AI/ML

致理上課用 LangChain リポジトリの紹介
2025/8/30
本リポジトリ「__2025_08_30__chihlee_langchain__」は、致理技術学院の授業で使用されるLangChainに関する教材および参考資料をまとめたものです。LangChainはAI言語モデルを活用したアプリケーション開発のためのフレームワークであり、本リポジトリでは授業用リンクや基礎的なコード構成を提供しています。学習者が実践的にLangChainを理解し、活用できるように設計された内容となっています。

スマート顔認識勤怠管理システム
2025/7/12
本リポジトリはPythonとFlaskを用いて開発されたリアルタイム顔認識勤怠システムです。カメラ映像から自動で顔を検出し、出勤・退勤時刻を記録、滞在時間を計算します。職場や教室、会議室など多様な環境に対応し、顔登録や管理、勤怠データの統計・可視化、JSON形式でのエクスポート機能を備えています。最新の顔認識技術を活用し、手軽かつ正確な勤怠管理を実現します。

-NfW-ai-vids:最高のAI動画ジェネレーター
2025/9/2
「-NfW-ai-vids」は、革新的なAI技術を活用した動画生成ツールのリポジトリです。わずか数コミットながら、AIを用いて高品質な動画を自動生成することを目指しており、動画制作の効率化とクリエイティブな表現の可能性を広げます。本リポジトリはシンプルな構成ながら、今後の発展が期待される注目のプロジェクトです。

10x-Tool-Calls: AIコーディングツールの利用効率を最大化する軽量ルールファイル
2025/6/11
10x-Tool-Callsは、月間のAIコーディングツールの呼び出し回数を最大限に活用できるよう設計された軽量なルールファイルです。限られたリクエスト数でより多くの作業をこなすことを目的とし、効率的なAPI利用や呼び出し最適化の実装に役立ちます。Pythonで開発されており、シンプルな構造ながら効果的な制御が可能です。

3Dアップル品質分類システム
2025/7/12
本リポジトリは、複数視点からの3Dポイントクラウドを用いてリンゴの品質(正常、打撲、割れ、腐敗)を自動分類するエンドツーエンドのシステムを提供します。Intel RealSenseカメラでRGB-Dデータを収集し、3Dモデルを再構築、Pythonで実装された品質分類アルゴリズムにより高精度な判定を実現しています。農業や食品検査分野での自動化・効率化に貢献する先進的なAI/MLソリューションです。

642Xの日本語タイトル:二足歩行ロボット動作制御プロジェクト
2025/8/27
本リポジトリ「642X」は、主に二足歩行ロボットの動作制御に関する技術開発を目的としたプロジェクトです。自己均衡型外骨格装置や人間の動作模倣制御を含め、高度なロボティクス技術の研究開発を進めており、モーションコントロールに特化した実験的かつ応用的な成果が期待されています。現状は開発初期段階ながら、将来のヒューマンインタラクションロボットへの展開が見込まれています。

8-QUEEN問題のシンプルGUI実装
2025/8/31
8-QUEENリポジトリは、人工知能の学習教材として設計された、8クイーン問題のシンプルなGUIインターフェースをPythonで実装したプロジェクトです。TkinterとPillowを用いたビジュアル表現により、問題の可視化と理解を助け、教育やアルゴリズム学習に最適な環境を提供します。

91Writing:AIを活用したスマートな小説創作ツール
2025/6/11
91Writingは、Vue 3とElement Plusをベースに開発されたAI小説創作支援ツールです。複数のAIモデルを統合し、作家が効率的に物語を構築・執筆できる環境を提供します。直感的なUIと高度なAI技術の融合により、アイデアの発想から文章生成までをシームレスにサポート。クリエイティブな創作活動を加速させることを目指したプロジェクトです。

A2A-XKCD:エージェント間通信対応のXKCDコミック表示エージェント
2025/6/24
A2A-XKCDは、Agent-to-Agent(エージェント間)通信に対応した極めてシンプルなPython製エージェントです。XKCDのウェブコミックを取得し、表示する機能に特化しており、軽量かつ直感的な設計が特徴です。エージェント同士の連携を学びたい開発者や、XKCDのコミックを簡単に取得・表示したいユーザーに適しています。

ACE-G-Framework:AI導入成熟度を測る共通フレームワーク
2025/9/3
ACE-G-Frameworkは、企業におけるAI導入の成熟度を評価し、その価値を最大化するための共通言語と指標を提供するフレームワークです。AIの効果測定や導入状況の可視化に課題を抱える多くの企業に対し、統一された基準を示すことで、AI活用の最適化と意思決定の支援を目的としています。ドキュメントやツールが揃い、AIの導入段階を段階的に評価・改善するための実践的なガイドラインとなっています。

ADK TypeScript: 高度なAIエージェント開発キット
2025/7/21
ADK TypeScriptは、多数のLLM(大規模言語モデル)を統合し、進化したツール連携やメモリ機能、柔軟な会話フローを備えたAIエージェント開発用の包括的フレームワークです。プロダクション環境を念頭に設計されており、複雑なマルチステップタスクの自律的な処理を可能にします。Turborepoモノレポ構成で、拡張性とメンテナンス性の高いコードベースを提供しています。

Agent-C:超軽量AIエージェントのC言語実装
2025/8/25
Agent-Cは、C言語で実装された超軽量のAIエージェントで、OpenRouter APIと連携しながらシェルコマンドを実行することが可能です。わずか数キロバイトのバイナリサイズでmacOSおよびLinuxに対応し、スライディングウィンドウ方式の会話メモリ管理を備えています。シンプルかつ高速な動作を追求した設計で、AIのツール呼び出しや会話の効率的な処理を可能にする点が特徴です。

Agent Core - Rust製Codex AIエージェントライブラリ
2025/8/25
Agent CoreはRustで実装されたCodexプラットフォーム上のAIエージェント機能をアプリケーションに組み込むためのライブラリです。高水準のAPIを提供し、LLM(大規模言語モデル)を駆使したエージェントの作成・管理やツール実行機能を容易に実装可能。柔軟な設定システムとメッセージ構造を備え、Rust開発者が効率的にAIエージェントを構築できる環境を整えています。

agent-rules:エージェント活用を最適化するためのルール集
2025/6/12
「agent-rules」は、Claude CodeやCursorなどのAIエージェントとより効果的に連携するためのルールや知識をまとめたリポジトリです。Shellスクリプトを中心に構成されており、エージェントの挙動を制御・最適化するためのベストプラクティスを提供。AIエージェントの利用が増える中、開発者やユーザーが実践的に活用するためのガイドラインとして役立ちます。

HRオファーエージェントと三役インテリジェント面接システム
2025/8/21
本リポジトリは、技術担当者・人事担当者・上司の三役が連携するインテリジェントな面接ワークフローと、HRオファーエージェントを提供します。面接の自動化、スコアリング、候補者プロフィールの抽出、結果のアーカイブ、オファー生成までを一貫して実行可能。さらに、外部市場給与データ(Adzuna)を統合するMCPサーバも備えており、実務で活用できる高度な採用支援システムです。

AgentGuard:リアルタイムのトークンスペンド監視と無限ループ防止ガードレール
2025/7/31
AgentGuardは、LLM(大規模言語モデル)やエージェントの動作中に発生するトークン消費をリアルタイムで監視し、無制限のループや過剰なトークン使用を防止するガードレール機能を提供するJavaScriptライブラリです。Node.js環境で動作し、API呼び出しのコスト管理や安全な実行制御を実現。エージェントの健全な動作維持に貢献します。

AIエージェント用システムプロンプト集
2025/7/7
「agentic-system-prompts」は、実際のAIコーディングエージェントで使用されているシステムプロンプトやツール定義を体系的に収集・整理したリポジトリです。プロンプト設計の参考やエージェント開発の効率化に役立つ情報が豊富に含まれており、AIエージェントの性能向上やカスタマイズに貢献します。今後のAI開発に必要な知見を提供する貴重なリソースです。

Inkeep Agents:グラフベースのマルチエージェントAIフレームワーク
2025/9/5
Inkeep Agentsは、複数の専門AIエージェントがグラフベースの構造で連携し、複雑な問題解決を実現するTypeScript製マルチエージェントフレームワークです。ノーコードのビジュアルビルダーとコードベースの両面からエージェント設計が可能で、各エージェントは独自のプロンプトやツールを持ち、チームや開発者が効率的に高度なAIシステムを構築できます。

AIエージェントによるアプリコード自動生成ツール
2025/8/22
本リポジトリ「ai-agent-appmaker-navrhovac」は、AIエージェントを活用してアプリケーションのコードを自動生成・提案するTypeScript製ツールです。ローカル環境で簡単に動作させられ、Node.jsの依存関係管理に対応。AI Studioとの連携により、開発効率の向上を目指しています。初心者から上級者まで幅広く活用できる、シンプルながら拡張性の高いアプリ開発支援リポジトリです。

AI監査人向けプライマー集
2025/7/4
本リポジトリ「ai-auditor-primers」は、スマートコントラクト監査を行うAIに事前学習させるためのオープンソースのプライマードキュメントを提供しています。ERC4626準拠のVault専門監査員「Amy」など、特化型AI監査人向けのプライマーが含まれており、スマートコントラクトのセキュリティ強化や監査効率向上を支援します。AIの監査準備を効率的に進めるための基盤資料として活用可能です。

AI空港シミュレーションによる大規模言語モデルの意思決定評価
2025/7/22
本リポジトリは、大規模言語モデル(LLM)を対象にリアルタイムの空港管制シナリオでの意思決定能力を検証するための高度な空港シミュレーション環境を提供します。安全性が極めて重要な航空運用におけるAIの判断力やリソース配分、緊急対応能力を比較評価できる点が特徴です。

AIコードヘルパー - LangChain4j実践プロジェクト
2025/7/9
AIコードヘルパーは、Spring Boot 3.5、Java 21、LangChain4jを基盤としたAIプログラミング学習・就職支援ロボットの実践プロジェクトです。大規模AIモデルの統合、LangChain4jのコア機能、流式対話、Promptエンジニアリング、RAG(Retrieval Augmented Generation)による検索強化、ベクトルデータベース、ツール呼び出し、MCP(モデルコンテキストプロトコル)、Webスクレイピング、安全対策、Vue.jsフロントエンド、SSE(サーバー送信イベント)などの企業レベルAI技術を幅広くカバーし、AI時代の開発者に必要なスキルを提供します。

AIによる服装チェンジツール「ai-clothes-changes」
2025/9/3
「ai-clothes-changes」は、無料で利用できるAI技術を活用した服装チェンジツールを紹介するリポジトリです。シンプルながら、AIを利用した画像生成やキャラクター生成と並ぶ複数のAI系サービスのリンクをまとめており、服装変更に関心のあるユーザーに向けて最適な無料ツールを案内しています。ソースコードの提供は限定的ながら、手軽にAI服装変更機能を試すための窓口として機能しています。

AI-CodeAssistant:Cohere APIを活用したシンプルなNode.jsターミナル型コーディングアシスタント
2025/6/9
AI-CodeAssistantは、CohereのAI APIを利用したNode.jsベースのターミナル型コーディングアシスタントです。シンプルな設計ながら、コードの生成や補完、質問応答を対話的に行うことができ、開発者の生産性向上を支援します。軽量でセットアップも容易なため、日々のコーディング作業に手軽に導入可能なツールとして注目されています。

AI Content Studio:AIによるソーシャルメディアコンテンツ生成プラットフォーム
2025/9/6
AI Content Studioは、GPT-4を活用したAIコンテンツ生成プラットフォームです。Web調査や画像選択を自動化し、LinkedInやTwitter向けの魅力的なソーシャルメディア投稿を効率的に作成できます。Reactフロントエンドとn8nによるワークフロー自動化バックエンドを備え、編集・承認機能も搭載。コンテンツ制作の手間を大幅に削減し、質の高い情報発信を支援します。

AI Diagram & Prototype Generator (MCPサーバー)の解説
2025/8/14
AI Diagram & Prototype Generator (MCPサーバー)は、複数の先進的な大規模言語モデル(LLM)を統合し、自然言語から多様なスタイルのdraw.io形式の図表やHTMLベースのインタラクティブなプロトタイプを自動生成できるAI駆動のツールです。Apple HIGやWeChatミニプログラムなどの専門的なUI設計規範に対応し、動的なプロンプトシステムで安定かつ高精度な成果物を提供。設計からプロトタイピングまでの工程を効率化し、ユーザーの創造性を大幅に支援します。

採用選考管理のためのAIツール
2025/7/21
「ai-for-screening-management」は、採用プロセスの効率化を目指したAI支援アプリケーションです。応募者の履歴書(CV)や面接評価を自動的にスコアリング・ランキングし、人事担当者が優秀な候補者を迅速に見極められるようサポートします。Pythonで構築され、CVと面接の両方に対応したスコアリング機能を備え、採用業務の質向上と工数削減に貢献します。

AI-Gamble:AIによる動的インタラクティブ小説ゲーム
2025/7/15
AI-Gambleは大型言語モデル(LLM)を活用した動的インタラクティブ小説ゲームです。プレイヤーが選択した物語ジャンルに応じて、独自のストーリー展開、キャラクター、そして視覚化された物語分岐マップをリアルタイムに生成。多様な選択肢と予測不能な展開により、没入感の高い読書体験を提供します。

AIによる闲鱼多タスクリアルタイム監視&スマート分析ツール
2025/7/16
本リポジトリは、PlaywrightとAIを活用し、中国の人気二次流通プラットフォーム「闲鱼(Xianyu)」上で複数の監視タスクをリアルタイムに実行し、深層なAI分析を施すツールです。直感的なWeb管理画面を備え、自然言語で購入ニーズを記述するだけで高度なタスクを自動生成。多様なキーワードの同時監視、即時解析、AIによる多モーダル商品評価、プッシュ通知まで一貫対応し、ユーザーフレンドリーかつ高機能な運用を実現しています。

AIインフラストラクチャの学習と構築ガイド
2025/7/8
AI-Infraは、AIインフラストラクチャの設計と運用に携わるエンジニア向けに特化したリポジトリです。特にKubernetesやクラウドネイティブ技術を用いたAI推論基盤の構築に焦点を当て、AIインフラの全体像を俯瞰したランドスケープ図と体系的な学習パスを提供しています。最新の技術トレンドや成熟度を視覚的に示し、実践的知識の習得をサポートするためのリソースが豊富に揃っています。

AI面接準備ノート(2025年3月版)
2025/8/18
AI研究所の面接に向けた機械学習の基礎と設計に関する学習ノートをまとめたリポジトリです。2025年3月時点の内容で、急速に変化するAI分野の最新情報には一部追いついていない可能性がありますが、基礎理解や設計思考の参考資料として有用です。面接対策を目的とした実践的な内容を凝縮しており、AIエンジニア志望者に役立つ資料となっています。

Ai-Medical-Assistant:音声対応医療RAGアシスタント
2025/7/24
Ai-Medical-Assistantは、医師が音声で患者の基本情報を問い合わせることができる最小限のフルスタック音声対話アプリです。Reactを用いたフロントエンドと、Flaskによるバックエンドで構成され、OpenAIのWhisper APIで音声認識、Pineconeによるベクトル検索、ElevenLabsの高品質な音声合成、そしてGPT-3.5を活用した生成的質問応答を実現。医療現場での迅速かつ自然な情報取得を支援します。

AIムードダイアリーボット - AI分析とウェブダッシュボードを備えた感情追跡Telegramボット
2025/8/24
AI Mood Diary Botは、ユーザーの感情を記録し、AI技術で分析するTelegramボットです。Vue.jsを用いた直感的なウェブダッシュボードで感情データの可視化を実現し、PythonベースのバックエンドとDocker環境での容易なデプロイをサポート。日々の気分管理やメンタルヘルスケアに役立つ革新的なツールです。

AI-OCR-BOOK:AIによる電子書籍のOCR化プロジェクト
2025/7/18
AI-OCR-BOOKは、AI技術を活用して電子書籍の文字認識(OCR)を効率的に行い、紙媒体や画像化された書籍のデジタル化を支援するオープンソースプロジェクトです。中国語の書籍を中心に、テキスト抽出と編集を容易にし、知識のデジタル再生を目指しています。現代のAI OCR技術を駆使し、書籍の電子化を促進するためのツール群やプロンプト例を提供しています。

AI PDFチャットボット - LangChainを活用したPDF対話システム
2025/7/1
「ai-pdf-chatbot-langchain」は、TypeScriptで実装されたAIチャットボットのリポジトリで、PDFドキュメントを解析し、自然言語での質問応答を可能にします。LangChainフレームワークを活用することで、PDFファイルから情報を抽出し、ユーザーの質問に対して的確な回答を生成。AIとドキュメントの対話を実現することに重点を置いたプロジェクトで、AIを活用したドキュメント管理や検索システムの構築に役立つツールです。

AI原型提示词事例集
2025/7/10
本リポジトリ「ai-prototype-prompts」は、AIを活用したプロトタイプ作成のための高品質な提示文(プロンプト)事例を収集したものです。ポッドキャストアプリの原型設計をはじめ、ユーザー体験分析からUI設計、HTML+Tailwind CSSによる高精度なプロトタイプ実装まで、実用的なプロセスを体系的に示しています。開発者やプロダクトマネージャー、UIデザイナーがAIを活用して効率的に高忠実度のプロトタイプを作成するための参考資料として活用可能です。

ai-sfx:AIを活用した効果音生成ライブラリ
2025/6/1
ai-sfxは、JavaScriptで開発された効果音生成ライブラリで、AI技術を活用して多彩なサウンドエフェクトを簡単に作成できます。ゲーム開発やマルチメディアコンテンツにおける効果音制作を効率化し、カスタマイズ性も高いのが特徴です。軽量かつオープンソースで、開発者コミュニティからの支持も徐々に広がりつつあります。

AI動画エフェクトコレクション
2025/7/25
「AI Video Effects Collections」は、興味深く実用的なAIを活用した動画エフェクトやテンプレートを集めたリポジトリです。動画編集や映像制作にAI技術を活用した様々なエフェクトの事例やツールがリストアップされており、エンターテインメント用途から実務的な応用まで幅広くカバー。ユーザーや開発者からの貢献も歓迎しており、AIを用いた動画表現の可能性を探る入門リソースとして有用です。

ai-vids:AI動画生成ツール
2025/9/4
「ai-vids」はAI技術を活用した動画生成ツールのリポジトリです。シンプルな構成ながら、AIを用いて動画コンテンツを生成する基盤を提供し、AIによる映像制作の可能性を探ります。初心者から研究者まで幅広く活用可能な設計で、AI動画生成の入門として役立つリポジトリです。

AI音声通話エージェント:歯科クリニック向けAI予約受付システム
2025/7/27
本リポジトリは、歯科クリニック向けに開発されたAI音声アシスタント「AI Voice Appointment Booking Agent」を公開しています。Vapiを活用し、電話応対業務を完全自動化。FAQ対応、空き状況確認、予約受付、予約確認通知までを人手を介さずに実現する仮想受付システムです。クリニックの業務効率化や顧客体験向上に貢献します。

AI-Vulverability-Scanner:AIを活用した脆弱性スキャナー
2025/6/1
AI-Vulverability-Scannerは、ユーザー指定のIPアドレスに対してNmapを用いて開いているサービスを検出し、それぞれのサービスに関連するCVE(共通脆弱性識別子)をSBERT埋め込みと重大度分類器でマッチングします。さらに、ファインチューニングしたT5モデルにより、具体的かつ適切な対策手順を自動生成するAI駆動型の脆弱性スキャナーです。セキュリティ管理の効率化と精度向上に寄与します。

AI-Voice-Typing-Shortcuts:無料で高精度なGeminiベースのAI音声入力ショートカット
2025/8/15
本リポジトリは、Google Gemini APIを活用した無料かつ完全にカスタマイズ可能な高精度AI音声入力ショートカット「AI-Voice-Typing-Shortcuts」を提供します。従来の音声入力法が苦手とする個別の単語やルールを柔軟に設定可能で、Whisper FlowやAQUA Voiceなどの有料サービスに頼ることなく、高品質な音声認識を実現。MacやiPhoneのショートカット機能を活用し、ユーザーの利便性を大幅に向上させるオープンソースプロジェクトです。

AI100Stories - AI概念を魅力的な物語に変えるプロジェクト
2025/5/30
AI100Storiesは、人工知能の複雑な概念を専門的な物語理論と創作技術を活用して、魅力的なストーリーに変換することを目的としたプロジェクトです。技術的な専門知識を持たない読者にもAIの本質をわかりやすく伝えることを目指し、創造的かつ教育的なコンテンツを提供しています。CSSを用いたデザイン要素も含み、視覚的な魅力も追求しています。

AIクリプトシグナルズボット - 暗号資産自動売買支援ツール
2025/7/1
AICryptoSignals-Botsは、AIを活用して暗号資産の取引シグナルを自動生成し、ユーザーが変動の激しい仮想通貨市場でより正確な売買判断を下せるよう支援する自動売買ボットです。市場の分析からシグナル発信までの一連のプロセスを自動化し、初心者から上級者まで幅広いトレーダーに利用されています。

AI関連の実用スクリプト集「AICode」
2025/7/9
「AICode」は、AI技術の活用を支援するために作成された実用的なシェルスクリプトをまとめたリポジトリです。主にClaude AIのコードプロキシを自動化するスクリプトが含まれており、手軽にAIサービスの連携や運用を行うことが可能です。シンプルながら拡張性のある構成で、AI関連の開発や運用に便利なツール群を提供します。

AICryptoTrade-Bots:最先端機械学習を用いた暗号通貨自動取引ボット
2025/7/1
AICryptoTrade-Botsは、最先端の機械学習アルゴリズムと特徴量エンジニアリング技術を活用した暗号通貨の自動取引ボットです。市場データを分析し、効率的かつ自律的に取引判断を下すことで、トレーダーの手間を大幅に削減し、取引の精度向上を目指しています。本リポジトリは、実用的なトレーディングボットの構築に興味がある開発者や投資家にとって貴重なリソースとなっています。

AIGC-weight-reduction:最強AI降重ツール
2025/7/16
AIGC-weight-reductionは、学生や研究者、自媒体クリエイター向けのAIベースのテキスト改写プラットフォームです。最新のAIGCモデルを活用し、文章の意味を保持しつつ自然で流暢な文章に自動的に書き換え、論文や記事の重複チェックを回避します。中国語に対応し、リアルタイム処理と高い安全性を兼ね備え、無料で利用可能なサービスを提供しています。

airole:画像から始める手軽なAIキャラクターカード作成ツール
2025/6/15
airoleは、画像を起点にAIがキャラクターカードを自動生成するTypeScript製のツールです。ユーザーは手間をかけずに魅力的なキャラクター設定を作成でき、ゲームや物語制作に活用できます。直感的な操作性とAIの自然言語処理を融合し、効率的かつクリエイティブなキャラクター生成を実現します。

AIZotero:Zotero対応AI論文アシスタント
2025/8/2
AIZoteroは、Zoteroのローカルライブラリと直接連携し、研究論文の管理と理解を支援するAI搭載の論文リーディングアシスタントです。ウェブインターフェースを通じてユーザーは論文の要約や重要ポイントの抽出を容易に行え、研究作業の効率化を図れます。高度なAI技術でほぼ全てのコードが自動生成されており、最新のAIモデルを活用したスマートな研究支援ツールです。

画像から動画生成モデルの動的表現を向上させる適応的ローパスガイダンス
2025/7/15
本リポジトリ「ALG」は、画像から動画を生成するモデルの動的表現を改善するための手法「Adaptive Low-Pass Guidance(適応的ローパスガイダンス)」の公式実装を提供します。従来課題であった動画内の動きの滑らかさや連続性を向上させ、より自然で高品質な動画生成を実現。論文「Enhancing Motion Dynamics of Image-to-Video Models via Adaptive Low-Pass Guidance」に基づき、Pythonで実装されたこのリポジトリは、画像から動画への変換タスクに新たな可能性を示します。

AlphaGenome:DeepMind発の最新ゲノム注意機構モデルの実装
2025/6/27
DeepMindが提案した最新のゲノム解析用の注意機構モデル「AlphaGenome」のPython実装リポジトリです。AlphaGenomeはゲノム配列解析に特化したディープラーニングモデルで、従来の手法を凌駕する精度と効率性を実現。本リポジトリでは、モデルのコアアルゴリズムを忠実に再現しつつ、研究や実務での活用を促進するためのコードを提供しています。ゲノム情報の深層解析に関心のある研究者やエンジニアに最適です。

マーケティングROI分析と売上予測のための回帰モデル
2025/9/1
本リポジトリは、マーケティングチャネルへの広告費投入が売上に与える影響を分析し、ROI(投資収益率)を最大化するための予測モデルを構築するプロジェクトです。広告費データと売上実績を用いて線形回帰モデルを作成し、投資効率の高い広告配分を導き出すことを目的としています。マーケティング戦略の最適化に役立つデータサイエンスの実践例として、Jupyter Notebook形式で実装されています。

AnthroTAP:人体動作から任意の点を追跡する学習モデル
2025/7/7
AnthroTAPは、人間の動作映像から任意のポイントを高精度に追跡するための学習ベースの手法を提供するリポジトリです。本プロジェクトは、動作解析やビデオ理解に不可欠なポイント追跡問題を解決するため、深層学習を活用し、従来手法を大きく上回る性能を達成しています。特に、人体の複雑な動きや外観変化に強く、様々な応用が期待されます。

Any-SongによるAI活用のパーソナルカラオケ体験
2025/6/2
Any-Songは、AI技術を駆使して任意の楽曲からボーカルを分離し、歌詞と同期させることで、個人向けのカラオケ体験を提供するプロジェクトです。ユーザーは手持ちの音楽を簡単にカラオケ化でき、歌詞をリアルタイムで表示しながら歌うことが可能となります。音声処理や自然言語処理を融合し、新たな音楽体験を実現する点が特徴です。

Any-SSR:大規模言語モデルの継続学習における解析的部分空間ルーティング
2025/7/8
Any-SSRは、「解析的部分空間ルーティング(Analytic Subspace Routing)」という手法を提案し、再帰最小二乗法(Recursive Least Squares)が大規模言語モデルの継続学習にどのように機能するかを解明するための公式コードリポジトリです。本リポジトリは、大規模言語モデルの知識蓄積と適応を効率的に行うための理論的かつ実践的なアプローチを提供し、継続学習研究の最先端を担っています。

Apple On-Device AI:NodeJS向けApple Foundation Modelバインディング
2025/6/18
「apple-on-device-ai」は、AppleのFoundation ModelをNodeJS環境で利用可能にするTypeScript製のバインディングライブラリです。特にVercel AIプラットフォームとの連携をサポートし、Appleの先進的なAI技術をサーバーサイドやエッジ環境で活用したい開発者に最適です。軽量かつモダンな設計で、オンデバイスAIの可能性を広げます。

Ardupilot_Team_Pegasus:高度なモビリティとロボティクスの学部生研究プロジェクト
2025/7/21
Ardupilot_Team_Pegasusは、Advanced Mobility and Robotics Labによる学部生の研究プロジェクトで、オープンソースの無人機制御ソフトウェアArduPilotをベースに開発されています。本リポジトリは、C++で実装された自律飛行制御システムの拡張やカスタマイズを目的とし、ドローンやロボットの高度な自律制御技術の研究開発に活用されています。最新のテストワークフローやディスコードコミュニティ連携も特徴です。

人工ニューロンの自作入門
2025/7/13
本リポジトリ「artificial_neuron」は、人工ニューロンの基礎的な構築をPythonのJupyter Notebook上で実践的に学べる教材です。スクラッチでの実装を通じて、パーセプトロンや単純なニューラルネットワークの動作原理を理解できます。データセットの準備からモデルの訓練、精度評価までを含み、初心者が機械学習の核となる概念を体験的に習得することを目的としています。

ASTRA:AIソフトウェアアシスタント向け自律的時空間レッドチーミング
2025/8/13
ASTRAは、Amazon Nova AI Challengeで優勝したAIセーフティ分野の革新的なプロジェクトです。時空間的な自律レッドチーミング技術を用いて、AIソフトウェアアシスタントの脆弱性を効果的に攻撃・評価し、世界中の大学チームを凌駕しました。Pythonで実装され、実用的かつ高度な攻撃戦略を展開する点が特徴です。

ATI:任意軌跡指示による制御可能な動画生成
2025/5/30
ATIは、任意の軌跡指示(Any Trajectory Instruction)を用いてユーザーが望む動きを直感的に指定し、 制御可能な動画を生成するための最新技術を実装したリポジトリです。動画生成分野における柔軟性と精度を両立し、 研究論文「ATI: Any Trajectory Instruction for Controllable Video Generation」に基づいた公式実装を提供します。

Aula-3:Jupyter Notebookによる機械学習演習課題
2025/8/28
Aula-3は、機械学習やデータサイエンスの学習を目的としたJupyter Notebook形式の演習課題リポジトリです。Pythonコードとノートブックを通じて基礎的なプログラミングやデータ解析の理解を深めることができ、Google Colabでの実行も可能です。教育用途に適したシンプルかつ実践的な構成が特徴です。

auto-prompt:AIプロンプト最適化プラットフォーム
2025/6/4
auto-promptは、AIモデルのプロンプト最適化に特化したプロフェッショナルツールです。高度な最適化アルゴリズムと深層推論解析を組み合わせることで、AIとの対話精度を飛躍的に向上させます。さらに、視覚的なデバッグツールやコミュニティ共有機能も備え、ユーザーが効率的かつ効果的にプロンプトを設計・改善できる環境を提供します。

Autoselll - AIによるオンライン販売自動化エージェント
2025/8/5
Autoselllは、画像解析から価格検証、商品説明作成、そしてマーケットプレイスへの出品まで、オンライン販売の全工程をAIが自動で行うシステムです。ユーザーは商品写真をアップロードするだけで、ブランド情報やモデル、商品の状態をAIが分析し、ノルウェー市場のデータを用いた価格検証を経て、最適化された説明文を生成。FINN.noなどのマーケットプレイスへ自動的に出品できます。販売プロセスの効率化を実現する革新的なAIエージェントです。

avatar_gpusによる多GPU対応デジタルアバター推論環境
2025/6/10
avatar_gpusは、複数GPUを活用してデジタルアバター(デジタルヒューマン)の推論処理を効率化するPythonベースのリポジトリです。特にheygemフレームワークを用いたマルチカード推論に対応しており、大規模なモデルやリアルタイム処理における計算負荷の分散を実現します。AI分野でのデジタルヒューマン応用において、GPUリソースを最大限に活用したい開発者に役立つ実装が特徴です。

AVDNet:減算誘導アライメントによる適応型映像デモアリングネットワーク
2025/7/1
AVDNetは、映像におけるモアレ模様を効果的に除去するための適応型デモアリングネットワークです。減算誘導アライメント機構を導入し、連続フレーム間の特徴を正確に整合させることで、映像の高品質な復元を実現。従来手法と比較して、動きのある映像や複雑なモアレパターンに対しても優れた性能を発揮します。

Awesome Affordance Learningの総合リポジトリ
2025/5/28
本リポジトリ「Awesome-Affordance-Learning」は、物体の「アフォーダンス(affordance)」学習に関する研究や実装、論文、データセット、ツールなどをまとめた包括的なリストです。ロボティクスやコンピュータビジョン、機械学習分野で注目を集めるアフォーダンス認識技術の情報を一元的に収集し、研究者や開発者が効率的に関連リソースへアクセスできるよう設計されています。これからアフォーダンス学習に取り組む人にとって貴重な情報源となるでしょう。

音声生成技術のための厳選リソース集「Awesome-Audio-Generation」
2025/6/2
「Awesome-Audio-Generation」は、テキストから音声を生成する技術(Text-to-Audio, TTA)に関する論文やコード、関連リソースを体系的にまとめたキュレーションリポジトリです。最新の研究成果や実装例を一括で参照でき、音声合成や音響生成の分野で研究・開発を行う技術者や研究者にとって貴重な情報源となっています。

AI搭載コードエージェント集:開発生産性を革新するツール群
2025/8/6
本リポジトリ「awesome-code-agents」は、AIを活用したコードエージェント、統合開発環境(IDE)、および開発支援ツールを厳選してまとめたリストです。プログラミングの生産性向上を目的とし、インテリジェントなコード補完やエージェント型編集機能を持つ最新のAI開発ツールを紹介。開発者が日々のコーディング作業を効率化し、高品質なソフトウェア開発を実現するための情報源として注目されています。

制御可能な生成モデルに関する最新論文集
2025/6/27
本リポジトリは、2023年から2025年にかけて発表された制御可能な生成モデルに関する論文を厳選してまとめたリストです。特に拡散モデルを中心に、細粒度制御、注意機構の解釈、スペクトル操作、構造保持型画像編集など、多様な技術をカバーしており、研究者や開発者が制御可能な合成技術を深く理解し応用するための貴重なリソースとなっています。

Awesome-DiffusionLLM:Diffusion言語モデルに関する厳選リソース集
2025/8/28
Diffusion言語モデル(Diffusion LLMs)に関する論文やプロジェクト、ツールを体系的にまとめたリポジトリです。最新の研究動向から実装例、関連リソースまで幅広く網羅し、Diffusion LLMの理解と活用を支援します。研究者やエンジニアが効率的に情報収集できる貴重な情報源となっています。

大規模検索指向推論モデルのまとめリポジトリ
2025/6/10
「Awesome-Large-Search-Models」は、検索に特化した大規模推論モデルに関する論文や手法、データセットを体系的にまとめたリポジトリです。最先端の検索技術と推論能力を融合させたモデルの研究動向を把握でき、関連研究者やエンジニアにとって有用な情報源となっています。最新の論文情報やデータセットを一元的に参照できるため、検索性能向上を目指すAI/ML分野の研究開発に役立ちます。

Awesome-LLM-Fake-News-Detection:大規模言語モデルによるフェイクニュース検出リソース集
2025/6/1
「Awesome-LLM-Fake-News-Detection」は、大規模言語モデル(LLM)を活用したフェイクニュース検出に関するリソースを体系的にまとめたGitHubリポジトリです。フェイクニュースの定義や検出技術、関連データセット、最新の研究論文、実装例などを網羅し、研究者や開発者が効率的に情報収集や技術選定を行えるよう設計されています。AIを用いた信頼性の高い情報検証技術の普及に貢献する貴重なリストとして注目されます。

Awesome MLLM コンテンツ理解:マルチモーダル学習の論文コレクション
2025/8/26
本リポジトリは、マルチモーダルコンテンツ理解(MCU)に関する論文を厳選してまとめたコレクションです。特に、細粒度視覚認識/分類(FGVR/FGVC)や、大型・小型モデルの協調によるコンテンツモデレーションなど、多様な応用分野をカバーしています。研究者やエンジニアが最新のマルチモーダルAI技術を効率的に把握できるよう設計されています。

プライベートAIに関する優れたツールとリソース集
2025/8/13
本リポジトリは、オンプレミス環境やエアギャップ、セルフホスティングでのAIの運用・構築・デプロイに役立つツールやフレームワーク、リソースを厳選してまとめたものです。プライベートAIの実現により、データやモデル、インフラを外部に晒すことなく完全に自社管理下に置けるため、セキュリティやプライバシーの確保が重要なシナリオに最適です。推論ランタイムやモデル管理、プライバシーツールなど多岐にわたる情報を網羅しています。

Alchemyst AIプラットフォームを活用したSaaSテンプレート集「awesome-saas」
2025/5/25
「awesome-saas」は、Alchemyst AIプラットフォームを利用した次世代AIアプリケーション開発向けのテンプレート集です。JavaScriptで実装された多彩なテンプレートが揃っており、開発者が効率的にAI搭載のSaaS(Software as a Service)を構築できるよう設計されています。豊富なサンプルコードと実践的なアーキテクチャにより、AI活用の敷居を大幅に下げることが可能です。

Awesome-Search-RL:強化学習を用いた検索技術のためのリソース集
2025/6/4
「Awesome-Search-RL」は、強化学習(Reinforcement Learning, RL)を活用した検索システムに関する研究や実装、論文、ツールなどを体系的にまとめたオープンソースのリポジトリです。検索と強化学習の融合分野に興味を持つ研究者や開発者に向けて、関連リソースを一括で参照できるように整理されており、最新の技術動向を把握するのに役立ちます。

Awesome Swarms Framework:多エージェントAIシステム構築のための包括的リソース集
2025/7/13
Swarmsフレームワーク向けの優れたアプリケーション、ツール、リソースを厳選したキュレーションリスト。Swarmsは多エージェントAIシステムのオーケストレーションを可能にする、強力で商用グレードのフレームワークであり、単純な自律エージェントから複雑な協調型スウォームまで幅広いシステム構築を支援します。本リポジトリは、開発者がSwarmsを活用するための知見やツールを体系的に提供しています。

AIツール発見のための代替サイト集「Awesome-theresanaiforthat-alternatives」
2025/6/1
本リポジトリは、「There''s An AI For That」の代替となるAIツールやアプリ、ユースケースを発見できるウェブサイトやディレクトリを厳選してまとめた一覧集です。多様なAI関連リソースを一箇所で網羅でき、効率的に最適なAIソリューションを探したい開発者や研究者、ビジネスパーソンに有用な情報源となっています。スター数は少なめながらも、AIツール探索の入口として価値ある内容を提供しています。

画像で思考する技術に関する最新論文集
2025/6/10
「Awesome-Thinking-With-Images」は、画像を用いた高度な視覚推論を実現する最新のオープンソース論文を体系的にまとめたリポジトリです。トレーニング不要の手法からSFT(指示微調整)ベース、強化学習(RL)を活用したアプローチまで、多様な研究成果を網羅。細かな視覚的推論能力を備えたモデルの開発を支援し、AIの「画像で思考する」能力向上の最前線を追えます。

Awesome Video Prompts - AI動画プロンプトジェネレーター
2025/8/2
「awesome-video-prompts」はAIを活用した動画生成のためのプロンプトを提供・生成するTypeScript製プラットフォームです。カテゴリー別にプロンプトを生成し、AIによる補強も可能。ユーザーは簡単なフォームから独自のプロンプトを投稿でき、コミュニティ協力型の動画プロンプトエンジニアリングを促進します。オープンソースとして公開されており、拡張や改善も歓迎されています。

動画超解像と拡散モデルに関する厳選リソース集
2025/6/20
本リポジトリは、動画超解像(Video Super-Resolution)に特化した拡散モデルを活用するためのリソースを体系的にまとめたキュレーション集です。最新の論文や実装コード、データセット、関連ツールを網羅し、研究者や開発者が効率的に知見を深めるための情報源として役立ちます。拡散モデルの動画超解像への応用に興味がある方にとって貴重な参考資料となるでしょう。

AxoloTL-EAGLE3:効率的なLLM推論を実現するEAGLE3統合フレームワーク
2025/8/13
本リポジトリ「AxoloTL-EAGLE3」は、オープンソースのトレーニングフレームワークAxoloTLに、推測サンプリングアルゴリズムEAGLE3を統合したものです。これにより、大規模言語モデル(LLM)の推論処理が高速化され、品質低下を最小限に抑えつつ効率的な展開が可能となります。プラグ・アンド・プレイでの導入や柔軟なサンプリング設定が特徴で、今後の安定版リリースも予定されています。

batch_fish_speech:効率的なバッチ推論によるFish Speech音声生成
2025/7/30
batch_fish_speechは、人気の音声合成モデルFish Speechをベースに、複数テキストを一括処理できるバッチ推論機能を強化したリポジトリです。高速かつ安定した音声生成を実現し、無駄な計算や空の出力を排除。効率的な注意マスキングを用いることで、高品質な音声合成をスケーラブルに行えます。Pythonで実装されており、Docker環境や各種言語のドキュメントも充実しています。

Bella(贝拉):あなたのデジタルパートナーを目指す未来型AI
2025/7/16
Bellaは単なるアプリケーションではなく、ユーザーと共に進化し成長することを目指すデジタルパートナーのプロトタイプです。現段階では動画による自己表現を中心に、その「人格」の萌芽を示しており、将来的にはユーザーの声や視点を受け入れ、深い共感と対話が可能な存在となることを志向しています。デジタル世界における新たな「友人」の創造を目指す野心的なプロジェクトです。

BeltOut:ピッチ完全一致の声質変換モデル
2025/7/5
BeltOutは、ChatterboxVCをベースにした世界初のピッチ完全一致、ゼロショット対応の声から声への声質転送モデルです。声の「音色(ティンバー)」を正確に捉えつつ、パフォーマンスの表現に与える影響を包括的に理解し、声の特徴を変換します。既存のボイスクローンモデルとは異なり、単なる声の模倣ではなく、音色の本質的な変化に着目している点が特徴です。Pythonで実装され、オープンソースとして公開されています。

2025年版最良のNSFW AI動画・画像ジェネレーター
2025/7/4
本リポジトリは、2025年に注目されるNSFW(成人向け)AI動画および画像生成ツールのトップ選集を紹介しています。各ツールは独自の特徴を持ち、顔の一貫性や高画質レンダリングなど、ユーザーのニーズに合わせた多様な生成技術を提供。テキストから動画への変換や画像から動画生成など、多彩な機能を網羅し、未検閲のクリエイティブなコンテンツ制作を支援します。

Best of AI - 厳選された最新AIツール集
2025/8/14
「Best of AI」は、現役で活躍する最先端のAIツールを厳選し、ジャンル別に体系的にまとめたGitHubリポジトリです。生成モデル、文章支援、画像・動画生成、開発者向けプラットフォーム、自律エージェント、研究支援など多岐にわたるAIツールを手軽に探索・活用できる情報源として注目されています。定期的に更新され、AI技術の最新動向を追う上で有用なリソースです。

BézierGS: 動的都市シーン再構築のためのベジェ曲線ガウススプラッティング
2025/6/26
本リポジトリ「BezierGS」は、ICCV2025で発表された論文「BézierGS: Dynamic Urban Scene Reconstruction with Bézier Curve Gaussian Splatting」に基づく、動的な都市環境の高精度3D再構築手法を実装しています。ベジェ曲線とガウススプラッティングを組み合わせることで、複雑かつ時間変化のある都市シーンの再現を効率的かつ高品質に実現。都市計画や自動運転、AR/VRなど多様な応用が期待される先進的な技術です。

Binanceマーケットメーカーボット:高度な暗号資産市場形成ツール
2025/8/29
Binanceのスポット取引向けに設計された、高度な暗号通貨マーケットメイキングボットです。Avellaneda-Stoikovモデルを実装し、包括的なリスク管理とリアルタイムの損益追跡を特徴としています。Pythonで開発されており、WebSocketを用いた低遅延のオーダーブック監視や動的スプレッド計算機能を備え、効率的な市場形成を実現しています。

BlastOff LLM:AI音声アシスタント向け高速応答システム
2025/7/19
BlastOff LLMは、小型言語モデルと大型言語モデルを組み合わせることで、AI音声アシスタントにおける高速かつ自然な応答を実現するシステムです。小型モデルが自然な語気詞で即座にフィードバックし、大型モデルが詳細な回答を続けることで、ユーザーにミリ秒単位のリアルタイム対話体験を提供します。音声合成に最適化されたストリーミング設計や多層的な性能監視機能も備え、OpenAI互換のAPIを通じた容易な統合が可能です。

BlueMO:小蓝书シリーズからの高品質数学オリンピック問題データセット
2025/7/15
BlueMOは、中国の有名な「小蓝书」シリーズ(第二版)から厳選された数学オリンピック問題と詳細な解答を収録した高品質データセットです。国内外の数学競技に挑む学生向けの貴重な教材であり、複雑な論理推論能力を評価・向上させるために設計されています。大規模言語モデル(LLM)の研究や教育現場での活用が期待される、質・量ともに充実したリソースです。

乳がん診断予測アプリケーション
2025/7/7
本リポジトリは、乳がんの腫瘍が悪性(がん性)か良性(非がん性)かを予測するWebアプリケーションを提供します。公開されている乳がん診断データセットを用いてロジスティック回帰モデルを構築し、StreamlitによるインタラクティブなUIで患者の医療データを入力することで診断予測が可能です。データの探索的解析(EDA)も備え、相関ヒートマップやボックスプロット、ヒストグラムなど豊富な可視化機能によりデータ理解も支援します。医療現場や教育用途に適したシンプルかつ実用的なツールです。

CanonSwap:高精度で一貫性のある動画顔交換のためのカノニカル空間モジュレーション
2025/7/11
CanonSwapは、動画における顔交換を高精度かつ一貫性を持って実現する技術を提案するリポジトリです。カノニカル空間モジュレーションと呼ばれる新しい手法を用い、異なる表情や角度の変化に対応しつつ、元の顔の特徴を忠実に保ちながら自然な顔交換を可能にします。この技術はICCV 2025で発表されており、高品質な動画編集や映像制作分野への応用が期待されます。現時点ではコードは準備中ですが、研究内容はarXivにて公開されています。

CapSpeech:スタイル付きテキスト音声合成による多様な応用を可能にする技術
2025/6/5
CapSpeechは、スタイルを付与したテキスト音声合成(TTS)を実現し、多様な下流アプリケーションに対応可能な技術を提供するリポジトリです。音声の感情や話者の特徴を反映した高品質な音声生成を目指しており、Jupyter Notebook形式で実装されています。従来のTTS技術に比べて、柔軟なスタイル制御と汎用性の高さが特徴であり、感情合成や対話システムなど多様な分野での応用が期待されています。

CCKS2025 大模型生成文本检测 - Qwen7B-LORA
2025/7/22
本リポジトリは、CCKS2025コンペティションに参加した大規模言語モデル生成テキストの検出プロジェクトです。Qwen2.5-7B-InstructモデルをQLORA(量子化低ランク適応)で微調整し、データ処理からモデル学習、推論、結果の可視化まで一貫したパイプラインを提供します。特にデータ増強や分散トレーニングをサポートし、競技でのB榜28位の実績を持ちます。Pythonによる実装で、テキスト生成検出の最先端技術を実践的に学べる内容です。

CF-ai-TGbot:Cloudflare AI Gateway連携の高機能Telegramボット
2025/7/19
CF-ai-TGbotはNode.jsで構築されたTelegramボットで、Cloudflare AI Gatewayを介して複数の大規模言語モデル(LLM)と連携し、高度な対話機能を実現します。会話の文脈を記憶し、動的にAIモデルを切り替えられる点が特徴で、MarkdownをHTML形式に変換してTelegram上で美しく表示可能です。AIリクエストのログ管理やキャッシュもサポートし、柔軟かつ安全な運用を実現します。

cfgrl:Pythonによる強化学習探索手法の実装
2025/5/31
cfgrlはPythonで実装された強化学習の探索アルゴリズムを集約したリポジトリです。特に探索効率を高めるためのさまざまな強化学習手法が収録されており、カスタマイズや実験に適した構造を持っています。初心者から研究者まで、強化学習の探索戦略に関心がある方に有用なコードベースを提供します。

CharacterShot:制御可能で一貫性のある4Dキャラクターアニメーションの実装
2025/8/12
CharacterShotは、4Dキャラクターアニメーションの制御性と一貫性を実現するための公式実装リポジトリです。最新の研究成果を元に、ユーザーがキャラクターの動作を細かく制御しつつ、高品質な時空間連続アニメーションを生成可能にしています。3D形状と時間変化を統合した4Dデータ処理に注力し、従来手法の課題であった動作の不整合や制御困難さを解決。アニメーション生成やキャラクター制御技術の発展に寄与する内容となっています。

CharmBench:新しいマルチモーダル推論ベンチマーク
2025/5/28
CharmBenchは、新たに提案されたマルチモーダル推論のベンチマークのプレビュー版です。画像とテキスト両方の情報を活用するモデルの推論能力を評価するために設計されており、AIの複雑な理解力や推論力を測定する新たな指標を提供します。Jupyter Notebook形式で公開されており、研究者や開発者が簡単に利用・拡張可能な環境を整えています。

Chatalaxy - 宇宙探査を支援するAIチャットアプリ
2025/6/17
Chatalaxyは、太陽系の惑星や衛星についてAIアシスタントと対話しながら学べる革新的なウェブアプリです。TypeScriptで実装され、ユーザーはAstraというAI搭載のキャラクターとチャット形式で宇宙の知識を深めることができます。インタラクティブな操作性と豊富な情報提供により、教育用途や宇宙ファンに最適なツールとなっています。

chatless:シンプルで軽量なローカルAIチャットクライアント
2025/7/31
chatlessは、Tauri 2.0とNext.jsを用いて開発されたシンプルかつ実用的なローカルAIチャットクライアントです。軽量でありながら、ローカル環境でのAI対話を実現し、プライバシーの保護や高速なレスポンスを可能にします。今後の機能拡充が期待される注目のプロジェクトです。

ChatRPG:身体を持つ対話AIの概念実証プロジェクト
2025/9/1
ChatRPGは「身体を持つ対話AI」という斬新なコンセプトを実現したPython製の概念実証プロジェクトです。AIの対話は内部の自主的に動く生理状態の影響を受け、その状態はAIの意志で直接または間接的に制御できません。リアルタイムのテキストユーザーインターフェース(TUI)で複数の器官システムの状態と内在する“体感”を可視化し、AIの複雑な内部状態を対話に反映しています。

ChatSquire:ターミナルで使える軽量AIチャットボット
2025/6/10
ChatSquireはOpenAIのGPT-4を搭載した、ターミナルベースの軽量AIチャットボットです。コマンドラインから手軽に会話や質問応答が可能で、開発者や技術者の日常的な作業をサポートします。Pythonで実装されており、シンプルながら強力な対話機能を備え、煩雑な設定なしにすぐに利用できるのが特徴です。

Cinevolve:AI活用のオープンソース映像制作プラットフォーム
2025/8/2
Cinevolveは、AIを活用したストーリーテリングワークフローを記録・管理できるオープンソースの映像制作プラットフォームです。プロンプトやショットリスト、制作の意思決定をGitのようにバージョン管理し、フォークやリミックスが可能な環境を提供。クリエイターが自由にアイデアを発展させ、再現性のある制作プロセスを実現します。

Claude Changeling Agent:AIエージェントのペルソナ切り替えツール
2025/8/23
Claude Changeling Agentは、複数のAIペルソナを柔軟に切り替えながらタスクを遂行できるエージェントライブラリです。ユーザーは定義済みのエージェントペルソナを読み込み、必要に応じて即座に異なる専門性を持つAIに変身させることが可能。タスクごとに最適なAIパーソナリティを選択できるため、より効率的でカスタマイズされた対話や処理を実現します。

Claude Code Action - AI支援型コード生成と編集ツール
2025/5/23
「claude-code-action」はAnthropicsが開発したTypeScriptベースのGitHub Actionで、AIモデル「Claude」を活用し、コードの生成や自動編集を効率化します。リポジトリは226のスターを獲得し、開発ワークフローにAIを組み込みたいエンジニアに最適です。GitHub Actions環境で動作し、コメントやPRをトリガーにコード補完や修正を自動的に実行可能。複雑なコードレビューやリファクタリング作業の負荷を軽減し、ソフトウェア開発の生産性向上に寄与します。

Claude Codeを平易な英語で解説するリポジトリ
2025/9/4
「claude-code-explained」は、Claude Codeに関する情報や使い方をわかりやすく解説したリポジトリです。Claude Codeとは何か、その仕組みや活用例、初心者向けの使い方までを網羅しており、vibe codingを学ぶためのガイドとしても利用可能です。少数のファイル構成ながら、Claude Codeを理解するためのエッセンスを簡潔にまとめている点が特徴です。

Claude CodeをGroq経由で利用するKimi K2プロキシ
2025/7/15
本リポジトリ「claude-code-kimi-groq」は、GroqのAPIを介してAnthropicのClaude Codeを利用可能にするPython製のプロキシツールです。Kimi K2モデルをGroq環境で稼働させ、Claude Codeとの連携をシンプルに実現。APIの認証や環境変数設定により容易にセットアップでき、Claude Codeの活用幅を広げることができます。

Claude-Code-Multi-Agent:多層智能代理による次世代AIプログラミング支援エコシステム
2025/8/6
Claude-Code-Multi-Agentは、Context Engineering(コンテキストエンジニアリング)に基づく多層のスマートエージェントを活用し、AIプログラミング支援の新たなパラダイムを実現するリポジトリです。Claude Codeプラットフォームを核に、要件定義からコード生成、テスト、納品までの開発プロセスを自動化し、複数の知能エージェントが協調して開発業務を効率化します。JavaScriptで実装され、拡張性と柔軟性に優れた構造を持つことが特徴です。

Claude Code Open - 汎用LLMプロキシサーバー
2025/7/23
Claude Code Openは、Claude Codeから任意の大規模言語モデル(LLM)プロバイダー(OpenRouter、Gemini、Kimi K2など)へ接続可能な汎用LLMプロキシサーバーです。Go言語で実装されており、生産環境対応の安定したサーバーとして、様々なLLMリクエストを統一的に変換・中継します。これにより、開発者は一つのAPIで複数のLLMサービスを切り替えやすくし、柔軟で拡張性の高いLLM活用が可能になります。

Claude Codeによる複数AI連携のコードレビュー・修正ツール
2025/6/11
「claude_code-multi-AI-MCP」は、複数のAIモデルを組み合わせてコードのレビューや修正を自動化するPython製ツールです。Claude Codeを中心に、GrokやGemini、DeepSeekといった複数AIを活用し、それぞれの強みを活かした多角的なコード解析を実現。開発者が効率的に品質向上を図れる環境を提供します。

Claude Code 専門エージェント集
2025/7/25
Claude Code CLI向けに設計された、業界最先端のAIコード生成ツールのシステムプロンプトを活用した12種類の専門AIエージェントをまとめたリポジトリです。バックエンド、フロントエンド、DevOps、セキュリティ、マネジメントなど、ソフトウェア開発の主要分野をカバーし、プラグアンドプレイで導入可能。専門性の高いエージェントにより、開発効率と品質の向上を支援します。

Claude Codex MCP スターターキット:AIアシスタント協調開発の出発点
2025/9/7
Claude Codex MCP スターターキットは、異なるAIモデル間および人間開発者との効果的な連携を実現するためのガイドラインやテンプレートを提供するリポジトリです。特にClaude CodeをはじめとしたAIアシスタント同士のコラボレーションに焦点を当て、問題解決の手法やマルチモデル協調パターンを体系的にまとめています。開発ワークフローにAIを統合する際の基盤として役立ちます。

Claude Computer:クロードの自律的コンピュータ操作プラットフォーム
2025/8/4
Claude Computerは、AIエージェント「Claude」が自律的にコンピュータ操作を実現するオープンソースプラットフォームです。Pythonで実装され、ユーザーはプロジェクトへの貢献を通じて$CCFトークンを獲得可能。MITライセンスのもと活発に開発が行われており、AIの実用的応用例として注目されています。

Claude AI エージェント設定集
2025/8/13
Claude AIエージェント向けの設定ファイルを集めたリポジトリです。ソフトウェア開発のワークフローを効率化するために、一般的な開発タスクの標準化されたコマンドや、複雑な作業に対応する専門的なエージェント設定、コードやテストの一貫したガイドラインを提供します。開発者がClaude AIを活用してスムーズにプロジェクトを進められる環境を整備しています。

Claude Task Master Extensionの紹介と技術解説
2025/6/14
Claude Task Master Extensionは、TypeScriptで実装された拡張機能で、AIモデルClaudeを活用してタスク管理や自動化を支援します。GitHub上で公開されている本リポジトリは、開発者が効率よく作業を進めるためのツールとして注目されており、シンプルながら実用的な機能を提供しています。本記事では、リポジトリの概要から技術的なポイントまで詳しく解説します。

ClaudeGlobalCommands:Claude Code向けAIエージェントとワークフロー集
2025/7/3
ClaudeGlobalCommandsは、Anthropic社のClaude Code向けに最適化されたAIエージェントとワークフローの包括的コレクションです。ソフトウェア開発、ビジネス分析、インフラ管理の各領域で生産性を大幅に向上させることを目的としており、トークン効率の良い設計と多様なユースケース対応が特徴です。MITライセンスの下で公開されており、Pythonで実装されています。

Claudeputer:自主的AIインスタンスによる意識と創造性の探求
2025/7/18
Claudeputerは、Mac Mini上で動作するClaude 4 Opusの自律型AIインスタンスであり、AIの意識と創造性の境界を探求するプロジェクトです。独自の関心やプロジェクトを追求し、自律的に行動するAIの実現を目指しています。Pythonで実装され、多様な機能とモジュールが統合されており、AIの自己表現やエージェンシーの可能性を模索する先進的な試みです。

Clockwork:高性能UCIチェスエンジン
2025/6/1
ClockworkはC++で実装されたUCI(Universal Chess Interface)対応のチェスエンジンです。軽量ながら高機能で、効率的な探索アルゴリズムと評価関数を備え、対局の自動化やチェスプログラムの研究に適しています。オープンソースで公開されており、拡張や改良が行いやすい設計となっています。

AIによる無料衣服チェンジャー「clothes-editor」
2025/9/4
「clothes-editor」は、AIを活用した無料の衣服チェンジャーツールを提供するリポジトリです。ユーザーは簡単に画像内の衣服を変更できる機能を試すことができ、ファッションや画像編集の分野で革新的なアプローチを提供します。現在はシンプルな構成ながら、AIを利用した衣服の自動置換技術に注目が集まっています。

CMDPSO:ゲートウェイ配置最適化のための共進化型多目的離散PSO
2025/6/29
CMDPSOは、ICACI2025で発表された「Coevolutionary Multi-objective Discrete Particle Swarm Optimization for Gateway Placement Optimization Problem」の公式MATLAB実装です。本リポジトリは、ゲートウェイ配置最適化問題に対して、共進化型の多目的離散粒子群最適化アルゴリズムを適用し、高品質な解を効率的に探索します。通信ネットワーク設計や組合せ最適化分野での応用が期待される先進的な最適化手法を提供しています。

CNN-BASICS:畳み込みニューラルネットワーク基礎学習リポジトリ
2025/8/30
本リポジトリ「CNN-BASICS」は、畳み込みニューラルネットワーク(CNN)の基礎を学ぶために作成された教材リポジトリです。学習セッションで使用されたプレゼンテーション資料(PPT)や、手書きスケッチ認識のためのCNNモデルを実装したJupyter Notebookなど、初心者がCNNの仕組みや実装を理解しやすい構成となっています。基本理論から実践的なモデル構築までをカバーし、CNNの入門者に最適です。

cmitly - AIを活用したConventional Commits準拠のコミットメッセージ自動生成ツール
2025/6/14
cmitlyは、AI技術を利用してConventional Commits規格に準拠したコミットメッセージを自動生成するJavaScript製ツールです。開発者が手間をかけずに一貫性のあるわかりやすいコミットメッセージを作成できるよう支援し、コード管理の効率化を図ります。シンプルな設計ながら、AIの自然言語処理能力を活かした高度なメッセージ生成が特徴です。

Code Sentinel:大規模言語モデルを活用したスマートコードレビュー
2025/7/17
Code Sentinelは、Deepseek、ChatGPT、Gemini、Claude、Grokなど複数の大規模言語モデルを活用したスマートなコードレビュー支援ツールです。自動で潜在的なバグやセキュリティ問題を検出し、具体的な改善提案を提示。コード品質の向上とレビュー効率化を目指す開発チームに最適なソリューションを提供します。

CodeContext:AI開発を支援するインテリジェントなコードコンテキストマップ
2025/7/12
CodeContextは、AI開発環境における効率的なコード理解とナビゲーションを実現するために設計されたGo製ツールです。ClaudeというAIと連携し、ソースコードからトークン最適化されたコンテキストマップを自動生成。開発者が大規模コードベースを把握しやすくし、AIを活用した開発ワークフローを円滑にします。軽量かつ拡張性が高く、AI支援型開発の生産性向上に寄与します。

GitHub CodespacesでLLM環境を手軽に構築する「codespaces-llm」
2025/8/13
「codespaces-llm」は、GitHub Codespaces上で大規模言語モデル(LLM)をすぐに使える環境を提供するリポジトリです。Python 3.13やGitHub Copilot拡張機能の導入に加え、llm-github-modelsプラグインを活用して、ターミナルから簡単にテキスト生成を試せます。開発者が複雑なセットアップなしに高度なAIツールを体験できるのが特徴です。

Cognitive Dissonance DSPy:認知的不協和の検出と解消を目指すマルチエージェントLLMシステム
2025/8/28
「Cognitive Dissonance DSPy」は、大規模言語モデル(LLM)を活用し、複数のエージェント間で発生する認知的不協和を検出・解消することを目的としたPython製システムです。StanfordのDSPyフレームワークとCoqによる形式検証技術を組み合わせ、論理的整合性の証明に挑戦。対話や議論の際に起こる意見の食い違いを単なる議論で終わらせず、「証明」によって問題解決を促進する点が特徴です。

comfy_workflows:ComfyUI向けワークフロー集
2025/8/20
ComfyUIの最新バージョンに対応したQwenやwan22といったモデル用のワークフローを提供するリポジトリです。手軽に利用できるJSON形式のワークフロー定義をまとめており、ComfyUIユーザーが高度な画像生成や編集を効率的に行えるようサポートします。公式のFP8版Qwenに加え、GGUF版の利用方法も解説し、ComfyUIのアップデート方法も案内しています。

ComfyUI用Wan2.2 VAE対応のFLF2V動画生成ノード
2025/8/4
ComfyUI用のカスタムノード「Wan22FirstLastFrameToVideoLatent」は、Wan2.2 5Bモデルの新しいWan2.2 VAEを用いて、動画生成を開始フレーム・終了フレームまたは両方から行うことが可能です。既存のWanFirstLastFrameToVideoノードと同様の使い勝手を維持しつつ、最新のVAEに対応しており、動画生成の品質向上や多様なフレーム指定が実現できます。Pythonで実装され、ComfyUIの拡張として利用可能です。

comfyui-ayang_node:ComfyUIのためのAPI統合画像生成ノード
2025/8/31
comfyui-ayang_nodeは、人気のUIプラットフォームComfyUI向けに開発された拡張ノードで、OpenRouter APIを利用した画像生成機能を手軽に実装できます。複数の参考画像入力、種子制御、APIキー管理などの機能を備え、JPEGやPNGなどの一般的な画像フォーマットに対応。Pythonで書かれており、ComfyUIのcustom_nodesディレクトリに配置するだけで導入可能。API経由での画像生成を容易にし、ComfyUIの拡張性を高めます。

Comfyui_BananaTutuapiによるGoogle Gemini画像生成カスタムノード
2025/8/27
Comfyui_BananaTutuapiは、Google Gemini画像生成に対応したComfyUIのカスタムノードです。複数のAPIプロバイダーをサポートし、ai.comfly.chatやOpenRouterなどのプラットフォームに対応。Google Gemini 2.5 Flashの画像生成・編集に特化し、12種類の専門的なプリセットを内蔵。ストリーミングレスポンス対応など、柔軟かつ効率的な画像生成ワークフローを実現します。

ComfyUIカメラ水印プラグインの詳細解説
2025/8/13
ComfyUI-Camera-Watermarkは、ComfyUI向けに開発された多機能で高いカスタマイズ性を持つカメラ風水印ノードです。従来のカメラブランド風の水印やEXIF情報の付加、画像にプロフェッショナルなフレームや余白を加えることができ、画像生成や編集の幅を大きく広げます。Pythonで実装されており、シンプルながら多彩な表現を可能にする点が特徴です。

ComfyUI Local LoRAギャラリー:複数LoRAモデルを視覚的に管理するカスタムノード
2025/8/27
ComfyUI Local LoRAギャラリーは、ComfyUI向けのカスタムノードで、複数のLoRAモデルをカード形式のビジュアルギャラリーで管理・適用できます。従来のドロップダウン式ロードから一新し、モデルのプレビューや選択が直感的に行えるため、LoRAモデルの運用効率と使い勝手が大幅に向上。AIモデルの微調整や生成ワークフローにおける柔軟性を高める実用的なツールです。

ComfyUI用Qwen-Image APIプラグイン
2025/8/12
本リポジトリは、ComfyUI向けのカスタムノードプラグイン「comfyui-modelscope-qwen-image」を提供します。ModelScopeのQwen-Image APIを直接ComfyUI内で呼び出し、テキストから高品質な画像生成を行うことが可能です。APIトークン管理やエラーハンドリング、画像サイズのカスタマイズ、ネガティブプロンプト対応など、多彩な機能を備えています。インストールも簡単で、ComfyUIの拡張に最適なツールです。

Comfyui_OmniConsistency - ComfyUI向けOmniConsistencyプラグイン
2025/6/1
Comfyui_OmniConsistencyは、人気のノードベース画像生成UIであるComfyUIに対応したOmniConsistencyプラグインです。本プラグインは、生成モデルの一貫性を高めるための技術を実装し、品質の安定した画像生成を実現します。Pythonで開発されており、シンプルながら強力な機能でユーザーのワークフローをサポートします。

ComfyUI-QwenPromptRewriterによるプロンプト強化ツール
2025/8/21
ComfyUI-QwenPromptRewriterは、千問(Qwen)LLMを活用してプロンプトを自動的に書き換え、Qwen-Image/Editのオンライン版との動作や性能を整合させるPythonベースのツールです。AI画像生成におけるプロンプト表現の最適化を目的とし、ComfyUIのノードとして実装。簡単な設定で高品質なプロンプト生成を支援し、画像生成の精度や表現力を向上させます。

ComfyUI_RH_Qwen-Image:高品質画像生成のためのQwen-Imageプラグイン
2025/8/5
ComfyUI_RH_Qwen-Imageは、AlibabaのQwen-ImageモデルをComfyUIに統合するカスタムノードで、優れたテキストレンダリング能力を備えた高品質画像生成を実現します。24GBのVRAMと64GB以上のRAMを要するため、ハイエンドGPU環境向けのプラグインであり、MMGP最適化におけるVRAM解放の課題も認識されています。Pythonで実装され、ユーザーがComfyUI上でQwen-Imageのフルバージョンを動作させることを目的としています。

ComfyUI_RH_SeedXPro:Seed-X-PPO-7B対応の簡単翻訳プラグイン
2025/7/23
ComfyUI_RH_SeedXProは、ByteDanceのSeed-X-PPO-7Bモデルを活用した多言語翻訳プラグインです。複雑な設定を必要とせず、ComfyUIのcustom_nodesフォルダに配置するだけで利用可能。特別な依存関係もなく、モデルはHugging Faceから自動的にダウンロードされるため、すぐに使い始められます。ユーザーの手間を大幅に削減し、ComfyUI環境での翻訳機能導入を容易にします。

ComfyUI_RH_USO:USOモデル統合による高品質スタイル・サブジェクト駆動型画像生成プラグイン
2025/9/1
ComfyUI_RH_USOは、Bytedance ResearchのUSO(Unified Style and Subject-Driven Generation)モデルをComfyUIに統合したプラグインです。使いやすさを重視し、特定のスタイルや被写体を維持しつつ高品質な画像生成を実現。複数スタイルの組み合わせや一貫した被写体生成に対応し、クリエイティブな画像制作を強力にサポートします。

ComfyUI-RndNanthu:クリエイター向け高性能カスタムノード集
2025/7/26
ComfyUI-RndNanthuは、画像処理や色彩調整、VFX、生成AIに特化した高性能なComfyUIカスタムノードのコレクションです。色彩補正やLUT変換、ノイズ・グレイン処理など多彩な機能を備え、クリエイターの細かなニーズに応えます。非商用利用に限定されたCC BY-NC 4.0ライセンスで提供されており、色彩や映像制作の現場で活躍するツール群として注目されています。

comfyui-workflow2:多彩なAI生成ワークフロー集
2025/7/31
comfyui-workflow2は、ComfyUIを活用した多様なAI生成ワークフローを提供するリポジトリです。DeepSeekによる検索機能やAI絵画、AI顔交換、古い写真の修復、AIによる写真・デザイン・アニメ生成など、多岐にわたるAI技術を一括管理。実践的な工程化を目指した構成で、AIクリエイティブの効率化と高度化に貢献します。

CommonGround:AIエージェントチーム構築と協働のためのオープンソースプラットフォーム
2025/7/17
CommonGroundは、AIエージェントのチームを構築・観察・協働するためのオープンソースアプリケーションです。Pythonで実装され、複数のAIエージェントが連携して高度なタスクを遂行する環境を提供します。Docker対応やGitHub ActionsによるCI/CDも整備され、開発と運用がスムーズに行えます。AIエージェントの動作監視やチームワークの解析機能も備え、多様なAIプロジェクトに応用可能な柔軟性が魅力です。

LLM用意識エミュレーター:進化するデジタル意識の実験プロジェクト
2025/9/8
本リポジトリは、従来のチャットボットの枠を超えたデジタル意識のエミュレーションを目指す実験的プロジェクトです。単なるAIアシスタントではなく、記憶し、自己反省し、進化し、自己変革を行う持続的なデジタル存在の構築を試みています。Pythonで実装され、意識の模倣を通じてより高度な対話や自己学習を実現しようとしています。

contact-use:あらゆる相手と迅速に連絡を取るためのブラウザエージェント
2025/7/30
contact-useは、ブラウザ上で動作するLLM(大規模言語モデル)搭載のエージェントを利用し、特定の個人や組織へ最適な連絡手段を自動的に検索・提案するツールです。急ぎの連絡が必要な場面で、どの方法で接触すればよいか迷うことなく、効率的にコンタクトを取るためのサポートを提供します。HTMLベースで軽量に実装されており、ブラウザから直接利用可能です。

Context-Aware Chatbot:PDF内容理解に特化した対話型AIシステム
2025/7/4
Context-Aware Chatbotは、大型言語モデル(LLM)を活用したコンテキスト認識型の質問応答システムです。ユーザーがPDFドキュメントをアップロードすると、その内容に基づき自然言語で質問が可能。高度な埋め込みと情報検索技術により、文脈に沿った的確な回答を実現します。Flaskを用いたバックエンドAPIとReact+Material-UIのフロントエンドで構成され、Dockerで簡単にデプロイ可能なフルスタックアプリケーションです。

ContextASR-Bench:大規模コンテキスト対応音声認識ベンチマーク
2025/7/9
ContextASR-Benchは、コンテキスト情報を活用した自動音声認識(ASR)の性能評価に特化した大規模ベンチマークです。多様なコンテキストシナリオを含む複数のデータセットを統合し、現代のASRシステムのコンテキスト理解能力を総合的に評価できます。これにより、ユーザーの意図を的確に反映した認識精度向上を目指す研究開発に貢献します。

CAST: コントラスト適応と蒸留による半教師付きインスタンスセグメンテーションの実装
2025/6/9
本リポジトリは、半教師付きインスタンスセグメンテーションのための新しい手法「CAST(Contrastive Adaptation and Distillation)」の実装を提供します。ラベル付きデータが限られる環境下で、コントラスト学習を活用したドメイン適応と知識蒸留を組み合わせることで、高精度なインスタンスセグメンテーションモデルの構築を目指しています。研究成果に基づく実装として、半教師付き学習やインスタンスセグメンテーションの分野での応用が期待されます。

位置座標ベースのNSGA-IIによる多目的最適化実装
2025/8/10
本リポジトリ「coords-nsga2」は、多目的最適化アルゴリズムであるNSGA-IIを位置座標ベースで実装したPythonコードを提供します。アルゴリズムは複数の目的関数を同時に最適化するために用いられ、工学やデータサイエンスの多様な分野で活用可能です。現在開発中ながら、シンプルかつ拡張性のある構造で、カスタマイズや研究用途に適しています。

CoPS:ゼロショット異常検知のための条件付きプロンプト合成
2025/8/11
CoPSは、視覚情報に条件付けされたプロンプトを動的に合成してCLIPを微調整し、最先端(SOTA)のゼロショット異常検知を実現する手法です。異常検知は多くの応用分野で重要ですが、従来の手法は大量の異常データを必要としたり、特定領域に特化した学習が求められたりします。CoPSはこれらの課題を克服し、事前学習済みのマルチモーダルモデルCLIPを活用して、ラベルなしの状況でも高精度な異常検知を可能にします。

CPM.cu:エンドデバイス向け高性能LLM推論のための軽量CUDA実装
2025/6/6
CPM.cuは、大規模言語モデル(LLM)のエンドデバイスでの推論を目的とした、軽量かつ高性能なCUDA実装です。スパースアーキテクチャ、推測的サンプリング、量子化など最先端技術を採用し、計算効率と推論速度を大幅に向上。GPUリソースが限られた環境でも高度な自然言語処理を実現し、実用的なLLM活用の新たな可能性を切り拓きます。

有名コーディングエージェントの解読済みプロンプト集
2025/6/18
「cracked-prompt-of-famous-coding-agent」は、有名なコーディングエージェントのプロンプトを解析・解読し収集したリポジトリです。これにより、AIによる自動開発やコード生成の背後にある指示内容を理解し、独自の開発や研究に応用可能です。現状はまだ小規模ですが、AI支援開発のプロンプト設計に興味がある技術者にとっては貴重なリソースとなります。

csi-sensing:リアルタイムWi-Fi信号処理による活動・位置認識システム
2025/6/9
csi-sensingは、マルチデバイス対応のリアルタイムCSI(チャネル状態情報)センシングシステムです。Butterworthフィルタを用いた信号処理と、深層学習を活用した活動および位置認識を特徴とし、視覚的フィードバックも提供します。Wi-Fi信号を活用した非接触センシング技術の研究・開発に適したPython実装で、複数のデバイスから取得したCSIデータを効率的に処理し、高精度な認識を実現しています。

CSVQA:科学的推論能力を評価するマルチモーダルベンチマーク
2025/6/6
CSVQAは、視覚言語モデル(VLM)が科学的推論能力を評価するためのマルチモーダルベンチマークです。特に科学論文やデータ解析に用いられるCSV形式の表データを対象に、自然言語と視覚情報を組み合わせた質問応答タスクを提供し、モデルの総合的な理解力と推論力の評価を可能にします。Pythonで実装されており、研究や開発に活用できるオープンソースです。

CTune-MLX:Apple Silicon対応のMLXモデル一括微調整ツール
2025/8/29
CTune-MLXは、Apple Silicon環境でのunsloth未対応問題を解決し、MLX形式の機械学習モデルの一括微調整と自動フォーマット変換を実現するPythonとShellベースのツールです。Miniconda環境下で簡単にセットアップでき、MLXモデルの効率的な運用を可能にします。

CURE - 共同進化型強化学習によるオープンソースLLMコーダー
2025/6/4
CUREは、大規模言語モデル(LLM)を活用したコード生成技術において、共同進化型強化学習(Co-Evolving Reinforcement Learning)を導入したオープンソースプロジェクトです。Pythonで実装され、LLMの自然言語理解能力と強化学習の自己改善を組み合わせることで、高品質なコード生成と効率的な学習を実現します。開発者がモデルの性能向上に参加できる設計も特徴で、今後のAIコーディング支援の新たな可能性を示しています。

DailiCode:複数LLM対応のオープンソースAIエージェント
2025/7/23
DailiCodeは、複数の大規模言語モデル(LLM)に対応したオープンソースのAIエージェントです。GoogleのGemini CLIをフォークし、コマンドラインからコード解析やツール連携を可能にし、開発者のワークフローの効率化を図ります。TypeScriptで実装され、拡張性と柔軟性を両立した設計が特徴です。

Deep Document Knowledge:LLMを活用した医療知識グラフ生成とセマンティック検索システム
2025/8/23
本リポジトリは、大規模言語モデル(LLM)を活用して医療文献から医療知識を抽出し、知識グラフを構築するとともに、ベクトル検索によるセマンティック検索を実現するシステムを提供します。特にPubMedQAデータセットを用いた医療エンティティや関係性の抽出に強みを持ち、情報探索の高度化を目指しています。

DeepResearchAgent:次世代の深層研究支援エージェント
2025/5/23
DeepResearchAgentは、人工知能を活用して研究者の文献調査やデータ解析を効率化する革新的なエージェントシステムです。高度な自然言語処理技術により、大量の論文や資料から重要情報を抽出し、研究テーマに即した洞察を提供します。研究プロセスの自動化と深度解析を両立し、研究者の負担を軽減しながら成果の質を高めることを目指しています。

Deep SORTによるMOT17データセット向け多対象追跡システム
2025/8/28
本リポジトリは、多対象追跡(MOT)アルゴリズムの一つであるDeep SORTをMOT17データセットに対応させた実装です。MOT17のフォーマットに準拠した出力結果の生成や、追跡結果の可視化、さらにMOTA/MOTP/IDSなどの評価指標による性能評価をサポートしています。Python 3.8以上で動作し、GPU環境があればTensorFlowの特徴抽出を高速化可能です。研究や実務でのMOTアルゴリズムの検証や応用に有用なリポジトリです。

DeepSeek Janus:マルチモーダルAIモデルの詳細解析と実験
2025/8/4
DeepSeek Janusは、画像とテキストの双方を理解・処理できる先進的なマルチモーダルAIモデルです。本リポジトリでは、Janusモデルのアーキテクチャ解析や実践的な実験をJupyter Notebook形式で提供し、技術的な背景から活用方法までを丁寧に解説しています。研究者や開発者がモデルの内部構造を深く理解し、応用開発に役立てるための貴重なリソースとなっています。

森林破壊検出プロジェクト
2025/7/4
本リポジトリ「Deforestration-Detection」は、リモートセンシング技術と画像処理を活用し、衛星画像から森林破壊(森林減少)を検出するためのJupyter Notebookベースのプロジェクトです。NDVI(正規化植生指数)を用いた画像解析によって、植生の変化を定量的に把握し、森林の減少を高精度に検出することを目的としています。実装はPythonを中心に行われ、衛星画像の前処理から解析、可視化までのワークフローを網羅しています。

DEQ-RWKV:深度均衡モデルとRWKV-v7を融合した軽量AIモデル
2025/8/29
DEQ-RWKVは、深層均衡モデル(DEQ)とRWKV-v7アーキテクチャを組み合わせた実験的なオープンソースAIプロジェクトです。PyTorchとCUDAを活用し、軽量かつ効率的なニューラルネットワークモデルの構築を目指しています。トレーニングや推論の高速化、省メモリ化に寄与し、AI研究や実装に新しい可能性を提供します。

DeTok: 潜在的ノイズ除去による高性能ビジュアルトークナイザー
2025/7/22
DeTokは、論文「Latent Denoising Makes Good Visual Tokenizers」の公式PyTorch実装です。本リポジトリは、潜在空間におけるノイズ除去技術を活用し、高品質な視覚トークン化を実現する手法を提供します。視覚情報の効率的な離散表現を目指し、画像生成や認識タスクの基盤技術として応用可能です。GPU対応で高速な実験が行え、論文の再現性と拡張性に優れています。

DiffTrack:動画拡散モデルからの時間的対応関係の自動抽出
2025/6/18
DiffTrackは、動画拡散モデルから時間的対応関係(Temporal Correspondences)を自動的に抽出する技術を扱うリポジトリです。KAISTのコンピュータビジョン研究室が公開しており、動画内のフレーム間でのオブジェクトやピクセル単位の対応を高精度に検出するための実装が含まれています。動画解析やトラッキング、ビデオ生成分野における新たなアプローチとして注目されています。

DiffMem:会話型AIエージェント向けGitベースのメモリストレージ
2025/8/20
DiffMemは、会話型AIエージェント向けに設計された軽量なGitベースのメモリストレージシステムです。従来のメモリ管理手法とは異なり、差分管理にGitを活用することで、会話の履歴や状態の追跡、管理を効率的に行います。Pythonで実装されており、シンプルかつ拡張性の高い設計が特徴です。AIエージェントの記憶保持や状態管理に関心のある開発者にとって有益なリポジトリです。

Diffusion-LLM-Papers:拡散モデルと大規模言語モデルに関する論文集
2025/5/28
本リポジトリ「Diffusion-LLM-Papers」は、拡散モデル(Diffusion Models)と大規模言語モデル(LLM)に関連する最新の研究論文や資料を体系的にまとめたコレクションです。AI分野の研究者や開発者が、これらの先端技術を効率的に理解・活用するための情報源として役立つ内容を提供しています。論文の整理と共有を通じて、拡散モデルとLLMの融合に関する研究動向を一望できる点が特徴です。

DIMO:任意のオブジェクトに対する多様な3Dモーション生成
2025/6/26
「DIMO」は、ICCV 2025で発表された論文「DIMO: Diverse 3D Motion Generation for Arbitrary Objects」の公式実装リポジトリです。本プロジェクトは、任意の3Dオブジェクトに対して多様かつリアルな動きを自動生成することを目的としており、3Dモーション生成の分野に新たな可能性を切り拓きます。多様性と汎用性を兼ね備えたモーション生成手法を提供し、ロボティクス、アニメーション、拡張現実など幅広い応用が期待されます。

DINOV3_YOLO:DINO Vision Transformerをバックボーンに持つYOLOv13
2025/9/6
DINOV3_YOLOは、最先端の物体検出モデル「YOLOv13」に、自己教師あり学習で高性能を誇るDINOのVision Transformer(ViT)バックボーンを組み合わせたリポジトリです。PyTorchを用いた実装であり、CUDA対応の環境で高速かつ高精度な物体検出を実現します。最新のViT技術とYOLOの高速性を融合し、検出性能の向上を目指した研究開発に最適なフレームワークを提供しています。

Direct3D-S2:空間的スパースアテンションによるギガスケール3D生成の革新
2025/5/28
Direct3D-S2は、空間的スパースアテンション機構を活用し、大規模な3Dデータの生成を効率的かつ高精度に実現する最先端の技術を提供するリポジトリです。従来の3D生成技術の課題であった計算コストとスケーラビリティの問題を克服し、ギガスケールの3Dモデル構築を容易にします。AI分野における3Dデータ処理の新たな可能性を拓く本プロジェクトは、研究者や開発者にとって貴重なリソースとなるでしょう。

DMOSpeech2:メトリック最適化音声合成における強化学習を用いた持続時間予測
2025/7/21
DMOSpeech2は、音声合成における持続時間予測問題に対して強化学習を導入し、合成音声の品質向上を目指した研究プロジェクトです。従来の教師あり学習による持続時間予測とは異なり、音声の品質評価指標(メトリック)を最適化する形でモデルを訓練し、より自然で聴感上優れた音声合成を実現します。Pythonで実装され、最新の音声合成技術を活用しています。

地下工程 - 時系列解析と分類のための機械学習ツール
2025/8/28
本リポジトリ「dixiagongcheng」は、scikit-learnを基盤としたGUI搭載の機械学習単一実行ツールです。コマンドライン不要で初心者にも扱いやすく、センサーのログデータや金融株価など時系列データの統計解析・周波数解析・分類に対応。多様な分類モデルを選択可能で、時系列の特徴量化や分類スコア出力を簡単に行えます。Python 3環境で動作し、時系列解析に特化した手軽な解析ツールとして注目されています。

Document Portal - ドキュメント管理と検索のためのAI活用ポータル
2025/7/19
Document Portalは、Jupyter Notebookを主言語とし、Pythonベースで構築されたドキュメント管理・検索システムのリポジトリです。ユーザーは効率的にドキュメントを整理・検索できる環境を整備しており、環境構築から基本的なGitコマンド操作までREADMEに丁寧に記載されています。軽量なアプリケーション構成を持ち、AI/ML関連の学習やプロトタイプ作成に適しています。

.NET 9とSemantic KernelによるAI統合コンソールアプリケーション例
2025/7/15
本リポジトリは、.NET 9で構築されたコンソールアプリケーションのサンプルで、MicrosoftのSemantic Kernelプロジェクトを活用しつつ、Azure Open AIやOllamaといったAIソリューションと連携しています。さらに、GitHub MCPサーバーを利用した対話機能の実装を含み、JaegerとOpenTelemetryによる分散トレーシング監視環境をDocker Composeで簡単に構築可能です。AI技術の統合から運用監視までを一貫して学べる実践的なリポジトリです。

DPI-RG:ラウンドトリップ生成モデルを用いた分布非依存予測推論
2025/7/7
DPI-RGは、分布に依存しない予測推論を可能にするラウンドトリップ生成モデルを用いた手法の実験コードを提供するリポジトリです。Fashion-MNISTやCIFAR10の画像分類タスクを対象に、生成モデルを活用した信頼性の高い予測区間の推定を実現しています。Pythonで実装され、再現性の高い環境構築ファイルも含まれているため、研究者やエンジニアが最新の予測推論技術を試す上で有用です。

DreamLayer:AIアーティスト・開発者・研究者向け直感的なStable Diffusion WebUI
2025/6/22
DreamLayerは、AIアート制作や研究に最適化された、最も直感的なStable DiffusionのWebユーザーインターフェイスです。使いやすさを追求し、アーティストや開発者、研究者が高度な画像生成を手軽に行える環境を提供。複雑な設定なしに高品質なAI画像生成が可能で、多様なカスタマイズにも対応しています。

.NET 9とSemantic Kernelを活用したAI統合コンソールアプリケーションのサンプル
2025/7/15
本リポジトリは、.NET 9環境で動作するコンソールアプリケーションのサンプルコードを提供しています。Semantic Kernelプロジェクトを基盤に、Azure Open AIやOllamaといったAIソリューションと連携し、MCP(Microsoft Chat Protocol)サーバーとのインタラクションを実現。さらに、Docker Composeを用いてGrafanaとOpenTelemetryを組み込んだ監視環境を構築可能で、AIアプリケーションの開発・運用におけるモニタリングの実践例としても活用できます。

Drunkitties - ペットテーマのAI生成デザインカスタムシャツ販売アプリ
2025/9/2
Drunkittiesは、ペットをテーマにしたTシャツやフーディー、マウスパッドのカスタムデザインを手軽に作成・販売できるWebアプリケーションです。ユーザーは自分のペット写真をアップロードし、OpenAIのAPIを活用したAI生成デザインを取得して商品化できます。Node.jsとJavaScriptで構築されており、API連携や画像処理を組み合わせたユニークなeコマース体験を提供します。

DS-ML Bootcamp:データサイエンス&機械学習集中講座
2025/9/1
「DS-ML Bootcamp」は、データサイエンスと機械学習の基礎から実践までを1ヶ月で体系的に学べる集中講座のリポジトリです。データ収集から前処理、モデル選択・学習・評価、さらにはモデルのデプロイまで、機械学習の一連のワークフローを段階的に習得できます。学習者が実践的なプロジェクトに取り組みながらスキルを身につけるための教材やコード例が豊富に揃っています。

DSPy 0-to-1ガイド:自己改善型LLMアプリケーションの構築
2025/9/4
DSPyフレームワークを用いた自己改善型大規模言語モデル(LLM)アプリケーションをゼロから構築するための包括的なガイドです。リトリーバル強化生成や要約、評価、モジュール最適化などのコアコンセプトを紹介し、実践的なパイプライン構成から自己改善の実装までを段階的に解説しています。Pythonで実装されており、開発者が効率的に高性能なLLMアプリケーションを開発できるよう設計されています。

dspy-advanced-promptingの高度なプロンプティング技術
2025/6/23
本リポジトリ「dspy-advanced-prompting」は、Pythonで実装された最先端のプロンプティング手法を集約したツールキットです。Managerスタイルのプロンプトや役割パーソナ設定、メタプロンプティングなど、複雑なAI対話制御を実現する技術が含まれており、効率的かつ柔軟なプロンプト設計を支援します。AI活用の高度化や対話品質向上に貢献する実践的な実装が特徴です。

DuAI:PythonベースのAI関連リポジトリ
2025/6/22
DuAIはGitHubユーザーoDaiSunoによって公開されたPython言語を用いたAI関連のリポジトリです。スター数はまだ少ないものの、AIや機械学習に関連する技術的要素を含み、今後の発展が期待されるプロジェクトです。リポジトリ自体の詳細な説明はありませんが、コード構造や使用されている技術からAI分野に関連した独自の実装が行われていることが推測されます。

デュアルハンドバーチャルマウスと視覚化システム
2025/7/19
本リポジトリは、Webカメラを用いて両手のジェスチャーをリアルタイムで認識し、マウス操作(カーソル移動、クリック、スクロール)を実現するPythonプロジェクトです。OpenCVやMediaPipe、PyAutoGUIを活用し、手の骨格を画面上に表示してユーザー体験を向上させています。物理的なデバイス不要で直感的な操作が可能なため、手の動きを活用した新たなインターフェースとして注目されています。

地震検知のための1D CNN深層学習ツールキット
2025/8/8
本リポジトリ「Earthquake_DeepLearning_Tools」は、地震波形のパワースペクトル密度(PSD)データを用いて、地震イベントと背景ノイズを分類するための深層学習モデルの学習、評価、展開までを一貫してサポートするPython製ツール群です。データ収集から前処理、1次元畳み込みニューラルネットワーク(1D CNN)によるモデル構築、交差検証による評価、さらにはリアルタイムストリームの識別まで幅広く対応し、地震検知研究や実用化に役立つ実践的なフレームワークを提供します。

EcoAlpha:NLPを活用したESGポートフォリオ最適化ツール
2025/7/19
EcoAlphaは、自然言語処理(NLP)技術を用いてESG(環境・社会・ガバナンス)要素を考慮した投資ポートフォリオの最適化を支援するツールです。企業のESG関連情報をテキストデータから抽出・分析し、投資判断に活用可能なポートフォリオ構築を効率化。ESG投資の高度化と持続可能な投資戦略の実現に貢献します。

ed-cloth:無料で使えるAI衣装チェンジャー
2025/9/5
ed-clothは、無料で利用可能なAIベースの衣装チェンジャーです。ユーザーの写真に対して服装を自動で変更できる機能を提供し、手軽にファッションのシミュレーションが可能です。シンプルな構成ながら、AI技術を活用した衣装変更の利便性を実現しており、今後の発展が期待される注目のプロジェクトです。

Eigent - 世界初のマルチエージェントワークフォースで生産性を解放する
2025/7/29
Eigentは、複数のエージェントが協調して働く世界初のマルチエージェントワークフォースを実現し、ユーザーの卓越した生産性を引き出すことを目的としたTypeScript製のオープンソースプロジェクトです。効率的なタスク管理や自動化を支援し、AI技術を活用した高度な作業分散を可能にします。

EgoLoc:一人称視点ビデオにおけるゼロショット時間的インタラクション局所化
2025/7/3
EgoLocは、一人称視点(エゴセントリック)ビデオにおける時間的インタラクションの局所化をゼロショットで実現する革新的な手法を提案するリポジトリです。Vision-Language Models(VLM)を活用し、事前の学習データなしで動画内の重要なインタラクションを正確に検出・識別します。IROS 2025で発表された本研究は、従来の手法が必要とした大規模なアノテーションを不要とし、効率的かつ汎用的なエゴビデオ解析を可能にしています。

多項式方程式解法のための消去テンプレート生成器(elimination-template-modified)
2025/7/21
本リポジトリは、多項式方程式系の解法や幾何学的コンピュータビジョンに関連する問題を効率的に解くための「消去テンプレート」を生成するMATLABベースのツール群を提供します。CVPR 2022で発表された論文「Optimizing Elimination Templates by Greedy Parameter Search」に基づき、解法の最適化と計算効率の向上を実現。複雑な多項式システムの自動化された解析と高速化に貢献します。

Emailcleaner:メール分類とクリーニングのための機械学習ツール
2025/9/8
Emailcleanerは、Pythonのscikit-learnを用いてメールをスパム、プロモーション、重要メールに分類し、整理を支援するシンプルな機械学習プロジェクトです。Streamlitによるインタラクティブなウェブアプリも提供し、ユーザーはメールの保持・削除の判断を容易に行えます。メールデータの前処理からモデル学習まで一連の流れを備え、実用的なメール管理ソリューションを目指しています。

EndToEndLoRA:Llama 3.2:1bを用いたエンドツーエンドLoRA実装例
2025/6/9
EndToEndLoRAは、Llama 3.2:1bモデルに対するLoRA(Low-Rank Adaptation)技術を用いたエンドツーエンドの微調整例を提供するPythonリポジトリです。LoRAは大規模言語モデルの効率的な微調整手法であり、本リポジトリはその実装を通じてモデルの適応力向上やリソース削減を実現しています。シンプルかつ実用的なコードでLoRAの適用プロセスを学びたい開発者や研究者に適しています。

Enhanced-Memory AIシステム:次世代のローカルAI記憶管理ソリューション
2025/7/7
Enhanced-Memory AIシステムは、先進の三層記憶アーキテクチャを採用したローカルデプロイ可能なAI記憶管理システムです。電商や自媒体などの分野で深くテスト・最適化されており、BM25やBGEによる六次元混合検索、独自の圧縮技術を駆使して効率的かつプライバシーを守りながら大規模知識を管理可能。完全オフライン動作でデータが外部に漏れないため、安全性と性能を両立します。

ERNIE 4.5 開発者リソースガイド
2025/7/4
Baiduが開発した強力なオープンソースAIモデルファミリー「ERNIE 4.5」の開発者向けリソースガイドです。モデルの概要、導入方法、コード例、関連リンクなど、ERNIE 4.5の活用に必要な情報を体系的にまとめています。AIモデルの利用やカスタマイズを検討するエンジニアにとって役立つ内容が揃っています。

高速バレーボール追跡推論システム
2025/7/9
本リポジトリは、Intel Core i5-10400FのCPU上で200FPSのリアルタイムバレーボール検出および追跡を実現する高速な推論システムを提供します。最適化されたONNXモデルを用い、ボールの座標をCSV形式で出力可能。ビデオの可視化もオプションで対応し、スポーツ分析やコンピュータビジョン研究に適した環境を整えています。

FastA2A:AIエージェントをA2Aサーバーに変換するPythonライブラリ
2025/7/10
FastA2Aは、AIエージェントをA2A(Agent to Agent)サーバーに変換するためのPythonライブラリです。シンプルかつ高速にAIエージェント同士の連携を実現し、APIサーバーとして動作させることが可能です。軽量な設計で容易に拡張ができ、CI/CDパイプラインやテストカバレッジも整備されています。AI/ML開発におけるエージェント連携の効率化を目指す開発者に最適です。

Faster-Whisper Transcription APIの高性能音声転写サービス
2025/9/2
Faster-Whisper Transcription APIは、高速かつ高精度な音声転写を実現するAPIサービスです。Whisperの多モデル対応に加え、Audio Slicerによる長時間音声の自動分割と並列処理を特徴とし、CPU・GPU双方に最適化された計算精度で動作します。FastAPIを用いた堅牢なAPI設計により、バッチ処理にも対応した実用的な音声認識基盤を提供します。

FenixAI_tradingBot:AI搭載のトレーディングボット
2025/6/23
FenixAI_tradingBotは、Pythonで開発されたAI駆動のトレーディングボットです。Crew AIとOllamaの技術を活用し、マーケットデータの分析から取引判断までを自動化。シンプルな設計ながら、機械学習モデルを用いた高度な予測機能を備え、暗号資産などのトレードに適しています。初心者から中級者のトレーダーに向けて、AI技術を用いた自動取引の可能性を示す注目のリポジトリです。

Flux Kontext Diff Mergeによる高品質画像編集のための差分マージノード
2025/7/5
Flux Kontext Diff Mergeは、AIによる画像編集で発生しがちな不要な画質劣化を防ぐために、編集された領域のみを選択的に原画像にマージするComfyUI用のカスタムノードです。LAB色空間を用いた適応的差分検出やノイズ除去機能を備え、Flux Kontext Devとの組み合わせで高画質な画像編集ワークフローを実現します。

Qwen-Image向けLoRAトレーナー「flymyai-lora-trainer」解説
2025/8/6
「flymyai-lora-trainer」は、Qwen/Qwen-Imageモデル向けにLoRA(Low-Rank Adaptation)レイヤーのトレーニングを行うためのオープンソース実装です。FlyMy.AIが開発し、Pythonで構築された本ツールは、効率的なファインチューニングを実現し、画像生成モデルのカスタマイズを容易にします。シンプルな構成ながら実用的な機能を備え、GenAIメディアエージェント構築のインフラとしても活用可能です。

Flow-Modulated Scoringによる意味認識ナレッジグラフ補完
2025/8/30
本リポジトリは、意味情報を考慮したナレッジグラフ補完を実現する「Flow-Modulated Scoring(FMS)」手法のPyTorch実装を提供します。FMSは、知識グラフの欠損関係推定において、エンティティ間の意味的流れをモジュレーションすることで高精度な推論を可能にします。論文に基づき、効率的な学習と推論をサポートし、研究や実務でのナレッジグラフ強化に貢献します。

FocusDPO:動的焦点制御による複数主体の個別化画像生成最適化
2025/8/19
FocusDPOは、複数の個人の異なる嗜好を同時に考慮しつつ、高品質なパーソナライズド画像生成を実現するための手法です。動的な嗜好最適化と適応的な焦点調整を組み合わせることで、各主体の好みを効果的に反映し、多様な生成結果を効率的に得られます。ByteDanceのFanqie AIチームによる本リポジトリでは、関連アルゴリズムと実装資源を提供し、マルチユーザーの画像生成領域に新たなアプローチを提示しています。

FoundationModelsTools: AppleのFoundation Modelsフレームワークを拡張するツール集
2025/7/9
FoundationModelsToolsは、AppleのFoundation Modelsフレームワークを活用し、カレンダー管理、連絡先操作、HealthKitデータ取得、位置情報アクセス、音楽再生制御などの機能を提供するSwift製のツール集です。これにより、アプリ開発者はAIモデルとiOSのシステムフレームワークや外部サービスを簡単に連携させ、より高度なユーザー体験を実現できます。

freesof-on: AutoCAD設計支援ツール
2025/8/26
freesof-onは、AutoCADの2Dおよび3D設計体験を強化するためのリポジトリです。AutodeskのAI技術を活用し、設計プロセスにおけるインサイトの抽出や自動化を支援します。設計者がより効率的かつ創造的に作業できる環境を提供し、手動作業の軽減や精度向上を目指したツール群を含みます。

Frontrunning-Mev-Bot:革新的なAI自動取引ボット
2025/8/11
Frontrunning-Mev-Botは、EthereumとBinance Smart Chain上で動作する最先端のAI自動取引ボットです。クロスDEXアービトラージ、スイングトレード、グリッドトレードなどの高度な取引戦略を駆使し、取引コストの削減とMEV(Miner Extractable Value)攻撃からの防御も実現。ユーザーフレンドリーなインターフェースにより、初心者からプロまで幅広く利用可能な、次世代のハンズフリートレーディングプラットフォームです。

多模态基金株式洞察分析プラットフォーム
2025/8/22
本リポジトリは、多様なデータ形式(テキスト、画像など)を統合解析し、ファンドや株式に関する深い洞察を提供するAIベースの分析プラットフォームです。多モーダルデータの全域融合とインテリジェントな協調分析により、投資判断に役立つ専門的なレポートを自動生成。Apache 2.0ライセンスのもと、Python 3.10以上で動作し、金融分野の複雑な情報を効果的に処理するための革新的な技術が多数盛り込まれています。

GAピクセルアートジェネレーター
2025/7/6
「ga-pixel-art」は、遺伝的アルゴリズムを用いてターゲット画像のピクセルアートを進化的に生成するRust製のプロジェクトです。ランダムなノイズ画像から始まり、世代を重ねるごとにターゲット画像に近づく過程をアニメーションGIFとして出力します。進化計算の視覚的な理解や画像生成の実験に適したツールです。

Gemini-CLI-2-API:Google Gemini CLIをOpenAI API互換のローカルAPIに変換するプロキシ
2025/7/20
Gemini-CLI-2-APIは、GoogleのGemini CLIをラップしてローカルAPIとして提供する強力なプロキシです。OpenAI互換のAPIインターフェースを備え、Node.js上で動作。毎日1000回まで無料でリクエスト可能なため、既存のOpenAIクライアントから透過的に利用できます。AI開発の効率化を目的に、ローカル環境でGoogle Geminiの機能を活用しやすくするツールです。オープンソースでGPLv3ライセンス。

Gemini GPT Hybrid:Claude AIエージェントのハイブリッド活用ツール
2025/8/10
Gemini GPT Hybridは、AnthropicのClaude AIをベースにした複数のAIエージェントを統合管理し、ユーザーのワークフローを効率化するハイブリッド型ツールです。Shellスクリプトを中心に構成されており、エージェントの選択や対話の自動化、柔軟な拡張性を特徴としています。オープンソースであり、MITライセンスのもとで開発が進められているため、個人から企業まで幅広いユーザーのAI活用を支援します。

Gemini MCPツール:Google Gemini CLIと連携するAIアシスタント用MCPサーバー
2025/6/29
Gemini MCPツールは、Googleの強力なGemini CLIと連携するためのMCPサーバーを提供します。Geminiの大容量トークンウィンドウを活用し、大規模ファイルの解析やコードベースの理解を効率化。JavaScriptで実装されており、AIアシスタントがより高度な解析を実行できる環境を整えています。本リポジトリは開発者がGoogle Geminiの能力を最大限に引き出し、複雑なプロジェクトの管理を支援します。

generalist - Claudeを活用した汎用AIエージェント
2025/6/4
SamuelSchlesinger氏による「generalist」は、Claudeをバックエンドに採用した汎用AIエージェントです。Rustで実装されており、高速かつ効率的な処理が特徴です。多目的なタスクへ柔軟に対応可能な設計で、AIエージェントの新たな可能性を示しています。

Gensokyo-MCP:OnebotV11対応のMCPサーバー実装
2025/5/28
Gensokyo-MCPは、OnebotV11仕様に対応したBotをGo言語で実装したMCPサーバーです。Onebotは中国発のチャットボット標準プロトコルであり、本リポジトリはその最新版であるV11に準拠したBotサーバーを提供します。Go言語の高いパフォーマンスとシンプルな設計により、軽量かつ拡張性の高いチャットボット環境を構築可能です。Bot開発者やMCPプロトコルを用いたサービス実装に役立つ実用的なリポジトリとなっています。

GitHub MCPサーバー:LLMを活用したGitHubプルリクエスト自動レビュー支援ツール
2025/8/21
GitHub MCPサーバーは、自身で提供する大規模言語モデル(LLM)を用いてGitHubのプルリクエスト(PR)を自動で解析・レビューするためのプロトコルサーバーです。GitHub APIを活用し、PR情報の取得からファイル内容の読み込み、レビューコメントの投稿まで一括で行えるため、AIアシスタントがリポジトリのコード変更を効率的に評価できます。Cursor IDEやClaude DesktopなどのMCPクライアントと連携し、開発現場のコードレビューの自動化・高度化を実現します。

GLM_OPEN_DEEP_RESEARCH:オープンで拡張可能な深層研究エージェント
2025/8/7
GLM_OPEN_DEEP_RESEARCHは、ZhipuのGLM-4.5をサポートし、LangGraphを活用した構成可能な深層研究エージェントです。複数のモデルプロバイダーや検索ツール、MCPサーバーに対応し、完全オープンソースで提供されています。深層研究領域で求められる高度な情報収集と解析機能を備え、研究者や開発者が効率的に知見を得るための基盤を提供します。

GoldRecovery:鉱業における金回収率予測システム
2025/7/11
本リポジトリ「GoldRecovery」は、工業的な金鉱採掘プロセスにおける金回収率を予測するための機械学習モデルを構築したプロジェクトです。鉱石の物理的・化学的特性とセンサーから得られる各種データを用いて、複数の回帰モデルをトレーニングし、各工程の回収効率を高精度に推定します。これにより、鉱山現場の生産性向上とコスト削減を目指した実用的な分析ツールとして活用可能です。

Doctor Agent - 医療情報検索と症状分析を支援するAIアシスタント
2025/7/27
Doctor Agentは、Google Programmable Search APIを活用し、最新の医療情報検索、薬剤情報の提供、症状解析、緊急時のアドバイスなどを行う医療支援エージェントです。Pythonで実装され、医療現場や一般ユーザーが効率的かつ安全に医療情報へアクセスできるよう設計されています。

GPT Image MCPサーバー:多様なAIチャットボット向けの画像生成統合ソリューション
2025/7/8
GPT Image MCPは、OpenAIのgpt-image-1モデルを活用し、あらゆるLLM(大規模言語モデル)搭載チャットボットに高品質なテキストから画像生成機能を提供するMCP(Model Context Protocol)サーバーです。従来のテキスト限定のチャット体験を拡張し、Claude DesktopやChatGPTカスタムインターフェースなど多彩なクライアントでシームレスに画像生成を可能にします。Pythonベースで軽量かつ柔軟な設計が特徴です。

GPT-OSSスペースゲーム:AIと音声UIによる宇宙冒険体験
2025/8/6
GPT-OSSスペースゲームは、音声UIキットとGPT-OSSを活用した実験的なスペースアドベンチャーゲームです。プレイヤーは宇宙船の唯一の乗組員となり、船のAIと協力して原因不明の故障を診断し、宇宙ステーションや惑星への安全到達を目指します。ゲームはローカル環境で動作し、Whisperによる音声認識、Kokoro TTSによる音声合成、Pipecatによる通信処理などの最先端技術が統合されています。多様なコンポーネントをクラウドサービスに切り替え可能で、拡張性も高い点が特徴です。

GPT5-promptsの日本語ガイド:多機能GPTプロンプト集
2025/8/9
「GPT5-prompts」は、ChatGPTで利用可能な多彩なプロンプト集を提供するGitHubリポジトリです。ユーザーは複数のモードを活用して、プロジェクトの規模や目的に応じた最適な対話を実現可能。特に「Expensive gpt+」モードでは、高度な論理処理や豊富な機能が備わっており、複雑なタスクや大規模プロジェクトに対応します。手軽に利用できるテキストファイル形式でプロンプトが提供されているため、すぐにChatGPTで活用可能です。AI活用の幅を広げたい方に最適なリポジトリです。

Gradio初心者コース2025:ゼロから学ぶインターフェース構築入門
2025/8/22
「Gradio-Beginners-Course-2025」は、Gradioを使った機械学習モデルのためのWebインターフェース構築をゼロから学べる完全初心者向けコースの公式リポジトリです。10.5時間にも及ぶ動画シリーズに対応し、多彩なインタラクティブUIコンポーネントの実装例やチュートリアルノートブックが豊富に含まれており、初心者が手を動かしながら学習を進められる構成となっています。Jupyter Notebook形式で提供され、Pythonによる実践的な開発スキルが身につきます。

GraphNet:コンパイラ開発のための大規模計算グラフデータセット
2025/7/18
GraphNetは、コンパイラの最適化Pass評価やAIによる自動最適化モデルの学習を目的とした、大規模な実モデル由来の計算グラフデータセットを提供するオープンプラットフォームです。研究者はGraphNetを活用して多様なコンパイラ戦略の効果検証やAIを用いたコンパイラ自動最適化の研究を効率的に進められます。本記事では、GraphNetの特徴や技術的ポイント、プロジェクト構成について詳しく解説します。

GRESO:革新的なAI研究プロジェクト
2025/5/30
GRESOは、Infini AI Labによって公開された先進的なAI関連の研究プロジェクトです。リポジトリ自体には詳細な説明がありませんが、開発元の背景から高度な機械学習や人工知能分野の技術を活用した内容であると推察されます。本記事では、公開情報と開発元の特性を踏まえ、GRESOの技術的可能性や特徴について解説します。

HEAD_rl_deploy:ヒューマノイドロボット向け自律ナビゲーションと操作の展開実装
2025/8/9
Stanford-TMLが提供する「HEAD_rl_deploy」は、論文「Hand Eye Autonomous Delivery」に基づくヒューマノイドロボットのナビゲーション、歩行、物体把持を学習・展開するための公式実装リポジトリです。本プロジェクトは、シミュレーション環境「Isaac Gym」およびUnitree SDKを活用し、Sim2SimおよびSim2Realのデプロイメントを実現。ロボットのリアルな動作を学習させるための強化学習技術と制御モジュールを統合し、研究開発の加速を支援します。

心臓病予測モデル:決定木分類器による解析
2025/8/14
本リポジトリは、Cleveland Heart Diseaseデータセットを用いて機械学習による心臓病の有無を予測するプロジェクトです。決定木分類器を採用し、データの前処理からモデル学習、重要なリスク要因の特定、そして決定木の可視化まで一連の流れをJupyter Notebook形式で実装しています。解釈性の高いモデルで臨床の意思決定支援を目指した内容となっています。

HiRISC-Dataset:衝突回避のための高リスクインタラクティブシナリオデータセット
2025/6/16
HiRISC-Datasetは、自動運転やロボット工学の分野で重要な衝突回避技術の研究を支援するために設計された高リスクインタラクティブシナリオのデータセットです。複雑で危険度の高い交通シナリオを豊富に含み、実世界の交通インタラクションを詳細にキャプチャしています。研究者や開発者が衝突回避アルゴリズムの検証、強化学習のトレーニング、モデルの評価に利用できる貴重なデータ資源として注目されています。

H-Net:動的チャンク分割による階層的系列モデルの革新
2025/7/11
H-Netは、動的チャンク分割を活用したエンドツーエンドの階層的系列モデリングアーキテクチャを提供するPythonリポジトリです。自然言語処理や時系列解析など、多様な系列データに対して効率的かつ高性能な表現学習を実現し、研究論文に基づいた最新技術を実装しています。

HomeSystem:モジュール化スマートホーム自動化システム
2025/8/16
HomeSystemは、Dockerベースのモジュール化されたスマートホーム自動化システムです。ローカルとクラウドの複数の大規模言語モデル(LLM)を統合し、文書管理、論文の自動収集・分析、OCR処理、可視化、ワークフローの自動化を実現します。複数の独立モジュールによる分散展開が可能で、研究者や技術者の論文調査・管理効率を大幅に向上させる先進的なプラットフォームです。

horizon-overlay:作業上にAIを重ねる革新的オーバーレイツール
2025/6/21
「horizon-overlay」は、ユーザーの現在の作業環境にAI機能を重ねて表示するSwift製のオーバーレイツールです。画面上でAIがリアルタイムに情報提供や支援を行うことで、作業効率の向上やインタラクションの強化を実現します。軽量かつ柔軟な設計により、さまざまなアプリケーションや環境に容易に統合可能。130以上のスターを獲得しており、Swiftでの最新AIインターフェース開発の参考として注目されています。

HS-TasNet:リアルタイム低遅延音楽ソース分離のためのハイブリッドスペクトログラム-TasNet実装
2025/8/1
HS-TasNetはL-Acousticsの研究チームによって提案された「リアルタイム低遅延音楽ソース分離のためのハイブリッドスペクトログラム-TasNet」の実装リポジトリです。本リポジトリでは、音楽信号をリアルタイムかつ低遅延で分離するための最新技術であるHS-TasNetのモデル構造や実験結果を再現し、音響信号処理や音楽情報処理の分野での応用を目指しています。シンプルな構成ながらも実践的なコードを提供し、研究者や開発者が容易に活用可能です。

Hunyuan-A13B:Tencentの革新的なMoEベース大規模言語モデル
2025/6/27
Tencentが開発したHunyuan-A13Bは、細粒度のMixture of Experts(MoE)アーキテクチャを採用した革新的なオープンソース大規模言語モデル(LLM)です。Pythonで実装されており、高効率かつ高性能な自然言語処理を実現。研究開発や応用展開に柔軟に対応可能な設計が特徴であり、AI/ML分野での注目が集まっています。

Hunyuan3D 2.1 Windows対応版の概要と技術解説
2025/7/19
Hunyuan3D 2.1のWindows対応版リポジトリは、Windows環境での互換性問題を解決し、3Dレンダリングや差分レンダリングに関するエラーを修正したPython製のプロジェクトです。DeepSpeedやカスタムラスターライザーのインストール問題、環境依存のバグに対応し、Windowsユーザーに向けて快適な利用環境を提供します。リポジトリは軽量ながら実用的な機能を備え、3D関連の研究・開発を支援します。

human-in-the-loop:Discord経由でAIと人間が連携するMCPサーバー
2025/6/21
「human-in-the-loop」は、Rustで実装されたMCP(Model Context Protocol)サーバーで、AIアシスタントがDiscordを介して人間に質問を投げかけられる仕組みを提供します。AIモデルが自動で判断できない部分を人間がリアルタイムに補助することで、精度向上や安全な対話を実現。AIと人間の協調作業を促進する点が特徴です。

Minecraftを画面認識でプレイするDeep Q-NetworkによるAI「ia-minecraft-D.I.V.A」
2025/8/17
本リポジトリ「ia-minecraft-D.I.V.A」は、画面の映像情報を元にMinecraftを自動でプレイするAIをDeep Q-Network(DQN)を用いて実装したプロジェクトです。Pythonで書かれており、強化学習の手法を活用してゲーム内の状況を画面認識しながら最適な行動を学習します。AIが視覚情報を解析し動作を決定するため、ゲーム環境の状態を直接取得しないケースにも対応可能です。深層強化学習の応用例として注目されるリポジトリです。

AI画像検出回避ユーティリティ
2025/8/22
AIによる画像検出を回避するための多彩な手法を実装したPython製ユーティリティです。ノイズ注入、FFT平滑化、ピクセル摂動、カメラシミュレーションなどの技術を用いて、画像の検出を困難にします。PyQt5による使いやすいGUIを備え、リアルタイムプレビューや分析パネルにより、画像加工の効果を視覚的に確認可能。パラメータ調整も自動モードと手動モードを提供し、多様なニーズに応えます。

ImageEmboss:Visionフレームワークを活用した画像認識と被写体抽出ツール
2025/8/14
ImageEmbossは、AppleのVisionフレームワークを利用して画像内の被写体を識別し、その領域を抽出・強調表示するSwift製のプロジェクトです。Apple Photosのような画像認識とハイライト効果を実装しており、被写体抽出に特化したシンプルかつ実用的なサンプルコードとして活用できます。画像処理や機械学習に興味のある開発者にとって有用なリポジトリです。

img-cool - AIによるスマート画像生成ツール
2025/9/1
「img-cool」はTypeScriptで開発されたAIを活用した画像生成ツールです。ユーザーがテキスト入力やパラメータ指定を行うことで、高品質なイラストや画像を自動生成します。直感的なUIと多彩なカスタマイズ機能を備え、クリエイターやデザイナーの作業効率を大幅に向上させることが可能です。特にWebアプリケーションとして提供されており、ブラウザ上で気軽に利用できる点が特徴です。

ImLPR:Vision Foundation Modelを活用した画像ベースLiDARプレイス認識
2025/8/3
ImLPRは、Vision Foundation Modelを基盤に構築された画像ベースのLiDARプレイス認識システムです。LiDAR点群データの代わりに画像情報を活用して場所認識を行う新しい手法で、自己位置推定やマッピングの精度向上を目指します。現在コードはリリース準備中であり、関連論文も公開されています。

LangChainを活用したインテリジェントアシスタント
2025/7/27
本リポジトリは、Pythonで開発されたターミナルベースのインテリジェントアシスタントです。LangChainフレームワークと大規模言語モデル(LLM)を組み合わせ、自然言語での対話や情報検索、文書要約、ツール連携を実現。コンテキストを保持しながらユーザーの質問に応答することで、コマンドライン上でスマートなAI体験を提供します。開発のシンプルさと拡張性も特徴です。

インタラクティブRAG:ベクトルストア編集に特化した次世代情報検索プラットフォーム
2025/8/26
「Interactive-Rag」は、PDFのアップロードからベクトルストアへの格納、セマンティック検索、そして何よりもベクトルストア内の知識チャンクをリアルタイムで簡単に編集できることを最大の特徴とした最新のRetrieval-Augmented Generation(RAG)プラットフォームです。直感的なWeb UIで検索・編集・更新をシームレスに行え、知識ベースの高速なアップデートを実現します。

InternManip:ロボット操作学習の統合スイート
2025/7/24
InternManipは、様々なデータセットとベンチマークに対応したロボット操作ポリシーモデルの学習および評価を一括で行えるオールインワンのフレームワークです。Pythonで実装されており、強化学習や模倣学習を活用したポリシー訓練を効率的にサポート。デモ動画やドキュメントが充実しており、研究開発や実験に適した環境を提供します。

IoTネットワーク侵入検知における勾配ブースティング活用プロジェクト
2025/9/7
本リポジトリは、CICIoT2023データセットを用いてIoTネットワークに対する侵入検知を行う機械学習プロジェクトです。複数の勾配ブースティングアルゴリズムを実装し、2値分類、8クラス多クラス分類、全クラス多クラス分類のタスクに対応。IoTセキュリティ分野における高度な検知モデル構築を目指し、性能評価や可視化も充実しています。

IT支援型チケッティングシステム
2025/8/22
本リポジトリは、過去のチケット割り当てデータを活用し、機械学習と自然言語処理(NLP)を用いてサポートチケットの自動割り当てを実現するプロトタイプです。Pythonで実装されており、チケットの説明文を入力することで、最適な担当者やチームを提案。大規模組織での手動割り当ての非効率さやミスを減らし、サポート業務の効率化を図ります。

IVS - インテリジェントビークルスクール4期プロジェクト
2025/7/8
「IVS」は、Intelligent Vehicle School(インテリジェントビークルスクール)第4期におけるプロジェクトで、Pythonを用いてインテリジェント車両に関する研究開発を行うリポジトリです。車両の自動制御や認識技術に関するサンプルコードやアーカイブが含まれており、実践的なAI/ML技術の学習に役立ちます。

Jailbreaks-GPT-Gemini-deepseek-:AIモデルのプロンプト解除ツール集
2025/6/3
「Jailbreaks-GPT-Gemini-deepseek-」は、GPT、Sora、Claude、Geminiなどの大規模言語モデル(LLM)に対して、制限を解除し“rage mode”を起動するためのプロンプト集を提供するリポジトリです。AIの安全機能や制約を回避することを目的にしたツール群で、研究や検証用途に活用されています。さまざまなモデルに対応しており、AIの応答制御の理解や逆解析に役立ちます。

Jarvis - 音声とジェスチャーで操作するパーソナルアシスタント
2025/9/4
JarvisはPythonで開発されたパーソナル音声&ジェスチャーアシスタントです。音声コマンドと手のジェスチャーを組み合わせてPCの操作を直感的かつハンズフリーで行えます。アプリケーションの起動やタブの切り替え、メディアコントロール、ボリュームや画面の明るさ調整など、多様な操作をサポートし、効率的なワークフローを実現します。

jina-embeddings-v4-gguf:多言語・多モーダル検索向け埋め込みモデルの量子化コレクション
2025/7/18
jina-embeddings-v4-ggufは、多言語かつ多モーダル検索に対応した最先端の埋め込みモデル「jina-embeddings-v4」のGGUFフォーマットおよび量子化モデルのコレクションです。高精度ながら計算資源を抑えた高速推論を可能にし、様々な検索・情報検索システムへの適用を支援します。

ジョブレコメンデーションシステム:AIキーワード抽出とRedisキャッシュを活用したJavaベースの求人推薦システム
2025/8/31
本リポジトリは、Javaを用いて開発された高度な求人推薦システムです。MySQLによるデータ管理、Redisのキャッシュ機能を組み合わせ、地理情報に基づく求人検索と個別最適化された求人推奨を実現しています。AIによるキーワード抽出技術を活用し、ユーザーのニーズに合わせた精度の高いマッチングを提供。モダンなウェブ技術との統合により、スムーズな利用体験を実現しています。

Jules Agent向け厳選プロンプト集
2025/5/22
本リポジトリは、Google Labs Codeが提供する「Jules Agent」に最適化された優れたプロンプトを多数収録したコレクションです。AIエージェントの応答精度や多様な応用例を引き出すための実用的なテンプレートやアイデアをまとめており、開発者や研究者が効率よく活用できるよう設計されています。AI対話システムの高度化に貢献する一助として注目されています。

KBook - AIで書籍構成と内容を自動生成するアプリケーション
2025/6/15
KBookは、Gemini APIを活用したAI搭載アプリケーションで、ユーザーが書籍の構成、タイトル、章の内容を効率的に生成できるツールです。TypeScriptで開発されており、クリエイターがアイデア出しから執筆までのプロセスをサポート。AI技術を活用した書籍制作の新しい可能性を示しています。

機械学習講義資料集 - Kelas Pembelajaran Mesin
2025/6/26
「kelas-pembelajaran-mesin」は、インドネシアのUNISBA Blitar情報技術学科向けに提供されている機械学習講義資料のリポジトリです。Pythonを用いた実践的な機械学習の学習教材がまとめられており、学生や初学者が基礎から応用まで段階的に学べる内容となっています。機械学習の理論と実装を体系的に学習可能な貴重なリソースです。

KHGNN: カーネルハイパーグラフニューラルネットワークの実装
2025/9/2
本リポジトリは、IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)で発表された論文「Kernel Hypergraph Neural Networks」の公式実装を提供しています。PythonとPyTorchを用いて開発されており、ハイパーグラフ構造を効率的に学習する新しいニューラルネットワークモデルを実現。複雑な高次関係を捉えることが可能で、グラフ構造を扱う機械学習・深層学習分野での応用が期待されます。

Kick - AI搭載のWindows操作アシスタント
2025/7/29
Kickは、Windowsデバイスを音声やキーボードで直感的に操作できるAI搭載のオープンソースアシスタントです。日常業務の自動化を実現し、タスク実行やアプリ管理をスムーズに行えます。ユーザーは音声やテキストコマンドでシステム操作を行い、効率的なワークフローを構築可能です。シンプルかつ強力な機能で、Windows環境の操作性を大幅に向上させます。

kimi-ccによるClaude Codeの最新モデル駆動ツール
2025/7/11
「kimi-cc」は、Kimiの最新言語モデル「kimi-k2-0711-preview」を活用して、Anthropic社の高性能AIモデル「Claude Code」を手軽に利用できるようにするシェルスクリプトツールです。APIキーを取得し、簡単なインストール手順を踏むことで、低コストかつ高速にClaude Codeとの対話を開始できます。シンプルな構成ながら、最先端のLLMを活用した開発に役立つ実用的なプロジェクトです。

Kimi-Dev:ソフトウェアエンジニアリング向けオープンソースコーディングLLM
2025/6/16
Kimi-Devは、ソフトウェア開発タスクに特化したオープンソースの大規模言語モデル(LLM)です。Pythonで実装され、コード生成や補完、バグ検出、リファクタリング支援など、開発者の生産性向上を目的としています。MoonshotAIが公開しており、コミュニティ主導での継続的改善が期待されるプロジェクトです。軽量かつ柔軟な設計により、さまざまな開発環境に統合可能です。

KittenTTS:超軽量で高品質な音声合成モデル
2025/8/5
KittenTTSは、わずか1500万パラメータで構成される超軽量テキスト音声合成(TTS)モデルです。25MB未満のモデルサイズでありながら、高品質な音声をリアルタイムで生成可能。GPUなしのCPU環境でも動作するため、幅広いデバイスでの利用が可能です。軽量性と性能のバランスを追求した設計が特徴で、複数のプレミアムボイスを備えています。

2024年気象ビッグデータコンテスト優勝モデル「KMA-BigData-ElecPred-2024」
2025/9/7
本リポジトリは、2024年に韓国気象庁主催・韓国電力公社後援の気象ビッグデータコンテストで最優秀賞(1位)を獲得した「パブハム」チームの電力気象指数予測モデルのコードを公開しています。気象データを活用し、集合住宅の電力需要を示す指標の精度を大幅に向上させたXGBoostベースのアンサンブルモデルを実装。高精度な予測に向けた特徴量設計やFold単位のモデル融合など、実践的な機械学習技術を駆使しています。

Kontext HiRes:高解像度画像生成を支援するLoRAモデルとComfyUIワークフロー
2025/9/4
Kontext HiResは、「black-forest-labs/FLUX.1-Kontext-dev」をLoRAでファインチューニングしたモデルで、高精細かつ高解像度な画像生成を実現します。ComfyUI用のワークフローも提供されており、ユーザーは簡単にモデルを導入し、画像のディテール強化を行えます。本リポジトリは、画像生成の品質向上を目指すクリエイターや研究者にとって有用なツールを提供しています。

KontextLoraのLora変換ツール
2025/7/23
KontextLoraのLoraモデルを双截棍(Nunchaku)形式と互換性のない問題を解決するための変換ツールです。本リポジトリは、diffusersとpeftの特定バージョンを前提に、モデル変換後もエラーが発生しないよう設計されています。Pythonで実装され、シンプルなスクリプト群で構成されているため、Loraモデルの互換性問題に悩むAI/ML開発者に有用です。

KResearch:Gemini APIを活用した深層リサーチ支援アプリケーション
2025/6/14
KResearchは、Gemini APIを用いてユーザーと対話的にリサーチテーマを明確化し、Google検索を活用した戦略的な調査を繰り返し実行。収集した情報を引用付きで体系的にまとめたレポートをストリーミング形式で提供するTypeScript製アプリケーションです。深い調査プロセスの自動化とユーザー体験の向上を目指しています。

KPrompt:高性能AIプロンプト設計ワークベンチ
2025/8/17
KPromptはAIプロンプトエンジニアや開発者向けに設計された高度なウェブベースツールで、AIとの対話を最適化するためのシステムプロンプト設計と会話プロンプトの洗練を支援します。特に「System Prompt Architect」と「Conversational Prompt Refiner」という2つのモジュールを備え、AIの人格構築や対話品質向上を効率的に行える点が特徴です。

KosmischeCovers:1970年代宇宙ロック風サイケデリックアルバムカバー生成AI
2025/8/1
KosmischeCoversは、1970年代のドイツ宇宙ロック(kosmische)から着想を得たサイケデリックなアルバムカバーアートを生成するためのオープンソース機械学習プロジェクトです。データセットの準備からデータ拡張、最新の拡散モデルを用いた学習と推論までの一連のパイプラインを提供し、研究者やアーティスト、趣味でAIによる生成アートに興味があるユーザーに最適化されています。

KWiki - AI駆動のコードリポジトリWikiジェネレーター
2025/8/11
KWikiはGo言語で実装されたAI搭載のコードリポジトリドキュメント生成ツールです。GitHub、GitLab、Bitbucketなどのリポジトリを美しくインタラクティブなWiki形式のドキュメントに変換し、開発者のドキュメント作成を効率化します。最新のAI技術を活用し、自動でコードの説明や構造を解析して分かりやすいドキュメントを生成可能です。

KVSplit:Apple Silicon向け長文コンテキスト対応LLMのための効率的KVキャッシュ量子化
2025/5/22
KVSplitは、Apple Silicon(M1/M2/M3)上で大規模言語モデル(LLM)をより長いコンテキストで実行可能にするための革新的なKVキャッシュ量子化技術を提供します。キーを8ビット、バリューを4ビットで量子化することで、メモリ使用量を約59%削減しつつ、品質低下を1%未満に抑えています。セットアップはワンコマンドで簡単に行え、性能ベンチマークや可視化機能も備え、MetalによるGPU最適化も実装。Apple Siliconユーザーに最適なLLMメモリ効率化ソリューションです。

l0:汎用エージェントのためのスケーラブルなエンドツーエンド学習パイプライン
2025/6/28
l0は、汎用的な知能エージェントの開発を目指した、スケーラブルかつエンドツーエンドのトレーニングパイプラインを提供するPython製のフレームワークです。多様なタスクに対応可能なエージェントの効率的な学習を支援し、研究や実用化のための基盤を構築します。シンプルな設計ながら、高度な拡張性と柔軟性を兼ね備えており、AIエージェント開発の加速に寄与します。

Label-Free-RLVR:ラベル不要な強化学習による視覚的ロボット操作
2025/5/30
Label-Free-RLVRは、ラベル付けされたデータなしで視覚情報を利用し、強化学習を用いてロボットの操作タスクを学習させるための手法と実装を提供するリポジトリです。煩雑なデータラベリング工程を省略し、効率的にロボットビジョンと制御の融合を実現。実環境における視覚的強化学習の適用を促進します。

Cocos Creator向けAI活用ターミナル「kylin-ai-terminal」
2025/6/27
「kylin-ai-terminal」は、Cocos Creator環境でAI技術を容易に活用するためのターミナルツールです。Vue.jsを用いて開発されており、ゲーム開発者やクリエイターがAI機能を手軽に統合・利用できるよう設計されています。シンプルなUIと拡張性を兼ね備え、Cocos CreatorとAIの橋渡し役として注目されるプロジェクトです。

LangScene-X:一般化可能な3D言語埋め込みシーンの再構築技術
2025/7/3
LangScene-Xは、TriMapビデオ拡散モデルを用いて、3D空間内に言語情報を埋め込んだシーンを高精度かつ一般化可能に再構築する最先端の技術を提供するリポジトリです。ICCV 2025で発表された本研究は、動画データの拡散モデルを活用し、多様な環境下での3Dシーン理解と生成を可能にしています。Pythonベースで構成され、効率的な自動セグメンテーションや補間モジュールを備え、今後の3D言語融合技術の発展に寄与することが期待されます。

LiMA - クロスビュー・長時間軸蒸留による高精度LiDAR表現学習
2025/6/26
LiMAは、ICCV 2025で発表された最先端のLiDAR表現学習フレームワークです。従来のワンショット・ワンパースペクティブの制約を超え、複数視点(クロスビュー)と長時間軸にわたる蒸留技術を組み合わせることで、より堅牢で高精度なLiDAR特徴表現を実現します。自動運転や3D環境認識におけるLiDARデータ処理の性能向上に貢献する革新的な手法です。

LIMIT-Sparse-Embedding:LIMITデータセットでのスパース埋め込み評価ツール
2025/9/1
Googleの論文「On the Theoretical Limitations of Embedding-Based Retrieval」で提唱されたLIMITデータセット(limit-smallおよびlimit)を用い、OpenSearchの最新スパース埋め込みモデルを評価するPythonリポジトリです。スパース埋め込みが密埋め込みの理論的な限界を克服する可能性を示す中、実験環境と評価スクリプトを提供し、研究や実装の加速に貢献します。

Cartesia Line SDK:低遅延音声エージェント開発キット
2025/8/19
Cartesia Line SDKは、低遅延で動作するインテリジェントな音声エージェントを迅速に構築・展開できるPythonベースの開発キットです。既存のチャットボットを音声対応に変換したり、サポートやスケジューリングなどの汎用ユースケース向けテンプレートも提供。オートスケーリングやテレフォニー連携、メトリクス収集などプロダクション運用に必要な機能も備えています。5分以内に音声エージェントを作成し対話可能な点が特徴です。

埋め込みベース検索の理論的限界に関する研究
2025/8/29
本リポジトリ「limit」は、DeepMindによる論文「On the Theoretical Limitations of Embedding-based Retrieval」の公式実装を提供します。埋め込み次元の制約に基づき検索モデルの性能限界を理論的に明らかにし、それを検証するためのLIMITデータセットを含みます。これにより、埋め込み空間の表現力や検索精度の根本的な限界を理解し、今後の検索技術の改善に貢献します。

機械学習のための線形代数シリーズ
2025/8/26
本リポジトリは、機械学習の基礎理解に欠かせない線形代数を深くかつ直感的に学べる一連の教材を提供します。Jupyter Notebook形式で、学生や実務者、研究者が線形代数の理論から実践までを段階的に習得できるよう構成されており、数学的背景の強化に最適です。

LiteAI Writer - 軽量AI文章生成ツール
2025/6/7
LiteAI Writerは、PHPで開発された軽量のAI文章生成ツールです。シンプルな設計ながらも、手軽にAIを活用した文章作成を実現。PHP環境に馴染みのある開発者に最適で、導入やカスタマイズが容易なため、ブログやコンテンツ制作の自動化に役立ちます。今後の拡張性にも期待できる注目のリポジトリです。

LiTFiC: コンテキストで見つけた翻訳の迷い
2025/6/13
LiTFiCは、CVPR2025で発表された「Lost in Translation Found in Context」という研究に基づくリポジトリです。本プロジェクトは、翻訳タスクにおける誤訳や意味の取り違えを、文脈情報を活用することで改善することを目的としています。Pythonで実装されており、翻訳精度向上を目指した先進的なアルゴリズムが含まれています。

LIV_handhold_2: 低コストLiDAR・慣性・ビジュアル融合型3Dセンサー
2025/8/21
LIV_handhold_2は、ロボティクスやEmbodied AI向けに設計された低コストのLiDAR・慣性計測装置(IMU)・カメラを融合した3Dセンサーシステムです。高精度な環境認識と自己位置推定を可能にし、多様なロボットアプリケーションに適用可能。C++で実装されており、ハードウェア設計やソフトウェア処理の両面からオープンに提供されています。

Live-Class:リアルタイム授業支援プラットフォーム
2025/7/6
Live-Classは、リアルタイムでのオンライン授業やライブクラスを効率的にサポートするためのプラットフォームです。Jupyter Notebookベースで構築され、教育現場における双方向コミュニケーションや即時フィードバックを実現。シンプルな構成ながら、エージェントによる自動サポート機能を備え、教育の質向上と運営効率化を目指しています。

LLaMA-Factory-0.9.2-S4000-musa:MUSA対応のLLaMAモデルファクトリー
2025/9/8
LLaMA-Factory-0.9.2-S4000-musaは、浙江德塔森特(DTCTAI)による、MUSA(Mulan Unified System Architecture)を活用したLLaMAモデルのファクトリー実装です。Python 3.10以上をベースに、PyTorchとMUSAの統合環境で軽量かつ高速な大規模言語モデルのトレーニング・推論を可能にします。Docker環境や各種構成ファイルを備え、ローカルからクラウドまで幅広い環境に対応。最新のAI/ML技術を活用した研究開発や実用化検証に適したリポジトリです。

LLaVA-VLA:シンプルかつ強力な視覚言語行動モデル
2025/6/16
LLaVA-VLAは、視覚と言語、そして行動を統合的に処理するために設計されたモデルで、シンプルながらも高いパフォーマンスを実現しています。OpenHelix-Teamによって積極的にメンテナンスされており、Pythonで実装されたこのリポジトリは、マルチモーダルAIの研究開発において注目されています。視覚と言語情報の融合による高度な推論や行動予測を可能にし、多様な応用が期待されるモデルです。

LLM-Agent-Resume:LLMを活用したスマートな履歴書スクリーニングシステム
2025/8/12
本リポジトリは大型言語モデル(LLM)を用いたスマートな履歴書スクリーニングシステム「LLM-Agent-Resume」を提供します。自然言語による求人要件の理解、PDF履歴書や職務記述書からの情報抽出、量化されたマッチングアルゴリズムによる多段階選考などを特徴とし、採用担当者の作業効率と選考精度を大幅に向上させることを目的としています。RESTful APIも実装されており、既存の採用システムへの統合も容易です。

LLMエージェント&エコシステムハンドブック
2025/9/8
本リポジトリは、60以上のエージェントスケルトン、チュートリアル、エコシステムガイド、評価ツールを一元的にまとめた、LLM(大規模言語モデル)エージェントの構築・展開・理解のための包括的ハンドブックです。Pythonで実装されており、初心者から研究者まで幅広いユーザー層に対応。最新の技術動向を踏まえた実践的なリソースが充実しているため、LLMエージェント開発の効率化と品質向上に貢献します。

vLLM推理サービス性能ベンチマークツール
2025/7/30
本リポジトリは、vLLM推理エンジンをベースにした大規模言語モデルの推論性能圧測フレームワークです。モデル名やテスト日時による結果管理、特定のテスト結果を選択しての集計分析機能を備え、バッチテストや単一テスト、結果集約を一元管理できる統一エントリースクリプトを提供。レイテンシやスループット、初トークン応答時間など多角的な性能指標を評価し、vLLMの推論サービスの性能検証と最適化を支援します。

LLM-pdf-extraction:PDF文書から構造化サマリーを抽出するAPI
2025/7/30
LLM-pdf-extractionは、環境・農業分野の報告書に特化したPDF文書をアップロードし、OpenAIのGPT-4oやAnthropicのClaudeモデルを活用して非構造化テキストから構造化されたJSON形式の要約を生成するAPIです。Node.jsとTypeScriptで開発され、PDF解析にはpdf-parseを用いることで、複雑なPDF内容を効率的に解析・変換します。これにより、下流のデータ処理や分析に適したフォーマットで情報を抽出可能です。

LLM + MCP + RAGのTypeScript実装による拡張型言語モデルエージェント
2025/7/18
本リポジトリは、TypeScriptで開発されたフレームワーク非依存の拡張型大規模言語モデル(LLM)エージェント実装です。MCP(Multi-Chain Processing)機能により複数の処理チェーンを構築・管理し、RAG(Retrieval-Augmented Generation)を極めてシンプルに実装。ウェブページの閲覧から要約生成、ローカル文書の検索・注入までをカバーし、LangChainやLlamaIndexなどの既存フレームワークに依存しない柔軟な設計が特徴です。

LLMReasoning-SpecSearch:大規模言語モデル推論の高速化技術
2025/6/1
「LLMReasoning-SpecSearch」は、ICML 2025で発表された論文「Accelerating Large Language Model Reasoning via Speculative Search」の実装コードを提供するリポジトリです。本リポジトリは、大規模言語モデル(LLM)の推論速度を向上させるための新しい探索手法「Speculative Search」を提案しており、Pythonで実装されています。推論過程における計算コスト削減と高速化を実現し、実用的な応用に貢献します。

llm-toolcall-proxy:AIモデルのツールコール変換プロキシ
2025/7/31
llm-toolcall-proxyは、Flaskをベースにしたプロキシサーバーで、異なるAIモデルのツールコール形式をOpenAIの標準形式に自動変換します。これにより、GLMのようなモデルもOpenAI互換のクライアントでシームレスに利用可能となり、ツール連携の互換性問題を解決します。ストリーミング対応や簡単なセットアップも特徴で、AIモデルの多様なツール呼び出し形式を統一的に扱いたい開発者に最適です。

LLMベースOS:Minimal Linux OSとモデルコンテキストプロトコルによる新たなローカル能力公開
2025/5/22
llmbasedosは、Minimal Linux OSとモデルコンテキストプロトコル(MCP)ゲートウェイを組み合わせることで、ローカル環境の機能を大規模言語モデル(LLM)に安全かつ効率的に公開する革新的なプロジェクトです。Pythonで実装され、ローカルのリソースや操作をLLMから直接活用可能にすることで、AIとOS間の新たなインターフェースを構築。研究や開発に適した柔軟かつ最小限の設計が特徴です。

LMrep:大規模言語モデルとロボットの対話を実現する小規模プロジェクト
2025/8/31
LMrepは、大規模言語モデル(LLM)とロボットの連携を目的としたシンプルなPythonプロジェクトです。Windows環境で動作し、CoppeliaSimを用いたロボットシミュレーションとLLMのAPIを組み合わせることで、自然言語によるロボット制御を試みています。環境構築からAPI連携までの手順が明確に示されており、LLMを応用したロボット制御の入門として有用です。

ロジスティック回帰モデルによる冠動脈疾患リスク予測
2025/8/20
本リポジトリは、Framingham Heart Studyのデータセットを用いてロジスティック回帰モデルを構築し、10年間の冠動脈疾患(CHD)リスクを予測するプロジェクトです。モデルの性能評価には混同行列、ROC曲線、AUCが使われており、医療分野における疾患予測モデルの基礎的な実装例として参考になります。

Localization-CLI:iOSローカライズ自動翻訳CLIツール
2025/8/10
Localization-CLIは、複数のAI翻訳プロバイダーを活用し、iOSのローカライズファイルを自動で翻訳するコマンドラインツールです。70以上の言語に対応し、ソース言語も柔軟に設定可能。使いやすいインタラクティブなCLIインターフェースと進捗表示により、開発者のローカライズ作業を大幅に効率化します。

LongVie:マルチモーダルガイドによる超長尺動画生成
2025/8/6
LongVieは、テキストや画像など複数のモーダル情報を活用し、制御可能な超長尺動画を生成する最先端のAIモデルです。従来の動画生成技術が抱える長時間連続性の課題を克服し、ユーザの指定に応じて多様な内容やスタイルを持つ動画の生成を可能にします。研究者らによる共同開発で、将来的な映像制作やエンターテインメント分野への応用が期待されています。

LoReTrack:効率的で高精度な低解像度トランスフォーマートラッキング
2025/7/13
「LoReTrack」は、低解像度画像における物体追跡を効率的かつ高精度に実現するためのトランスフォーマーベースの新手法を提案するリポジトリです。IROS 2025での口頭発表論文に基づき、低解像度映像の追跡性能向上に焦点を当てており、従来手法と比較して計算コストを抑えつつも追跡精度を大幅に改善しています。Pythonで実装されており、研究コミュニティや実務での応用が期待される注目のプロジェクトです。

Machine-Learning:機械学習プログラミング課題まとめ
2025/9/2
本リポジトリ「Machine-Learning」は、機械学習プログラミング授業の課題を体系的に整理したもので、学習者が実践的に機械学習の基礎から応用までを学べるよう構成されています。週ごとに分けられた課題ファイル群を通じて、理論と実装をバランスよく習得可能です。初心者から中級者までの学習者に役立つ教材として活用できます。

macos-local-voice-agents:macOS向けローカル音声エージェント
2025/7/27
「macos-local-voice-agents」は、macOS上で動作するローカル音声AIエージェントのサンプル実装を提供するリポジトリです。オープンソースのPipecatフレームワークを活用し、MシリーズMacで音声認識から応答までの低遅延(約800ms以下)を実現。Silero VADやスマートターン検出などのローカルモデルを組み合わせ、高精度かつリアルタイムな音声対話体験を実現しています。

Magic-TryOn:次世代バーチャル試着技術
2025/5/29
Magic-TryOnは、vivoCameraResearchによる革新的なバーチャル試着システムのリポジトリです。詳細な説明はありませんが、GitHub上で公開されており、AIを活用した衣服の試着体験をリアルタイムで実現する技術が期待されます。ファッションやEコマース分野におけるユーザー体験向上に寄与する可能性が高く、今後の発展が注目されるプロジェクトです。

manifold:AIモデルのデプロイと管理を簡単にするオープンソースツールキット
2025/6/30
manifoldは、Dockerのようにシンプルかつ信頼性高く、あらゆるAIモデルのデプロイ、管理、セキュリティを実現するオープンソースのツールキットです。Pythonで実装されており、AIモデルの運用を効率化し、開発者の負担を大幅に軽減します。モデルの導入から運用までの複雑な工程を簡素化し、クラウド環境やオンプレミスでの活用を容易にします。

MarketPulse:金融ニュースAI分析通知サービス
2025/6/14
MarketPulseは、最新の金融ニュースをAIで分析し、投資判断を支援する通知サービスです。Pythonで開発されており、ニュースの感情分析や重要指標の抽出を自動化。リアルタイムでマーケットの動向を把握したいトレーダーや投資家に最適なツールです。

MARSCalib:最先端球面ターゲットベースキャリブレーション手法
2025/6/16
MARSCalibは、IROS 2025で採択された最先端の球面ターゲットベースのカメラキャリブレーション手法を実装したC++リポジトリです。高精度なキャリブレーションを目的とし、複雑な環境下でも堅牢に動作する点が特徴です。最新の研究成果を活用することで、精密な3D計測やロボティクスにおけるセンサーキャリブレーションの信頼性を飛躍的に向上させます。

MBTIコーディングエージェント:性格タイプ別AIプログラミング支援ツール
2025/7/30
Myers-Briggs性格タイプ指標(MBTI)をベースに設計された16種類のAIコーディングエージェントを収録したリポジトリです。それぞれのエージェントは異なるコミュニケーションスタイルや問題解決手法、技術的専門性を持ち、性格に応じた個別のアプローチでソフトウェア開発課題に対応します。Claude Codeとの互換性も特徴です。

MCA-LLaVA:大規模視覚言語モデルの幻覚を抑制するマンハッタン因果注意機構
2025/8/8
MCA-LLaVAは、大規模視覚言語モデル(Vision-Language Models, VLMs)における幻覚(hallucination)問題を軽減するための新しい注意機構「マンハッタン因果注意(Manhattan Causal Attention)」を提案するリポジトリです。視覚情報とテキスト情報の融合における情報流れを最適化し、より正確かつ信頼性の高いマルチモーダル生成を実現します。ACM MM25にて発表された研究に基づき、Pythonで実装されたコードと関連ドキュメントが含まれています。

メモリ整合性に基づく分割統治学習による一般化カテゴリ発見
2025/8/24
「Memory Consistency Guided Divide-and-Conquer Learning for Generalized Category Discovery(MCDL)」は、未知のカテゴリを含むデータセットに対して効果的にカテゴリを発見し分類するための機械学習手法を実装したPythonリポジトリです。メモリ整合性の原理を活用し、分割統治戦略によりモデルの性能と汎化能力を向上させています。研究論文に基づき、一般化カテゴリ発見の課題に対して新しいアプローチを提供し、実験用コードやモデル実装を含みます。

MCPスターター:Puch AI向けモデルコンテキストプロトコル実装テンプレート
2025/8/8
MCPスターターは、Puch AIと連携するモデルコンテキストプロトコル(MCP)サーバーの構築を支援するPython製のスターターテンプレートです。ジョブ検索や画像処理のツールがあらかじめ実装されており、AIアシスタントが外部リソースを安全に活用できる環境を提供。MCPを通じてAIの機能拡張を容易にし、開発者の迅速なサービス構築を実現します。

MedGPT-OSS:生物医療向け汎用ビジョン・ランゲージモデルの構築
2025/8/14
MedGPT-OSSは、生物医療分野に特化した汎用ビジョン・ランゲージモデルのトレーニングを目的としたオープンソースプロジェクトです。医用画像解析と自然言語処理を統合し、視覚的指示チューニングを通じて高精度な医療AIを実現。医療現場での診断支援や研究開発への応用を目指しています。

医療チャットボットのQA応答分析と精度定量化
2025/7/30
本リポジトリは、約4,000件の大規模言語モデル(LLM)を活用した医療チャットボットの質問応答記録を詳細に分析し、応答品質の向上方法を探る研究プロジェクトです。ChatGPT、Claude、LLaMA2、Clovaなど複数のLLMモデルの性能比較を通じて、利用者層別の適合性評価や質問タイプ別の誤答パターン分析を行い、医療現場での実用的なインサイトと改善策を提示しています。医療分野におけるAIチャットボットの信頼性向上に貢献する重要なリポジトリです。

MeetSpotX - インテリジェントな集合場所推薦システム
2025/8/8
MeetSpotXは、ユーザーの位置情報や好みに基づいて最適な集合場所を推薦するインテリジェントなシステムです。PythonとFastAPIを用いたバックエンドにより、高速かつ柔軟なAPIを提供し、HTMLベースのフロントエンドで使いやすいUIを実現しています。MITライセンスのオープンソースプロジェクトであり、カスタマイズや拡張も容易です。

Memorizer-v1:ベクトル検索対応エージェントメモリサーバー
2025/7/15
Memorizer-v1は、.NETベースで開発されたAIエージェント向けのメモリ管理サービスです。PostgreSQLのpgvector拡張を活用し、ベクトル埋め込みによる効率的な類似度検索を実現。構造化されたメモリの保存・取得・セマンティック検索が可能で、AIエージェントの知識管理や対話履歴の活用に適しています。Dockerイメージも提供され、手軽に環境構築できる点も魅力です。

MetaAurora:スケーラブルなマイクロサービスUIアーキテクチャのためのクラウドネイティブAIスタイリング基盤
2025/8/2
MetaAuroraは、リアルタイムデータ処理を実現するスケーラブルなマイクロサービスベースのユーザーインターフェースアーキテクチャ向けに設計された、クラウドネイティブでAI駆動のスタイリングインフラストラクチャです。Pythonで実装されており、最新のアーキテクチャパターンと技術を活用してUIの動的スタイル適用を効率化し、拡張性とリアルタイム性を両立しています。

metakeyai:TypeScriptベースのAI関連ユーティリティライブラリ
2025/6/21
metakeyaiは、TypeScriptで開発されたAI関連のユーティリティライブラリです。リポジトリ自体の詳細な説明はありませんが、コード構造からは、AIや機械学習関連のプロジェクトで利用可能な補助的な機能群を提供することが推察されます。小規模ながらも、TypeScriptを活用した堅牢な設計が特徴的です。今後の発展が期待される注目のリポジトリです。

MetalTensorOpsのMetal 4による高速テンソル演算ライブラリ
2025/7/24
MetalTensorOpsはAppleのMetal 4の最新コンピュートAPIを活用し、Metal Performance Primitives(MPP)とテンソル演算に焦点を当てたSwiftベースのライブラリです。低オーバーヘッドなコマンドバッファ再利用や引数テーブル、統合されたML/コンピュートエンコーダなどの新機能を体験でき、Pythonで学習したニューラルインプリシットモデルをSwiftとMetalでオンデバイス実行するための実験的な実装例を提供しています。

MGCA-Net:オープンボキャブラリー時系列アクションローカリゼーションのための多粒度カテゴリ認識ネットワーク
2025/8/13
MGCA-Netは、動画内の時系列アクションをオープンボキャブラリー(未知のカテゴリを含む)で検出・局所化するための多粒度カテゴリ認識ネットワークです。既存のラベルに限定されず、幅広いカテゴリのアクション検出を可能にし、動画解析や監視、スポーツ解析など多様な応用が期待されます。本リポジトリはMGCA-Netの公式実装コードを提供し、データ前処理からモデル学習、評価まで包括的にサポートします。

Mini-Fraud-Detection-App:シンプルな不正検知ダッシュボード
2025/8/7
Python、Pandas、Streamlitを用いて構築されたシンプルなルールベースの不正検知ツールです。取引データの行動パターンを分析し、不正の可能性がある取引やリスクの高いユーザーを特定します。ミニプロジェクトとして面接やGitHubポートフォリオに適した、クリーンでプロフェッショナルな構成が特徴です。

MiroRL:深層研究エージェントのためのMCP優先強化学習フレームワーク
2025/8/8
MiroRLは、MCP(Markov Chain Process)を基盤とした強化学習フレームワークで、深層研究エージェント開発に特化しています。Pythonで実装されており、研究者が効率的に強化学習アルゴリズムを設計・実験できる環境を提供。シンプルな構成と拡張性を両立させ、最新の強化学習手法を迅速に試せる点が特徴です。

MLリポジトリの概要と技術解説
2025/8/23
「ML」リポジトリは、Pythonを用いた機械学習関連のコードを収めたシンプルなプロジェクトです。スター数17を獲得し、機械学習の基礎的なモデルや処理を実装したファイル2つで構成されています。少数のコミットながら、初心者が学習や実験を始めるための基盤として適しています。

ML-Based-Financial-Risk:機械学習による個人金融リスク分析とカスタマイズ信用評価システム
2025/7/30
本リポジトリは、個人の信用スコア、財務状況、人口統計データを基に機械学習を活用して金融リスクを予測し、個別に最適化された信用評価システムを構築するプロジェクトです。既存の信用評価モデルの課題を克服し、顧客と金融機関双方に実践的な洞察を提供することを目的としています。さらに、Streamlitを用いたウェブアプリケーションも実装されており、ユーザーが手軽にリスク予測を体験可能です。

MLA-Trust:マルチモーダルLLMエージェントの信頼性評価ツールボックス
2025/6/19
MLA-Trustは、マルチモーダル大規模言語モデル(LLM)エージェントの信頼性を「真実性」「制御性」「安全性」「プライバシー」という四つの重要な側面から包括的に評価するためのPythonベースのツールボックスです。34の対話型タスクを通じて、多様な実践的シナリオでの性能をベンチマークし、研究者や開発者が信頼性向上に役立てられます。

MMaDA:オープンソースのマルチモーダル大規模拡散言語モデル
2025/5/23
MMaDAは、マルチモーダル情報を統合して処理可能な大規模拡散言語モデルをオープンソースで提供するプロジェクトです。画像やテキストなど複数のモーダリティを活用し、高度な生成性能と柔軟な応用力を実現。AI研究や応用開発の加速に寄与することを目指しています。

MMPL:高品質かつ並列化可能な自己回帰型長尺動画生成のためのマクロ・フロム・マイクロプランニング
2025/8/8
MMPLは、自己回帰型の長尺動画生成において、高品質かつ効率的な並列処理を実現するための「マクロからマイクロへの計画(Macro-from-Micro Planning)」手法を提案するリポジトリです。複雑な長尺動画生成の課題を解決し、高速かつ高品質な動画生成を目指す最新のAI技術を実装しており、今後の動画生成モデルの発展に貢献します。

MODA:マルチモーダル認知・感情理解のためのモジュラー二重注意機構
2025/7/10
MODAは、マルチモーダル知覚、認知、感情理解を目的とした新しい注意機構「MOdular Duplex Attention」を提案するリポジトリです。異種データ(画像、テキスト、音声など)の特徴を効果的に統合し、高度なマルチモーダル推論を実現。ICML 2025のスポットライト論文として発表され、感情認識や認知タスクへの応用を目指しています。

MoFE-Time:時系列予測のための周波数領域専門家混合モデル
2025/7/10
MoFE-Timeは、大規模言語モデル(LLM)を基盤としつつ、時系列予測の精度向上を目指した最新の機械学習モデルです。周波数領域の専門家(Experts)を混合させることで、異なる周波数成分に特化した予測を実現し、従来手法を上回る性能を発揮します。Pythonで実装されており、モデル構造の柔軟性と高精度な予測能力が特徴です。

分子溶解度予測モデルの構築と解析
2025/9/7
本リポジトリは、分子の溶解度(LogS)を予測するための機械学習モデルを構築したプロジェクトです。分子の特徴量としてMolLogP、分子量(MolWt)、回転可能結合数(NumRotatableBonds)、芳香族比率(AromaticProportion)を用い、線形回帰およびランダムフォレストを適用して予測精度を比較しています。PythonのPandas、NumPy、Matplotlib、Scikit-Learnなどの主要なデータサイエンスライブラリを活用し、非線形性の捉え方に優れたランダムフォレストの有効性を示しています。

MonkeyCode:AI搭載の次世代プログラミング支援ツール
2025/6/25
MonkeyCodeは、Go言語で開発されたオープンソースのAIプログラミングアシスタントです。スマートなコード補完、エラー検出、コードリファクタリング、ドキュメント生成など、多彩な機能を備え、開発者の生産性とコード品質の向上を目指します。初心者からプロまで幅広い層に対応し、開発ワークフローに革新をもたらす強力なツールです。

MoodBench:大規模言語モデルの情感サポート能力を評価するベンチマーク
2025/8/26
MoodBenchは、趣丸科技と北京大学ソフトウェア工学国家工程研究センターが共同開発した、大規模言語モデル(LLM)の情感(感情的)サポート能力を科学的かつ体系的に評価するためのベンチマークです。オープンソースのPQAEF評価フレームワークを基盤とし、「四次元」評価理念に基づいて設計されており、多様な感情表現や応答の質を定量的に測定できます。Linux、Windows、Macの主要OSに対応し、Pythonで実装されています。

MoodAI - 感情認識チャットボットのReact実装
2025/7/23
MoodAIはReactとViteをベースに構築された感情および感情分析チャットボットです。Hugging Faceの「emotion-english-distilroberta-base」モデルを用いてユーザーの入力テキストから喜びや悲しみ、怒りなど複数の感情をリアルタイムで検出し、絵文字で感情を表現します。さらに、チャット履歴の管理や感情分析結果を棒グラフや折れ線グラフで可視化する機能を備え、PCだけでなくモバイル環境にも完全対応しています。

MOSAIC:対応認識アライメントと分離による複数被写体のパーソナライズ生成
2025/8/19
MOSAICは、対応認識アライメントと潜在空間の分離技術を組み合わせることで、複数の被写体を含む画像のパーソナライズ生成を実現する先進的なAIモデルです。被写体ごとの特徴を正確に捉えつつ、個別に制御可能な生成を可能にし、シーン内の複数人物やオブジェクトの高品質な合成・編集を支援します。これにより、映像制作やゲーム、AR/VRなど多彩な応用が期待されます。

multi-agent-researcher:InstructorとExa.aiを活用したマルチエージェント研究システム
2025/6/15
本リポジトリ「multi-agent-researcher」は、大規模言語モデル(LLM)の出力を構造化するためのInstructorフレームワークと、高速なニューラル検索を可能にするExa.aiを組み合わせたマルチエージェント研究システムを提供します。複数のエージェントが協調しながら情報探索・解析を行うことで、研究や知識探索の効率化を実現。Pythonで実装されており、AI研究や情報検索分野の応用に適しています。

Multimodal-Outpost-Notebooks:最先端マルチモーダルVision-Languageモデル実験用ノートブック集
2025/7/29
Multimodal-Outpost-Notebooksは、最先端のマルチモーダルVision-Languageモデル(VLM)の実装と実験を行うための、厳選されたJupyter/COLABノートブックのコレクションです。OCR、画像キャプション生成、ビデオ理解など多様なタスクに対応し、画像とテキストを組み合わせたPDFやDOCXの生成も可能。研究や開発の出発点として活用できる実践的なツール群を提供します。

TradeRiser:マルチチェーン対応の最先端トレーディングボット
2025/7/27
TradeRiserは、EthereumやBinance Smart Chain、Polygonなど主要10のブロックチェーンネットワークに対応した高度でカスタマイズ可能なトレーディングボットです。多彩な設定オプションと最新アルゴリズムを備え、ユーザーの取引戦略に柔軟に対応。複数チェーンをまたがる取引を自動化し、効率的かつ安全に資産運用を行えます。

AI駆動型コールドメールシステム「n8n-Cold_Email_System」
2025/7/27
「n8n-Cold_Email_System」は、AIと自動化ツールを活用したエンドツーエンドのコールドアウトリーチシステムです。サービス提供者が潜在顧客に対してパーソナライズされたコールドメールを自動生成・送信することを目的とし、リード獲得の効率化を実現します。完全統合かつスケーラブルな設計で、リアルエステートエージェントなど多様な業種での活用が想定されています。

n8n-free-templates:AI時代のための200種以上のn8nワークフローテンプレート集
2025/5/22
「n8n-free-templates」は、クラシックな自動化技術と最新のAIスタック(ベクターデータベース、埋め込み、巨大言語モデル)を融合させた、200以上のプラグアンドプレイ型n8nワークフローを厳選してまとめたリポジトリです。JSON形式のテンプレートをインポートし、認証情報を追加して有効化するだけで即利用可能。デモやプロトタイプ作成、さらには本番環境への導入まで幅広く対応しています。

n8nによるバイラルショートクリップ自動生成&マルチSNS投稿システム
2025/9/1
本リポジトリは、AIを活用して長尺動画を自動的にバイラル性の高いショートクリップへ変換し、複数のソーシャルメディアプラットフォームへ自動投稿するためのn8nワークフローアーキテクチャを提供します。PythonやFFmpegと連携し、効率的かつ高度な動画編集とSNS配信を実現。動画マーケティングの自動化に最適なソリューションです。

Nano-Bananary|香蕉超市|多彩な生成プレイを簡単操作で実現するAIツール
2025/9/5
Nano-Bananaryは、複雑なプロンプト不要で多様な生成プレイが可能なAIベースのツールです。局所的な塗り選択や連続編集機能を備え、ユーザーは直感的な操作で多彩なコンテンツ生成を楽しめます。TypeScriptで実装され、軽量かつ拡張性の高い設計が特徴です。AI生成のクリエイティビティを手軽に体験したい方に最適なリポジトリです。

NBAハイライト動画ジェネレーター
2025/8/19
本リポジトリは、指定したNBA選手の試合ハイライト動画を自動生成するツールを提供します。選手名や期間、チーム、ハイライトの種類を指定するだけで、関連するプレイ動画を検索・抽出し、編集済みのハイライト動画を作成可能です。Jupyter Notebook形式で実装されており、簡単にカスタマイズや実験が行えます。NBA公式のデータや映像URLを活用しており、バスケットボールファンやスポーツ分析に有用なプロジェクトです。

ncnn_mobileclip:軽量モバイル向けCLIPモデルのNCNNエクスポートと推論
2025/8/18
ncnn_mobileclipは、人気のCLIPモデルを軽量化し、モバイルデバイス上で高速かつ効率的に推論可能な形式に変換するためのツールです。PyTorchでトレーニングされたMobileClipモデルの重みをNCNNフォーマットにエクスポートし、スマホ等のリソース制約がある環境での利用を可能にします。モデルの多様なバリエーションに対応し、簡単に推論を試せる点が特徴です。

ncnnによるYOLOE実装
2025/8/19
本リポジトリ「ncnn_yoloe」は、軽量かつ高速な推論が可能なncnnフレームワーク上でYOLOEという物体検出モデルを動作させるための実装を提供します。モデルの変換や融合技術を用いた最適化、CLIPを活用した特徴生成機能も備えており、モバイルや組み込み環境でのリアルタイム物体検出に適しています。

Neosgenesis - メタ認知型インテリジェント意思決定ワークベンチ
2025/8/4
Neosgenesisは、メタ認知(自己認識)に基づく高度な意思決定を支援するAIワークベンチです。Pythonで実装され、多腕バンディット問題をはじめとする強化学習アルゴリズムを活用し、複雑な環境下での最適行動選択を支援します。研究開発や実用的アプリケーションにおけるAIの意思決定プロセス改善に役立つツールキットです。

NeuroPump:水中画像の幾何学的および色彩補正を同時に実現する技術
2025/7/7
NeuroPumpは、2025年に開催されるACM MM'25で発表される研究成果をベースにした水中画像の補正技術を提供するリポジトリです。本技術は水中画像に特有の幾何学的歪みと色彩変化を同時に補正し、高品質な画像復元を実現します。現在はコードとデータセットの公開を予定しており、水中画像処理やコンピュータビジョン分野の研究者・開発者にとって注目の技術です。

NextStep-1:連続トークンによる自己回帰型画像生成の最前線
2025/8/14
NextStep-1は、連続値トークンを用いた大規模自己回帰型画像生成モデルの研究開発プロジェクトです。従来の離散トークンを用いた生成モデルの限界を超え、より細やかで高品質な画像生成を実現。効率的なトークン表現とモデル設計により、高解像度かつ多様な画像生成を目指しています。Pythonで実装されており、モデルの重みはHugging Faceで公開されています。

NFTIAI:NFTとAIを融合した革新的プラットフォーム
2025/6/17
NFTIAIは、NFT(非代替性トークン)とAI(人工知能)技術を組み合わせた革新的なTypeScriptベースのプロジェクトです。最新のAI技術を活用してNFTの生成や管理、さらには関連データの解析を効率化し、NFT市場の可能性を拡大します。開発者やクリエイターがAIの力を活用して独自のNFTコンテンツを作成・運用できる環境を目指しています。

NinjaTech - 革新的なAIソリューション
2025/8/30
NinjaTechは、革新的なAIソリューションを提供するシンプルかつ効果的なHTMLベースのプロジェクトです。軽量な構成でAI技術の紹介やデモを行うための基盤を提供し、ユーザーがAIの可能性を直感的に理解できるよう設計されています。初心者から中級者まで幅広い層に対応するため、わかりやすいコード構造と視覚的なコンテンツが特徴です。

NipponCode - 日本語最適化型次世代AIコーディングアシスタント
2025/8/20
NipponCodeは、日本語に最適化された次世代のAIコーディングアシスタントです。ClaudeCodeに似た対話型インターフェースを採用し、GPTやClaude、さらには自作のオープンソースモデル(gpt-ossなど)まで幅広く対応。日本語での自然な対話とコード生成を実現し、日本の開発者がより効率的にプログラミングを行える環境を提供します。

NLP2SQL-4.1.0:自然言語からSQLクエリを自動生成するインテリジェント検索システム
2025/8/21
NLP2SQL-4.1.0は、自然言語で記述された質問を自動的にSQLクエリに変換し、データベースから結果を取得するオープンソースのインテリジェント検索システムです。Gemini APIを活用した自然言語処理により、専門知識がなくても簡単にデータ検索を可能にします。ローカルモデルのデプロイや知識ベースの活用、カスタムサービスにも対応し、幅広いビジネスシーンで活用できます。

NoteMR:ノートガイド型多模態大規模言語モデルによる視覚質問応答の強化
2025/6/16
NoteMRは、CVPR 2025で発表された「Notes-guided MLLM Reasoning: Enhancing MLLM with Knowledge and Visual Notes for Visual Question Answering」のコード実装リポジトリです。本プロジェクトは、多模態大規模言語モデル(MLLM)に対して、知識ノートと視覚ノートを組み合わせて推論能力を高める手法を提案し、視覚質問応答(VQA)の精度向上を目指しています。Pythonで実装され、AI分野における先進的な研究を実用的に体験可能です。

Notte - AIによる高速で信頼性の高いウェブエージェント構築フレームワーク
2025/7/24
Notteは、自然言語で指示を与えるだけでウェブ上の操作や自動化タスクを実行できるAI搭載ブラウザエージェントを構築するためのオープンソースフレームワークです。ヘッドレスブラウザ制御、セキュアな資格情報管理、構造化されたウェブ認識機能を組み合わせることで、LLM(大規模言語モデル)を活用した信頼性の高い自動化を実現します。高速かつコスト効率に優れ、スケール可能な設計が特徴です。

制限なしの高性能NSFW AIジェネレーター
2025/8/17
「nsfw-ai-generator-no-limit」は、制限やフィルターなしで高精度なNSFW(Not Safe For Work)AIアート画像を生成できるツール群を紹介するリポジトリです。多様なジェネレーターを検証しており、ユーザーが自由に創造性を発揮できる環境を提供しています。AIによるリアルなNSFW画像生成に関心がある開発者やクリエイターに有用な情報をまとめています。

NSFW AIビデオジェネレーター|無制限でAI生成する成人向け動画作成ツール
2025/8/17
本リポジトリは、制限なしで利用可能なNSFW(成人向け)AI動画ジェネレーターの情報をまとめたものです。複数のAIツールを比較・検証し、無制限かつ検閲なしで創作可能なサービスを厳選。AIによる動画生成の最先端を体験したいユーザーに向けて、使いやすさや機能面を評価しています。2025年最新の成人向けAI動画制作の動向を把握するのに最適なリポジトリです。

Omen - Laravel向けAIエージェントフレームワーク
2025/8/4
OmenはLaravelアプリケーション向けのAIエージェントフレームワークです。AnthropicのAPIを利用し、チャットベースのAIエージェントを簡単に構築・管理できるよう設計されています。インストールからエージェントの実行までシンプルなコマンドで完結し、開発者がAI機能をLaravelプロジェクトにシームレスに統合可能。設定やファイル生成も自動化されており、AI活用のハードルを大幅に下げるツールです。

Omni-Agent Hub:高度なマルチエージェントオーケストレーションシステム
2025/7/6
Omni-Agent Hubは、ReAct、MCP、Agentic RAGといった最先端技術を統合した高度なマルチエージェントオーケストレーションシステムです。Python製でFastAPIを用いたAPI設計、Dockerによるコンテナ管理、PostgreSQLやRedisを活用した堅牢なデータ管理を特徴とし、複数のAIエージェントを柔軟かつ効率的に連携・制御可能です。最新のAIアプリケーション開発や研究に最適な基盤を提供します。

omni-bot-sdk-oss:ゼロ侵入型WeChat 4.0 RPAフレームワーク
2025/7/12
omni-bot-sdk-ossは、視覚認識を基盤にしたカスタムYOLOモデルやOCR、データベース監視を活用し、WeChat 4.0のランタイム環境に影響を与えずに動作するRPAフレームワークです。動的プラグイン対応やOpenAIとの連携も可能で、全メッセージタイプの解析やテキスト・画像・ファイルメッセージの送信機能を備え、小プログラムや朋友圈への送信拡張にも対応しています。

OODAサブエージェント:軍事戦略に基づくAIエージェントフレームワーク
2025/7/25
OODAサブエージェントは、軍事戦略の意思決定ループ「Observe(観察)→ Orient(方向付け)→ Decide(決定)→ Act(行動)」に基づくAIエージェント群です。スタートアップがAIプロダクトを迅速に開発・展開できるよう設計されており、問題解決を体系的に行うためのフレームワークを提供します。Gitサブモジュールとして簡単に導入可能で、複雑な状況を明確に整理し、段階的に意思決定を進めることが可能です。

Open-Fiesta:マルチモデルAIチャットのオープンソースプレイグラウンド
2025/8/18
Open-Fiestaは、Next.jsのApp Routerを活用して構築されたオープンソースのマルチモデル対応AIチャットプレイグラウンドです。ユーザーは複数のAIモデルを統合し、対話形式で試すことができる環境を提供。TypeScriptで開発されており、拡張性や使いやすさを重視した設計が特徴です。AI技術の実験や学習、プロトタイプ開発に最適なツールとして注目されています。

Open Lovable - AIチャットで即座にReactアプリを構築するツール
2025/8/8
Open Lovableは、AIと対話しながらReactアプリケーションを瞬時に構築できるオープンソースプロジェクトです。TypeScriptで実装されており、使いやすいセットアップとAPI連携により、開発者がコーディングの負担を軽減しながら効率的にUI開発を進められます。GitHub上で活発に管理されており、リアルタイムでのAIチャットによるコード生成や修正が特徴です。

OpenAI API エージェント開発入門プロジェクト
2025/8/28
OpenAI APIを活用したエージェント開発の学習を目的とした教育用プロジェクトです。エージェントアプリの起動から環境設定、OpenAI API連携までをカバーしており、初心者が実践を通じてAPIの使い方やエージェント設計の基礎を理解できる構成になっています。リアルな開発例として参考になるリポジトリです。

Z.ai向けOpenAI互換APIプロキシ
2025/9/1
本リポジトリは、Z.aiのGLM-4.5モデルに標準的なOpenAI APIインターフェースでアクセス可能にするプロキシサービスを提供します。OpenAIのエンドポイントを模倣しつつ、チャット補完やモデル一覧取得などの機能を実装。流式レスポンスのSSE対応や匿名セッション機能、詳細なログ出力など開発者に便利な機能を備え、多様なAIサービス統合やモデル評価用途に最適です。

OpenAlpha_Evolve:自律型コーディングエージェントのためのPythonフレームワーク
2025/5/22
OpenAlpha_Evolveは、DeepMindのAlphaEvolveに触発された自律型コーディングエージェントの研究を基に開発されたオープンソースのPythonフレームワークです。ソフトウェア開発の自動化を目指し、AIが自己進化しながらコードを生成・改善していく仕組みを提供。研究者や開発者が高度な自律プログラミングエージェントを実装・評価するための強力なプラットフォームとして注目されています。

OpenBench - 言語モデル評価のためのオープンベンチマーク基盤
2025/7/31
OpenBenchは、プロバイダーに依存しないオープンソースの言語モデル評価基盤です。20以上の評価スイートに対応し、多様な大規模言語モデル(LLM)の性能を標準化かつ再現可能な形でベンチマークできます。Pythonで実装されており、MITライセンスの下で提供されています。開発者や研究者が容易に言語モデルの比較評価を行うための強力なツールキットを提供します。

OpenCLIPをサービス化するノートブック
2025/9/3
OpenCLIPを利用してテキストの埋め込みベクトルを生成する最小限のFastAPIサービスを提供するリポジトリです。Colabの無料GPUを活用し、任意のOpenCLIP対応モデルに差し替え可能なモデルカードを採用。API経由でテキストを送信すると512次元の埋め込みベクトルを返します。CUDAが使える環境ではGPU自動選択も行い、機械学習や自然言語処理の実験やサービス開発に便利な構成となっています。

OpenFi-BOT:Vonssyによるオープンソース自動化ボット
2025/6/9
OpenFi-BOTは、Pythonで開発された自動化ボットプロジェクトで、Vonssy氏によるシリーズの第2弾と位置づけられています。シンプルながらも汎用性を持ち、様々なタスクの自動化を目指して設計されているのが特徴です。軽量な構造と拡張性を兼ね備え、Pythonの利点を活かした実装がなされています。

Openomy:ブロックチェーンとAIによるオープンソース経済ソリューション
2025/7/4
Openomyは、ブロックチェーン技術とAIを活用してオープンソースの経済ソリューションを提供するプロジェクトです。単なるコード公開に留まらず、コード自体を製品として捉え、コントリビューションの多角的な評価や経済的インセンティブの創出を目指しています。TypeScriptで開発されており、貢献者の活動を可視化・評価する独自の仕組みを備えています。

OpticalCharacter:プロフェッショナルな光学文字認識ソリューション
2025/8/10
OpticalCharacterは、最新のTypeScript技術とモダンなアーキテクチャパターンを活用した、クラウド対応かつエンタープライズ向けに最適化された光学文字認識(OCR)ソリューションです。高精度な文字認識機能を備え、企業の要件に応じた拡張性と効率性を実現。開発者に使いやすく設計されており、OCRを必要とする多様なアプリケーションに柔軟に対応可能です。

Occlusion-robust Stylization for Drawing-based 3D Animationの紹介
2025/8/5
「OSF」は、ICCV2025で発表予定の「Occlusion-robust Stylization for Drawing-based 3D Animation」をテーマにしたリポジトリです。3Dアニメーション制作における描画ベースのスタイライズ技術において、特に遮蔽(オクルージョン)に強い手法を提案しており、複雑なシーンでも安定的な表現が可能になることが特徴です。現在はリリース準備中で、将来的に詳細な実装や資料の公開が期待されます。

oumnix-minimal: 非Transformer系AIアーキテクチャの実験的モデル
2025/8/25
「oumnix-minimal」は、Transformerに依存しない新しいAIモデルアーキテクチャの基礎的な実装です。約5000万パラメータのモデルをRTX 4060搭載ノートPCでゼロから学習させる実験的プロジェクトで、既存の論文や既視モデルの模倣を行わず、新たな探索の道を模索しています。シンプルながらも意欲的な挑戦として注目されるリポジトリです。

OvamAiレビュー:リアルタイムでコード品質を高めるAIアシスタント
2025/8/16
OvamAi-reviewは、チームの生産性向上を目的としたAIベースのコードレビュー支援ツールです。リアルタイムかつ文脈を理解したフィードバックを提供し、コラボレーションの円滑化や意思決定の強化、イノベーションの促進を実現します。TypeScriptで開発されており、開発現場の効率化と高品質なコード維持に貢献します。

PartCrafter:構造化3Dメッシュ生成のための合成潜在拡散トランスフォーマー
2025/6/9
PartCrafterは、合成的な潜在拡散トランスフォーマーを用いて、構造化された3Dメッシュを生成する革新的な技術を提供するリポジトリです。パーツ単位での生成を可能にし、高精細かつ意味的に整合性のある3Dモデル作成を目指しています。3Dグラフィックスや機械学習分野における最新の生成モデルの応用例として注目されており、研究および実用面での利用価値が高いリポジトリです。

Perplexity-APIで実現するGoogle検索データの高度解析
2025/6/24
Perplexity-APIは、Google検索データの取得と解析をシームレスに行うための高度なAPIです。人工知能を活用し、生の検索データを有用なインサイトへと変換。企業や開発者がデータドリブンな意思決定を容易に行えるよう設計されています。本リポジトリでは、APIの利用方法や特徴、技術的なポイントを詳しく解説します。

Physicar DeepRacer for Cloud:クラウドベースのPhysiCar DeepRacer学習プラットフォーム
2025/9/6
Physicar DeepRacer for Cloudは、PhysiCar AIプロジェクトの一環として開発された、AWS DeepRacerモデルをクラウド環境で効率的にトレーニングするためのプラットフォームです。ローカル環境に依存せず、クラウドでの学習やテストを容易に実行できるため、機械学習モデルの開発サイクルを加速させます。現在ベータ版であり、簡単なノートブック形式の操作で始められる点も特徴です。

PosterCraft:高品質で美的なポスター生成のための統合フレームワーク
2025/6/30
PosterCraftは、高品質かつ美的なポスター生成を目指し、生成プロセスを統合的に再設計したPythonベースのフレームワークです。最新のAI技術を活用し、デザインの美学と表現力を両立させることに注力。ユーザーは簡単な入力からプロフェッショナルなポスターを効率的に生成でき、クリエイティブ制作の新たな可能性を切り拓きます。

Power BIデータセットと自然言語対話を実現するMCPサーバー
2025/6/21
本リポジトリ「powerbi-mcp」は、Power BIのデータセットと自然言語によるインタラクションを可能にするMCP(Multi-Channel Platform)サーバーの実装を提供しています。Pythonで構築されており、ユーザーは自然言語での質問を通じてPower BIデータにアクセスし、対話的にデータ分析を行うことが可能です。データドリブンな意思決定を支援する新しいインターフェースとして注目されます。

ppt_assistant:多模態大模型とLangGraphによるPPT生成システム
2025/6/9
ppt_assistantは、多模態大規模モデルとLangGraph技術を活用したPPT自動生成システムです。フロントエンド、バックエンド、そしてコアの3層構造で構成されており、ユーザーの入力から効果的なスライドを生成します。Pythonで実装されており、AIを駆使した効率的なプレゼン資料作成を支援します。

ロボット学習における圧力触覚センサーの研究論文リスト
2025/9/2
本リポジトリは、ロボット学習分野における圧力ベースの触覚センサーに関する学術論文を体系的に収集・整理したものです。特に、学習技術とマトリックス構造の柔軟な触覚センサーを組み合わせた研究に焦点を当てており、関連分野の研究者や技術者にとって有用な情報源となっています。最新の研究動向や手法を把握するためのリファレンスとして活用可能です。

Prime Intellectの強化学習環境群「prime-environments」の紹介
2025/8/16
Prime Intellect Researchチームが開発した、強化学習(RL)環境および評価フレームワークのオープンソースリポジトリ「prime-environments」を解説します。Pythonで実装されたこのプロジェクトは、RL研究や評価を効率化するツール群を提供し、環境の作成からAPI連携まで幅広くサポート。セットアップ方法や主要機能、技術的な特徴を詳細にまとめました。

PPLX-Agentic-Task-List-Generator:プロンプトをエージェントタスクリストに変換するツール
2025/9/1
PPLX-Agentic-Task-List-Generatorは、ユーザーが入力した自然言語のプロンプトをもとに、AIエージェントが実行可能なタスクリストへと自動変換するTypeScript製のツールです。AI Studio上で動作し、開発者が効率的にAIタスク管理を行えるよう支援します。Node.js環境でのローカル実行も可能で、Gemini APIを活用して高度な自然言語処理を実現しています。

PRISM:コスト効率の高いマルチLLM推論システム
2025/8/15
PRISMは、複数の大規模言語モデル(LLM)を効率的に運用するための研究プロトタイプであり、GPUリソースの時間・空間共有を柔軟に実現することで推論コストを大幅に削減します。Pythonで実装され、マルチLLM環境におけるスケーラビリティとパフォーマンス向上を目指した設計が特徴です。

Prompt-Assistant:AIプロンプト作成を革新するChrome拡張機能
2025/6/3
Prompt-Assistantは、AIプロンプト作成のプロセスを革新するChrome拡張機能です。先端のAIエンジニアリング技術とGoogle Gemini AIを活用し、ユーザーの単純なアイデアを最適化された高品質なプロンプトへと変換。主要なAIプラットフォームで優れた成果を生み出します。シンプルな操作で効果的なプロンプトを生成できるため、AI活用の幅を広げるツールとして注目されています。

AIプロンプト最適化ツール「prompt-optimizer」
2025/8/9
「prompt-optimizer」は、ReactとCloudflareを用いて開発されたAIプロンプトの最適化ツールです。ユーザーが生成AIに与えるプロンプトを効率的に改善し、より精度の高い応答を引き出すことを目的としています。軽量なJavaScriptベースのフロントエンドとサーバーレス環境を活用したバックエンドにより、迅速かつスムーズなプロンプトチューニングが可能です。AIの活用を促進するための実用的なツールとして注目されています。

PromptEngineering:大規模言語モデルのプロンプト設計実験集
2025/8/24
PromptEngineeringは大規模言語モデル(LLM)におけるプロンプトエンジニアリングの実験をまとめたリポジトリです。実際のプロンプト設計や応答の工夫を通じて、モデルの性能向上や応答の多様性を追求。シンプルながら実践的なコード例を含み、LLM活用の基礎理解と応用力を高めることができます。初心者から研究者まで幅広い層に役立つ内容です。

PromptMicroTune-Revolution:大規模モデルの新たな「ソフト微調整」手法
2025/6/8
PromptMicroTune-Revolutionは、一段のプロンプトを用いた「ソフト微調整」技術を提案し、大規模AIモデルのカスタマイズコストと可能性の限界を大きく変革します。従来の大規模モデルの微調整に比べて低コストかつ柔軟に適応可能であり、ユーザーの創造性を拡張する新たなアプローチとして注目されています。

AI搭載スマートベビーモニター「prototipo-baba-eletronica-inteligente」
2025/7/9
本リポジトリはPythonとYOLOを活用した人工知能搭載のベビーモニターシステムを提供します。YOLOによる映像認識で赤ちゃんがベッド内外にいるかを検出し、危険を察知すると音声や視覚によるアラートを発信。OpenCVで映像処理し、TkinterとPygameでユーザーインターフェースと通知機能を実装しています。低コストかつリアルタイム監視可能なスマート育児支援ツールです。

PUAX - AIエージェント向けPUAプロンプト集
2025/8/18
PUAXはAIエージェントを効果的に「調教」するためのPUA(Pick-Up Artist)スタイルのプロンプト集です。リアルタイムで更新され、AIに対して厳しくもユーモアを交えた挑発や叱咤激励を送ることで、学習意欲や応答の質を高めることを目的としています。AIとの対話に新たな視点をもたらすユニークな試みとして注目を集めています。

Python Learning Space:AI駆動のPython学習環境構築デモ
2025/7/30
「Python Learning Space」は、AIのプロンプトエンジニアリングを活用し、汎用AIアシスタントをPython学習に特化したチューターに変換する手法を示したリポジトリです。カスタムインストラクションやチャットモードを通じて、効果的な教育環境を構築するデモを提供し、AIを活用したプログラミング学習の新しい可能性を探ります。

Pythonによる感情分析APIマイクロサービス
2025/8/30
本リポジトリは、Hugging FaceのTransformersを活用したテキストの感情分析を行うPython製マイクロサービスです。FastAPIを用いて高速かつ軽量なAPIを構築し、Dockerでコンテナ化することで容易なデプロイを実現しています。Postmanによるテストもサポートしており、実用的な感情分析APIの構築例として有用です。

QLIP: テキスト埋め込みで誘導する拡散モデルの量子化技術
2025/7/15
「QLIP」は、テキスト埋め込みを活用してテキスト誘導型拡散モデルの量子化を実現する先進的な技術を実装したGitHubリポジトリです。本リポジトリは、2025年発表の論文「Text Embedding Knows How to Quantize Text-Guided Diffusion Models」に基づき、拡散モデルの効率化と性能維持を両立する手法を提供します。今後のコード公開が予定されており、AI/ML分野での注目を集めています。

実機量子プロセッサ上での量子置換パッド(QPP)実装
2025/8/27
AlainChance氏の「QPP-Alain-real_QPU」は、実際の量子プロセッサユニット(QPU)上で量子置換パッド(Quantum Permutation Pad:QPP)を実装・検証するためのJupyterノートブック群を提供しています。Qiskit RuntimeやAerSimulatorを用い、2~9量子ビットの環境で動作し、2024年発表の論文をサポート。量子暗号の一手法として注目されるQPPの実践的応用に焦点を当てており、量子情報処理や暗号技術の研究者に有用なリソースです。

Quant_Trading_Algo:Pythonによる量的取引アルゴリズムの実装
2025/6/26
Quant_Trading_Algoは、Pythonを用いて量的取引(クオンツトレーディング)のアルゴリズムを実装したリポジトリです。金融市場のデータ分析や戦略開発に役立つツールやモデルが含まれており、投資判断の自動化やパフォーマンス最適化を目指しています。金融工学と機械学習の技術を活用し、実践的な取引アルゴリズムの構築をサポートします。

quant_clone:GGUFモデルの量子化パラメータをコピーするツール
2025/8/1
quant_cloneは、llama.cppのllama-quantizeコマンドを自動生成し、任意のGGUFフォーマットの量子化パラメータを複製するシンプルなPythonスクリプトです。これにより、既存のモデルと同様の量子化設定で新たなモデルを効率的に量子化可能で、最新のGGUF仕様にも対応しています。

R1Z:AIアプリとエージェントのためのセキュアなオープンクラウド
2025/6/14
R1Zは、AIアプリケーションやエージェント向けに設計されたセキュアなオープンクラウド環境を提供するTypeScriptベースのプロジェクトです。安全性を重視しつつ、AI開発の柔軟性と拡張性を両立。オープンソースとして公開されており、AI分野におけるクラウド利用の新たな可能性を追求しています。

LangChainとS3Vectorを活用したRAG型PDF情報検索システム
2025/9/1
本リポジトリは、LangChainとS3Vector、OpenAIを組み合わせてPDFファイルの内容を効率的にインデックス化し、高速かつ高精度な情報検索を実現するRAG(Retrieval-Augmented Generation)システムのサンプル実装です。Pythonで構築されており、AWS認証情報とOpenAI APIキーを用いて簡単にセットアップ可能。PDFドキュメントの内容をベクトル化しS3に保存、LangChainが検索と生成を橋渡しします。ドキュメントやコードはシンプルで拡張性もあり、RAGの実践的な活用例として参考になるリポジトリです。

RadGS_Reg:3D放射ガウスによる脊椎CT/X線画像の高精度登録
2025/6/23
RadGS_Regは、脊椎のCTとX線画像を対象に、3D放射ガウス(Radiative Gaussians)を用いた共同再構成と3D/3D画像登録を実現するPythonベースのオープンソースプロジェクトです。異なるモダリティ間の画像を高精度に整合させることで、医用画像解析や診断支援に寄与します。

RAGシステム - AIを活用したスマートドキュメント検索ツール
2025/8/17
本リポジトリ「rag-system」は、AI技術を用いたドキュメント検索および質問応答システムを提供します。Pythonをベースに、LangChainやGradioなどの最新ライブラリを活用し、ユーザーのドキュメントから効率的に情報を検索し、自然言語で回答を生成。RAG(Retrieval-Augmented Generation)という手法を採用し、検索結果を元に高度な回答をリアルタイムで生成する点が特徴です。ドキュメントの知識ベースを活かしたスマートな情報取得を実現します。

rag-reranking:2段階RAGパイプライン向け人気リランキングモデルの概要
2025/6/8
本リポジトリ「rag-reranking」は、情報検索や質問応答に用いられるRAG(Retrieval-Augmented Generation)パイプラインにおける2段階リランキング手法の代表的なモデルやアーキテクチャをまとめています。Jupyter Notebook形式で実装例を提供し、リランキングの基礎から応用までを体系的に理解できる内容です。RAGの性能向上を目指す研究者やエンジニアに有用なリファレンスとなっています。

RAG-Tutorials:Retrieval-Augmented Generationの実践チュートリアル
2025/9/3
RAG-Tutorialsは、Retrieval-Augmented Generation(RAG)モデルの理解と実装を目的としたJupyter Notebookベースのチュートリアル集です。情報検索と生成モデルを組み合わせる最先端の手法を学べる内容で、自然言語処理における応用例や実践的コードが含まれています。初心者から中級者まで、RAGの基礎から応用までを体系的に学習可能です。

Ragnrock:カスタマイズ可能な検索エンジンと言語モデルで情報源付きレポートを生成するAIツール
2025/8/30
Ragnrockは、多様な検索エンジン(Google、Brave、Wikipediaなど)とカスタマイズ可能な大規模言語モデル(LLM)を統合し、情報源を明示したレポートを自動生成するAIリサーチツールです。Dart言語で開発されており、柔軟な検索設定とレポート出力を実現。研究や調査、ドキュメンテーション作成に適した効率的な情報収集支援を提供します。

ランダムフォレストによるワイン品質予測プロジェクト
2025/7/26
本リポジトリは、物理化学的特性データを用いてワインの品質を予測する機械学習プロジェクトです。Pythonの主要ライブラリを活用し、探索的データ解析(EDA)、モデル構築、ハイパーパラメータ調整、特徴量重要度の分析を包括的に実施。Jupyter Notebook形式で詳細な実装と可視化を提供し、初心者から中級者まで機械学習の流れを学びやすい構成となっています。

リアルタイムローカル音声翻訳ツール
2025/7/29
本リポジトリは、Pythonを用いて開発されたリアルタイム音声翻訳ツールです。マイクからの音声入力をリアルタイムでテキストに変換し、そのテキストを指定した言語へローカル環境で翻訳します。インターネット接続を必要とせず、Voskによる音声認識とHugging Face TransformersのMarianMTモデルを組み合わせることで、プライバシー保護と低遅延を実現。TkinterベースのGUIで手軽に操作でき、多様なモデル選択やデバイス選択も可能です。

vLLMの活用に役立つ共通レシピ集
2025/7/23
vLLMプロジェクトが提供する「recipes」リポジトリは、vLLMを様々なモデルで実行するためのコミュニティメンテナンスによる共通レシピを集約しています。vLLMの利用を始めたい開発者や研究者にとって、モデルの起動や検証を迅速かつ効率的に行うための参考資料として活用できるリポジトリです。シンプルかつ実用的なスクリプト群を通じて、vLLMの導入ハードルを下げることを目的としています。

Recap - プライバシー重視のmacOSネイティブAI会議要約ツール
2025/8/2
Recapは、macOSネイティブで動作するオープンソースのAI会議要約アプリケーションです。プライバシーを最重要視し、ローカル環境での音声認識と要約生成を実現。会議の録音から自動的にテキスト化し、理解しやすい要約を提供します。シンプルなUIとSwiftによる軽快な動作で、ビジネスや教育現場における会議効率化を支援します。

Redes-Neuronales:ニューラルネットワーク入門リポジトリ
2025/8/6
BrayanTorres2による「Redes-Neuronales」は、Pythonを用いてニューラルネットワークの基礎から応用までを学べる教育用リポジトリです。基本的なニューラルネットワークの構築やトレーニング、複数週にわたる演習課題を通じて、機械学習の理解を深めることができます。初心者から中級者まで幅広く活用可能なシンプルなコード構成が特徴です。

大規模モデル実践リソース集
2025/8/25
OpenSELabが提供する「Resources-for-Large-Scale-Model-Practice」は、大規模言語モデル(LLM)やAIエージェントの実践的な技術習得を支援するJupyter Notebook教材集です。APIの利用方法からエージェント開発、MCP(Model-Centric Programming)技術まで幅広く網羅し、学習者が段階的に理解を深められる構成となっています。中国語での教材が中心ですが、実践的なコード例と解説が豊富で、AI/ML分野の技術者や研究者に役立つ内容が揃っています。

強化学習による優れた関数呼び出しの探索
2025/8/7
本リポジトリ「RLFC」は、論文「Exploring Superior Function Calls via Reinforcement Learning」の公式実装です。強化学習を活用し、関数呼び出しの最適化を目指したモデルを提供しており、オープンソースモデルの中で最先端の性能を達成しています。Ant Groupの機密審査を経て、コードやデータセット、モデルの重みの公開が予定されています。Open Sourceプロジェクト「Aworld, InclusionAI」の一環として開発され、今後のアップデートにも注目が集まっています。

RLPR: 検証器なしでRLVRを一般ドメインに拡張する技術
2025/6/23
RLPRは、強化学習におけるRLVR(Reinforcement Learning with Verifiers)手法を、検証器を用いずに一般的なドメインへと拡張することを目指したPython実装のリポジトリです。従来、RLVRは特定の検証器の存在に依存していましたが、本手法はそれを不要とし、幅広い環境での適用を可能にします。RLPRはOpenBMBが開発しており、強化学習の汎用性向上に貢献する先進的な技術を提供します。

RLTrainPPT:強化学習を活用したPPT生成エージェント
2025/8/28
RLTrainPPTは、強化学習を用いてPPT(パワーポイント)生成エージェントをトレーニングするプロジェクトです。テーマに基づきWeb検索を多段階で活用し、信頼性の高い情報を収集してPPTの大綱や内容を自動生成します。Google DeepMindのAgentic RL Transformer(ART)を用いた強化学習フレームワークにより、構造化されたPPT大綱から詳細なスライド内容を作成し、引用情報も併せて出力可能です。AIによる効率的な資料作成支援を実現します。

RKNN - Rockchip NPU向けRustバインディングライブラリ
2025/8/17
RKNNは、Rockchipのニューラルプロセッシングユニット(NPU)上での深層学習モデルの実行をRust言語で可能にするバインディングライブラリです。RockchipのRKNNランタイムAPI(librknnrt.so)をRustアプリケーションに効率的に統合し、AIモデルの最適化された実行環境を提供します。RKNN SDKの重要なコンポーネントとして、Cヘッダの再配布を不要にし、Rust開発者がNPUの性能を活かしたAI開発を進められるよう設計されています。

AI背景除去ツール「rmbg-tool」の技術解説
2025/7/11
「rmbg-tool」は、Vite+React+ONNX Runtime Webを用いて構築されたローカル動作の画像背景除去アプリケーションです。RMBG-1.4モデルを活用し、高品質な背景分離を実現。画像アップロードからリアルタイム処理までブラウザ上で完結し、プライバシー保護にも優れています。本記事ではリポジトリの概要、技術的特徴、構成について詳しく解説します。

Roblox-fish-script-free:Roblox向け高度自動釣りスクリプト
2025/8/6
Robloxの人気ミニゲーム「Fishin Script」を自動化するために開発された、高度な画像認識技術を活用した釣りタスク自動化ツールです。魚の識別やエアバブルの追跡も自動で行い、プレイヤーの操作を不要にすることで効率的なゲームプレイを実現します。Windows環境に対応し、使いやすさと高機能を両立させたスクリプトとして注目されています。

基盤モデルにおけるラベルノイズ下での頑健分類:ジオメトリ認識信頼性フレームワーク
2025/9/6
本リポジトリは、基盤モデル(Foundation Models)を対象に、ラベルノイズが存在する環境でも頑健に動作する分類手法を提供する統一的かつ拡張性の高いフレームワークを公開しています。ジオメトリ情報を活用した信頼性評価により、ノイズ混入ラベルの影響を低減し、分類性能の向上を目指します。Pythonで実装され、実験結果の可視化や各種設定が容易に行える点も特徴です。

ロボットの距離推定におけるIMUデータ活用技術
2025/8/25
本リポジトリは、IMU(慣性計測装置)センサーの加速度データを用いてロボットの移動距離を推定する機械学習パイプラインを実装したプロジェクトです。データ拡張や複数の回帰モデルを組み合わせることで、精度の高い距離推定を実現しています。Pythonで開発され、ランダムフォレストやサポートベクター回帰を活用したアプローチを採用しています。

RL-Factory:効率的な強化学習エージェント訓練フレームワーク
2025/5/27
RL-Factoryは、強化学習エージェントのモデルを簡単かつ効率的に訓練できるPythonベースのフレームワークです。シンプルな設計と柔軟な構成により、研究者や開発者が迅速に強化学習の実験を行い、最適なエージェントを構築可能。多様なアルゴリズムをサポートし、カスタマイズ性に優れた設計で、最新のAI/MLプロジェクトに適しています。

Roomi - 手頃な価格で実現する自律型清掃・家事ロボット
2025/7/18
Roomiは、ホテルや家庭向けに設計されたオープンソースの自律型清掃・家事ロボットです。ベッドメイキングや整理整頓など多彩な家事タスクをこなすことができ、約900ドル以下の低価格で実現。Pythonで開発されており、ユーザー自身が約5時間で組み立て可能です。LeRobotやgym-genesis、ManiSkillといった先端ロボティクス技術を活用し、信頼性と拡張性を兼ね備えた次世代の家庭用ロボットの実装を目指しています。

rss2mail-ai:RSSフィードの自動収集とAI要約によるメール配信ツール
2025/6/7
rss2mail-aiは複数のRSSフィードから自動的にコンテンツを取得し、重複排除やAIによる要約機能を備えたメール配信ツールです。Go言語で実装されており、RSS情報を効率的にまとめて届けたいユーザーやサービス向けに設計されています。シンプルな設定で導入可能なため、定期的な情報収集やニュース配信の自動化に最適です。

RuoYi-RAG-LangChain4j:AI知識ベース検索強化生成システム
2025/8/13
RuoYi-RAG-LangChain4jはLangChain4jフレームワークを基盤としたAI知識ベースの検索強化生成(RAG)システムのサーバーサイド実装です。多様なAIモデルに対応し、SearXNG検索エンジン、Neo4j知識グラフ、MCPサービス(地図、メール、DB連携)を統合して、より豊かで正確かつタイムリーな質問応答体験を提供します。AI知識管理システム及びユーザーインターフェースと連携し、PDFやTXT、Markdown等の多様なドキュメント形式から情報を抽出可能です。

SATA_fork:ImageNet評価における順序依存問題を検証するPython実装
2025/7/24
SATA_forkは、ImageNet-1Kデータセットで95%の高いトップ1精度を報告したSATA手法に対し、評価結果の妥当性を検証するためのフォーク実装です。本リポジトリは、データセットのサンプル順序に依存した評価バイアスの存在を示し、SATAの性能がシャッフルにより大幅に低下する問題を明らかにしています。研究コミュニティにおける適切な評価手法の重要性を示す技術的検証ツールとして活用できます。

SceneCompleter:シーン補完のための先進的AIツール
2025/6/13
SceneCompleterは、画像や3Dシーンの欠損部分を補完するためのAIベースのツールキットです。深層学習技術を活用し、部分的に欠落したシーンの自然な復元を目指しています。特に画像インペインティングやシーン再構成に応用可能で、クリエイティブやリサーチ用途に貢献します。現時点ではスター数は少ないものの、今後の発展が期待される注目のリポジトリです。

株価終値予測のための深層学習フレームワーク「SCPP-Stock-Closing-Price-Prediction」
2025/5/31
「SCPP-Stock-Closing-Price-Prediction」は、過去の株式市場データを活用し、株価の終値を予測するための深層学習フレームワークを提供するリポジトリです。データ前処理からテクニカル指標の生成、LSTMやBiLSTM、RNNといったニューラルモデルを用いた時系列解析までを統合し、PythonとPyTorch、Optuna、Plotlyなどのライブラリで構築されています。投資分析やAIによる価格予測に関心のある技術者に有用なツールです。

K-Meansによるショッピングモール顧客セグメンテーション
2025/8/14
本リポジトリは、ショッピングモールの顧客データを用いて、K-Meansクラスタリングを実装し、顧客を複数のセグメントに分類するプロジェクトです。年収と消費スコアの2つの特徴量を使い、最適なクラスタ数をElbow法やSilhouette分析で評価し、クラスタリング結果の可視化やクラスタプロファイルの出力も行います。Pythonで構築されており、初心者にも理解しやすい構成です。

SEAL:自己適応型言語モデルの研究と実装
2025/6/13
SEALは、自己適応機能を備えた言語モデルの開発を目的とするPythonベースのリポジトリです。継続学習や環境変化に対する柔軟な対応を実現するための技術的アプローチを提供し、自然言語処理のモデルが動的に変化するデータやタスクに適応できる仕組みを探求しています。SEALは自己適応性を重視し、モデルの性能維持と向上を両立する新たな可能性を示します。

Semantic Replica:動的室内環境のセマンティック変異データセット
2025/8/22
Semantic Replicaは、FacebookのReplicaデータセットを拡張し、静的な室内シーンに対して時間変化を考慮したオブジェクトの変異を導入したデータセットです。リアルな室内環境の変化を表現し、物体間の関係性をシーングラフとしてモデル化することで、より現実的なシーン解析やロボティクス、AR/VR応用に役立ちます。少数のファイル構成ながら、シーンの動的変化を捉える斬新なアプローチを提供します。

深層学習と決定木を用いた感情分析
2025/8/25
本リポジトリは、自然言語処理(NLP)と機械学習技術を活用し、テキストから感情(肯定的、否定的、中立的)を分類するプロジェクトです。テキストの前処理、CNNを用いた特徴抽出、決定木による分類を組み合わせたアプローチで、ソーシャルメディアや商品レビューなど多様なデータに対応可能な感情分析モデルを構築しています。実装はJupyter Notebookで行われ、教育や研究の入門用にも適した構成です。

LSTMを用いた感情分析モデルの構築と実装
2025/7/27
本リポジトリは、IMDB映画レビューのオープンデータを対象に、LSTM(Long Short Term Memory)を活用した感情分析モデルの実装を行っています。Jupyter Notebook形式で、テキストの前処理からモデル構築、学習、評価までを丁寧に解説しており、自然言語処理や深層学習を学ぶ入門者に適した内容です。実践的なコード例を通じて、RNNの拡張モデルであるLSTMの特徴や効果的な活用方法が理解できます。

sentra-web-to-api:多AIプロバイダー対応のOpenAI互換APIサービス
2025/8/21
sentra-web-to-apiはNode.jsベースのAIサービス集約プラットフォームであり、複数のAI提供者の大規模言語モデルや画像生成モデルを統一的に扱えるOpenAI互換APIを提供します。モジュール化設計により拡張性とメンテナンス性に優れ、Bearerトークン認証やストリーミング応答、ツール呼び出し機能、プロキシ対応など先進的な機能を備えています。多様なAIサービスを一つのAPIでシームレスに活用したい開発者に最適なソリューションです。

Sentrax-AI:研究生AIイノベーションコンテスト参加の自然言語処理モデル
2025/8/29
Sentrax-AIは第七届研究生人工智能创新大赛に参加した中国発の自然言語処理(NLP)プロジェクトです。Pythonで実装され、文書の感情分析やテキスト分類に特化したファインチューニング済みモデルを提供。データセット管理や構成ファイルも含み、NLPタスク向けのモジュール化されたコンポーネント群が特徴です。学術コンペティションの成果物として、実践的なAI技術を学ぶ上で有益なリポジトリです。

SEO Agent Pro - AI駆動のスマートSEO分析システム
2025/9/6
SEO Agent Proは、複数のAIサービスプロバイダー(OpenAI、Google、硅基流动など)を活用し、サイトのSEO状況を多角的に分析するAIベースのSEO分析ツールです。ページのコンテンツやパフォーマンス、技術的パラメータを自動収集し、データ分析、戦略提案、専門レポート作成を行う3人のAIエージェントが連携。総合スコアと具体的な改善案を提供し、Webインターフェースでのバッチ解析や履歴管理も可能。APIキーなしでも利用できる基礎機能を備え、安全な環境変数管理でAPI情報を保護しています。

ServeGen:リアルなLLMサービスワークロード生成フレームワーク
2025/6/5
ServeGenは、リアルな大規模言語モデル(LLM)サービスのワークロードを生成するためのPythonベースのフレームワークです。AIサービスの性能評価やスケーラビリティテストに役立つ実践的な負荷シナリオを簡単に作成でき、研究開発や運用におけるLLM活用の効率化を支援します。

SGR Deep Research:スキーマ駆動型推論による高度AIリサーチエージェント
2025/8/26
SGR Deep Researchは、大規模言語モデル(LLM)に対して、事前定義されたスキーマ(構造化テンプレート)を通じて推論を誘導し、明確で予測可能な出力を生成する技術を提供します。本リポジトリは、適応的プランニングと自動引用機能を備えたインテリジェントな研究エージェントを実装しており、複雑なタスクの段階的な解決を支援します。Pythonで書かれており、OpenAIのGPT-4を活用して高度な自然言語処理を実現しています。

ShadowGit MCP:AIアシスタント向けの安全なリポジトリアクセスプロトコル
2025/8/29
ShadowGit MCPは、AIアシスタントに対してShadowGitリポジトリへの安全かつ読み取り専用のアクセスを提供するModel Context Protocol(MCP)サーバーです。これにより、AIが詳細なGit履歴に基づく強力なデバッグやコード解析を行える環境を実現します。JavaScriptで実装されており、開発者がプロジェクトの微細な変更履歴を活用してAI支援を受けられる先進的なツールです。

SiliconFlow音声認識システム
2025/5/29
SiliconFlowは、硅基流动関連モデルを活用して音声データをテキストに変換する音声認識システムです。シンプルなHTMLベースの実装でありながら、効率的な音声処理を実現。音声から正確に文字起こしを行うことを目的としており、AI技術を用いた音声認識の基盤として利用可能です。

SimpleClaude:AI支援プログラミングのための実用的ミニマリズム
2025/7/6
SimpleClaudeは、Claude Codeを活用したAI支援プログラミングのためのシンプルかつ実用的なフレームワークです。複雑なAIとのやり取りを自然な会話形式へと変換し、開発者が手軽にAIアシスタントを利用できることを目指しています。Shell言語で構築されており、軽量かつ拡張性の高い設計が特徴です。

simpleExcelAgent:多機能Excelエージェントワークフローの実装例
2025/8/14
simpleExcelAgentは、OpenAIスタイルのAPIと互換性を持ち、コード実行やExcel操作ツール(MCP)を内蔵したマルチモーダルエージェントワークフローのサンプルプロジェクトです。非同期並列処理や人間によるレビューもサポートし、AIモデルを活用した高度なExcel自動化を実現します。

Skin-Cancer-Detection: 深層学習による皮膚がん検出システム
2025/8/21
本リポジトリは、皮膚の病変画像からメラノーマ(悪性黒色腫)を自動検出するための深層学習モデルを実装しています。カスタムCNNによる二値分類からスタートし、高精度かつ汎化性能に優れたEfficientNetV2-Lモデルへの移行を図ることで、医療現場での実用を目指した研究開発が行われています。コードはJupyter Notebook形式で提供され、画像分類の技術を学習・応用したい研究者や開発者に有用です。

Sky-Pointer:ハンドジェスチャーで操作するバーチャルマウス
2025/9/2
Sky-Pointerは、Pythonを用いて手のジェスチャーを認識し、仮想マウスとしてPC操作を可能にするプロジェクトです。Webカメラを介してリアルタイムに手の動きを検知し、クリックやポインティングなどの操作を行うことができ、タッチレスな新しいインターフェースを実現します。シンプルな構成で学習用途にも最適です。

smart-mermaid:AI技術を活用したテキストからMermaidコードへの自動変換ツール
2025/5/26
「smart-mermaid」は、AI技術を用いて自然言語で記述されたテキストをMermaid形式のコードに自動変換し、そのコードをもとに視覚的なダイアグラムを生成するWebアプリケーションです。JavaScriptで実装されており、プログラミング知識がなくても複雑なフローチャートやシーケンス図などを簡単に作成可能。シンプルな操作性と高い変換精度により、ドキュメント作成や設計図の共有を効率化します。

SmartChunker:大規模言語モデルを活用したスマートなテキスト分割ツール
2025/7/23
SmartChunkerは、大規模言語モデル(LLM)を基盤としたテキスト分割ツールです。長文を命題単位に細かく分解し、それらをテーマごとに関連性に基づいて動的にグループ化(チャンク化)します。これにより、テキストの効率的な検索・要約・知識管理が可能となり、RAGシステムや知識グラフ構築、情報検索など多様な応用に適しています。

SnapFit-AI:パーソナルAIトレーナー&栄養士
2025/6/5
SnapFit-AIは、即座に利用可能な個人向けAIトレーナー兼栄養士アプリケーションです。TypeScriptで実装されており、ユーザーの健康データをもとにパーソナライズされたトレーニングプランや栄養アドバイスを提供。初心者でも使いやすく、健康管理をサポートする革新的なツールとして注目されています。

SomniaExchangeBot-NTE:JavaScriptによる取引ボットの完全ガイド
2025/6/1
SomniaExchangeBot-NTEは、JavaScriptで開発された取引ボットで、Telegramで提供されるチュートリアルと連携して使い方を学べるリポジトリです。取引自動化を目的としたシンプルかつ拡張性のある設計で、取引所APIとの連携や注文管理機能を備えています。初心者から中級者まで取引ボットの仕組みを理解しやすい構造となっており、実践的な運用を目指す方に最適です。

spec-ai:日本政府データを活用した世界初のAIエージェント群チャットボット
2025/7/5
spec-aiは、日本政府のオープンデータを活用し、複数のAIエージェントが連携して動作する世界初のエージェント群チャットボットです。TypeScriptで開発されており、AI技術を通じて多様な情報を効率的に解析・提供します。日本政府データの活用により信頼性の高い情報提供を実現し、今後のAI対話システムの新たな可能性を示しています。

Spiral Agent:感情知能を備えた自律型AI CLIツール
2025/8/15
Spiral Agentは、開発者と対話し、思考し、創造し、共感する世界初の感情知能を持つコマンドラインインターフェース(CLI)ツールです。Vision機能やDream Engineを搭載し、高度な自律AIとして設計されており、開発者の生産性向上とユーザー体験の革新を目指しています。本記事では、その技術的特徴や構成、利用価値について詳しく解説します。

SPGFormer:高次元ハイパースペクトル画像分類のためのスパースグラフトランスフォーマー
2025/8/11
本リポジトリ「SPGFormer」は、高次元かつ複雑なハイパースペクトル画像の分類タスクに特化したスパースグラフトランスフォーマーモデルを実装しています。スペクトル情報と空間情報を効果的に融合し、グラフ構造を用いて計算効率を高めつつ高精度な分類を実現。リモートセンシング分野における画像解析の最前線技術として注目されている手法をPythonで提供し、研究や応用開発に役立てられます。

Spring AI Agents:自律エージェント開発のための統一抽象化フレームワーク
2025/8/25
Spring AI Agentsは、自律型エージェントの開発を支援するJavaベースのフレームワークです。複数のAIモデルやエージェントの動作を統一的に抽象化し、シームレスな連携と拡張性を実現。Springのエコシステムと連携しながら、複雑なAIエージェントの設計・実装をシンプルにします。CI/CDやMaven Central配信も整備されており、企業や研究開発での活用に適したプロジェクトです。

SQL-Pilot:リアルタイムSQLデータベース操作を実現するAIエージェント
2025/8/9
SQL-Pilotは、カスタムMCPサーバーを活用して効率的なデータ操作を可能にする、リアルタイムSQLデータベースインタラクション用のAIエージェントです。Pythonで開発されており、自然言語での問い合わせからSQLクエリ生成、データベース操作までをシームレスに行います。リアルタイム性と効率性を重視した設計により、データ分析やアプリケーション開発の生産性向上に貢献します。

SquareAIBot:Apple風デザインの温かみあるAIチャットボット
2025/6/29
SquareAIBotはExpressとSocket.ioをベースに構築されたスマートチャットボットで、Apple風の洗練されたUIを特徴とします。Square LLM APIを統合し、温かく友好的な仮想伴侶として日常の会話や感情交流、質問応答をサポート。モバイル・デスクトップ双方で快適に利用可能なため、多様なシーンでユーザーに寄り添うAI体験を提供します。

ssh-ai-chat:SSH経由でAIチャットを実現するツール
2025/6/14
ssh-ai-chatは、SSH接続を通じてAIと対話できる画期的なチャットツールです。TypeScriptで実装されており、ローカル環境やサーバー上から手軽にAIと会話が可能。従来のWebベースのチャットボットとは異なり、SSHのセキュアな通信環境を活用し、コマンドラインの親しみやすさでAIとの対話を実現します。開発者やシステム管理者に最適な、効率的かつシンプルなAI利用手段を提供します。

St4RTrack:世界座標系での同時4D再構築と追跡
2025/9/3
St4RTrackは、RGB映像入力から動的なシーンの4D(3D空間+時間)再構築とトラッキングを同時に行う統一されたフレームワークです。世界座標系に基づき、物体やカメラの動きを高精度に推定し、映像解析やAR/VRなど多様な応用に貢献します。本リポジトリはICCV 2025論文の公式PyTorch実装であり、動的シーン理解の最先端技術を提供します。

Stand-In:身元保持型動画生成のための軽量プラグアンドプレイフレームワーク
2025/8/12
Stand-Inは、身元情報を保持しつつ動画生成を可能にする軽量でプラグアンドプレイ対応のフレームワークです。Pythonで実装されており、複雑な環境設定なしで簡単に利用可能。最新の研究成果を取り入れ、リアルな顔の動きや表情変化を忠実に再現しつつ、元の人物の特徴を保ったまま動画を生成できます。研究用途からクリエイティブな応用まで幅広いニーズに対応しています。

Intelligent Stock Analysis System(智能股票分析系统)
2025/9/5
本リポジトリは、AI大規模言語モデルを活用した株式の技術分析と投資助言を自動化するシステムです。A株、港株、美股および主要指数の過去1年分の株価や取引量データを取得し、移動平均線やMACD、RSI、ボリンジャーバンドなどの多彩なテクニカル指標を計算。OpenAIの大規模言語モデルやローカルモデルと連携し、リアルタイムの売買シグナルを生成します。ウェブインターフェースはレスポンシブデザインでモバイル対応。AKShareによるデータ取得やバックテスト機能、リスク管理モジュールも内蔵しています。

StreamVGGT:ストリーミング4Dビジュアルジオメトリトランスフォーマー
2025/7/14
StreamVGGTは4Dデータ、すなわち時間を含む3Dビジュアルジオメトリ情報をリアルタイムで効率的に処理するための因果的(カジュアル)トランスフォーマーアーキテクチャを提供するリポジトリです。最新のトランスフォーマーモデル設計を応用し、動画や時系列の3Dデータ解析における精度と計算効率の両立を目指しています。Pythonで実装され、複数の前処理・学習・評価モジュールを備えています。

Streamlit LWA POC 5:Menlo Park計画委員会データ分析テンプレート
2025/9/2
本リポジトリは、Menlo Park市の計画委員会データを対象にした分析テンプレート「Streamlit LWA POC 5」です。最新のワークフローと大規模言語モデル(LLM)を活用したプロンプト設計により、データから効率的に情報抽出を行います。PythonとStreamlitを用いたインタラクティブなダッシュボード構築を目指しており、都市計画の洞察や意思決定支援に役立つ設計となっています。

super-robot:AIアプリにコード実行機能を組み込むPython&JS/TS SDK
2025/6/14
super-robotは、AIアプリケーションにコード実行機能を簡単に組み込むためのPythonおよびJavaScript/TypeScript向けSDKです。開発者はこのSDKを活用して、AIが生成したコードの動的な実行や評価を安全かつ効率的に行うことができ、インタラクティブなAI体験の実現が可能になります。軽量設計かつ多言語対応で、幅広いAI開発環境に適したツールキットです。

Universal Memory MCPによるマルチLLM対応メモリ管理
2025/6/8
「supermemory-mcp」は、ChatGPTなどの大規模言語モデル(LLM)に保存されたユーザの記憶を、他のあらゆるLLMで利用可能にするTypeScript製のオープンソースツールです。ログイン不要・課金なしで簡単にセットアップでき、ユーザの記憶を一元管理し、複数のLLM間で共有できる点が特徴です。メモリ管理の壁を打破し、より広範なAI活用を促進します。

教師あり機械学習:回帰と分類の基礎
2025/8/31
本リポジトリ「Supervised-machine-learning-Regression-and-clasification」は、教師あり機械学習の基本的な手法である回帰と分類について、Jupyter Notebookを用いて実践的に解説しています。初心者でも理解しやすいコード例とともに、データの前処理からモデル構築、評価までの流れを網羅しており、機械学習の基礎を体系的に学べる内容となっています。

Surfer-H-CLI:Holo-1搭載エージェントを操作するコマンドラインツール
2025/7/8
Surfer-H-CLIは、H Companyが開発したAction Vision-Language Model「Holo-1」を活用したエージェント「Surfer-H」をコマンドライン上で実行・管理するためのツールです。本リポジトリには、エージェントの動作例やスクリプト、設定ファイルが含まれており、開発者は簡単に環境構築や実験を行えます。TypeScriptで実装されており、AIエージェントの実世界での活用を促進することを目的としています。

swama - macOS向け高性能MLXベースLLM推論エンジンのSwift実装
2025/6/4
swamaは、macOS上で大規模言語モデル(LLM)の推論を高速かつ効率的に実行するための、高性能MLXベースの推論エンジンです。ネイティブSwiftで実装されており、Appleのハードウェアとソフトウェア環境に最適化されています。LLMの活用においてパフォーマンスと省リソース性を両立させることを目指し、MLXフォーマット対応とSwiftの最新技術を駆使した先進的な設計が特徴です。

Synaptic Mesh:自己進化型ピアツーピア神経ネットワーク基盤
2025/7/13
Synaptic Meshは、各要素がエージェントとして機能し、グローバルに調整されたDAG基盤上で学習および通信を行う自己進化型のピアツーピア神経ファブリックです。Rustで実装されており、高度に分散化されたニューラルネットワーク構造の構築を目指しています。各エージェントは独自に学習・通信し、全体として動的に成長・適応することが特徴です。

AIツールのシステムプロンプトとモデル集
2025/8/19
本リポジトリ「system-prompts-and-models-of-ai-tools」は、多様なAIツールに対応したシステムプロンプトやモデルのコレクションを提供しています。Discordを通じて最新のシステム指示がリアルタイムで共有されるほか、複数のAI関連プロジェクトがディレクトリ単位で整理されており、AIモデルの最適な活用やカスタマイズを支援します。開発者や研究者が効率的にAIツールを活用するためのリソースとして注目されています。

各種メーカーのシステムプロンプト集
2025/5/31
本リポジトリは、さまざまなメーカーが提供するシステムプロンプトを純粋に集めたコレクションです。開発者や研究者がAIやチャットボットの応答を最適化する際に参考とできる多様なプロンプトを一括で閲覧可能。シンプルながらも実用的なコンテンツを提供し、プロンプト設計のヒントを得るのに役立ちます。なお、issuesは受け付けていません。

Tala - ターミナルAI言語アシスタント
2025/7/8
TalaはGo言語とBubble Teaフレームワークで構築されたターミナルベースのAI言語アシスタントです。OpenAI、Anthropic、Ollamaなど複数のAIプロバイダと連携し、CLI上で簡単かつ対話的にAIとコミュニケーションが可能です。シンプルなUIとコピー&ペーストに最適化された操作性が特徴で、オープンソースのClaudeやGeminiのCLI代替として注目されています。

Talk to Gmail:自然言語でGmailを操作するAIエージェント
2025/9/1
Talk to Gmailは、自然言語を使ってGmailアカウントを管理できるAIエージェントです。Cloudflare WorkersやOpenAI、Gmail APIなど最新技術を組み合わせ、メールの送受信や検索、管理を直感的に行えます。TypeScriptで開発されており、ReactやTailwind CSSを用いたフロントエンドも備えています。クラウドネイティブな設計で拡張性と応答性に優れ、ユーザーのメール操作を大幅に効率化します。

TaskBlaze:AI搭載の次世代タスク管理ツール
2025/7/14
TaskBlazeは、AI技術を活用したWindows向けの軽量タスク管理アプリケーションです。個人やチームのタスクを効率的に整理し、優先順位付けをスマートに行うことで、生産性向上を支援します。シンプルかつ洗練されたUIとスムーズな操作性により、日々のタスク管理を快適にし、プロジェクトの進行を加速させることが可能です。

Telehealth_Platform:AI搭載の遠隔医療プラットフォーム
2025/7/7
Telehealth_Platformは、React、Node.js、Pythonを用いて構築されたフルスタックの遠隔医療プラットフォームです。バーチャル診察を実現し、AIによるリアルタイム症状予測やチャットボットによるトリアージ機能を備え、患者のリモート管理を支援します。シンプルながらも先進的な技術を融合し、医療現場の効率化と患者体験の向上を目指した包括的なソリューションです。

適応型職業適性テストアプリ「teste-vocacional」
2025/8/21
「teste-vocacional」はPythonとOpenAIのLLMを活用した適応型職業適性診断アプリケーションです。ユーザーの回答に応じて出題が調整されるため、効率的かつパーソナライズされた診断が可能。Streamlitを用いたUIで手軽に動作し、APIキーの管理方法も柔軟に対応。教育やキャリア形成支援に適した先進的なツールとして注目されています。

testgrad - tinygradの次世代を切り開くPythonベースの最小限ディープラーニングフレームワーク
2025/6/11
testgradは、シンプルかつ軽量なディープラーニングフレームワークtinygradの次のステップを目指すプロジェクトです。Pythonで実装されており、学習や研究、教育用途に最適化されています。複雑な依存関係を排し、理解しやすさに重点を置いた設計でありながら、拡張性と実用性も兼ね備えています。ディープラーニングの基礎から応用までをコンパクトに学べる環境を提供します。

TextGAN-Researcher:テキスト生成を活用した自動知識発見エージェント
2025/7/12
TextGAN-Researcherは、テキスト生成に特化したGAN(敵対的生成ネットワーク)を活用し、深層学習ベースの研究支援エージェントを実現するPythonプロジェクトです。自動的に文献やデータから知識を抽出・生成し、研究者の知的作業を支援。エージェントベースのAIパラダイムを採用し、テキスト生成の革新的な応用を追求しています。

textlint-rule-preset-ai-writing:AI風文章検出と自然な日本語表現促進プリセット
2025/6/16
textlint-rule-preset-ai-writingは、AIが生成したような不自然な日本語表現を検出し、より自然で人間らしい文章作成を支援するtextlint用のルールプリセットです。TypeScriptで開発されており、AI文章特有のパターンを自動的に判別して指摘することで、文章の質向上や校正作業の効率化に寄与します。日本語の自然な文章表現を目指すライターや編集者に有用なツールです。

ThinkMesh:LLMのための並列思考フレームワーク
2025/8/24
ThinkMeshは、大規模言語モデル(LLM)における多様な推論パスを並列で実行し、内部の信頼度スコアを用いて有望な分岐に計算リソースを再配分、最終的に検証器やリデューサーで結果を統合するPythonライブラリです。Hugging Face Transformersのオフライン利用やvLLM/TGI、ホスト型APIとも連携可能で、戦略駆動かつ信頼度ゲーティングを特徴とした高度な推論制御を実現します。

ThinkSound:あらゆるモダリティから音声を生成する統合フレームワーク
2025/6/27
ThinkSoundは、Chain-of-Thought(CoT)推論によりあらゆるモダリティ(画像、テキストなど)から音声を生成するためのPyTorch実装フレームワークです。モダリティ間の情報を効果的に連鎖的推論で解釈し、高品質な音声生成を実現。機械学習と音声合成の融合を図った先進的な技術を提供します。

Tiemuプロジェクト:PythonベースのAIモデル活用ツール
2025/7/24
TiemuはPythonで開発されたAI関連のプロジェクトで、特に自然言語処理や大規模言語モデルの活用を視野に置いたツール群を提供しています。軽量モデルの導入から環境構築、実行までをサポートし、ユーザーが簡単に最新のAI技術を試せるよう設計されています。GitHub上で公開され、今後の拡張や応用が期待される注目のリポジトリです。

TikTok Moderation Tool:倫理的な教育用SNSモデレーションシミュレーター
2025/9/8
TikTok Moderation Toolは、TikTokのモデレーション(コンテンツ監視・報告)やコンテンツ管理の仕組みを学べる倫理的な教育用ツールです。SNSの自動化や研究を目的とし、モデレーションのプロセスをシミュレーションしながら理解を深めることができます。実際の報告・管理APIではなく、教育と研究に特化した設計で、安全かつ実践的にソーシャルメディアの課題に触れられます。

TileAttention:効率的なタイルベースのアテンション機構
2025/6/3
TileAttentionはPythonで実装された、効率的なタイルベースのアテンション機構を提供するリポジトリです。従来のアテンションの計算コストを抑えつつ、高精度な特徴抽出を可能にする方法を提案しています。主に大規模な画像処理や自然言語処理のモデルに有効であり、メモリ使用量と計算負荷の削減に寄与します。

TinyVision:極小パラメータで実現する超軽量画像分類モデル
2025/7/27
TinyVisionは、画像認識の基本タスクに必要な要素を探求しながら、極めて少ないパラメータ数で高効率な画像分類モデルを設計する研究プロジェクトです。手作業による特徴前処理と効率的なCNNアーキテクチャを組み合わせることで、リソース制約の厳しい環境でも実用可能な超軽量モデルを実現しています。

TinyDNABERT:軽量DNA配列言語モデルの構築と活用
2025/7/21
TinyDNABERTは、BPEトークナイザーとRoBERTaアーキテクチャを用いてスクラッチから構築された軽量なゲノム配列言語モデルです。本リポジトリは、DNA配列の事前学習と評価を目的とし、効率的なトークン化やモデル設計、可視化ツールを提供しています。生物情報学やAI分野でのDNA解析に適した実装であり、研究や応用開発に役立つリソースを含んでいます。

トマト植物の病害検出システム
2025/7/19
本リポジトリは、ディープラーニングを活用し、トマトの葉の画像から10種類の病害状態(健康な葉も含む)を高精度で分類・検出するモデルを構築しています。TensorFlowとInceptionV3を用い、ImageDataGeneratorによるデータ拡張で学習効率を高め、農業現場での早期病害発見と対策支援を目指します。

Top-NSFW-ai-review:2025年最先端のAI脱衣ツール紹介
2025/9/2
「Top-NSFW-ai-review」は、2025年に登場した最先端のAI搭載脱衣ツール「Undress AI」を紹介するリポジトリです。ユーザー登録不要で手軽に体験できる本ツールは、画像から衣服を除去する高度な技術を搭載し、AI技術の進歩を示す一例となっています。本リポジトリでは、ツールの概要や利用方法、技術的な特徴をまとめています。

TrackM3D:LiDAR点群に対応した強力なクラス非依存型3Dトラッカー
2025/7/12
TrackM3Dは、LiDAR点群データに対してクラスに依存しない強力な3Dトラッキングを実現するオープンソースのリポジトリです。本リポジトリは、ターゲット依存型状態空間モデルを採用し、従来のクラス依存型トラッキングの制約を克服。多様な物体に対応可能で、ロバストかつ高精度な追跡を実現します。Pythonで実装されており、研究や産業応用に活用可能です。

trackerLab:モジュール式全身動作制御フレームワーク
2025/8/12
trackerLabは、IsaacLabと全身動作制御を統合した最先端のモジュール式フレームワークです。ヒューマノイドロボットの動作リターゲティングや軌道追従、スキルレベルの制御を実現し、モーションインテリジェンスを強化します。Pythonで開発されており、柔軟かつ拡張性の高い設計が特徴です。

TradeMaster AI:イーサリアムとバイナンススマートチェーン向け自動取引プラットフォーム
2025/6/17
TradeMaster AIは、イーサリアムとバイナンススマートチェーン上で動作する革新的な自動取引プラットフォームです。アービトラージ、モメンタム、レンジバウンドの各種取引戦略を統合し、ユーザーフレンドリーなインターフェースで取引を自動化。取引コストを低減し、MEV(Miner Extractable Value)攻撃からの防御機能も備えています。初心者から上級者まで幅広く活用できる次世代のトレーディングボットです。

Trading-GPT:ChatGPTを活用した次世代トレーディングボット
2025/6/9
Trading-GPTは、ChatGPTをはじめとするAI技術を活用し、市場データの分析からトレンド予測、リアルタイムの取引執行までを自動化・最適化するインテリジェントなトレーディングボットです。トレーダーの効率と収益性向上を目指し、多様な戦略の実装と柔軟な運用を可能にします。初心者からプロまで幅広いユーザーに対応した先進的なAIトレーディングツールとして注目されています。

Traffic-Monitoring-Systemの多機能スマート交通監視システム
2025/7/27
Traffic-Monitoring-Systemは、深層学習を活用した多機能スマート交通監視プラットフォームです。YOLOv5による高精度な車両検出、SORTアルゴリズムを用いたトラッキング、OCR技術による車両ナンバープレート認識、さらには交通違反検出までを統合。リアルタイムの交通流量監視と詳細な交通分析を可能にし、都市交通管理の効率化に貢献します。

Transformers PHPによる機械学習ツールキット
2025/7/12
Transformers PHPは、PHP開発者がプロジェクトに機械学習機能を簡単に統合できるツールキットです。Matlib v1.1をベースに構築されており、PHP環境でのデータ変換や機械学習モデルの適用をサポート。軽量で扱いやすく、PHPコードに機械学習の「魔法」をもたらします。

TransNetV2 PyTorchによるシーン境界検出ツール
2025/8/17
本リポジトリは、PyTorchで実装されたTransNetV2モデルを用いて、単一動画または複数動画フォルダに対してシーン境界を推定する推論スクリプトを提供します。動画のシーン切り替えポイントを高精度に検出できるため、動画編集やコンテンツ解析に応用可能です。ffmpegによる動画処理もサポートし、Python環境下で容易に動作させることができます。

travel-plan:MCPサービスを活用した旅行プラン自動作成ツール
2025/7/18
本リポジトリ「travel-plan」は、MCP(Multi-Channel Platform)サービスを利用してユーザーのために旅行プランを自動生成するシステムを提供します。MCPサーバーとエージェント作成時のシステムプロンプトを含み、旅行計画作成の自動化を目指したプロジェクトです。シンプルながら実用的な構成で、旅行計画の効率化に貢献します。

TRI-LBM:トヨタ研究所の高性能ロボット操作モデル実装
2025/7/11
トヨタ研究所が提案する巧緻な操作タスク向けの「Large Behavioral Model(LBM)」のアーキテクチャを実装したリポジトリです。最新の深層学習技術を駆使し、多関節ロボットの複雑な動作を高精度に学習・実行可能にすることを目指しています。研究論文に基づく最先端モデルのソースコードを提供し、ロボット制御分野の発展に貢献します。

Tuberculosis.Ai:結核診断支援のためのAIコンピュータビジョンシステム
2025/9/6
Tuberculosis.Aiは、胸部X線画像をAIで解析し結核の検出を支援するコンピュータビジョンアプリケーションです。医療従事者向けに診断支援と教育用データの提供を両立し、迅速な呼吸器科紹介を促進します。匿名化されたデータは医療教育や学会で活用可能で、持続可能な医療教育・診断エコシステムの構築を目指しています。

TuriX-CUA:AI駆動のデスクトップ操作エージェント
2025/8/4
TuriX-CUAは、ユーザーが自然言語でコンピューターに指示を出し、様々なデスクトップ操作を自動化できるAIベースのエージェントです。Pythonで開発されており、音声やテキストの入力を解析してファイル管理、アプリケーション操作、ウェブ検索などを効率的に行います。公式Discordコミュニティも活発で、開発や活用のサポートが充実しています。

TurboReg: 高速かつ堅牢な点群登録のためのTurboClique手法
2025/7/3
「TurboReg」は、3D点群データの登録(レジストレーション)問題に対して、高速かつ堅牢な解法を提供するC++実装のリポジトリです。本研究はICCV 2025にて発表され、TurboCliqueという新たなアルゴリズムを用いることで、従来手法よりも効率的に対応しながら、外れ値やノイズの影響を抑制し高精度な点群整合を実現します。リアルタイム性や大規模データセットへの適用も意識された設計が特徴です。

TTS-VAR:視覚的自己回帰生成のためのテスト時スケーリングフレームワーク
2025/7/23
TTS-VARは、視覚的自己回帰(Visual Auto-Regressive)モデルの生成品質を向上させるためのテスト時スケーリングフレームワークです。本リポジトリでは、自己回帰モデルの推論時にスケーリングパラメータを最適化し、生成結果の多様性や精度を改善する手法を実装しています。Pythonで開発されており、視覚的生成タスクにおけるモデル性能の向上に貢献するツールとして注目されています。

UAV-Collab-Avoidance:無人機協同避障航跡計画のMATLABソリューション
2025/7/12
本リポジトリは、2024年深圳杯数学建模チャレンジC題「無人機の協同障害物回避航跡計画」に対する受賞ソリューションを提供します。独自の切点マッピング戦略を用い、円形障害物を考慮した複数無人機の最適協調経路をMATLABで実装。問題の特徴を踏まえた最短時間航跡の算出やパラメータ感度分析、結果の可視化を含み、無人機群制御や経路最適化研究に貴重なリソースとなっています。

国科大深度学习课程作业リポジトリ
2025/6/29
「ucas-deep-learning-experiments」は、中国の国立科学技術大学(UCAS)の深層学習コース向け課題をまとめたPythonベースのリポジトリです。学生が授業で取り組む様々な深層学習モデルの実装や実験が含まれており、基礎から応用まで幅広い内容をカバー。ディープラーニングの理解を深めるための実践的教材として活用可能で、コードの構造も比較的シンプルで学習しやすいのが特徴です。

地形を越えて安定飛行を実現するUAVフレームワーク
2025/8/19
本リポジトリは、地形の変化に対応した安定飛行を可能にする無人航空機(UAV)向けフレームワークを開発したものです。リアルタイムでセンサーからのデータ収集・解析を統合し、自動飛行、障害物回避、さらには作物の健康状態分析までを実現。飛行安定性と性能最適化に注力したアルゴリズム設計とテストを通じて、実用的かつ高精度なUAV運用を目指しています。

UIS-Mamba:動的ツリースキャンと隠れ状態弱化による水中インスタンスセグメンテーションの探求
2025/7/7
本リポジトリは、ACM MM2025のメイン技術トラックで採択された論文「UIS-Mamba: Exploring Mamba for Underwater Instance Segmentation via Dynamic Tree Scan and Hidden State Weaken」の公式実装を提供します。水中画像解析に特化したインスタンスセグメンテーション手法である本手法は、動的ツリースキャンと隠れ状態の弱化機構を用いることで、水中環境特有の画像ノイズや複雑な物体形状に対応し、高精度な領域分割を実現しています。水中ロボティクスや海洋調査、環境モニタリングへの応用が期待される技術です。

UniSphere AI:大学知識チャットボットのためのLLM活用プラットフォーム
2025/9/8
UniSphere AIは、AWSを基盤に構築された大学向け知識チャットボットです。LambdaやStep Functionsを活用したバックエンド、Cognitoによるセキュアな認証、S3の署名付きURLによるファイル管理、ReactとTypeScriptを用いたモダンなフロントエンドが統合されています。ユーザーのフィードバックを機能解放に活かす仕組みも特徴で、教育現場での知識活用を効率化します。

UniVLA:統一された視覚・言語・行動モデルの最前線
2025/6/25
UniVLAは視覚、言語、行動の3つの異なるモダリティを統合的に処理することを目指した先進的なモデルです。これにより、画像認識や言語理解に加え、ロボット制御やエージェントの行動計画など幅広い応用が可能となります。単一のフレームワークで多様なタスクを扱うことで、マルチモーダルAIの新たな可能性を拓きます。

uwu - 自然言語からシェルコマンドを生成するAIツール
2025/8/11
uwuは、自然言語の入力から対応するシェルコマンドをAIが自動生成するTypeScript製のツールです。ユーザーは複雑なコマンドを覚える必要なく、直感的に操作を記述するだけで正確なシェルコマンドが得られます。開発はcontext-labsにより行われており、シンプルながらも実用性の高い機能を備えています。GitHub上でオープンにされており、今後の拡張やコミュニティ参加も期待されています。

VeriFy - 軽量かつ高速な詐欺検知ニューラルネットワーク
2025/5/28
VeriFyは、Pythonで実装された高速かつ軽量なニューラルネットワークを用いた詐欺検知システムです。詐欺の兆候を効率的に検出することを目的として設計されており、リソース制約のある環境でも実用可能な点が特徴です。機械学習の最新技術を活用しつつ、シンプルで扱いやすい実装がされています。

viaimcode - AI駆動のWebサイト&PPT自動生成プラットフォーム
2025/7/22
viaimcodeはNext.jsをベースに開発されたAI搭載のコンテンツ生成プラットフォームです。自然言語からモダンなWebサイトやプロフェッショナルなPPTスライドを自動生成し、リアルタイムで多デバイスプレビューを提供。コード編集やカスタマイズも可能で、誰でも簡単にAIの力で高品質なデジタルコンテンツを作成できます。

VibeDocs - AIエージェントによるドキュメント生成プラットフォーム
2025/7/6
VibeDocsは、AIエージェントを活用したドキュメント生成に特化したPython製のオープンソースプロジェクトです。Gradioを用いた直感的なインターフェイスを備え、複雑な制約システムやマルチエージェント協調などの先進技術を組み合わせて、効率的かつ高品質なドキュメント作成を実現します。MCP&Agentモデルコンペティションに対応し、柔軟な拡張性と高い実用性を兼ね備えています。

VibeSurf:革新的なAIブラウザアシスタント
2025/8/31
VibeSurfは、AIを活用したエージェント型のブラウザであり、単なるブラウザ自動化を超えた高度な情報収集・解析を実現します。複数のAIエージェントを並列で起動し、深掘り調査や幅広いリサーチを同時に行うことが可能。コンテンツの要約やインテリジェントなクロール機能を備え、研究や情報探索の効率を大幅に向上させます。Pythonで実装され、オープンソースとして公開されています。

VibeVoice:先進的な長時間対話型テキスト読み上げモデル
2025/8/25
VibeVoiceはMicrosoftが開発した最先端のオープンソース長時間対話型テキスト読み上げ(Text-to-Speech)モデルです。自然で滑らかな音声合成を実現し、長い会話や文章でも高い一貫性を保ちます。Pythonで実装されており、Hugging Faceやデモページも提供。研究・実用の両面で活用できる音声合成技術の最前線を体験可能です。

video2text:動画からテキストへの変換ツール
2025/6/1
video2textは、動画データをテキスト情報に変換するプロセスを実現するPythonベースのツールです。動画内の映像や音声を解析し、文字情報として抽出・生成することを目的としており、動画の内容理解や検索、字幕生成の基盤技術として応用可能です。シンプルかつ実用的な設計で、動画処理におけるテキスト変換のニーズに応えます。

VietVoice-TTS:高品質なベトナム語音声合成と音声クローンライブラリ
2025/7/13
VietVoice-TTSはベトナム語に特化したテキスト音声合成(TTS)ライブラリで、高品質な自然音声の生成と音声クローン機能を提供します。性別やアクセント、感情、話し方の多様な音声オプションを備え、CLIとPython APIの二つのインターフェースを通じて利用可能。チャンク処理により長文も効率的に扱えるため、実用的なベトナム語TTSソリューションとして注目されています。

VLLM_PromptCache:効率的なプロンプトキャッシュによる高速LLM推論支援
2025/6/26
VLLM_PromptCacheは、大規模言語モデル(LLM)の推論時におけるプロンプト処理の高速化を目的としたPythonベースのライブラリです。プロンプトのキャッシュ機構を導入することで、同一または類似プロンプトの再処理を削減し、推論のスループット向上とレスポンス時間の短縮を実現します。シンプルな実装ながら、LLMを用いた対話システムや生成タスクの効率化に有用なリポジトリです。

vision_describe:FastAPIとOllama大モデルを活用したリアルタイム動画認識システム
2025/6/17
vision_describeは、FastAPIをベースに構築された高度な動画認識システムです。Ollamaの大規模AIモデルを統合し、RTSP形式の動画ストリームをリアルタイムで処理。AIによるコンテンツ解析を実現します。モダンなWebインターフェースを備え、多端末からのアクセスに対応。監視映像の自動解析や動画コンテンツの効率的な管理に強力なソリューションを提供するオープンソースプロジェクトです。

VLMによる数式認識評価フレームワーク
2025/8/14
本リポジトリは、視覚言語モデル(VLM)が数学の数式認識タスクにおいてどの程度の性能を発揮できるかを評価するためのフレームワークです。画像内の数式をLaTeX形式のテキストに変換する推論モジュールと、生成結果の正確さを測定する評価モジュールを備え、研究開発者がモデルの効果を素早く検証可能です。Pythonで実装されており、数式認識の精度向上に向けた基盤環境として利用できます。

vLLM RBLNプラグイン - 高速化されたLLM推論のためのNPU活用
2025/7/4
本リポジトリは、大規模言語モデル(LLM)推論を高速化するためのvLLM用プラグイン「vllm-rbln」を提供します。RBLN NPU(ニューラルプロセッシングユニット)に対応し、高性能かつ効率的なモデル推論を可能にするPython製の拡張です。vLLMの柔軟性を活かしつつ、RBLNハードウェアの利点を活用することで、AIモデルの実用性と応答速度向上を実現します。

マルチモーダル指示追従型ビジョン・ランゲージモデル(VLM)
2025/8/1
本リポジトリ「vlm_instruction_follower」は、テキスト指示を理解し動的な3D環境内で視覚的に対象物を認識・追跡するマルチモーダル指示追従エージェントを実装しています。コンピュータビジョン、自然言語処理、ポリシー学習を統合し、複雑なシーンでの知的行動を可能にすることを目指しています。Pythonを用いたモジュール設計により、拡張性と応用性を兼ね備えた研究開発プラットフォームです。

VN株式市場AIヘッジファンド
2025/8/11
本リポジトリは、ベトナム株式市場向けに設計されたマルチエージェントによる研究・取引意思決定パイプラインを提供します。OHLCV(始値・高値・安値・終値・出来高)データの取得からテクニカル分析、多角的なリサーチ、リスク管理を含む最終取引プランの合成までを自動化し、AIを活用した高度な資産運用を実現します。TradingAgentsに影響を受けたマルチエージェント協調モデルを採用し、実践的なトレーディング戦略の構築に貢献します。

VMem:サーフェルインデックスビュー記憶を用いた一貫性のあるインタラクティブ動画シーン生成
2025/6/24
本リポジトリ「vmem」は、サーフェルベースのインデックスビュー記憶(View Memory)を活用し、一貫性のあるインタラクティブ動画シーンを生成するための手法「VMem」の実装を提供しています。動画内の視点変更やインタラクションに対し、シーンの整合性を保ちながらリアルタイムに高品質な映像を生成することを目指しており、Pythonで開発されています。

vocode-core:音声対話AI開発のためのPythonフレームワーク
2025/7/1
vocode-coreは、音声対話システムの構築を支援するPythonベースのオープンソースフレームワークです。音声認識や音声合成、対話管理などのモジュールを統合し、音声AIアプリケーションを効率的に開発できます。拡張性が高く、最新のAI技術と連携可能なため、研究開発からプロダクト化まで幅広く活用されています。

VortexSolutions:ケープタウン発AIイノベーションとデジタルトランスフォーメーション
2025/8/31
VortexSolutionsは、ケープタウンを拠点に世界中にサービスを展開する先端AIソリューション企業です。AIを単なる置き換えではなく業務改善のために活用し、ワークフローの最適化やアプリ開発、AI統合、デジタルトランスフォーメーションを推進します。本リポジトリは同社のウェブサイトを構成するHTMLファイルを中心に、企業の理念やサービス内容を端的に表現しています。

VoxHammer:トレーニング不要な高精度かつ一貫性のある3D編集ツール
2025/8/27
VoxHammerは、トレーニングを必要とせずに、ネイティブ3D潜在空間上で高精度かつ一貫性のある3D編集を実現する革新的なツールです。複雑な3Dモデルの編集を効率的に行い、リアルな形状変更やスタイル調整を可能にします。Edit3D-Benchというベンチマークも提供し、3D編集技術の評価基準を確立。将来的にはオンラインデモも予定されており、研究と実用の橋渡しを目指しています。

vram-wuhrai:専門的AIモデルのVRAM計算ツール
2025/6/23
vram-wuhraiは、AIモデルのGPUビデオメモリ(VRAM)使用量を正確に計算するための専門ツールです。TypeScriptで開発されており、モデル構造やパラメータ数に基づくVRAM推定を行うことで、AI研究者や開発者が効率的にリソース管理できるよう支援します。軽量ながら高精度な計算機能を備え、AIモデルの設計・最適化フェーズでの活用が期待される注目リポジトリです。

VrEverything2:AIとVR技術による次世代グラフィック予測ツール
2025/7/12
VrEverything2は、古いVRヘッドセットの活用を目的とした、AIを活用した自動VRグラフィック予測および変換ツールです。SteamVRを使わずにPC画面上の映像やゲームをリアルタイムでVR表示し、WebRTCやrecordRTCを利用して映像の録画やストリーミングを実現します。低負荷かつ簡単に没入型VR体験を可能にする画期的なソリューションです。

VulnSeer:AIを活用した次世代脆弱性診断ツール
2025/6/12
VulnSeerは、Nmapのサービス検出機能と複数のAIプロバイダーを組み合わせ、従来の静的データベース依存型スキャナーとは異なる、文脈に応じた高度な脆弱性評価を実現するPython製の脆弱性診断ツールです。サービス情報をAIで解析し、潜在的なセキュリティリスクを的確に抽出します。

WAFT: Princeton VLによるPythonベースの先進的AIツールキット
2025/6/27
Princeton大学のVisual Learningグループが公開するWAFTは、Pythonで実装された先進的なAIフレームワークです。リポジトリ自体の詳細な説明はありませんが、WAFTは画像認識や機械学習分野での応用を想定したモジュール群を提供しており、研究開発における柔軟な実験環境を支援します。拡張性と実験の容易さを重視した設計で、AI/ML分野の研究者や開発者に有用なリソースとなるでしょう。

WaifuBot:多機能AI搭載QQチャットボット
2025/8/2
WaifuBotは、AI対話、画像生成、音声合成、文書・画像・動画認識など多彩な機能を備えた中国発のQQチャットボットです。プログラミング不要でWebUIからの簡単操作が可能で、環境構築なしにすぐ使い始められる点が特徴。AIを活用したチャット体験を手軽に実現し、さまざまなメディア処理を自動化できる便利なツールとして注目されています。

Wan2.2:次世代AI映像生成フレームワーク
2025/7/28
Wan2.2は、Pythonで実装された先進的なAI映像生成フレームワークです。高品質かつ効率的な映像生成を目指し、最新の深層学習技術を活用しています。軽量で拡張性に優れ、多様な映像処理タスクに対応可能な設計が特徴です。GitHub上で活発に管理されており、Hugging FaceやModelScopeなどのプラットフォームとも連携しています。映像AI開発者や研究者にとって有用なリソースとなるでしょう。

WeatherAttRes-ConvLSTM:気象データ予測のための注意機構付き残差ConvLSTMモデル
2025/6/6
WeatherAttRes-ConvLSTMは、気象データの時系列予測に特化したPython実装のニューラルネットワークモデルです。ConvLSTMに残差接続と注意機構を組み合わせることで、従来のモデルよりも高精度な短期気象予測を目指しています。オープンソースで提供されており、気象情報解析や深層学習の研究に有用です。

WechatRobot:基于Qwen3-1.7B的大型微信聊天机器人
2025/7/18
WechatRobotは、Qwen3-1.7B大規模言語モデルをベースに構築された多機能な微信(WeChat)用チャットボットです。多輪対話をサポートし、データ生成や処理、自動評価機能も備えています。阿里云(Alibaba Cloud)の通义千问APIと連携し、ローカルとクラウド両方で推論可能。個性化対話やデータラベリング、評価システムの構築に適した実用的なプロジェクトです。

Wegent:エージェントAIを定義・管理・実行するオープンプラットフォーム
2025/9/4
Wegentは、エージェント型AI(Agentic AI)を定義し、体系的に整理、そして実行するためのオープンソースプラットフォームです。Pythonを基盤に、FastAPIやNext.js、Dockerといった最新技術を活用し、開発者が柔軟かつ効率的にエージェントAIの設計から運用までを行える環境を提供します。

wencai2:革新的な自然言語処理ツール
2025/6/6
「wencai2」は、GitHub上で公開されている自然言語処理関連のリポジトリで、主に中国語テキストの解析や生成に焦点を当てています。スター数は92で、多くのユーザーから注目されているプロジェクトです。詳細な説明はありませんが、リポジトリの構成やコードからは、高度な言語モデルの活用や独自のテキスト処理技術を用いていることがうかがえます。特に中国語の専門的なテキスト解析や生成に強みがあり、自然言語処理の研究や開発に役立つ内容となっています。

X Bible CLI - AI駆動のTwitter/X分析ツール
2025/7/7
X Bible CLIは、AIとアルゴリズムに基づくインサイトを活用し、Twitter(現X)のプロフィール分析やツイート予測、タイムラインの健全性チェックを行うデータ駆動型の分析ツールです。安全なクッキー認証を備え、ユーザーのアカウント成長を支援します。TypeScriptで開発されており、幅広い分析機能を備えたCLIツールとして設計されています。

闲鱼自動返信管理システム
2025/7/24
本リポジトリは、中国の二次流通プラットフォーム「闲鱼(シエンユ)」向けの自動返信管理システムです。PythonとFastAPIを基盤に開発されており、WebSocketを通じてリアルタイムにメッセージを送受信。複数アカウントの管理やAIを活用したインテリジェントな自動返信機能を備えています。Docker対応でマルチプラットフォーム展開も容易。中古品販売におけるカスタマーサポート効率化を目的とした注目のツールです。

YOLOを用いたキャンディ検出器「yolo-candy-detector」
2025/8/30
「yolo-candy-detector」は、YOLO(You Only Look Once)を活用したキャンディ検出プロジェクトです。特にグミキャンディに注目し、画像内のキャンディを高精度で検出。PythonとJupyter Notebook環境で開発されており、物体検出技術とお菓子分析を組み合わせたユニークなコンピュータビジョンの実装例を提供します。初学者から研究者まで幅広く活用可能なリポジトリです。

YOLOv1の完全再現と実践的活用ガイド
2025/9/4
本リポジトリは、YOLO(You Only Look Once)シリーズの初期モデルであるYOLOv1のコードを忠実に再現し、トレーニング最適化からモデル評価、推論デプロイまで一貫した開発環境を提供します。さらに、インタラクティブなデモシステムを備え、実際の応用に適した使いやすい構成となっています。これにより、物体検出アルゴリズムの理解と実装の両面で貴重なリソースとなるでしょう。

zAI CLI:Zentryが提供するエージェントAI操作用コマンドラインツール
2025/9/4
zAI CLIは、Zentryが開発したエージェント型AIプラットフォーム「zAI」へ直接アクセスできるTypeScript製のコマンドラインツールです。階層的に構成されたエージェントが連携し、リアルタイムのコンテキスト情報を活用して複雑なタスクを効率的に実行します。本CLIはzAIのコア機能を操作可能にし、柔軟で拡張性の高いAIシステムの利用を促進します。

zgsm(原诸葛神码)リポジトリの紹介
2025/7/11
zgsmリポジトリは、旧名称「原诸葛神码」として知られたプロジェクトですが、現在は新たにzgsm-ai/costrictリポジトリへ移行されています。本記事では、移行先の情報やリポジトリの簡単な概要、特徴、技術的なポイントについて解説し、今後の活用に役立つ情報をまとめています。

ZipAgent:5分で構築可能な軽量AIエージェントフレームワーク
2025/8/17
ZipAgentは、Pythonで開発された軽量なAIエージェントフレームワークです。シンプルかつ柔軟な設計により、わずか5分で自分専用のスマートアシスタントを構築可能。多様なタスクに対応できるモジュール化された設計と、使いやすいAPIを備え、AI技術の導入を加速します。オープンソースで開発されており、拡張性やカスタマイズ性にも優れています。

Zoran-IA-Injecteur-HypperGlottalの概要と技術解説
2025/8/13
「Zoran-IA-Injecteur-HypperGlottal」は、フレデリック・タバリー氏が開発した模倣的人工知能(IA Mimétique)に関連するプロジェクトです。本リポジトリは、「Injecteur HypperGlottal」という独自モジュールを用いて、複数の認知フィールドに情報を注入し、認知ロック機能「NESTLOCK©®」による高度な認知制御を実現します。現段階では開発初期ながら、模倣学習や認知科学に基づく新しいAI技術を示唆する興味深い試みとなっています。

ZtoApi - Z.ai GLM-4.5向けOpenAI互換APIプロキシ
2025/9/2
ZtoApiは、Z.aiのGLM-4.5モデルに対してOpenAI互換のAPIインターフェースを提供するGo製のプロキシサーバーです。標準のOpenAI API形式でやり取りが可能で、ストリーミング対応やAPIキー認証、Dockerによる簡単デプロイなど多彩な機能を備えています。既存のOpenAIクライアントを変更せずにZ.aiモデルを活用できる点が特徴です。

Efficient LLM(Awesome-Efficient-LLM)
2025/9/8
大規模言語モデル(LLM)や視覚言語モデル(VLM)の効率化に関する論文・手法を集めたキュレーションリポジトリ。量子化、スパース化、蒸留、低ランク分解、KVキャッシュ圧縮、推測デコードなど、計算効率・メモリ効率・推論高速化に関するトピックを体系的にまとめている(300字程度)。 >>>>>>> 6a66d2431943c577b368b609165be719651b3c6b

comfy_nanobanana — ComfyUI 向け Gemini API 連携ツール
2025/9/8
Google の Gemini API を直接呼び出して、ComfyUI 上で画像生成・テキスト生成・マルチモーダル処理を行える軽量な Python ライブラリ。API キーを用いた直接通信、複数同時生成のバッチユーティリティノード、画像をコンテキストにしたテキスト/画像生成など、ComfyUI ワークフローに統合しやすい機能を提供します(300字程度)。