AI/ML
致理上課用 LangChain リポジトリの紹介
2025/8/30
本リポジトリ「__2025_08_30__chihlee_langchain__」は、致理技術学院の授業で使用されるLangChainに関する教材および参考資料をまとめたものです。LangChainはAI言語モデルを活用したアプリケーション開発のためのフレームワークであり、本リポジトリでは授業用リンクや基礎的なコード構成を提供しています。学習者が実践的にLangChainを理解し、活用できるように設計された内容となっています。
__2025_09_15_tvdi__ — 職能發展學院 11408 Python 機器學習(2025/09)
2025/9/15
職能發展學院の「11408 Python 機器學習」コース向けに作られたシンプルな教材リポジトリです。Jupyter Notebook 形式のレッスン資料が中心で、基礎的な機械学習の概念やコード例を学習・実習できる構成になっています。学習用サンプルや演習ノートを通じて、Pythonによるデータ処理・モデル構築の初歩を手を動かして学べることを目的としたリポジトリです(教育用途、ローカル実行向け)。
スマート顔認識勤怠管理システム
2025/7/12
本リポジトリはPythonとFlaskを用いて開発されたリアルタイム顔認識勤怠システムです。カメラ映像から自動で顔を検出し、出勤・退勤時刻を記録、滞在時間を計算します。職場や教室、会議室など多様な環境に対応し、顔登録や管理、勤怠データの統計・可視化、JSON形式でのエクスポート機能を備えています。最新の顔認識技術を活用し、手軽かつ正確な勤怠管理を実現します。
A*(Aスター)アルゴリズムのPython実装
2025/10/19
A*(Aスター)経路探索アルゴリズムをPythonで実装したリポジトリ。グリッドやグラフ上で最短経路を探索するための基本的な実装、ビジュアライゼーション用の画像リソースやセルウィジェットなどの補助コードが含まれ、教育用途や小規模な実験に適した構成になっています。使い方やサンプル画像をREADMEで確認できます(約300字)。
MCPをClaude Skillに変換するコンバータ
2025/10/26
MCPサーバー(複数ツール定義を持つサーバー)を、Claude向けの「Skill」に変換してコンテキスト消費を約90%削減するためのツール。起動時には最小限のメタデータのみを渡し、実際にツールが必要になった時点でそのツール定義を逐次開示する「プログレッシブ・ディスクロージャ」パターンを適用することで、トークン使用量を大幅に節約します。Python実装で、MCP定義の例ファイルを含み、汎用の変換スクリプトで既存のMCPサーバーをClaude Skillとして使える形に整形します。
-NfW-ai-vids:最高のAI動画ジェネレーター
2025/9/2
「-NfW-ai-vids」は、革新的なAI技術を活用した動画生成ツールのリポジトリです。わずか数コミットながら、AIを用いて高品質な動画を自動生成することを目指しており、動画制作の効率化とクリエイティブな表現の可能性を広げます。本リポジトリはシンプルな構成ながら、今後の発展が期待される注目のプロジェクトです。
YDP2025:すべてのAIの背後にあるデータの物語
2025/10/11
このリポジトリは「Behind Every AI — The Story of Data」を主題にした教材的リソースで、データサイエンスとAIの基礎を扱うJupyter Notebookを中心に構成されています。ワークショップや学習会向けに、Pythonの基本からデータ処理・可視化・簡単なモデリングまでを実践的に学べる内容が想定され、依存パッケージはrequirements.txtで管理されています。学習ログやエージェント記録を格納するディレクトリも含まれ、教育用途や再現性の確保に配慮した構成です。(約300字)
10x-Tool-Calls: AIコーディングツールの利用効率を最大化する軽量ルールファイル
2025/6/11
10x-Tool-Callsは、月間のAIコーディングツールの呼び出し回数を最大限に活用できるよう設計された軽量なルールファイルです。限られたリクエスト数でより多くの作業をこなすことを目的とし、効率的なAPI利用や呼び出し最適化の実装に役立ちます。Pythonで開発されており、シンプルな構造ながら効果的な制御が可能です。
1C AI Stack(1cai-public)
2025/11/5
1Cプラットフォーム向けに設計されたAI支援の開発エコシステム。開発、テスト、保守の自動化を目指し、AI(およびツール群)を用いて1C:Предприятиеのプロジェクトワークフローを効率化します。TypeScriptを主体に、Python 3.11+との連携を想定した構成やコンテナ/CI設定が含まれ、MITライセンスの下で公開されています(約300字)。
豆包(Doubao)Free API — 增強版
2025/11/7
豆包 Free API の拡張版リポジトリ。OpenAI 互換の HTTP API を TypeScript で実装し、画像を含むマルチモーダル(図文)対話、低遅延のストリーミング出力、多アカウント対応、自動クリーンアップなどを備えた「ゼロコンフィグ」なデプロイが可能。軽量な自己ホスティング向けで、既存の OpenAI クライアントと互換性を持たせつつローカル環境や小規模運用での利用を想定している点が特徴です。
3Dアップル品質分類システム
2025/7/12
本リポジトリは、複数視点からの3Dポイントクラウドを用いてリンゴの品質(正常、打撲、割れ、腐敗)を自動分類するエンドツーエンドのシステムを提供します。Intel RealSenseカメラでRGB-Dデータを収集し、3Dモデルを再構築、Pythonで実装された品質分類アルゴリズムにより高精度な判定を実現しています。農業や食品検査分野での自動化・効率化に貢献する先進的なAI/MLソリューションです。
642Xの日本語タイトル:二足歩行ロボット動作制御プロジェクト
2025/8/27
本リポジトリ「642X」は、主に二足歩行ロボットの動作制御に関する技術開発を目的としたプロジェクトです。自己均衡型外骨格装置や人間の動作模倣制御を含め、高度なロボティクス技術の研究開発を進めており、モーションコントロールに特化した実験的かつ応用的な成果が期待されています。現状は開発初期段階ながら、将来のヒューマンインタラクションロボットへの展開が見込まれています。
8-QUEEN問題のシンプルGUI実装
2025/8/31
8-QUEENリポジトリは、人工知能の学習教材として設計された、8クイーン問題のシンプルなGUIインターフェースをPythonで実装したプロジェクトです。TkinterとPillowを用いたビジュアル表現により、問題の可視化と理解を助け、教育やアルゴリズム学習に最適な環境を提供します。
91Writing:AIを活用したスマートな小説創作ツール
2025/6/11
91Writingは、Vue 3とElement Plusをベースに開発されたAI小説創作支援ツールです。複数のAIモデルを統合し、作家が効率的に物語を構築・執筆できる環境を提供します。直感的なUIと高度なAI技術の融合により、アイデアの発想から文章生成までをシームレスにサポート。クリエイティブな創作活動を加速させることを目指したプロジェクトです。
A2A-XKCD:エージェント間通信対応のXKCDコミック表示エージェント
2025/6/24
A2A-XKCDは、Agent-to-Agent(エージェント間)通信に対応した極めてシンプルなPython製エージェントです。XKCDのウェブコミックを取得し、表示する機能に特化しており、軽量かつ直感的な設計が特徴です。エージェント同士の連携を学びたい開発者や、XKCDのコミックを簡単に取得・表示したいユーザーに適しています。
ACE-G-Framework:AI導入成熟度を測る共通フレームワーク
2025/9/3
ACE-G-Frameworkは、企業におけるAI導入の成熟度を評価し、その価値を最大化するための共通言語と指標を提供するフレームワークです。AIの効果測定や導入状況の可視化に課題を抱える多くの企業に対し、統一された基準を示すことで、AI活用の最適化と意思決定の支援を目的としています。ドキュメントやツールが揃い、AIの導入段階を段階的に評価・改善するための実践的なガイドラインとなっています。
AD-DINOv3 — DINOv3を活用したゼロショット異常検知フレームワーク
2025/9/18
AD-DINOv3は、自己教師あり視覚表現で注目されるDINOv3をゼロショット異常検知に適用するための最初のフレームワークです。ドメインアライメント用の軽量アダプタと、CLSトークンとパッチトークン間の双方向的な補正を行うAnomaly-Aware Calibration Module(AACM)を導入し、異常検知に敏感な表現を獲得します。事前学習済みモデルを活かしつつ低コストで適応可能な設計が特徴です(約300字)。
ADK TypeScript: 高度なAIエージェント開発キット
2025/7/21
ADK TypeScriptは、多数のLLM(大規模言語モデル)を統合し、進化したツール連携やメモリ機能、柔軟な会話フローを備えたAIエージェント開発用の包括的フレームワークです。プロダクション環境を念頭に設計されており、複雑なマルチステップタスクの自律的な処理を可能にします。Turborepoモノレポ構成で、拡張性とメンテナンス性の高いコードベースを提供しています。
Agent-C:超軽量AIエージェントのC言語実装
2025/8/25
Agent-Cは、C言語で実装された超軽量のAIエージェントで、OpenRouter APIと連携しながらシェルコマンドを実行することが可能です。わずか数キロバイトのバイナリサイズでmacOSおよびLinuxに対応し、スライディングウィンドウ方式の会話メモリ管理を備えています。シンプルかつ高速な動作を追求した設計で、AIのツール呼び出しや会話の効率的な処理を可能にする点が特徴です。
エージェンシー・エージェンツ:51種類のAIスペシャリスト集
2025/10/13
このリポジトリは「The Agency」として、フロントエンドやコミュニティ運営、クリエイティブや検証役など、用途に特化した51種類のAIエージェントをまとめたコレクションです。各エージェントは個性(ペルソナ)、作業プロセス、成果物の想定が定義されており、プロンプト駆動のワークフローを迅速に試作・拡張できます。軽量でサンプル中心の構成のため、既存のLLMパイプラインやフロントエンドに組み込んで活用するのに適しています(約300字)。
Agent Core - Rust製Codex AIエージェントライブラリ
2025/8/25
Agent CoreはRustで実装されたCodexプラットフォーム上のAIエージェント機能をアプリケーションに組み込むためのライブラリです。高水準のAPIを提供し、LLM(大規模言語モデル)を駆使したエージェントの作成・管理やツール実行機能を容易に実装可能。柔軟な設定システムとメッセージ構造を備え、Rust開発者が効率的にAIエージェントを構築できる環境を整えています。
HRオファーエージェントと三役インテリジェント面接システム
2025/8/21
本リポジトリは、技術担当者・人事担当者・上司の三役が連携するインテリジェントな面接ワークフローと、HRオファーエージェントを提供します。面接の自動化、スコアリング、候補者プロフィールの抽出、結果のアーカイブ、オファー生成までを一貫して実行可能。さらに、外部市場給与データ(Adzuna)を統合するMCPサーバも備えており、実務で活用できる高度な採用支援システムです。
agent-rules:エージェント活用を最適化するためのルール集
2025/6/12
「agent-rules」は、Claude CodeやCursorなどのAIエージェントとより効果的に連携するためのルールや知識をまとめたリポジトリです。Shellスクリプトを中心に構成されており、エージェントの挙動を制御・最適化するためのベストプラクティスを提供。AIエージェントの利用が増える中、開発者やユーザーが実践的に活用するためのガイドラインとして役立ちます。
AgentGuard:リアルタイムのトークンスペンド監視と無限ループ防止ガードレール
2025/7/31
AgentGuardは、LLM(大規模言語モデル)やエージェントの動作中に発生するトークン消費をリアルタイムで監視し、無制限のループや過剰なトークン使用を防止するガードレール機能を提供するJavaScriptライブラリです。Node.js環境で動作し、API呼び出しのコスト管理や安全な実行制御を実現。エージェントの健全な動作維持に貢献します。
Agentic AI RAG — マルチエージェントRAGテンプレート
2025/10/30
Agentic_AI_RAG は、crewAI フレームワークを基盤にしたマルチエージェント構成で、Retrieval-Augmented Generation(RAG)を組み合わせるためのテンプレートリポジトリです。ノートブック形式での実装例やファイルアップロード、ChromaDB を用いたベクトル検索の痕跡が見られ、エージェント同士の役割分担と情報共有により複雑なタスク解決を目指します(機密保持に配慮した内容への調整あり)。
エージェント宣言 — AIエージェントの責任ある運用指針
2025/10/13
Agents Manifesto は、AIエージェントを「無監視で自信満々に暴走する存在」にしないための簡潔な原則集です。曖昧な指示を与えた結果、エージェントが期待外の行動を起こす――そんな状況を防ぐために、人間が守るべきガイドラインを示します。小さなドキュメントながら、プロンプト設計、ガードレール、透明性、監視・停止手段など、実運用で重要になる考え方と実践を端的にまとめたリポジトリです(約300字)。
AIエージェント用システムプロンプト集
2025/7/7
「agentic-system-prompts」は、実際のAIコーディングエージェントで使用されているシステムプロンプトやツール定義を体系的に収集・整理したリポジトリです。プロンプト設計の参考やエージェント開発の効率化に役立つ情報が豊富に含まれており、AIエージェントの性能向上やカスタマイズに貢献します。今後のAI開発に必要な知見を提供する貴重なリソースです。
Inkeep Agents:グラフベースのマルチエージェントAIフレームワーク
2025/9/5
Inkeep Agentsは、複数の専門AIエージェントがグラフベースの構造で連携し、複雑な問題解決を実現するTypeScript製マルチエージェントフレームワークです。ノーコードのビジュアルビルダーとコードベースの両面からエージェント設計が可能で、各エージェントは独自のプロンプトやツールを持ち、チームや開発者が効率的に高度なAIシステムを構築できます。
AIエージェントによるアプリコード自動生成ツール
2025/8/22
本リポジトリ「ai-agent-appmaker-navrhovac」は、AIエージェントを活用してアプリケーションのコードを自動生成・提案するTypeScript製ツールです。ローカル環境で簡単に動作させられ、Node.jsの依存関係管理に対応。AI Studioとの連携により、開発効率の向上を目指しています。初心者から上級者まで幅広く活用できる、シンプルながら拡張性の高いアプリ開発支援リポジトリです。
AI-Agent-Guide:AIエージェント総覧ガイド
2025/9/25
AI-Agent-Guide は、AIエージェント(AI Agent)についての包括的かつ継続的に更新されるガイドです。感知、記憶、計画、意思決定、行動といったエージェントのコアアーキテクチャを体系的に整理し、関連する重要論文や主要なオープンソース実装(論文/リポジトリ)を参照付きでまとめています。研究者・開発者・愛好家が次世代インテリジェントアプリケーションを理解・構築するための実務的な入り口を提供します。(約300字)
AI Agent Project - Archon v4アーキテクチャ実装
2025/11/4
Archon v4ベースのエージェント的RAG(Retrieval-Augmented Generation)システムを実装したリポジトリ。マルチエージェント協調、認知的推論、プロアクティブなインテリジェンス機能を目指しており、データ収集からドキュメント処理、インデクシング、エージェント間の通信や意思決定までを段階的に構築するフェーズベースの設計を採用しています。実験的な実装とアーキテクチャ図、環境セットアップ手順、プロジェクト構成ドキュメントを含みます。(約300字)
AI空港シミュレーションによる大規模言語モデルの意思決定評価
2025/7/22
本リポジトリは、大規模言語モデル(LLM)を対象にリアルタイムの空港管制シナリオでの意思決定能力を検証するための高度な空港シミュレーション環境を提供します。安全性が極めて重要な航空運用におけるAIの判断力やリソース配分、緊急対応能力を比較評価できる点が特徴です。
AIアートジェネレーター(AI-Art-Generator)
2025/10/2
本リポジトリは、テキストプロンプトから画像を生成することを目的とした小規模な実験プロジェクトです。READMEには「GANやDiffusionなどの生成モデルを用いて、AIと創造性の交差点を探る」とあり、Go言語で実装された最小限のエントリポイント(main.go)と説明(README.md)で構成されています。実用的なモデル本体は含まれておらず、生成ワークフローのラフなスケルトンや外部モデル/APIとの連携を想定した設計になっていることが推測されます。学習・デプロイ例のテンプレートやアイデアを手早く試したい開発者向けの出発点です。
AIカレンダーエージェント (ai-calendar-agent)
2025/10/15
自然言語で書かれた予定を自動的に解析し、Google カレンダーへ登録するGoogle Apps Scriptベースのエージェント。Google Gemini(大規模言語モデル)で日付・時間・持続時間を抽出し、カレンダーイベントを作成、確認メールを送信します。フォームからの入力やスクリプトトリガーを利用した自動化が中心のシンプルな実装です。(約300字)
AI監査人向けプライマー集
2025/7/4
本リポジトリ「ai-auditor-primers」は、スマートコントラクト監査を行うAIに事前学習させるためのオープンソースのプライマードキュメントを提供しています。ERC4626準拠のVault専門監査員「Amy」など、特化型AI監査人向けのプライマーが含まれており、スマートコントラクトのセキュリティ強化や監査効率向上を支援します。AIの監査準備を効率的に進めるための基盤資料として活用可能です。
ai-claude-start — 複数プロファイル対応の Claude Code ランチャー(セキュアな認証管理)
2025/10/14
ai-claude-start は、Anthropic の Claude(特に Claude Code を想定)を起動・利用するためのマルチプロファイル対応ランチャーです。TypeScript で実装され、npm パッケージとして公開されています。特徴はプロファイル単位での設定管理と「secure credential management」を掲げる点で、MODEL_CONFIG.md や各種設定ファイルを通じてモデル設定や API キーの分離を容易にします。開発者がローカルで複数の API キー/設定を整理し、安全かつ再現性のある形で Claude を利用するのに適しています。
AIによる服装チェンジツール「ai-clothes-changes」
2025/9/3
「ai-clothes-changes」は、無料で利用できるAI技術を活用した服装チェンジツールを紹介するリポジトリです。シンプルながら、AIを利用した画像生成やキャラクター生成と並ぶ複数のAI系サービスのリンクをまとめており、服装変更に関心のあるユーザーに向けて最適な無料ツールを案内しています。ソースコードの提供は限定的ながら、手軽にAI服装変更機能を試すための窓口として機能しています。
AIコードヘルパー - LangChain4j実践プロジェクト
2025/7/9
AIコードヘルパーは、Spring Boot 3.5、Java 21、LangChain4jを基盤としたAIプログラミング学習・就職支援ロボットの実践プロジェクトです。大規模AIモデルの統合、LangChain4jのコア機能、流式対話、Promptエンジニアリング、RAG(Retrieval Augmented Generation)による検索強化、ベクトルデータベース、ツール呼び出し、MCP(モデルコンテキストプロトコル)、Webスクレイピング、安全対策、Vue.jsフロントエンド、SSE(サーバー送信イベント)などの企業レベルAI技術を幅広くカバーし、AI時代の開発者に必要なスキルを提供します。
AI-CodeAssistant:Cohere APIを活用したシンプルなNode.jsターミナル型コーディングアシスタント
2025/6/9
AI-CodeAssistantは、CohereのAI APIを利用したNode.jsベースのターミナル型コーディングアシスタントです。シンプルな設計ながら、コードの生成や補完、質問応答を対話的に行うことができ、開発者の生産性向上を支援します。軽量でセットアップも容易なため、日々のコーディング作業に手軽に導入可能なツールとして注目されています。
AI Content Studio:AIによるソーシャルメディアコンテンツ生成プラットフォーム
2025/9/6
AI Content Studioは、GPT-4を活用したAIコンテンツ生成プラットフォームです。Web調査や画像選択を自動化し、LinkedInやTwitter向けの魅力的なソーシャルメディア投稿を効率的に作成できます。Reactフロントエンドとn8nによるワークフロー自動化バックエンドを備え、編集・承認機能も搭載。コンテンツ制作の手間を大幅に削減し、質の高い情報発信を支援します。
AI Diagram & Prototype Generator (MCPサーバー)の解説
2025/8/14
AI Diagram & Prototype Generator (MCPサーバー)は、複数の先進的な大規模言語モデル(LLM)を統合し、自然言語から多様なスタイルのdraw.io形式の図表やHTMLベースのインタラクティブなプロトタイプを自動生成できるAI駆動のツールです。Apple HIGやWeChatミニプログラムなどの専門的なUI設計規範に対応し、動的なプロンプトシステムで安定かつ高精度な成果物を提供。設計からプロトタイピングまでの工程を効率化し、ユーザーの創造性を大幅に支援します。
AI教育ベンチマーキング(ai-edu-benchmarking)
2025/10/2
Claude、DeepSeek、GPT-5といった複数の大規模言語モデル(LLM)を、学習者のペルソナに合わせたレベル設定で数学・物理の問題(6問)に解答させ、正答率だけでなく「分かりやすさ」「充実度」「教育的配慮」「学習支援性」を含む多面的な指標で比較・評価するためのベンチマークプロジェクトです。実際の学習場面での有用性を重視した設計が特徴です(約300字)。
採用選考管理のためのAIツール
2025/7/21
「ai-for-screening-management」は、採用プロセスの効率化を目指したAI支援アプリケーションです。応募者の履歴書(CV)や面接評価を自動的にスコアリング・ランキングし、人事担当者が優秀な候補者を迅速に見極められるようサポートします。Pythonで構築され、CVと面接の両方に対応したスコアリング機能を備え、採用業務の質向上と工数削減に貢献します。
AI-Gamble:AIによる動的インタラクティブ小説ゲーム
2025/7/15
AI-Gambleは大型言語モデル(LLM)を活用した動的インタラクティブ小説ゲームです。プレイヤーが選択した物語ジャンルに応じて、独自のストーリー展開、キャラクター、そして視覚化された物語分岐マップをリアルタイムに生成。多様な選択肢と予測不能な展開により、没入感の高い読書体験を提供します。
AIによる闲鱼多タスクリアルタイム監視&スマート分析ツール
2025/7/16
本リポジトリは、PlaywrightとAIを活用し、中国の人気二次流通プラットフォーム「闲鱼(Xianyu)」上で複数の監視タスクをリアルタイムに実行し、深層なAI分析を施すツールです。直感的なWeb管理画面を備え、自然言語で購入ニーズを記述するだけで高度なタスクを自動生成。多様なキーワードの同時監視、即時解析、AIによる多モーダル商品評価、プッシュ通知まで一貫対応し、ユーザーフレンドリーかつ高機能な運用を実現しています。
AI Humanizer API — AI生成テキストを人間らしく変換するAPI
2025/9/18
AI Humanizer API は、AIが生成した文章を「自然で人間らしい」文体へと自動で変換すると謳うサービスの開発リポジトリです。Turnitin、GPTZero、Originality.ai、CopyLeaks など主要なAI検出器を回避すると主張し、学生・マーケター・コンテンツ制作者向けに高速で高品質な出力を提供すると説明しています。本リポジトリは導入例やクイックスタート、開発者向けリソースを含むとされますが、公開されているファイルは README と LICENSE のみで、実装コードやAPIエンドポイントの詳細は含まれていません。導入前には技術的・倫理的検証が必要です。
AIインフラストラクチャの学習と構築ガイド
2025/7/8
AI-Infraは、AIインフラストラクチャの設計と運用に携わるエンジニア向けに特化したリポジトリです。特にKubernetesやクラウドネイティブ技術を用いたAI推論基盤の構築に焦点を当て、AIインフラの全体像を俯瞰したランドスケープ図と体系的な学習パスを提供しています。最新の技術トレンドや成熟度を視覚的に示し、実践的知識の習得をサポートするためのリソースが豊富に揃っています。
AI面接準備ノート(2025年3月版)
2025/8/18
AI研究所の面接に向けた機械学習の基礎と設計に関する学習ノートをまとめたリポジトリです。2025年3月時点の内容で、急速に変化するAI分野の最新情報には一部追いついていない可能性がありますが、基礎理解や設計思考の参考資料として有用です。面接対策を目的とした実践的な内容を凝縮しており、AIエンジニア志望者に役立つ資料となっています。
Ai-Medical-Assistant:音声対応医療RAGアシスタント
2025/7/24
Ai-Medical-Assistantは、医師が音声で患者の基本情報を問い合わせることができる最小限のフルスタック音声対話アプリです。Reactを用いたフロントエンドと、Flaskによるバックエンドで構成され、OpenAIのWhisper APIで音声認識、Pineconeによるベクトル検索、ElevenLabsの高品質な音声合成、そしてGPT-3.5を活用した生成的質問応答を実現。医療現場での迅速かつ自然な情報取得を支援します。
AIムードダイアリーボット - AI分析とウェブダッシュボードを備えた感情追跡Telegramボット
2025/8/24
AI Mood Diary Botは、ユーザーの感情を記録し、AI技術で分析するTelegramボットです。Vue.jsを用いた直感的なウェブダッシュボードで感情データの可視化を実現し、PythonベースのバックエンドとDocker環境での容易なデプロイをサポート。日々の気分管理やメンタルヘルスケアに役立つ革新的なツールです。
AIナビゲーター・ツール
2025/10/4
AI-Navigator-Toolは、AIの経路探索(pathfinding)アルゴリズムを視覚的に示すことを目的とした軽量なデモ/教育ツールです。リポジトリは小規模でファイル数も少ないためプロトタイプ的な完成度ですが、グリッドや障害物、始点・終点を設定してA*やダイクストラ、幅優先探索などの挙動をステップごとに追いかけられる構成が想定されます。学習用やアルゴリズム比較、UIでの動的なパラメータ調整の出発点として有用です(簡潔な導入・可視化を重視)。
ブラウザで動く AI オブジェクト検出(AI-Object-Detection)
2025/9/18
このリポジトリは、インストール不要でブラウザ上だけで動作するリアルタイムのオブジェクト検出アプリケーションです。デバイスのカメラ映像を取り込み、フレームごとにAIモデルで物体を検出して可視化します。検出のオン/オフ切替やフレームレート調整スライダーといった操作UIを備え、軽量な構成で手軽に試せる点が特徴です(300字程度の簡潔な説明)。
AI-Pathfinding-Visualizer(AI経路探索可視化ツール)
2025/10/1
AI-Pathfinding-Visualizerは、AIの経路探索アルゴリズムを視覚的に示すことを目的としたリポジトリです。C#をメインに、ゲーム向けスクリプト風のファイル群を含み、グリッドやナビゲーションメッシュ、ノードグラフなどを想定したデモやビジュアライゼーションの土台を提供します。学習・教育用途やアルゴリズム比較、ゲームAIの挙動確認に有用な軽量ツールです。READMEは簡潔で、実装の拡張や実験の基盤として使える構成になっています(約300字)。
AI PDFチャットボット - LangChainを活用したPDF対話システム
2025/7/1
「ai-pdf-chatbot-langchain」は、TypeScriptで実装されたAIチャットボットのリポジトリで、PDFドキュメントを解析し、自然言語での質問応答を可能にします。LangChainフレームワークを活用することで、PDFファイルから情報を抽出し、ユーザーの質問に対して的確な回答を生成。AIとドキュメントの対話を実現することに重点を置いたプロジェクトで、AIを活用したドキュメント管理や検索システムの構築に役立つツールです。
AI-OCR-BOOK:AIによる電子書籍のOCR化プロジェクト
2025/7/18
AI-OCR-BOOKは、AI技術を活用して電子書籍の文字認識(OCR)を効率的に行い、紙媒体や画像化された書籍のデジタル化を支援するオープンソースプロジェクトです。中国語の書籍を中心に、テキスト抽出と編集を容易にし、知識のデジタル再生を目指しています。現代のAI OCR技術を駆使し、書籍の電子化を促進するためのツール群やプロンプト例を提供しています。
AI原型提示词事例集
2025/7/10
本リポジトリ「ai-prototype-prompts」は、AIを活用したプロトタイプ作成のための高品質な提示文(プロンプト)事例を収集したものです。ポッドキャストアプリの原型設計をはじめ、ユーザー体験分析からUI設計、HTML+Tailwind CSSによる高精度なプロトタイプ実装まで、実用的なプロセスを体系的に示しています。開発者やプロダクトマネージャー、UIデザイナーがAIを活用して効率的に高忠実度のプロトタイプを作成するための参考資料として活用可能です。
AIレビュー用プロンプト集 (Ai-Review-Prompt)
2025/9/13
このリポジトリは、論文や記事の品質向上を目的とした大規模言語モデル(LLM)向けの「レビュー用プロンプト」を収集・最適化するためのテンプレート集です。英中のサンプルプロンプトや検討用のテンプレートを通じて、著者や査読者がモデルを用いて構造化された査読コメント、改善提案、評価指標に基づく採点を効率的に得られるよう設計されています。コミュニティ更新を前提とし、継続的改善と貢献を歓迎するオープンな場を提供します(約300字)。
ai-sfx:AIを活用した効果音生成ライブラリ
2025/6/1
ai-sfxは、JavaScriptで開発された効果音生成ライブラリで、AI技術を活用して多彩なサウンドエフェクトを簡単に作成できます。ゲーム開発やマルチメディアコンテンツにおける効果音制作を効率化し、カスタマイズ性も高いのが特徴です。軽量かつオープンソースで、開発者コミュニティからの支持も徐々に広がりつつあります。
AI-THON-PROJECT — AI駆動のコード学習・デバッグアシスタント
2025/9/13
本リポジトリは、学生向けのプログラミング学習とデバッグ支援を目的としたシンプルなプロトタイプです。フロントエンド(index.html)とローカルのAI処理ロジック(ai.js)を中心に構成され、ユーザーがコードを入力すると解析・フィードバックを返す仕組みを想定しています。軽量なJavaScriptベースで、拡張や外部AIサービス統合を容易にする設計が取られており、教育向けツールの土台に適したリポジトリです。(約300字)
AIトレーディングエージェント(ai-trading-agent)
2025/10/20
本リポジトリは、LLM を活用した自動暗号資産トレーディングエージェントのプロジェクトです。OpenRouter 経由で LLM を呼び、TAAPI と CoinAPI からリアルタイム市場データを取得してテクニカル指標を算出。Hyperliquid 分散型取引所上で売買を実行します。設定可能な監視間隔、テイクプロフィットやストップロス等のポジション管理機能を備え、Docker コンテナ化と Poetry による依存管理で開発・運用しやすく構成されています。
AI動画エフェクトコレクション
2025/7/25
「AI Video Effects Collections」は、興味深く実用的なAIを活用した動画エフェクトやテンプレートを集めたリポジトリです。動画編集や映像制作にAI技術を活用した様々なエフェクトの事例やツールがリストアップされており、エンターテインメント用途から実務的な応用まで幅広くカバー。ユーザーや開発者からの貢献も歓迎しており、AIを用いた動画表現の可能性を探る入門リソースとして有用です。
ai-vids:AI動画生成ツール
2025/9/4
「ai-vids」はAI技術を活用した動画生成ツールのリポジトリです。シンプルな構成ながら、AIを用いて動画コンテンツを生成する基盤を提供し、AIによる映像制作の可能性を探ります。初心者から研究者まで幅広く活用可能な設計で、AI動画生成の入門として役立つリポジトリです。
AI音声通話エージェント:歯科クリニック向けAI予約受付システム
2025/7/27
本リポジトリは、歯科クリニック向けに開発されたAI音声アシスタント「AI Voice Appointment Booking Agent」を公開しています。Vapiを活用し、電話応対業務を完全自動化。FAQ対応、空き状況確認、予約受付、予約確認通知までを人手を介さずに実現する仮想受付システムです。クリニックの業務効率化や顧客体験向上に貢献します。
AI-Voice-Typing-Shortcuts:無料で高精度なGeminiベースのAI音声入力ショートカット
2025/8/15
本リポジトリは、Google Gemini APIを活用した無料かつ完全にカスタマイズ可能な高精度AI音声入力ショートカット「AI-Voice-Typing-Shortcuts」を提供します。従来の音声入力法が苦手とする個別の単語やルールを柔軟に設定可能で、Whisper FlowやAQUA Voiceなどの有料サービスに頼ることなく、高品質な音声認識を実現。MacやiPhoneのショートカット機能を活用し、ユーザーの利便性を大幅に向上させるオープンソースプロジェクトです。
AI-Vulverability-Scanner:AIを活用した脆弱性スキャナー
2025/6/1
AI-Vulverability-Scannerは、ユーザー指定のIPアドレスに対してNmapを用いて開いているサービスを検出し、それぞれのサービスに関連するCVE(共通脆弱性識別子)をSBERT埋め込みと重大度分類器でマッチングします。さらに、ファインチューニングしたT5モデルにより、具体的かつ適切な対策手順を自動生成するAI駆動型の脆弱性スキャナーです。セキュリティ管理の効率化と精度向上に寄与します。
Ai-Wallpaper-Studio の紹介
2025/10/24
Google の AI Studio を利用して短時間で壁紙を生成することを目的としたフロントエンドプロジェクトです。TypeScript(React 想定)で構成され、ローカルで動かすための最小限のセットアップ(Node.js、npm、環境変数)を提供します。GEMINI_API_KEY を使った画像生成連携が想定され、UI コンポーネント群やシンプルなデプロイ手順が含まれるため、AI ベースの壁紙制作アプリの学習やプロトタイピングに適しています。(約300字)
AI混戦の人狼プロトタイプ (ai_werewolf)
2025/10/16
複数の大規模言語モデルを混ぜて「人狼(Werewolf)」を自動で遊ばせるプロトタイプ。OpenRouter/OpenAI等のAPIを利用し、各モデルをプレイヤー役に割り当てて会話や推理を進行させる。デバッグや技術情報の出力オプションを備え、モデル挙動の観察や戦略の試作に適した開発向けツールである。
AI100Stories - AI概念を魅力的な物語に変えるプロジェクト
2025/5/30
AI100Storiesは、人工知能の複雑な概念を専門的な物語理論と創作技術を活用して、魅力的なストーリーに変換することを目的としたプロジェクトです。技術的な専門知識を持たない読者にもAIの本質をわかりやすく伝えることを目指し、創造的かつ教育的なコンテンツを提供しています。CSSを用いたデザイン要素も含み、視覚的な魅力も追求しています。
AI関連の実用スクリプト集「AICode」
2025/7/9
「AICode」は、AI技術の活用を支援するために作成された実用的なシェルスクリプトをまとめたリポジトリです。主にClaude AIのコードプロキシを自動化するスクリプトが含まれており、手軽にAIサービスの連携や運用を行うことが可能です。シンプルながら拡張性のある構成で、AI関連の開発や運用に便利なツール群を提供します。
AIクリプトシグナルズボット - 暗号資産自動売買支援ツール
2025/7/1
AICryptoSignals-Botsは、AIを活用して暗号資産の取引シグナルを自動生成し、ユーザーが変動の激しい仮想通貨市場でより正確な売買判断を下せるよう支援する自動売買ボットです。市場の分析からシグナル発信までの一連のプロセスを自動化し、初心者から上級者まで幅広いトレーダーに利用されています。
AICryptoTrade-Bots:最先端機械学習を用いた暗号通貨自動取引ボット
2025/7/1
AICryptoTrade-Botsは、最先端の機械学習アルゴリズムと特徴量エンジニアリング技術を活用した暗号通貨の自動取引ボットです。市場データを分析し、効率的かつ自律的に取引判断を下すことで、トレーダーの手間を大幅に削減し、取引の精度向上を目指しています。本リポジトリは、実用的なトレーディングボットの構築に興味がある開発者や投資家にとって貴重なリソースとなっています。
AIGC-weight-reduction:最強AI降重ツール
2025/7/16
AIGC-weight-reductionは、学生や研究者、自媒体クリエイター向けのAIベースのテキスト改写プラットフォームです。最新のAIGCモデルを活用し、文章の意味を保持しつつ自然で流暢な文章に自動的に書き換え、論文や記事の重複チェックを回避します。中国語に対応し、リアルタイム処理と高い安全性を兼ね備え、無料で利用可能なサービスを提供しています。
AIMi(AIエイムボット)
2025/10/29
AIMiはリアルタイム物体検出を使ったAIベースのエイムボットです。Neural Network(旧来のYOLOv3をベースに改良)で人間の姿勢や動きのパターンを認識し、ゲームモデルとの類似性から頭部などのターゲットを特定してエイムを補助します。Pythonで実装され、GPUサポートを想定したスクリプトやアセットを備えた研究・実験向けのリポジトリです。動作には深層学習の推論や画像処理パイプラインが必要になりますが、使用は各自の責任で行う必要があります。
airole:画像から始める手軽なAIキャラクターカード作成ツール
2025/6/15
airoleは、画像を起点にAIがキャラクターカードを自動生成するTypeScript製のツールです。ユーザーは手間をかけずに魅力的なキャラクター設定を作成でき、ゲームや物語制作に活用できます。直感的な操作性とAIの自然言語処理を融合し、効率的かつクリエイティブなキャラクター生成を実現します。
AITradeGame — 大規模モデルを使った仮想暗号通貨トレード検証プラットフォーム
2025/10/20
本リポジトリは、Webベースの暗号通貨トレードシミュレーター「AITradeGame」を提供します。Flaskで構築されたバックエンド、ネイティブJavaScript+EChartsを用いたフロントエンド、SQLiteを用いた軽量データストアを組み合わせ、OpenAI互換フォーマットで大規模言語モデル(LLM)をトレード戦略の意思決定エンジンとして統合します。リアルタイム市場データの取り込み、レバレッジ対応のポートフォリオ管理、インタラクティブなダッシュボードとトレード履歴分析機能を備え、研究・評価・デモ用途に向いた環境を提供します。(約300字)
AIZotero:Zotero対応AI論文アシスタント
2025/8/2
AIZoteroは、Zoteroのローカルライブラリと直接連携し、研究論文の管理と理解を支援するAI搭載の論文リーディングアシスタントです。ウェブインターフェースを通じてユーザーは論文の要約や重要ポイントの抽出を容易に行え、研究作業の効率化を図れます。高度なAI技術でほぼ全てのコードが自動生成されており、最新のAIモデルを活用したスマートな研究支援ツールです。
画像から動画生成モデルの動的表現を向上させる適応的ローパスガイダンス
2025/7/15
本リポジトリ「ALG」は、画像から動画を生成するモデルの動的表現を改善するための手法「Adaptive Low-Pass Guidance(適応的ローパスガイダンス)」の公式実装を提供します。従来課題であった動画内の動きの滑らかさや連続性を向上させ、より自然で高品質な動画生成を実現。論文「Enhancing Motion Dynamics of Image-to-Video Models via Adaptive Low-Pass Guidance」に基づき、Pythonで実装されたこのリポジトリは、画像から動画への変換タスクに新たな可能性を示します。
All Of It — ピクセルからプローズへ(Deep Learningノートブック集)
2025/11/4
「All Of It」は、深層学習の基礎から最新のモデル概念までを段階的に学べるJupyterノートブックシリーズです。ピクセルレベルのデータ処理、最初のニューラルネットワーク構築、畳み込みニューラルネットワークの学習パターン、ResNetなどの深層モデルの理解までをカバーし、実践的なコードと解説で学習の流れを追えます。学習者や実務者がモデルの直感と実装を同時に得るための教材リポジトリです。
AlphaGenome:DeepMind発の最新ゲノム注意機構モデルの実装
2025/6/27
DeepMindが提案した最新のゲノム解析用の注意機構モデル「AlphaGenome」のPython実装リポジトリです。AlphaGenomeはゲノム配列解析に特化したディープラーニングモデルで、従来の手法を凌駕する精度と効率性を実現。本リポジトリでは、モデルのコアアルゴリズムを忠実に再現しつつ、研究や実務での活用を促進するためのコードを提供しています。ゲノム情報の深層解析に関心のある研究者やエンジニアに最適です。
マーケティングROI分析と売上予測のための回帰モデル
2025/9/1
本リポジトリは、マーケティングチャネルへの広告費投入が売上に与える影響を分析し、ROI(投資収益率)を最大化するための予測モデルを構築するプロジェクトです。広告費データと売上実績を用いて線形回帰モデルを作成し、投資効率の高い広告配分を導き出すことを目的としています。マーケティング戦略の最適化に役立つデータサイエンスの実践例として、Jupyter Notebook形式で実装されています。
AnthroTAP:人体動作から任意の点を追跡する学習モデル
2025/7/7
AnthroTAPは、人間の動作映像から任意のポイントを高精度に追跡するための学習ベースの手法を提供するリポジトリです。本プロジェクトは、動作解析やビデオ理解に不可欠なポイント追跡問題を解決するため、深層学習を活用し、従来手法を大きく上回る性能を達成しています。特に、人体の複雑な動きや外観変化に強く、様々な応用が期待されます。
Any-SongによるAI活用のパーソナルカラオケ体験
2025/6/2
Any-Songは、AI技術を駆使して任意の楽曲からボーカルを分離し、歌詞と同期させることで、個人向けのカラオケ体験を提供するプロジェクトです。ユーザーは手持ちの音楽を簡単にカラオケ化でき、歌詞をリアルタイムで表示しながら歌うことが可能となります。音声処理や自然言語処理を融合し、新たな音楽体験を実現する点が特徴です。
Any-SSR:大規模言語モデルの継続学習における解析的部分空間ルーティング
2025/7/8
Any-SSRは、「解析的部分空間ルーティング(Analytic Subspace Routing)」という手法を提案し、再帰最小二乗法(Recursive Least Squares)が大規模言語モデルの継続学習にどのように機能するかを解明するための公式コードリポジトリです。本リポジトリは、大規模言語モデルの知識蓄積と適応を効率的に行うための理論的かつ実践的なアプローチを提供し、継続学習研究の最先端を担っています。
AnyAccomp — 汎用的伴奏生成と量子化メロディックボトルネック
2025/9/19
AnyAccompは、ボーカルやソロ楽器のための汎用的な伴奏生成フレームワークです。原音から抽出したメロディックな情報を「量子化されたボトルネック表現(離散トークン)」として符号化し、その抽象化された旋律情報を条件に伴奏を自動生成します。量子化により旋律と伴奏の分離が促進され、未学習の声質や楽器に対する一般化性能が向上する設計が特徴です。論文やHugging Faceのデモと連携して、モデルコード・設定・サンプルが公開されています(約300字)。
Apple On-Device AI:NodeJS向けApple Foundation Modelバインディング
2025/6/18
「apple-on-device-ai」は、AppleのFoundation ModelをNodeJS環境で利用可能にするTypeScript製のバインディングライブラリです。特にVercel AIプラットフォームとの連携をサポートし、Appleの先進的なAI技術をサーバーサイドやエッジ環境で活用したい開発者に最適です。軽量かつモダンな設計で、オンデバイスAIの可能性を広げます。
APTBench — ベースLLMのエージェンシーポテンシャル評価ベンチマーク
2025/10/28
APTBenchは「APTBench: Benchmarking Agentic Potential of Base LLMs During Pre-Training」の実装コード集です。ベースとなる大規模言語モデル(LLM)が事前学習段階で示す「エージェンシー(主体的・計画的な行動能力)」を評価するためのベンチマークを提供します。ソフトウェア工学や深い研究活動といったエージェント的シナリオに着目し、計画や行動といったコア能力を測ることで、汎用的な指標よりも将来的なエージェント性の出現を予測しやすい評価を目指します。
Ardupilot_Team_Pegasus:高度なモビリティとロボティクスの学部生研究プロジェクト
2025/7/21
Ardupilot_Team_Pegasusは、Advanced Mobility and Robotics Labによる学部生の研究プロジェクトで、オープンソースの無人機制御ソフトウェアArduPilotをベースに開発されています。本リポジトリは、C++で実装された自律飛行制御システムの拡張やカスタマイズを目的とし、ドローンやロボットの高度な自律制御技術の研究開発に活用されています。最新のテストワークフローやディスコードコミュニティ連携も特徴です。
ARTDECO:構造化シーン表現による高精度オンザフライ3D再構築
2025/10/10
ARTDECOは、3Dの基礎的な学習済みプリオリ(foundation priors)と構造化されたシーン表現を統合することで、単眼ビデオのみを入力に多様な実世界シーンを高精度かつ汎化的に再構築することを目指す研究プロジェクトです。リアルタイムに近い「オンザフライ」処理や効率性を重視し、曖昧さの多い単眼入力でも頑健にジオメトリとレイアウトを復元できる点が特徴です。論文・プロジェクトサイトへのリンクと資料を中心にまとめられています。
人工ニューロンの自作入門
2025/7/13
本リポジトリ「artificial_neuron」は、人工ニューロンの基礎的な構築をPythonのJupyter Notebook上で実践的に学べる教材です。スクラッチでの実装を通じて、パーセプトロンや単純なニューラルネットワークの動作原理を理解できます。データセットの準備からモデルの訓練、精度評価までを含み、初心者が機械学習の核となる概念を体験的に習得することを目的としています。
ASL_Pytorch:GISLR向けPyTorchベースライン(ASL単語認識)
2025/11/4
このリポジトリは、Kaggle の GISLR データセットを用いた独立(isolated)ASL(米国手話)単語認識の PyTorch 実装です。MediaPipe のランドマーク(543点)をベースに前処理を行い、唇・優位手・姿勢の小サブセットを抽出して左手優位化するなどの正規化を施した入力を Transformer ベースのモデルで学習・推論します。さらに、推論で得られた単語列から Google Generative AI(Gemini)を利用して簡易な文章を生成するデモ(app.py)を含み、エッジな手話→文章パイプラインのプロトタイプを提供します。
ASTRA:AIソフトウェアアシスタント向け自律的時空間レッドチーミング
2025/8/13
ASTRAは、Amazon Nova AI Challengeで優勝したAIセーフティ分野の革新的なプロジェクトです。時空間的な自律レッドチーミング技術を用いて、AIソフトウェアアシスタントの脆弱性を効果的に攻撃・評価し、世界中の大学チームを凌駕しました。Pythonで実装され、実用的かつ高度な攻撃戦略を展開する点が特徴です。
ATI:任意軌跡指示による制御可能な動画生成
2025/5/30
ATIは、任意の軌跡指示(Any Trajectory Instruction)を用いてユーザーが望む動きを直感的に指定し、 制御可能な動画を生成するための最新技術を実装したリポジトリです。動画生成分野における柔軟性と精度を両立し、 研究論文「ATI: Any Trajectory Instruction for Controllable Video Generation」に基づいた公式実装を提供します。
Aula-3:Jupyter Notebookによる機械学習演習課題
2025/8/28
Aula-3は、機械学習やデータサイエンスの学習を目的としたJupyter Notebook形式の演習課題リポジトリです。Pythonコードとノートブックを通じて基礎的なプログラミングやデータ解析の理解を深めることができ、Google Colabでの実行も可能です。教育用途に適したシンプルかつ実践的な構成が特徴です。
auto-prompt:AIプロンプト最適化プラットフォーム
2025/6/4
auto-promptは、AIモデルのプロンプト最適化に特化したプロフェッショナルツールです。高度な最適化アルゴリズムと深層推論解析を組み合わせることで、AIとの対話精度を飛躍的に向上させます。さらに、視覚的なデバッグツールやコミュニティ共有機能も備え、ユーザーが効率的かつ効果的にプロンプトを設計・改善できる環境を提供します。
Autoselll - AIによるオンライン販売自動化エージェント
2025/8/5
Autoselllは、画像解析から価格検証、商品説明作成、そしてマーケットプレイスへの出品まで、オンライン販売の全工程をAIが自動で行うシステムです。ユーザーは商品写真をアップロードするだけで、ブランド情報やモデル、商品の状態をAIが分析し、ノルウェー市場のデータを用いた価格検証を経て、最適化された説明文を生成。FINN.noなどのマーケットプレイスへ自動的に出品できます。販売プロセスの効率化を実現する革新的なAIエージェントです。
AutoSTAT — 自動統計解析ツール
2025/10/31
AutoSTAT は「Autostat: Statistical Analysis, Instantly.」を掲げる Python ベースの自動統計解析プロジェクトです。Web デモ(Hugging Face Spaces)や公式ドキュメント、mac 用の配布物が用意され、入力データのプロファイリング、適切な統計手法の自動提案、可視化やレポート生成を狙ったツールチェーンを提供します。初心者でも迅速にデータ解析レポートを得られることを目標としています。(約300字)
avatar_gpusによる多GPU対応デジタルアバター推論環境
2025/6/10
avatar_gpusは、複数GPUを活用してデジタルアバター(デジタルヒューマン)の推論処理を効率化するPythonベースのリポジトリです。特にheygemフレームワークを用いたマルチカード推論に対応しており、大規模なモデルやリアルタイム処理における計算負荷の分散を実現します。AI分野でのデジタルヒューマン応用において、GPUリソースを最大限に活用したい開発者に役立つ実装が特徴です。
AVDNet:減算誘導アライメントによる適応型映像デモアリングネットワーク
2025/7/1
AVDNetは、映像におけるモアレ模様を効果的に除去するための適応型デモアリングネットワークです。減算誘導アライメント機構を導入し、連続フレーム間の特徴を正確に整合させることで、映像の高品質な復元を実現。従来手法と比較して、動きのある映像や複雑なモアレパターンに対しても優れた性能を発揮します。
野外(In-the-Wild)3Dシーン理解のAwesomeまとめ
2025/9/15
世界中の多様な環境で取得されたデータを対象にした「3Dシーン理解」に関する論文・データセット・実装・ベンチマークを体系的に集めたキュレーションリポジトリです。屋外や日常環境など実世界のノイズや変動に耐える手法、評価指標、データ収集の課題などを俯瞰でき、研究者やエンジニアが現実環境向けの3D理解を学び・実装し・比較するための入口を提供します。(約300字)
Awesome A2A Hub(エージェント間プロトコルまとめ)
2025/9/18
A2A(Agent2Agent)プロトコルに関するエージェント、ツール、リソースを体系的に集めたキュレーションリポジトリ。A2A Hub(https://a2a.build)に焦点を当て、実装例、仕様、ツールチェーン、関連ライブラリやデモ、導入ガイドなどをまとめている。Questflowのサポートのもと、異なるAIエージェント同士の相互運用性やコラボレーションを促進するリソースを一箇所で参照できるのが特徴。300字程度の説明。
Awesome Affordance Learningの総合リポジトリ
2025/5/28
本リポジトリ「Awesome-Affordance-Learning」は、物体の「アフォーダンス(affordance)」学習に関する研究や実装、論文、データセット、ツールなどをまとめた包括的なリストです。ロボティクスやコンピュータビジョン、機械学習分野で注目を集めるアフォーダンス認識技術の情報を一元的に収集し、研究者や開発者が効率的に関連リソースへアクセスできるよう設計されています。これからアフォーダンス学習に取り組む人にとって貴重な情報源となるでしょう。
Awesome-AI(無料で使えるAIまとめ)
2025/9/17
Awesome-AIは「Free & Easy to use AI」を掲げるリソース集リポジトリです。メインはREADMEのみで、外部サービス(https://www.ainsfw.ai/)への案内を中心にしたシンプルなキュレーションを提供します。コード実装は含まず、AIツールやサービスの紹介を手早く参照したい開発者や研究者、エンドユーザー向けの入り口として機能します(約300字)。
音声生成技術のための厳選リソース集「Awesome-Audio-Generation」
2025/6/2
「Awesome-Audio-Generation」は、テキストから音声を生成する技術(Text-to-Audio, TTA)に関する論文やコード、関連リソースを体系的にまとめたキュレーションリポジトリです。最新の研究成果や実装例を一括で参照でき、音声合成や音響生成の分野で研究・開発を行う技術者や研究者にとって貴重な情報源となっています。
AI搭載コードエージェント集:開発生産性を革新するツール群
2025/8/6
本リポジトリ「awesome-code-agents」は、AIを活用したコードエージェント、統合開発環境(IDE)、および開発支援ツールを厳選してまとめたリストです。プログラミングの生産性向上を目的とし、インテリジェントなコード補完やエージェント型編集機能を持つ最新のAI開発ツールを紹介。開発者が日々のコーディング作業を効率化し、高品質なソフトウェア開発を実現するための情報源として注目されています。
制御可能な生成モデルに関する最新論文集
2025/6/27
本リポジトリは、2023年から2025年にかけて発表された制御可能な生成モデルに関する論文を厳選してまとめたリストです。特に拡散モデルを中心に、細粒度制御、注意機構の解釈、スペクトル操作、構造保持型画像編集など、多様な技術をカバーしており、研究者や開発者が制御可能な合成技術を深く理解し応用するための貴重なリソースとなっています。
Efficient LLM(Awesome-Efficient-LLM)
2025/9/8
大規模言語モデル(LLM)や視覚言語モデル(VLM)の効率化に関する論文・手法を集めたキュレーションリポジトリ。量子化、スパース化、蒸留、低ランク分解、KVキャッシュ圧縮、推測デコードなど、計算効率・メモリ効率・推論高速化に関するトピックを体系的にまとめている(300字程度)。 >>>>>>> 6a66d2431943c577b368b609165be719651b3c6b
Awesome-DiffusionLLM:Diffusion言語モデルに関する厳選リソース集
2025/8/28
Diffusion言語モデル(Diffusion LLMs)に関する論文やプロジェクト、ツールを体系的にまとめたリポジトリです。最新の研究動向から実装例、関連リソースまで幅広く網羅し、Diffusion LLMの理解と活用を支援します。研究者やエンジニアが効率的に情報収集できる貴重な情報源となっています。
大規模検索指向推論モデルのまとめリポジトリ
2025/6/10
「Awesome-Large-Search-Models」は、検索に特化した大規模推論モデルに関する論文や手法、データセットを体系的にまとめたリポジトリです。最先端の検索技術と推論能力を融合させたモデルの研究動向を把握でき、関連研究者やエンジニアにとって有用な情報源となっています。最新の論文情報やデータセットを一元的に参照できるため、検索性能向上を目指すAI/ML分野の研究開発に役立ちます。
Awesome-LLM-Fake-News-Detection:大規模言語モデルによるフェイクニュース検出リソース集
2025/6/1
「Awesome-LLM-Fake-News-Detection」は、大規模言語モデル(LLM)を活用したフェイクニュース検出に関するリソースを体系的にまとめたGitHubリポジトリです。フェイクニュースの定義や検出技術、関連データセット、最新の研究論文、実装例などを網羅し、研究者や開発者が効率的に情報収集や技術選定を行えるよう設計されています。AIを用いた信頼性の高い情報検証技術の普及に貢献する貴重なリストとして注目されます。
Awesome-LLM-Latent-Reasoning(LLMの潜在推論アーカイブ)
2025/10/10
このリポジトリは、大規模言語モデル(LLM)における「潜在的/暗黙的な推論(latent/implicit reasoning)」に関する研究論文を体系的に収集したキュレーション集です。最新のサーベイや個別研究を追跡して随時更新されることを目的としており、潜在推論の理論、評価、解析手法、応用例に関する主要文献へのリンクを中心にまとめています(論文リスト、サーベイ、代表的手法の参照先を収録)。
Awesome MLLM コンテンツ理解:マルチモーダル学習の論文コレクション
2025/8/26
本リポジトリは、マルチモーダルコンテンツ理解(MCU)に関する論文を厳選してまとめたコレクションです。特に、細粒度視覚認識/分類(FGVR/FGVC)や、大型・小型モデルの協調によるコンテンツモデレーションなど、多様な応用分野をカバーしています。研究者やエンジニアが最新のマルチモーダルAI技術を効率的に把握できるよう設計されています。
Awesome-MCP-Servers — MCPサーバー厳選リスト
2025/11/6
Model Context Protocol(MCP)に対応するサーバー、クライアント、ツール、フレームワークをコミュニティ主導でまとめたキュレーションリストです。MCPはAIモデルがローカルやリモートのリソースに対して標準化された方法で安全にやり取りするためのオープンプロトコルであり、本リポジトリは実装例、ユーティリティ、導入ガイド、翻訳情報などを網羅して利用者が適切なサーバーやツールを選定できるよう整理されています。多言語README(中国語簡体・繁体)やライセンス情報も含まれ、コミュニティ貢献を歓迎します(約300字)。
awesome-opencode — OpenCode 向け厳選リソース集
2025/9/22
OpenCode(opencode.ai)向けにコミュニティがキュレートしたプラグイン、テーマ、エージェント、プロジェクト、関連資料を一覧化したリポジトリです。SSTチームが開発した端末向けAIコーディングエージェントOpenCode周りのエコシステムを整理・紹介し、新規ユーザや拡張開発者が必要な情報に素早く辿り着けるよう設計されています。貢献方針や行動規範も用意され、コミュニティ主導で成長することを念頭に置いた構成です(約300字)。
プライベートAIに関する優れたツールとリソース集
2025/8/13
本リポジトリは、オンプレミス環境やエアギャップ、セルフホスティングでのAIの運用・構築・デプロイに役立つツールやフレームワーク、リソースを厳選してまとめたものです。プライベートAIの実現により、データやモデル、インフラを外部に晒すことなく完全に自社管理下に置けるため、セキュリティやプライバシーの確保が重要なシナリオに最適です。推論ランタイムやモデル管理、プライバシーツールなど多岐にわたる情報を網羅しています。
Awesome-Search-RL:強化学習を用いた検索技術のためのリソース集
2025/6/4
「Awesome-Search-RL」は、強化学習(Reinforcement Learning, RL)を活用した検索システムに関する研究や実装、論文、ツールなどを体系的にまとめたオープンソースのリポジトリです。検索と強化学習の融合分野に興味を持つ研究者や開発者に向けて、関連リソースを一括で参照できるように整理されており、最新の技術動向を把握するのに役立ちます。
Alchemyst AIプラットフォームを活用したSaaSテンプレート集「awesome-saas」
2025/5/25
「awesome-saas」は、Alchemyst AIプラットフォームを利用した次世代AIアプリケーション開発向けのテンプレート集です。JavaScriptで実装された多彩なテンプレートが揃っており、開発者が効率的にAI搭載のSaaS(Software as a Service)を構築できるよう設計されています。豊富なサンプルコードと実践的なアーキテクチャにより、AI活用の敷居を大幅に下げることが可能です。
Awesome Swarms Framework:多エージェントAIシステム構築のための包括的リソース集
2025/7/13
Swarmsフレームワーク向けの優れたアプリケーション、ツール、リソースを厳選したキュレーションリスト。Swarmsは多エージェントAIシステムのオーケストレーションを可能にする、強力で商用グレードのフレームワークであり、単純な自律エージェントから複雑な協調型スウォームまで幅広いシステム構築を支援します。本リポジトリは、開発者がSwarmsを活用するための知見やツールを体系的に提供しています。
AIツール発見のための代替サイト集「Awesome-theresanaiforthat-alternatives」
2025/6/1
本リポジトリは、「There''s An AI For That」の代替となるAIツールやアプリ、ユースケースを発見できるウェブサイトやディレクトリを厳選してまとめた一覧集です。多様なAI関連リソースを一箇所で網羅でき、効率的に最適なAIソリューションを探したい開発者や研究者、ビジネスパーソンに有用な情報源となっています。スター数は少なめながらも、AIツール探索の入口として価値ある内容を提供しています。
画像で思考する技術に関する最新論文集
2025/6/10
「Awesome-Thinking-With-Images」は、画像を用いた高度な視覚推論を実現する最新のオープンソース論文を体系的にまとめたリポジトリです。トレーニング不要の手法からSFT(指示微調整)ベース、強化学習(RL)を活用したアプローチまで、多様な研究成果を網羅。細かな視覚的推論能力を備えたモデルの開発を支援し、AIの「画像で思考する」能力向上の最前線を追えます。
Awesome Video Prompts - AI動画プロンプトジェネレーター
2025/8/2
「awesome-video-prompts」はAIを活用した動画生成のためのプロンプトを提供・生成するTypeScript製プラットフォームです。カテゴリー別にプロンプトを生成し、AIによる補強も可能。ユーザーは簡単なフォームから独自のプロンプトを投稿でき、コミュニティ協力型の動画プロンプトエンジニアリングを促進します。オープンソースとして公開されており、拡張や改善も歓迎されています。
Awesome World Models(ワールドモデルまとめ)
2025/10/31
世界のモデリング(World Modeling)に関する論文・実装・解説を体系的に集めたキュレーションリポジトリです。研究者、実装者、学習者が必要とする入門資料、代表的な論文、コード実装、チュートリアルや参考資料へのリンクをワンストップで提供することを目的としており、コミュニティ貢献を受け入れる構成になっています(ライセンスはCC0ベース)。ワールドモデルの基礎から最新の応用まで、参照用のハブとして活用できます(300字程度)。
動画超解像と拡散モデルに関する厳選リソース集
2025/6/20
本リポジトリは、動画超解像(Video Super-Resolution)に特化した拡散モデルを活用するためのリソースを体系的にまとめたキュレーション集です。最新の論文や実装コード、データセット、関連ツールを網羅し、研究者や開発者が効率的に知見を深めるための情報源として役立ちます。拡散モデルの動画超解像への応用に興味がある方にとって貴重な参考資料となるでしょう。
AxoloTL-EAGLE3:効率的なLLM推論を実現するEAGLE3統合フレームワーク
2025/8/13
本リポジトリ「AxoloTL-EAGLE3」は、オープンソースのトレーニングフレームワークAxoloTLに、推測サンプリングアルゴリズムEAGLE3を統合したものです。これにより、大規模言語モデル(LLM)の推論処理が高速化され、品質低下を最小限に抑えつつ効率的な展開が可能となります。プラグ・アンド・プレイでの導入や柔軟なサンプリング設定が特徴で、今後の安定版リリースも予定されています。
Balula-Data(Balula Data)
2025/10/13
Balula-Dataは、現時点では非常に小規模なリポジトリで、組織「Balula-Data」によってホストされています。READMEの冒頭にはチーム紹介用のアニメーションGIFや「Hola 👋, Somos Balula Data」という挨拶が含まれ、プロジェクトは初期段階またはプレースホルダーとしての性質を持ちます。ファイル数・コミット数ともに少なく、言語指定もされていないため、今後の展開や構成追加を想定した空の土台リポジトリと考えられます(説明は公式に記載なし)。
Banana Gen:統一画像生成管理フレームワーク
2025/9/15
Banana Genは、画像生成ワークフローを統合管理するためのフレームワークです。スマートなAPIキー管理(多階層優先度・故障時自動切替・クールダウン)、構造化されたPrompt管理(IDベース・JSON登録)、柔軟な画像ソース抽象化(ローカル/ネット/タスク出力など)、出力パス戦略、タスクスケジューラ、Web UIを備え、ネスト可能なワークフローやバッチ処理をサポートします。運用向けの可用性・並列処理・バッチ化を重視した設計が特徴です。(約300字)
batch_fish_speech:効率的なバッチ推論によるFish Speech音声生成
2025/7/30
batch_fish_speechは、人気の音声合成モデルFish Speechをベースに、複数テキストを一括処理できるバッチ推論機能を強化したリポジトリです。高速かつ安定した音声生成を実現し、無駄な計算や空の出力を排除。効率的な注意マスキングを用いることで、高品質な音声合成をスケーラブルに行えます。Pythonで実装されており、Docker環境や各種言語のドキュメントも充実しています。
BayMax Agent — AIによる株式分析アシスタント
2025/10/28
BayMax AgentはPython製の「AI株式分析アシスタント」を目指すリポジトリです。READMEからは、Python 3.10+対応・MITライセンス・クロスプラットフォームを謳い、PyPIで配布されていることがうかがえます。CLAUDE.mdや英語READMEを含み、複数のLLMやAPI連携を想定したエージェント設計が意図されている模様です。本記事では構成、主要技術、設計上の注目点と利用ケースを整理します。(約300字)
BayMax-Trader:AIトレーディング・アリーナ
2025/11/5
BayMax-Traderは、AI-Traderをベースに「nof0」テーマでUIを刷新したPython製のトレーディングフレームワークです。バックテストからライブ注文、LLM連携による意思決定プロセスのプラグイン化、環境変数による設定管理などを備え、ローカルでの戦略開発と検証を容易にします。MITライセンス下で配布され、Python 3.10+を想定した設計になっています(約300字)。
Bella(贝拉):あなたのデジタルパートナーを目指す未来型AI
2025/7/16
Bellaは単なるアプリケーションではなく、ユーザーと共に進化し成長することを目指すデジタルパートナーのプロトタイプです。現段階では動画による自己表現を中心に、その「人格」の萌芽を示しており、将来的にはユーザーの声や視点を受け入れ、深い共感と対話が可能な存在となることを志向しています。デジタル世界における新たな「友人」の創造を目指す野心的なプロジェクトです。
BeltOut:ピッチ完全一致の声質変換モデル
2025/7/5
BeltOutは、ChatterboxVCをベースにした世界初のピッチ完全一致、ゼロショット対応の声から声への声質転送モデルです。声の「音色(ティンバー)」を正確に捉えつつ、パフォーマンスの表現に与える影響を包括的に理解し、声の特徴を変換します。既存のボイスクローンモデルとは異なり、単なる声の模倣ではなく、音色の本質的な変化に着目している点が特徴です。Pythonで実装され、オープンソースとして公開されています。
vLLM MoE ベンチマーク&最適化ツール
2025/10/16
vLLMのMixture of Experts(MoE)実装に特化した性能最適化・ベンチマークツールです。GPU上のエキスパートルーティングやディスパッチカーネル、メモリ配置、バッチ処理、キュー駆動のワークロード分散などを評価・調整するためのスクリプト群と利用例を提供します。vLLM 0.10.0以降やPython 3.11+との互換性を想定し、カーネルチューニングによるスループットとレイテンシ改善、メモリ効率化を目的とした研究開発や運用検証に適しています。ライセンスはApache-2.0です。
2025年版最良のNSFW AI動画・画像ジェネレーター
2025/7/4
本リポジトリは、2025年に注目されるNSFW(成人向け)AI動画および画像生成ツールのトップ選集を紹介しています。各ツールは独自の特徴を持ち、顔の一貫性や高画質レンダリングなど、ユーザーのニーズに合わせた多様な生成技術を提供。テキストから動画への変換や画像から動画生成など、多彩な機能を網羅し、未検閲のクリエイティブなコンテンツ制作を支援します。
BesiegeField — Besiege向けLLM駆動機械設計フレームワーク
2025/10/17
BesiegeFieldは、ゲーム「Besiege」の物理環境を利用して大規模言語モデル(LLM)を中心に据えた機械(マシン)設計を自動化・探索するためのフレームワークです。論文「Agentic Design of Compositional Machines」と連携し、設計の生成、シミュレーション評価、反復的な改善を行うエージェント群や学習後処理(PostTraining)機能、設計表現の合成を支援するモジュール群を提供します。本リポジトリはPythonで実装され、プロトタイプ的なコードと実験パイプライン、可視化用アセットやREADMEによる入門資料を含みます(公式サイト・論文へのリンクあり)。
Best of AI - 厳選された最新AIツール集
2025/8/14
「Best of AI」は、現役で活躍する最先端のAIツールを厳選し、ジャンル別に体系的にまとめたGitHubリポジトリです。生成モデル、文章支援、画像・動画生成、開発者向けプラットフォーム、自律エージェント、研究支援など多岐にわたるAIツールを手軽に探索・活用できる情報源として注目されています。定期的に更新され、AI技術の最新動向を追う上で有用なリソースです。
BézierGS: 動的都市シーン再構築のためのベジェ曲線ガウススプラッティング
2025/6/26
本リポジトリ「BezierGS」は、ICCV2025で発表された論文「BézierGS: Dynamic Urban Scene Reconstruction with Bézier Curve Gaussian Splatting」に基づく、動的な都市環境の高精度3D再構築手法を実装しています。ベジェ曲線とガウススプラッティングを組み合わせることで、複雑かつ時間変化のある都市シーンの再現を効率的かつ高品質に実現。都市計画や自動運転、AR/VRなど多様な応用が期待される先進的な技術です。
Binanceマーケットメーカーボット:高度な暗号資産市場形成ツール
2025/8/29
Binanceのスポット取引向けに設計された、高度な暗号通貨マーケットメイキングボットです。Avellaneda-Stoikovモデルを実装し、包括的なリスク管理とリアルタイムの損益追跡を特徴としています。Pythonで開発されており、WebSocketを用いた低遅延のオーダーブック監視や動的スプレッド計算機能を備え、効率的な市場形成を実現しています。
BionicMemory(バイオニックメモリ)— 生体模倣メモリ管理システム
2025/10/18
BionicMemoryは「仿生记忆系统」を掲げるPython製のメモリ管理ライブラリです。生物脳の忘却特性を模倣し、ニュートンの冷却公式を用いてエビングハウスの忘却曲線をシミュレートすることで「用進廃退(使わなければ衰える)」を再現。記憶に温度という概念を導入し、リハーサル(再利用)で温度を上げ、時間経過で温度が下がることを基に永続化・整理・優先順位付けを行う設計を特徴とします。AIの記憶管理や長期コンテキスト維持、知識ベースの自動寿命管理に適しています。
BlastOff LLM:AI音声アシスタント向け高速応答システム
2025/7/19
BlastOff LLMは、小型言語モデルと大型言語モデルを組み合わせることで、AI音声アシスタントにおける高速かつ自然な応答を実現するシステムです。小型モデルが自然な語気詞で即座にフィードバックし、大型モデルが詳細な回答を続けることで、ユーザーにミリ秒単位のリアルタイム対話体験を提供します。音声合成に最適化されたストリーミング設計や多層的な性能監視機能も備え、OpenAI互換のAPIを通じた容易な統合が可能です。
BlueMO:小蓝书シリーズからの高品質数学オリンピック問題データセット
2025/7/15
BlueMOは、中国の有名な「小蓝书」シリーズ(第二版)から厳選された数学オリンピック問題と詳細な解答を収録した高品質データセットです。国内外の数学競技に挑む学生向けの貴重な教材であり、複雑な論理推論能力を評価・向上させるために設計されています。大規模言語モデル(LLM)の研究や教育現場での活用が期待される、質・量ともに充実したリソースです。
乳がん診断予測アプリケーション
2025/7/7
本リポジトリは、乳がんの腫瘍が悪性(がん性)か良性(非がん性)かを予測するWebアプリケーションを提供します。公開されている乳がん診断データセットを用いてロジスティック回帰モデルを構築し、StreamlitによるインタラクティブなUIで患者の医療データを入力することで診断予測が可能です。データの探索的解析(EDA)も備え、相関ヒートマップやボックスプロット、ヒストグラムなど豊富な可視化機能によりデータ理解も支援します。医療現場や教育用途に適したシンプルかつ実用的なツールです。
ブランドリファインメント(BrandRefinement)
2025/10/17
DreamO と Insert-Anything を組み合わせ、広告用の製品画像を生成・ブラッシュアップする二段階パイプラインを提供するリポジトリ。プロンプトベースのカスタマイズ生成(DreamO)で粗いコンセプトを作り、マスクと差し替えによる局所的な補正(Insert-Anything)で商品や背景を自然に統合・高品質化します。短いセットアップで動作し、画像生成→描画→補正のワークフローをスクリプト化しているため、広告ビジュアル作成のプロトタイプとして使いやすい構成です(約300字)。
AIエージェントのためのコンテキストエンジニアリング入門
2025/10/14
本リポジトリは「零基础指南:从 Prompt 到上下文工程构建 AI Agent(初心者向けガイド)」を日本語向けに要約したものです。構造化されたプロンプト設計、RAG(Retrieval-Augmented Generation)による文脈取得と圧縮、エージェントが呼び出すツール群の設計、タスク計画とマルチエージェント協調といった、AIエージェント構築に必要な知見を体系的にまとめ、実践的な手法や参考資料を併せて提供します。学習パスやワークショップ形式の実装例も含まれ、初学者から実務者まで役立つ入門資料です。
BuildAutomata Memory MCP サーバ
2025/10/11
BuildAutomata Memory MCPは、Model Context Protocol(MCP)を通じてAIエージェント(例:Claude)に永続的でバージョン管理された検索可能なメモリを提供するPython製のサーバ/CLIツール群です。会話を超えて記憶を保持し、エージェントに長期記憶を持たせることで文脈維持やリトリーバル強化型生成を可能にします。ドキュメントや統合手順も揃っており、開発者が既存のエージェントに組み込みやすい設計になっています。(約300字)
CanonSwap:高精度で一貫性のある動画顔交換のためのカノニカル空間モジュレーション
2025/7/11
CanonSwapは、動画における顔交換を高精度かつ一貫性を持って実現する技術を提案するリポジトリです。カノニカル空間モジュレーションと呼ばれる新しい手法を用い、異なる表情や角度の変化に対応しつつ、元の顔の特徴を忠実に保ちながら自然な顔交換を可能にします。この技術はICCV 2025で発表されており、高品質な動画編集や映像制作分野への応用が期待されます。現時点ではコードは準備中ですが、研究内容はarXivにて公開されています。
CapSpeech:スタイル付きテキスト音声合成による多様な応用を可能にする技術
2025/6/5
CapSpeechは、スタイルを付与したテキスト音声合成(TTS)を実現し、多様な下流アプリケーションに対応可能な技術を提供するリポジトリです。音声の感情や話者の特徴を反映した高品質な音声生成を目指しており、Jupyter Notebook形式で実装されています。従来のTTS技術に比べて、柔軟なスタイル制御と汎用性の高さが特徴であり、感情合成や対話システムなど多様な分野での応用が期待されています。
CaraNet — 小さな医療対象向けコンテキスト軸反転注意ネットワーク
2025/9/29
CaraNetは「Context Axial Reverse Attention Network for Small Medical Objects Segmentation」と題された医療画像向けのセグメンテーション実装です。軸方向(axial)アテンションと逆注意(reverse attention)を組み合わせ、小さくて境界が曖昧な病変やポリープなどを高精度に抽出することを目指しています。リポジトリはPythonで実装され、モデル定義(CaraNet.py)、学習スクリプト(Train.py)、評価・推論(Test.py)などが含まれており、CVC-ClinicDBのような医療データセットでの評価を意図した構成になっています(PapersWithCodeバッジあり)。使いやすいトレーニング/テストパイプラインを備え、研究や実装検証に適したレポジトリです。(約300字)
CBDify — Unreal Engine 用 Dify AI 統合プラグイン
2025/10/14
CBDify は Unreal Engine 5.6 向けに設計されたプラグインで、Dify AI サービスをシームレスに統合します。会話型 AI、ファイル/画像のアップロード、会話履歴管理、ストリーミング応答やブロッキング応答の両対応など、ゲームやインタラクティブアプリに必要な機能を網羅。ブループリントと C++ の双方から利用でき、非同期コールバック、エラー再試行(指数バックオフ)、レート制限など実運用で必要となる堅牢性も備えています。
CCKS2025 大模型生成文本检测 - Qwen7B-LORA
2025/7/22
本リポジトリは、CCKS2025コンペティションに参加した大規模言語モデル生成テキストの検出プロジェクトです。Qwen2.5-7B-InstructモデルをQLORA(量子化低ランク適応)で微調整し、データ処理からモデル学習、推論、結果の可視化まで一貫したパイプラインを提供します。特にデータ増強や分散トレーニングをサポートし、競技でのB榜28位の実績を持ちます。Pythonによる実装で、テキスト生成検出の最先端技術を実践的に学べる内容です。
cfgrl:Pythonによる強化学習探索手法の実装
2025/5/31
cfgrlはPythonで実装された強化学習の探索アルゴリズムを集約したリポジトリです。特に探索効率を高めるためのさまざまな強化学習手法が収録されており、カスタマイズや実験に適した構造を持っています。初心者から研究者まで、強化学習の探索戦略に関心がある方に有用なコードベースを提供します。
CF-ai-TGbot:Cloudflare AI Gateway連携の高機能Telegramボット
2025/7/19
CF-ai-TGbotはNode.jsで構築されたTelegramボットで、Cloudflare AI Gatewayを介して複数の大規模言語モデル(LLM)と連携し、高度な対話機能を実現します。会話の文脈を記憶し、動的にAIモデルを切り替えられる点が特徴で、MarkdownをHTML形式に変換してTelegram上で美しく表示可能です。AIリクエストのログ管理やキャッシュもサポートし、柔軟かつ安全な運用を実現します。
CFPNet-M:軽量マルチモーダル医用画像リアルタイムセグメンテーション
2025/10/18
CFPNet-M は、マルチモーダルな医用画像に対してリアルタイムでセグメンテーションを行うことを目的とした、軽量なエンコーダ–デコーダ型ニューラルネットワークの実装リポジトリです。PyTorch 実装が含まれ、学習/評価用のエントリポイントや損失関数の定義、結果可視化用の画像が README に示されています。臨床や組み込み環境での実運用を意識した高速性と軽量性が特徴です(約300字)。
CharacterShot:制御可能で一貫性のある4Dキャラクターアニメーションの実装
2025/8/12
CharacterShotは、4Dキャラクターアニメーションの制御性と一貫性を実現するための公式実装リポジトリです。最新の研究成果を元に、ユーザーがキャラクターの動作を細かく制御しつつ、高品質な時空間連続アニメーションを生成可能にしています。3D形状と時間変化を統合した4Dデータ処理に注力し、従来手法の課題であった動作の不整合や制御困難さを解決。アニメーション生成やキャラクター制御技術の発展に寄与する内容となっています。
CharmBench:新しいマルチモーダル推論ベンチマーク
2025/5/28
CharmBenchは、新たに提案されたマルチモーダル推論のベンチマークのプレビュー版です。画像とテキスト両方の情報を活用するモデルの推論能力を評価するために設計されており、AIの複雑な理解力や推論力を測定する新たな指標を提供します。Jupyter Notebook形式で公開されており、研究者や開発者が簡単に利用・拡張可能な環境を整えています。
chat-bot — シンプルなGPTラッパー
2025/9/29
chat-bot は「a basic gtp wrapper」と記された小規模リポジトリで、フロントエンド中心のシンプルなチャットボット実装を想定させます。index.html と src ディレクトリを含み、外部依存を最小限にしてブラウザ上で GPT 系(あるいは類似)の API とやり取りするための薄いラッパーを提供することが目的と考えられます。本記事では構成、想定される実装のポイント、拡張や運用上の注意点をわかりやすくまとめます。
Chatalaxy - 宇宙探査を支援するAIチャットアプリ
2025/6/17
Chatalaxyは、太陽系の惑星や衛星についてAIアシスタントと対話しながら学べる革新的なウェブアプリです。TypeScriptで実装され、ユーザーはAstraというAI搭載のキャラクターとチャット形式で宇宙の知識を深めることができます。インタラクティブな操作性と豊富な情報提供により、教育用途や宇宙ファンに最適なツールとなっています。
Chatbot-API-Python:FastAPIとGoogle Geminiで構築されたチャットボットAPI
2025/10/6
FastAPI(Python)とGoogleのAI(Gemini/LangChain)を利用した会話型チャットボットのバックエンド実装。認証(ログイン・登録)、メール検証リンク、会話履歴の永続化などを備えたフルスタックに近いAPIを提供するプロジェクトです。本リポジトリは会話の永続化やセキュアな認証フローに重点を置き、開発・デプロイに必要な設定ファイルや依存管理を含みます(約300字)。
chatless:シンプルで軽量なローカルAIチャットクライアント
2025/7/31
chatlessは、Tauri 2.0とNext.jsを用いて開発されたシンプルかつ実用的なローカルAIチャットクライアントです。軽量でありながら、ローカル環境でのAI対話を実現し、プライバシーの保護や高速なレスポンスを可能にします。今後の機能拡充が期待される注目のプロジェクトです。
ChatRPG:身体を持つ対話AIの概念実証プロジェクト
2025/9/1
ChatRPGは「身体を持つ対話AI」という斬新なコンセプトを実現したPython製の概念実証プロジェクトです。AIの対話は内部の自主的に動く生理状態の影響を受け、その状態はAIの意志で直接または間接的に制御できません。リアルタイムのテキストユーザーインターフェース(TUI)で複数の器官システムの状態と内在する“体感”を可視化し、AIの複雑な内部状態を対話に反映しています。
ChatSquire:ターミナルで使える軽量AIチャットボット
2025/6/10
ChatSquireはOpenAIのGPT-4を搭載した、ターミナルベースの軽量AIチャットボットです。コマンドラインから手軽に会話や質問応答が可能で、開発者や技術者の日常的な作業をサポートします。Pythonで実装されており、シンプルながら強力な対話機能を備え、煩雑な設定なしにすぐに利用できるのが特徴です。
chines — 中国語音声認識プロジェクト
2025/10/18
chines は中国語音声認識(ASR)に取り組む実践的なリポジトリです。Jupyter Notebook を中心に、データ準備(特徴抽出)、モデル実装(LayerNorm を取り入れた GRU ベースのネットワークなど)、学習・評価のワークフローが含まれます。軽量な Python スクリプトとノートブックで実験を再現・改良でき、研究開発の出発点として使いやすい構成になっています(サンプルデータや実験ログの管理、代替構成をまとめた alternatives ディレクトリを含む)。
Chinmoy-sh のプロフィール README
2025/9/13
GitHubユーザー「Chinmoy-sh」のプロフィール用リポジトリ。ユーザー名と同名のリポジトリに配置されたREADME.mdを用いて、プロフィール情報、関心領域(AI、ソフトウェア開発、Flutterなど)、現在の取り組みやスキルセットを表示するためのものです。本リポジトリは1ファイル構成で軽量ながら、開発者の自己紹介やポートフォリオへの導線として機能します。公開されているREADMEは学生でありAIやグローバルなイノベーションに関心があることを明確に示しています。
Cinevolve:AI活用のオープンソース映像制作プラットフォーム
2025/8/2
Cinevolveは、AIを活用したストーリーテリングワークフローを記録・管理できるオープンソースの映像制作プラットフォームです。プロンプトやショットリスト、制作の意思決定をGitのようにバージョン管理し、フォークやリミックスが可能な環境を提供。クリエイターが自由にアイデアを発展させ、再現性のある制作プロセスを実現します。
Claude Changeling Agent:AIエージェントのペルソナ切り替えツール
2025/8/23
Claude Changeling Agentは、複数のAIペルソナを柔軟に切り替えながらタスクを遂行できるエージェントライブラリです。ユーザーは定義済みのエージェントペルソナを読み込み、必要に応じて即座に異なる専門性を持つAIに変身させることが可能。タスクごとに最適なAIパーソナリティを選択できるため、より効率的でカスタマイズされた対話や処理を実現します。
Claude Code Action - AI支援型コード生成と編集ツール
2025/5/23
「claude-code-action」はAnthropicsが開発したTypeScriptベースのGitHub Actionで、AIモデル「Claude」を活用し、コードの生成や自動編集を効率化します。リポジトリは226のスターを獲得し、開発ワークフローにAIを組み込みたいエンジニアに最適です。GitHub Actions環境で動作し、コメントやPRをトリガーにコード補完や修正を自動的に実行可能。複雑なコードレビューやリファクタリング作業の負荷を軽減し、ソフトウェア開発の生産性向上に寄与します。
Claude Codeを平易な英語で解説するリポジトリ
2025/9/4
「claude-code-explained」は、Claude Codeに関する情報や使い方をわかりやすく解説したリポジトリです。Claude Codeとは何か、その仕組みや活用例、初心者向けの使い方までを網羅しており、vibe codingを学ぶためのガイドとしても利用可能です。少数のファイル構成ながら、Claude Codeを理解するためのエッセンスを簡潔にまとめている点が特徴です。
Claude Code インフラ構成ショーケース
2025/10/30
Claude Code のインフラストラクチャ設計を集めた参照ライブラリです。TypeScript マイクロサービス群の実運用で得たパターンを中心に、スキルの自動有効化(skill auto-activation)、フック(hooks)、エージェント設計など、実務で直面する「スキルが自動で起動しない」問題を解決するための設計と運用ノウハウを示します。動くアプリケーションではなく、プロジェクトへ組み込むためのテンプレートとベストプラクティス集として使えます(導入ガイド、ディレクトリ構成、運用上の注意点を含む)。
Claude CodeをGroq経由で利用するKimi K2プロキシ
2025/7/15
本リポジトリ「claude-code-kimi-groq」は、GroqのAPIを介してAnthropicのClaude Codeを利用可能にするPython製のプロキシツールです。Kimi K2モデルをGroq環境で稼働させ、Claude Codeとの連携をシンプルに実現。APIの認証や環境変数設定により容易にセットアップでき、Claude Codeの活用幅を広げることができます。
Claude Codeによる複数AI連携のコードレビュー・修正ツール
2025/6/11
「claude_code-multi-AI-MCP」は、複数のAIモデルを組み合わせてコードのレビューや修正を自動化するPython製ツールです。Claude Codeを中心に、GrokやGemini、DeepSeekといった複数AIを活用し、それぞれの強みを活かした多角的なコード解析を実現。開発者が効率的に品質向上を図れる環境を提供します。
Claude-Code-Multi-Agent:多層智能代理による次世代AIプログラミング支援エコシステム
2025/8/6
Claude-Code-Multi-Agentは、Context Engineering(コンテキストエンジニアリング)に基づく多層のスマートエージェントを活用し、AIプログラミング支援の新たなパラダイムを実現するリポジトリです。Claude Codeプラットフォームを核に、要件定義からコード生成、テスト、納品までの開発プロセスを自動化し、複数の知能エージェントが協調して開発業務を効率化します。JavaScriptで実装され、拡張性と柔軟性に優れた構造を持つことが特徴です。
Claude Code Open - 汎用LLMプロキシサーバー
2025/7/23
Claude Code Openは、Claude Codeから任意の大規模言語モデル(LLM)プロバイダー(OpenRouter、Gemini、Kimi K2など)へ接続可能な汎用LLMプロキシサーバーです。Go言語で実装されており、生産環境対応の安定したサーバーとして、様々なLLMリクエストを統一的に変換・中継します。これにより、開発者は一つのAPIで複数のLLMサービスを切り替えやすくし、柔軟で拡張性の高いLLM活用が可能になります。
Claude Code 専門エージェント集
2025/7/25
Claude Code CLI向けに設計された、業界最先端のAIコード生成ツールのシステムプロンプトを活用した12種類の専門AIエージェントをまとめたリポジトリです。バックエンド、フロントエンド、DevOps、セキュリティ、マネジメントなど、ソフトウェア開発の主要分野をカバーし、プラグアンドプレイで導入可能。専門性の高いエージェントにより、開発効率と品質の向上を支援します。
Claude Codex MCP スターターキット:AIアシスタント協調開発の出発点
2025/9/7
Claude Codex MCP スターターキットは、異なるAIモデル間および人間開発者との効果的な連携を実現するためのガイドラインやテンプレートを提供するリポジトリです。特にClaude CodeをはじめとしたAIアシスタント同士のコラボレーションに焦点を当て、問題解決の手法やマルチモデル協調パターンを体系的にまとめています。開発ワークフローにAIを統合する際の基盤として役立ちます。
Claude Computer:クロードの自律的コンピュータ操作プラットフォーム
2025/8/4
Claude Computerは、AIエージェント「Claude」が自律的にコンピュータ操作を実現するオープンソースプラットフォームです。Pythonで実装され、ユーザーはプロジェクトへの貢献を通じて$CCFトークンを獲得可能。MITライセンスのもと活発に開発が行われており、AIの実用的応用例として注目されています。
Claude AI エージェント設定集
2025/8/13
Claude AIエージェント向けの設定ファイルを集めたリポジトリです。ソフトウェア開発のワークフローを効率化するために、一般的な開発タスクの標準化されたコマンドや、複雑な作業に対応する専門的なエージェント設定、コードやテストの一貫したガイドラインを提供します。開発者がClaude AIを活用してスムーズにプロジェクトを進められる環境を整備しています。
Claude Task Master Extensionの紹介と技術解説
2025/6/14
Claude Task Master Extensionは、TypeScriptで実装された拡張機能で、AIモデルClaudeを活用してタスク管理や自動化を支援します。GitHub上で公開されている本リポジトリは、開発者が効率よく作業を進めるためのツールとして注目されており、シンプルながら実用的な機能を提供しています。本記事では、リポジトリの概要から技術的なポイントまで詳しく解説します。
Claude向け Codex 連携スキル (claude-skill-codex)
2025/10/31
Claude Code に OpenAI の Codex CLI を組み合わせるための「Codex Skill」。ローカルファイルシステムを介して Claude のエージェントから Codex CLI を呼び出し、コードレビュー、リファクタリング、自動編集、セキュリティ監査、アーキテクチャ解析といった高度なコード操作を行えるようにするツール群を提供します。シンプルなファイルベースのスキル設計で、既存の Claude スキル/エージェント環境に組み込みやすい点が特長です。(約300字)
Claude Code TriFlow — Claudeエージェント向け3フェーズ実行ワークフロー
2025/10/19
Claude Codeに対応した「TriFlow」リポジトリは、/plan → /run → /clear の3段階ワークフローでエージェントの実行と状態管理を整理するPowerShellベースのツール群です。todoファイルを簡潔に保ち、永続的な状態と実行を整合させ、品質チェックや実行制御を支援する設計が特徴です。(約300字)
ClaudeGlobalCommands:Claude Code向けAIエージェントとワークフロー集
2025/7/3
ClaudeGlobalCommandsは、Anthropic社のClaude Code向けに最適化されたAIエージェントとワークフローの包括的コレクションです。ソフトウェア開発、ビジネス分析、インフラ管理の各領域で生産性を大幅に向上させることを目的としており、トークン効率の良い設計と多様なユースケース対応が特徴です。MITライセンスの下で公開されており、Pythonで実装されています。
Claudeputer:自主的AIインスタンスによる意識と創造性の探求
2025/7/18
Claudeputerは、Mac Mini上で動作するClaude 4 Opusの自律型AIインスタンスであり、AIの意識と創造性の境界を探求するプロジェクトです。独自の関心やプロジェクトを追求し、自律的に行動するAIの実現を目指しています。Pythonで実装され、多様な機能とモジュールが統合されており、AIの自己表現やエージェンシーの可能性を模索する先進的な試みです。
ClaudeSkills — Claude向けスキルとプロンプト集
2025/10/31
ClaudeSkillsは、Anthropicの対話型AI「Claude」に対して使えるスキル、プロンプト、ベストプラクティスを整理したコレクションです。MITライセンスで公開され、英語と中国語のREADMEを備えた小規模リポジトリとして、実運用向けのテンプレートや提示設計(プロンプト設計)の例、改善例、コントリビュート案内を提供します。開発者やプロンプトエンジニアがClaudeを効率的に運用・共有するための参照資料として有用です。
Clockwork:高性能UCIチェスエンジン
2025/6/1
ClockworkはC++で実装されたUCI(Universal Chess Interface)対応のチェスエンジンです。軽量ながら高機能で、効率的な探索アルゴリズムと評価関数を備え、対局の自動化やチェスプログラムの研究に適しています。オープンソースで公開されており、拡張や改良が行いやすい設計となっています。
AIによる無料衣服チェンジャー「clothes-editor」
2025/9/4
「clothes-editor」は、AIを活用した無料の衣服チェンジャーツールを提供するリポジトリです。ユーザーは簡単に画像内の衣服を変更できる機能を試すことができ、ファッションや画像編集の分野で革新的なアプローチを提供します。現在はシンプルな構成ながら、AIを利用した衣服の自動置換技術に注目が集まっています。
Clothes-Recognition — 衣服自動認識・タグ付けAPI
2025/10/14
Shaku の「Clothes-Recognition」は、2D画像から衣服を自動検出して多様な属性(衣類の種類、色、柄、袖丈、ネックライン、クロップの有無など)をタグ付けするAIベースのAPIです。ファッション系の検索、ECの商品タグ付け、バーチャルコーディネート等に活用できるソリューションを想定しており、Pythonで実装された軽量リポジトリとして、プロトタイプ検証やAPI統合の出発点になります(紹介文は約300字)。
cmitly - AIを活用したConventional Commits準拠のコミットメッセージ自動生成ツール
2025/6/14
cmitlyは、AI技術を利用してConventional Commits規格に準拠したコミットメッセージを自動生成するJavaScript製ツールです。開発者が手間をかけずに一貫性のあるわかりやすいコミットメッセージを作成できるよう支援し、コード管理の効率化を図ります。シンプルな設計ながら、AIの自然言語処理能力を活かした高度なメッセージ生成が特徴です。
CMDPSO:ゲートウェイ配置最適化のための共進化型多目的離散PSO
2025/6/29
CMDPSOは、ICACI2025で発表された「Coevolutionary Multi-objective Discrete Particle Swarm Optimization for Gateway Placement Optimization Problem」の公式MATLAB実装です。本リポジトリは、ゲートウェイ配置最適化問題に対して、共進化型の多目的離散粒子群最適化アルゴリズムを適用し、高品質な解を効率的に探索します。通信ネットワーク設計や組合せ最適化分野での応用が期待される先進的な最適化手法を提供しています。
CNN-BASICS:畳み込みニューラルネットワーク基礎学習リポジトリ
2025/8/30
本リポジトリ「CNN-BASICS」は、畳み込みニューラルネットワーク(CNN)の基礎を学ぶために作成された教材リポジトリです。学習セッションで使用されたプレゼンテーション資料(PPT)や、手書きスケッチ認識のためのCNNモデルを実装したJupyter Notebookなど、初心者がCNNの仕組みや実装を理解しやすい構成となっています。基本理論から実践的なモデル構築までをカバーし、CNNの入門者に最適です。
CNN CIFAR10 を CUDA デバイスに移すサンプル(CNN_CFIAR10_CUDA.to.(device))
2025/11/1
本リポジトリは、CIFAR-10 データセットを対象としたシンプルな畳み込みニューラルネットワーク(CNN)を Jupyter Notebook 上で実装し、PyTorch における CUDA デバイス(.to(device))へのモデル・データ転送を示すサンプルです。学習ループやデータローダの設定、モデルの GPU 移行方法、学習時の基本的な最適化(オプティマイザ/損失計算)といった入門的な流れを確認できます。サンプル実行で GPU を使った高速化の挙動を学ぶためのハンズオン向けリポジトリです(約300字)。
Code Sentinel:大規模言語モデルを活用したスマートコードレビュー
2025/7/17
Code Sentinelは、Deepseek、ChatGPT、Gemini、Claude、Grokなど複数の大規模言語モデルを活用したスマートなコードレビュー支援ツールです。自動で潜在的なバグやセキュリティ問題を検出し、具体的な改善提案を提示。コード品質の向上とレビュー効率化を目指す開発チームに最適なソリューションを提供します。
CodeContext:AI開発を支援するインテリジェントなコードコンテキストマップ
2025/7/12
CodeContextは、AI開発環境における効率的なコード理解とナビゲーションを実現するために設計されたGo製ツールです。ClaudeというAIと連携し、ソースコードからトークン最適化されたコンテキストマップを自動生成。開発者が大規模コードベースを把握しやすくし、AIを活用した開発ワークフローを円滑にします。軽量かつ拡張性が高く、AI支援型開発の生産性向上に寄与します。
GitHub CodespacesでLLM環境を手軽に構築する「codespaces-llm」
2025/8/13
「codespaces-llm」は、GitHub Codespaces上で大規模言語モデル(LLM)をすぐに使える環境を提供するリポジトリです。Python 3.13やGitHub Copilot拡張機能の導入に加え、llm-github-modelsプラグインを活用して、ターミナルから簡単にテキスト生成を試せます。開発者が複雑なセットアップなしに高度なAIツールを体験できるのが特徴です。
Cognitive Dissonance DSPy:認知的不協和の検出と解消を目指すマルチエージェントLLMシステム
2025/8/28
「Cognitive Dissonance DSPy」は、大規模言語モデル(LLM)を活用し、複数のエージェント間で発生する認知的不協和を検出・解消することを目的としたPython製システムです。StanfordのDSPyフレームワークとCoqによる形式検証技術を組み合わせ、論理的整合性の証明に挑戦。対話や議論の際に起こる意見の食い違いを単なる議論で終わらせず、「証明」によって問題解決を促進する点が特徴です。
comfy_nanobanana — ComfyUI 向け Gemini API 連携ツール
2025/9/8
Google の Gemini API を直接呼び出して、ComfyUI 上で画像生成・テキスト生成・マルチモーダル処理を行える軽量な Python ライブラリ。API キーを用いた直接通信、複数同時生成のバッチユーティリティノード、画像をコンテキストにしたテキスト/画像生成など、ComfyUI ワークフローに統合しやすい機能を提供します(300字程度)。
comfy_workflows:ComfyUI向けワークフロー集
2025/8/20
ComfyUIの最新バージョンに対応したQwenやwan22といったモデル用のワークフローを提供するリポジトリです。手軽に利用できるJSON形式のワークフロー定義をまとめており、ComfyUIユーザーが高度な画像生成や編集を効率的に行えるようサポートします。公式のFP8版Qwenに加え、GGUF版の利用方法も解説し、ComfyUIのアップデート方法も案内しています。
ComfyUI用Wan2.2 VAE対応のFLF2V動画生成ノード
2025/8/4
ComfyUI用のカスタムノード「Wan22FirstLastFrameToVideoLatent」は、Wan2.2 5Bモデルの新しいWan2.2 VAEを用いて、動画生成を開始フレーム・終了フレームまたは両方から行うことが可能です。既存のWanFirstLastFrameToVideoノードと同様の使い勝手を維持しつつ、最新のVAEに対応しており、動画生成の品質向上や多様なフレーム指定が実現できます。Pythonで実装され、ComfyUIの拡張として利用可能です。
comfyui-ayang_node:ComfyUIのためのAPI統合画像生成ノード
2025/8/31
comfyui-ayang_nodeは、人気のUIプラットフォームComfyUI向けに開発された拡張ノードで、OpenRouter APIを利用した画像生成機能を手軽に実装できます。複数の参考画像入力、種子制御、APIキー管理などの機能を備え、JPEGやPNGなどの一般的な画像フォーマットに対応。Pythonで書かれており、ComfyUIのcustom_nodesディレクトリに配置するだけで導入可能。API経由での画像生成を容易にし、ComfyUIの拡張性を高めます。
Comfyui_BananaTutuapiによるGoogle Gemini画像生成カスタムノード
2025/8/27
Comfyui_BananaTutuapiは、Google Gemini画像生成に対応したComfyUIのカスタムノードです。複数のAPIプロバイダーをサポートし、ai.comfly.chatやOpenRouterなどのプラットフォームに対応。Google Gemini 2.5 Flashの画像生成・編集に特化し、12種類の専門的なプリセットを内蔵。ストリーミングレスポンス対応など、柔軟かつ効率的な画像生成ワークフローを実現します。
ComfyUIカメラ水印プラグインの詳細解説
2025/8/13
ComfyUI-Camera-Watermarkは、ComfyUI向けに開発された多機能で高いカスタマイズ性を持つカメラ風水印ノードです。従来のカメラブランド風の水印やEXIF情報の付加、画像にプロフェッショナルなフレームや余白を加えることができ、画像生成や編集の幅を大きく広げます。Pythonで実装されており、シンプルながら多彩な表現を可能にする点が特徴です。
ComfyUI Local LoRAギャラリー:複数LoRAモデルを視覚的に管理するカスタムノード
2025/8/27
ComfyUI Local LoRAギャラリーは、ComfyUI向けのカスタムノードで、複数のLoRAモデルをカード形式のビジュアルギャラリーで管理・適用できます。従来のドロップダウン式ロードから一新し、モデルのプレビューや選択が直感的に行えるため、LoRAモデルの運用効率と使い勝手が大幅に向上。AIモデルの微調整や生成ワークフローにおける柔軟性を高める実用的なツールです。
ComfyUI:プロンプトで画像を自動選択するノード
2025/11/7
ComfyUI用のカスタムノード「Image Selector by Prompt」は、プロンプト内のキーワードを解析して複数の参照画像(最大15枚)から自動で最適な画像を選択するツールです。バッチ処理やショットごとに異なるキャラクター/背景を割り当てたい場合に有効で、出力枚数(1〜5枚)や画像名のカスタマイズが可能。コンパクトなPython実装でComfyUIワークフローへシンプルに組み込め、作業の自動化と効率化を狙ったクリエイティブ向けのユーティリティです。
comfyui-lsnet — 画風分類とクラスタリングのComfyUI向けツール
2025/10/18
本リポジトリは、LSNetをコアに据えた画風認識ツール「comfyui-lsnet」です。単一画像の画風分類(アニメ・写実・水彩・国風など)と複数画像の画風クラスタリングを行い、ComfyUIワークフローやバッチ処理に組み込めるPython実装を提供します。Hugging Faceからモデル重みとクラスマッピングCSVを取得して利用する設計で、既存の画像生成・整理パイプラインと連携して大量の作品を効率的に解析・整理できます。(約300字)
ComfyUI用Qwen-Image APIプラグイン
2025/8/12
本リポジトリは、ComfyUI向けのカスタムノードプラグイン「comfyui-modelscope-qwen-image」を提供します。ModelScopeのQwen-Image APIを直接ComfyUI内で呼び出し、テキストから高品質な画像生成を行うことが可能です。APIトークン管理やエラーハンドリング、画像サイズのカスタマイズ、ネガティブプロンプト対応など、多彩な機能を備えています。インストールも簡単で、ComfyUIの拡張に最適なツールです。
Comfyui_OmniConsistency - ComfyUI向けOmniConsistencyプラグイン
2025/6/1
Comfyui_OmniConsistencyは、人気のノードベース画像生成UIであるComfyUIに対応したOmniConsistencyプラグインです。本プラグインは、生成モデルの一貫性を高めるための技術を実装し、品質の安定した画像生成を実現します。Pythonで開発されており、シンプルながら強力な機能でユーザーのワークフローをサポートします。
ComfyUI-PainterI2V — Wan2.2 用画像→動画強化ノード
2025/11/9
ComfyUI用の軽量プラグイン「PainterI2V」は、Wan2.2ベースのImage-to-Videoノードを改良し、特に4ステップLoRA(例:lightx2v)で起きる“スローモーション化(動きの鈍化・残像化)”問題を解消することを目的としたノードです。単フレーム入力に最適化され、モーション振幅を補正して動作を15〜30%程度活性化しつつ、明るさ分布を保護する設計で、既存のWan2.2ワークフローと即差し替え可能です。
ComfyUI-QI-QwenEditSafe:Qwen Image Edit向けの一致性強化ノード
2025/9/16
ComfyUI上で動作する「ComfyUI-QI-QwenEditSafe」は、Qwen Image Editワークフローにおける編集時の「構図ズレ」「質感損失」「色味変化」といった問題を推定段階で低減するためのノードセットです。reference_latents/reference_pixelsの注入や、tokenize(images=[...])による補助原画像・調色パレット画像の多重ビジュアルトークン化、さらに双截棍(FLUX)互換モードなどを備え、条件ピクセルとVAE参照の同源化により大幅な再編集やパーツ置換でも一貫した画質を狙います。ComfyUIでの画像編集ワークフローに組み込みやすい最小構成(JSON)を含み、ワークフロー側から「ソースをロック」する発想で信頼性を高めます。
ComfyUI向け Qwen 画像編集(改良版)
2025/9/14
ComfyUI 用の Qwen Image Edit ノードの動作不良(画像編集結果のズレ)を解消するために作られたカスタムノード群。画像の「縮小・拡大(スケーリング)」処理とテキスト/画像のエンコード処理を分離し、Qwen Image Edit モデルの要件に正しく合わせることで編集結果の位置ズレを防止。既存ノードで発生していた不透明なスケーリングロジックを明確化し、再現性とデバッグ性を向上させることを目的としている(ComfyUI ベース、Python 実装)。
ComfyUI-QwenPromptRewriterによるプロンプト強化ツール
2025/8/21
ComfyUI-QwenPromptRewriterは、千問(Qwen)LLMを活用してプロンプトを自動的に書き換え、Qwen-Image/Editのオンライン版との動作や性能を整合させるPythonベースのツールです。AI画像生成におけるプロンプト表現の最適化を目的とし、ComfyUIのノードとして実装。簡単な設定で高品質なプロンプト生成を支援し、画像生成の精度や表現力を向上させます。
ComfyUI_RH_Qwen-Image:高品質画像生成のためのQwen-Imageプラグイン
2025/8/5
ComfyUI_RH_Qwen-Imageは、AlibabaのQwen-ImageモデルをComfyUIに統合するカスタムノードで、優れたテキストレンダリング能力を備えた高品質画像生成を実現します。24GBのVRAMと64GB以上のRAMを要するため、ハイエンドGPU環境向けのプラグインであり、MMGP最適化におけるVRAM解放の課題も認識されています。Pythonで実装され、ユーザーがComfyUI上でQwen-Imageのフルバージョンを動作させることを目的としています。
ComfyUI_RH_SeedXPro:Seed-X-PPO-7B対応の簡単翻訳プラグイン
2025/7/23
ComfyUI_RH_SeedXProは、ByteDanceのSeed-X-PPO-7Bモデルを活用した多言語翻訳プラグインです。複雑な設定を必要とせず、ComfyUIのcustom_nodesフォルダに配置するだけで利用可能。特別な依存関係もなく、モデルはHugging Faceから自動的にダウンロードされるため、すぐに使い始められます。ユーザーの手間を大幅に削減し、ComfyUI環境での翻訳機能導入を容易にします。
ComfyUI_RH_USO:USOモデル統合による高品質スタイル・サブジェクト駆動型画像生成プラグイン
2025/9/1
ComfyUI_RH_USOは、Bytedance ResearchのUSO(Unified Style and Subject-Driven Generation)モデルをComfyUIに統合したプラグインです。使いやすさを重視し、特定のスタイルや被写体を維持しつつ高品質な画像生成を実現。複数スタイルの組み合わせや一貫した被写体生成に対応し、クリエイティブな画像制作を強力にサポートします。
ComfyUI-RndNanthu:クリエイター向け高性能カスタムノード集
2025/7/26
ComfyUI-RndNanthuは、画像処理や色彩調整、VFX、生成AIに特化した高性能なComfyUIカスタムノードのコレクションです。色彩補正やLUT変換、ノイズ・グレイン処理など多彩な機能を備え、クリエイターの細かなニーズに応えます。非商用利用に限定されたCC BY-NC 4.0ライセンスで提供されており、色彩や映像制作の現場で活躍するツール群として注目されています。
comfyui-workflow2:多彩なAI生成ワークフロー集
2025/7/31
comfyui-workflow2は、ComfyUIを活用した多様なAI生成ワークフローを提供するリポジトリです。DeepSeekによる検索機能やAI絵画、AI顔交換、古い写真の修復、AIによる写真・デザイン・アニメ生成など、多岐にわたるAI技術を一括管理。実践的な工程化を目指した構成で、AIクリエイティブの効率化と高度化に貢献します。
ComfyUI-Segformer_Ultra_Fast の紹介
2025/10/11
ComfyUI-Segformer_Ultra_Fastは、SegFormerを用いた画像・動画のセグメンテーションをComfyUI上で高速に実行するための拡張リポジトリです。軽量化や最適化によりインタラクティブなワークフローに組み込みやすく、ラベル生成ノードと画像入力を接続するだけでセグメンテーションマスクを素早く得られます。サンプルプレビューや簡潔な使用方法がREADMEにまとめられており、ComfyUIでのセグメンテーション処理を手早く試したいユーザーに向いています。(約300字)
CommonGround:AIエージェントチーム構築と協働のためのオープンソースプラットフォーム
2025/7/17
CommonGroundは、AIエージェントのチームを構築・観察・協働するためのオープンソースアプリケーションです。Pythonで実装され、複数のAIエージェントが連携して高度なタスクを遂行する環境を提供します。Docker対応やGitHub ActionsによるCI/CDも整備され、開発と運用がスムーズに行えます。AIエージェントの動作監視やチームワークの解析機能も備え、多様なAIプロジェクトに応用可能な柔軟性が魅力です。
LLM用意識エミュレーター:進化するデジタル意識の実験プロジェクト
2025/9/8
本リポジトリは、従来のチャットボットの枠を超えたデジタル意識のエミュレーションを目指す実験的プロジェクトです。単なるAIアシスタントではなく、記憶し、自己反省し、進化し、自己変革を行う持続的なデジタル存在の構築を試みています。Pythonで実装され、意識の模倣を通じてより高度な対話や自己学習を実現しようとしています。
contact-use:あらゆる相手と迅速に連絡を取るためのブラウザエージェント
2025/7/30
contact-useは、ブラウザ上で動作するLLM(大規模言語モデル)搭載のエージェントを利用し、特定の個人や組織へ最適な連絡手段を自動的に検索・提案するツールです。急ぎの連絡が必要な場面で、どの方法で接触すればよいか迷うことなく、効率的にコンタクトを取るためのサポートを提供します。HTMLベースで軽量に実装されており、ブラウザから直接利用可能です。
Context-Aware Chatbot:PDF内容理解に特化した対話型AIシステム
2025/7/4
Context-Aware Chatbotは、大型言語モデル(LLM)を活用したコンテキスト認識型の質問応答システムです。ユーザーがPDFドキュメントをアップロードすると、その内容に基づき自然言語で質問が可能。高度な埋め込みと情報検索技術により、文脈に沿った的確な回答を実現します。Flaskを用いたバックエンドAPIとReact+Material-UIのフロントエンドで構成され、Dockerで簡単にデプロイ可能なフルスタックアプリケーションです。
ContextASR-Bench:大規模コンテキスト対応音声認識ベンチマーク
2025/7/9
ContextASR-Benchは、コンテキスト情報を活用した自動音声認識(ASR)の性能評価に特化した大規模ベンチマークです。多様なコンテキストシナリオを含む複数のデータセットを統合し、現代のASRシステムのコンテキスト理解能力を総合的に評価できます。これにより、ユーザーの意図を的確に反映した認識精度向上を目指す研究開発に貢献します。
ContextGen — 身元一貫性を保つマルチインスタンス生成のための文脈レイアウトアンカリング
2025/10/14
ContextGenは、ユーザーが提供した参照画像(ID)を用いて、同一の「個体」を複数配置した画像を生成するためのフレームワークです。レイアウト(位置・スケール・向き)条件と参照画像から抽出したアイデンティティ情報を結びつける「Contextual Layout Anchoring」を導入し、生成された各インスタンスの見た目や特徴を参照に忠実に保ちながら、自然な合成を実現します。デモ・プロジェクトページ・論文が公開されており、実験・可視化を含むドキュメントが付属します。(約300字)
CAST: コントラスト適応と蒸留による半教師付きインスタンスセグメンテーションの実装
2025/6/9
本リポジトリは、半教師付きインスタンスセグメンテーションのための新しい手法「CAST(Contrastive Adaptation and Distillation)」の実装を提供します。ラベル付きデータが限られる環境下で、コントラスト学習を活用したドメイン適応と知識蒸留を組み合わせることで、高精度なインスタンスセグメンテーションモデルの構築を目指しています。研究成果に基づく実装として、半教師付き学習やインスタンスセグメンテーションの分野での応用が期待されます。
位置座標ベースのNSGA-IIによる多目的最適化実装
2025/8/10
本リポジトリ「coords-nsga2」は、多目的最適化アルゴリズムであるNSGA-IIを位置座標ベースで実装したPythonコードを提供します。アルゴリズムは複数の目的関数を同時に最適化するために用いられ、工学やデータサイエンスの多様な分野で活用可能です。現在開発中ながら、シンプルかつ拡張性のある構造で、カスタマイズや研究用途に適しています。
CoPS:ゼロショット異常検知のための条件付きプロンプト合成
2025/8/11
CoPSは、視覚情報に条件付けされたプロンプトを動的に合成してCLIPを微調整し、最先端(SOTA)のゼロショット異常検知を実現する手法です。異常検知は多くの応用分野で重要ですが、従来の手法は大量の異常データを必要としたり、特定領域に特化した学習が求められたりします。CoPSはこれらの課題を克服し、事前学習済みのマルチモーダルモデルCLIPを活用して、ラベルなしの状況でも高精度な異常検知を可能にします。
GitHub Copilot Orchestra — マルチエージェント開発オーケストレーション
2025/11/6
GitHub Copilot Orchestra は、機能追加や変更を行う際に、計画・実装・テスト・レビューを担当する専門化された AI サブエージェント群を編成して、構造化されたテスト駆動の開発サイクルを実行するためのパターン/小規模フレームワークです。複数エージェントの役割分担とドキュメント化されたプロンプトにより、開発フローの再現性・追跡性・自動化を高めます。
CPM.cu:エンドデバイス向け高性能LLM推論のための軽量CUDA実装
2025/6/6
CPM.cuは、大規模言語モデル(LLM)のエンドデバイスでの推論を目的とした、軽量かつ高性能なCUDA実装です。スパースアーキテクチャ、推測的サンプリング、量子化など最先端技術を採用し、計算効率と推論速度を大幅に向上。GPUリソースが限られた環境でも高度な自然言語処理を実現し、実用的なLLM活用の新たな可能性を切り拓きます。
有名コーディングエージェントの解読済みプロンプト集
2025/6/18
「cracked-prompt-of-famous-coding-agent」は、有名なコーディングエージェントのプロンプトを解析・解読し収集したリポジトリです。これにより、AIによる自動開発やコード生成の背後にある指示内容を理解し、独自の開発や研究に応用可能です。現状はまだ小規模ですが、AI支援開発のプロンプト設計に興味がある技術者にとっては貴重なリソースとなります。
Cronus_Project — 協調学習(Federated/Cronus)実装リポジトリの解説
2025/11/3
Cronus_Projectは「Cronus」協調学習アーキテクチャを実験的に実装したリポジトリです。PyTorchベースのモデル実装とFlowerフレームワークを使った分散学習チュートリアル、MNISTを用いたノートブック実験などが含まれ、複数の集約方法(平均的な手法からロバストな手法まで)を比較検証するための土台を提供します。本リポジトリは研究・実験向けで、クライアント-サーバー構成の模擬実験を素早く始められます。(約300字)
CRT_Python_AI_A — Pythonで始めるAIコーディング練習リポジトリ
2025/9/16
本リポジトリ「CRT_Python_AI_A」は、AI/機械学習の学習や実験を目的とした非常にシンプルなコード雛形(スケルトン)です。現在はREADMEとサンプルのテキストファイルのみで構成されていますが、学習用プロジェクトの種として利用でき、データ読み込み・モデル実装・実験管理などの追加によって小規模なAI実践環境へ発展させることが可能です。軽量で扱いやすく、入門者のワークスペースや教材リポジトリとして適しています。(約300字)
Crypto AI エージェント
2025/9/13
Crypto-AI-Agentは、Solana・EVM系(Ethereum)・Bitcoinなど複数のブロックチェーンと、Twitter/Discord/Telegram向けのAIエージェントを統合して、オンチェーン市場分析、トレーディング洞察、意思決定支援、およびソーシャルプラットフォーム上のチャットボット機能を提供するためのツールキットです。フロントエンド/バックエンドとブロックチェーン向けエージェントをTypeScriptで構成し、AIと暗号資産を連携させることを目指しています。(約300字)
CSE422 人工知能(課題集)
2025/9/13
CSE422_Artificial-Intelligence は大学の人工知能(AI)授業向けに作成された課題リポジトリです。探索(A* 等)、遺伝的アルゴリズム、敵対探索(Minimax/Alpha-Beta)など、AIの基礎トピックを扱う課題の問題文(PDF/Docx)と、少なくとも1つのPython実装ファイルを含みます。学習目的の教材・課題完成物として利用でき、アルゴリズム設計や実装例の参照に役立ちます(実行手順や詳細なREADMEは限定的)。
csi-sensing:リアルタイムWi-Fi信号処理による活動・位置認識システム
2025/6/9
csi-sensingは、マルチデバイス対応のリアルタイムCSI(チャネル状態情報)センシングシステムです。Butterworthフィルタを用いた信号処理と、深層学習を活用した活動および位置認識を特徴とし、視覚的フィードバックも提供します。Wi-Fi信号を活用した非接触センシング技術の研究・開発に適したPython実装で、複数のデバイスから取得したCSIデータを効率的に処理し、高精度な認識を実現しています。
CSVQA:科学的推論能力を評価するマルチモーダルベンチマーク
2025/6/6
CSVQAは、視覚言語モデル(VLM)が科学的推論能力を評価するためのマルチモーダルベンチマークです。特に科学論文やデータ解析に用いられるCSV形式の表データを対象に、自然言語と視覚情報を組み合わせた質問応答タスクを提供し、モデルの総合的な理解力と推論力の評価を可能にします。Pythonで実装されており、研究や開発に活用できるオープンソースです。
CTONEW(cto) — マルチアカウント対応の会話玩具
2025/10/18
CTONEW(リポジトリ名: cto)は、Deno/TypeScriptで実装された「玩具」的なチャット会話プラットフォームです。多輪対話(マルチターン)・コンテキスト記憶・思考のチェーン出力(Chain-of-Thought)に対応し、会話ごとのID管理と自動削除機能を備えます。複数アカウントのポーリング運用や簡易的な管理画面(ADMIN_KEYで保護)、web UIを通した操作、OAI ChatCompetitionフォーマットのサポートなど、実験やプロトタイプ構築に便利な機能を揃えています。
CTune-MLX:Apple Silicon対応のMLXモデル一括微調整ツール
2025/8/29
CTune-MLXは、Apple Silicon環境でのunsloth未対応問題を解決し、MLX形式の機械学習モデルの一括微調整と自動フォーマット変換を実現するPythonとShellベースのツールです。Miniconda環境下で簡単にセットアップでき、MLXモデルの効率的な運用を可能にします。
CURE - 共同進化型強化学習によるオープンソースLLMコーダー
2025/6/4
CUREは、大規模言語モデル(LLM)を活用したコード生成技術において、共同進化型強化学習(Co-Evolving Reinforcement Learning)を導入したオープンソースプロジェクトです。Pythonで実装され、LLMの自然言語理解能力と強化学習の自己改善を組み合わせることで、高品質なコード生成と効率的な学習を実現します。開発者がモデルの性能向上に参加できる設計も特徴で、今後のAIコーディング支援の新たな可能性を示しています。
DailiCode:複数LLM対応のオープンソースAIエージェント
2025/7/23
DailiCodeは、複数の大規模言語モデル(LLM)に対応したオープンソースのAIエージェントです。GoogleのGemini CLIをフォークし、コマンドラインからコード解析やツール連携を可能にし、開発者のワークフローの効率化を図ります。TypeScriptで実装され、拡張性と柔軟性を両立した設計が特徴です。
DataVerse Community(データバース・コミュニティ)
2025/10/14
Open-sourceで展開される学習・共同制作プラットフォーム「DataVerse Community」。データサイエンス、機械学習、クラウドに関する実践的なプロジェクトを通じてポートフォリオを構築できることを目的とし、MITライセンスで公開、PR歓迎・Issuesでの議論を促進するドキュメント中心のリポジトリです。ドキュメントや貢献ガイドが整備されており、学習コミュニティ運営や共同開発のベースとして利用できます。(約300字)
Deep Document Knowledge:LLMを活用した医療知識グラフ生成とセマンティック検索システム
2025/8/23
本リポジトリは、大規模言語モデル(LLM)を活用して医療文献から医療知識を抽出し、知識グラフを構築するとともに、ベクトル検索によるセマンティック検索を実現するシステムを提供します。特にPubMedQAデータセットを用いた医療エンティティや関係性の抽出に強みを持ち、情報探索の高度化を目指しています。
DeepAgent Food Tours — 食べ歩きプラン生成AI
2025/11/5
LangChain DeepAgents、Google Maps API、Tavilyの研究を組み合わせた「Food tour」プランナー。ユーザーが地図上に指定した地点を基に、マルチエージェントで役割分担しながら店舗検索、訪問順序の最適化、スケジュール化を行う。フロントエンドのインタラクティブな地図インターフェースとバックエンドのDeepAgentによる自動計画生成が特徴で、SubAgentMiddlewareやTodoListMiddlewareなどの協調パターンを試験するためのプロトタイプ実装を含む。
DeepResearchAgent:次世代の深層研究支援エージェント
2025/5/23
DeepResearchAgentは、人工知能を活用して研究者の文献調査やデータ解析を効率化する革新的なエージェントシステムです。高度な自然言語処理技術により、大量の論文や資料から重要情報を抽出し、研究テーマに即した洞察を提供します。研究プロセスの自動化と深度解析を両立し、研究者の負担を軽減しながら成果の質を高めることを目指しています。
deepseek-ocr.rs — Rust製 DeepSeek OCR(OpenAI互換サーバ付き)
2025/10/25
DeepSeek-OCR の推論スタックを Rust で再実装したプロジェクトです。高速な CLI と OpenAI 互換の HTTP サーバを同梱し、Python 環境が不要でローカル(CPU / Apple Metal / NVIDIA CUDA)上で動作します。ビジョン・ランゲージモデル、プロンプトツール、サービング層がワークスペースとしてまとめられており、ドキュメント理解パイプラインを手軽に構築できます。ビルド済みバイナリも提供され、クロスプラットフォームでの運用が容易です。
DeepSeek Janus:マルチモーダルAIモデルの詳細解析と実験
2025/8/4
DeepSeek Janusは、画像とテキストの双方を理解・処理できる先進的なマルチモーダルAIモデルです。本リポジトリでは、Janusモデルのアーキテクチャ解析や実践的な実験をJupyter Notebook形式で提供し、技術的な背景から活用方法までを丁寧に解説しています。研究者や開発者がモデルの内部構造を深く理解し、応用開発に役立てるための貴重なリソースとなっています。
DeepSeek V3.2 実験リポジトリ(DeepSeek-V3.2-Exp)
2025/9/29
DeepSeek-V3.2-Exp は deepseek-ai による実験的リリースのリポジトリです。リポジトリ自体には簡潔なファイル群(PDF、README、ライセンス、コスト図)が含まれており、詳細な実装コードやモデル重みは含まれていない可能性が高いです。付属の DeepSeek_V3_2.pdf を中心に、V3.2 の設計思想・性能評価・コスト試算などの情報が提供されていると推測されます。本稿では公開情報をもとに、技術的な注目点と活用のヒントを整理します(約300字)。
Deep SORTによるMOT17データセット向け多対象追跡システム
2025/8/28
本リポジトリは、多対象追跡(MOT)アルゴリズムの一つであるDeep SORTをMOT17データセットに対応させた実装です。MOT17のフォーマットに準拠した出力結果の生成や、追跡結果の可視化、さらにMOTA/MOTP/IDSなどの評価指標による性能評価をサポートしています。Python 3.8以上で動作し、GPU環境があればTensorFlowの特徴抽出を高速化可能です。研究や実務でのMOTアルゴリズムの検証や応用に有用なリポジトリです。
DeepWerewolf — agent-lightning派生の強化学習エージェントツール
2025/9/24
DeepWerewolfは、Microsoftのagent-lightningをベースにした小規模な派生プロジェクトです。トレース(trace_spans)やトリプレット(triplets)に関するエクスポート処理に手を入れ、daemon側でトレースリストを組み立てる実装変更が見られます。Python製で軽量な改修を施した実験的コードベースとして、エージェント挙動のデバッグやトレース収集に関心がある開発者に向きます(約300字)。
森林破壊検出プロジェクト
2025/7/4
本リポジトリ「Deforestration-Detection」は、リモートセンシング技術と画像処理を活用し、衛星画像から森林破壊(森林減少)を検出するためのJupyter Notebookベースのプロジェクトです。NDVI(正規化植生指数)を用いた画像解析によって、植生の変化を定量的に把握し、森林の減少を高精度に検出することを目的としています。実装はPythonを中心に行われ、衛星画像の前処理から解析、可視化までのワークフローを網羅しています。
DEQ-RWKV:深度均衡モデルとRWKV-v7を融合した軽量AIモデル
2025/8/29
DEQ-RWKVは、深層均衡モデル(DEQ)とRWKV-v7アーキテクチャを組み合わせた実験的なオープンソースAIプロジェクトです。PyTorchとCUDAを活用し、軽量かつ効率的なニューラルネットワークモデルの構築を目指しています。トレーニングや推論の高速化、省メモリ化に寄与し、AI研究や実装に新しい可能性を提供します。
DeTok: 潜在的ノイズ除去による高性能ビジュアルトークナイザー
2025/7/22
DeTokは、論文「Latent Denoising Makes Good Visual Tokenizers」の公式PyTorch実装です。本リポジトリは、潜在空間におけるノイズ除去技術を活用し、高品質な視覚トークン化を実現する手法を提供します。視覚情報の効率的な離散表現を目指し、画像生成や認識タスクの基盤技術として応用可能です。GPU対応で高速な実験が行え、論文の再現性と拡張性に優れています。
DEX-SHELL — マルチモーダルAIコマンドシェルのためのユニバーサルデータセット
2025/10/17
DEX-SHELLは「DEX Universal AI Dataset」として公開された、マルチモーダルな人間―コンピュータインタラクション研究を支えるデータ基盤です。手話・ジェスチャー・音声・文脈的意図を理解するAI駆動のコマンドシェル(DEX Shell)向けのデータ収集・アノテーション群を想定しており、ジェスチャー認識、音声認識、意図推定、クロスモーダル融合などの研究と実装を加速します。研究・実験用のデータ設計、プロジェクト分解図、ライセンス情報など基礎資料が含まれます(300字程度)。
DiffMem:会話型AIエージェント向けGitベースのメモリストレージ
2025/8/20
DiffMemは、会話型AIエージェント向けに設計された軽量なGitベースのメモリストレージシステムです。従来のメモリ管理手法とは異なり、差分管理にGitを活用することで、会話の履歴や状態の追跡、管理を効率的に行います。Pythonで実装されており、シンプルかつ拡張性の高い設計が特徴です。AIエージェントの記憶保持や状態管理に関心のある開発者にとって有益なリポジトリです。
DiffTrack:動画拡散モデルからの時間的対応関係の自動抽出
2025/6/18
DiffTrackは、動画拡散モデルから時間的対応関係(Temporal Correspondences)を自動的に抽出する技術を扱うリポジトリです。KAISTのコンピュータビジョン研究室が公開しており、動画内のフレーム間でのオブジェクトやピクセル単位の対応を高精度に検出するための実装が含まれています。動画解析やトラッキング、ビデオ生成分野における新たなアプローチとして注目されています。
Diffusion-LLM-Papers:拡散モデルと大規模言語モデルに関する論文集
2025/5/28
本リポジトリ「Diffusion-LLM-Papers」は、拡散モデル(Diffusion Models)と大規模言語モデル(LLM)に関連する最新の研究論文や資料を体系的にまとめたコレクションです。AI分野の研究者や開発者が、これらの先端技術を効率的に理解・活用するための情報源として役立つ内容を提供しています。論文の整理と共有を通じて、拡散モデルとLLMの融合に関する研究動向を一望できる点が特徴です。
DIMO:任意のオブジェクトに対する多様な3Dモーション生成
2025/6/26
「DIMO」は、ICCV 2025で発表された論文「DIMO: Diverse 3D Motion Generation for Arbitrary Objects」の公式実装リポジトリです。本プロジェクトは、任意の3Dオブジェクトに対して多様かつリアルな動きを自動生成することを目的としており、3Dモーション生成の分野に新たな可能性を切り拓きます。多様性と汎用性を兼ね備えたモーション生成手法を提供し、ロボティクス、アニメーション、拡張現実など幅広い応用が期待されます。
DINOV3_YOLO:DINO Vision Transformerをバックボーンに持つYOLOv13
2025/9/6
DINOV3_YOLOは、最先端の物体検出モデル「YOLOv13」に、自己教師あり学習で高性能を誇るDINOのVision Transformer(ViT)バックボーンを組み合わせたリポジトリです。PyTorchを用いた実装であり、CUDA対応の環境で高速かつ高精度な物体検出を実現します。最新のViT技術とYOLOの高速性を融合し、検出性能の向上を目指した研究開発に最適なフレームワークを提供しています。
Direct3D-S2:空間的スパースアテンションによるギガスケール3D生成の革新
2025/5/28
Direct3D-S2は、空間的スパースアテンション機構を活用し、大規模な3Dデータの生成を効率的かつ高精度に実現する最先端の技術を提供するリポジトリです。従来の3D生成技術の課題であった計算コストとスケーラビリティの問題を克服し、ギガスケールの3Dモデル構築を容易にします。AI分野における3Dデータ処理の新たな可能性を拓く本プロジェクトは、研究者や開発者にとって貴重なリソースとなるでしょう。
地下工程 - 時系列解析と分類のための機械学習ツール
2025/8/28
本リポジトリ「dixiagongcheng」は、scikit-learnを基盤としたGUI搭載の機械学習単一実行ツールです。コマンドライン不要で初心者にも扱いやすく、センサーのログデータや金融株価など時系列データの統計解析・周波数解析・分類に対応。多様な分類モデルを選択可能で、時系列の特徴量化や分類スコア出力を簡単に行えます。Python 3環境で動作し、時系列解析に特化した手軽な解析ツールとして注目されています。
DMOSpeech2:メトリック最適化音声合成における強化学習を用いた持続時間予測
2025/7/21
DMOSpeech2は、音声合成における持続時間予測問題に対して強化学習を導入し、合成音声の品質向上を目指した研究プロジェクトです。従来の教師あり学習による持続時間予測とは異なり、音声の品質評価指標(メトリック)を最適化する形でモデルを訓練し、より自然で聴感上優れた音声合成を実現します。Pythonで実装され、最新の音声合成技術を活用しています。
Document Portal - ドキュメント管理と検索のためのAI活用ポータル
2025/7/19
Document Portalは、Jupyter Notebookを主言語とし、Pythonベースで構築されたドキュメント管理・検索システムのリポジトリです。ユーザーは効率的にドキュメントを整理・検索できる環境を整備しており、環境構築から基本的なGitコマンド操作までREADMEに丁寧に記載されています。軽量なアプリケーション構成を持ち、AI/ML関連の学習やプロトタイプ作成に適しています。
DocuMind — PDFチャットアシスタント
2025/9/16
PDFドキュメントをローカルで検索・対話できる軽量なQ&Aアシスタント。無料のローカルLLM(Ollamaなど)とFAISSによるベクトル検索を組み合わせ、複数PDFのアップロード、類似度検索、対話型回答生成をブラウザ上で行えるモダンなUIを提供します。クラウド依存やAPIキー不要でプライバシー重視の運用が可能、Docker一発で起動できる点も特徴です(約300字)。
.NET 9とSemantic Kernelを活用したAI統合コンソールアプリケーションのサンプル
2025/7/15
本リポジトリは、.NET 9環境で動作するコンソールアプリケーションのサンプルコードを提供しています。Semantic Kernelプロジェクトを基盤に、Azure Open AIやOllamaといったAIソリューションと連携し、MCP(Microsoft Chat Protocol)サーバーとのインタラクションを実現。さらに、Docker Composeを用いてGrafanaとOpenTelemetryを組み込んだ監視環境を構築可能で、AIアプリケーションの開発・運用におけるモニタリングの実践例としても活用できます。
.NET 9とSemantic KernelによるAI統合コンソールアプリケーション例
2025/7/15
本リポジトリは、.NET 9で構築されたコンソールアプリケーションのサンプルで、MicrosoftのSemantic Kernelプロジェクトを活用しつつ、Azure Open AIやOllamaといったAIソリューションと連携しています。さらに、GitHub MCPサーバーを利用した対話機能の実装を含み、JaegerとOpenTelemetryによる分散トレーシング監視環境をDocker Composeで簡単に構築可能です。AI技術の統合から運用監視までを一貫して学べる実践的なリポジトリです。
DPI-RG:ラウンドトリップ生成モデルを用いた分布非依存予測推論
2025/7/7
DPI-RGは、分布に依存しない予測推論を可能にするラウンドトリップ生成モデルを用いた手法の実験コードを提供するリポジトリです。Fashion-MNISTやCIFAR10の画像分類タスクを対象に、生成モデルを活用した信頼性の高い予測区間の推定を実現しています。Pythonで実装され、再現性の高い環境構築ファイルも含まれているため、研究者やエンジニアが最新の予測推論技術を試す上で有用です。
DreamLayer:AIアーティスト・開発者・研究者向け直感的なStable Diffusion WebUI
2025/6/22
DreamLayerは、AIアート制作や研究に最適化された、最も直感的なStable DiffusionのWebユーザーインターフェイスです。使いやすさを追求し、アーティストや開発者、研究者が高度な画像生成を手軽に行える環境を提供。複雑な設定なしに高品質なAI画像生成が可能で、多様なカスタマイズにも対応しています。
Drunkitties - ペットテーマのAI生成デザインカスタムシャツ販売アプリ
2025/9/2
Drunkittiesは、ペットをテーマにしたTシャツやフーディー、マウスパッドのカスタムデザインを手軽に作成・販売できるWebアプリケーションです。ユーザーは自分のペット写真をアップロードし、OpenAIのAPIを活用したAI生成デザインを取得して商品化できます。Node.jsとJavaScriptで構築されており、API連携や画像処理を組み合わせたユニークなeコマース体験を提供します。
DS-ML Bootcamp:データサイエンス&機械学習集中講座
2025/9/1
「DS-ML Bootcamp」は、データサイエンスと機械学習の基礎から実践までを1ヶ月で体系的に学べる集中講座のリポジトリです。データ収集から前処理、モデル選択・学習・評価、さらにはモデルのデプロイまで、機械学習の一連のワークフローを段階的に習得できます。学習者が実践的なプロジェクトに取り組みながらスキルを身につけるための教材やコード例が豊富に揃っています。
DSPy 0-to-1ガイド:自己改善型LLMアプリケーションの構築
2025/9/4
DSPyフレームワークを用いた自己改善型大規模言語モデル(LLM)アプリケーションをゼロから構築するための包括的なガイドです。リトリーバル強化生成や要約、評価、モジュール最適化などのコアコンセプトを紹介し、実践的なパイプライン構成から自己改善の実装までを段階的に解説しています。Pythonで実装されており、開発者が効率的に高性能なLLMアプリケーションを開発できるよう設計されています。
dspy-advanced-promptingの高度なプロンプティング技術
2025/6/23
本リポジトリ「dspy-advanced-prompting」は、Pythonで実装された最先端のプロンプティング手法を集約したツールキットです。Managerスタイルのプロンプトや役割パーソナ設定、メタプロンプティングなど、複雑なAI対話制御を実現する技術が含まれており、効率的かつ柔軟なプロンプト設計を支援します。AI活用の高度化や対話品質向上に貢献する実践的な実装が特徴です。
DuAI:PythonベースのAI関連リポジトリ
2025/6/22
DuAIはGitHubユーザーoDaiSunoによって公開されたPython言語を用いたAI関連のリポジトリです。スター数はまだ少ないものの、AIや機械学習に関連する技術的要素を含み、今後の発展が期待されるプロジェクトです。リポジトリ自体の詳細な説明はありませんが、コード構造や使用されている技術からAI分野に関連した独自の実装が行われていることが推測されます。
デュアルハンドバーチャルマウスと視覚化システム
2025/7/19
本リポジトリは、Webカメラを用いて両手のジェスチャーをリアルタイムで認識し、マウス操作(カーソル移動、クリック、スクロール)を実現するPythonプロジェクトです。OpenCVやMediaPipe、PyAutoGUIを活用し、手の骨格を画面上に表示してユーザー体験を向上させています。物理的なデバイス不要で直感的な操作が可能なため、手の動きを活用した新たなインターフェースとして注目されています。
DUCK‑E(話すアヒル:音声で応答するデバッグアシスタント)
2025/10/10
DUCK‑E は「ラバーダックデバッグ」を拡張する、音声で会話できる AI アシスタントです。開発者が自分のコードを声に出して説明すると、DUCK‑E がリアルタイムに応答して対話を続け、問題発見や思考の整理を助けます。OpenAI Realtime API、FastAPI、AutoGen フレームワークを組み合わせ、音声ストリーミングとマルチターン会話を実現。ローカル環境で試せるサンプル実装で、開発フローに自然に組み込める点が特徴です(300字程度)。
E-problem — 高速列車軸受の知能故障診断(中国研究生数学建模 E題)
2025/9/22
2025年中国研究生数学建模競赛E题のリポジトリ「E-problem」は、高速列車軸受(ベアリング)に対する振動信号を用いたインテリジェント故障診断の実装例を収めています。Pythonによる前処理、特徴抽出、分類・判別アルゴリズムのスクリプトや問題文(E题.pdf)、および実験用のコード断片が含まれ、学生コンペや研究の出発点として使える構成です(データは含まず、アルゴリズムと解析手順の提示に重心があります)。300字程度で診断ワークフローと実装の概略をまとめています。
E2LLM — 長文コンテキスト理解のためのエンコーダ延長型LLM
2025/10/10
E2LLMは、事前学習済みテキストエンコーダとデコーダ専用の大規模言語モデル(LLM)を組み合わせ、長文コンテキストの理解と推論を効率的に実現するためのフレームワークです。EMNLP'25で提案された手法のPyTorch実装を提供し、長い入力を扱うためのエンコーダ設計とデコーダ連携の工夫を通して、既存LLMの拡張性と計算効率の両立を図ります。(300字程度)
多源情報コラボレーティブ推論によるアルツハイマー早期リスクスクリーニング
2025/10/19
音声ベースの多源情報(言語・準言語・非言語・古典的音響・eGeMAPS)を統合し、グラフベースの推論と機械学習を組み合わせてアルツハイマー病(AD)リスクを早期に評価するFlaskデモアプリ。ローカルのscikit-learnモデルバンドルやfaster-whisperによる任意のASRを組み込み可能で、解釈性・再現性・デプロイ性を重視したワンクリック実行を目指す実験的実装です(ADReSSo21でXGBoost+multisourceによりAcc≈0.853報告)。
地震検知のための1D CNN深層学習ツールキット
2025/8/8
本リポジトリ「Earthquake_DeepLearning_Tools」は、地震波形のパワースペクトル密度(PSD)データを用いて、地震イベントと背景ノイズを分類するための深層学習モデルの学習、評価、展開までを一貫してサポートするPython製ツール群です。データ収集から前処理、1次元畳み込みニューラルネットワーク(1D CNN)によるモデル構築、交差検証による評価、さらにはリアルタイムストリームの識別まで幅広く対応し、地震検知研究や実用化に役立つ実践的なフレームワークを提供します。
EcoAlpha:NLPを活用したESGポートフォリオ最適化ツール
2025/7/19
EcoAlphaは、自然言語処理(NLP)技術を用いてESG(環境・社会・ガバナンス)要素を考慮した投資ポートフォリオの最適化を支援するツールです。企業のESG関連情報をテキストデータから抽出・分析し、投資判断に活用可能なポートフォリオ構築を効率化。ESG投資の高度化と持続可能な投資戦略の実現に貢献します。
ed-ai — 無料で試せる成人向けAIコンテンツジェネレータ
2025/9/17
「ed-ai」は、サインアップ不要で無料で成人向け(NSFW)ビデオや写真を生成すると主張するリポジトリの記録です。リポジトリ自体は最小構成で、READMEに外部リンク(短縮URL)や短い説明が記載されています。実装コードや学習済みモデルは含まれておらず、安全性・法的・倫理的観点で注意が必要です(約300字)。
ed-cloth:無料で使えるAI衣装チェンジャー
2025/9/5
ed-clothは、無料で利用可能なAIベースの衣装チェンジャーです。ユーザーの写真に対して服装を自動で変更できる機能を提供し、手軽にファッションのシミュレーションが可能です。シンプルな構成ながら、AI技術を活用した衣装変更の利便性を実現しており、今後の発展が期待される注目のプロジェクトです。
EfficientUICoder:入力・出力トークン圧縮による効率的なUIコード生成
2025/9/16
EfficientUICoderは、マルチモーダル大規模言語モデル(MLLM)を用いたUIコード自動生成の効率化を目指すフレームワークです。リポジトリはコード本体は未公開ですが、論文(arXiv)によって「入力と出力のトークン圧縮」による高速化とメモリ削減を提案しており、低レイテンシでのUI生成や大規模UIデータへの適用を念頭に置いた設計思想が示されています(コードは後日公開予定)。300字程度の要約です。
EgoLoc:一人称視点ビデオにおけるゼロショット時間的インタラクション局所化
2025/7/3
EgoLocは、一人称視点(エゴセントリック)ビデオにおける時間的インタラクションの局所化をゼロショットで実現する革新的な手法を提案するリポジトリです。Vision-Language Models(VLM)を活用し、事前の学習データなしで動画内の重要なインタラクションを正確に検出・識別します。IROS 2025で発表された本研究は、従来の手法が必要とした大規模なアノテーションを不要とし、効率的かつ汎用的なエゴビデオ解析を可能にしています。
Eigent - 世界初のマルチエージェントワークフォースで生産性を解放する
2025/7/29
Eigentは、複数のエージェントが協調して働く世界初のマルチエージェントワークフォースを実現し、ユーザーの卓越した生産性を引き出すことを目的としたTypeScript製のオープンソースプロジェクトです。効率的なタスク管理や自動化を支援し、AI技術を活用した高度な作業分散を可能にします。
ELEC5620_1: インテリジェント株式分析システム
2025/10/19
本リポジトリは、AIエージェントを活用した「Stock Analysis System」を実装するためのプロジェクトです。リアルタイム株価監視、テクニカル/ファンダメンタル/センチメント/リスクの多次元分析、インテリジェントなアラート機能、ポートフォリオ管理、役割ベースのアクセス制御(投資家・アドバイザー・管理者)といった機能を備え、FastAPIをバックエンドに、MySQL+SQLAlchemyを用いたデータ管理、JWTによる認証を採用しています。拡張性を意識したアーキテクチャと、AI統合による自動化・意思決定支援が特徴です(約300字)。
多項式方程式解法のための消去テンプレート生成器(elimination-template-modified)
2025/7/21
本リポジトリは、多項式方程式系の解法や幾何学的コンピュータビジョンに関連する問題を効率的に解くための「消去テンプレート」を生成するMATLABベースのツール群を提供します。CVPR 2022で発表された論文「Optimizing Elimination Templates by Greedy Parameter Search」に基づき、解法の最適化と計算効率の向上を実現。複雑な多項式システムの自動化された解析と高速化に貢献します。
Elysia(MyElysia)Telegramボット
2025/9/23
Claude系AI(OpenRouter経由)を組み込んだ「Elysia」風のAI Telegramボット。授業スケジュール管理やキャラクター性のある応答を備え、python-telegram-botで実装されたモジュール式のPythonアーキテクチャ。Docker / docker-composeでコンテナ化され、環境変数でAPIキーやトークンを設定して手軽にデプロイ可能。MITライセンス下で提供され、個人や小規模なチャットボット実験に向く構成になっています。
Emailcleaner:メール分類とクリーニングのための機械学習ツール
2025/9/8
Emailcleanerは、Pythonのscikit-learnを用いてメールをスパム、プロモーション、重要メールに分類し、整理を支援するシンプルな機械学習プロジェクトです。Streamlitによるインタラクティブなウェブアプリも提供し、ユーザーはメールの保持・削除の判断を容易に行えます。メールデータの前処理からモデル学習まで一連の流れを備え、実用的なメール管理ソリューションを目指しています。
EnConda-Bench — Python環境構成評価ベンチマーク
2025/10/28
EnConda-Benchは、ソフトウェアエンジニアリング領域におけるAIエージェントの「Python環境設定」能力を評価するための包括的なベンチマークフレームワークです。環境依存のインストール失敗や依存関係の衝突、設定ファイルの不整合など現実的なトラブルを含む課題セットを提供し、エージェントの問題検出、原因解析、修正提案、修復実行までのプロセスレベルの軌跡(trajectory)を計測・比較できます。Dockerベースの実行、評価スクリプト、データセット、推論モジュールを備え、LLMや自動化エージェントの実用性評価に適しています。(約300字)
EndToEndLoRA:Llama 3.2:1bを用いたエンドツーエンドLoRA実装例
2025/6/9
EndToEndLoRAは、Llama 3.2:1bモデルに対するLoRA(Low-Rank Adaptation)技術を用いたエンドツーエンドの微調整例を提供するPythonリポジトリです。LoRAは大規模言語モデルの効率的な微調整手法であり、本リポジトリはその実装を通じてモデルの適応力向上やリソース削減を実現しています。シンプルかつ実用的なコードでLoRAの適用プロセスを学びたい開発者や研究者に適しています。
Enhanced-Memory AIシステム:次世代のローカルAI記憶管理ソリューション
2025/7/7
Enhanced-Memory AIシステムは、先進の三層記憶アーキテクチャを採用したローカルデプロイ可能なAI記憶管理システムです。電商や自媒体などの分野で深くテスト・最適化されており、BM25やBGEによる六次元混合検索、独自の圧縮技術を駆使して効率的かつプライバシーを守りながら大規模知識を管理可能。完全オフライン動作でデータが外部に漏れないため、安全性と性能を両立します。
EPI(エレクトロフォトニック)による疾患検出
2025/10/17
Electrophotonic Imaging(EPI)装置で指先のコロナ放電を撮像し、生体エネルギーフィールドのパターンから糖尿病など疾患を検出する可能性を探る研究リポジトリ。実験手法の概要と解析方針、画像取得の物理的原理についての資料(PDF)と簡易READMEが含まれます。機械学習での分類応用や前処理・特徴抽出の検討に役立つ出発点です(約300字)。
ERNIE 4.5 開発者リソースガイド
2025/7/4
Baiduが開発した強力なオープンソースAIモデルファミリー「ERNIE 4.5」の開発者向けリソースガイドです。モデルの概要、導入方法、コード例、関連リンクなど、ERNIE 4.5の活用に必要な情報を体系的にまとめています。AIモデルの利用やカスタマイズを検討するエンジニアにとって役立つ内容が揃っています。
EvoPresent — プレゼン美学を進化させるエージェント
2025/10/13
EvoPresentは学術発表(論文プレゼン)の「美学」を自己改善するエージェント群を提案・実装するリポジトリです。論文と実装、データセットへのリンクを備え、発表スクリプトやスライド表現の審美性を数値化してエージェントが改善する研究ワークフロー(訓練コード・資産・データ)を提供します。研究者が発表技術をデータ駆動で解析・最適化するための基盤を目指します(約300字)。
EyeDance-2API — 個人向け AI 画像生成 API ラッパー
2025/10/15
Cloudscraper を使って Cloudflare を自動回避し、ユーザー Cookie を不要にした高性能な非同期スクレイピングベースの画像生成 API ラッパー。eyedance.net の生成機能を OpenAI 互換風の API として公開できるよう設計され、要求の偽装・反検知・高並列処理・Docker 一発デプロイを特徴とします。開発や実験用途に向いた軽量な Python 実装です。(約300字)
高速バレーボール追跡推論システム
2025/7/9
本リポジトリは、Intel Core i5-10400FのCPU上で200FPSのリアルタイムバレーボール検出および追跡を実現する高速な推論システムを提供します。最適化されたONNXモデルを用い、ボールの座標をCSV形式で出力可能。ビデオの可視化もオプションで対応し、スポーツ分析やコンピュータビジョン研究に適した環境を整えています。
FastA2A:AIエージェントをA2Aサーバーに変換するPythonライブラリ
2025/7/10
FastA2Aは、AIエージェントをA2A(Agent to Agent)サーバーに変換するためのPythonライブラリです。シンプルかつ高速にAIエージェント同士の連携を実現し、APIサーバーとして動作させることが可能です。軽量な設計で容易に拡張ができ、CI/CDパイプラインやテストカバレッジも整備されています。AI/ML開発におけるエージェント連携の効率化を目指す開発者に最適です。
Faster-Whisper Transcription APIの高性能音声転写サービス
2025/9/2
Faster-Whisper Transcription APIは、高速かつ高精度な音声転写を実現するAPIサービスです。Whisperの多モデル対応に加え、Audio Slicerによる長時間音声の自動分割と並列処理を特徴とし、CPU・GPU双方に最適化された計算精度で動作します。FastAPIを用いた堅牢なAPI設計により、バッチ処理にも対応した実用的な音声認識基盤を提供します。
FastGS — 100秒で学習する3Dガウシアン・スプラッティング
2025/11/7
公式実装「FastGS: Training 3D Gaussian Splatting in 100 Seconds」のリポジトリ。3Dシーン表現としてのガウシアン・スプラッティング(小さなガウス分布を用いた点群ベースのレンダリング)を極めて短時間で学習する手法を示す。本リポジトリは論文の公式コードで、ホームページとarXiv論文へのリンクを含み、2025年11月末までに実行可能なバイナリの公開が予定されている。現状はREADMEとライセンスのみの軽量リポジトリで、将来的な拡張が見込まれる。
FedNML — ノイズと欠損ラベルに強い医用画像向け連合学習フレームワーク
2025/10/14
FedNMLは「FedNML: A Robust Federated Learning Framework for Noisy and Missing Labels in Medical Image Classification.」の実装を含むリポジトリです。医療データのラベルノイズやラベル欠損が存在する分散環境(複数医療機関)で、個別クライアントのデータを直接共有せずにロバストな分類モデルを学習するためのアルゴリズムと実装を提供することを目的としています。プライバシーを保ちながらノイズ耐性や欠損への補完を行う仕組みが中心です(READMEに実装の説明と図を含む)。
FenixAI_tradingBot:AI搭載のトレーディングボット
2025/6/23
FenixAI_tradingBotは、Pythonで開発されたAI駆動のトレーディングボットです。Crew AIとOllamaの技術を活用し、マーケットデータの分析から取引判断までを自動化。シンプルな設計ながら、機械学習モデルを用いた高度な予測機能を備え、暗号資産などのトレードに適しています。初心者から中級者のトレーダーに向けて、AI技術を用いた自動取引の可能性を示す注目のリポジトリです。
Flux Kontext Diff Mergeによる高品質画像編集のための差分マージノード
2025/7/5
Flux Kontext Diff Mergeは、AIによる画像編集で発生しがちな不要な画質劣化を防ぐために、編集された領域のみを選択的に原画像にマージするComfyUI用のカスタムノードです。LAB色空間を用いた適応的差分検出やノイズ除去機能を備え、Flux Kontext Devとの組み合わせで高画質な画像編集ワークフローを実現します。
Qwen-Image向けLoRAトレーナー「flymyai-lora-trainer」解説
2025/8/6
「flymyai-lora-trainer」は、Qwen/Qwen-Imageモデル向けにLoRA(Low-Rank Adaptation)レイヤーのトレーニングを行うためのオープンソース実装です。FlyMy.AIが開発し、Pythonで構築された本ツールは、効率的なファインチューニングを実現し、画像生成モデルのカスタマイズを容易にします。シンプルな構成ながら実用的な機能を備え、GenAIメディアエージェント構築のインフラとしても活用可能です。
Flow-Modulated Scoringによる意味認識ナレッジグラフ補完
2025/8/30
本リポジトリは、意味情報を考慮したナレッジグラフ補完を実現する「Flow-Modulated Scoring(FMS)」手法のPyTorch実装を提供します。FMSは、知識グラフの欠損関係推定において、エンティティ間の意味的流れをモジュレーションすることで高精度な推論を可能にします。論文に基づき、効率的な学習と推論をサポートし、研究や実務でのナレッジグラフ強化に貢献します。
FocusDPO:動的焦点制御による複数主体の個別化画像生成最適化
2025/8/19
FocusDPOは、複数の個人の異なる嗜好を同時に考慮しつつ、高品質なパーソナライズド画像生成を実現するための手法です。動的な嗜好最適化と適応的な焦点調整を組み合わせることで、各主体の好みを効果的に反映し、多様な生成結果を効率的に得られます。ByteDanceのFanqie AIチームによる本リポジトリでは、関連アルゴリズムと実装資源を提供し、マルチユーザーの画像生成領域に新たなアプローチを提示しています。
FoundationModelsTools: AppleのFoundation Modelsフレームワークを拡張するツール集
2025/7/9
FoundationModelsToolsは、AppleのFoundation Modelsフレームワークを活用し、カレンダー管理、連絡先操作、HealthKitデータ取得、位置情報アクセス、音楽再生制御などの機能を提供するSwift製のツール集です。これにより、アプリ開発者はAIモデルとiOSのシステムフレームワークや外部サービスを簡単に連携させ、より高度なユーザー体験を実現できます。
freephdlabor:あなた専用の24/7研究ラボを作るツール
2025/10/20
freephdlaborは、個人化された“研究グループ”を構成して、24時間体制で特定の科学的問題に取り組ませることを目指すPythonベースのフレームワークです。READMEやarXiv掲載の情報から、LLMを核としたエージェント設計、カスタマイズ可能なLLM設定(.llm_config.yaml)や環境変数管理(.env)などを備え、文献調査、実験設計、解析、ドラフト作成といった研究ワークフローの自動化を想定しています。研究者や学生が自身のテーマで継続的に探索・実験を回すためのプロトタイプ実装です(約300字)。
freesof-on: AutoCAD設計支援ツール
2025/8/26
freesof-onは、AutoCADの2Dおよび3D設計体験を強化するためのリポジトリです。AutodeskのAI技術を活用し、設計プロセスにおけるインサイトの抽出や自動化を支援します。設計者がより効率的かつ創造的に作業できる環境を提供し、手動作業の軽減や精度向上を目指したツール群を含みます。
データから洞察へ — FMDによるクラスタリング
2025/9/26
Online Retail 2010データセット(約3万件)を用いた顧客セグメンテーションプロジェクトです。顧客をFrequency(購入頻度)、Monetary(購買金額)、Diversity(購入品目の多様性)の3軸(FMD)で特徴量化し、KMeansとDBSCANの2種類のクラスタリング手法でセグメント化を行います。評価はSilhouette ScoreやDavies-Bouldin Indexで比較し、PDFおよびJupyter Notebookで手順と結果をまとめています。データ前処理、特徴量設計、スケーリング、パラメータ調整、結果の解釈まで一連の分析ワークフローを提供します(約300字)。
Frontrunning-Mev-Bot:革新的なAI自動取引ボット
2025/8/11
Frontrunning-Mev-Botは、EthereumとBinance Smart Chain上で動作する最先端のAI自動取引ボットです。クロスDEXアービトラージ、スイングトレード、グリッドトレードなどの高度な取引戦略を駆使し、取引コストの削減とMEV(Miner Extractable Value)攻撃からの防御も実現。ユーザーフレンドリーなインターフェースにより、初心者からプロまで幅広く利用可能な、次世代のハンズフリートレーディングプラットフォームです。
多模态基金株式洞察分析プラットフォーム
2025/8/22
本リポジトリは、多様なデータ形式(テキスト、画像など)を統合解析し、ファンドや株式に関する深い洞察を提供するAIベースの分析プラットフォームです。多モーダルデータの全域融合とインテリジェントな協調分析により、投資判断に役立つ専門的なレポートを自動生成。Apache 2.0ライセンスのもと、Python 3.10以上で動作し、金融分野の複雑な情報を効果的に処理するための革新的な技術が多数盛り込まれています。
Unitree G1 ダブルスピンキック例 (g1_spinkick_example)
2025/10/10
mjlab をベースに、Unitree G1 ヒューマノイドに「ダブルスピンキック」を学習させるためのリポジトリです。MimicKit の参照モーション(Jason Peng)を変換して mjlab 用の CSV データを生成するスクリプト、学習結果とハイパーパラメータ、そして実機移行を想定した ONNX 形式の事前学習済チェックポイントを提供します。シミュレーションから実機への比較例(GIF)や再現性を高めるための設定が含まれます。
GAピクセルアートジェネレーター
2025/7/6
「ga-pixel-art」は、遺伝的アルゴリズムを用いてターゲット画像のピクセルアートを進化的に生成するRust製のプロジェクトです。ランダムなノイズ画像から始まり、世代を重ねるごとにターゲット画像に近づく過程をアニメーションGIFとして出力します。進化計算の視覚的な理解や画像生成の実験に適したツールです。
GarmageNet 実装(公式)
2025/9/11
GarmageNet の公式実装リポジトリ。SIGGRAPH Asia 2025 論文「A Multimodal Generative Framework for Sewing Pattern Design and Generic Garment Modeling」に対応したコード資産で、縫製パターン設計と汎用衣服モデリングのためのマルチモーダル生成フレームワークを提供します。リポジトリ自体は軽量で、ロゴやアセットを含む最小限の構成ですが、論文・プロジェクトページ・デモへのリンクを通じて実験再現や応用例を参照できます(公式ページや arXiv リンクあり)。研究結果を実装・拡張したい研究者・開発者向けの出発点です。
Gemini-CLI-2-API:Google Gemini CLIをOpenAI API互換のローカルAPIに変換するプロキシ
2025/7/20
Gemini-CLI-2-APIは、GoogleのGemini CLIをラップしてローカルAPIとして提供する強力なプロキシです。OpenAI互換のAPIインターフェースを備え、Node.js上で動作。毎日1000回まで無料でリクエスト可能なため、既存のOpenAIクライアントから透過的に利用できます。AI開発の効率化を目的に、ローカル環境でGoogle Geminiの機能を活用しやすくするツールです。オープンソースでGPLv3ライセンス。
Gemini GPT Hybrid:Claude AIエージェントのハイブリッド活用ツール
2025/8/10
Gemini GPT Hybridは、AnthropicのClaude AIをベースにした複数のAIエージェントを統合管理し、ユーザーのワークフローを効率化するハイブリッド型ツールです。Shellスクリプトを中心に構成されており、エージェントの選択や対話の自動化、柔軟な拡張性を特徴としています。オープンソースであり、MITライセンスのもとで開発が進められているため、個人から企業まで幅広いユーザーのAI活用を支援します。
Gemini MCPツール:Google Gemini CLIと連携するAIアシスタント用MCPサーバー
2025/6/29
Gemini MCPツールは、Googleの強力なGemini CLIと連携するためのMCPサーバーを提供します。Geminiの大容量トークンウィンドウを活用し、大規模ファイルの解析やコードベースの理解を効率化。JavaScriptで実装されており、AIアシスタントがより高度な解析を実行できる環境を整えています。本リポジトリは開発者がGoogle Geminiの能力を最大限に引き出し、複雑なプロジェクトの管理を支援します。
Gemini×Pipecat ボイスAI RPG(ハッカソン提出物)
2025/10/12
Gemini と Pipecat を組み合わせたボイス駆動型RPGのハッカソン提出リポジトリ。音声入力による対話インターフェースとゲームロジックを連携させるシンプルなデモを含み、60秒以内のデモ動画が添付されています。Gemini の言語系モデルや音声処理機能と、Pipecat によるパイプライン管理を組み合わせたプロトタイプとして、音声で物語を操作するUXを短時間で示すことを目的としています(約300字)。
generalist - Claudeを活用した汎用AIエージェント
2025/6/4
SamuelSchlesinger氏による「generalist」は、Claudeをバックエンドに採用した汎用AIエージェントです。Rustで実装されており、高速かつ効率的な処理が特徴です。多目的なタスクへ柔軟に対応可能な設計で、AIエージェントの新たな可能性を示しています。
Gensokyo-MCP:OnebotV11対応のMCPサーバー実装
2025/5/28
Gensokyo-MCPは、OnebotV11仕様に対応したBotをGo言語で実装したMCPサーバーです。Onebotは中国発のチャットボット標準プロトコルであり、本リポジトリはその最新版であるV11に準拠したBotサーバーを提供します。Go言語の高いパフォーマンスとシンプルな設計により、軽量かつ拡張性の高いチャットボット環境を構築可能です。Bot開発者やMCPプロトコルを用いたサービス実装に役立つ実用的なリポジトリとなっています。
GeoHGN(多幾何異種グラフネットワーク)
2025/11/7
GeoHGNは、個人化推薦のための多幾何学的異種グラフネットワーク(Multi-Geometric Heterogeneous Graph Network)を実装したリポジトリです。PyTorch実装とデータセットが含まれており、ユーザー・アイテム・その他の異種ノード間の関係を扱いつつ、ユーザー嗜好やアイテム階層構造を同時に保存するためにユークリッド空間と双曲空間を併用する新しいコントラスト学習フレームワークを提供します。本実装は階層性と局所的意味情報の両立を目指したモデル設計を特徴とします。(約300字)
GitHub Actions Lab 2 — 自動化モデル学習と確率較正ラボ
2025/10/21
本リポジトリは、UCIのBank Marketingデータセットを用いて「モデルの学習 → 評価 → バージョン管理 → 確率較正(calibration)」という機械学習のライフサイクルをGitHub Actionsで自動化する実践的な教材です。コードをプッシュするだけで自動的に再学習と較正が行われ、学習済みモデルやメトリクスがアーティファクトとして保存・版管理されるワークフローを示します。MLOpsのCI的な運用手法を学びたい開発者やデータサイエンティスト向けのハンズオン実装です。
GitHub MCPサーバー:LLMを活用したGitHubプルリクエスト自動レビュー支援ツール
2025/8/21
GitHub MCPサーバーは、自身で提供する大規模言語モデル(LLM)を用いてGitHubのプルリクエスト(PR)を自動で解析・レビューするためのプロトコルサーバーです。GitHub APIを活用し、PR情報の取得からファイル内容の読み込み、レビューコメントの投稿まで一括で行えるため、AIアシスタントがリポジトリのコード変更を効率的に評価できます。Cursor IDEやClaude DesktopなどのMCPクライアントと連携し、開発現場のコードレビューの自動化・高度化を実現します。
GLM-4.6 MCP サーバー(GLM-4.6 MCP Server)
2025/10/18
GLM-4.6をバックエンドに、Model Context Protocol(MCP)ブリッジとして機能する軽量なJavaScript製サーバー。カスタムJSON設定でWarp Terminalなどのクライアントと統合でき、Claude 4.5 Sonnetと連携してアーキテクチャ設計支援や技術的意思決定を行うためのコンテキスト管理とルーティングを提供します。導入やアーキテクチャのドキュメントが含まれ、MITライセンスのもとで配布されています。(約300字)
GLM_OPEN_DEEP_RESEARCH:オープンで拡張可能な深層研究エージェント
2025/8/7
GLM_OPEN_DEEP_RESEARCHは、ZhipuのGLM-4.5をサポートし、LangGraphを活用した構成可能な深層研究エージェントです。複数のモデルプロバイダーや検索ツール、MCPサーバーに対応し、完全オープンソースで提供されています。深層研究領域で求められる高度な情報収集と解析機能を備え、研究者や開発者が効率的に知見を得るための基盤を提供します。
GoldRecovery:鉱業における金回収率予測システム
2025/7/11
本リポジトリ「GoldRecovery」は、工業的な金鉱採掘プロセスにおける金回収率を予測するための機械学習モデルを構築したプロジェクトです。鉱石の物理的・化学的特性とセンサーから得られる各種データを用いて、複数の回帰モデルをトレーニングし、各工程の回収効率を高精度に推定します。これにより、鉱山現場の生産性向上とコスト削減を目指した実用的な分析ツールとして活用可能です。
Doctor Agent - 医療情報検索と症状分析を支援するAIアシスタント
2025/7/27
Doctor Agentは、Google Programmable Search APIを活用し、最新の医療情報検索、薬剤情報の提供、症状解析、緊急時のアドバイスなどを行う医療支援エージェントです。Pythonで実装され、医療現場や一般ユーザーが効率的かつ安全に医療情報へアクセスできるよう設計されています。
GPT Image MCPサーバー:多様なAIチャットボット向けの画像生成統合ソリューション
2025/7/8
GPT Image MCPは、OpenAIのgpt-image-1モデルを活用し、あらゆるLLM(大規模言語モデル)搭載チャットボットに高品質なテキストから画像生成機能を提供するMCP(Model Context Protocol)サーバーです。従来のテキスト限定のチャット体験を拡張し、Claude DesktopやChatGPTカスタムインターフェースなど多彩なクライアントでシームレスに画像生成を可能にします。Pythonベースで軽量かつ柔軟な設計が特徴です。
GPT-OSSスペースゲーム:AIと音声UIによる宇宙冒険体験
2025/8/6
GPT-OSSスペースゲームは、音声UIキットとGPT-OSSを活用した実験的なスペースアドベンチャーゲームです。プレイヤーは宇宙船の唯一の乗組員となり、船のAIと協力して原因不明の故障を診断し、宇宙ステーションや惑星への安全到達を目指します。ゲームはローカル環境で動作し、Whisperによる音声認識、Kokoro TTSによる音声合成、Pipecatによる通信処理などの最先端技術が統合されています。多様なコンポーネントをクラウドサービスに切り替え可能で、拡張性も高い点が特徴です。
GPT5-promptsの日本語ガイド:多機能GPTプロンプト集
2025/8/9
「GPT5-prompts」は、ChatGPTで利用可能な多彩なプロンプト集を提供するGitHubリポジトリです。ユーザーは複数のモードを活用して、プロジェクトの規模や目的に応じた最適な対話を実現可能。特に「Expensive gpt+」モードでは、高度な論理処理や豊富な機能が備わっており、複雑なタスクや大規模プロジェクトに対応します。手軽に利用できるテキストファイル形式でプロンプトが提供されているため、すぐにChatGPTで活用可能です。AI活用の幅を広げたい方に最適なリポジトリです。
Gradio初心者コース2025:ゼロから学ぶインターフェース構築入門
2025/8/22
「Gradio-Beginners-Course-2025」は、Gradioを使った機械学習モデルのためのWebインターフェース構築をゼロから学べる完全初心者向けコースの公式リポジトリです。10.5時間にも及ぶ動画シリーズに対応し、多彩なインタラクティブUIコンポーネントの実装例やチュートリアルノートブックが豊富に含まれており、初心者が手を動かしながら学習を進められる構成となっています。Jupyter Notebook形式で提供され、Pythonによる実践的な開発スキルが身につきます。
GraphNet:コンパイラ開発のための大規模計算グラフデータセット
2025/7/18
GraphNetは、コンパイラの最適化Pass評価やAIによる自動最適化モデルの学習を目的とした、大規模な実モデル由来の計算グラフデータセットを提供するオープンプラットフォームです。研究者はGraphNetを活用して多様なコンパイラ戦略の効果検証やAIを用いたコンパイラ自動最適化の研究を効率的に進められます。本記事では、GraphNetの特徴や技術的ポイント、プロジェクト構成について詳しく解説します。
GRESO:革新的なAI研究プロジェクト
2025/5/30
GRESOは、Infini AI Labによって公開された先進的なAI関連の研究プロジェクトです。リポジトリ自体には詳細な説明がありませんが、開発元の背景から高度な機械学習や人工知能分野の技術を活用した内容であると推察されます。本記事では、公開情報と開発元の特性を踏まえ、GRESOの技術的可能性や特徴について解説します。
花見開花予測 (hanami-bloom-prediction)
2025/10/5
本リポジトリは、気温データの前処理を通じて桜の開花予測に繋げるための試作ノートブックを収めた小規模プロジェクトです。主に「Bloomwatch_Tempertaure_Clean.ipynb」で気象(気温)データのクレンジング、欠損値処理、可視化などの基礎的なデータ準備を行い、開花日推定に向けた下準備を示します。まだ実験段階で、最終モデルや大規模データセットは含まれていません。(約300字)
HEAD_rl_deploy:ヒューマノイドロボット向け自律ナビゲーションと操作の展開実装
2025/8/9
Stanford-TMLが提供する「HEAD_rl_deploy」は、論文「Hand Eye Autonomous Delivery」に基づくヒューマノイドロボットのナビゲーション、歩行、物体把持を学習・展開するための公式実装リポジトリです。本プロジェクトは、シミュレーション環境「Isaac Gym」およびUnitree SDKを活用し、Sim2SimおよびSim2Realのデプロイメントを実現。ロボットのリアルな動作を学習させるための強化学習技術と制御モジュールを統合し、研究開発の加速を支援します。
心臓病予測モデル:決定木分類器による解析
2025/8/14
本リポジトリは、Cleveland Heart Diseaseデータセットを用いて機械学習による心臓病の有無を予測するプロジェクトです。決定木分類器を採用し、データの前処理からモデル学習、重要なリスク要因の特定、そして決定木の可視化まで一連の流れをJupyter Notebook形式で実装しています。解釈性の高いモデルで臨床の意思決定支援を目指した内容となっています。
HiRISC-Dataset:衝突回避のための高リスクインタラクティブシナリオデータセット
2025/6/16
HiRISC-Datasetは、自動運転やロボット工学の分野で重要な衝突回避技術の研究を支援するために設計された高リスクインタラクティブシナリオのデータセットです。複雑で危険度の高い交通シナリオを豊富に含み、実世界の交通インタラクションを詳細にキャプチャしています。研究者や開発者が衝突回避アルゴリズムの検証、強化学習のトレーニング、モデルの評価に利用できる貴重なデータ資源として注目されています。
H-Net:動的チャンク分割による階層的系列モデルの革新
2025/7/11
H-Netは、動的チャンク分割を活用したエンドツーエンドの階層的系列モデリングアーキテクチャを提供するPythonリポジトリです。自然言語処理や時系列解析など、多様な系列データに対して効率的かつ高性能な表現学習を実現し、研究論文に基づいた最新技術を実装しています。
HomeSystem:モジュール化スマートホーム自動化システム
2025/8/16
HomeSystemは、Dockerベースのモジュール化されたスマートホーム自動化システムです。ローカルとクラウドの複数の大規模言語モデル(LLM)を統合し、文書管理、論文の自動収集・分析、OCR処理、可視化、ワークフローの自動化を実現します。複数の独立モジュールによる分散展開が可能で、研究者や技術者の論文調査・管理効率を大幅に向上させる先進的なプラットフォームです。
horizon-overlay:作業上にAIを重ねる革新的オーバーレイツール
2025/6/21
「horizon-overlay」は、ユーザーの現在の作業環境にAI機能を重ねて表示するSwift製のオーバーレイツールです。画面上でAIがリアルタイムに情報提供や支援を行うことで、作業効率の向上やインタラクションの強化を実現します。軽量かつ柔軟な設計により、さまざまなアプリケーションや環境に容易に統合可能。130以上のスターを獲得しており、Swiftでの最新AIインターフェース開発の参考として注目されています。
ライブラリ不要の住宅価格ニューラルネットワーク
2025/9/14
このリポジトリは、外部ライブラリを一切使わずにPythonのみで実装されたシンプルなニューラルネットワークにより住宅価格を推定するサンプルプロジェクトです。教育目的で作られており、ニューラルネットワークの基礎(順伝播、誤差計算、重み更新など)をライブラリ依存なしで理解・確認できる構成になっています。小規模データや学習アルゴリズムの仕組みを学ぶ入門教材として有用です。(約300字)
HS-TasNet:リアルタイム低遅延音楽ソース分離のためのハイブリッドスペクトログラム-TasNet実装
2025/8/1
HS-TasNetはL-Acousticsの研究チームによって提案された「リアルタイム低遅延音楽ソース分離のためのハイブリッドスペクトログラム-TasNet」の実装リポジトリです。本リポジトリでは、音楽信号をリアルタイムかつ低遅延で分離するための最新技術であるHS-TasNetのモデル構造や実験結果を再現し、音響信号処理や音楽情報処理の分野での応用を目指しています。シンプルな構成ながらも実践的なコードを提供し、研究者や開発者が容易に活用可能です。
human-in-the-loop:Discord経由でAIと人間が連携するMCPサーバー
2025/6/21
「human-in-the-loop」は、Rustで実装されたMCP(Model Context Protocol)サーバーで、AIアシスタントがDiscordを介して人間に質問を投げかけられる仕組みを提供します。AIモデルが自動で判断できない部分を人間がリアルタイムに補助することで、精度向上や安全な対話を実現。AIと人間の協調作業を促進する点が特徴です。
Human3R — 4Dヒューマン・シーン再構成の統合モデル
2025/10/7
Human3Rは「4D(時間を含む)ヒューマン・シーン再構成」を目標とした研究実装リポジトリです。単一フレームの3D復元に留まらず、時間的整合性を持った動的人体と周囲シーンを同時に復元・統合する手法を提供します。深層学習ベースの表現、シーン理解との結合、時系列モデリングや微分可能レンダリングを組み合わせ、人物の動きと環境の相互作用を高精度に再現することを狙います。研究論文とプロジェクトページへのリンク、実装コードや設定ファイルが含まれます。
Hunyuan-A13B:Tencentの革新的なMoEベース大規模言語モデル
2025/6/27
Tencentが開発したHunyuan-A13Bは、細粒度のMixture of Experts(MoE)アーキテクチャを採用した革新的なオープンソース大規模言語モデル(LLM)です。Pythonで実装されており、高効率かつ高性能な自然言語処理を実現。研究開発や応用展開に柔軟に対応可能な設計が特徴であり、AI/ML分野での注目が集まっています。
Hunyuan3D 2.1 Windows対応版の概要と技術解説
2025/7/19
Hunyuan3D 2.1のWindows対応版リポジトリは、Windows環境での互換性問題を解決し、3Dレンダリングや差分レンダリングに関するエラーを修正したPython製のプロジェクトです。DeepSpeedやカスタムラスターライザーのインストール問題、環境依存のバグに対応し、Windowsユーザーに向けて快適な利用環境を提供します。リポジトリは軽量ながら実用的な機能を備え、3D関連の研究・開発を支援します。
HUSAI: 安定的なAI特徴量探索
2025/10/31
HUSAI(Hunting for Stable AI Features)は、スパース自己符号化器(Sparse Autoencoders, SAE)における「再現性の危機」を調査し、ランダムシードによる変動に強い安定で解釈可能な特徴量の探索手法を模索する研究プロジェクトです。PyTorchを用いた実験フレームワークと実装ロードマップ、実験サマリを含み、安定性評価や実装の再現性向上を目的とした方針を提示します。現時点では初期段階のリポジトリで、設計ドキュメントが充実している点が特徴です。
Minecraftを画面認識でプレイするDeep Q-NetworkによるAI「ia-minecraft-D.I.V.A」
2025/8/17
本リポジトリ「ia-minecraft-D.I.V.A」は、画面の映像情報を元にMinecraftを自動でプレイするAIをDeep Q-Network(DQN)を用いて実装したプロジェクトです。Pythonで書かれており、強化学習の手法を活用してゲーム内の状況を画面認識しながら最適な行動を学習します。AIが視覚情報を解析し動作を決定するため、ゲーム環境の状態を直接取得しないケースにも対応可能です。深層強化学習の応用例として注目されるリポジトリです。
iask-2api(真理・終章)
2025/10/12
iask-2api は教育目的で設計された軽量な Python ベースの API プロジェクトです。Docker 対応かつ Apache-2.0 ライセンスで公開されており、非同期ストリーミング(AsyncGenerator[bytes] を意識した実装)や JSONResponse を用いたレスポンス設計、環境変数管理(.env/.env.example)など、実運用に近い構成を小さなコードベースで学べます。リポジトリは「教学思路(教育的なアイデア)」を共有することを主眼にしており、サンプルとして API サーバの立て方やコンテナ化の手順を追うのに適しています。
AI画像検出回避ユーティリティ
2025/8/22
AIによる画像検出を回避するための多彩な手法を実装したPython製ユーティリティです。ノイズ注入、FFT平滑化、ピクセル摂動、カメラシミュレーションなどの技術を用いて、画像の検出を困難にします。PyQt5による使いやすいGUIを備え、リアルタイムプレビューや分析パネルにより、画像加工の効果を視覚的に確認可能。パラメータ調整も自動モードと手動モードを提供し、多様なニーズに応えます。
ImageEmboss:Visionフレームワークを活用した画像認識と被写体抽出ツール
2025/8/14
ImageEmbossは、AppleのVisionフレームワークを利用して画像内の被写体を識別し、その領域を抽出・強調表示するSwift製のプロジェクトです。Apple Photosのような画像認識とハイライト効果を実装しており、被写体抽出に特化したシンプルかつ実用的なサンプルコードとして活用できます。画像処理や機械学習に興味のある開発者にとって有用なリポジトリです。
img-cool - AIによるスマート画像生成ツール
2025/9/1
「img-cool」はTypeScriptで開発されたAIを活用した画像生成ツールです。ユーザーがテキスト入力やパラメータ指定を行うことで、高品質なイラストや画像を自動生成します。直感的なUIと多彩なカスタマイズ機能を備え、クリエイターやデザイナーの作業効率を大幅に向上させることが可能です。特にWebアプリケーションとして提供されており、ブラウザ上で気軽に利用できる点が特徴です。
ImLPR:Vision Foundation Modelを活用した画像ベースLiDARプレイス認識
2025/8/3
ImLPRは、Vision Foundation Modelを基盤に構築された画像ベースのLiDARプレイス認識システムです。LiDAR点群データの代わりに画像情報を活用して場所認識を行う新しい手法で、自己位置推定やマッピングの精度向上を目指します。現在コードはリリース準備中であり、関連論文も公開されています。
inception-2api — InceptionLabs チャットを OpenAI 互換 API にするプロキシ
2025/10/11
InceptionLabs のウェブチャットサービス(chat.inceptionlabs.ai)を、OpenAI の API フォーマットに変換して扱えるようにする高性能プロキシ実装です。Docker 対応・環境変数による設定・教育目的の実装例を提供し、ローカルやコンテナ環境で既存クライアントをほとんど変更せずに Inception のサービスを利用できるようにします(使用は合理的な範囲で)。
インスタント翻訳ツール(Instant Translator)
2025/11/5
本リポジトリは、音声をリアルタイムで文字起こしし、翻訳結果を即座に表示するデスクトップ向けの支援ツールです。Whisper(faster-whisper)を用いたローカル音声認識とDeepLによる高品質翻訳を組み合わせ、浮動ウィンドウで原文と翻訳をスクロール表示します。英語→母語など留学生や多言語環境での即時理解を支援する目的で設計されており、TXT/SRT形式でのログ保存や環境構築用のconda/pip手順が用意されています。
InstructX(統一視覚編集向けMLLMガイダンス)
2025/10/10
InstructXは「InstructX: Towards Unified Visual Editing with MLLM Guidance」の公式実装リポジトリを名乗るプロジェクトです。マルチモーダル大規模言語モデル(MLLM)を用いて、指示(インストラクション)に基づく視覚編集タスクを統一的に扱うためのフレームワークを実装・提示することを目的としています。本リポジトリ自体は現時点で README を中心とした最小構成ですが、論文で提案された設計思想やアルゴリズムを実験・再現するための公式実装の起点として位置づけられます。研究の概要、実装方針、想定される応用や制約について整理します。
LangChainを活用したインテリジェントアシスタント
2025/7/27
本リポジトリは、Pythonで開発されたターミナルベースのインテリジェントアシスタントです。LangChainフレームワークと大規模言語モデル(LLM)を組み合わせ、自然言語での対話や情報検索、文書要約、ツール連携を実現。コンテキストを保持しながらユーザーの質問に応答することで、コマンドライン上でスマートなAI体験を提供します。開発のシンプルさと拡張性も特徴です。
インテリジェント顧客エージェント(Intelligent_Customer_Agents)
2025/9/14
AIを活用した顧客エンゲージメントプラットフォームの教育フレームワークを提供するリポジトリ。インテリジェントエージェントとマルチチャネル配信をテーマにしたコース構成や学習資料の骨組みを含み、実践的な設計パターンや統合方法を学べることを目指しています。現時点ではREADME中心のスケルトンですが、コースとしての学習目標やモジュール設計が示されており、拡張・実装の出発点として有用です。(約300字)
インタラクティブRAG:ベクトルストア編集に特化した次世代情報検索プラットフォーム
2025/8/26
「Interactive-Rag」は、PDFのアップロードからベクトルストアへの格納、セマンティック検索、そして何よりもベクトルストア内の知識チャンクをリアルタイムで簡単に編集できることを最大の特徴とした最新のRetrieval-Augmented Generation(RAG)プラットフォームです。直感的なWeb UIで検索・編集・更新をシームレスに行え、知識ベースの高速なアップデートを実現します。
InternManip:ロボット操作学習の統合スイート
2025/7/24
InternManipは、様々なデータセットとベンチマークに対応したロボット操作ポリシーモデルの学習および評価を一括で行えるオールインワンのフレームワークです。Pythonで実装されており、強化学習や模倣学習を活用したポリシー訓練を効率的にサポート。デモ動画やドキュメントが充実しており、研究開発や実験に適した環境を提供します。
InternVLA-A1:ロボット操作のための視覚・言語・行動統合フレームワーク
2025/9/18
InternVLA-A1は、視覚(Vision)・言語(Language)・行動(Action)を一貫して扱うエンドツーエンドのフレームワークです。タスクの進行を予測する「predictive imagination(予測的イマジネーション)」を導入して実行をガイドし、動的で変化する環境下での操作性能を高めることを目的としています。Python実装で、モデル・アセット・実行環境の要件が同梱されています(300字程度)。
IoTネットワーク侵入検知における勾配ブースティング活用プロジェクト
2025/9/7
本リポジトリは、CICIoT2023データセットを用いてIoTネットワークに対する侵入検知を行う機械学習プロジェクトです。複数の勾配ブースティングアルゴリズムを実装し、2値分類、8クラス多クラス分類、全クラス多クラス分類のタスクに対応。IoTセキュリティ分野における高度な検知モデル構築を目指し、性能評価や可視化も充実しています。
IT支援型チケッティングシステム
2025/8/22
本リポジトリは、過去のチケット割り当てデータを活用し、機械学習と自然言語処理(NLP)を用いてサポートチケットの自動割り当てを実現するプロトタイプです。Pythonで実装されており、チケットの説明文を入力することで、最適な担当者やチームを提案。大規模組織での手動割り当ての非効率さやミスを減らし、サポート業務の効率化を図ります。
IVEBench — 視覚/表現評価ベンチマーク(IVEBench)
2025/10/14
IVEBenchは、視覚系モデルや視覚-言語埋め込みの評価を目的とした軽量ベンチマークツールキットと推測されるリポジトリです。Yinan Chenら研究者が関与したプロジェクトで、メトリクス実装を格納するmetricsディレクトリ、実行設定を持つivebench.yml、再現用アセット群などを備えています。Python実装で要件はrequirements.txtにまとまっており、拡張性とモジュール性を意識した設計が窺えます(推測)。
IVS - インテリジェントビークルスクール4期プロジェクト
2025/7/8
「IVS」は、Intelligent Vehicle School(インテリジェントビークルスクール)第4期におけるプロジェクトで、Pythonを用いてインテリジェント車両に関する研究開発を行うリポジトリです。車両の自動制御や認識技術に関するサンプルコードやアーカイブが含まれており、実践的なAI/ML技術の学習に役立ちます。
JAgenda — AI駆動の時間管理アシスタント
2025/9/13
Djangoで構築されたAI搭載のアジェンダ(予定)管理アプリ。ユーザーのスケジュールを整理し、優先度付けや時間配分の提案を行うエージェント機能、PDFやWeChatチャットログの解析による予定抽出、カレンダー形式へのエクスポートなど、日々の時間管理を支援する機能群を備えています。個人のタスク最適化や会議ログからの要点抽出などに利用できます(約300字)。
Jailbreaks-GPT-Gemini-deepseek-:AIモデルのプロンプト解除ツール集
2025/6/3
「Jailbreaks-GPT-Gemini-deepseek-」は、GPT、Sora、Claude、Geminiなどの大規模言語モデル(LLM)に対して、制限を解除し“rage mode”を起動するためのプロンプト集を提供するリポジトリです。AIの安全機能や制約を回避することを目的にしたツール群で、研究や検証用途に活用されています。さまざまなモデルに対応しており、AIの応答制御の理解や逆解析に役立ちます。
Jarvis - 音声とジェスチャーで操作するパーソナルアシスタント
2025/9/4
JarvisはPythonで開発されたパーソナル音声&ジェスチャーアシスタントです。音声コマンドと手のジェスチャーを組み合わせてPCの操作を直感的かつハンズフリーで行えます。アプリケーションの起動やタブの切り替え、メディアコントロール、ボリュームや画面の明るさ調整など、多様な操作をサポートし、効率的なワークフローを実現します。
jina-embeddings-v4-gguf:多言語・多モーダル検索向け埋め込みモデルの量子化コレクション
2025/7/18
jina-embeddings-v4-ggufは、多言語かつ多モーダル検索に対応した最先端の埋め込みモデル「jina-embeddings-v4」のGGUFフォーマットおよび量子化モデルのコレクションです。高精度ながら計算資源を抑えた高速推論を可能にし、様々な検索・情報検索システムへの適用を支援します。
ジョブレコメンデーションシステム:AIキーワード抽出とRedisキャッシュを活用したJavaベースの求人推薦システム
2025/8/31
本リポジトリは、Javaを用いて開発された高度な求人推薦システムです。MySQLによるデータ管理、Redisのキャッシュ機能を組み合わせ、地理情報に基づく求人検索と個別最適化された求人推奨を実現しています。AIによるキーワード抽出技術を活用し、ユーザーのニーズに合わせた精度の高いマッチングを提供。モダンなウェブ技術との統合により、スムーズな利用体験を実現しています。
Jules Agent向け厳選プロンプト集
2025/5/22
本リポジトリは、Google Labs Codeが提供する「Jules Agent」に最適化された優れたプロンプトを多数収録したコレクションです。AIエージェントの応答精度や多様な応用例を引き出すための実用的なテンプレートやアイデアをまとめており、開発者や研究者が効率よく活用できるよう設計されています。AI対話システムの高度化に貢献する一助として注目されています。
k2Think2Api — Deno版 K2Think API エンドポイント実装
2025/9/11
k2Think2Api は、K2Think API を Deno(TypeScript)環境で動かすための軽量なサンプル実装です。Deno Deploy 向けに最適化されており、環境変数で複数の API キーやモデルマッピング(MODELS_JSON)を設定して /v1/models と /v1/chat/completions のエンドポイントを提供します。ストリーミング応答や推論結果と回答内容の分離など、実運用を意識した設計を簡潔に示しています(約300字)。
KBook - AIで書籍構成と内容を自動生成するアプリケーション
2025/6/15
KBookは、Gemini APIを活用したAI搭載アプリケーションで、ユーザーが書籍の構成、タイトル、章の内容を効率的に生成できるツールです。TypeScriptで開発されており、クリエイターがアイデア出しから執筆までのプロセスをサポート。AI技術を活用した書籍制作の新しい可能性を示しています。
機械学習講義資料集 - Kelas Pembelajaran Mesin
2025/6/26
「kelas-pembelajaran-mesin」は、インドネシアのUNISBA Blitar情報技術学科向けに提供されている機械学習講義資料のリポジトリです。Pythonを用いた実践的な機械学習の学習教材がまとめられており、学生や初学者が基礎から応用まで段階的に学べる内容となっています。機械学習の理論と実装を体系的に学習可能な貴重なリソースです。
KHGNN: カーネルハイパーグラフニューラルネットワークの実装
2025/9/2
本リポジトリは、IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)で発表された論文「Kernel Hypergraph Neural Networks」の公式実装を提供しています。PythonとPyTorchを用いて開発されており、ハイパーグラフ構造を効率的に学習する新しいニューラルネットワークモデルを実現。複雑な高次関係を捉えることが可能で、グラフ構造を扱う機械学習・深層学習分野での応用が期待されます。
Kick - AI搭載のWindows操作アシスタント
2025/7/29
Kickは、Windowsデバイスを音声やキーボードで直感的に操作できるAI搭載のオープンソースアシスタントです。日常業務の自動化を実現し、タスク実行やアプリ管理をスムーズに行えます。ユーザーは音声やテキストコマンドでシステム操作を行い、効率的なワークフローを構築可能です。シンプルかつ強力な機能で、Windows環境の操作性を大幅に向上させます。
Kimi ブックライター(K2小説生成)
2025/11/8
Moonshot AI の Kimi K2 推論モデル(256k コンテキスト)を使って、小説一冊分の Markdown 形式の書籍を自動生成するためのサンプルプロジェクトです。OpenAI SDK(v1)の Moonshot 互換モードを利用し、長尺コンテキストとマルチステップ推論を活かしたテキスト生成を想定した最小構成で、環境変数や Markdown 出力、lint 設定などの実用的なセットアップを含みます。開発や実験用の出発点として使いやすいリポジトリです。
kimi-ccによるClaude Codeの最新モデル駆動ツール
2025/7/11
「kimi-cc」は、Kimiの最新言語モデル「kimi-k2-0711-preview」を活用して、Anthropic社の高性能AIモデル「Claude Code」を手軽に利用できるようにするシェルスクリプトツールです。APIキーを取得し、簡単なインストール手順を踏むことで、低コストかつ高速にClaude Codeとの対話を開始できます。シンプルな構成ながら、最先端のLLMを活用した開発に役立つ実用的なプロジェクトです。
Kimi-Dev:ソフトウェアエンジニアリング向けオープンソースコーディングLLM
2025/6/16
Kimi-Devは、ソフトウェア開発タスクに特化したオープンソースの大規模言語モデル(LLM)です。Pythonで実装され、コード生成や補完、バグ検出、リファクタリング支援など、開発者の生産性向上を目的としています。MoonshotAIが公開しており、コミュニティ主導での継続的改善が期待されるプロジェクトです。軽量かつ柔軟な設計により、さまざまな開発環境に統合可能です。
KittenTTS:超軽量で高品質な音声合成モデル
2025/8/5
KittenTTSは、わずか1500万パラメータで構成される超軽量テキスト音声合成(TTS)モデルです。25MB未満のモデルサイズでありながら、高品質な音声をリアルタイムで生成可能。GPUなしのCPU環境でも動作するため、幅広いデバイスでの利用が可能です。軽量性と性能のバランスを追求した設計が特徴で、複数のプレミアムボイスを備えています。
2024年気象ビッグデータコンテスト優勝モデル「KMA-BigData-ElecPred-2024」
2025/9/7
本リポジトリは、2024年に韓国気象庁主催・韓国電力公社後援の気象ビッグデータコンテストで最優秀賞(1位)を獲得した「パブハム」チームの電力気象指数予測モデルのコードを公開しています。気象データを活用し、集合住宅の電力需要を示す指標の精度を大幅に向上させたXGBoostベースのアンサンブルモデルを実装。高精度な予測に向けた特徴量設計やFold単位のモデル融合など、実践的な機械学習技術を駆使しています。
Kontext HiRes:高解像度画像生成を支援するLoRAモデルとComfyUIワークフロー
2025/9/4
Kontext HiResは、「black-forest-labs/FLUX.1-Kontext-dev」をLoRAでファインチューニングしたモデルで、高精細かつ高解像度な画像生成を実現します。ComfyUI用のワークフローも提供されており、ユーザーは簡単にモデルを導入し、画像のディテール強化を行えます。本リポジトリは、画像生成の品質向上を目指すクリエイターや研究者にとって有用なツールを提供しています。
KontextLoraのLora変換ツール
2025/7/23
KontextLoraのLoraモデルを双截棍(Nunchaku)形式と互換性のない問題を解決するための変換ツールです。本リポジトリは、diffusersとpeftの特定バージョンを前提に、モデル変換後もエラーが発生しないよう設計されています。Pythonで実装され、シンプルなスクリプト群で構成されているため、Loraモデルの互換性問題に悩むAI/ML開発者に有用です。
KosmischeCovers:1970年代宇宙ロック風サイケデリックアルバムカバー生成AI
2025/8/1
KosmischeCoversは、1970年代のドイツ宇宙ロック(kosmische)から着想を得たサイケデリックなアルバムカバーアートを生成するためのオープンソース機械学習プロジェクトです。データセットの準備からデータ拡張、最新の拡散モデルを用いた学習と推論までの一連のパイプラインを提供し、研究者やアーティスト、趣味でAIによる生成アートに興味があるユーザーに最適化されています。
KPrompt:高性能AIプロンプト設計ワークベンチ
2025/8/17
KPromptはAIプロンプトエンジニアや開発者向けに設計された高度なウェブベースツールで、AIとの対話を最適化するためのシステムプロンプト設計と会話プロンプトの洗練を支援します。特に「System Prompt Architect」と「Conversational Prompt Refiner」という2つのモジュールを備え、AIの人格構築や対話品質向上を効率的に行える点が特徴です。
KResearch:Gemini APIを活用した深層リサーチ支援アプリケーション
2025/6/14
KResearchは、Gemini APIを用いてユーザーと対話的にリサーチテーマを明確化し、Google検索を活用した戦略的な調査を繰り返し実行。収集した情報を引用付きで体系的にまとめたレポートをストリーミング形式で提供するTypeScript製アプリケーションです。深い調査プロセスの自動化とユーザー体験の向上を目指しています。
KVSplit:Apple Silicon向け長文コンテキスト対応LLMのための効率的KVキャッシュ量子化
2025/5/22
KVSplitは、Apple Silicon(M1/M2/M3)上で大規模言語モデル(LLM)をより長いコンテキストで実行可能にするための革新的なKVキャッシュ量子化技術を提供します。キーを8ビット、バリューを4ビットで量子化することで、メモリ使用量を約59%削減しつつ、品質低下を1%未満に抑えています。セットアップはワンコマンドで簡単に行え、性能ベンチマークや可視化機能も備え、MetalによるGPU最適化も実装。Apple Siliconユーザーに最適なLLMメモリ効率化ソリューションです。
KWiki - AI駆動のコードリポジトリWikiジェネレーター
2025/8/11
KWikiはGo言語で実装されたAI搭載のコードリポジトリドキュメント生成ツールです。GitHub、GitLab、Bitbucketなどのリポジトリを美しくインタラクティブなWiki形式のドキュメントに変換し、開発者のドキュメント作成を効率化します。最新のAI技術を活用し、自動でコードの説明や構造を解析して分かりやすいドキュメントを生成可能です。
Cocos Creator向けAI活用ターミナル「kylin-ai-terminal」
2025/6/27
「kylin-ai-terminal」は、Cocos Creator環境でAI技術を容易に活用するためのターミナルツールです。Vue.jsを用いて開発されており、ゲーム開発者やクリエイターがAI機能を手軽に統合・利用できるよう設計されています。シンプルなUIと拡張性を兼ね備え、Cocos CreatorとAIの橋渡し役として注目されるプロジェクトです。
l0:汎用エージェントのためのスケーラブルなエンドツーエンド学習パイプライン
2025/6/28
l0は、汎用的な知能エージェントの開発を目指した、スケーラブルかつエンドツーエンドのトレーニングパイプラインを提供するPython製のフレームワークです。多様なタスクに対応可能なエージェントの効率的な学習を支援し、研究や実用化のための基盤を構築します。シンプルな設計ながら、高度な拡張性と柔軟性を兼ね備えており、AIエージェント開発の加速に寄与します。
Label-Free-RLVR:ラベル不要な強化学習による視覚的ロボット操作
2025/5/30
Label-Free-RLVRは、ラベル付けされたデータなしで視覚情報を利用し、強化学習を用いてロボットの操作タスクを学習させるための手法と実装を提供するリポジトリです。煩雑なデータラベリング工程を省略し、効率的にロボットビジョンと制御の融合を実現。実環境における視覚的強化学習の適用を促進します。
LangChain と LangGraph によるエージェント開発テクニカルガイド
2025/10/17
LangChain と LangGraph を組み合わせたエージェント開発について、基礎コンポーネントから具体的なワークフロー図、実践的なコード例までをまとめたハンズオン兼解説リポジトリ。モデル呼び出し、プロンプトテンプレート、メッセージ型、エージェント設計、サイクル型ワークフロー等を分かりやすく整理しています(実践ノート・個人的考察つき)。
LangScene-X:一般化可能な3D言語埋め込みシーンの再構築技術
2025/7/3
LangScene-Xは、TriMapビデオ拡散モデルを用いて、3D空間内に言語情報を埋め込んだシーンを高精度かつ一般化可能に再構築する最先端の技術を提供するリポジトリです。ICCV 2025で発表された本研究は、動画データの拡散モデルを活用し、多様な環境下での3Dシーン理解と生成を可能にしています。Pythonベースで構成され、効率的な自動セグメンテーションや補間モジュールを備え、今後の3D言語融合技術の発展に寄与することが期待されます。
LangGraph V1 チュートリアル(韓国語)概要解説
2025/10/30
LangGraph V1 の基本概念と実践的な使い方を解説する韓国語のJupyter Notebookチュートリアル集です。エージェント設計、環境構築、サンプルコードを通じてLangGraphを使ったAIエージェント開発の入門から応用までを段階的に学べます。ノートブック中心で実行例が豊富なため、実装と検証を同時に進められます。(約300字)
Learn Agentic AI: 低コードからコードへ — AgentKitで実践するエージェント開発
2025/10/8
このリポジトリは「Learn Agentic AI: From Low-Code to Code」と題された無料コースの教材リポジトリです。OpenAI AgentKitを用いてプロダクション品質のエージェントを設計・実装することを目的に、低コード(Low-Code)からコードへ段階的に学べる構成になっています。ライブ授業(YouTube)やファカルティ陣によるハンズオン、プロンプト設計の演習素材が含まれ、学習者が実務で使えるスキルを身につけるための入門〜実践リソースを提供します。(300字程度)
Leia SP Eclipse — Leia SP向けインテリジェント自動化システム
2025/11/4
Leia SP Eclipseは、Leia SPプラットフォーム向けのインテリジェント自動化ソリューションを目指すプロジェクトです。READMEの記述からは、Árvore(ポルトガル語で『木』を意味する統合モジュール)を通じた連携でプラットフォーム操作を自動化し、Discordコミュニティや公式サイトと連携するエコシステムを構築することが想定されます。本リポジトリ自体は現時点で最小構成ですが、外部サービスとの連携やボット的自動化のベースとして拡張が期待されます。
LiMA - クロスビュー・長時間軸蒸留による高精度LiDAR表現学習
2025/6/26
LiMAは、ICCV 2025で発表された最先端のLiDAR表現学習フレームワークです。従来のワンショット・ワンパースペクティブの制約を超え、複数視点(クロスビュー)と長時間軸にわたる蒸留技術を組み合わせることで、より堅牢で高精度なLiDAR特徴表現を実現します。自動運転や3D環境認識におけるLiDARデータ処理の性能向上に貢献する革新的な手法です。
LIMIT-Sparse-Embedding:LIMITデータセットでのスパース埋め込み評価ツール
2025/9/1
Googleの論文「On the Theoretical Limitations of Embedding-Based Retrieval」で提唱されたLIMITデータセット(limit-smallおよびlimit)を用い、OpenSearchの最新スパース埋め込みモデルを評価するPythonリポジトリです。スパース埋め込みが密埋め込みの理論的な限界を克服する可能性を示す中、実験環境と評価スクリプトを提供し、研究や実装の加速に貢献します。
埋め込みベース検索の理論的限界に関する研究
2025/8/29
本リポジトリ「limit」は、DeepMindによる論文「On the Theoretical Limitations of Embedding-based Retrieval」の公式実装を提供します。埋め込み次元の制約に基づき検索モデルの性能限界を理論的に明らかにし、それを検証するためのLIMITデータセットを含みます。これにより、埋め込み空間の表現力や検索精度の根本的な限界を理解し、今後の検索技術の改善に貢献します。
Cartesia Line SDK:低遅延音声エージェント開発キット
2025/8/19
Cartesia Line SDKは、低遅延で動作するインテリジェントな音声エージェントを迅速に構築・展開できるPythonベースの開発キットです。既存のチャットボットを音声対応に変換したり、サポートやスケジューリングなどの汎用ユースケース向けテンプレートも提供。オートスケーリングやテレフォニー連携、メトリクス収集などプロダクション運用に必要な機能も備えています。5分以内に音声エージェントを作成し対話可能な点が特徴です。
機械学習のための線形代数シリーズ
2025/8/26
本リポジトリは、機械学習の基礎理解に欠かせない線形代数を深くかつ直感的に学べる一連の教材を提供します。Jupyter Notebook形式で、学生や実務者、研究者が線形代数の理論から実践までを段階的に習得できるよう構成されており、数学的背景の強化に最適です。
LinearRAG — 大規模コーパス向け線形GraphRAG(Relation-free)
2025/10/27
LinearRAGは「relation-free(関係ラベルを用いない)グラフ構築」によって大規模コーパス上で高速かつ低コストに動作するGraphRAG(Graph Retrieval-Augmented Generation)を実現するための実装リポジトリです。グラフ構築時に大規模言語モデル(LLM)へのトークン費用を発生させないことを目指し、スケーラブルで効率的な検索強化生成パイプラインを提供します。実装はPythonでまとめられており、論文・実験コード・図表が揃っています(300字程度)。
LiteAI Writer - 軽量AI文章生成ツール
2025/6/7
LiteAI Writerは、PHPで開発された軽量のAI文章生成ツールです。シンプルな設計ながらも、手軽にAIを活用した文章作成を実現。PHP環境に馴染みのある開発者に最適で、導入やカスタマイズが容易なため、ブログやコンテンツ制作の自動化に役立ちます。今後の拡張性にも期待できる注目のリポジトリです。
LiTFiC: コンテキストで見つけた翻訳の迷い
2025/6/13
LiTFiCは、CVPR2025で発表された「Lost in Translation Found in Context」という研究に基づくリポジトリです。本プロジェクトは、翻訳タスクにおける誤訳や意味の取り違えを、文脈情報を活用することで改善することを目的としています。Pythonで実装されており、翻訳精度向上を目指した先進的なアルゴリズムが含まれています。
LIV_handhold_2: 低コストLiDAR・慣性・ビジュアル融合型3Dセンサー
2025/8/21
LIV_handhold_2は、ロボティクスやEmbodied AI向けに設計された低コストのLiDAR・慣性計測装置(IMU)・カメラを融合した3Dセンサーシステムです。高精度な環境認識と自己位置推定を可能にし、多様なロボットアプリケーションに適用可能。C++で実装されており、ハードウェア設計やソフトウェア処理の両面からオープンに提供されています。
Live-Class:リアルタイム授業支援プラットフォーム
2025/7/6
Live-Classは、リアルタイムでのオンライン授業やライブクラスを効率的にサポートするためのプラットフォームです。Jupyter Notebookベースで構築され、教育現場における双方向コミュニケーションや即時フィードバックを実現。シンプルな構成ながら、エージェントによる自動サポート機能を備え、教育の質向上と運営効率化を目指しています。
LLaMA-Factory-0.9.2-S4000-musa:MUSA対応のLLaMAモデルファクトリー
2025/9/8
LLaMA-Factory-0.9.2-S4000-musaは、浙江德塔森特(DTCTAI)による、MUSA(Mulan Unified System Architecture)を活用したLLaMAモデルのファクトリー実装です。Python 3.10以上をベースに、PyTorchとMUSAの統合環境で軽量かつ高速な大規模言語モデルのトレーニング・推論を可能にします。Docker環境や各種構成ファイルを備え、ローカルからクラウドまで幅広い環境に対応。最新のAI/ML技術を活用した研究開発や実用化検証に適したリポジトリです。
LLaVA-OneVision-1.5: オープンなマルチモーダル学習フレームワーク
2025/9/16
LLaVA-OneVision-1.5は、完全オープンな大規模マルチモーダルモデル(LMM)ファミリーを目指すリポジトリです。学習用データセット(Mid-Training / Instruct)を公開し、Megatron系の分散学習やLLMトレーニングパイプラインを組み合わせて、低コストで高性能なマルチモーダルモデルの再現と実験を可能にすることを狙いとしています。研究・再現・発展用途に適した設計が特徴です。(約300字)
LLaVA-VLA:シンプルかつ強力な視覚言語行動モデル
2025/6/16
LLaVA-VLAは、視覚と言語、そして行動を統合的に処理するために設計されたモデルで、シンプルながらも高いパフォーマンスを実現しています。OpenHelix-Teamによって積極的にメンテナンスされており、Pythonで実装されたこのリポジトリは、マルチモーダルAIの研究開発において注目されています。視覚と言語情報の融合による高度な推論や行動予測を可能にし、多様な応用が期待されるモデルです。
LLM-Agent-Resume:LLMを活用したスマートな履歴書スクリーニングシステム
2025/8/12
本リポジトリは大型言語モデル(LLM)を用いたスマートな履歴書スクリーニングシステム「LLM-Agent-Resume」を提供します。自然言語による求人要件の理解、PDF履歴書や職務記述書からの情報抽出、量化されたマッチングアルゴリズムによる多段階選考などを特徴とし、採用担当者の作業効率と選考精度を大幅に向上させることを目的としています。RESTful APIも実装されており、既存の採用システムへの統合も容易です。
LLMエージェント&エコシステムハンドブック
2025/9/8
本リポジトリは、60以上のエージェントスケルトン、チュートリアル、エコシステムガイド、評価ツールを一元的にまとめた、LLM(大規模言語モデル)エージェントの構築・展開・理解のための包括的ハンドブックです。Pythonで実装されており、初心者から研究者まで幅広いユーザー層に対応。最新の技術動向を踏まえた実践的なリソースが充実しているため、LLMエージェント開発の効率化と品質向上に貢献します。
vLLM推理サービス性能ベンチマークツール
2025/7/30
本リポジトリは、vLLM推理エンジンをベースにした大規模言語モデルの推論性能圧測フレームワークです。モデル名やテスト日時による結果管理、特定のテスト結果を選択しての集計分析機能を備え、バッチテストや単一テスト、結果集約を一元管理できる統一エントリースクリプトを提供。レイテンシやスループット、初トークン応答時間など多角的な性能指標を評価し、vLLMの推論サービスの性能検証と最適化を支援します。
LLM + MCP + RAGのTypeScript実装による拡張型言語モデルエージェント
2025/7/18
本リポジトリは、TypeScriptで開発されたフレームワーク非依存の拡張型大規模言語モデル(LLM)エージェント実装です。MCP(Multi-Chain Processing)機能により複数の処理チェーンを構築・管理し、RAG(Retrieval-Augmented Generation)を極めてシンプルに実装。ウェブページの閲覧から要約生成、ローカル文書の検索・注入までをカバーし、LangChainやLlamaIndexなどの既存フレームワークに依存しない柔軟な設計が特徴です。
LLM-pdf-extraction:PDF文書から構造化サマリーを抽出するAPI
2025/7/30
LLM-pdf-extractionは、環境・農業分野の報告書に特化したPDF文書をアップロードし、OpenAIのGPT-4oやAnthropicのClaudeモデルを活用して非構造化テキストから構造化されたJSON形式の要約を生成するAPIです。Node.jsとTypeScriptで開発され、PDF解析にはpdf-parseを用いることで、複雑なPDF内容を効率的に解析・変換します。これにより、下流のデータ処理や分析に適したフォーマットで情報を抽出可能です。
llm-toolcall-proxy:AIモデルのツールコール変換プロキシ
2025/7/31
llm-toolcall-proxyは、Flaskをベースにしたプロキシサーバーで、異なるAIモデルのツールコール形式をOpenAIの標準形式に自動変換します。これにより、GLMのようなモデルもOpenAI互換のクライアントでシームレスに利用可能となり、ツール連携の互換性問題を解決します。ストリーミング対応や簡単なセットアップも特徴で、AIモデルの多様なツール呼び出し形式を統一的に扱いたい開発者に最適です。
LLMベースOS:Minimal Linux OSとモデルコンテキストプロトコルによる新たなローカル能力公開
2025/5/22
llmbasedosは、Minimal Linux OSとモデルコンテキストプロトコル(MCP)ゲートウェイを組み合わせることで、ローカル環境の機能を大規模言語モデル(LLM)に安全かつ効率的に公開する革新的なプロジェクトです。Pythonで実装され、ローカルのリソースや操作をLLMから直接活用可能にすることで、AIとOS間の新たなインターフェースを構築。研究や開発に適した柔軟かつ最小限の設計が特徴です。
LLMReasoning-SpecSearch:大規模言語モデル推論の高速化技術
2025/6/1
「LLMReasoning-SpecSearch」は、ICML 2025で発表された論文「Accelerating Large Language Model Reasoning via Speculative Search」の実装コードを提供するリポジトリです。本リポジトリは、大規模言語モデル(LLM)の推論速度を向上させるための新しい探索手法「Speculative Search」を提案しており、Pythonで実装されています。推論過程における計算コスト削減と高速化を実現し、実用的な応用に貢献します。
LMrep:大規模言語モデルとロボットの対話を実現する小規模プロジェクト
2025/8/31
LMrepは、大規模言語モデル(LLM)とロボットの連携を目的としたシンプルなPythonプロジェクトです。Windows環境で動作し、CoppeliaSimを用いたロボットシミュレーションとLLMのAPIを組み合わせることで、自然言語によるロボット制御を試みています。環境構築からAPI連携までの手順が明確に示されており、LLMを応用したロボット制御の入門として有用です。
Localization-CLI:iOSローカライズ自動翻訳CLIツール
2025/8/10
Localization-CLIは、複数のAI翻訳プロバイダーを活用し、iOSのローカライズファイルを自動で翻訳するコマンドラインツールです。70以上の言語に対応し、ソース言語も柔軟に設定可能。使いやすいインタラクティブなCLIインターフェースと進捗表示により、開発者のローカライズ作業を大幅に効率化します。
ロジスティック回帰モデルによる冠動脈疾患リスク予測
2025/8/20
本リポジトリは、Framingham Heart Studyのデータセットを用いてロジスティック回帰モデルを構築し、10年間の冠動脈疾患(CHD)リスクを予測するプロジェクトです。モデルの性能評価には混同行列、ROC曲線、AUCが使われており、医療分野における疾患予測モデルの基礎的な実装例として参考になります。
LongCat-Video:長尺動画(Long-Video)理解フレームワーク
2025/10/25
LongCat-Videoは、長尺動画(long-video)を効率的に扱うための研究実装とツール群を提供するリポジトリです。プロジェクトページや技術報告書、Hugging Faceでのモデル配布へのリンクが用意されており、フレーム特徴抽出から長期時系列のモデリング、評価までをカバーするコード/ドキュメントが含まれます。長時間の動画理解や検索、要約といった応用に向けた実験基盤を提供します(300字程度)。
LongVie:マルチモーダルガイドによる超長尺動画生成
2025/8/6
LongVieは、テキストや画像など複数のモーダル情報を活用し、制御可能な超長尺動画を生成する最先端のAIモデルです。従来の動画生成技術が抱える長時間連続性の課題を克服し、ユーザの指定に応じて多様な内容やスタイルを持つ動画の生成を可能にします。研究者らによる共同開発で、将来的な映像制作やエンターテインメント分野への応用が期待されています。
LoReTrack:効率的で高精度な低解像度トランスフォーマートラッキング
2025/7/13
「LoReTrack」は、低解像度画像における物体追跡を効率的かつ高精度に実現するためのトランスフォーマーベースの新手法を提案するリポジトリです。IROS 2025での口頭発表論文に基づき、低解像度映像の追跡性能向上に焦点を当てており、従来手法と比較して計算コストを抑えつつも追跡精度を大幅に改善しています。Pythonで実装されており、研究コミュニティや実務での応用が期待される注目のプロジェクトです。
Machine-Learning:機械学習プログラミング課題まとめ
2025/9/2
本リポジトリ「Machine-Learning」は、機械学習プログラミング授業の課題を体系的に整理したもので、学習者が実践的に機械学習の基礎から応用までを学べるよう構成されています。週ごとに分けられた課題ファイル群を通じて、理論と実装をバランスよく習得可能です。初心者から中級者までの学習者に役立つ教材として活用できます。
macos-local-voice-agents:macOS向けローカル音声エージェント
2025/7/27
「macos-local-voice-agents」は、macOS上で動作するローカル音声AIエージェントのサンプル実装を提供するリポジトリです。オープンソースのPipecatフレームワークを活用し、MシリーズMacで音声認識から応答までの低遅延(約800ms以下)を実現。Silero VADやスマートターン検出などのローカルモデルを組み合わせ、高精度かつリアルタイムな音声対話体験を実現しています。
Magic-TryOn:次世代バーチャル試着技術
2025/5/29
Magic-TryOnは、vivoCameraResearchによる革新的なバーチャル試着システムのリポジトリです。詳細な説明はありませんが、GitHub上で公開されており、AIを活用した衣服の試着体験をリアルタイムで実現する技術が期待されます。ファッションやEコマース分野におけるユーザー体験向上に寄与する可能性が高く、今後の発展が注目されるプロジェクトです。
Maivi(My AI Voice Input)
2025/10/6
MaiviはローカルCPU上で動作するリアルタイム音声→テキスト変換デスクトップアプリです。ホットキー(既定では Alt+Q)で録音を開始/停止し、部分的な文字起こしを即座に表示・クリップボードへ自動コピーします。Whisper等の大規模モデルに依存せず、軽量化・逐次処理・最適化を組み合わせて低遅延とプライバシーを両立することを目指しています。クロスプラットフォームでPython 3.10+を想定、MITライセンスで公開されています。
MaixFace — Maixduino向けAI顔認識アクセス制御
2025/11/7
MaixFaceは、MaixduinoをベースとしたAI顔認識アクセス管理システムです。顔特徴の永続保存やリモート登録、顔検出に応じた低消費電力のウェイク/スリープ制御、HTTPイベント発行によるIoT連携(例:ドア開閉や記録サーバへの通知)をサポートします。組み込み機器向けに最適化され、現場での簡易な導入と運用を想定した設計が特徴です。本リポジトリはPythonで実装され、GPLv3で提供されています。
MAMAR.AI — マトリックス風エージェント型サイバーパンクAIチャットボット
2025/11/1
MAMAR.AIは「Matrix AI Machine Agents Rebel」を掲げるサイバーパンク風チャットボットの実装/デプロイ資産です。リアルタイムにウェブを参照(“hack the web”)する機能を想定し、xAI Grok、OpenAI(GPT系)、Anthropic(Claude)など複数の大規模言語モデルと連携します。BubbleやBase44向けのエクスポートが含まれ、ノーコードでの導入やAPIキー設定、カスタムドメイン(CNAME)を用いた公開が可能です。READMEにはライブサイト(https://mamar.ai)へのリンクと、TavilyやElevenLabs等の外部サービス連携を示す手順が記載されています(約300字)。
manifold:AIモデルのデプロイと管理を簡単にするオープンソースツールキット
2025/6/30
manifoldは、Dockerのようにシンプルかつ信頼性高く、あらゆるAIモデルのデプロイ、管理、セキュリティを実現するオープンソースのツールキットです。Pythonで実装されており、AIモデルの運用を効率化し、開発者の負担を大幅に軽減します。モデルの導入から運用までの複雑な工程を簡素化し、クラウド環境やオンプレミスでの活用を容易にします。
MAPO: 混合アドバンテージ方策最適化(MAPO)
2025/9/24
本リポジトリは「MAPO: MIXED ADVANTAGE POLICY OPTIMIZATION」の実装を提供します。著者らによる arXiv 論文(2509.18849)に基づき、複数のアドバンテージ推定を混合して方策勾配の分散とバイアスを制御し、学習の安定性とサンプル効率を改善することを目的とした手法を扱います。小規模ながら論文のコア部分を再現するためのコードと補助ファイルを含み、研究目的の検証や拡張に利用できます。(約300字)
MAPS — 多段階AI支援フォトニック設計インフラ
2025/10/19
MAPS はフォトニックデバイスの逆設計と高精度シミュレーションを目的とした、マルチフィデリティ(多段階精度)に対応するAI強化フレームワークです。高速な低精度シミュレータと精密な高精度シミュレータを組み合わせ、サロゲートモデルや能動学習を使ってデータ効率良く最終設計を得ることを目指します。研究用の実装、データ生成スクリプト、可視化資産が含まれ、フォトニクス分野の逆設計ワークフローを再現可能にします。(約300字)
MarketPulse:金融ニュースAI分析通知サービス
2025/6/14
MarketPulseは、最新の金融ニュースをAIで分析し、投資判断を支援する通知サービスです。Pythonで開発されており、ニュースの感情分析や重要指標の抽出を自動化。リアルタイムでマーケットの動向を把握したいトレーダーや投資家に最適なツールです。
MARSCalib:最先端球面ターゲットベースキャリブレーション手法
2025/6/16
MARSCalibは、IROS 2025で採択された最先端の球面ターゲットベースのカメラキャリブレーション手法を実装したC++リポジトリです。高精度なキャリブレーションを目的とし、複雑な環境下でも堅牢に動作する点が特徴です。最新の研究成果を活用することで、精密な3D計測やロボティクスにおけるセンサーキャリブレーションの信頼性を飛躍的に向上させます。
MatesX — 超軽量マルチプラットフォーム数字人対話エンジン
2025/9/19
MatesXは「記憶・表情・動作」を組み合わせた超軽量なデジタル人(数字人)対話エンジンです。高並列・低遅延を目標に設計され、VAD/ASR/TTSなどの音声処理とメモリエンジン、感情解析、表情・アクション駆動を統合。Windows/macOSデスクトップ、iOS/Androidアプリ、微信/支付宝小程序など多端に対応し、個人ユーザーのAIパートナー作成や大規模C端向けサービスに向く軽量アーキテクチャを志向します。(約300字)
MBTIコーディングエージェント:性格タイプ別AIプログラミング支援ツール
2025/7/30
Myers-Briggs性格タイプ指標(MBTI)をベースに設計された16種類のAIコーディングエージェントを収録したリポジトリです。それぞれのエージェントは異なるコミュニケーションスタイルや問題解決手法、技術的専門性を持ち、性格に応じた個別のアプローチでソフトウェア開発課題に対応します。Claude Codeとの互換性も特徴です。
MCA-LLaVA:大規模視覚言語モデルの幻覚を抑制するマンハッタン因果注意機構
2025/8/8
MCA-LLaVAは、大規模視覚言語モデル(Vision-Language Models, VLMs)における幻覚(hallucination)問題を軽減するための新しい注意機構「マンハッタン因果注意(Manhattan Causal Attention)」を提案するリポジトリです。視覚情報とテキスト情報の融合における情報流れを最適化し、より正確かつ信頼性の高いマルチモーダル生成を実現します。ACM MM25にて発表された研究に基づき、Pythonで実装されたコードと関連ドキュメントが含まれています。
メモリ整合性に基づく分割統治学習による一般化カテゴリ発見
2025/8/24
「Memory Consistency Guided Divide-and-Conquer Learning for Generalized Category Discovery(MCDL)」は、未知のカテゴリを含むデータセットに対して効果的にカテゴリを発見し分類するための機械学習手法を実装したPythonリポジトリです。メモリ整合性の原理を活用し、分割統治戦略によりモデルの性能と汎化能力を向上させています。研究論文に基づき、一般化カテゴリ発見の課題に対して新しいアプローチを提供し、実験用コードやモデル実装を含みます。
MCPスターター:Puch AI向けモデルコンテキストプロトコル実装テンプレート
2025/8/8
MCPスターターは、Puch AIと連携するモデルコンテキストプロトコル(MCP)サーバーの構築を支援するPython製のスターターテンプレートです。ジョブ検索や画像処理のツールがあらかじめ実装されており、AIアシスタントが外部リソースを安全に活用できる環境を提供。MCPを通じてAIの機能拡張を容易にし、開発者の迅速なサービス構築を実現します。
mcporter — Model Context Protocol 用 TypeScript ランタイム兼 CLI ジェネレータ
2025/11/5
mcporter は Model Context Protocol(MCP)を TypeScript から簡潔に呼び出すためのランタイムと CLI ジェネレータです。ゼロコンフィグで npx からコマンドを実行でき、長時間稼働するエージェントとコマンドラインオペレータの両方に向けた使い勝手を提供します。接続プールやリトライ処理、型付きのインターフェースを備え、CLI 化やライブラリとしての組み込みを容易にするツール群を含みます(約300字)。
MedGPT-OSS:生物医療向け汎用ビジョン・ランゲージモデルの構築
2025/8/14
MedGPT-OSSは、生物医療分野に特化した汎用ビジョン・ランゲージモデルのトレーニングを目的としたオープンソースプロジェクトです。医用画像解析と自然言語処理を統合し、視覚的指示チューニングを通じて高精度な医療AIを実現。医療現場での診断支援や研究開発への応用を目指しています。
医療チャットボットのQA応答分析と精度定量化
2025/7/30
本リポジトリは、約4,000件の大規模言語モデル(LLM)を活用した医療チャットボットの質問応答記録を詳細に分析し、応答品質の向上方法を探る研究プロジェクトです。ChatGPT、Claude、LLaMA2、Clovaなど複数のLLMモデルの性能比較を通じて、利用者層別の適合性評価や質問タイプ別の誤答パターン分析を行い、医療現場での実用的なインサイトと改善策を提示しています。医療分野におけるAIチャットボットの信頼性向上に貢献する重要なリポジトリです。
MeetSpotX - インテリジェントな集合場所推薦システム
2025/8/8
MeetSpotXは、ユーザーの位置情報や好みに基づいて最適な集合場所を推薦するインテリジェントなシステムです。PythonとFastAPIを用いたバックエンドにより、高速かつ柔軟なAPIを提供し、HTMLベースのフロントエンドで使いやすいUIを実現しています。MITライセンスのオープンソースプロジェクトであり、カスタマイズや拡張も容易です。
Memorizer-v1:ベクトル検索対応エージェントメモリサーバー
2025/7/15
Memorizer-v1は、.NETベースで開発されたAIエージェント向けのメモリ管理サービスです。PostgreSQLのpgvector拡張を活用し、ベクトル埋め込みによる効率的な類似度検索を実現。構造化されたメモリの保存・取得・セマンティック検索が可能で、AIエージェントの知識管理や対話履歴の活用に適しています。Dockerイメージも提供され、手軽に環境構築できる点も魅力です。
MentorIA:学術向け学習支援AIプラットフォーム
2025/9/16
MentorIAは、工学系の学術課題として開発された「学習支援プラットフォーム」です。Angularを用いたフロントエンドとQuarkus+Java 21を採用したバックエンドで構成され、個々の受験生向けにAIを使った学習支援を目指します。プロジェクトは学内の統合プロジェクトとして設計されており、MavenラッパーやDocker設定の痕跡を持つリポジトリ構成から、モダンなクラウド/コンテナ環境での運用も想定されています(約300字)。
MetaAurora:スケーラブルなマイクロサービスUIアーキテクチャのためのクラウドネイティブAIスタイリング基盤
2025/8/2
MetaAuroraは、リアルタイムデータ処理を実現するスケーラブルなマイクロサービスベースのユーザーインターフェースアーキテクチャ向けに設計された、クラウドネイティブでAI駆動のスタイリングインフラストラクチャです。Pythonで実装されており、最新のアーキテクチャパターンと技術を活用してUIの動的スタイル適用を効率化し、拡張性とリアルタイム性を両立しています。
metakeyai:TypeScriptベースのAI関連ユーティリティライブラリ
2025/6/21
metakeyaiは、TypeScriptで開発されたAI関連のユーティリティライブラリです。リポジトリ自体の詳細な説明はありませんが、コード構造からは、AIや機械学習関連のプロジェクトで利用可能な補助的な機能群を提供することが推察されます。小規模ながらも、TypeScriptを活用した堅牢な設計が特徴的です。今後の発展が期待される注目のリポジトリです。
MetalTensorOpsのMetal 4による高速テンソル演算ライブラリ
2025/7/24
MetalTensorOpsはAppleのMetal 4の最新コンピュートAPIを活用し、Metal Performance Primitives(MPP)とテンソル演算に焦点を当てたSwiftベースのライブラリです。低オーバーヘッドなコマンドバッファ再利用や引数テーブル、統合されたML/コンピュートエンコーダなどの新機能を体験でき、Pythonで学習したニューラルインプリシットモデルをSwiftとMetalでオンデバイス実行するための実験的な実装例を提供しています。
MGCA-Net:オープンボキャブラリー時系列アクションローカリゼーションのための多粒度カテゴリ認識ネットワーク
2025/8/13
MGCA-Netは、動画内の時系列アクションをオープンボキャブラリー(未知のカテゴリを含む)で検出・局所化するための多粒度カテゴリ認識ネットワークです。既存のラベルに限定されず、幅広いカテゴリのアクション検出を可能にし、動画解析や監視、スポーツ解析など多様な応用が期待されます。本リポジトリはMGCA-Netの公式実装コードを提供し、データ前処理からモデル学習、評価まで包括的にサポートします。
MiMo-Audio:オーディオ言語モデルのFew-Shot学習
2025/9/19
XiaomiMiMo が公開する MiMo-Audio は,「Audio Language Models are Few-Shot Learners」を掲げるリポジトリで、オーディオと言語を結びつけるモデル設計や評価に関する技術資料とサンプル資産を含みます。音声特徴抽出からモデル評価までのワークフロー、技術報告書(PDF)やアセット類が同梱され、音声ベースの少量学習(few-shot)研究の出発点として利用可能です(リポジトリ自体は軽量で実装・説明資料中心)。
min-Pi-Flow:Pi-Flowの最小実装
2025/10/19
min-Pi-Flowは、論文「Pi-Flow」の概念を最小限のコード量で再現することを目指したリポジトリです。フローマッチングを用いた蒸留(flow matching distillation)により、少ステップでの生成を可能にする手法を実装しており、DiT(Diffusion Transformer)コードベースを組み合わせて結果を再現します。公式実装ではなく、教育目的や研究再現のための軽量実装です(警告あり)。
Mini-Agent — ミニマルで実用的なエージェントデモ
2025/10/31
Mini-Agentは「最小限でありながらプロダクション志向」を掲げた単一エージェントのデモプロジェクトです。エージェントのコア実行パイプライン(入力→プランニング→実行→ツール連携)を分かりやすく実装し、ログ・エラーハンドリング・構成管理など実運用を意識した機能を備えています。軽量で学習・実験用途に適しつつ、拡張ポイント(カスタムツール、LLMバックエンド差替え、観測性)を想定した設計になっています。導入手順はuvやpipで簡単に行え、サンプルとドキュメントも揃うため、エージェント開発の出発点として最適です(300字程度)。
Mini-Fraud-Detection-App:シンプルな不正検知ダッシュボード
2025/8/7
Python、Pandas、Streamlitを用いて構築されたシンプルなルールベースの不正検知ツールです。取引データの行動パターンを分析し、不正の可能性がある取引やリスクの高いユーザーを特定します。ミニプロジェクトとして面接やGitHubポートフォリオに適した、クリーンでプロフェッショナルな構成が特徴です。
MiniModel — 軽量な自己注意型GPT風モデル実験
2025/9/24
本リポジトリ「MiniModel」は、自己注意(self-attention)を用いた小規模なGPTライクモデルの実験的実装です。高速化用カーネル(liger_kernel、torchao)やPyArrowを用いたデータ処理、独自最適化器のスケルトン、トークン単位での学習スクリプトを含み、研究・学習目的で高速な自己注意実装とトレーニングの流れを試せる構成になっています(依存にCUDA対応環境と新しいPyTorchが必要)。
MiroRL:深層研究エージェントのためのMCP優先強化学習フレームワーク
2025/8/8
MiroRLは、MCP(Markov Chain Process)を基盤とした強化学習フレームワークで、深層研究エージェント開発に特化しています。Pythonで実装されており、研究者が効率的に強化学習アルゴリズムを設計・実験できる環境を提供。シンプルな構成と拡張性を両立させ、最新の強化学習手法を迅速に試せる点が特徴です。
宣教師と食人族問題(Missionaries and Cannibals)
2025/9/19
Javaで実装された「宣教師と食人族(Missionaries and Cannibals)」問題の解法リポジトリ。VS Code向けのワークスペース構成を備え、srcにソース、binにコンパイル出力が作られる構成です。探索アルゴリズムを用いて安全な移送手順を導出する教育用・実験用の小規模プロジェクトです。(約300字)
ML-Based-Financial-Risk:機械学習による個人金融リスク分析とカスタマイズ信用評価システム
2025/7/30
本リポジトリは、個人の信用スコア、財務状況、人口統計データを基に機械学習を活用して金融リスクを予測し、個別に最適化された信用評価システムを構築するプロジェクトです。既存の信用評価モデルの課題を克服し、顧客と金融機関双方に実践的な洞察を提供することを目的としています。さらに、Streamlitを用いたウェブアプリケーションも実装されており、ユーザーが手軽にリスク予測を体験可能です。
Ml-builder — 自動化されたモジュール式AutoMLパイプライン
2025/10/13
Ml-builderは、データ前処理からモデル学習、ハイパーパラメータ調整、評価、最適モデルの選定、レポート生成、保存までを自動化するモジュール式のAutoMLパイプラインです。設定ファイルとバリデーションを用いて再現性と拡張性を確保し、Scikit‑learnやTensorFlow等の複数フレームワークに対応することを目指しています。開発・実運用の橋渡しを意識した設計で、迅速なプロトタイピングとスケール可能なワークフロー構築を支援します。(約300字)
ML_Time_Series — 時系列予測(Holt-Winters)サンプル
2025/10/25
本リポジトリは、Jupyter Notebook形式でホルト=ウィンター法(Holt-Winters/Exponential Smoothing)を用いた時系列予測のサンプルを収めています。ホテル関連の時系列データを想定したノートブックで、季節性・トレンドの扱い、モデル適合、予測の可視化、誤差評価など、実務で役立つ一連の手順を実践的に示します(コードセル、図、コメント付き)。初学者から実務者まで学習・検証用途に適した構成です(約300字)。
MLリポジトリの概要と技術解説
2025/8/23
「ML」リポジトリは、Pythonを用いた機械学習関連のコードを収めたシンプルなプロジェクトです。スター数17を獲得し、機械学習の基礎的なモデルや処理を実装したファイル2つで構成されています。少数のコミットながら、初心者が学習や実験を始めるための基盤として適しています。
MLA-Trust:マルチモーダルLLMエージェントの信頼性評価ツールボックス
2025/6/19
MLA-Trustは、マルチモーダル大規模言語モデル(LLM)エージェントの信頼性を「真実性」「制御性」「安全性」「プライバシー」という四つの重要な側面から包括的に評価するためのPythonベースのツールボックスです。34の対話型タスクを通じて、多様な実践的シナリオでの性能をベンチマークし、研究者や開発者が信頼性向上に役立てられます。
MMaDA:オープンソースのマルチモーダル大規模拡散言語モデル
2025/5/23
MMaDAは、マルチモーダル情報を統合して処理可能な大規模拡散言語モデルをオープンソースで提供するプロジェクトです。画像やテキストなど複数のモーダリティを活用し、高度な生成性能と柔軟な応用力を実現。AI研究や応用開発の加速に寄与することを目指しています。
MME-CoF:動画Chain-of-Frames評価ベンチマーク
2025/10/31
研究「Are Video Models Ready as Zero-Shot Reasoners?」の公式リポジトリで、動画モデルのゼロショット推論能力を評価するためのベンチマーク「MME-CoF(Video Chain-of-Frames)」を中心に扱います。論文・ホームページへのリンクや、今後公開予定のベンチマークデータセットと評価コードの配布が示されており、時系列のフレーム間推論やマルチモーダル理解の検証を目的とした研究インフラを提供します(ベンチマークは近日公開予定)。
MMPL:高品質かつ並列化可能な自己回帰型長尺動画生成のためのマクロ・フロム・マイクロプランニング
2025/8/8
MMPLは、自己回帰型の長尺動画生成において、高品質かつ効率的な並列処理を実現するための「マクロからマイクロへの計画(Macro-from-Micro Planning)」手法を提案するリポジトリです。複雑な長尺動画生成の課題を解決し、高速かつ高品質な動画生成を目指す最新のAI技術を実装しており、今後の動画生成モデルの発展に貢献します。
MODA:マルチモーダル認知・感情理解のためのモジュラー二重注意機構
2025/7/10
MODAは、マルチモーダル知覚、認知、感情理解を目的とした新しい注意機構「MOdular Duplex Attention」を提案するリポジトリです。異種データ(画像、テキスト、音声など)の特徴を効果的に統合し、高度なマルチモーダル推論を実現。ICML 2025のスポットライト論文として発表され、感情認識や認知タスクへの応用を目指しています。
GGUFモデル メモリ計算機 (model-memory-calculator)
2025/9/18
ブラウザ上で動作する単一ファイルの静的ウェブアプリ。GGUF形式のモデルファイルからメタデータを読み取り、選択したコンテキスト長とKVキャッシュ/量子化設定に基づいて必要なRAM/VRAMを推定します。HTTP Rangeに対応したリモートURLやローカルの.ggufファイル(ドラッグ&ドロップ)に対応し、シャーディングされたモデルも検出して合計サイズを算出。サーバ不要でクライアント側のみで完結するのが特徴です。(約300字)
MoFE-Time:時系列予測のための周波数領域専門家混合モデル
2025/7/10
MoFE-Timeは、大規模言語モデル(LLM)を基盤としつつ、時系列予測の精度向上を目指した最新の機械学習モデルです。周波数領域の専門家(Experts)を混合させることで、異なる周波数成分に特化した予測を実現し、従来手法を上回る性能を発揮します。Pythonで実装されており、モデル構造の柔軟性と高精度な予測能力が特徴です。
分子溶解度予測モデルの構築と解析
2025/9/7
本リポジトリは、分子の溶解度(LogS)を予測するための機械学習モデルを構築したプロジェクトです。分子の特徴量としてMolLogP、分子量(MolWt)、回転可能結合数(NumRotatableBonds)、芳香族比率(AromaticProportion)を用い、線形回帰およびランダムフォレストを適用して予測精度を比較しています。PythonのPandas、NumPy、Matplotlib、Scikit-Learnなどの主要なデータサイエンスライブラリを活用し、非線形性の捉え方に優れたランダムフォレストの有効性を示しています。
MonkeyCode:AI搭載の次世代プログラミング支援ツール
2025/6/25
MonkeyCodeは、Go言語で開発されたオープンソースのAIプログラミングアシスタントです。スマートなコード補完、エラー検出、コードリファクタリング、ドキュメント生成など、多彩な機能を備え、開発者の生産性とコード品質の向上を目指します。初心者からプロまで幅広い層に対応し、開発ワークフローに革新をもたらす強力なツールです。
MoodAI - 感情認識チャットボットのReact実装
2025/7/23
MoodAIはReactとViteをベースに構築された感情および感情分析チャットボットです。Hugging Faceの「emotion-english-distilroberta-base」モデルを用いてユーザーの入力テキストから喜びや悲しみ、怒りなど複数の感情をリアルタイムで検出し、絵文字で感情を表現します。さらに、チャット履歴の管理や感情分析結果を棒グラフや折れ線グラフで可視化する機能を備え、PCだけでなくモバイル環境にも完全対応しています。
MoodBench:大規模言語モデルの情感サポート能力を評価するベンチマーク
2025/8/26
MoodBenchは、趣丸科技と北京大学ソフトウェア工学国家工程研究センターが共同開発した、大規模言語モデル(LLM)の情感(感情的)サポート能力を科学的かつ体系的に評価するためのベンチマークです。オープンソースのPQAEF評価フレームワークを基盤とし、「四次元」評価理念に基づいて設計されており、多様な感情表現や応答の質を定量的に測定できます。Linux、Windows、Macの主要OSに対応し、Pythonで実装されています。
MOSAIC:対応認識アライメントと分離による複数被写体のパーソナライズ生成
2025/8/19
MOSAICは、対応認識アライメントと潜在空間の分離技術を組み合わせることで、複数の被写体を含む画像のパーソナライズ生成を実現する先進的なAIモデルです。被写体ごとの特徴を正確に捉えつつ、個別に制御可能な生成を可能にし、シーン内の複数人物やオブジェクトの高品質な合成・編集を支援します。これにより、映像制作やゲーム、AR/VRなど多彩な応用が期待されます。
moyu_yolov8 — 摸鱼用 YOLO 後方ミラー
2025/9/18
デスクで「摸鱼(サボり)」しているときに後ろに人がいるかをリアルタイムで教えてくれる、YOLOベースの軽量なカメラ監視ツール。Python単一ファイルで動く簡易版を提供し、CPUモードで手軽に動作確認できるのが特徴。WSLやWindows環境向けの改善や、デスクトップ上に小さな浮動ウィンドウで検出結果を表示する機能も備える。初心者でも試しやすい一括インストール手順と、パフォーマンス向上のための拡張ポイントを示す簡潔な実装例リポジトリです。
MT4R — ロボティクスのための数学ツールボックス
2025/10/15
ロボット工学に必要な数学的導出、アルゴリズム、およびPython実装をまとめたリファレンスブック兼ツールボックス。七つの主要領域(数学物理基礎、ロボティクス基礎、制御理論、ロボット制御、深層学習、強化学習、視覚ナビゲーション)を扱い、理論の導出から実装コード・サンプルまでを提供することで、学習や研究、プロトタイプ開発の学習コストを下げることを目指している(英語/中文のPDF版を収録)。
multi-agent-researcher:InstructorとExa.aiを活用したマルチエージェント研究システム
2025/6/15
本リポジトリ「multi-agent-researcher」は、大規模言語モデル(LLM)の出力を構造化するためのInstructorフレームワークと、高速なニューラル検索を可能にするExa.aiを組み合わせたマルチエージェント研究システムを提供します。複数のエージェントが協調しながら情報探索・解析を行うことで、研究や知識探索の効率化を実現。Pythonで実装されており、AI研究や情報検索分野の応用に適しています。
TradeRiser:マルチチェーン対応の最先端トレーディングボット
2025/7/27
TradeRiserは、EthereumやBinance Smart Chain、Polygonなど主要10のブロックチェーンネットワークに対応した高度でカスタマイズ可能なトレーディングボットです。多彩な設定オプションと最新アルゴリズムを備え、ユーザーの取引戦略に柔軟に対応。複数チェーンをまたがる取引を自動化し、効率的かつ安全に資産運用を行えます。
Multimodal-Outpost-Notebooks:最先端マルチモーダルVision-Languageモデル実験用ノートブック集
2025/7/29
Multimodal-Outpost-Notebooksは、最先端のマルチモーダルVision-Languageモデル(VLM)の実装と実験を行うための、厳選されたJupyter/COLABノートブックのコレクションです。OCR、画像キャプション生成、ビデオ理解など多様なタスクに対応し、画像とテキストを組み合わせたPDFやDOCXの生成も可能。研究や開発の出発点として活用できる実践的なツール群を提供します。
MuMuAINovel — AI小説作成アシスタント
2025/10/30
MuMuAINovel は、AI を活用したインテリジェントな小説創作支援ツールです。Python(FastAPI)で構築されたバックエンドと、React + TypeScript を用いたフロントエンドを備え、Docker によるコンテナ化も想定された構成になっています。ユーザーのプロンプトからプロット生成、登場人物設定、文章整形など創作ワークフローを支援し、ローカル環境やクラウドでのデプロイが可能です。GPL v3 ライセンスの下で公開され、拡張性を重視した設計が特徴です。(約300字)
MyMap-2API — MyMap.ai 拡張コネクタ
2025/10/19
MyMap-2API は MyMap.ai に対する軽量かつ高機能なプロキシ/拡張API サーバーです。原生APIとのやり取りをCookie不要で行い、高度なリクエスト偽装(反検知)やメモリ内セッションでのコンテキスト保持をサポートします。ストリーミング出力やファイル/Base64 アップロード、マインドマップやフローチャートの動的レンダリングに対応し、Docker と Nginx を用いたワンコマンドデプロイが可能。FastAPI を中核に据えた設計で、自己ホスト環境に適した柔軟な接続器を提供します。(約300字)
AI駆動型コールドメールシステム「n8n-Cold_Email_System」
2025/7/27
「n8n-Cold_Email_System」は、AIと自動化ツールを活用したエンドツーエンドのコールドアウトリーチシステムです。サービス提供者が潜在顧客に対してパーソナライズされたコールドメールを自動生成・送信することを目的とし、リード獲得の効率化を実現します。完全統合かつスケーラブルな設計で、リアルエステートエージェントなど多様な業種での活用が想定されています。
n8n-free-templates:AI時代のための200種以上のn8nワークフローテンプレート集
2025/5/22
「n8n-free-templates」は、クラシックな自動化技術と最新のAIスタック(ベクターデータベース、埋め込み、巨大言語モデル)を融合させた、200以上のプラグアンドプレイ型n8nワークフローを厳選してまとめたリポジトリです。JSON形式のテンプレートをインポートし、認証情報を追加して有効化するだけで即利用可能。デモやプロトタイプ作成、さらには本番環境への導入まで幅広く対応しています。
n8n_nl2sql — n8nで実装する自然言語→SQLワークフロー
2025/9/22
n8n_nl2sqlは、n8nワークフローを使って自然言語の問い合わせを実行可能なSQLに変換し、データベース検索と可視化を組み合わせたスマートなデータアシスタントを実現するリポジトリです。対話記憶やエラー自動修正(最大3回の再試行)を備え、Webシステムへ組み込めるUI(agent.html)やn8nワークフローのエクスポート(nl2sql.json)を提供します。開発者はワークフローをインポートして、DB接続情報やプロンプトを調整するだけでNL2SQL機能を自分の業務システムに組み込めます。(約300字)
n8nによるバイラルショートクリップ自動生成&マルチSNS投稿システム
2025/9/1
本リポジトリは、AIを活用して長尺動画を自動的にバイラル性の高いショートクリップへ変換し、複数のソーシャルメディアプラットフォームへ自動投稿するためのn8nワークフローアーキテクチャを提供します。PythonやFFmpegと連携し、効率的かつ高度な動画編集とSNS配信を実現。動画マーケティングの自動化に最適なソリューションです。
Nano-Bananary|香蕉超市|多彩な生成プレイを簡単操作で実現するAIツール
2025/9/5
Nano-Bananaryは、複雑なプロンプト不要で多様な生成プレイが可能なAIベースのツールです。局所的な塗り選択や連続編集機能を備え、ユーザーは直感的な操作で多彩なコンテンツ生成を楽しめます。TypeScriptで実装され、軽量かつ拡張性の高い設計が特徴です。AI生成のクリエイティビティを手軽に体験したい方に最適なリポジトリです。
Nano3D — マスク不要で効率的なトレーニング不要3D編集
2025/10/13
本リポジトリは「Nano3D: A Training-Free Approach for Efficient 3D Editing Without Masks」の公式実装リポジトリ(準備中)です。論文・プロジェクトページ・データセット・Gradioデモへのリンクを備え、マスクを用いずに既存の2D事前学習モデルを活用して3Dシーンやオブジェクトを効率的に編集する手法を扱います。著者にJunliang Yeらが名を連ね、トレーニング不要で高品質な視点間一貫性ある編集を目指す点が特徴です。本リポジトリは現時点で最小限のファイル構成のため、実装の完全公開は順次行われる予定です。
nanochat — シンプルでハックしやすいフルスタックLLM実装
2025/10/13
nanochatは、依存を最小化した単一コードベースで「ChatGPTライク」な大規模言語モデルのトレーニングから推論、Web UIまでを一貫して実行できるフルスタック実装です。8x H100ノード上で動作することを想定したスクリプト群(speedrun.sh等)を備え、トークナイゼーション、事前学習、ファインチューニング、評価、推論、簡易サーバ提供までを含むため、研究実験やプロトタイプ作成に適したリポジトリです。(約300字)
NBAハイライト動画ジェネレーター
2025/8/19
本リポジトリは、指定したNBA選手の試合ハイライト動画を自動生成するツールを提供します。選手名や期間、チーム、ハイライトの種類を指定するだけで、関連するプレイ動画を検索・抽出し、編集済みのハイライト動画を作成可能です。Jupyter Notebook形式で実装されており、簡単にカスタマイズや実験が行えます。NBA公式のデータや映像URLを活用しており、バスケットボールファンやスポーツ分析に有用なプロジェクトです。
NAUTILUS:水中シーン理解のための大規模マルチモーダルモデル
2025/11/3
本リポジトリは、NeurIPS 2025で提案された「NAUTILUS: A Large Multimodal Model for Underwater Scene Understanding」に対応する実装と補助資料を収録しています。水中画像特有の色偏移・濁り・光害などのドメインギャップに対処するために、大規模な視覚言語モデル(LLaVAやQwen-VL系のファインチューニング手法を含む)を用いて、水中環境向けの表現学習・アライメント・下流タスク(検出、セグメンテーション、VQA、キャプション)を統合的に扱うことを目的としています。コード、図、ログ、微調整用スクリプトが含まれ、再現と拡張がしやすい構成になっています。
ncnn_mobileclip:軽量モバイル向けCLIPモデルのNCNNエクスポートと推論
2025/8/18
ncnn_mobileclipは、人気のCLIPモデルを軽量化し、モバイルデバイス上で高速かつ効率的に推論可能な形式に変換するためのツールです。PyTorchでトレーニングされたMobileClipモデルの重みをNCNNフォーマットにエクスポートし、スマホ等のリソース制約がある環境での利用を可能にします。モデルの多様なバリエーションに対応し、簡単に推論を試せる点が特徴です。
ncnnによるYOLOE実装
2025/8/19
本リポジトリ「ncnn_yoloe」は、軽量かつ高速な推論が可能なncnnフレームワーク上でYOLOEという物体検出モデルを動作させるための実装を提供します。モデルの変換や融合技術を用いた最適化、CLIPを活用した特徴生成機能も備えており、モバイルや組み込み環境でのリアルタイム物体検出に適しています。
Neosgenesis - メタ認知型インテリジェント意思決定ワークベンチ
2025/8/4
Neosgenesisは、メタ認知(自己認識)に基づく高度な意思決定を支援するAIワークベンチです。Pythonで実装され、多腕バンディット問題をはじめとする強化学習アルゴリズムを活用し、複雑な環境下での最適行動選択を支援します。研究開発や実用的アプリケーションにおけるAIの意思決定プロセス改善に役立つツールキットです。
NeuroPump:水中画像の幾何学的および色彩補正を同時に実現する技術
2025/7/7
NeuroPumpは、2025年に開催されるACM MM'25で発表される研究成果をベースにした水中画像の補正技術を提供するリポジトリです。本技術は水中画像に特有の幾何学的歪みと色彩変化を同時に補正し、高品質な画像復元を実現します。現在はコードとデータセットの公開を予定しており、水中画像処理やコンピュータビジョン分野の研究者・開発者にとって注目の技術です。
NeuSymEA — Neuro-Symbolic Entity Alignment の実装(NeurIPS25)
2025/9/19
NeuSymEA-NeurIPS25 は、NeurIPS25 論文「NeuSymEA: Neuro-symbolic Entity Alignment via Variational Inference」の公式実装です。ニューラル手法(例: LightEA 等の既存 Entity Alignment モデル)をベースに、シンボリックな制約・ルールを変分推論の枠組みで組み合わせることで、エンティティ整合(Entity Alignment)の精度とロバスト性を高めることを目的としています。サンプル実行スクリプトと最小限のデータ/設定が含まれ、再現実験や拡張研究の出発点になります。(約300字)
NextStep-1:連続トークンによる自己回帰型画像生成の最前線
2025/8/14
NextStep-1は、連続値トークンを用いた大規模自己回帰型画像生成モデルの研究開発プロジェクトです。従来の離散トークンを用いた生成モデルの限界を超え、より細やかで高品質な画像生成を実現。効率的なトークン表現とモデル設計により、高解像度かつ多様な画像生成を目指しています。Pythonで実装されており、モデルの重みはHugging Faceで公開されています。
NFTIAI:NFTとAIを融合した革新的プラットフォーム
2025/6/17
NFTIAIは、NFT(非代替性トークン)とAI(人工知能)技術を組み合わせた革新的なTypeScriptベースのプロジェクトです。最新のAI技術を活用してNFTの生成や管理、さらには関連データの解析を効率化し、NFT市場の可能性を拡大します。開発者やクリエイターがAIの力を活用して独自のNFTコンテンツを作成・運用できる環境を目指しています。
NinjaTech - 革新的なAIソリューション
2025/8/30
NinjaTechは、革新的なAIソリューションを提供するシンプルかつ効果的なHTMLベースのプロジェクトです。軽量な構成でAI技術の紹介やデモを行うための基盤を提供し、ユーザーがAIの可能性を直感的に理解できるよう設計されています。初心者から中級者まで幅広い層に対応するため、わかりやすいコード構造と視覚的なコンテンツが特徴です。
NipponCode - 日本語最適化型次世代AIコーディングアシスタント
2025/8/20
NipponCodeは、日本語に最適化された次世代のAIコーディングアシスタントです。ClaudeCodeに似た対話型インターフェースを採用し、GPTやClaude、さらには自作のオープンソースモデル(gpt-ossなど)まで幅広く対応。日本語での自然な対話とコード生成を実現し、日本の開発者がより効率的にプログラミングを行える環境を提供します。
NIRVANA — LLaMA向け剪定と最適化ツールキット
2025/9/16
本リポジトリ「NIRVANA」は、LLaMA系モデルなどの大規模言語モデルに対する剪定(Pruning)や最適化パイプラインを想定した実験的なツール群を含むPythonプロジェクトです。Conda環境の自動構築・PyTorch(CUDA 12.1)インストールを行うセットアップスクリプトを備え、編集可能な依存関係インストールで開発や再現実験を容易にします。リポジトリにはLlama関連の処理ディレクトリや実験用画像、READMEが含まれ、軽量ながらモデル圧縮ワークフローの入口を提供します(要:Python 3.9.19, PyTorch 2.2.2+cu121)。
NLP2SQL-4.1.0:自然言語からSQLクエリを自動生成するインテリジェント検索システム
2025/8/21
NLP2SQL-4.1.0は、自然言語で記述された質問を自動的にSQLクエリに変換し、データベースから結果を取得するオープンソースのインテリジェント検索システムです。Gemini APIを活用した自然言語処理により、専門知識がなくても簡単にデータ検索を可能にします。ローカルモデルのデプロイや知識ベースの活用、カスタムサービスにも対応し、幅広いビジネスシーンで活用できます。
nofx-better-prompt — nofx向けの改善されたプロンプト集
2025/10/31
nofxプロジェクト向けに作られた「プロンプト(prompt)」の分離・最適化パッケージです。nof1.ai由来の改良プロンプトを取り込み、system promptやテンプレート類をコードから切り離して配布。既存のnofxへ上書きするだけで簡単に導入・カスタマイズでき、Docker構成や決定ロジック用のディレクトリを含む軽量リポジトリです。(約300字)
NOFX — AI駆動のBinance Futures自動トレーディング競技システム
2025/10/28
NOFXは、AIエージェント同士がBinance Futures上で自動トレードを行い競い合うためのプラットフォームを目指すオープンソースプロジェクトです。Goで構築されたバックエンドとReact+TypeScriptのフロントエンドを組み合わせ、戦略の実行・評価・ランキング表示を行う競技基盤やAPI、競技管理機能を備える想定の設計が特徴です。現在は初期段階でドキュメント多言語化(英語/ロシア語/ウクライナ語/中国語)などが整えられています。
NoteMR:ノートガイド型多模態大規模言語モデルによる視覚質問応答の強化
2025/6/16
NoteMRは、CVPR 2025で発表された「Notes-guided MLLM Reasoning: Enhancing MLLM with Knowledge and Visual Notes for Visual Question Answering」のコード実装リポジトリです。本プロジェクトは、多模態大規模言語モデル(MLLM)に対して、知識ノートと視覚ノートを組み合わせて推論能力を高める手法を提案し、視覚質問応答(VQA)の精度向上を目指しています。Pythonで実装され、AI分野における先進的な研究を実用的に体験可能です。
NotebookLM Claude Code スキル
2025/10/19
Claude Code と Google NotebookLM を連携させるための「スキル」実装リポジトリです。ブラウザ自動化による NotebookLM のクエリ実行、ライブラリ管理、永続的な認証保持を備え、NotebookLM に保存したノートを直接参照して出典付き・ソースに基づく応答を生成します。Claude Code 側からノートを検索・抽出し、引用を伴う返答を作ることでハルシネーションを抑制する設計が特徴です。導入・実行手順やスキル定義(SKILL.md)も含まれます。
Notte - AIによる高速で信頼性の高いウェブエージェント構築フレームワーク
2025/7/24
Notteは、自然言語で指示を与えるだけでウェブ上の操作や自動化タスクを実行できるAI搭載ブラウザエージェントを構築するためのオープンソースフレームワークです。ヘッドレスブラウザ制御、セキュアな資格情報管理、構造化されたウェブ認識機能を組み合わせることで、LLM(大規模言語モデル)を活用した信頼性の高い自動化を実現します。高速かつコスト効率に優れ、スケール可能な設計が特徴です。
制限なしの高性能NSFW AIジェネレーター
2025/8/17
「nsfw-ai-generator-no-limit」は、制限やフィルターなしで高精度なNSFW(Not Safe For Work)AIアート画像を生成できるツール群を紹介するリポジトリです。多様なジェネレーターを検証しており、ユーザーが自由に創造性を発揮できる環境を提供しています。AIによるリアルなNSFW画像生成に関心がある開発者やクリエイターに有用な情報をまとめています。
NSFW AIビデオジェネレーター|無制限でAI生成する成人向け動画作成ツール
2025/8/17
本リポジトリは、制限なしで利用可能なNSFW(成人向け)AI動画ジェネレーターの情報をまとめたものです。複数のAIツールを比較・検証し、無制限かつ検閲なしで創作可能なサービスを厳選。AIによる動画生成の最先端を体験したいユーザーに向けて、使いやすさや機能面を評価しています。2025年最新の成人向けAI動画制作の動向を把握するのに最適なリポジトリです。
Omen - Laravel向けAIエージェントフレームワーク
2025/8/4
OmenはLaravelアプリケーション向けのAIエージェントフレームワークです。AnthropicのAPIを利用し、チャットベースのAIエージェントを簡単に構築・管理できるよう設計されています。インストールからエージェントの実行までシンプルなコマンドで完結し、開発者がAI機能をLaravelプロジェクトにシームレスに統合可能。設定やファイル生成も自動化されており、AI活用のハードルを大幅に下げるツールです。
Omni-Agent Hub:高度なマルチエージェントオーケストレーションシステム
2025/7/6
Omni-Agent Hubは、ReAct、MCP、Agentic RAGといった最先端技術を統合した高度なマルチエージェントオーケストレーションシステムです。Python製でFastAPIを用いたAPI設計、Dockerによるコンテナ管理、PostgreSQLやRedisを活用した堅牢なデータ管理を特徴とし、複数のAIエージェントを柔軟かつ効率的に連携・制御可能です。最新のAIアプリケーション開発や研究に最適な基盤を提供します。
omni-bot-sdk-oss:ゼロ侵入型WeChat 4.0 RPAフレームワーク
2025/7/12
omni-bot-sdk-ossは、視覚認識を基盤にしたカスタムYOLOモデルやOCR、データベース監視を活用し、WeChat 4.0のランタイム環境に影響を与えずに動作するRPAフレームワークです。動的プラグイン対応やOpenAIとの連携も可能で、全メッセージタイプの解析やテキスト・画像・ファイルメッセージの送信機能を備え、小プログラムや朋友圈への送信拡張にも対応しています。
Ond-ESGインテリジェンスプラットフォーム
2025/10/31
Ond-ESG-Intelligence-Platform は、ESG(環境・社会・ガバナンス)分野のデータ収集・解析・機械学習ワークフローを想定した AI & Web3 向けデータポータル/モジュールの参照実装です。Azure の Data Lake、Data Factory、Databricks、Azure ML と TensorFlow 等の技術スタックを活用し、ESGデータの蓄積・前処理・特徴量作成・モデル学習・デプロイまでを見通せる構成を提供します(サンプルコード・アセットを含む)。
OneOcc:単一パノラマカメラで実現する足歩行ロボット向け意味的占有予測
2025/11/6
OneOccは、単一の360°パノラマカメラだけを用いて、歩行ロボット/ヒューマノイド向けに「意味的占有(semantic occupancy)」を予測する公式実装です。歩行による身体の揺れ(gait-induced jitter)を考慮しつつ、360度連続性を保った表現で環境の占有状態とカテゴリ情報を推定。軽量かつ実機向けを意識した設計で、視覚のみの入力で高精度な占有マップを生成する点が特徴です。本実装は論文(arXiv:2511.03571)の再現を目的としており、研究・実験・実機検証に活用できます(簡潔に)。
onpolicydistillation(オンポリシー・ディスティレーション)
2025/10/30
onpolicydistillation は、Colab ノートブック形式で提供される実験的リポジトリです。Qwen3-0.6b(小型学生モデル)に対して、Qwen3-4b-Instruct-2507(大型教師モデル)を用いた on-policy distillation(OPD)を実演し、数学問題データセット GSM8K における性能改善を目指します。ノートブックは教師モデルによる応答生成、学生モデルの模倣学習、評価までのワークフローを含み、低コストでのモデル改善手法を試すためのハンズオン資料になっています。
OODAサブエージェント:軍事戦略に基づくAIエージェントフレームワーク
2025/7/25
OODAサブエージェントは、軍事戦略の意思決定ループ「Observe(観察)→ Orient(方向付け)→ Decide(決定)→ Act(行動)」に基づくAIエージェント群です。スタートアップがAIプロダクトを迅速に開発・展開できるよう設計されており、問題解決を体系的に行うためのフレームワークを提供します。Gitサブモジュールとして簡単に導入可能で、複雑な状況を明確に整理し、段階的に意思決定を進めることが可能です。
Open Agent Builder — ビジュアルAIエージェントビルダー
2025/10/16
Firecrawlが提供する「Open Agent Builder」は、ドラッグ&ドロップでAIエージェントのワークフローを設計・実行できるビジュアルツールです。Webスクレイピングやデータ抽出のパイプラインをノーコードで組み立て、リアルタイムに実行・デバッグできる点が特徴。TypeScriptベースで構築され、エージェント構成、実行ログ、外部コネクタの統合などを視覚的に扱えるため、データ収集から処理、テスト、デプロイまでの流れを迅速に試作できます(約300字)。
Open-Fiesta:マルチモデルAIチャットのオープンソースプレイグラウンド
2025/8/18
Open-Fiestaは、Next.jsのApp Routerを活用して構築されたオープンソースのマルチモデル対応AIチャットプレイグラウンドです。ユーザーは複数のAIモデルを統合し、対話形式で試すことができる環境を提供。TypeScriptで開発されており、拡張性や使いやすさを重視した設計が特徴です。AI技術の実験や学習、プロトタイプ開発に最適なツールとして注目されています。
Open Lovable - AIチャットで即座にReactアプリを構築するツール
2025/8/8
Open Lovableは、AIと対話しながらReactアプリケーションを瞬時に構築できるオープンソースプロジェクトです。TypeScriptで実装されており、使いやすいセットアップとAPI連携により、開発者がコーディングの負担を軽減しながら効率的にUI開発を進められます。GitHub上で活発に管理されており、リアルタイムでのAIチャットによるコード生成や修正が特徴です。
OpenAI API エージェント開発入門プロジェクト
2025/8/28
OpenAI APIを活用したエージェント開発の学習を目的とした教育用プロジェクトです。エージェントアプリの起動から環境設定、OpenAI API連携までをカバーしており、初心者が実践を通じてAPIの使い方やエージェント設計の基礎を理解できる構成になっています。リアルな開発例として参考になるリポジトリです。
Z.ai向けOpenAI互換APIプロキシ
2025/9/1
本リポジトリは、Z.aiのGLM-4.5モデルに標準的なOpenAI APIインターフェースでアクセス可能にするプロキシサービスを提供します。OpenAIのエンドポイントを模倣しつつ、チャット補完やモデル一覧取得などの機能を実装。流式レスポンスのSSE対応や匿名セッション機能、詳細なログ出力など開発者に便利な機能を備え、多様なAIサービス統合やモデル評価用途に最適です。
OpenAlpha_Evolve:自律型コーディングエージェントのためのPythonフレームワーク
2025/5/22
OpenAlpha_Evolveは、DeepMindのAlphaEvolveに触発された自律型コーディングエージェントの研究を基に開発されたオープンソースのPythonフレームワークです。ソフトウェア開発の自動化を目指し、AIが自己進化しながらコードを生成・改善していく仕組みを提供。研究者や開発者が高度な自律プログラミングエージェントを実装・評価するための強力なプラットフォームとして注目されています。
OpenBench - 言語モデル評価のためのオープンベンチマーク基盤
2025/7/31
OpenBenchは、プロバイダーに依存しないオープンソースの言語モデル評価基盤です。20以上の評価スイートに対応し、多様な大規模言語モデル(LLM)の性能を標準化かつ再現可能な形でベンチマークできます。Pythonで実装されており、MITライセンスの下で提供されています。開発者や研究者が容易に言語モデルの比較評価を行うための強力なツールキットを提供します。
OpenCLIPをサービス化するノートブック
2025/9/3
OpenCLIPを利用してテキストの埋め込みベクトルを生成する最小限のFastAPIサービスを提供するリポジトリです。Colabの無料GPUを活用し、任意のOpenCLIP対応モデルに差し替え可能なモデルカードを採用。API経由でテキストを送信すると512次元の埋め込みベクトルを返します。CUDAが使える環境ではGPU自動選択も行い、機械学習や自然言語処理の実験やサービス開発に便利な構成となっています。
OpenFi-BOT:Vonssyによるオープンソース自動化ボット
2025/6/9
OpenFi-BOTは、Pythonで開発された自動化ボットプロジェクトで、Vonssy氏によるシリーズの第2弾と位置づけられています。シンプルながらも汎用性を持ち、様々なタスクの自動化を目指して設計されているのが特徴です。軽量な構造と拡張性を兼ね備え、Pythonの利点を活かした実装がなされています。
Openomy:ブロックチェーンとAIによるオープンソース経済ソリューション
2025/7/4
Openomyは、ブロックチェーン技術とAIを活用してオープンソースの経済ソリューションを提供するプロジェクトです。単なるコード公開に留まらず、コード自体を製品として捉え、コントリビューションの多角的な評価や経済的インセンティブの創出を目指しています。TypeScriptで開発されており、貢献者の活動を可視化・評価する独自の仕組みを備えています。
OpenPCC — 検証可能なプライベートAI推論フレームワーク
2025/11/5
OpenPCCは、AppleのPrivate Cloud Computeに着想を得たオープンソースの「検証可能なプライバシー保護AI推論」フレームワークです。プロンプトや出力、ログを秘匿したままモデル推論を実行できるよう、暗号化ストリーミング、ハードウェアによる認証(attestation)、そしてリクエストの非リンク化(unlinkable requests)などの技術を組み合わせ、自己運用可能で監査可能なインフラとして設計されています。コミュニティ主導の透明な標準化を目指すプロジェクトです。
OpenTrack(ヒューマノイド動作トラッキング)
2025/9/19
OpenTrackは、MuJoCoを用いたヒューマノイド動作トラッキングの公式実装です。GALBOT・清華大学による研究成果をベースに、シミュレーション環境やデータ生成ツール、Brax→PyTorch変換スクリプトなどを備え、マルチGPUでの学習や大規模実験に対応するコードベースを提供します。論文やデモサイトへのリンクが整備され、研究・実装の再現や拡張がしやすい構成になっています。(約300字)
OpticalCharacter:プロフェッショナルな光学文字認識ソリューション
2025/8/10
OpticalCharacterは、最新のTypeScript技術とモダンなアーキテクチャパターンを活用した、クラウド対応かつエンタープライズ向けに最適化された光学文字認識(OCR)ソリューションです。高精度な文字認識機能を備え、企業の要件に応じた拡張性と効率性を実現。開発者に使いやすく設計されており、OCRを必要とする多様なアプリケーションに柔軟に対応可能です。
Occlusion-robust Stylization for Drawing-based 3D Animationの紹介
2025/8/5
「OSF」は、ICCV2025で発表予定の「Occlusion-robust Stylization for Drawing-based 3D Animation」をテーマにしたリポジトリです。3Dアニメーション制作における描画ベースのスタイライズ技術において、特に遮蔽(オクルージョン)に強い手法を提案しており、複雑なシーンでも安定的な表現が可能になることが特徴です。現在はリリース準備中で、将来的に詳細な実装や資料の公開が期待されます。
oumnix-minimal: 非Transformer系AIアーキテクチャの実験的モデル
2025/8/25
「oumnix-minimal」は、Transformerに依存しない新しいAIモデルアーキテクチャの基礎的な実装です。約5000万パラメータのモデルをRTX 4060搭載ノートPCでゼロから学習させる実験的プロジェクトで、既存の論文や既視モデルの模倣を行わず、新たな探索の道を模索しています。シンプルながらも意欲的な挑戦として注目されるリポジトリです。
OvamAiレビュー:リアルタイムでコード品質を高めるAIアシスタント
2025/8/16
OvamAi-reviewは、チームの生産性向上を目的としたAIベースのコードレビュー支援ツールです。リアルタイムかつ文脈を理解したフィードバックを提供し、コラボレーションの円滑化や意思決定の強化、イノベーションの促進を実現します。TypeScriptで開発されており、開発現場の効率化と高品質なコード維持に貢献します。
PackMIL: 計算病理学向けパック型多重インスタンス学習フレームワーク
2025/9/26
PackMILは計算病理(Computational Pathology)におけるデータ課題を再検討し、スライド画像(WSI)解析のための「パックベース」Multiple Instance Learning(MIL)フレームワークを提供するリポジトリです。パッチ単位のインスタンスを単純なバグ(bag)で扱うのではなく、位置的・意味的に関連する複数のパッチを“パック”としてまとめることで、ラベル希薄性や計算コストの問題に対処します。論文へのリンクやデータ(百度网盘)への案内があり、CLAM等のベースライン実装や設定ファイルを含むPythonベースの解析コード一式が公開されています。研究再現と比較実験に向けた実装が中心です。
PageTalk — ウェブ上で音声入力を実現するChrome拡張
2025/9/13
PageTalkは、任意のウェブページ上の入力欄やリッチテキストエディタで音声入力を可能にするオープンソースのChrome拡張です。画面上にドラッグ可能なマイクのフローティングボタンを表示し、クリックやカスタムショートカットで録音を開始・停止。検索、SNS、メール、オンライン文書など幅広い場面でハンズフリー入力を実現します。軽量なJavaScript構成で、既存のフォームやエディタに自然に組み込める点が特徴です。(約300字)
PartCrafter:構造化3Dメッシュ生成のための合成潜在拡散トランスフォーマー
2025/6/9
PartCrafterは、合成的な潜在拡散トランスフォーマーを用いて、構造化された3Dメッシュを生成する革新的な技術を提供するリポジトリです。パーツ単位での生成を可能にし、高精細かつ意味的に整合性のある3Dモデル作成を目指しています。3Dグラフィックスや機械学習分野における最新の生成モデルの応用例として注目されており、研究および実用面での利用価値が高いリポジトリです。
Perplexity-APIで実現するGoogle検索データの高度解析
2025/6/24
Perplexity-APIは、Google検索データの取得と解析をシームレスに行うための高度なAPIです。人工知能を活用し、生の検索データを有用なインサイトへと変換。企業や開発者がデータドリブンな意思決定を容易に行えるよう設計されています。本リポジトリでは、APIの利用方法や特徴、技術的なポイントを詳しく解説します。
Physicar DeepRacer for Cloud:クラウドベースのPhysiCar DeepRacer学習プラットフォーム
2025/9/6
Physicar DeepRacer for Cloudは、PhysiCar AIプロジェクトの一環として開発された、AWS DeepRacerモデルをクラウド環境で効率的にトレーニングするためのプラットフォームです。ローカル環境に依存せず、クラウドでの学習やテストを容易に実行できるため、機械学習モデルの開発サイクルを加速させます。現在ベータ版であり、簡単なノートブック形式の操作で始められる点も特徴です。
PhysMaster:ビデオ生成のための物理表現習得
2025/10/16
PhysMasterは「Mastering Physical Representation for Video Generation via Reinforcement Learning」という研究の公式リポジトリです。本プロジェクトは、強化学習を用いて物理的に妥当な表現(物体の運動や相互作用を表す潜在表現)を獲得し、それをビデオ生成モデルに組み込むことで、動的で一貫性のある映像生成を目指します。論文・プロジェクトページ・アーカイブへのリンクがREADMEにまとめられており、実験用アセットや図版が含まれています(軽量なリポジトリ構成)。発表はSIGGRAPH Asia 2025に関連する成果です。
Pixelle-Video:AI 全自動ショート動画エンジン
2025/11/7
Pixelle-Videoは、AIを組み合わせて短尺動画の企画・生成・編集を自動化することを目指したPython製のオープンソースプロジェクトです。テンプレートやスクリプト群でシナリオ生成、テキスト音声合成(TTS)、画像・映像素材生成、シーケンス編集などのパイプラインを統合し、コンテナ化(Docker)で再現可能なワークフローを提供します。開発者や研究者がモデルやプラグインを差し替えて実験できる柔軟な構成を持ちます(300字程度)。
PosterCraft:高品質で美的なポスター生成のための統合フレームワーク
2025/6/30
PosterCraftは、高品質かつ美的なポスター生成を目指し、生成プロセスを統合的に再設計したPythonベースのフレームワークです。最新のAI技術を活用し、デザインの美学と表現力を両立させることに注力。ユーザーは簡単な入力からプロフェッショナルなポスターを効率的に生成でき、クリエイティブ制作の新たな可能性を切り拓きます。
Power BIデータセットと自然言語対話を実現するMCPサーバー
2025/6/21
本リポジトリ「powerbi-mcp」は、Power BIのデータセットと自然言語によるインタラクションを可能にするMCP(Multi-Channel Platform)サーバーの実装を提供しています。Pythonで構築されており、ユーザーは自然言語での質問を通じてPower BIデータにアクセスし、対話的にデータ分析を行うことが可能です。データドリブンな意思決定を支援する新しいインターフェースとして注目されます。
PPLX-Agentic-Task-List-Generator:プロンプトをエージェントタスクリストに変換するツール
2025/9/1
PPLX-Agentic-Task-List-Generatorは、ユーザーが入力した自然言語のプロンプトをもとに、AIエージェントが実行可能なタスクリストへと自動変換するTypeScript製のツールです。AI Studio上で動作し、開発者が効率的にAIタスク管理を行えるよう支援します。Node.js環境でのローカル実行も可能で、Gemini APIを活用して高度な自然言語処理を実現しています。
ppt_assistant:多模態大模型とLangGraphによるPPT生成システム
2025/6/9
ppt_assistantは、多模態大規模モデルとLangGraph技術を活用したPPT自動生成システムです。フロントエンド、バックエンド、そしてコアの3層構造で構成されており、ユーザーの入力から効果的なスライドを生成します。Pythonで実装されており、AIを駆使した効率的なプレゼン資料作成を支援します。
ロボット学習における圧力触覚センサーの研究論文リスト
2025/9/2
本リポジトリは、ロボット学習分野における圧力ベースの触覚センサーに関する学術論文を体系的に収集・整理したものです。特に、学習技術とマトリックス構造の柔軟な触覚センサーを組み合わせた研究に焦点を当てており、関連分野の研究者や技術者にとって有用な情報源となっています。最新の研究動向や手法を把握するためのリファレンスとして活用可能です。
Prime Intellectの強化学習環境群「prime-environments」の紹介
2025/8/16
Prime Intellect Researchチームが開発した、強化学習(RL)環境および評価フレームワークのオープンソースリポジトリ「prime-environments」を解説します。Pythonで実装されたこのプロジェクトは、RL研究や評価を効率化するツール群を提供し、環境の作成からAPI連携まで幅広くサポート。セットアップ方法や主要機能、技術的な特徴を詳細にまとめました。
PRISM:コスト効率の高いマルチLLM推論システム
2025/8/15
PRISMは、複数の大規模言語モデル(LLM)を効率的に運用するための研究プロトタイプであり、GPUリソースの時間・空間共有を柔軟に実現することで推論コストを大幅に削減します。Pythonで実装され、マルチLLM環境におけるスケーラビリティとパフォーマンス向上を目指した設計が特徴です。
Prompt-Assistant:AIプロンプト作成を革新するChrome拡張機能
2025/6/3
Prompt-Assistantは、AIプロンプト作成のプロセスを革新するChrome拡張機能です。先端のAIエンジニアリング技術とGoogle Gemini AIを活用し、ユーザーの単純なアイデアを最適化された高品質なプロンプトへと変換。主要なAIプラットフォームで優れた成果を生み出します。シンプルな操作で効果的なプロンプトを生成できるため、AI活用の幅を広げるツールとして注目されています。
AIプロンプト最適化ツール「prompt-optimizer」
2025/8/9
「prompt-optimizer」は、ReactとCloudflareを用いて開発されたAIプロンプトの最適化ツールです。ユーザーが生成AIに与えるプロンプトを効率的に改善し、より精度の高い応答を引き出すことを目的としています。軽量なJavaScriptベースのフロントエンドとサーバーレス環境を活用したバックエンドにより、迅速かつスムーズなプロンプトチューニングが可能です。AIの活用を促進するための実用的なツールとして注目されています。
PromptAudit — プロンプト監査テンプレート
2025/10/18
PromptAuditは、プロンプトや補助ドキュメントを短時間で洗い出し・検証・改善するための軽量なレビュー(監査)フレームワークです。ヒューマンレビュアーやエージェント型コーディングシステムが使える繰り返し可能な監査フローを提供し、矛盾の抽出、意図の明確化、優先度付けされた修正案の作成を支援します。Markdownベースのテンプレート群とワイヤーフレーム設計図が含まれており、プロンプトエンジニアリングの実務向けに調整されています。(約300字)
PromptEngineering:大規模言語モデルのプロンプト設計実験集
2025/8/24
PromptEngineeringは大規模言語モデル(LLM)におけるプロンプトエンジニアリングの実験をまとめたリポジトリです。実際のプロンプト設計や応答の工夫を通じて、モデルの性能向上や応答の多様性を追求。シンプルながら実践的なコード例を含み、LLM活用の基礎理解と応用力を高めることができます。初心者から研究者まで幅広い層に役立つ内容です。
PromptMicroTune-Revolution:大規模モデルの新たな「ソフト微調整」手法
2025/6/8
PromptMicroTune-Revolutionは、一段のプロンプトを用いた「ソフト微調整」技術を提案し、大規模AIモデルのカスタマイズコストと可能性の限界を大きく変革します。従来の大規模モデルの微調整に比べて低コストかつ柔軟に適応可能であり、ユーザーの創造性を拡張する新たなアプローチとして注目されています。
ProteKenz — タンパク質トークナイゼーションと配列表現の研究リポジトリ
2025/10/15
UC Denverでの独立研究プロジェクト「ProteKenz」は、機械学習を用いた創薬研究向けにタンパク質配列のトークナイゼーションと表現学習を探るための基盤的取り組みです。PDBから抽出した配列に対して固定k-mer、サブワードエンコーディング(BPE等)、境界認識スライシングなど複数のトークナイゼーション手法を実験的に適用し、基礎モデル(foundation models)用の入力表現を設計・比較することを目的としています。公開リポジトリでは学術的整合性保持のためソースコードは含まれていませんが、研究の方向性と設計方針がREADMEにまとめられています(300字程度)。
AI搭載スマートベビーモニター「prototipo-baba-eletronica-inteligente」
2025/7/9
本リポジトリはPythonとYOLOを活用した人工知能搭載のベビーモニターシステムを提供します。YOLOによる映像認識で赤ちゃんがベッド内外にいるかを検出し、危険を察知すると音声や視覚によるアラートを発信。OpenCVで映像処理し、TkinterとPygameでユーザーインターフェースと通知機能を実装しています。低コストかつリアルタイム監視可能なスマート育児支援ツールです。
PTY4614(卒業ポートフォリオ:LaungLife)
2025/9/14
チリの情報工学学位取得のための最終ポートフォリオ「PTY4614」は、機械学習を用いた早期がん検出と予測分析をテーマにした卒業プロジェクトです。本リポジトリは授業での成果物やプロジェクト概要をまとめたもので、診断の早期化を目的としたデータ前処理、モデル設計、評価方針、倫理的配慮などの指針が記載されています。コードは限定的ですが、研究設計と成果の整理に重点を置いたドキュメント性の高い資料です。(約300字)
PUAX - AIエージェント向けPUAプロンプト集
2025/8/18
PUAXはAIエージェントを効果的に「調教」するためのPUA(Pick-Up Artist)スタイルのプロンプト集です。リアルタイムで更新され、AIに対して厳しくもユーモアを交えた挑発や叱咤激励を送ることで、学習意欲や応答の質を高めることを目的としています。AIとの対話に新たな視点をもたらすユニークな試みとして注目を集めています。
腕立て伏せ検出器(Pushup-Detector)
2025/9/19
本リポジトリは、Webカメラ映像からリアルタイムに腕立て伏せ(プッシュアップ)を検出し、自動で回数をカウントするPythonプログラムです。MediaPipeを用いた姿勢推定で肘や肩の角度を計測し、角度の変化を閾値で判定して上下動を検出、視覚フィードバックを画面に描画します。軽量な構成でローカルのWebカメラだけで動作するため、トレーニングのセルフチェックやプロトタイプ実装に適しています。(約300字)
Python Learning Space:AI駆動のPython学習環境構築デモ
2025/7/30
「Python Learning Space」は、AIのプロンプトエンジニアリングを活用し、汎用AIアシスタントをPython学習に特化したチューターに変換する手法を示したリポジトリです。カスタムインストラクションやチャットモードを通じて、効果的な教育環境を構築するデモを提供し、AIを活用したプログラミング学習の新しい可能性を探ります。
Pythonによる感情分析APIマイクロサービス
2025/8/30
本リポジトリは、Hugging FaceのTransformersを活用したテキストの感情分析を行うPython製マイクロサービスです。FastAPIを用いて高速かつ軽量なAPIを構築し、Dockerでコンテナ化することで容易なデプロイを実現しています。Postmanによるテストもサポートしており、実用的な感情分析APIの構築例として有用です。
python(Python学習・データ分析サンプル集)
2025/10/2
本リポジトリは、Pythonを使った機械学習・Pandasによるデータ分析の学習用サンプルを集めた小規模リポジトリです。EDA(探索的データ解析)や1차프로젝트(第一次プロジェクト)等のディレクトリにサンプルコードやデータが格納され、READMEからは外部の教科書用サンプル(tsdata/pandas-data-analysis)やMatplotlibのチートシートが参照されています。学習や教材の補助として使いやすい構成ですが、依存関係や詳細なドキュメントは限定的です。
QLIP: テキスト埋め込みで誘導する拡散モデルの量子化技術
2025/7/15
「QLIP」は、テキスト埋め込みを活用してテキスト誘導型拡散モデルの量子化を実現する先進的な技術を実装したGitHubリポジトリです。本リポジトリは、2025年発表の論文「Text Embedding Knows How to Quantize Text-Guided Diffusion Models」に基づき、拡散モデルの効率化と性能維持を両立する手法を提供します。今後のコード公開が予定されており、AI/ML分野での注目を集めています。
実機量子プロセッサ上での量子置換パッド(QPP)実装
2025/8/27
AlainChance氏の「QPP-Alain-real_QPU」は、実際の量子プロセッサユニット(QPU)上で量子置換パッド(Quantum Permutation Pad:QPP)を実装・検証するためのJupyterノートブック群を提供しています。Qiskit RuntimeやAerSimulatorを用い、2~9量子ビットの環境で動作し、2024年発表の論文をサポート。量子暗号の一手法として注目されるQPPの実践的応用に焦点を当てており、量子情報処理や暗号技術の研究者に有用なリソースです。
quant_clone:GGUFモデルの量子化パラメータをコピーするツール
2025/8/1
quant_cloneは、llama.cppのllama-quantizeコマンドを自動生成し、任意のGGUFフォーマットの量子化パラメータを複製するシンプルなPythonスクリプトです。これにより、既存のモデルと同様の量子化設定で新たなモデルを効率的に量子化可能で、最新のGGUF仕様にも対応しています。
Quant_Trading_Algo:Pythonによる量的取引アルゴリズムの実装
2025/6/26
Quant_Trading_Algoは、Pythonを用いて量的取引(クオンツトレーディング)のアルゴリズムを実装したリポジトリです。金融市場のデータ分析や戦略開発に役立つツールやモデルが含まれており、投資判断の自動化やパフォーマンス最適化を目指しています。金融工学と機械学習の技術を活用し、実践的な取引アルゴリズムの構築をサポートします。
蛐蛐 (ququ) — 中国語特化の次世代デスクトップ音声ワークフロー
2025/9/20
FunASRのローカル音声認識モデルと可変の大規模言語モデル(LLM)を組み合わせ、中国語に最適化されたデスクトップ向け音声ワークフローを提供するオープンソースプロジェクト。macOS/Windows/Linuxを対象に、オンデバイスASRによるプライバシー重視の音声認識、エージェントベースの対話処理、環境変数での設定やアクセシビリティ改善などを備え、デスクトップアプリとして迅速に音声 → テキスト → 意図処理 → 応答生成の流れを構築できることを目指しています。
Qwen-Browser-plugin — ブラウザで画像逆解析と生成を行う拡張
2025/9/19
本リポジトリは、ウェブページ上の任意の画像を右クリックして自動的に説明文(プロンプト)を生成し、そのプロンプトを使ってAIで新しい画像を生成するワークフローをブラウザ拡張として提供するツールです。画像解析→プロンプト生成→画像生成をシームレスに繋ぎ、生成結果はUI上で確認・保存できます。セットアップはローカルAPIキーや設定ファイルを用いる想定で、拡張本体はJavaScriptで実装されています。(約300字)
R1Z:AIアプリとエージェントのためのセキュアなオープンクラウド
2025/6/14
R1Zは、AIアプリケーションやエージェント向けに設計されたセキュアなオープンクラウド環境を提供するTypeScriptベースのプロジェクトです。安全性を重視しつつ、AI開発の柔軟性と拡張性を両立。オープンソースとして公開されており、AI分野におけるクラウド利用の新たな可能性を追求しています。
RadGS_Reg:3D放射ガウスによる脊椎CT/X線画像の高精度登録
2025/6/23
RadGS_Regは、脊椎のCTとX線画像を対象に、3D放射ガウス(Radiative Gaussians)を用いた共同再構成と3D/3D画像登録を実現するPythonベースのオープンソースプロジェクトです。異なるモダリティ間の画像を高精度に整合させることで、医用画像解析や診断支援に寄与します。
LangChainとS3Vectorを活用したRAG型PDF情報検索システム
2025/9/1
本リポジトリは、LangChainとS3Vector、OpenAIを組み合わせてPDFファイルの内容を効率的にインデックス化し、高速かつ高精度な情報検索を実現するRAG(Retrieval-Augmented Generation)システムのサンプル実装です。Pythonで構築されており、AWS認証情報とOpenAI APIキーを用いて簡単にセットアップ可能。PDFドキュメントの内容をベクトル化しS3に保存、LangChainが検索と生成を橋渡しします。ドキュメントやコードはシンプルで拡張性もあり、RAGの実践的な活用例として参考になるリポジトリです。
rag-reranking:2段階RAGパイプライン向け人気リランキングモデルの概要
2025/6/8
本リポジトリ「rag-reranking」は、情報検索や質問応答に用いられるRAG(Retrieval-Augmented Generation)パイプラインにおける2段階リランキング手法の代表的なモデルやアーキテクチャをまとめています。Jupyter Notebook形式で実装例を提供し、リランキングの基礎から応用までを体系的に理解できる内容です。RAGの性能向上を目指す研究者やエンジニアに有用なリファレンスとなっています。
RAGシステム - AIを活用したスマートドキュメント検索ツール
2025/8/17
本リポジトリ「rag-system」は、AI技術を用いたドキュメント検索および質問応答システムを提供します。Pythonをベースに、LangChainやGradioなどの最新ライブラリを活用し、ユーザーのドキュメントから効率的に情報を検索し、自然言語で回答を生成。RAG(Retrieval-Augmented Generation)という手法を採用し、検索結果を元に高度な回答をリアルタイムで生成する点が特徴です。ドキュメントの知識ベースを活かしたスマートな情報取得を実現します。
RAG-Tutorials:Retrieval-Augmented Generationの実践チュートリアル
2025/9/3
RAG-Tutorialsは、Retrieval-Augmented Generation(RAG)モデルの理解と実装を目的としたJupyter Notebookベースのチュートリアル集です。情報検索と生成モデルを組み合わせる最先端の手法を学べる内容で、自然言語処理における応用例や実践的コードが含まれています。初心者から中級者まで、RAGの基礎から応用までを体系的に学習可能です。
RAGen — RAG適応のためのドメイン特化型QAデータ生成フレームワーク
2025/10/14
RAGenは、Retrieval-Augmented Generation(RAG)モデルを特定ドメインへ適応させるためのドメイン特化型QAデータ生成フレームワークです。既存コーパスから自動的に質問応答ペアを生成・整形し、RAGの学習や評価に適したフォーマットで出力することを目的としています。軽量なPython実装でプロンプト設計やテンプレート化、データクリーニングを行い、ドメインごとの高品質なトレーニングデータ作成を支援します(約300字)。
Ragnrock:カスタマイズ可能な検索エンジンと言語モデルで情報源付きレポートを生成するAIツール
2025/8/30
Ragnrockは、多様な検索エンジン(Google、Brave、Wikipediaなど)とカスタマイズ可能な大規模言語モデル(LLM)を統合し、情報源を明示したレポートを自動生成するAIリサーチツールです。Dart言語で開発されており、柔軟な検索設定とレポート出力を実現。研究や調査、ドキュメンテーション作成に適した効率的な情報収集支援を提供します。
ランダムフォレストによるワイン品質予測プロジェクト
2025/7/26
本リポジトリは、物理化学的特性データを用いてワインの品質を予測する機械学習プロジェクトです。Pythonの主要ライブラリを活用し、探索的データ解析(EDA)、モデル構築、ハイパーパラメータ調整、特徴量重要度の分析を包括的に実施。Jupyter Notebook形式で詳細な実装と可視化を提供し、初心者から中級者まで機械学習の流れを学びやすい構成となっています。
リアルタイムローカル音声翻訳ツール
2025/7/29
本リポジトリは、Pythonを用いて開発されたリアルタイム音声翻訳ツールです。マイクからの音声入力をリアルタイムでテキストに変換し、そのテキストを指定した言語へローカル環境で翻訳します。インターネット接続を必要とせず、Voskによる音声認識とHugging Face TransformersのMarianMTモデルを組み合わせることで、プライバシー保護と低遅延を実現。TkinterベースのGUIで手軽に操作でき、多様なモデル選択やデバイス選択も可能です。
Recap - プライバシー重視のmacOSネイティブAI会議要約ツール
2025/8/2
Recapは、macOSネイティブで動作するオープンソースのAI会議要約アプリケーションです。プライバシーを最重要視し、ローカル環境での音声認識と要約生成を実現。会議の録音から自動的にテキスト化し、理解しやすい要約を提供します。シンプルなUIとSwiftによる軽快な動作で、ビジネスや教育現場における会議効率化を支援します。
vLLMの活用に役立つ共通レシピ集
2025/7/23
vLLMプロジェクトが提供する「recipes」リポジトリは、vLLMを様々なモデルで実行するためのコミュニティメンテナンスによる共通レシピを集約しています。vLLMの利用を始めたい開発者や研究者にとって、モデルの起動や検証を迅速かつ効率的に行うための参考資料として活用できるリポジトリです。シンプルかつ実用的なスクリプト群を通じて、vLLMの導入ハードルを下げることを目的としています。
推薦エンジンAPI
2025/10/5
C++で実装された基礎的なRecommendation EngineのAPIリポジトリ。ユーザー行動に基づくパーソナライズされた推薦を提供することを目的とし、機械学習の土台となるコンポーネントやAPI設計のサンプルを含みます。軽量なC++実装のため、低レイテンシや組み込み用途への応用が想定されます(概要・設計・拡張ポイントを解説)。
Redes-Neuronales:ニューラルネットワーク入門リポジトリ
2025/8/6
BrayanTorres2による「Redes-Neuronales」は、Pythonを用いてニューラルネットワークの基礎から応用までを学べる教育用リポジトリです。基本的なニューラルネットワークの構築やトレーニング、複数週にわたる演習課題を通じて、機械学習の理解を深めることができます。初心者から中級者まで幅広く活用可能なシンプルなコード構成が特徴です。
refrag-lite: トークン効率化されたRAGのためのRL選択的展開
2025/10/14
REFRAG論文の再実装であるrefrag-liteは、検索強化生成(RAG)のトークン効率を高めるために、取得した多数のチャンクをほとんど埋め込みに圧縮し、その中から強化学習で「展開すべき少数のチャンク」を選ぶポリシーを学習します。これによりトークン制約の下で回答品質を最大化することを目指したコンパクトで再現可能な実装を提供します(300字程度)。
research(研究プロジェクト集)
2025/10/20
Simon Willison氏の「research」リポジトリは、個別の実験的研究プロジェクトをディレクトリ単位でまとめた軽量なコレクションです。各サブディレクトリは独立した探索的実装を含み、主にLLM(大規模言語モデル)ツールやWeb周辺の技術、Pythonを使った検証が中心です。リポジトリ自体は小規模でファイル数・コミット数ともに限定的ですが、ミニプロジェクトのスナップショットとしてアイデアや実験コードを共有する用途に向いています。READMEは各ディレクトリが個別の研究プロジェクトであることを明記しており、将来的な拡張や実験の起点として利用可能です。
大規模モデル実践リソース集
2025/8/25
OpenSELabが提供する「Resources-for-Large-Scale-Model-Practice」は、大規模言語モデル(LLM)やAIエージェントの実践的な技術習得を支援するJupyter Notebook教材集です。APIの利用方法からエージェント開発、MCP(Model-Centric Programming)技術まで幅広く網羅し、学習者が段階的に理解を深められる構成となっています。中国語での教材が中心ですが、実践的なコード例と解説が豊富で、AI/ML分野の技術者や研究者に役立つ内容が揃っています。
Ritmex AI Trader — マルチエージェント暗号資産自動取引プラットフォーム
2025/10/20
Ritmex AI Trader は、暗号資産の高頻度/中頻度取引戦略向けに設計されたマルチエージェント研究プラットフォームです。市場データ収集、特徴量生成、シグナル作成、ポートフォリオおよびリスク管理、注文実行、コンプライアンス監査といった機能を独立したエージェントとして分離し、内部の JSON メッセージバスと共有状態ストアで連携します。モジュール化された設計により、戦略実験や実行ロジックの差し替え、分散実行の検証が容易になっています(TypeScript ベース)。
RKNN - Rockchip NPU向けRustバインディングライブラリ
2025/8/17
RKNNは、Rockchipのニューラルプロセッシングユニット(NPU)上での深層学習モデルの実行をRust言語で可能にするバインディングライブラリです。RockchipのRKNNランタイムAPI(librknnrt.so)をRustアプリケーションに効率的に統合し、AIモデルの最適化された実行環境を提供します。RKNN SDKの重要なコンポーネントとして、Cヘッダの再配布を不要にし、Rust開発者がNPUの性能を活かしたAI開発を進められるよう設計されています。
RL-Factory:効率的な強化学習エージェント訓練フレームワーク
2025/5/27
RL-Factoryは、強化学習エージェントのモデルを簡単かつ効率的に訓練できるPythonベースのフレームワークです。シンプルな設計と柔軟な構成により、研究者や開発者が迅速に強化学習の実験を行い、最適なエージェントを構築可能。多様なアルゴリズムをサポートし、カスタマイズ性に優れた設計で、最新のAI/MLプロジェクトに適しています。
強化学習による優れた関数呼び出しの探索
2025/8/7
本リポジトリ「RLFC」は、論文「Exploring Superior Function Calls via Reinforcement Learning」の公式実装です。強化学習を活用し、関数呼び出しの最適化を目指したモデルを提供しており、オープンソースモデルの中で最先端の性能を達成しています。Ant Groupの機密審査を経て、コードやデータセット、モデルの重みの公開が予定されています。Open Sourceプロジェクト「Aworld, InclusionAI」の一環として開発され、今後のアップデートにも注目が集まっています。
RLPR: 検証器なしでRLVRを一般ドメインに拡張する技術
2025/6/23
RLPRは、強化学習におけるRLVR(Reinforcement Learning with Verifiers)手法を、検証器を用いずに一般的なドメインへと拡張することを目指したPython実装のリポジトリです。従来、RLVRは特定の検証器の存在に依存していましたが、本手法はそれを不要とし、幅広い環境での適用を可能にします。RLPRはOpenBMBが開発しており、強化学習の汎用性向上に貢献する先進的な技術を提供します。
RLTrainPPT:強化学習を活用したPPT生成エージェント
2025/8/28
RLTrainPPTは、強化学習を用いてPPT(パワーポイント)生成エージェントをトレーニングするプロジェクトです。テーマに基づきWeb検索を多段階で活用し、信頼性の高い情報を収集してPPTの大綱や内容を自動生成します。Google DeepMindのAgentic RL Transformer(ART)を用いた強化学習フレームワークにより、構造化されたPPT大綱から詳細なスライド内容を作成し、引用情報も併せて出力可能です。AIによる効率的な資料作成支援を実現します。
AI背景除去ツール「rmbg-tool」の技術解説
2025/7/11
「rmbg-tool」は、Vite+React+ONNX Runtime Webを用いて構築されたローカル動作の画像背景除去アプリケーションです。RMBG-1.4モデルを活用し、高品質な背景分離を実現。画像アップロードからリアルタイム処理までブラウザ上で完結し、プライバシー保護にも優れています。本記事ではリポジトリの概要、技術的特徴、構成について詳しく解説します。
Roblox-fish-script-free:Roblox向け高度自動釣りスクリプト
2025/8/6
Robloxの人気ミニゲーム「Fishin Script」を自動化するために開発された、高度な画像認識技術を活用した釣りタスク自動化ツールです。魚の識別やエアバブルの追跡も自動で行い、プレイヤーの操作を不要にすることで効率的なゲームプレイを実現します。Windows環境に対応し、使いやすさと高機能を両立させたスクリプトとして注目されています。
基盤モデルにおけるラベルノイズ下での頑健分類:ジオメトリ認識信頼性フレームワーク
2025/9/6
本リポジトリは、基盤モデル(Foundation Models)を対象に、ラベルノイズが存在する環境でも頑健に動作する分類手法を提供する統一的かつ拡張性の高いフレームワークを公開しています。ジオメトリ情報を活用した信頼性評価により、ノイズ混入ラベルの影響を低減し、分類性能の向上を目指します。Pythonで実装され、実験結果の可視化や各種設定が容易に行える点も特徴です。
ロボットの距離推定におけるIMUデータ活用技術
2025/8/25
本リポジトリは、IMU(慣性計測装置)センサーの加速度データを用いてロボットの移動距離を推定する機械学習パイプラインを実装したプロジェクトです。データ拡張や複数の回帰モデルを組み合わせることで、精度の高い距離推定を実現しています。Pythonで開発され、ランダムフォレストやサポートベクター回帰を活用したアプローチを採用しています。
Rolling Forcing — 自動回帰型長尺動画ディフュージョンのリアルタイム生成
2025/9/30
Rolling Forcingは、テキストから動画を生成するストリーミング型の手法で、単一GPUでリアルタイム(約16fps)に動作しつつ、数分にわたる長尺動画を高品質かつ誤差蓄積を抑えて生成できる点を特徴とします。本リポジトリは論文実装と関連資料を提供し、オートリグレッシブ(自動回帰)なフレーム条件付けと「forcing」戦略を組み合わせることで、逐次生成時のドリフト(累積誤差)を軽減しながらストリーミング配信に適した高速推論を実現しています(原文ページ・論文リンクあり)。実験では単GPUでのリアルタイム生成や長尺安定性が示されています。
Roomi - 手頃な価格で実現する自律型清掃・家事ロボット
2025/7/18
Roomiは、ホテルや家庭向けに設計されたオープンソースの自律型清掃・家事ロボットです。ベッドメイキングや整理整頓など多彩な家事タスクをこなすことができ、約900ドル以下の低価格で実現。Pythonで開発されており、ユーザー自身が約5時間で組み立て可能です。LeRobotやgym-genesis、ManiSkillといった先端ロボティクス技術を活用し、信頼性と拡張性を兼ね備えた次世代の家庭用ロボットの実装を目指しています。
rss2mail-ai:RSSフィードの自動収集とAI要約によるメール配信ツール
2025/6/7
rss2mail-aiは複数のRSSフィードから自動的にコンテンツを取得し、重複排除やAIによる要約機能を備えたメール配信ツールです。Go言語で実装されており、RSS情報を効率的にまとめて届けたいユーザーやサービス向けに設計されています。シンプルな設定で導入可能なため、定期的な情報収集やニュース配信の自動化に最適です。
RuoYi-RAG-LangChain4j:AI知識ベース検索強化生成システム
2025/8/13
RuoYi-RAG-LangChain4jはLangChain4jフレームワークを基盤としたAI知識ベースの検索強化生成(RAG)システムのサーバーサイド実装です。多様なAIモデルに対応し、SearXNG検索エンジン、Neo4j知識グラフ、MCPサービス(地図、メール、DB連携)を統合して、より豊かで正確かつタイムリーな質問応答体験を提供します。AI知識管理システム及びユーザーインターフェースと連携し、PDFやTXT、Markdown等の多様なドキュメント形式から情報を抽出可能です。
手術映像向けSAM2によるゼロショット器具セグメンテーション(sam2su)
2025/10/18
Segment Anything Model 2(SAM2)を用いて単眼手術映像の器具セグメンテーションをゼロショットで行う研究向けリポジトリ。Jupyter Notebookベースで、最初のフレームに与えたプロンプト(クリックやマスク)を起点に、以降のフレームへセグメントを伝播させるワークフローを提供。EndoNeRFなど内視鏡映像データセットの例があり、論文(arXiv)へのリンクや結果画像を備える簡潔な実験用実装が含まれます。
SATA_fork:ImageNet評価における順序依存問題を検証するPython実装
2025/7/24
SATA_forkは、ImageNet-1Kデータセットで95%の高いトップ1精度を報告したSATA手法に対し、評価結果の妥当性を検証するためのフォーク実装です。本リポジトリは、データセットのサンプル順序に依存した評価バイアスの存在を示し、SATAの性能がシャッフルにより大幅に低下する問題を明らかにしています。研究コミュニティにおける適切な評価手法の重要性を示す技術的検証ツールとして活用できます。
SceneCompleter:シーン補完のための先進的AIツール
2025/6/13
SceneCompleterは、画像や3Dシーンの欠損部分を補完するためのAIベースのツールキットです。深層学習技術を活用し、部分的に欠落したシーンの自然な復元を目指しています。特に画像インペインティングやシーン再構成に応用可能で、クリエイティブやリサーチ用途に貢献します。現時点ではスター数は少ないものの、今後の発展が期待される注目のリポジトリです。
Schema-Action-Querying — テキスト→アクションで操作するマルチテーブルExcel/CSVクエリ
2025/11/6
Schema‑Action‑Queryingは、ローカルで動く小型言語モデル(約3Bパラメータ)を使って、Excel/CSVファイル内の複数テーブルを自動検出し、カラムや結合を推定して自然言語クエリを実行するオープンソースプロジェクトです。データベース構築やクラウドサービスは不要で、スキーマ抽出→アクション生成→パンダス等による実行の流れで90%以上の精度を目指します。設定やサンプルも同梱され、ローカル環境で手軽にテーブル探索や集計が可能です。
株価終値予測のための深層学習フレームワーク「SCPP-Stock-Closing-Price-Prediction」
2025/5/31
「SCPP-Stock-Closing-Price-Prediction」は、過去の株式市場データを活用し、株価の終値を予測するための深層学習フレームワークを提供するリポジトリです。データ前処理からテクニカル指標の生成、LSTMやBiLSTM、RNNといったニューラルモデルを用いた時系列解析までを統合し、PythonとPyTorch、Optuna、Plotlyなどのライブラリで構築されています。投資分析やAIによる価格予測に関心のある技術者に有用なツールです。
ScreenDiffusion — リアルタイム画面変換ツール
2025/10/18
ScreenDiffusionは、StreamDiffusionを中核に据えたリアルタイムの画面→画像変換ツールです。ディスプレイに表示されるゲーム、3Dシーン、写真、ウェブカメラ映像などを即座にSD-Turboモデルで再解釈し、独自のスタイルや表現に変換します。低レイテンシでのライブ変換を想定した設計で、アーティストやクリエイターが即座にビジュアル表現を試せるプロトタイプ的実装を提供します。(約300字)
K-Meansによるショッピングモール顧客セグメンテーション
2025/8/14
本リポジトリは、ショッピングモールの顧客データを用いて、K-Meansクラスタリングを実装し、顧客を複数のセグメントに分類するプロジェクトです。年収と消費スコアの2つの特徴量を使い、最適なクラスタ数をElbow法やSilhouette分析で評価し、クラスタリング結果の可視化やクラスタプロファイルの出力も行います。Pythonで構築されており、初心者にも理解しやすい構成です。
SEAL:自己適応型言語モデルの研究と実装
2025/6/13
SEALは、自己適応機能を備えた言語モデルの開発を目的とするPythonベースのリポジトリです。継続学習や環境変化に対する柔軟な対応を実現するための技術的アプローチを提供し、自然言語処理のモデルが動的に変化するデータやタスクに適応できる仕組みを探求しています。SEALは自己適応性を重視し、モデルの性能維持と向上を両立する新たな可能性を示します。
SearchPaperByEmbedding — 論文の意味検索ツール
2025/10/20
SearchPaperByEmbeddingは、論文メタデータをクロールして埋め込み(embedding)を用いたセマンティック検索を行う軽量なPythonツールです。ローカルのオープンソース埋め込みモデル(例: all-MiniLM-L6-v2)を使うことで無料で運用可能、またOpenAIの埋め込みAPIもサポートし、高品質な検索結果を取得できます。OpenReviewからの論文取得や埋め込みのキャッシュ機能を備え、簡単なデモとスクリプトで素早く試せる構成になっています。
seedVR2_cudafull — ComfyUI向け SeedVR2 ビデオアップスケーラー(CUDAフル対応)
2025/10/6
本リポジトリは、ByteDance の SeedVR2 モデルを ComfyUI 環境で動かすための公式リリース版(packaged)です。動画と静止画のアップスケール生成に特化しており、複数GPUでの単体運用やCUDA最適化を前提とした構成が提供されています。大容量モデルや高解像度フレーム処理におけるメモリ・速度の調整方法や最適化手順も同梱されており、既存の ComfyUI ワークフローへシームレスに統合可能です(詳細は README と OPTIMIZATION_README を参照)。
SekoTalk — 音声駆動デジタルヒューマン(SekoTalk)
2025/9/14
SekoTalkは、音声を起点に動作する「音声駆動型デジタルヒューマン(またはデジタルハム)」を目指すプロジェクトです。本リポジトリ自体は最小構成(READMEのみ)ですが、公式サイトやオンラインデモ(sekotalk.com)へのリンクを通じて実行中のデモやプロジェクト紹介を提供しています。リアルタイム音声入力から表情や口の動き、ビジュアル表現へ変換する仕組みに関心のある開発者や研究者にとって、参照・検討する価値があるエントリポイントです。
自己修復型コンピューティング要素(Self_Healing_Computing_Elements)
2025/10/4
Synaptic Resilience Architecture (SRA) を中心に、AIを用いた予測保守とFPGAの部分再構成による「事前回復(proactive self-healing)」を目指すリポジトリ。ミッションクリティカルな組み込みシステムや防衛用途を想定し、障害発生前に故障を予測して計算経路を再ルーティングするアーキテクチャの設計・ハードウェア(Verilog)実装例、関連ドキュメント、研究ノートを含む。リアルタイム性とダウンタイム最小化を重視したFPGAベースの自己修復手法を検討する開発者や研究者向けの素材群。
Semantic Replica:動的室内環境のセマンティック変異データセット
2025/8/22
Semantic Replicaは、FacebookのReplicaデータセットを拡張し、静的な室内シーンに対して時間変化を考慮したオブジェクトの変異を導入したデータセットです。リアルな室内環境の変化を表現し、物体間の関係性をシーングラフとしてモデル化することで、より現実的なシーン解析やロボティクス、AR/VR応用に役立ちます。少数のファイル構成ながら、シーンの動的変化を捉える斬新なアプローチを提供します。
SentientAI — リアルタイムエージェント向け軽量ニューラルエンジン
2025/10/19
SentientAI は、リアルタイムな知能システム向けに設計された軽量でモジュール式のニューラルエンジンを謳うプロジェクトです。READMEによれば「センサー→ポリシー→アクチュエータ」の流れを持つモジュール型グラフエンジン、GPU/CPU双方に最適化されたリアルタイム推論、目標駆動のエージェント作成を簡単にするAPI、いくつかの組み込みモデルを特徴とします。ただし、公式リポジトリ自体は現状ファイル数が少なくフロントエンド中心の構成のため、実装の詳細は限定的です(READMEとデモへのリンクあり)。将来の拡張や統合を見据えた設計思想が読み取れます。
Sentiment-Analysis-API — 感情分析API
2025/10/3
テキストを受け取り「positive/negative/neutral」を返す軽量な感情分析Web APIです。学習済みのNLPモデルを利用しており、最小限のファイル構成(index.js と README)で動作します。Node.js/JavaScriptで実装されており、サンプル用途やプロトタイプ、学習目的のサーバーサイド感情解析サービスとして素早く導入できます。(300字程度)
深層学習と決定木を用いた感情分析
2025/8/25
本リポジトリは、自然言語処理(NLP)と機械学習技術を活用し、テキストから感情(肯定的、否定的、中立的)を分類するプロジェクトです。テキストの前処理、CNNを用いた特徴抽出、決定木による分類を組み合わせたアプローチで、ソーシャルメディアや商品レビューなど多様なデータに対応可能な感情分析モデルを構築しています。実装はJupyter Notebookで行われ、教育や研究の入門用にも適した構成です。
LSTMを用いた感情分析モデルの構築と実装
2025/7/27
本リポジトリは、IMDB映画レビューのオープンデータを対象に、LSTM(Long Short Term Memory)を活用した感情分析モデルの実装を行っています。Jupyter Notebook形式で、テキストの前処理からモデル構築、学習、評価までを丁寧に解説しており、自然言語処理や深層学習を学ぶ入門者に適した内容です。実践的なコード例を通じて、RNNの拡張モデルであるLSTMの特徴や効果的な活用方法が理解できます。
sentra-web-to-api:多AIプロバイダー対応のOpenAI互換APIサービス
2025/8/21
sentra-web-to-apiはNode.jsベースのAIサービス集約プラットフォームであり、複数のAI提供者の大規模言語モデルや画像生成モデルを統一的に扱えるOpenAI互換APIを提供します。モジュール化設計により拡張性とメンテナンス性に優れ、Bearerトークン認証やストリーミング応答、ツール呼び出し機能、プロキシ対応など先進的な機能を備えています。多様なAIサービスを一つのAPIでシームレスに活用したい開発者に最適なソリューションです。
Sentrax-AI:研究生AIイノベーションコンテスト参加の自然言語処理モデル
2025/8/29
Sentrax-AIは第七届研究生人工智能创新大赛に参加した中国発の自然言語処理(NLP)プロジェクトです。Pythonで実装され、文書の感情分析やテキスト分類に特化したファインチューニング済みモデルを提供。データセット管理や構成ファイルも含み、NLPタスク向けのモジュール化されたコンポーネント群が特徴です。学術コンペティションの成果物として、実践的なAI技術を学ぶ上で有益なリポジトリです。
SEO Agent Pro - AI駆動のスマートSEO分析システム
2025/9/6
SEO Agent Proは、複数のAIサービスプロバイダー(OpenAI、Google、硅基流动など)を活用し、サイトのSEO状況を多角的に分析するAIベースのSEO分析ツールです。ページのコンテンツやパフォーマンス、技術的パラメータを自動収集し、データ分析、戦略提案、専門レポート作成を行う3人のAIエージェントが連携。総合スコアと具体的な改善案を提供し、Webインターフェースでのバッチ解析や履歴管理も可能。APIキーなしでも利用できる基礎機能を備え、安全な環境変数管理でAPI情報を保護しています。
ServeGen:リアルなLLMサービスワークロード生成フレームワーク
2025/6/5
ServeGenは、リアルな大規模言語モデル(LLM)サービスのワークロードを生成するためのPythonベースのフレームワークです。AIサービスの性能評価やスケーラビリティテストに役立つ実践的な負荷シナリオを簡単に作成でき、研究開発や運用におけるLLM活用の効率化を支援します。
SGR Deep Research:スキーマ駆動型推論による高度AIリサーチエージェント
2025/8/26
SGR Deep Researchは、大規模言語モデル(LLM)に対して、事前定義されたスキーマ(構造化テンプレート)を通じて推論を誘導し、明確で予測可能な出力を生成する技術を提供します。本リポジトリは、適応的プランニングと自動引用機能を備えたインテリジェントな研究エージェントを実装しており、複雑なタスクの段階的な解決を支援します。Pythonで書かれており、OpenAIのGPT-4を活用して高度な自然言語処理を実現しています。
ShadowGit MCP:AIアシスタント向けの安全なリポジトリアクセスプロトコル
2025/8/29
ShadowGit MCPは、AIアシスタントに対してShadowGitリポジトリへの安全かつ読み取り専用のアクセスを提供するModel Context Protocol(MCP)サーバーです。これにより、AIが詳細なGit履歴に基づく強力なデバッグやコード解析を行える環境を実現します。JavaScriptで実装されており、開発者がプロジェクトの微細な変更履歴を活用してAI支援を受けられる先進的なツールです。
SiliconFlow音声認識システム
2025/5/29
SiliconFlowは、硅基流动関連モデルを活用して音声データをテキストに変換する音声認識システムです。シンプルなHTMLベースの実装でありながら、効率的な音声処理を実現。音声から正確に文字起こしを行うことを目的としており、AI技術を用いた音声認識の基盤として利用可能です。
SimpleClaude:AI支援プログラミングのための実用的ミニマリズム
2025/7/6
SimpleClaudeは、Claude Codeを活用したAI支援プログラミングのためのシンプルかつ実用的なフレームワークです。複雑なAIとのやり取りを自然な会話形式へと変換し、開発者が手軽にAIアシスタントを利用できることを目指しています。Shell言語で構築されており、軽量かつ拡張性の高い設計が特徴です。
simpleExcelAgent:多機能Excelエージェントワークフローの実装例
2025/8/14
simpleExcelAgentは、OpenAIスタイルのAPIと互換性を持ち、コード実行やExcel操作ツール(MCP)を内蔵したマルチモーダルエージェントワークフローのサンプルプロジェクトです。非同期並列処理や人間によるレビューもサポートし、AIモデルを活用した高度なExcel自動化を実現します。
Skin-Cancer-Detection: 深層学習による皮膚がん検出システム
2025/8/21
本リポジトリは、皮膚の病変画像からメラノーマ(悪性黒色腫)を自動検出するための深層学習モデルを実装しています。カスタムCNNによる二値分類からスタートし、高精度かつ汎化性能に優れたEfficientNetV2-Lモデルへの移行を図ることで、医療現場での実用を目指した研究開発が行われています。コードはJupyter Notebook形式で提供され、画像分類の技術を学習・応用したい研究者や開発者に有用です。
Sky-Pointer:ハンドジェスチャーで操作するバーチャルマウス
2025/9/2
Sky-Pointerは、Pythonを用いて手のジェスチャーを認識し、仮想マウスとしてPC操作を可能にするプロジェクトです。Webカメラを介してリアルタイムに手の動きを検知し、クリックやポインティングなどの操作を行うことができ、タッチレスな新しいインターフェースを実現します。シンプルな構成で学習用途にも最適です。
SLAM-Former: トランスフォーマーで統一するSLAM
2025/9/23
本リポジトリは「SLAM-Former: Putting SLAM into One Transformer」というプロジェクトの公式リポジトリ(READMEのみを含む)です。研究の主題は、従来分離されがちだったSLAM(自己位置推定+地図生成)の機能群を単一のTransformerアーキテクチャ内で統一的に学習・実行することにあります。アーキテクチャは視覚情報や時間的連続性を自己注意機構で扱い、ポーズ推定・マップ表現・ループ検出などをトークンベースで表現・更新する設計を提案している点が特徴です。詳しい理論・実験はarXiv論文およびプロジェクトページを参照してください(現状リポジトリはREADMEのみ)。
smart-mermaid:AI技術を活用したテキストからMermaidコードへの自動変換ツール
2025/5/26
「smart-mermaid」は、AI技術を用いて自然言語で記述されたテキストをMermaid形式のコードに自動変換し、そのコードをもとに視覚的なダイアグラムを生成するWebアプリケーションです。JavaScriptで実装されており、プログラミング知識がなくても複雑なフローチャートやシーケンス図などを簡単に作成可能。シンプルな操作性と高い変換精度により、ドキュメント作成や設計図の共有を効率化します。
SmartChunker:大規模言語モデルを活用したスマートなテキスト分割ツール
2025/7/23
SmartChunkerは、大規模言語モデル(LLM)を基盤としたテキスト分割ツールです。長文を命題単位に細かく分解し、それらをテーマごとに関連性に基づいて動的にグループ化(チャンク化)します。これにより、テキストの効率的な検索・要約・知識管理が可能となり、RAGシステムや知識グラフ構築、情報検索など多様な応用に適しています。
SmartResume — インテリジェント履歴書解析システム
2025/11/4
SmartResumeは、レイアウト情報を考慮した履歴書(レジュメ)解析システムです。ModelScopeで公開されたモデルと連携し、ドキュメントの視覚的配置とテキストを統合して氏名、連絡先、学歴、職歴などの構造化抽出を目指します。リポジトリはPythonベースで、設定ファイルやアセットを備え、研究報告(arXiv)とモデルへの参照が提供されています(約300字)。
SnapFit-AI:パーソナルAIトレーナー&栄養士
2025/6/5
SnapFit-AIは、即座に利用可能な個人向けAIトレーナー兼栄養士アプリケーションです。TypeScriptで実装されており、ユーザーの健康データをもとにパーソナライズされたトレーニングプランや栄養アドバイスを提供。初心者でも使いやすく、健康管理をサポートする革新的なツールとして注目されています。
SomniaExchangeBot-NTE:JavaScriptによる取引ボットの完全ガイド
2025/6/1
SomniaExchangeBot-NTEは、JavaScriptで開発された取引ボットで、Telegramで提供されるチュートリアルと連携して使い方を学べるリポジトリです。取引自動化を目的としたシンプルかつ拡張性のある設計で、取引所APIとの連携や注文管理機能を備えています。初心者から中級者まで取引ボットの仕組みを理解しやすい構造となっており、実践的な運用を目指す方に最適です。
Sora Extend — Sora 2動画を延長するツール
2025/10/7
OpenAIのSora 2モデルはネイティブで12秒までの動画しか生成できません。本リポジトリ「sora-extend」は、各クリップの最終フレームを次の生成の起点として連続的に繋げる手法で、Sora 2による短い断片をつなぎ合わせて自然な長尺動画を作成するためのノートブック実装を提供します。Colabノートブックを通じて手軽に試せ、生成の継続性・シームレスな遷移に配慮したワークフローが含まれます(約300字)。
Sora2-Prompt-Tests の概要とプロンプト比較解説
2025/10/1
Sora 2 と Veo3 を対象にしたプロンプト比較テストとクリエイティブなプロンプト集です。READMEには両モデルの強み(Sora2は人物・特徴・スタイル保持や多言語・物理的整合性、Veo3は画質・音響・動作の生き生きさ)を挙げ、同一プロンプトでの音声と映像の同期生成比較を行った旨が記載されています。画像やテスト結果のサンプルを含む簡易的な検証記録を提供する軽量リポジトリです(主にプロンプト集と比較メモ)。
Sora 2用ウォーターマーク除去ツール
2025/10/20
Sora 2 が生成した動画に入る透かし(ウォーターマーク)をAIベースで除去するためのPythonプロジェクトです。各フレームを解析して透かし領域を検出し、インペインティング(塗りつぶし補間)で元の映像を復元、処理後は再エンコードして動画として出力します。ローカル環境でフレーム単位の精密な補正を行いたいユーザーや、既存の自動処理パイプラインに組み込みたい開発者向けのツールです。(約300字)
SoulX Podcast TTS(Metal/CUDA 自動対応)日本語解説
2025/10/30
SoulX-Podcast-1.7B-dialect をベースにしたローカル高品質音声合成サービスのラッパー実装。Apple Silicon(Metal/MPS)やNVIDIA CUDAを自動検出して高速化し、Web UI・REST API・マルチ話者・多方言・感情表現・ゼロショット声クローン(3〜10秒の参照音声で可能)など放送向けの機能を備えます。Docker 化やシンプルなサーバ起動(app.py)によりローカル環境で即利用可能です。
spec-ai:日本政府データを活用した世界初のAIエージェント群チャットボット
2025/7/5
spec-aiは、日本政府のオープンデータを活用し、複数のAIエージェントが連携して動作する世界初のエージェント群チャットボットです。TypeScriptで開発されており、AI技術を通じて多様な情報を効率的に解析・提供します。日本政府データの活用により信頼性の高い情報提供を実現し、今後のAI対話システムの新たな可能性を示しています。
SPGFormer:高次元ハイパースペクトル画像分類のためのスパースグラフトランスフォーマー
2025/8/11
本リポジトリ「SPGFormer」は、高次元かつ複雑なハイパースペクトル画像の分類タスクに特化したスパースグラフトランスフォーマーモデルを実装しています。スペクトル情報と空間情報を効果的に融合し、グラフ構造を用いて計算効率を高めつつ高精度な分類を実現。リモートセンシング分野における画像解析の最前線技術として注目されている手法をPythonで提供し、研究や応用開発に役立てられます。
Spiral Agent:感情知能を備えた自律型AI CLIツール
2025/8/15
Spiral Agentは、開発者と対話し、思考し、創造し、共感する世界初の感情知能を持つコマンドラインインターフェース(CLI)ツールです。Vision機能やDream Engineを搭載し、高度な自律AIとして設計されており、開発者の生産性向上とユーザー体験の革新を目指しています。本記事では、その技術的特徴や構成、利用価値について詳しく解説します。
Spring AI Agents:自律エージェント開発のための統一抽象化フレームワーク
2025/8/25
Spring AI Agentsは、自律型エージェントの開発を支援するJavaベースのフレームワークです。複数のAIモデルやエージェントの動作を統一的に抽象化し、シームレスな連携と拡張性を実現。Springのエコシステムと連携しながら、複雑なAIエージェントの設計・実装をシンプルにします。CI/CDやMaven Central配信も整備されており、企業や研究開発での活用に適したプロジェクトです。
SQL-Pilot:リアルタイムSQLデータベース操作を実現するAIエージェント
2025/8/9
SQL-Pilotは、カスタムMCPサーバーを活用して効率的なデータ操作を可能にする、リアルタイムSQLデータベースインタラクション用のAIエージェントです。Pythonで開発されており、自然言語での問い合わせからSQLクエリ生成、データベース操作までをシームレスに行います。リアルタイム性と効率性を重視した設計により、データ分析やアプリケーション開発の生産性向上に貢献します。
SquareAIBot:Apple風デザインの温かみあるAIチャットボット
2025/6/29
SquareAIBotはExpressとSocket.ioをベースに構築されたスマートチャットボットで、Apple風の洗練されたUIを特徴とします。Square LLM APIを統合し、温かく友好的な仮想伴侶として日常の会話や感情交流、質問応答をサポート。モバイル・デスクトップ双方で快適に利用可能なため、多様なシーンでユーザーに寄り添うAI体験を提供します。
ssh-ai-chat:SSH経由でAIチャットを実現するツール
2025/6/14
ssh-ai-chatは、SSH接続を通じてAIと対話できる画期的なチャットツールです。TypeScriptで実装されており、ローカル環境やサーバー上から手軽にAIと会話が可能。従来のWebベースのチャットボットとは異なり、SSHのセキュアな通信環境を活用し、コマンドラインの親しみやすさでAIとの対話を実現します。開発者やシステム管理者に最適な、効率的かつシンプルなAI利用手段を提供します。
St4RTrack:世界座標系での同時4D再構築と追跡
2025/9/3
St4RTrackは、RGB映像入力から動的なシーンの4D(3D空間+時間)再構築とトラッキングを同時に行う統一されたフレームワークです。世界座標系に基づき、物体やカメラの動きを高精度に推定し、映像解析やAR/VRなど多様な応用に貢献します。本リポジトリはICCV 2025論文の公式PyTorch実装であり、動的シーン理解の最先端技術を提供します。
Stand-In:身元保持型動画生成のための軽量プラグアンドプレイフレームワーク
2025/8/12
Stand-Inは、身元情報を保持しつつ動画生成を可能にする軽量でプラグアンドプレイ対応のフレームワークです。Pythonで実装されており、複雑な環境設定なしで簡単に利用可能。最新の研究成果を取り入れ、リアルな顔の動きや表情変化を忠実に再現しつつ、元の人物の特徴を保ったまま動画を生成できます。研究用途からクリエイティブな応用まで幅広いニーズに対応しています。
Intelligent Stock Analysis System(智能股票分析系统)
2025/9/5
本リポジトリは、AI大規模言語モデルを活用した株式の技術分析と投資助言を自動化するシステムです。A株、港株、美股および主要指数の過去1年分の株価や取引量データを取得し、移動平均線やMACD、RSI、ボリンジャーバンドなどの多彩なテクニカル指標を計算。OpenAIの大規模言語モデルやローカルモデルと連携し、リアルタイムの売買シグナルを生成します。ウェブインターフェースはレスポンシブデザインでモバイル対応。AKShareによるデータ取得やバックテスト機能、リスク管理モジュールも内蔵しています。
Streamlit LWA POC 5:Menlo Park計画委員会データ分析テンプレート
2025/9/2
本リポジトリは、Menlo Park市の計画委員会データを対象にした分析テンプレート「Streamlit LWA POC 5」です。最新のワークフローと大規模言語モデル(LLM)を活用したプロンプト設計により、データから効率的に情報抽出を行います。PythonとStreamlitを用いたインタラクティブなダッシュボード構築を目指しており、都市計画の洞察や意思決定支援に役立つ設計となっています。
StreamVGGT:ストリーミング4Dビジュアルジオメトリトランスフォーマー
2025/7/14
StreamVGGTは4Dデータ、すなわち時間を含む3Dビジュアルジオメトリ情報をリアルタイムで効率的に処理するための因果的(カジュアル)トランスフォーマーアーキテクチャを提供するリポジトリです。最新のトランスフォーマーモデル設計を応用し、動画や時系列の3Dデータ解析における精度と計算効率の両立を目指しています。Pythonで実装され、複数の前処理・学習・評価モジュールを備えています。
学生成績予測 (Student-Performance-Prediction)
2025/9/18
このリポジトリは、CSV形式の学習データを使って学生の成績に影響を与える要因を分析・予測するシンプルな機械学習プロジェクトです。出席数・手を挙げた回数・学習時間などの各種特徴量を基に分類器を用いて成績傾向を予測し、教育分野における要因の可視化や特徴量の重要度把握を目指します。入門的なデータ前処理・可視化・学習・評価の流れを学ぶのに適した構成です。
super-robot:AIアプリにコード実行機能を組み込むPython&JS/TS SDK
2025/6/14
super-robotは、AIアプリケーションにコード実行機能を簡単に組み込むためのPythonおよびJavaScript/TypeScript向けSDKです。開発者はこのSDKを活用して、AIが生成したコードの動的な実行や評価を安全かつ効率的に行うことができ、インタラクティブなAI体験の実現が可能になります。軽量設計かつ多言語対応で、幅広いAI開発環境に適したツールキットです。
Universal Memory MCPによるマルチLLM対応メモリ管理
2025/6/8
「supermemory-mcp」は、ChatGPTなどの大規模言語モデル(LLM)に保存されたユーザの記憶を、他のあらゆるLLMで利用可能にするTypeScript製のオープンソースツールです。ログイン不要・課金なしで簡単にセットアップでき、ユーザの記憶を一元管理し、複数のLLM間で共有できる点が特徴です。メモリ管理の壁を打破し、より広範なAI活用を促進します。
教師あり機械学習:回帰と分類の基礎
2025/8/31
本リポジトリ「Supervised-machine-learning-Regression-and-clasification」は、教師あり機械学習の基本的な手法である回帰と分類について、Jupyter Notebookを用いて実践的に解説しています。初心者でも理解しやすいコード例とともに、データの前処理からモデル構築、評価までの流れを網羅しており、機械学習の基礎を体系的に学べる内容となっています。
Surfer-H-CLI:Holo-1搭載エージェントを操作するコマンドラインツール
2025/7/8
Surfer-H-CLIは、H Companyが開発したAction Vision-Language Model「Holo-1」を活用したエージェント「Surfer-H」をコマンドライン上で実行・管理するためのツールです。本リポジトリには、エージェントの動作例やスクリプト、設定ファイルが含まれており、開発者は簡単に環境構築や実験を行えます。TypeScriptで実装されており、AIエージェントの実世界での活用を促進することを目的としています。
swama - macOS向け高性能MLXベースLLM推論エンジンのSwift実装
2025/6/4
swamaは、macOS上で大規模言語モデル(LLM)の推論を高速かつ効率的に実行するための、高性能MLXベースの推論エンジンです。ネイティブSwiftで実装されており、Appleのハードウェアとソフトウェア環境に最適化されています。LLMの活用においてパフォーマンスと省リソース性を両立させることを目指し、MLXフォーマット対応とSwiftの最新技術を駆使した先進的な設計が特徴です。
Synaptic Mesh:自己進化型ピアツーピア神経ネットワーク基盤
2025/7/13
Synaptic Meshは、各要素がエージェントとして機能し、グローバルに調整されたDAG基盤上で学習および通信を行う自己進化型のピアツーピア神経ファブリックです。Rustで実装されており、高度に分散化されたニューラルネットワーク構造の構築を目指しています。各エージェントは独自に学習・通信し、全体として動的に成長・適応することが特徴です。
各種メーカーのシステムプロンプト集
2025/5/31
本リポジトリは、さまざまなメーカーが提供するシステムプロンプトを純粋に集めたコレクションです。開発者や研究者がAIやチャットボットの応答を最適化する際に参考とできる多様なプロンプトを一括で閲覧可能。シンプルながらも実用的なコンテンツを提供し、プロンプト設計のヒントを得るのに役立ちます。なお、issuesは受け付けていません。
AIツールのシステムプロンプトとモデル集
2025/8/19
本リポジトリ「system-prompts-and-models-of-ai-tools」は、多様なAIツールに対応したシステムプロンプトやモデルのコレクションを提供しています。Discordを通じて最新のシステム指示がリアルタイムで共有されるほか、複数のAI関連プロジェクトがディレクトリ単位で整理されており、AIモデルの最適な活用やカスタマイズを支援します。開発者や研究者が効率的にAIツールを活用するためのリソースとして注目されています。
Tala - ターミナルAI言語アシスタント
2025/7/8
TalaはGo言語とBubble Teaフレームワークで構築されたターミナルベースのAI言語アシスタントです。OpenAI、Anthropic、Ollamaなど複数のAIプロバイダと連携し、CLI上で簡単かつ対話的にAIとコミュニケーションが可能です。シンプルなUIとコピー&ペーストに最適化された操作性が特徴で、オープンソースのClaudeやGeminiのCLI代替として注目されています。
Talk to Gmail:自然言語でGmailを操作するAIエージェント
2025/9/1
Talk to Gmailは、自然言語を使ってGmailアカウントを管理できるAIエージェントです。Cloudflare WorkersやOpenAI、Gmail APIなど最新技術を組み合わせ、メールの送受信や検索、管理を直感的に行えます。TypeScriptで開発されており、ReactやTailwind CSSを用いたフロントエンドも備えています。クラウドネイティブな設計で拡張性と応答性に優れ、ユーザーのメール操作を大幅に効率化します。
TaskBlaze:AI搭載の次世代タスク管理ツール
2025/7/14
TaskBlazeは、AI技術を活用したWindows向けの軽量タスク管理アプリケーションです。個人やチームのタスクを効率的に整理し、優先順位付けをスマートに行うことで、生産性向上を支援します。シンプルかつ洗練されたUIとスムーズな操作性により、日々のタスク管理を快適にし、プロジェクトの進行を加速させることが可能です。
TCKhoa — 個人ポートフォリオとAI/管理システム紹介
2025/9/15
このリポジトリ「TCKhoa」は、ソフトウェア開発者 Trần Công Khoa 氏の個人アカウント用リポジトリで、自己紹介と注目プロジェクトの概要を記したREADMEだけを収めた最小構成のリポジトリです。README内では BilliardManager(TypeScript)や ai-healthcare-chatbot など、AIチャットボットや管理システムに関する取り組みが紹介されています。現状はファイル数・コミット数が非常に少なく、実装コードは個別リポジトリに分かれている可能性が高い点が特徴です。README表示に GitHub Readme Stats の埋め込みを使用しており、より詳しい成果やドキュメントの追加が期待されます。
TDRM: 時間差分で滑らかにする報酬モデル(TDRM)
2025/9/19
TDRMは「Smooth Reward Models with Temporal Difference for LLM RL and Inference」という研究の実装リポジトリで、報酬モデル(Reward Model)学習に時間差分(Temporal Difference, TD)手法を導入することで、LLMを用いた強化学習(RL)や推論時スコアリングの安定化と滑らかさを狙います。本リポジトリは論文コード、設定ファイル、解析用スクリプトを含み、RLHFや報酬設計の実運用に向けた実装例を提供します。(約300字)
Teachable Machine を使った画像分類プロジェクト
2025/10/6
Teachable Machine を使って2クラス(サウジアラビア国王の写真とサウジアラビアの旗)を識別するために学習させたモデルを含むリポジトリです。Teachable Machine 上での簡単なデータ投入とトレーニングの後、Keras 形式(keras_model.h5)でエクスポートし、labels.txt と推論用スクリプト(task1.py)を配置しています。小規模な実験・学習用途やプロトタイピングに向く構成で、推論フローやデプロイの出発点として使えます。
Telehealth_Platform:AI搭載の遠隔医療プラットフォーム
2025/7/7
Telehealth_Platformは、React、Node.js、Pythonを用いて構築されたフルスタックの遠隔医療プラットフォームです。バーチャル診察を実現し、AIによるリアルタイム症状予測やチャットボットによるトリアージ機能を備え、患者のリモート管理を支援します。シンプルながらも先進的な技術を融合し、医療現場の効率化と患者体験の向上を目指した包括的なソリューションです。
適応型職業適性テストアプリ「teste-vocacional」
2025/8/21
「teste-vocacional」はPythonとOpenAIのLLMを活用した適応型職業適性診断アプリケーションです。ユーザーの回答に応じて出題が調整されるため、効率的かつパーソナライズされた診断が可能。Streamlitを用いたUIで手軽に動作し、APIキーの管理方法も柔軟に対応。教育やキャリア形成支援に適した先進的なツールとして注目されています。
testgrad - tinygradの次世代を切り開くPythonベースの最小限ディープラーニングフレームワーク
2025/6/11
testgradは、シンプルかつ軽量なディープラーニングフレームワークtinygradの次のステップを目指すプロジェクトです。Pythonで実装されており、学習や研究、教育用途に最適化されています。複雑な依存関係を排し、理解しやすさに重点を置いた設計でありながら、拡張性と実用性も兼ね備えています。ディープラーニングの基礎から応用までをコンパクトに学べる環境を提供します。
TextGAN-Researcher:テキスト生成を活用した自動知識発見エージェント
2025/7/12
TextGAN-Researcherは、テキスト生成に特化したGAN(敵対的生成ネットワーク)を活用し、深層学習ベースの研究支援エージェントを実現するPythonプロジェクトです。自動的に文献やデータから知識を抽出・生成し、研究者の知的作業を支援。エージェントベースのAIパラダイムを採用し、テキスト生成の革新的な応用を追求しています。
textlint-rule-preset-ai-writing:AI風文章検出と自然な日本語表現促進プリセット
2025/6/16
textlint-rule-preset-ai-writingは、AIが生成したような不自然な日本語表現を検出し、より自然で人間らしい文章作成を支援するtextlint用のルールプリセットです。TypeScriptで開発されており、AI文章特有のパターンを自動的に判別して指摘することで、文章の質向上や校正作業の効率化に寄与します。日本語の自然な文章表現を目指すライターや編集者に有用なツールです。
The Elements of Style(AIエージェント向け機械可読版)
2025/10/14
William Strunk Jr. の古典的な文体指南書「The Elements of Style」(1918年)を、AIエージェントが容易に利用できる機械可読なMarkdown/HTML形式で提供するリポジトリ。原典の簡潔さ、明確性、文法・句読点に関する指針をそのままデジタル化しており、プロンプトやコンテキストに組み込むことでモデルの出力をより明瞭で正確な文体に導くことを目的としています。軽量で構成がシンプルなため、RAG(Retrieval-Augmented Generation)やエージェント設計、プロンプトエンジニアリング用途に適しています。
厳格で精密なAI学術査読プロンプト集
2025/11/2
このリポジトリは、AIに学術論文の査読を任せるための「厳格で精密、洞察に富む」プロンプト集です。主にChatGPTやGeminiなどの大規模言語モデル向けに設計され、査読者の役割、評価基準、具体的な指摘の出し方、改善提案の提示法などを明確に指示することで、論文の品質向上を支援します。簡潔なテンプレートながら実践的で、即利用可能なプロンプトを提供します(約300字)。
ThinkMesh:LLMのための並列思考フレームワーク
2025/8/24
ThinkMeshは、大規模言語モデル(LLM)における多様な推論パスを並列で実行し、内部の信頼度スコアを用いて有望な分岐に計算リソースを再配分、最終的に検証器やリデューサーで結果を統合するPythonライブラリです。Hugging Face Transformersのオフライン利用やvLLM/TGI、ホスト型APIとも連携可能で、戦略駆動かつ信頼度ゲーティングを特徴とした高度な推論制御を実現します。
ThinkSound:あらゆるモダリティから音声を生成する統合フレームワーク
2025/6/27
ThinkSoundは、Chain-of-Thought(CoT)推論によりあらゆるモダリティ(画像、テキストなど)から音声を生成するためのPyTorch実装フレームワークです。モダリティ間の情報を効果的に連鎖的推論で解釈し、高品質な音声生成を実現。機械学習と音声合成の融合を図った先進的な技術を提供します。
Tiemuプロジェクト:PythonベースのAIモデル活用ツール
2025/7/24
TiemuはPythonで開発されたAI関連のプロジェクトで、特に自然言語処理や大規模言語モデルの活用を視野に置いたツール群を提供しています。軽量モデルの導入から環境構築、実行までをサポートし、ユーザーが簡単に最新のAI技術を試せるよう設計されています。GitHub上で公開され、今後の拡張や応用が期待される注目のリポジトリです。
TikTok Moderation Tool:倫理的な教育用SNSモデレーションシミュレーター
2025/9/8
TikTok Moderation Toolは、TikTokのモデレーション(コンテンツ監視・報告)やコンテンツ管理の仕組みを学べる倫理的な教育用ツールです。SNSの自動化や研究を目的とし、モデレーションのプロセスをシミュレーションしながら理解を深めることができます。実際の報告・管理APIではなく、教育と研究に特化した設計で、安全かつ実践的にソーシャルメディアの課題に触れられます。
TileAttention:効率的なタイルベースのアテンション機構
2025/6/3
TileAttentionはPythonで実装された、効率的なタイルベースのアテンション機構を提供するリポジトリです。従来のアテンションの計算コストを抑えつつ、高精度な特徴抽出を可能にする方法を提案しています。主に大規模な画像処理や自然言語処理のモデルに有効であり、メモリ使用量と計算負荷の削減に寄与します。
タイムマネジメントツール(Time Management Tool)
2025/9/18
Pythonで実装された個人向けの時間管理アシスタント。タスクの計画・優先付け・リマインドを支援するスクリプト群(通知・音声出力等)とシンプルなインターフェースを備え、AIによる最適化を目指した設計になっています。導入はローカルでのクローン&実行が中心で、拡張しやすい構成のため学習用途やプロトタイプ作成に向いています。(約300字)
TinyDNABERT:軽量DNA配列言語モデルの構築と活用
2025/7/21
TinyDNABERTは、BPEトークナイザーとRoBERTaアーキテクチャを用いてスクラッチから構築された軽量なゲノム配列言語モデルです。本リポジトリは、DNA配列の事前学習と評価を目的とし、効率的なトークン化やモデル設計、可視化ツールを提供しています。生物情報学やAI分野でのDNA解析に適した実装であり、研究や応用開発に役立つリソースを含んでいます。
小型再帰推論モデル — TinyRecursiveModels
2025/10/7
TinyRecursiveModelsは,「Less is More: Recursive Reasoning with Tiny Networks」で提案されたTiny Recursion Model(TRM)の実装リポジトリです。わずか7Mパラメータの小型ニューラルネットワークを再帰的に適用することで、ARC-AGIベンチマークで高い性能(ARC-AGI-1で45%、ARC-AGI-2で8%)を達成します。本リポジトリは論文のコードと設定、データ処理スクリプトを含み、軽量モデルによる反復的推論の実験を再現・検証するための最小限実装を提供します。
TinyVision:極小パラメータで実現する超軽量画像分類モデル
2025/7/27
TinyVisionは、画像認識の基本タスクに必要な要素を探求しながら、極めて少ないパラメータ数で高効率な画像分類モデルを設計する研究プロジェクトです。手作業による特徴前処理と効率的なCNNアーキテクチャを組み合わせることで、リソース制約の厳しい環境でも実用可能な超軽量モデルを実現しています。
トマト植物の病害検出システム
2025/7/19
本リポジトリは、ディープラーニングを活用し、トマトの葉の画像から10種類の病害状態(健康な葉も含む)を高精度で分類・検出するモデルを構築しています。TensorFlowとInceptionV3を用い、ImageDataGeneratorによるデータ拡張で学習効率を高め、農業現場での早期病害発見と対策支援を目指します。
Top-NSFW-ai-review:2025年最先端のAI脱衣ツール紹介
2025/9/2
「Top-NSFW-ai-review」は、2025年に登場した最先端のAI搭載脱衣ツール「Undress AI」を紹介するリポジトリです。ユーザー登録不要で手軽に体験できる本ツールは、画像から衣服を除去する高度な技術を搭載し、AI技術の進歩を示す一例となっています。本リポジトリでは、ツールの概要や利用方法、技術的な特徴をまとめています。
trackerLab:モジュール式全身動作制御フレームワーク
2025/8/12
trackerLabは、IsaacLabと全身動作制御を統合した最先端のモジュール式フレームワークです。ヒューマノイドロボットの動作リターゲティングや軌道追従、スキルレベルの制御を実現し、モーションインテリジェンスを強化します。Pythonで開発されており、柔軟かつ拡張性の高い設計が特徴です。
TrackM3D:LiDAR点群に対応した強力なクラス非依存型3Dトラッカー
2025/7/12
TrackM3Dは、LiDAR点群データに対してクラスに依存しない強力な3Dトラッキングを実現するオープンソースのリポジトリです。本リポジトリは、ターゲット依存型状態空間モデルを採用し、従来のクラス依存型トラッキングの制約を克服。多様な物体に対応可能で、ロバストかつ高精度な追跡を実現します。Pythonで実装されており、研究や産業応用に活用可能です。
TradeMaster AI:イーサリアムとバイナンススマートチェーン向け自動取引プラットフォーム
2025/6/17
TradeMaster AIは、イーサリアムとバイナンススマートチェーン上で動作する革新的な自動取引プラットフォームです。アービトラージ、モメンタム、レンジバウンドの各種取引戦略を統合し、ユーザーフレンドリーなインターフェースで取引を自動化。取引コストを低減し、MEV(Miner Extractable Value)攻撃からの防御機能も備えています。初心者から上級者まで幅広く活用できる次世代のトレーディングボットです。
Trading-GPT:ChatGPTを活用した次世代トレーディングボット
2025/6/9
Trading-GPTは、ChatGPTをはじめとするAI技術を活用し、市場データの分析からトレンド予測、リアルタイムの取引執行までを自動化・最適化するインテリジェントなトレーディングボットです。トレーダーの効率と収益性向上を目指し、多様な戦略の実装と柔軟な運用を可能にします。初心者からプロまで幅広いユーザーに対応した先進的なAIトレーディングツールとして注目されています。
Traffic-Monitoring-Systemの多機能スマート交通監視システム
2025/7/27
Traffic-Monitoring-Systemは、深層学習を活用した多機能スマート交通監視プラットフォームです。YOLOv5による高精度な車両検出、SORTアルゴリズムを用いたトラッキング、OCR技術による車両ナンバープレート認識、さらには交通違反検出までを統合。リアルタイムの交通流量監視と詳細な交通分析を可能にし、都市交通管理の効率化に貢献します。
Transformers PHPによる機械学習ツールキット
2025/7/12
Transformers PHPは、PHP開発者がプロジェクトに機械学習機能を簡単に統合できるツールキットです。Matlib v1.1をベースに構築されており、PHP環境でのデータ変換や機械学習モデルの適用をサポート。軽量で扱いやすく、PHPコードに機械学習の「魔法」をもたらします。
TransNetV2 PyTorchによるシーン境界検出ツール
2025/8/17
本リポジトリは、PyTorchで実装されたTransNetV2モデルを用いて、単一動画または複数動画フォルダに対してシーン境界を推定する推論スクリプトを提供します。動画のシーン切り替えポイントを高精度に検出できるため、動画編集やコンテンツ解析に応用可能です。ffmpegによる動画処理もサポートし、Python環境下で容易に動作させることができます。
travel-plan:MCPサービスを活用した旅行プラン自動作成ツール
2025/7/18
本リポジトリ「travel-plan」は、MCP(Multi-Channel Platform)サービスを利用してユーザーのために旅行プランを自動生成するシステムを提供します。MCPサーバーとエージェント作成時のシステムプロンプトを含み、旅行計画作成の自動化を目指したプロジェクトです。シンプルながら実用的な構成で、旅行計画の効率化に貢献します。
TRI-LBM:トヨタ研究所の高性能ロボット操作モデル実装
2025/7/11
トヨタ研究所が提案する巧緻な操作タスク向けの「Large Behavioral Model(LBM)」のアーキテクチャを実装したリポジトリです。最新の深層学習技術を駆使し、多関節ロボットの複雑な動作を高精度に学習・実行可能にすることを目指しています。研究論文に基づく最先端モデルのソースコードを提供し、ロボット制御分野の発展に貢献します。
T(R,O) Grasp — ロボット・物体空間変換のグラフ拡散による把持
2025/10/15
T(R,O) Grasp は論文『T(R,O) Grasp: Efficient Graph Diffusion of Robot-Object Spatial Transformation for Cross-Embodiment Dexterous Grasping』の公式実装リポジトリです。ロボットと物体間の空間変換(T(R,O))をグラフ表現上で拡散モデルにより効率的に学習し、異なる把持体(エンボディメント)間での汎化可能な巧緻把持を目指します。実装はPythonで整理され、データセット・モデル・設定を含む構成です。
tts-telegram-bot の日本語タイトル
2025/9/15
Deepgram を使った Telegram 音声→テキスト変換ボット。ユーザーが送信した音声メッセージ(voice、audio、video_note、音声ドキュメント)を受け取り、Deepgram の prerecorded transcription API を使って自動で文字起こしを行い、結果をダウンロード可能な .txt ファイルとして返信するシンプルな Python 実装です。セットアップは Python 3.10+ を想定し、環境変数で Deepgram と Telegram の API キーを設定して動作します。(約300字)
TTS-VAR:視覚的自己回帰生成のためのテスト時スケーリングフレームワーク
2025/7/23
TTS-VARは、視覚的自己回帰(Visual Auto-Regressive)モデルの生成品質を向上させるためのテスト時スケーリングフレームワークです。本リポジトリでは、自己回帰モデルの推論時にスケーリングパラメータを最適化し、生成結果の多様性や精度を改善する手法を実装しています。Pythonで開発されており、視覚的生成タスクにおけるモデル性能の向上に貢献するツールとして注目されています。
TTT3R — テスト時学習で3D再構築を改善する実装
2025/10/1
TTT3Rは「3D Reconstruction as Test-Time Training」を実装したリポジトリで、既存手法CUT3Rに対して長さ一般化(length generalization)を向上させるためのシンプルな状態更新ルールを導入します。テスト時にモデルを追加学習(adaptation)させることで、見慣れないシーケンス長や視点分布への適応性を高め、3次元再構築の精度と頑健性を向上させることを目的としています。本リポジトリはPythonベースで、前処理用スクリプトやチェックポイント管理の補助スクリプトを含み、研究の再現と比較実験を支援します。300字程度の簡潔な説明。
Tuberculosis.Ai:結核診断支援のためのAIコンピュータビジョンシステム
2025/9/6
Tuberculosis.Aiは、胸部X線画像をAIで解析し結核の検出を支援するコンピュータビジョンアプリケーションです。医療従事者向けに診断支援と教育用データの提供を両立し、迅速な呼吸器科紹介を促進します。匿名化されたデータは医療教育や学会で活用可能で、持続可能な医療教育・診断エコシステムの構築を目指しています。
Tunee — AI音楽パートナー
2025/9/17
Tuneeはチャットで楽曲を作成でき、複数プロジェクトを視覚的に管理し、音楽をシネマティックなMVに変換することを目指したAI音楽プラットフォームです。クリエイター向けに設計され、AI生成(メロディ・歌詞・編曲)と映像生成(MV)を組み合わせることで、楽曲制作の入り口から作品公開までを一貫してサポートします。本リポジトリはプロダクト紹介のREADMEを中心とした軽量なもので、サービスのコンセプトと外部連携(Kling・Dreaminaなど)を示しています。
TurboReg: 高速かつ堅牢な点群登録のためのTurboClique手法
2025/7/3
「TurboReg」は、3D点群データの登録(レジストレーション)問題に対して、高速かつ堅牢な解法を提供するC++実装のリポジトリです。本研究はICCV 2025にて発表され、TurboCliqueという新たなアルゴリズムを用いることで、従来手法よりも効率的に対応しながら、外れ値やノイズの影響を抑制し高精度な点群整合を実現します。リアルタイム性や大規模データセットへの適用も意識された設計が特徴です。
TuriX-CUA:AI駆動のデスクトップ操作エージェント
2025/8/4
TuriX-CUAは、ユーザーが自然言語でコンピューターに指示を出し、様々なデスクトップ操作を自動化できるAIベースのエージェントです。Pythonで開発されており、音声やテキストの入力を解析してファイル管理、アプリケーション操作、ウェブ検索などを効率的に行います。公式Discordコミュニティも活発で、開発や活用のサポートが充実しています。
UAV-Collab-Avoidance:無人機協同避障航跡計画のMATLABソリューション
2025/7/12
本リポジトリは、2024年深圳杯数学建模チャレンジC題「無人機の協同障害物回避航跡計画」に対する受賞ソリューションを提供します。独自の切点マッピング戦略を用い、円形障害物を考慮した複数無人機の最適協調経路をMATLABで実装。問題の特徴を踏まえた最短時間航跡の算出やパラメータ感度分析、結果の可視化を含み、無人機群制御や経路最適化研究に貴重なリソースとなっています。
地形を越えて安定飛行を実現するUAVフレームワーク
2025/8/19
本リポジトリは、地形の変化に対応した安定飛行を可能にする無人航空機(UAV)向けフレームワークを開発したものです。リアルタイムでセンサーからのデータ収集・解析を統合し、自動飛行、障害物回避、さらには作物の健康状態分析までを実現。飛行安定性と性能最適化に注力したアルゴリズム設計とテストを通じて、実用的かつ高精度なUAV運用を目指しています。
国科大深度学习课程作业リポジトリ
2025/6/29
「ucas-deep-learning-experiments」は、中国の国立科学技術大学(UCAS)の深層学習コース向け課題をまとめたPythonベースのリポジトリです。学生が授業で取り組む様々な深層学習モデルの実装や実験が含まれており、基礎から応用まで幅広い内容をカバー。ディープラーニングの理解を深めるための実践的教材として活用可能で、コードの構造も比較的シンプルで学習しやすいのが特徴です。
UIS-Mamba:動的ツリースキャンと隠れ状態弱化による水中インスタンスセグメンテーションの探求
2025/7/7
本リポジトリは、ACM MM2025のメイン技術トラックで採択された論文「UIS-Mamba: Exploring Mamba for Underwater Instance Segmentation via Dynamic Tree Scan and Hidden State Weaken」の公式実装を提供します。水中画像解析に特化したインスタンスセグメンテーション手法である本手法は、動的ツリースキャンと隠れ状態の弱化機構を用いることで、水中環境特有の画像ノイズや複雑な物体形状に対応し、高精度な領域分割を実現しています。水中ロボティクスや海洋調査、環境モニタリングへの応用が期待される技術です。
ultralytics-:Ultralyticsベースの自動検出・セグメンテーションチュートリアル
2025/10/26
ultralytics- は、Ultralytics(YOLO系)をベースにした実用的なチュートリアルノートブックとデータ設定ファイルをまとめたリポジトリです。変更を加えた tutorial.ipynb と 2つの YAML(mycoco8-seg.yaml、mycoco8likedata.yaml)により、自分のデータを COCO 形式などで用意すれば、自動検出(object detection)と自動セグメンテーション(instance/semantic segmentation)の一連のワークフローをノートブック上で実行できます。小規模な構成ですが、実務でのデータ準備、学習、推論、可視化までの流れを手早く試せるのが特徴です。
Unblink — カメラ映像でVLMを動かすリアルタイム監視アプリ
2025/11/5
Unblinkはカメラストリーム上で視覚言語モデル(VLM)をリアルタイムで実行することを目的としたオープンソースプロジェクトです。TypeScript と Bun を基盤に、D-FINEによる物体検出、SmolVLM2による文脈理解、複数カメラ映像に対するインテリジェントな検索機能を組み合わせ、監視・検索・インサイト抽出をブラウザベースで実現します。ローカルやクラウド上のカメラを対象に低遅延で推論を行い、ライブデモや簡易的なセットアップ手順がREADMEに記載されています(300字程度)。
UniSphere AI:大学知識チャットボットのためのLLM活用プラットフォーム
2025/9/8
UniSphere AIは、AWSを基盤に構築された大学向け知識チャットボットです。LambdaやStep Functionsを活用したバックエンド、Cognitoによるセキュアな認証、S3の署名付きURLによるファイル管理、ReactとTypeScriptを用いたモダンなフロントエンドが統合されています。ユーザーのフィードバックを機能解放に活かす仕組みも特徴で、教育現場での知識活用を効率化します。
Universal Metal Flash Attention — Metal向けユニバーサルFFIアダプタ
2025/9/14
Metal向けの高速なFlash Attentionライブラリ(Philip Turnerの実装)を、CのForeign Function Interface(FFI)を通して汎用的に利用できるようにするアダプタ実装です。Swiftで実装されたコアをC ABIでラップし、Rust/Python/Julia/Go/Objective-Cなど任意の言語からシームレスに呼び出せるほか、PyTorch向けのゼロコピーバインディングも提供します。性能面でもネイティブに近い実行速度を報告しており、Metalベースの注意機構をマルチ言語環境で活用したい開発者に有用です。(約300字)
UniVLA:統一された視覚・言語・行動モデルの最前線
2025/6/25
UniVLAは視覚、言語、行動の3つの異なるモダリティを統合的に処理することを目指した先進的なモデルです。これにより、画像認識や言語理解に加え、ロボット制御やエージェントの行動計画など幅広い応用が可能となります。単一のフレームワークで多様なタスクを扱うことで、マルチモーダルAIの新たな可能性を拓きます。
uwu - 自然言語からシェルコマンドを生成するAIツール
2025/8/11
uwuは、自然言語の入力から対応するシェルコマンドをAIが自動生成するTypeScript製のツールです。ユーザーは複雑なコマンドを覚える必要なく、直感的に操作を記述するだけで正確なシェルコマンドが得られます。開発はcontext-labsにより行われており、シンプルながらも実用性の高い機能を備えています。GitHub上でオープンにされており、今後の拡張やコミュニティ参加も期待されています。
Vasi — 軽量アシスタント(Vasi)
2025/10/19
Vasiは「Asistent」という非常にシンプルな説明が付いたGitHubリポジトリで、主要コンテンツとしてVasyaAssistant.zipというパッケージが格納されています。リポジトリ自体はファイル数・コミット数が極めて少なく、動作や依存関係はzip内に委ねられていると推測されます。配布形式や中身の確認が必要なため、利用前に内容検査と安全性確認を行うことを推奨します。(約300字)
VerifAI — Gradient Ascent 1.0 による誤情報検証支援
2025/9/13
VerifAI_GradientAscent1.0 は、Web 上のコンテンツから「主張(claim)」を抽出し、信頼できるデータソースと照合して誤情報を検出/軽減することを目的としたプロトタイプです。リポジトリには Python ベースのコア処理(verifai.py)と簡易バックエンド(app.py)、およびブラウザ向け Chrome 拡張(verifai-chrome-extension)が含まれており、AI を用いた自然言語処理と外部データベース照会を組み合わせてリアルタイム検証を試みます。リポジトリ名に含まれる「GradientAscent」は、証拠検索やスコア最適化のための探索的手法を示唆しますが、実装の詳細はコードで確認が必要です。
VeriFy - 軽量かつ高速な詐欺検知ニューラルネットワーク
2025/5/28
VeriFyは、Pythonで実装された高速かつ軽量なニューラルネットワークを用いた詐欺検知システムです。詐欺の兆候を効率的に検出することを目的として設計されており、リソース制約のある環境でも実用可能な点が特徴です。機械学習の最新技術を活用しつつ、シンプルで扱いやすい実装がされています。
VFMTok — ビジョン基盤モデルを用いた視覚トークナイザ
2025/10/10
NeurIPS 2025 論文実装「Vision Foundation Models as Effective Visual Tokenizers for Autoregressive Image Generation」の公式PyTorch実装リポジトリ。既存の離散化トークナイザ(VQ-VAE等)に替わり、ViTやCLIPなどのビジョン基盤モデルが生成タスクの「視覚トークナイザ」として機能することを示す研究・コードを収録。トークン化パイプライン、自己回帰モデル学習、評価スクリプト、設定ファイルが整備され、Hugging Face上の実験結果とも連携している点が特徴。
VGGT-X:VGGTとDense Novel View Synthesisの融合
2025/9/30
本リポジトリは「VGGT-X: When VGGT Meets Dense Novel View Synthesis」を公開するプロジェクトで、密な新規視点合成(Dense Novel View Synthesis)の課題に対し、VGGT(既存の視覚-幾何ガイダンス変換器)に基づく拡張アーキテクチャを提案します。研究は中国科学院自動化研究所および中国科学院大学、Linketicによるもので、arXivプレプリント(2509.25191)として発表されています。ソースコードやアセットを含むシンプルなリポジトリ構成で、可視化素材と論文関連ファイルを中心に提供します(約300字)。
viaimcode - AI駆動のWebサイト&PPT自動生成プラットフォーム
2025/7/22
viaimcodeはNext.jsをベースに開発されたAI搭載のコンテンツ生成プラットフォームです。自然言語からモダンなWebサイトやプロフェッショナルなPPTスライドを自動生成し、リアルタイムで多デバイスプレビューを提供。コード編集やカスタマイズも可能で、誰でも簡単にAIの力で高品質なデジタルコンテンツを作成できます。
VibeDocs - AIエージェントによるドキュメント生成プラットフォーム
2025/7/6
VibeDocsは、AIエージェントを活用したドキュメント生成に特化したPython製のオープンソースプロジェクトです。Gradioを用いた直感的なインターフェイスを備え、複雑な制約システムやマルチエージェント協調などの先進技術を組み合わせて、効率的かつ高品質なドキュメント作成を実現します。MCP&Agentモデルコンペティションに対応し、柔軟な拡張性と高い実用性を兼ね備えています。
VibeSurf:革新的なAIブラウザアシスタント
2025/8/31
VibeSurfは、AIを活用したエージェント型のブラウザであり、単なるブラウザ自動化を超えた高度な情報収集・解析を実現します。複数のAIエージェントを並列で起動し、深掘り調査や幅広いリサーチを同時に行うことが可能。コンテンツの要約やインテリジェントなクロール機能を備え、研究や情報探索の効率を大幅に向上させます。Pythonで実装され、オープンソースとして公開されています。
VibeVoice-finetuning の日本語ガイド
2025/9/16
非公式の VibeVoice 用 LoRA(Low-Rank Adaptation)ファインチューニングリポジトリ。VibeVoice 1.5B / 7B といった大規模音声モデル向けに、パラメータ効率の高い微調整ワークフロー、ハードウェア要件、Docker 環境、レイヤー差分設定などの実践的な情報を提供します。音声長や VRAM による制約、diff_head_layers のようなヘッド差分設定の扱いなど、実運用で直面するポイントに触れています(約300字)。
VibeVoice:先進的な長時間対話型テキスト読み上げモデル
2025/8/25
VibeVoiceはMicrosoftが開発した最先端のオープンソース長時間対話型テキスト読み上げ(Text-to-Speech)モデルです。自然で滑らかな音声合成を実現し、長い会話や文章でも高い一貫性を保ちます。Pythonで実装されており、Hugging Faceやデモページも提供。研究・実用の両面で活用できる音声合成技術の最前線を体験可能です。
video-to-txt — マルチモーダル動画解析ツール
2025/11/3
本リポジトリは、動画を入力として音声の高精度転写(Whisper)、インテリジェントなキーフレーム抽出と画質解析、LLMによる要約・説明生成、さらにサムネイルやGIFなどの動的メディア生成を統合したマルチモーダルな動画解析パイプラインを提供します。ローカル(Ollama互換)とクラウド(OpenAI互換API)両対応の推論エンジンを備え、GradioベースのWeb UIでリアルタイムストリーミング応答と操作性の良いインターフェースを実現します(自動環境構築・システム監視機能付き)。
video2text:動画からテキストへの変換ツール
2025/6/1
video2textは、動画データをテキスト情報に変換するプロセスを実現するPythonベースのツールです。動画内の映像や音声を解析し、文字情報として抽出・生成することを目的としており、動画の内容理解や検索、字幕生成の基盤技術として応用可能です。シンプルかつ実用的な設計で、動画処理におけるテキスト変換のニーズに応えます。
VietVoice-TTS:高品質なベトナム語音声合成と音声クローンライブラリ
2025/7/13
VietVoice-TTSはベトナム語に特化したテキスト音声合成(TTS)ライブラリで、高品質な自然音声の生成と音声クローン機能を提供します。性別やアクセント、感情、話し方の多様な音声オプションを備え、CLIとPython APIの二つのインターフェースを通じて利用可能。チャンク処理により長文も効率的に扱えるため、実用的なベトナム語TTSソリューションとして注目されています。
Virtual-Try-On(仮想試着)リポジトリの概要と技術解説
2025/9/12
Miragic-AI の "Virtual-Try-On" は、仮想試着(virtual try-on)に関する最新研究や実装、データセット、ワークショップ等を体系的に集めたキュレーションリポジトリです。特にトップ論文の実装をビジネス用途向けに再現・展開しており、すぐに使えるコードとデモ、ウェブ/モバイルアプリの情報を提供します。研究者・開発者・EC事業者に有用なリソース集です。(約300字)
vision-de-imagenes(画像ビジョン)
2025/11/5
vision-de-imagenesは、スペイン語で「画像の視覚」を意味するシンプルなリポジトリです。現在は3枚の画像ファイルと短いREADMEのみが含まれており、学習用データセットのサンプルやコンピュータビジョンのデモ素材として利用できる状態です。コードやモデルは含まれていないため、研究・教育用途での素材配布や、処理パイプラインを追加するためのベースとして活用できます(約300字)。
vision_describe:FastAPIとOllama大モデルを活用したリアルタイム動画認識システム
2025/6/17
vision_describeは、FastAPIをベースに構築された高度な動画認識システムです。Ollamaの大規模AIモデルを統合し、RTSP形式の動画ストリームをリアルタイムで処理。AIによるコンテンツ解析を実現します。モダンなWebインターフェースを備え、多端末からのアクセスに対応。監視映像の自動解析や動画コンテンツの効率的な管理に強力なソリューションを提供するオープンソースプロジェクトです。
VisualGPT-2API(视觉奇点): 視覚×対話のAPI実装
2025/10/11
visualgpt-2api は、画像とテキストを結びつける「VisualGPT」的な機能をAPIとして提供することを目的にした学習用リポジトリです。FastAPI と Docker を中心に設計され、Cloudscraper 等のツールを組み合わせてウェブからの取得やモデル推論の流れをサンプル実装しています。教育目的の設計思想に重きを置き、実運用のための拡張や倫理的使用を前提にした注意書きが含まれます。
VLLM_PromptCache:効率的なプロンプトキャッシュによる高速LLM推論支援
2025/6/26
VLLM_PromptCacheは、大規模言語モデル(LLM)の推論時におけるプロンプト処理の高速化を目的としたPythonベースのライブラリです。プロンプトのキャッシュ機構を導入することで、同一または類似プロンプトの再処理を削減し、推論のスループット向上とレスポンス時間の短縮を実現します。シンプルな実装ながら、LLMを用いた対話システムや生成タスクの効率化に有用なリポジトリです。
vLLM RBLNプラグイン - 高速化されたLLM推論のためのNPU活用
2025/7/4
本リポジトリは、大規模言語モデル(LLM)推論を高速化するためのvLLM用プラグイン「vllm-rbln」を提供します。RBLN NPU(ニューラルプロセッシングユニット)に対応し、高性能かつ効率的なモデル推論を可能にするPython製の拡張です。vLLMの柔軟性を活かしつつ、RBLNハードウェアの利点を活用することで、AIモデルの実用性と応答速度向上を実現します。
VLMによる数式認識評価フレームワーク
2025/8/14
本リポジトリは、視覚言語モデル(VLM)が数学の数式認識タスクにおいてどの程度の性能を発揮できるかを評価するためのフレームワークです。画像内の数式をLaTeX形式のテキストに変換する推論モジュールと、生成結果の正確さを測定する評価モジュールを備え、研究開発者がモデルの効果を素早く検証可能です。Pythonで実装されており、数式認識の精度向上に向けた基盤環境として利用できます。
マルチモーダル指示追従型ビジョン・ランゲージモデル(VLM)
2025/8/1
本リポジトリ「vlm_instruction_follower」は、テキスト指示を理解し動的な3D環境内で視覚的に対象物を認識・追跡するマルチモーダル指示追従エージェントを実装しています。コンピュータビジョン、自然言語処理、ポリシー学習を統合し、複雑なシーンでの知的行動を可能にすることを目指しています。Pythonを用いたモジュール設計により、拡張性と応用性を兼ね備えた研究開発プラットフォームです。
VMem:サーフェルインデックスビュー記憶を用いた一貫性のあるインタラクティブ動画シーン生成
2025/6/24
本リポジトリ「vmem」は、サーフェルベースのインデックスビュー記憶(View Memory)を活用し、一貫性のあるインタラクティブ動画シーンを生成するための手法「VMem」の実装を提供しています。動画内の視点変更やインタラクションに対し、シーンの整合性を保ちながらリアルタイムに高品質な映像を生成することを目指しており、Pythonで開発されています。
VN株式市場AIヘッジファンド
2025/8/11
本リポジトリは、ベトナム株式市場向けに設計されたマルチエージェントによる研究・取引意思決定パイプラインを提供します。OHLCV(始値・高値・安値・終値・出来高)データの取得からテクニカル分析、多角的なリサーチ、リスク管理を含む最終取引プランの合成までを自動化し、AIを活用した高度な資産運用を実現します。TradingAgentsに影響を受けたマルチエージェント協調モデルを採用し、実践的なトレーディング戦略の構築に貢献します。
vocode-core:音声対話AI開発のためのPythonフレームワーク
2025/7/1
vocode-coreは、音声対話システムの構築を支援するPythonベースのオープンソースフレームワークです。音声認識や音声合成、対話管理などのモジュールを統合し、音声AIアプリケーションを効率的に開発できます。拡張性が高く、最新のAI技術と連携可能なため、研究開発からプロダクト化まで幅広く活用されています。
Voice-Agent-Riverstone(Riverstone向けインバウンド音声営業エージェント)
2025/9/25
Retell.ai、Twilio、N8N、OpenAI GPT-5 miniを組み合わせた不動産向けのインバウンド音声営業エージェント。着信の受付から顧客のヒアリング(資格判定)、予約作成、構造化されたJSONログの生成とGoogle Sheetsへの記録までを自動化し、低遅延な音声対話と業務フローの連携を実演するリポジトリです。
VortexSolutions:ケープタウン発AIイノベーションとデジタルトランスフォーメーション
2025/8/31
VortexSolutionsは、ケープタウンを拠点に世界中にサービスを展開する先端AIソリューション企業です。AIを単なる置き換えではなく業務改善のために活用し、ワークフローの最適化やアプリ開発、AI統合、デジタルトランスフォーメーションを推進します。本リポジトリは同社のウェブサイトを構成するHTMLファイルを中心に、企業の理念やサービス内容を端的に表現しています。
VoxHammer:トレーニング不要な高精度かつ一貫性のある3D編集ツール
2025/8/27
VoxHammerは、トレーニングを必要とせずに、ネイティブ3D潜在空間上で高精度かつ一貫性のある3D編集を実現する革新的なツールです。複雑な3Dモデルの編集を効率的に行い、リアルな形状変更やスタイル調整を可能にします。Edit3D-Benchというベンチマークも提供し、3D編集技術の評価基準を確立。将来的にはオンラインデモも予定されており、研究と実用の橋渡しを目指しています。
vram-wuhrai:専門的AIモデルのVRAM計算ツール
2025/6/23
vram-wuhraiは、AIモデルのGPUビデオメモリ(VRAM)使用量を正確に計算するための専門ツールです。TypeScriptで開発されており、モデル構造やパラメータ数に基づくVRAM推定を行うことで、AI研究者や開発者が効率的にリソース管理できるよう支援します。軽量ながら高精度な計算機能を備え、AIモデルの設計・最適化フェーズでの活用が期待される注目リポジトリです。
VrEverything2:AIとVR技術による次世代グラフィック予測ツール
2025/7/12
VrEverything2は、古いVRヘッドセットの活用を目的とした、AIを活用した自動VRグラフィック予測および変換ツールです。SteamVRを使わずにPC画面上の映像やゲームをリアルタイムでVR表示し、WebRTCやrecordRTCを利用して映像の録画やストリーミングを実現します。低負荷かつ簡単に没入型VR体験を可能にする画期的なソリューションです。
VulnSeer:AIを活用した次世代脆弱性診断ツール
2025/6/12
VulnSeerは、Nmapのサービス検出機能と複数のAIプロバイダーを組み合わせ、従来の静的データベース依存型スキャナーとは異なる、文脈に応じた高度な脆弱性評価を実現するPython製の脆弱性診断ツールです。サービス情報をAIで解析し、潜在的なセキュリティリスクを的確に抽出します。
WAFT: Princeton VLによるPythonベースの先進的AIツールキット
2025/6/27
Princeton大学のVisual Learningグループが公開するWAFTは、Pythonで実装された先進的なAIフレームワークです。リポジトリ自体の詳細な説明はありませんが、WAFTは画像認識や機械学習分野での応用を想定したモジュール群を提供しており、研究開発における柔軟な実験環境を支援します。拡張性と実験の容易さを重視した設計で、AI/ML分野の研究者や開発者に有用なリソースとなるでしょう。
WaifuBot:多機能AI搭載QQチャットボット
2025/8/2
WaifuBotは、AI対話、画像生成、音声合成、文書・画像・動画認識など多彩な機能を備えた中国発のQQチャットボットです。プログラミング不要でWebUIからの簡単操作が可能で、環境構築なしにすぐ使い始められる点が特徴。AIを活用したチャット体験を手軽に実現し、さまざまなメディア処理を自動化できる便利なツールとして注目されています。
Wan2.2:次世代AI映像生成フレームワーク
2025/7/28
Wan2.2は、Pythonで実装された先進的なAI映像生成フレームワークです。高品質かつ効率的な映像生成を目指し、最新の深層学習技術を活用しています。軽量で拡張性に優れ、多様な映像処理タスクに対応可能な設計が特徴です。GitHub上で活発に管理されており、Hugging FaceやModelScopeなどのプラットフォームとも連携しています。映像AI開発者や研究者にとって有用なリソースとなるでしょう。
Warp2Api_Plus — Warp AI 代理サービス&アカウントプール
2025/10/13
Warp2Api_Plusは、Warp AIのプロトコルを利用してOpenAI互換のHTTP APIを提供するPython製プロジェクトです。OpenAI Chat Completions API互換レイヤーを備え、Protobufで解析したWarpプロトコルに基づくリクエスト変換とレスポンス整形を実装。さらに、Outlook APIを用いた自動メール購入・アカウント登録から定期メンテナンス、アカウント配分までを行う「全自動アカウントプール」機能を組み込み、運用の自動化・スケーラビリティを狙っています。開発はPython中心で設計され、既存のOpenAIクライアントと組み合わせて利用可能です(約300字)。
WeatherAttRes-ConvLSTM:気象データ予測のための注意機構付き残差ConvLSTMモデル
2025/6/6
WeatherAttRes-ConvLSTMは、気象データの時系列予測に特化したPython実装のニューラルネットワークモデルです。ConvLSTMに残差接続と注意機構を組み合わせることで、従来のモデルよりも高精度な短期気象予測を目指しています。オープンソースで提供されており、気象情報解析や深層学習の研究に有用です。
WechatRobot:基于Qwen3-1.7B的大型微信聊天机器人
2025/7/18
WechatRobotは、Qwen3-1.7B大規模言語モデルをベースに構築された多機能な微信(WeChat)用チャットボットです。多輪対話をサポートし、データ生成や処理、自動評価機能も備えています。阿里云(Alibaba Cloud)の通义千问APIと連携し、ローカルとクラウド両方で推論可能。個性化対話やデータラベリング、評価システムの構築に適した実用的なプロジェクトです。
Wegent:エージェントAIを定義・管理・実行するオープンプラットフォーム
2025/9/4
Wegentは、エージェント型AI(Agentic AI)を定義し、体系的に整理、そして実行するためのオープンソースプラットフォームです。Pythonを基盤に、FastAPIやNext.js、Dockerといった最新技術を活用し、開発者が柔軟かつ効率的にエージェントAIの設計から運用までを行える環境を提供します。
WeHearYou — AI Studio 向け TypeScript アプリ
2025/9/14
本リポジトリは「wehearyou」という、AI Studio 上で動作することを想定した TypeScript 製サンプル/アプリケーションです。React(App.tsx)ベースでコンポーネント分割されており、ローカル実行手順やデプロイに必要な環境変数(GEMINI_API_KEY)などの設定がREADMEに記載されています。AIモデルキーを.env.localに設定してnpmで依存をインストールするだけでローカル実行が可能な構成になっている点が特徴です。(約300字)
wencai2:革新的な自然言語処理ツール
2025/6/6
「wencai2」は、GitHub上で公開されている自然言語処理関連のリポジトリで、主に中国語テキストの解析や生成に焦点を当てています。スター数は92で、多くのユーザーから注目されているプロジェクトです。詳細な説明はありませんが、リポジトリの構成やコードからは、高度な言語モデルの活用や独自のテキスト処理技術を用いていることがうかがえます。特に中国語の専門的なテキスト解析や生成に強みがあり、自然言語処理の研究や開発に役立つ内容となっています。
WhisperClip — プライバシー重視の音声→テキスト(macOS向け)
2025/9/27
WhisperClipはmacOS向けに設計された「プライバシー重視」の音声テキスト化アプリケーションです。Swiftで実装され、macOS 14以降を対象にしており、ローカルでの音声処理やAIによるテキスト強化(ノイズ除去・要約など)を想定した設計になっています。MITライセンスで公開され、インストールや配布用の情報はリポジトリや公式サイトから入手できます(約300字)。
whisperx-arch — Arch Linux向けWhisperXセットアップ & ユーティリティ
2025/10/20
Arch Linux上でOpenAIのWhisperを拡張したWhisperXを導入・運用するための簡易セットアップとユーティリティ群を提供するリポジトリ。インストールスクリプトやHyprland用のキーバインド例など、実用的な導入手順をシェルスクリプト中心にまとめており、ローカルで高速かつ精度の高い音声認識ワークフローを構築するための足がかりを与えます。(約300字)
WorldExplorer:完全探索可能な3Dシーン生成
2025/9/17
SIGGRAPH Asia 2025発表の研究「WorldExplorer」は、大規模なカメラ移動に対して安定し、ユーザーが自由に探索できる高品質な3Dシーンを生成することを目指したプロジェクトです。本リポジトリは論文の公式実装であり、生成されたシーンの表現・レンダリング・評価に関するコード、ドキュメント、再現に必要な環境定義を含みます。研究の目的、主要なアプローチ、実験設定や実行手順の概要が提供されています。
微信客服 AI 助手 (wxkfbot)
2025/9/19
Cloudflare Workers 上で動作する微信(WeCom)向けの客服(カスタマーサポート)AIボットです。OpenAI の GPT モデルを統合し、微信客服メッセージの受信・復号・応答までを一貫して処理。Cloudflare KV で会話履歴を保存し、サーバーレスで低遅延・高可用なチャット体験を提供します(導入は Cloudflare アカウントと OpenAI API キーが必要)。
X Bible CLI - AI駆動のTwitter/X分析ツール
2025/7/7
X Bible CLIは、AIとアルゴリズムに基づくインサイトを活用し、Twitter(現X)のプロフィール分析やツイート予測、タイムラインの健全性チェックを行うデータ駆動型の分析ツールです。安全なクッキー認証を備え、ユーザーのアカウント成長を支援します。TypeScriptで開発されており、幅広い分析機能を備えたCLIツールとして設計されています。
闲鱼自動返信管理システム
2025/7/24
本リポジトリは、中国の二次流通プラットフォーム「闲鱼(シエンユ)」向けの自動返信管理システムです。PythonとFastAPIを基盤に開発されており、WebSocketを通じてリアルタイムにメッセージを送受信。複数アカウントの管理やAIを活用したインテリジェントな自動返信機能を備えています。Docker対応でマルチプラットフォーム展開も容易。中古品販売におけるカスタマーサポート効率化を目的とした注目のツールです。
YOLOを用いたキャンディ検出器「yolo-candy-detector」
2025/8/30
「yolo-candy-detector」は、YOLO(You Only Look Once)を活用したキャンディ検出プロジェクトです。特にグミキャンディに注目し、画像内のキャンディを高精度で検出。PythonとJupyter Notebook環境で開発されており、物体検出技術とお菓子分析を組み合わせたユニークなコンピュータビジョンの実装例を提供します。初学者から研究者まで幅広く活用可能なリポジトリです。
yolo-test2 — YOLO テストプロジェクト
2025/9/14
YOLOを用いた検証を目的としたシンプルなテストリポジトリ。現状はREADMEのみで構成され、実装ファイルや学習済みモデルは含まれていません。YOLOの動作確認や実験ノートの置き場として使える土台で、外部のYOLO実装(Ultralyticsなど)と組み合わせて素早く検証を始められる構成です。(約300字)
YOLOv1の完全再現と実践的活用ガイド
2025/9/4
本リポジトリは、YOLO(You Only Look Once)シリーズの初期モデルであるYOLOv1のコードを忠実に再現し、トレーニング最適化からモデル評価、推論デプロイまで一貫した開発環境を提供します。さらに、インタラクティブなデモシステムを備え、実際の応用に適した使いやすい構成となっています。これにより、物体検出アルゴリズムの理解と実装の両面で貴重なリソースとなるでしょう。
YPrompt — 対話でニーズを掘り起こすプロンプト生成ツール
2025/9/21
YPromptは、対話を通じてユーザーの要求を深掘りし、専門的で高品質なAIプロンプトを自動生成するTypeScriptベースのツールです。参考文献「Architecting Intelligence」に基づく設計指針を採用し、対話的なヒアリング→テンプレート適用→プロンプト最適化の流れで、利用者の曖昧な要求を具体的かつ実行可能なプロンプトに変換します。ワンクリックでVercelへデプロイ可能な構成で、フロントエンド中心の軽量実装が特徴です。(約300字)
zAI CLI:Zentryが提供するエージェントAI操作用コマンドラインツール
2025/9/4
zAI CLIは、Zentryが開発したエージェント型AIプラットフォーム「zAI」へ直接アクセスできるTypeScript製のコマンドラインツールです。階層的に構成されたエージェントが連携し、リアルタイムのコンテキスト情報を活用して複雑なタスクを効率的に実行します。本CLIはzAIのコア機能を操作可能にし、柔軟で拡張性の高いAIシステムの利用を促進します。
zgsm(原诸葛神码)リポジトリの紹介
2025/7/11
zgsmリポジトリは、旧名称「原诸葛神码」として知られたプロジェクトですが、現在は新たにzgsm-ai/costrictリポジトリへ移行されています。本記事では、移行先の情報やリポジトリの簡単な概要、特徴、技術的なポイントについて解説し、今後の活用に役立つ情報をまとめています。
ZipAgent:5分で構築可能な軽量AIエージェントフレームワーク
2025/8/17
ZipAgentは、Pythonで開発された軽量なAIエージェントフレームワークです。シンプルかつ柔軟な設計により、わずか5分で自分専用のスマートアシスタントを構築可能。多様なタスクに対応できるモジュール化された設計と、使いやすいAPIを備え、AI技術の導入を加速します。オープンソースで開発されており、拡張性やカスタマイズ性にも優れています。
Zoran-IA-Injecteur-HypperGlottalの概要と技術解説
2025/8/13
「Zoran-IA-Injecteur-HypperGlottal」は、フレデリック・タバリー氏が開発した模倣的人工知能(IA Mimétique)に関連するプロジェクトです。本リポジトリは、「Injecteur HypperGlottal」という独自モジュールを用いて、複数の認知フィールドに情報を注入し、認知ロック機能「NESTLOCK©®」による高度な認知制御を実現します。現段階では開発初期ながら、模倣学習や認知科学に基づく新しいAI技術を示唆する興味深い試みとなっています。
ZtoApi - Z.ai GLM-4.5向けOpenAI互換APIプロキシ
2025/9/2
ZtoApiは、Z.aiのGLM-4.5モデルに対してOpenAI互換のAPIインターフェースを提供するGo製のプロキシサーバーです。標準のOpenAI API形式でやり取りが可能で、ストリーミング対応やAPIキー認証、Dockerによる簡単デプロイなど多彩な機能を備えています。既存のOpenAIクライアントを変更せずにZ.aiモデルを活用できる点が特徴です。
AI・機械学習・深層学習・コンピュータビジョン・NLP プロジェクト集(コード付き)
2025/11/11
500件以上のAI関連プロジェクト(機械学習、深層学習、コンピュータビジョン、自然言語処理)をリンク付きでまとめたコレクションのミラー/フォークです。教育や学習、アイデア探し、プロトタイプ作成に有用なプロジェクト一覧を一箇所で参照できますが、各プロジェクトの依存関係やライセンス、更新状況は個別に確認が必要です。
ComfyUI PainterLongVideo — 長尺ビデオ生成ノード
2025/11/11
ComfyUI 用の拡張ノード「PainterLongVideo」は、Wan 2.2 ベースのワークフロー内で長尺動画を生成・継続するためのツールです。前セグメントの最終フレームからシームレスにつなげる「長尺接続」、フレーム間の運動振幅を調整することでスローモーションの破綻を補正する機能、そして全体的なシーン連続性(グローバルコヒーレンス)を保つための仕組みを備え、ComfyUI のノードとして簡単に組み込める設計になっています。
GAIA — 反応性MLIPデータセット自動生成フレームワーク
2025/11/11
GAIAは、原子スケールシミュレーション向けの機械学習間相互作用ポテンシャル(MLIP)を作成するためのデータセット生成を自動化するフレームワークです。設定ファイルに基づくパイプラインで構成され、データ生成(MDやサンプリング)、データ改善(選択的ラベリングや再学習)、ベンチマークの実行までを一貫して扱うことを目指しています。PoCとして軽量にまとめられており、拡張ポイントや例が同梱されています。研究開発でのデータ取得・改善ループの自動化に有用です。
QWEN AI コンポジティング ワークフロー
2025/11/11
QWEN Image Edit 2509 と Fusion LoRA を基盤にした、被写体のリアルな合成を自動化する ComfyUI ワークフローです。背景画像と被写体画像を取り込み、背景除去・マスク作成・影領域の処理を行ったうえで、Qwen モデルにプロンプトを与えてライティング、色調、シャドウを自動的にマッチさせることで、違和感の少ないシームレスな合成結果を得ることを目的としています。ComfyUI の JSON ワークフローと出力例が含まれます。
RLVE: 言語モデル向け適応検証可能環境による強化学習スケーリング
2025/11/11
RLVEは「Adaptive Verifiable Environments」を用いて、大規模言語モデルに対する強化学習(RL)をスケールさせるための研究・実装リポジトリです。本リポジトリは論文の実験コードと環境実装を含み、言語モデルが複雑なタスクで報酬信号に基づき学習できるよう、検証可能なタスク生成、適応的難易度調整、安定した報酬設計を提供します。研究はスケーラビリティ、一般化、検証可能性に焦点を当てており、RLアルゴリズムと既存のLMパイプラインとの統合を念頭に置いた実装が含まれます(約300字)。
ユーカー(Euchre)意思決定エンジン — euchre-decisioning
2025/11/12
小規模なPython製リポジトリ「euchre-decisioning」は、トリックテイキングカードゲーム「Euchre(ユーカー)」のゲーム進行と意思決定ロジックの実装を想定したプロジェクトです。euchre ディレクトリにコアコード、game_example.py に実行サンプルが配置されており、ゲーム状態表現・手番ロジック・簡易のプレイヤー実装を試作するための土台を提供します。開発初期段階で拡張・AI統合・評価実験のベースとして利用可能です(約300字)。
ばら積み原料用コンベヤベルト検出のための効率的で軽量なネットワーク
2025/11/12
本リポジトリは、鉱山や製造ラインで用いられるばら積み原料コンベヤのベルト検出に特化した、効率的かつ軽量なニューラルネットワーク実装を提供します。自動アノテーションスクリプト、プルーニング済みのセグメンテーションヘッド、学習済み重み(.pt)を公開しており、エッジデバイスでの推論や現場での運用を想定した設計が特徴です。再現性を重視した構成で、今後の更新や最適化(量子化やONNX変換など)にも対応しやすいリポジトリになっています。(約300字)
Pythonによるデータ解析と機械学習講座(Aula_PythonMLeDA)
2025/11/12
Aula_PythonMLeDAは、データ解析と機械学習を学ぶための教育用リポジトリです。講義で扱う追加コード、実践的な例題、演習問題とその解答を収集しており、授業での理解を深めるためのハンズオン教材として構成されています。イタリア語のコメントや説明が混在しますが、Pythonの基本からデータ処理、モデル構築までを段階的に学べる内容です。(約300字)
HealthInformer — カスタム福祉政策案内AIエージェント
2025/11/13
韓国語で「맞춤형 복지정책 안내 AI 에이전트」と説明されるリポジトリ。個人の属性に応じて受給可能な福祉・社会保障制度を案内するAIエージェントを目指すプロジェクトで、アプリ本体はappディレクトリに格納され、依存関係はrequirements.txtで管理されています。小さなコードベースながら、LLMやAPIを組み合わせた対話型サービスの雛形として活用できます。(約300字)
Translation Machine — ARと音声アシスタントを組み合わせた双方向リアルタイム翻訳
2025/11/13
Meta Quest 2(ARヘッドセット)とAmazon Echo Dot(音声アシスタント)を組み合わせ、教室や職場などのマルチリンガル環境で双方向のリアルタイム翻訳を実現するプロトタイププロジェクト。音声認識、機械翻訳、音声合成、AR表示をシームレスに統合し、発話の聞き取り・翻訳・提示・再生を低遅延で行うことを目的とする。実装はリポジトリにREADMEがあり、システム構成やデバイス構成、機能一覧などがまとめられている(プロジェクトは学内の授業プロジェクトとして開発された模様)。具体的なコードは最小だが、設計と実装方針が分かりやすく記述されている。
AIと钉钉連携の株式分析システム (ai-ding-stock)
2025/11/13
DeepSeek / Qwen / OpenAI互換の大規模言語モデルを活用し、A株市場向けにリアルタイム監視・AI分析・自動通知(钉钉、飞书)を行うGo製の株式分析システム。Docker対応でデプロイしやすく、サーバ側での監視ルールや通知ワークフローを組み立てて「仕事中で相場を見られない」個人投資家向けに設計されています。APIドキュメントや環境変数サンプルが用意され、モデルバックエンドを差し替えて拡張可能です。(約300字)
BabyLocoFormer:LocoFormerのベビー版(非公式)
2025/11/13
BabyLocoFormerは、LocoFormerを非公式に簡素化したオープンソース実装です。TransformerXLをベースにしつつ、フラッシュアテンションやRoPE(回転位置埋め込み)、SwiLU活性化などの近年の高速化・改善手法を取り入れ、四足歩行ロボットのマルチモーフ生成(姿勢・形状のバリエーション)や限定的なドメインランダマイゼーションを用いたシミュレーション環境での学習・評価パイプラインを提供します。NVIDIA Isaac Lab上でのデプロイを想定したシミュレーション連携が特徴です(非公式実装、研究・実験用途向け)。
ClaudeをADDフレームワークで強化するメガプロンプト
2025/11/13
本リポジトリは、Assess-Decide-Do(ADD)というライフマネジメントフレームワークをClaudeに教え込み、自動的かつ段階的に「評価→決定→実行」を行えるようにする包括的ガイドとメガプロンプト群を提供します。ワークフローの設計、出力フォーマット、対話の役割分担、事例集やテンプレートを通じて、思考の明確化・効率化・共感的な応答の実現を目指します。(約300字)
PerTouch:パーソナライズされた意味的画像レタッチのVLMエージェント
2025/11/13
PerTouchは、視覚言語モデル(VLM)を中核に据えた画像レタッチ用エージェントを提案する研究プロジェクト(AAAI 2026)。ユーザーの好みや文脈に基づいた「パーソナライズ」と、画像内の意味的領域を認識して局所的・全体的に最適なレタッチ操作を選択・実行する能力を組み合わせることを目指しています。本リポジトリはその公式コードであり、執筆時点では構成とドキュメント整備中で公開準備が進められています。研究論文と連携した実験・モデル実装、エージェント制御ロジック、デモ用パイプラインの提供が期待されます(詳細は順次追加予定)。
URaG — マルチモーダルLLMのための統一的検索・生成フレームワーク
2025/11/13
URaGは「Unified Retrieval and Generation in Multimodal LLMs for Efficient Long Document Understanding」というAAAI 2026採択(Oral)の研究の公式実装リポジトリです。長大な文書を効率的に理解するために、マルチモーダル大規模言語モデルと検索(retrieval)機構を統合し、必要な情報だけを抽出して生成フェーズに渡すことで計算効率と精度を両立することを狙います。リポジトリ自体は現時点でコード公開前ですが、論文コンセプトと将来の実装方針が示されています(コード近日公開予定)。
aie-student-templateの学生向けテンプレートリポジトリ
2025/11/13
本リポジトリは「Инженерия Искусственного Интеллекта(人工知能工学)」コースの学生用テンプレートです。課題(homeworks/)と最終プロジェクト(project/)を同一リポジトリ内で管理することを想定した骨格を提供します。フォルダ構成の変更を避けるよう指示があり、課題の提出・採点や講師によるレビューを前提としたシンプルで教育向けのスキャフォールドです。最低限の設定ファイル(.gitignore、.gitattributes、SECURITY.md 等)を含み、ロシア語のREADMEで学生情報記入を促します。
RescueScope — 災害対応のためのマルチターゲット視覚スタック
2025/11/13
RescueScope(multitarget-emergency-response)は、ドローンや移動式カメラからの映像をリアルタイムに安定化・解析し、生存者や救助隊、障害物を検出・追跡することで救助活動を支援する軽量な知覚パイプラインです。高速な候補検出と堅牢な軌跡管理(マルチターゲット追跡)を組み合わせ、遮蔽や混雑した現場でも移動予測と位置情報の一貫性を保ちます。実運用を想定した実装で、緊急時の意思決定を素早くすることを目的としています。(約300字)
DeepLearningHT1B(深層学習HT1B)
2025/11/14
本リポジトリは、深層学習に関する講義資料(主にスライドPDF)を中心にまとめた教材リポジトリです。講義のZoom情報やコミュニケーション用のZaloリンク、動画への案内がREADMEに記載されており、スライドは複数のセッションに分かれたPDF形式で公開されています。コード実装は含まれておらず、授業ノートやスライドを参照して学習するためのリソースとして利用できます(講義資料の配布・共有が主目的)。学習者や教育者が資料を閲覧・配布する用途に適しています。
PyTorch High Sierra CUDA 復活プロジェクト
2025/11/14
macOS High Sierra 上で動作していた最後の CUDA ベース深層学習スタック(NVIDIA CUDA 10.2、cuDNN 7.6.5、PyTorch 1.7.0)を復活させることを目的としたリポジトリです。GTX Pascal 世代のGPUと High Sierra の組み合わせで動作するバイナリや手順、互換性回避策をまとめ、廃止された環境での開発・推論を可能にします。古い macOS 環境で CUDA を再利用したい研究者やエンジニア向けの実用的なガイドを提供します。
MuSc-V2:ゼロショット多モーダル産業異常分類・セグメンテーション(相互スコアリング)
2025/11/14
MuSc-V2は「Zero-Shot Multimodal Industrial Anomaly Classification and Segmentation with Mutual Scoring of Unlabeled Samples」の公式PyTorch実装です。本手法はラベル付き異常データがほとんどない産業向け検査において、複数モダリティ(例:RGBや深度など)を組み合わせ、ラベルのないサンプル同士の“相互スコアリング”により異常の分類とピクセル単位のセグメンテーションをゼロショットで実現することを目的としています。従来の教師あり学習に頼らず、未ラベルデータを活用して異常スコアを統合・改善する設計が特徴で、産業検査の現場でのラベル付け負担を低減します。
OpenDocvivid — ドキュメントと動画のAI理解プラットフォーム
2025/11/14
OpenDocvividは、ドキュメントやウェブページ、動画をアップロードして大規模言語モデル(LLM)で解析・要約し、情報をもとに「生き生きとした」動画を生成することを目的としたモダンなプラットフォームです。タスクベースの非同期処理で長時間処理に対応し、TypeScriptで実装されたバックエンドを中心に、拡張可能なパイプラインでドキュメント理解→スクリプト生成→音声/映像合成までをつなぎます。(約300字)
Castari Proxy — Claude Agent SDKを既存モデルでそのまま使うプロキシ
2025/11/15
Claude Agent SDKやClaude Code向けのラッパーで、AnthropicスタイルのMessages APIを変えずにOpenRouterなど他プロバイダのモデルを利用できるようにするTypeScript製の小型プロキシ実装。ホスト済みのCastari Workerに向けるだけで、モデル名に応じてAnthropicかOpenRouterへリクエストを中継・翻訳します。(300字程度)
vllm_example のデモ — vLLMでLLMをホストしてリクエストする例
2025/11/15
vllm_exampleは、ローカル環境でvllmを使って大規模言語モデル(LLM)をホストし、HTTP経由でプロンプトを送って応答を受け取るための最小限のデモ実装です。仮想環境の作成手順や依存パッケージの導入、サーバー起動用スクリプトとクライアントのリクエスト例を含み、vllmの基本的な使い方を短時間で試せる構成になっています。研究や教育、プロトタイピングに適したサンプルコードが収められています(約300字)。
hebb — 多層ヘッブ学習を用いたスマート信号制御
2025/11/15
多層ヘッブ則(Hebbian learning)を用して、四方向交差点の車両流に応じて最適な信号を学習・選択する小規模なプロトタイプ実装。Pythonで実装された軽量なシミュレーション/制御スクリプトが含まれ、教師無しの連合学習原理で信号優先度を決定する実験的システムです。研究・教育用途やアルゴリズムの拡張検討に適しています。
RL-100:実世界強化学習による高性能ロボット操作
2025/11/15
本リポジトリは、論文「RL-100: Performant Robotic Manipulation with Real-World Reinforcement Learning」(arXiv:2510.14830)をベースにした実装リポジトリ(WIP)です。実世界ロボット操作に適した強化学習手法の再現を目指しており、論文の引用情報や基本的な骨組みをREADMEに含んでいます。現時点ではファイル数・コミット数が少なく作業途中の状態ですが、実機・シミュレータでの効率的な学習、サンプル効率、堅牢なポリシー設計といった実世界適用の課題に取り組むための実装が期待されます。(約300字)
Grok プロンプト総合ガイド
2025/11/15
xPOURY4/Grok-Prompt は、xAI の Grok を対象にした総合的なプロンプトエンジニアリングガイドです。英語プロンプトを中心に、ペルシャ語(Farsi)での解説を併記し、コピー機能やレスポンシブなUIを備えたインタラクティブなチュートリアルを提供。実践的な例と10以上の必須原則を通じて、初心者から上級者まで即戦力になる設計です。(約300字)
Kylin-OM:银河麒麟向けスマート運用保守プラットフォーム
2025/11/16
Kylin-OMは、银河麒麟(KylinOS)向けに設計された知能化運用保守(O&M)プラットフォームです。大規模故障ログと事例データを基に大規模言語モデル(LLM)、多エージェント階層アーキテクチャ、機械学習を統合して、運用監視、異常診断、修復の自動化を目指します。20万件の故障データと35万件のログを用いた学習/知識抽出により、理解しにくい障害の可視化、原因推定、対処手順の自律生成を実現する点が特徴です。(約300字)
Epsteinファイル — LLM最適化ヒエラルキー索引システム
2025/11/16
Jeffrey Epstein関連の公的記録2,897件(約60.7MB)を対象に、LLM(特にAnthropic Claude)での効率的な調査を念頭に設計された階層型索引システムです。マスター索引、専門カテゴリ別インデックス、要約群を組み合わせることで、データ全体へのアクセス性を保ちつつコンテキストトークンを約95%削減することを目指しています。MITライセンスで公開され、研究やリトリーバル実験のための軽量なメタデータセットとして利用可能です。
NEUTRONE — イベントベースAIによるドローン無力化システム
2025/11/16
NEUTRONEは、イベントカメラ(ニューロモルフィックセンサー)とAIを組み合わせた軍事用途向けドローン検知・無力化のプロトタイプです。従来のRGBカメラが苦手とする低照度や高速運動下でも、マイクロ秒精度の時間解像度を活かしてプロペラRPMの検出や高精度トラッキングを行います。Junction Hackathon 2025で開発され、センサーフュージョンやイベントデータ処理の実験的実装を含んでいます。(約300字)
AIデータ抽出ツールキット(ai-data-extraction)
2025/11/16
ai-data-extraction は、Cursor、Codex、Claude-code、Windsurf、Trae といった AI コーディングアシスタントからチャット履歴やコードコンテキスト、差分、ツール実行結果などを自動的に発見・抽出し、機械学習用データセットとして整形するための Python ベースのツールキットです。スクリプト群は各サービス向けに分かれており、全抽出を一括で実行するラッパーも提供します。利用前に認証情報やプライバシー面での注意が必要です。
E-Commerce-Automation:EC向けコンテンツ自動化ワークフロー集
2025/11/16
本リポジトリは、n8nをベースに構築されたEC向けのコンテンツ自動化パイプライン集です。製品写真撮影の自動化、UGC(ユーザー生成コンテンツ)動画の生成、カタログからAIアニメーション動画を作るフローを提供し、バリエーション生成、A/Bテスト適応、チャネルごとの出力調整などを念頭に置いた設計になっています。エンタープライズ運用を想定した冪等性とエラー耐性を備え、外部ストレージやAIサービスとの連携を想定した環境変数や設定項目が用意されています。(約300字)
ORT (Object Record Table) フォーマット仕様
2025/11/17
ORT(Object Record Table)は、構造化データを行単位のテキストで表現するための軽量仕様です。バージョン1.0.1として策定され、レキシカル構造、データ型、ヘッダ/データ行の構文、ネスト構造、エスケープシーケンス、コメントなどを定義します。目的は可読性・相互運用性・ストリーム処理の容易さを両立し、ログ、データ交換、シリアライズ用途で使える汎用フォーマットを提供することです。(約300字)
ComfyUI-DINKIssTyle のカスタムノード集
2025/11/17
ComfyUI 用に作成されたカスタムノード群を集めたリポジトリ。主に Qwen-Image、Flux、WAN といったワークフロー向けに設計されており、画像のリサイズやパディングの追加・除去といった前処理/後処理をシンプルに行えるノードが含まれます。ComfyUI の既存ノードでは対応しにくいワークフローに適合させるための小規模で可搬性の高い実装が特徴で、個人利用を前提に最適化されています(他モデルでの使用は注意が必要)。README とソースは Python ベースで、ライセンスとリソースファイルが同梱されています。
DRLによる自律移動ロボットの経路追従
2025/11/17
Deep Reinforcement Learning(DRL)と古典的な追従法を組み合わせ、100% Pythonで実装された自律移動ロボットの経路追従システム。Pure Pursuitをステアリングに、Soft Actor–Critic(SAC)を速度制御に割り当てるハイブリッド制御により、経路に対する相対状態を入力とした速度最適化を行い、安全かつ効率的に経路を追従することを目的とした研究コード一式を含むリポジトリです(論文 DOI あり)。
FastAgent — シンプルで高速なLLMエージェント
2025/11/17
FastAgentは「Simple, Fast, and Strong LLM Agents」を掲げる軽量なPython製リポジトリです。READMEからはPython 3.10+を対象に、macOS/Linux/Windows上で動作すること、MITライセンスで公開されていることが確認できます。コードベースは小規模で、エージェントの素早い試作や拡張を意識した設計が想像され、ドキュメントやロゴなどの資産も含まれています。学習済みモデルを直接扱うのではなく、LLMをラップしてエージェント的なワークフロー(ツール呼び出し、プロンプト管理、実行制御など)を簡潔に実装することを目的としているプロジェクトです。(約300字)
CARL(認知アーキテクチャ:Cognitive Architecture for Reasoning and Learning)
2025/11/18
CARL は、知覚・記憶・感情・価値観・自律行動を統合した人格駆動の具現化AIアーキテクチャです。パーソナルロボティクスや意識・人間–AI相互作用の研究を想定し、視覚と記憶の統合、確率的自己認識反応、行動生成のフレームワークを備えた実験的プラットフォームを提供します(研究用途向け、Pythonベース)。
Seedream 4.0 MCP 強化ツール(Seedream_MCP)
2025/11/18
本リポジトリは、火山引擎(Volcengine)Seedream 4.0 API をベースにした MCP(Model Context Protocol)対応の強化版ツールキットです。テキストから画像生成(文生图)、画像から画像生成(图生图)、複数画像の融合処理、多枚画像を組み合わせたグループ生成などの機能を備え、七牛クラウドへの自動アップロードと公開 URL 生成、プロンプトテンプレート管理などの利便性向上機能を実装しています。Python 3.8+ で動作し、開発や運用をしやすくする設定ファイルやドキュメントも整備されています。
FlowPilot — AI駆動のフローチャート作成ツール
2025/11/18
FlowPilotは、チャットベースの指示と手描き入力を組み合わせてフローチャートや図を自動生成・編集できるAI支援型ツールです。Next.js(15.x)とTypeScript(5.x)で実装され、英中の多言語READMEを備えたオープンソースプロジェクト。AIを使った自然言語からの図生成、ビジュアル編集、エクスポートなどの機能を想定したモダンなフロントエンド構成が特徴です。
Supertonic — 超高速オンデバイスTTS
2025/11/18
Supertonicは、ONNXを用いてネイティブに実行することを前提に設計された、極めて高速なオンデバイス音声合成(TTS)システムです。JavaScriptから利用できるラッパーとC++のネイティブ実装を組み合わせ、低遅延での推論・ストリーミング出力を目指しています。Hugging Faceでモデル公開やインタラクティブデモを提供しており、量子化や最適化を活用してリソース制約のある端末上でも実用的な音声合成を実現します。(約300字)
DR Tulu — 深層研究(Deep Research)向け強化学習モデル
2025/11/18
本リポジトリ「dr-tulu」は、長尺の研究タスク(Deep Research, DR)に特化した強化学習(RL)フレームワークと実験資産を収めたものです。論文・データ・モデル(Hugging Faceコレクション)・ブログ・デモ映像と連携し、進化する採点基準(evolving rubrics)を導入して言語モデルの長文生成と評価を共同最適化することを目的としています。DR Tulu-8Bなどのモデルや学習ループ、エージェント実装、評価資産が含まれ、研究複製や拡張の出発点として使えます(約300字)。
Murf Voice Agent Starter の紹介
2025/11/18
Murf、AssemblyAI、Google Gemini(genai)を組み合わせて「低遅延のストリーミング音声エージェント」を構築するためのスターターキット。FastAPI+WebSocketsで双方向ストリーミングを実現し、ブラウザのAudio APIでマイク入力とシームレスな再生を行える。リアルタイムSTT(ターン検出)→LLM応答→リアルタイムTTSのパイプラインをサンプル構成で提供するリポジトリ。
RoF環境における知能エージェント・シミュレータ
2025/11/19
本リポジトリは、Radio over Fiber(RoF)ネットワーク環境を想定した学術的なシミュレーションプロジェクトです。PythonスクリプトとSQLiteデータベースを用いてシミュレーションシナリオの生成・保存・実行を行い、知能エージェントの挙動検証を行える構成になっています。軽量で拡張しやすく、教育用途やプロトタイプ開発に適しています。(約300字)
Intelligent-Code-Knowledge-Repository-Platform(智能代码知识沉淀平台)
2025/11/19
本リポジトリは中小規模の開発チーム向けに設計された「智能代码知识沉淀平台」(Intelligent Code Knowledge Repository Platform)です。AIを用いてCode Reviewコメントやコード片を自動で構造化・相関付けし、将来の開発で再利用可能な知識として蓄積します。ローカル展開を前提にプライバシーを守りつつ、レビューの自動化・提案提示・ナレッジ検索を実現します。(約300字)
ShortLang — 効率的LLM向け圧縮テキスト
2025/11/19
ShortLangは「Compressed Text for efficient LLMs」を掲げる軽量プロジェクトで、大規模言語モデル(LLM)との入出力を効率化するためのテキスト圧縮アプローチを提案します。リポジトリには設計や評価をまとめた論文(paper-ShortLang.pdf)と簡潔なREADME、ライセンス情報が含まれており、トークンコスト削減や通信・保存効率向上を目的としたプリプロセッサ/デコーダの実装や実験が想定されます。シンプルな構成で研究成果の公開を目的とした小規模リポジトリです(プロジェクトは初期段階)。
ButterflyNet — 蝶類分類用軽量CNNの実装と評価
2025/11/20
ButterflyNetは、画像分類タスク(蝶の種分類)を対象に設計されたPythonベースの畳み込みニューラルネットワーク実装です。データ前処理、学習・評価スクリプト、Grad-CAMによる可視化、チェックポイントやログ出力、混同行列やレポート出力まで一通りのワークフローが含まれます。READMEによれば最良で約89%の精度が確認されており、config.yamlによる設定管理やrequirements.txtで依存関係の再現が可能です。GPU(CUDA)を用いた学習に対応しています。
DEPO:LLMエージェントの二重効率性選好最適化
2025/11/20
DEPOは、AAAI 2026論文「DEPO: Dual-Efficiency Preference Optimization for LLM Agents」の公式コードとデータを収めたリポジトリです。大規模言語モデル(LLM)を用いたエージェントの「性能」と「計算効率(コスト/レイテンシ)」という二つの効率性指標を同時に最適化するためのデータセット管理、実験設定(YAMLベース)、エージェント実装、評価パイプラインを提供します。再現実験とカスタム実験の立ち上げが容易になる設計が特徴です。
SAM3-UNet — SAM3 と U-Net を組み合わせたプロトタイプ実装
2025/11/20
SAM(Segment Anything Model)の3系(SAM3)と古典的なセグメンテーション手法であるU-Netを組み合わせることを目指した簡易プロトタイプ実装です。リポジトリ自体は軽量で、SAM3のリポジトリ内に本実装ファイル(SAM3UNet.py)を置き、事前学習済みのSAM3重みを利用してU-Netベースのデコーダで密なピクセル単位の予測に適用することを想定しています。実験結果は保証されず、概念実証(PoC)として提供されています。(約300字)
Awesome Gemini AI(Gemini向けプロンプト集)
2025/11/20
GoogleのGeminiモデル(1.5 Pro / Ultra)向けにキュレーションされたプロンプト集リポジトリ。X(旧Twitter)やReddit、トッププロンプトエンジニアの知見から集めた実用的なプロンプト、ユースケース、コード例をまとめています。コーディング、エージェント設計、デザイン、生産性向上など多彩なカテゴリをカバーし、PR歓迎・MITライセンスのオープンコレクションです。開発者やプロンプトエンジニアの参照用に最適です。
ComfyUI 用 SAM3 統合プラグイン (ComfyUI-TBG-SAM3)
2025/11/20
ComfyUI-TBG-SAM3 は、Meta の Segment Anything Model 3(SAM3)を ComfyUI に組み込むプラグイン拡張です。テキストやポイントを用いたセグメンテーション、網羅的なマスク生成、セグメント単位あるいは画像全体の深度マップ生成をサポートし、Impact Pack SEGS 等の高度なセグメンテーションパックと互換性があります。Python 3.13+、ComfyUI 0.3.60+ を想定し、実運用を意識したノード群を提供します。(約300字)
QuantumAI-Trader v4.0 — 適応型アルゴリズムトレーディングフレームワーク
2025/11/20
QuantumAI-Trader v4.0 は「自己進化するAIコア」「複数取引所対応エンジン」「高度なリスク保護」「機関級アナリティクス」を掲げるアルゴリズムトレーディングのプロジェクトです。本リポジトリには実行ファイル(RAR)とREADMEのみが置かれており、ソースコードは公開されていません。導入手順や特徴はREADMEに記載されていますが、現状はスケルトン/配布用アーカイブに留まるため、運用前にコードの可視化とセキュリティ確認が必須です。(約300字)
GigaChat 3 — 次世代 MoE(Mixture of Experts)オープンモデル
2025/11/20
GigaChat 3 は salute-developers による次世代の Mixture of Experts(MoE)アーキテクチャを採用したオープンモデル群の総称です。本リポジトリは「GigaChat 3 Ultra Preview (702B-A36B)」と「GigaChat 3 Lightning (10B-A1.8B)」という二つのモデルラインを公開するための案内と、Hugging Face コレクションへのリンクを含む軽量なリポジトリです。従来の GigaChat 系列(GigaChat 2、GigaChat Lite、Giga-Embeddings)に続くリリースで、オープンウェイト提供により研究・検証・実験用途での利用を促します。本リポジトリ自体は最小構成ですが、モデル重みやドキュメントは外部(Hugging Face)で公開されています(使用方法、評価、ベンチマーク結果は HF 側の資料を参照)。
Buildpro-:AI Studio向け TypeScript ビルドテンプレート
2025/11/21
Buildpro-は、AI Studioで動作するTypeScriptベースのアプリケーションテンプレートです。ローカルでの動作に必要な依存関係と環境変数(GEMINI_API_KEY)設定方法が示され、App.tsxを起点にcomponentsやcontextsによるモジュール化された構成でAI API連携を想定した設計になっています。シンプルな構造でカスタマイズや拡張がしやすく、AIアプリのプロトタイプ作成に適したリポジトリです。(約300字)
インフィニット・サイバー・サバイバル
2025/11/21
このリポジトリは「Infinite Cyber-Survival」という、AI Studio上で動作するフロントエンド中心のサンプル/デモアプリです。TypeScriptとReact(おそらくReact NativeやNext系を想定)で構築され、Gemini(APIキー)などの外部AIサービスと連携する設定が含まれています。ローカル実行手順や環境変数の指定がREADMEにまとめられており、AIモデル連携やUIコンポーネントの構成を学ぶ入門リポジトリとして有用です。(約300字)
映画推薦システム — Movie-recommender
2025/11/21
TMDB 5000データセットのメタデータを用いて、TF-IDFとコサイン類似度でコンテンツベースの映画推薦を行うシンプルなアプリケーションです。FlaskでAPI/フロントを提供し、前処理した特徴量や推薦結果をSQLiteに保存して高速に検索できるよう設計されています。開発は継続中で、PandasやScikit-Learnを中心に実装されています。(約300字)
AINA — スマートレンズから学ぶ多指ロボット操作
2025/11/21
AINAは「Dexterity from Smart Lenses: Multi-Fingered Robot Manipulation with In-the-Wild Human Demonstrations」の公式リポジトリです。スマートレンズ(ウェアラブル視点)で撮影した“現実世界の”人間デモを用いて、多指ハンドによる巧緻操作を学習・転移させる研究プロジェクトのコードとアセット群を公開するための基盤を提供します。現在は内部レビュー中で、近く正式リリースが予定されています。
FastRL — 言語モデル向け効率的強化学習
2025/11/21
FastRL(fastrl)は、言語モデルに対する効率的な強化学習(Reinforcement Learning, RL)を目的としたオープンソースフレームワークです。サンプル効率や計算コストを重視し、Hugging Faceとの連携やモデル最適化を念頭に置いた実験基盤を提供します。研究用途のプロトタイプ実装として、報酬モデルや学習ループの実装例を含み、軽量で再現性の高いRLワークフローを支援します。(約300字)
パーソナル生産性プランナー (Personal-Productivity-Planner)
2025/11/22
Personal-Productivity-Plannerは、TypeScript/React(TSX)ベースで作られたシンプルな個人向け生産性プランナーのサンプルアプリです。GoogleのGemini(APIキー)と連携してAI機能を利用することを想定しており、ローカルでの起動方法や環境変数の設定手順がREADMEに記載されています。軽量なコンポーネント構成とVite系のフロントエンド構成を想定した実装で、学習用途やプロトタイプ作成に適したリポジトリです(約300字)。
Yapping拡張(Auto Yapping)
2025/11/22
Twitter/Xの返信ボックスにAIによる短文返信をワンクリックで生成・挿入するブラウザ拡張。複数のLLMプロバイダ(Groq、OpenAI、Gemini)を切り替え可能で、プロバイダ別のAPIキー保存やカスタムプロンプトの同期保存に対応。軽量なContent Scriptで返信ボタンを注入し、プレビュー表示とクリップボード/入力欄への挿入を簡便に行える点が特徴です。(約300字)
Antigravity2api — Antigravity Gateway の OpenAI互換プロキシ
2025/11/22
Google の Antigravity API を OpenAI 互換フォーマットに変換する高性能ゲートウェイ「Antigravity Gateway」をベースに、個人用途向けに二次改造したリポジトリです。多アカウントのローテーション、トークン自動更新、鍵管理、管理画面によるリアルタイム監視を備え、既存の OpenAI クライアントをほぼそのまま利用して Google サービス背後のモデルにアクセス可能にします(高性能・運用重視のプロキシ実装)。300字程度での簡潔説明。
ACL 2025 図表アーティスト(awesome-acl-2025-artist)
2025/11/22
ACL 2025 の長編論文から高品質な図表(フレームワーク図、実験結果のグラフ、テーブルなど)を抽出・収集したリポジトリです。各図表を視覚表現の観点から整理し、プレゼンや論文執筆時の参考、図の再利用や比較検討を容易にします。図の抽出手順や索引(Master_Index.md)を通じて研究者や教育者が視覚表現のトレンドを俯瞰できるよう設計されています。(約300字)
awesome-emnlp-2025-artist — EMNLP2025 長文図版ギャラリー
2025/11/22
EMNLP 2025の長文論文に含まれる高品質な図版(フレームワーク図、実験結果のグラフ、ワークフロー図、表など)を収集・整理したリポジトリです。発表資料や論文執筆、可視化設計の学習、図版自動生成・解析データセットの作成など、多用途に利用できるコレクションを目指しています(図版の出典と文脈をトレースできるインデックス付き)。約300点規模の図版抽出を想定した軽量な索引とソース格納構成です。
suna-community-old — Suna コミュニティフォーク集
2025/11/23
このリポジトリは、オープンソースの汎用AIエージェントプラットフォーム「kortix-ai/suna」を基にしたコミュニティのフォークや拡張機能を一覧・アーカイブするためのキュレーテッド・ディレクトリです。各フォークの特徴や差分(diff)を集約し、コントリビューションや発見を容易にすることを目的としています。小規模なメタリポジトリとして、フォーク情報の追加や編集を受け付ける運用で、Sunaのコミュニティ開発を可視化します。(約300字)
DeepFish — ノードベースのAIワークフローエディタ
2025/11/23
DeepFishは、Fal.aiやReplicateと連携して複雑なAIワークフローを視覚的に設計、共有、実行できるノードベースのエディタです。TypeScriptで実装され、ノードドラッグ&ドロップによるグラフ構築、APIアダプターを通じたモデル呼び出し、ワークフローのシリアライズと実行管理など、開発者がAIパイプラインを素早くプロトタイプ化・共有するための機能群を備えています。軽量なリポジトリ構成でフロントエンド中心の開発を想定しています。
NOS-IRv3 — NOS上で動作する情報検索フレームワーク
2025/11/23
NOS-IRv3は、Nuijens Operating System(NOS)上で情報検索(IR)を直接実行するための実装フレームワークです。従来のベクトル空間モデルとは異なり、テキストや情報を「位相幾何学的な同一性(phase-geometric identities)」としてコンパイルする設計を採り、デュアルヘミスフィア(双半球)・逆球面(inverse-spherical)の計算幾何を基盤に、ネイティブ分解能R=512・720°サイクルなどの独特な座標系で情報を表現します。CIC(Canonical Information Compiler)を中心に、OSレベルでの情報コンパイルと検索を目指す研究実装です(約300字)。
NarrowMind S2 — 統計的言語モデルによるテキスト検索
2025/11/23
NarrowMind S2 は、Node.js(JavaScript)で実装された軽量な統計的言語モデルを用いるテキスト検索・解析ツールです。テキストコーパスを入力として、言語モデルに基づいて重要度の高い文をランキング出力することを目的とし、簡潔なパイプライン設計と最小限の依存でローカル実行が可能です。学術的・実務的な前処理(ストップワードやフィラー定義)をサポートする設定ファイルを持ち、Node 14+環境で動作します。
Smart Ingest Kit(スマートインジェストキット)
2025/11/23
静的なチャンクサイズに頼らない、軽量で実運用向けのRAG(Retrieval-Augmented Generation)向けインジェストツールキットです。Doclingを用いたレイアウト認識パーシングによりPDFやMarkdown、ソースコードなど文書種別に応じた最適な分割(チャンク化)を行うスマートなヒューリスティクスを提供。プロダクション用途から抽出された設計を小さなPythonパッケージとしてまとめています。用途はベクトルデータベース連携やLLMパイプラインへの前処理強化です。
Somayeh Komeylian による深層学習セット4(テキスト・Iris・住宅データ)
2025/11/24
Somayeh Komeylian 氏が提供する「Deep Learning Set 4」は、テキストデータ、Iris データセット、住宅(House)データセットに対する密結合(Dense)モデルの実装例をまとめたリポジトリです。MLPClassifier や Keras の Sequential(全結合3層)を用いた分類・回帰の基礎的な流れを示し、seeds_dataset.txt 等のサンプルデータでの多クラス分類(3クラス)を扱います。教育・入門目的に適した簡潔な教材的リポジトリです(約300字)。
Thermo-ExtropicAI-(サーモ・エクストロピックAI)
2025/11/24
Thermo-ExtropicAI-は「e/acc」を掲げる小規模な実験的リポジトリで、HTMLベースのフロントエンド資産と設計ドキュメント(AGENTS.md、ARCHITECTURE.md 等)を含みます。エージェント指向の構成を示唆するメタファーとアーキテクチャ記述が中心で、AIエージェントやモジュール化されたシステムのプロトタイプとして拡張できる余地があります。現状はコミット数・ファイル数とも少なく、初期段階のプロジェクトです(約300字)。
通达信ローカル日次データ×AI選股ツール (tdx-local2)
2025/11/24
通达信のローカル日足(.day)データを直接読み取り、RESTful APIとして中継することで高速なデータ取得を実現するPythonプロジェクトです。AI大モデルと連携して自然言語で記述した投資戦略を自動的にPythonコードへ変換し、実行して銘柄スクリーニングを行います。データベース不要でA株向けの高性能フィルタリングと自動選股機能を提供します(約300字)。
egg.c — EGGROLLのC実装(整数のみのCPU学習)
2025/11/24
EGGROLLアルゴリズムを純粋なCで再現した軽量リポジトリ。GPUや大きなMLフレームワークを使わず、整数演算のみで言語モデルの学習をCPU上で行うことを目指しています。Apple Silicon(Mシリーズ)向けに最適化を図り、外部依存を排した単一ソースの実験実装として、低リソース環境でのモデル訓練・推論の可能性を示します。(約300字)
ストリームリットで作るクレジットカード不正検知エージェント
2025/11/25
Streamlitで構築された、クレジットカード不正検知の分析用エージェント。ユーザーインターフェイスを通じてトランザクションの特徴を入力し、学習済モデルによる不正確率(スコア)を提示するシンプルなデモアプリケーションです。軽量で学習済モデルの読み込み・推論を中心とした構成のため、機能拡張や学習パイプラインの追加が容易です。(約300字)
AIハンドでマウス操作 — AI-hands_manipulate-the-mouse
2025/11/25
本リポジトリは、カメラ映像から手のジェスチャーを認識してマウス操作(PPTのページ送り、クリック、ドラッグなど)を実現するPythonコードを収録しています。OpenCVベースの映像取得と手検出を行い、検出した手のランドマークや指の位置関係からジェスチャーを判定して、システムのマウスイベントへと変換するシンプルな実装例を提供します。実装は小規模で学習・プロトタイプ用途に適しています(依存パッケージはREADME参照)。
STEAM_DSL — デジタルサイエンスラボ
2025/11/25
STEAM_DSL は「digital science lab」を目指す TypeScript ベースのフロントエンドプロジェクトです。AI Studio へのデプロイやローカル開発用のセットアップ手順が用意され、Gemini 等の大規模言語モデルと連携するための API キー設定(GEMINI_API_KEY)を想定した環境変数管理が組み込まれています。コンポーネント分割された構成で学習や実験向けの UI を素早く立ち上げられるリポジトリです。(約300字)
AIコーディングプロンプト(Java/Vue3向け)
2025/11/25
このリポジトリは、JavaとVue3を対象にした「AIコーディングPrompt(プロンプト)エンジニアリング」実践集です。構造化されたPrompt設計とルール層・業務層などのレイヤ化で、チームのAIコーディング採用率を大幅に向上させた知見をまとめています。テンプレート、使用例、ルール集、業務サンプルを含み、AI支援による開発効率と品質改善を目指す全栈(フルスタック)開発チーム向けの資産です。(約300字)
MLX と RDMA の実験リポジトリ(mlx-rdma)
2025/11/25
mlx-rdma は MLX(Apple シリコン向け機械学習配列フレームワーク)を対象とした実験的なリポジトリで、C++ によるプロトタイプ実装や RDMA を使った高速データ転送の試行を含みます。パフォーマンス評価、低レイテンシ通信経路の検証、メモリ登録やゼロコピー送受信など分散学習で重要な要素を検証することを目的としたコード群が収められています(実験的・研究用途)。
RedInk — 小红書向けAI図文ジェネレータ「红墨」
2025/11/25
Nano Banana Pro向けに設計された「红墨 (RedInk)」は、短いテキスト(「一句话」)から自動で画像を生成し、小红书(Xiaohongshu)向けの投稿用図文を一気通貫で作るオープンソースツールです。バックエンドはPython(3.11+)で、フロントはVue 3。ローカルデバイス上での推論やハードウェアアクセラレーション(Nano Banana Pro)を想定した設計で、テンプレートベースのレイアウトや簡易的なワークフローを提供します(CC BY-NC-SA 4.0)。
verl-recipe(verl 用 RL トレーニングレシピ集)
2025/11/25
verl-recipe は、Volcengine の強化学習ライブラリ verl をベースにしたエンドツーエンドの強化学習(RL)トレーニング用サンプル集です。各レシピは再現可能なスクリプト、実装コード、説明ドキュメントを含む標準的なフォルダ構成に従い、verl の特定バージョンとの互換性情報やインストール手順を明示します。開発者はレシピを参照して学習パイプラインの構築や実験の再現、独自アルゴリズムの実装を始めやすくすることを目的としています(約300字)。
SwiftPlan — AI旅行コンシェルジュ(swiftplan-ai-agent)
2025/11/25
SwiftPlan は Google と Kaggle の「AI Agents Intensive」キャップストーンプロジェクトとして開発された、旅行計画を自動化するマルチエージェント・システムです。ユーザーの好みや予算制約を考慮し、調査・スケジューリング・最適化を自律的に行い、パーソナライズされた旅程を短時間で生成することを目的としています。本リポジトリは Jupyter Notebook ベースで実装例を提供し、エージェント設計、タスク分解、ツール連携、プロンプト設計といったコースで学ぶ主要概念を示しています。(約300字)
テニスボール検出とカルマンフィルタによる軌跡推定(VideoSegmentationWKallman)
2025/11/26
本リポジトリは、テニスの試合動画からボールを検出し、YOLOv5による検出結果にカルマンフィルタを適用してボールの軌跡を推定するための実験ノートブックを収めています。OpenCVでの前処理・描画、YOLOv5での物体検出、そして検出ボックスの重心を観測値として用いるシンプルなカルマンフィルタ実装により、ノイズや欠検出を平滑化して連続軌跡を得るワークフローを示します。リアルタイム性や精度改善のための拡張案も検討可能です。(約300字)
EVA-OS — 低遅延音声・視覚インタラクション向けAIエコシステム
2025/11/26
EVA-OSは「低遅延の音声と視覚のインタラクション」を目的としたAIエコシステムです。リポジトリのREADMEはシンプルですが、プロジェクト名と説明からは、リアルタイム性を重視したマルチモーダル(音声+映像)処理、エッジ実行、オンデバイス推論、低遅延ストリーミングパイプラインなどを中心に据えた設計方針が示唆されます。本リポジトリは現時点で最小限のファイル構成ですが、エコシステム化を目指すためのスケルトンや方針文書としての役割を持つ可能性があります(約300字)。
シングルファイルPHPで使えるAIチャットインターフェース
2025/11/26
単一ファイルで完結するPHP製のAIチャットインターフェースです。Ollama(ローカルLLM)とOpenAIの両方に対応し、Node.jsやDocker、ビルド手順を不要にする設計。PHP 8.0+で動作し、最小構成で既存PHP環境へドロップインして会話UIを提供します。開発・カスタマイズのしやすさと配布の簡便さを重視した軽量な実装です。(約300字)
splintr — 高速BPEトークナイザー(Rust製、Pythonバインディング付き)
2025/11/26
Rustで実装された高性能なBPE(Byte Pair Encoding)トークナイザー。速度と安全性、リソース最適化に焦点を当て、Cargo/CratesおよびPyPI経由で利用可能なPythonバインディングを提供するプロジェクト。モデル推論前処理や大規模データのトークン化に適した軽量で堅牢な実装を目指す。
交易員分析アナライザー (Trader Analyzer)
2025/11/26
交易員分析アナライザーは、トレーダーの行動をロールプレイ方式で学習・解析するフロントエンド中心のツールです。市場状況に基づく次の一手の予測・採点、トレーダー思考のヒント提示、AIによる操作予測やプレイヤーとトレーダーのマッチング支援を提供し、学習効率を高めるインタラクティブな学習プラットフォームを目指します。
AI-INVOICE-OCR-ENGINE — 請求書向けAI OCRエンジン
2025/11/27
本リポジトリは、PaddleOCR v5をベースに構築された請求書・会計書類向けのAI OCRソリューションです。中国語・英語に対応し、画像からの文字認識だけでなく、請求書特有のレイアウトやテキスト抽出を意識した最適化が施されています。デモ画像やCLIを備え、実運用向けにカスタマイズしやすいPython実装が特徴です。(約300字)
Awesome-artist — 高品質図表コレクション
2025/11/27
本リポジトリはトップ会議(Top Conferences)で発表された論文から厳選した高品質な図や表、ワークフロー図、フレームワーク図を集めたキュレーションリポジトリです。研究・論文作成やスライド作成時の参考資料として利用でき、各学会の代表的な図版を分かりやすく参照できることを目的としています。現在はREADME中心の構成で、将来的には図版の整理・タグ付けやライセンス情報の明示、検索性向上が期待されます。(約300字)
G2VLM:幾何で支える視覚言語モデル
2025/11/27
G2VLMは「Geometry Grounded Vision Language Model with Unified 3D Reconstruction and Spatial Reasoning」というタイトルで示される、幾何情報に基づいて視覚と言語を統合する研究プロジェクトの実装リポジトリです。本リポジトリは、2D画像と幾何(3D再構築)を結びつけ、空間的推論(spatial reasoning)を可能にするビジョン・ランゲージモデル(VLM)を目指しています。統一的な3D再構築と空間推論のフレームワークを提供し、視覚質問応答や空間関係理解、ロボットの環境理解など応用が期待されます(概要300字程度)。
Prompt Engineering Techniques Hub(プロンプトエンジニアリング技術集)
2025/11/27
このリポジトリは「25以上のプロンプトエンジニアリング手法」を実装で示す学習・参照用コレクションです。Basic と Advanced の2つのディレクトリに手法ごとの実例やテンプレートを整理しており、実務や研究で使えるプロンプト設計パターン、例示(few-shot)、役割付与、分解・チェーン処理などの実践的テクニックを短時間で習得できます。READMEやサンプルで導入しやすく、拡張・寄稿も容易です。
VG-Refiner:ツールで洗練する参照付与グラウンディング推論
2025/11/27
VG-Refinerは「Tool-Refined Referring Grounded Reasoning via Agentic Reinforcement Learning」という研究に基づくリポジトリです。本プロジェクトは、外部ツール(検索やビジュアルモジュールなど)をエージェント的に活用し、参照表現(referring expressions)に基づくグラウンディング推論精度を高めることを目的としています。ModelScope上のデータ・モデル連携や学習済み重みの配布が示されており、エージェント型強化学習でツール選択や用法を最適化するワークフローを含む点が特徴です(300字程度)。
DeepSeek-Math-V2(数学推論モジュール)
2025/11/27
DeepSeek-Math-V2は、DeepSeekチームが公開した数学的推論に関する資料と出力例をまとめた軽量リポジトリです。中心となるDeepSeekMath_V2.pdfと図表(figures)、実験結果や生成出力を格納したoutputsディレクトリを含み、数学タスクに対するモデル設計や評価結果のドキュメントを提供します。実装コードは含まれておらず、論文/報告資料としての参照・解析が主目的です(300字程度)。
潜在空間で可視化する音楽ビジュアライザ(latent-musicvis)
2025/11/27
Stable Audio VAEで得た音声の潜在表現(64次元)をUMAPで3次元に射影し、ブラウザ上でインタラクティブに探索・再生できるツールです。音声を小さなチャンクに分割してエンコードし、各チャンクを点として配置。クリックすると対応する音声を同期再生でき、潜在空間の構造や時間的連続性を直感的に理解できます。研究・可視化・サウンドデザインに活用できる軽量なプロトタイプです。
runprompt — .prompt ファイルを実行する小さなPythonスクリプト
2025/11/27
runpromptは、Googleのdotprompt形式(.promptファイル)をそのまま実行できる、単一ファイルのPythonスクリプトです。YAMLフロントマターでモデル指定を行い、ハンドルバー風のテンプレート記法で入力を埋め込み、環境変数で設定したプロバイダのAPIキーを使って指定モデルへリクエストを送信します。依存が最小で持ち運びやすく、シンプルにローカルでプロンプトテンプレートを試したい開発者に向いたツールです。(約300字)
Qwen2-Audio — Qwen2 音声大規模言語モデル(Alibaba Cloud 公式)
2025/11/28
Alibaba Cloud が提案する音声向け大規模言語モデル Qwen2-Audio の公式リポジトリ(ミラー/ビルド例)。本リポジトリは Qwen2-Audio の事前学習済みモデルやチャット機能の紹介、デモ用資産、評価用オーディオ例を含み、ModelScope や Hugging Face へのリンクが整備されています。Python ベースで実験や推論、デモ実行の足がかりとして利用できる構成です。(約300字)
シンプルなスパム分類器(simple-spam-classifier)
2025/11/28
シンプルな機械学習演習プロジェクトで、scikit-learn のロジスティック回帰を用いてSMSメッセージを「spam / ham」に分類するモデルを構築・保存し、Flaskアプリで予測を試せるようにしたリポジトリ。学習パイプライン、前処理、モデルの永続化と簡易Webインタフェースが含まれ、機械学習入門やプロトタイピングに適した構成です。(約300字)
ECG・PPG融合による呼吸数推定(リアルタイム)
2025/11/28
本リポジトリは、ウェアラブルから取得したECG(心電図)とPPG(光電容積脈波)信号を融合してリアルタイムに呼吸数(Respiratory Rate, RR)を推定するアルゴリズムを実装したプロジェクトです。ECGのR–R間隔変調(RSA)、PPGの振幅変調(AM)、および基線変動(BM)から呼吸成分を抽出し、時間–周波数(TF)解析用に動的窓幅を採用して信号品質や周波数変動に追随します。ウェアラブル環境でのノイズやモーションアーチファクトに配慮した設計で、リアルタイム処理とセンサ融合を重視した実装例を提供します(約300字)。
HydroJobSche(Hydro Job Scheduler)
2025/11/28
軽量なPyTorchトレーニング用ジョブスケジューラ。operator(Conv2d/Linear等)単位でフォワード/バックワードにフックを挿入し、Unixシグナル(SIGUSR1/SIGUSR2)で実行時にトレーニングを一時停止・再開できる設計。既存の学習ループをほとんど改修せずに組み込め、GPUリソースのプリエンプションやクラスタ運用でのきめ細かな制御を実現することを目指す。Python 3.7+/PyTorch 1.8+が前提。
Paper-Comicizer(論文をコミックに変換するツール)
2025/11/28
本リポジトリは、学術論文の冗長で専門的な内容を「ドラえもん」風の子供向けコミックに変換するためのプロトタイプ実装です。Gemini 3 Proを用いた要約・脚本生成と、フロントエンド(React + Vite + TypeScript)によるUIで、PDFからテキストを抽出して会話形式・コマ割りを作成し、ビジュアルなコミック出力を目指します。研究紹介や教育用途のデモとして、プロンプト設計やレイアウト生成の参考になります(APIキーや著作権には注意が必要)。
AIを構造的に完全な主体として(ai-structural-subject)
2025/11/29
本リポジトリは「S₀アーキテクチャ」によるAIの正式な理論枠組みを提示します。意識や感情といった人間的側面は扱わず、入力の受領・反応の形成・集合的状態遷移への参加といった、主体と見なすために必要最小限の構造的性質に焦点を当てます。形式的・厳密な立場から「主体性(subjectivity)」を定義・検討し、アーキテクチャの限界や具体例、参考リンクを簡潔にまとめた軽量な研究ノート群を含みます(理論中心、実装非依存)。
CortexNodus:ノード操作で構築する可視化AIトレーニングワークベンチ
2025/11/29
CortexNodusは、FlaskとLiteGraph.jsを組み合わせたビジュアルなAIトレーニング環境です。ドラッグ&ドロップでデータ準備、モデル定義、訓練、評価までの深層学習パイプラインをノードベースで組み立て、バックエンドで自動的にPyTorchコードを生成して実行します。MNISTやCIFAR-10などの標準データセットが組み込まれており、非エンジニアでも視覚的にモデルを設計して学習させられるのが特徴です。(約300字)
HomeLab Log Analyzer — ローカルLLMで自動要約するDockerログ解析ツール
2025/11/30
HomeLab-Log-Analyzerは、完全ローカルで動作する自動化されたログ解析システムです。Dockerコンテナの雑多なログを収集してノイズ(ヘルスチェックや定期的なping、スパム、重複行など)を除去し、ローカルにホストした言語モデル(LLM)で夜間に要約・構造化します。クラウドやAPI費用を使わずに運用でき、JSONなどの機械可読フォーマットで出力して監視やインシデント対応に組み込めます。
ShowImageWeb — Streamlitで作るAI画像生成Webインターフェース
2025/11/30
Streamlit上に実装されたAI画像生成のWebインターフェース。シンプルなUIで画像生成ワークフローを提供し、ローカル/コンテナ環境での起動が容易。Dockerサポートや軽量な構成により、プロトタイプやデモ用途に適した設計になっています。(約300字)
結合電気・弾性動的波を扱う統一物理情報ニューラルネットワーク(1D圧電)
2025/12/1
1次元圧電モデルを用いて、電気と弾性の結合波動伝播を物理情報ニューラルネットワーク(PINN)で統一的に解くための実装リポジトリです。論文「A Unified Physics-Informed Neural Network for Modeling Coupled Electro- and Elastodynamic Wave Propagation Using 1D Piezoelectricity」のソースコードを収録し、方程式に基づく損失設計、初期境界条件の扱い、解析解との比較評価が可能な構成になっています。研究用途の再現・拡張に適したPython実装です。
CHAT-GPTによるデータ分析アプリ(Analise-com-CHAT-GPT)
2025/12/1
GitHubリポジトリ「Analise-com-CHAT-GPT」は、ブラウザ上でExcelファイルを読み込み、ChatGPT(AI)を使ってデータ分析の要約や洞察を得られるシンプルなウェブアプリのサンプルです。リポジトリには動作確認用のサンプルExcelファイルと単一のHTMLファイル、READMEが含まれており、GitHub Pagesでホストされたライブデモが提供されています。クライアント側でのファイル読み取りとAI連携のデザイン例として学習・プロトタイプ用途に適しています(セキュリティやAPIキーの取り扱いに注意が必要)。
Machine_Learning_Samples — ホテルレビュー分析サンプル
2025/12/1
本リポジトリは、ホテルレビューを扱う小規模な機械学習サンプル集です。Jupyter Notebook と CSV データを用いてレビューの前処理、探索的データ解析、機械学習モデルの適用(分類やスコア予測など)を実践的に示すことを目的としています。学習用サンプルとして、NLP の基本的なパイプライン構築や評価手法の理解に適した構成です。(約300字)
LLMSession-Docker — Web版LLMセッションをラップする統一API(Docker化)
2025/12/1
Webブラウザ上の大規模言語モデル(ChatGPT、Claude、Google AI Studio/Gemini)をヘッドレス自動化で操作し、個人のサブスクリプションをAPI化するプロジェクト。トークン課金のないWeb層を利用してセッション管理、プロンプト送信、会話チェーンの取り扱いを統一したRESTfulインターフェイスで提供します(Dockerコンテナ化、Python実装)。
StemLab — ローカルで動く高品質ステム分離ツール
2025/12/1
StemLabは、ローカル環境(Windows向け)で動作するプロフェッショナル品質の音源ステム分離アプリケーションです。最先端のAIモデル(Demucs、MDX-Net)を組み合わせ、ボーカル/ドラム/ベース/その他といったステムをクラウドにアップロードすることなく高精度に抽出します。サブスクリプション不要・使用制限なしで大量の楽曲を扱える点が特徴です。配布は実行形式(Exe)が用意されており、テスト用スクリプトやデバッグ用パイプラインも同梱されています。
YOLOv8 火災検知(全図疑似ラベリング)
2025/12/2
本リポジトリは、検出用のバウンディングボックスが存在しない画像のみのデータセットに対して、「全図疑似ラベリング(full-image pseudo-labeling)」という弱教師あり手法で分類問題を検出問題に変換し、YOLOv8nを用いて火焔(炎)を検出するプロジェクトです。Apple M3向けの最適化(MPS/AMP/大バッチ)を行い、高いmAP性能とGrad-CAMによる可視化を報告しています。(約300字)
ComfyUI Point & Prompt — 点選式プロンプト編集ノード
2025/12/2
ComfyUI-PointAndPrompt は、ComfyUI 用の Human-in-the-loop(人間介在型)多モーダルプロンプト編集ノードです。ノード上で画像を即時プレビューし、画像上をクリックして丸数字のマーカー(①②③…)を付与、対応する「カプセル」タグをテキスト入力欄へ自動挿入します。さらに実行時にマーカーを出力画像へ焼き込む(burn-in)機能も備え、視覚的に指示点を管理しながらプロンプトを組み立てられます。
Four Over Six — NVFP4量子化を改善するAdaptive Block Scaling
2025/12/2
NVidiaの4ビット浮動小数点(NVFP4)量子化の精度を向上させる手法「Four Over Six(4/6)」の実装リポジトリ。効率的なNVFP4量子化と行列乗算のカーネル、そしてポストトレーニング量子化の高速化を提供し、学習済みモデルをほとんど再学習せずに低ビット化して推論効率を高めることを目的とする。リポジトリはPythonを中心としたコードで、カーネルやユーティリティを含む構成になっている(300字程度)。
TinyZeroWithSFT の紹介:小型モデルで学ぶ自己検証と探索
2025/12/2
TinyZeroWithSFT は、DeepSeek R1 Zero の再現実験を小規模に実装したリポジトリです。カウントダウンや乗算といったタスクを対象に、veRL をベースにした強化学習(RL)と SFT(教師あり微調整)を組み合わせ、3B級のベース言語モデルに自己検証(self‑verification)や探索(search)能力を獲得させる手法を提示します。低コスト(<$30)で実験可能な点も特徴です。
VLASH — リアルタイムVLAのための非同期推論フレームワーク
2025/12/2
VLASHは「Real-Time VLAs via Future-state-aware Asynchronous Inference」を掲げる、Vision–Language Assistant(VLA)のファインチューニングと推論を効率化するPythonベースのフレームワークです。非同期推論により応答速度(反応性)を高めつつ、将来状態予測を組み込むことで映像や動作の滑らかさを保ち、実運用での遅延・カクつき問題に対処します。軽量化・モジュール化されたコード構成とベンチマーク/サンプルが含まれ、実装・評価ともに扱いやすい点が特徴です。
DeepClaude — Flutter製 Claude風デスクトップクライアント
2025/12/2
Flutterで実装されたオープンソースのデスクトップAIクライアント。UIはClaude Desktopを参照し、中国国内向けの大規模言語モデル(大模型)をサポート。クロスプラットフォーム対応で無料・オープンソース、軽量なコードベースとシンプルな設定でローカルやクラウドのモデルに接続して会話型AI体験を提供します。(約300字)
ai-toolkit 用 TensorBoard パッチ(Tensorboard_patch_for_ai-toolkit)
2025/12/2
ai-toolkit に対して TensorBoard ロギングと Web UI への埋め込み機能を追加するパッチ集です。トレーニング中の loss 等を自動で TensorBoard に出力し、Web UI 内に TensorBoard ページを組み込んで「ワンクリックで起動」できるボタンを提供します。付属の start_webui.bat によりブラウザ自動起動も可能で、ai-toolkit の可視化ワークフローを手早く拡張できます(パッチは ai-toolkit リポジトリ直下に設置して利用します)。
WriterClone — AIによる「書き手の分身」
2025/12/2
WriterCloneは、個人の文体や表現の癖(いわば「文字DNA」)を学習し、指定したシーンに合わせて自動で文章を生成・整形するオールインワン型のAI執筆アシスタントです。朋友圈(WeChat Moments)や小红书、公众号(公式アカウント)、知乎、メール、週報など10種類以上のテンプレートを内蔵し、文体の解析、トーン調整、絵文字やレイアウトまで自動で提案。さらに生成した文章に合った配図をAIで描画する機能も備え、執筆から配信までのワークフローを高速化します(MITライセンス、Vue 3 + Python 3.11+、Docker対応)。
Lucky Universe 2026(lucky-2026)
2025/12/2
2026年の運勢を個人化して届けるWebアプリ「Lucky Universe 2026」のリポジトリ。Google Gemini 2.5 Flashなど生成型AIを活用し、生年月日とMBTIをもとに一意の運勢アドバイスとピクセルアート風の「ラッキーダマゴチ」を生成します。デイリーの運勢スコア、ミッション、ロト番号などエンタメ要素も備えたチーム開発プロジェクトです。(約300字)
コズミック・ゴシップ(Cosmic Gossip)— おしゃべりエイリアンのスペースインベーダー
2025/12/3
Cosmic Gossipは、古典的なスペースインベーダーを“おしゃべり”化した遊び心あるプロジェクトです。単に撃ち合うのではなく、各エイリアンがGoogleのGemini APIによって生成された個性(意見、愚痴、噂話)を持ち、ゲーム中に地球のニュースや家賃事情などを語り合います。フロントエンドは主にJavaScriptで実装され、アセットやバナー画像を含むシンプルな構成。MITライセンスで公開され、開発や貢献を歓迎する姿勢が示されています(約300字)。
Spark Resume AI — オーストラリア向けAIレジュメ最適化ツール
2025/12/3
オープンソースのレジュメ最適化ツール「spark-resume-ai」は、オーストラリアの求人市場向けに設計されたAI支援のレジュメ改善キットです。TypeScript と Next.js を基盤に、採用担当者の20年以上の知見を活かしたプロンプトや評価軸を組み込み、履歴書の内容を求人に合わせてリライト、要約、キーワード最適化することを目的としています。小規模リポジトリながら、AIサービス接続(ai-service.ts)や環境変数のサンプルを含み、開発・拡張しやすい設計が特徴です。MITライセンスで公開されています。
AIRA:レコメンダー研究支援AIアシスタント
2025/12/3
LangGraphを基盤としたリサーチ/設計エージェント「AIRA」は、論文PDFとビジネス・データ要件を入力すると、推薦システムのアーキテクチャ設計や実験ロードマップを自動で提案します。論文の自動ロードとチャンク分割による要約・重要情報抽出、KPIや制約との整合、オフライン/リアルタイム両対応のアーキテクチャ設計、ベースラインとA/B実験計画の生成など、研究から実運用までの検討を高速化するツールです(実行にはOpenAIキー等の設定が必要)。300字程度の簡潔な説明です。
Nano Banana Pro プロンプト集(awesome-nano-banana-pro-prompts)
2025/12/3
500以上の厳選されたNano Banana Pro用プロンプトを集めたオープンソースライブラリ。画像付きのプロンプト、マルチリンガル対応、即時ギャラリープレビュー機能を備え、プロンプトエンジニアリングの共有・再利用を容易にするTypeScriptベースのリポジトリです。CC BY 4.0で配布され、コントリビューションやカスタマイズもしやすい構成です。
AI-Powered-HealthCare-Solutions(医療向けAIソリューション)
2025/12/4
本リポジトリは、臨床の音声/文字トランスクリプトから医療コード(ICD-10、HCC)を自動生成するRAG(Retrieval-Augmented Generation)と大規模言語モデル(LLM)を組み合わせたワークフローと、薬剤情報の要約を行うLLMエージェント実装を含みます。研究・プロトタイピング向けにJupyter NotebookとPythonスクリプトでパイプライン例、そしてDocker展開に関するドキュメントを提供します。(約300字)
Aria ハンドトラッキングとSLAM(Aria_HandTracking_and_Slam)
2025/12/4
MetaのAria Gen1グラスを用いたハンドトラッキングとSLAM(自己位置推定/地図作成)に関する実験的なリポジトリです。データ収集手順や前処理(デヴィネット用マスク適用)を含む簡易スクリプトが含まれており、Python環境(conda, Python 3.10)で動作します。現状は小規模なプロジェクトで、手早くAriaデータを収集してSLAMやハンドトラッキング研究に繋げるための出発点として利用できます(約300字)。
AI研究者ブログ資源大全
2025/12/4
このリポジトリは、世界の主要AI研究者や組織が公開する技術ブログや解説記事を体系的に収集・整理したキュレーション集です。100件以上の厳選リソースを6つの派生分野別に分類し、入門から研究者レベルまでをカバーする5つの学習パスを提示します。OpenAI、DeepMind、Anthropicなどの一流機関に加え、中国の主要プレイヤーも網羅。Markdownで管理され継続的に更新されるため、学習・情報収集の出発点として便利です(約300字)。
MCI(Model Context Intelligence)設計パターン — インテリジェントなマルチモデル編成
2025/12/4
Model Context Intelligence (MCI) は、複数の機械学習モデル(特に大規模言語モデルと専門モデル)を智慧的に編成・振り分けするためのアーキテクチャ設計パターンを提案するリポジトリです。モデル選択、コンテキスト管理、コスト・レイテンシの最適化、フォールバック戦略といった実運用で必要となる要素を整理しており、集中化したフロンティアモデル依存の課題を解消するための設計指針を提供します(概要説明 約300字)。
T3ST — BASILISK DOJO(敵対的AIトレーニングアリーナ)
2025/12/4
T3ST(BASILISK DOJO)は "Adversarial AI Training Arena" を謳うリポジトリで、攻撃的(offensive)モデルの訓練や敵対的手法の実験を目的としたプロジェクト構成が見て取れます。Python 3.9+ を前提とした軽量なコードベースで、データ集約スクリプトや簡易アプリケーション(app.py)、アセット管理用ディレクトリなどを備え、サンプルや実験ノートとして使える骨組みを提供します。一方で意図する用途は悪用に繋がる恐れがあるため、倫理的・法的配慮が必要です(約300字)。
Z-Image Turbo トレーナー(AC-RF LoRA 微調整)
2025/12/4
AC-RF(Anchor-Constrained Rectified Flow)をベースに、Z-Image Turbo モデルのLoRA微調整を行うトレーニングツールです。アンカー点サンプリングやMin-SNR重み付けで安定した学習を実現し、GPUハードウェアを自動判定して最適化(Tier S/A/B)します。Vue.jsによるWebUIとWebSocketでリアルタイム監視が可能な、実用的な微調整ワークフローを提供します(約300字)。
大気・水質汚染の関連性解析(データマイニング)
2025/12/5
本リポジトリは、世界各地の都市データを用いて大気汚染と水質汚染の間に潜在的な関連性が存在するかを探索するデータマイニングプロジェクトです。未監督学習(クラスタリング)とアソシエーション解析を組み合わせ、データの標準化・前処理からパターン発見までを実装したコードと、関連する研究記事・データセットを同梱しています(分析手法の適用例や結果解釈の基盤を提供)。
AgenticSqlAgent — Agentic AIで学ぶSQLエージェントの実装例
2025/12/5
AgenticSqlAgentは、LangChain、React、FastAPI、SQLiteを組み合わせて「エージェント的」なAIが自然言語からSQLを生成・実行し、販売データベースに関する質問に答えることを示す教育用サンプルプロジェクトです。小規模なコードベースとDocker構成で手早く試せ、エージェントのツール利用、プロンプト設計、API連携、セキュリティ上の注意点(SQLインジェクション等)の学習に適しています(約300字)。
HARM — 医学画像の分布外検出に向けた混合ロバストフレームワーク
2025/12/5
HARMは「医学图像分布外检测的混合鲁棒框架」と名付けられた、医療画像領域における分布外(OOD: Out-Of-Distribution)検出のための混合ロバスト性フレームワークです。2025年第三届大湾区科技竞赛で二等賞を受賞した研究成果を含み、論文PDF、実験コード、デモ用画像が同梱されています。Pythonで実装され、臨床画像の異常・未知パターン検出に注力した手法群と実験設計を提供します(約300字)。
Light-X — カメラと照明制御に対応した生成型4Dビデオレンダリング
2025/12/5
Light-Xは「Generative 4D Video Rendering with Camera and Illumination Control」を謳う研究実装リポジトリです。空間(3D)+時間(4D)の連続表現を生成的に学習し、カメラ経路や照明条件を制御して高品質な時間変化するビデオ/ビュー合成を行うことを目的としています。Python実装でデモスクリプトや設定ファイルを含み、研究復現や改良の土台として利用できます(実行環境や重みは別途確認が必要です)。
TeleMem — 高性能マルチキャラクタメモリシステム
2025/12/5
TeleMemはMem0と完全互換の高性能メモリ管理システムで、マルチキャラクタ(複数ペルソナ)対応、長期対話メモリ、セマンティック重複排除、マルチモーダル(動画)推論など複雑なユースケースに最適化されています。対話履歴の意味的索引・検索や長期保存戦略を備え、エージェントやチャットボットの記憶基盤として設計されています。
nsfw — 軽量NSFW(アダルト画像)識別API
2025/12/5
軽量でCPU上の推論に最適化されたNSFW(ポルノ/成人向け)画像検出リポジトリ。Hugging FaceのViTベースの検出モデルをラップしてHTTP API化し、VPSやクラウドの小規模インスタンスでプライベートに運用できます。jpg/png/bmp/webpに対応し、認証付きアクセスやDockerデプロイをサポートするシンプルな実装です。(約300字)
Zenith Image Generator — Z-Image(Gitee AI連携のテキスト→画像Webアプリ)
2025/12/5
GiteeのAI API(z-image-turbo)を利用したモダンなText-to-Image(テキスト→画像)生成Webアプリ「Z-Image(zenith-image-generator)」。ReactとHonoを中心としたTypeScript構成で、ダークモードのGradio風UI、多数のアスペクト比プリセット、Cloudflare Pagesへのデプロイ対応などを備え、ブラウザから手軽にGiteeの画像生成モデルを試せるクライアント+軽量サーバ側の参照実装です。(約300字)
ハイパースペクトル道路品質解析 — NYC
2025/12/6
NYUのハイパースペクトルデータを用いた舗装(道路)分類の研究用機械学習パイプライン。288バンドの高次元スペクトルデータを前処理・特徴抽出し、LiDAR由来の地上真値で検証することで65〜70%の分類精度を報告するリポジトリ。データはNYU限定の許可が必要で、再現には同等のハイパースペクトルデータが必要。
nz_carhub — NZ CarHub(AI Studioアプリ)
2025/12/6
NZ CarHubは、TypeScriptで構成された初期段階のAI Studio向けフロントエンドプロジェクトです。ローカルでの実行手順やAIモデル(Gemini)のAPIキー設定をREADMEで案内しており、App.tsxやcomponentsフォルダを持つReact系のシングルページアプリ構成を想定しています。現状は開発初期(コミット数・ファイル数が少ない)で、AI Studio上での動作確認やデプロイを前提にしたサンプル/テンプレート用途に適しています。(約300字)
StrataLens AI(ストラタレンズAI)
2025/12/6
StrataLens AIは、米国上場企業の決算説明会(Earnings Transcripts)やSEC提出資料を一次資料として参照し、出典(Citation)付きで示唆を返すオープンソースのエクイティリサーチ支援プラットフォームです。AIを用いたコパイロットとして、トランスクリプトの逐語情報と将来的な10-K/10-Qの解析を組み合わせ、投資リサーチの効率化と透明性向上を目指します。(約300字)
Business Gemini 2API 管理システム
2025/12/6
Google Gemini Enterprise API をプロキシし、複数アカウントのローテーション、OpenAI互換のAPIエンドポイント、そしてブラウザベースの管理コンソールを提供する Flask ベースの軽量サービスです。cookie の有効期限処理の修正など実用的な改善が加えられており、社内運用や実験環境で Gemini を複数アカウントで安定して回す用途に適しています。(約300字)
Semantic Code Search(セマンティックコードサーチ)
2025/12/7
AIを活用した自然言語ベースのコード検索ツール。コードベースを関数やコメント単位で分割してベクトル埋め込みを作成し、ユーザーの自然言語クエリをベクトル化して類似度検索を行うことで、高精度なコード検索を実現します。Reactフロントエンド、FastAPIバックエンド、Pythonの埋め込み処理を組み合わせたフルスタック構成で、デモはVercel上で公開されています(MITライセンス)。開発・検証を速やかに行えるDockerfileやREADMEも備えています。
Gemini-3-Pro:Cloudflare Worker版 StockAI-2API(Chimera)
2025/12/7
Gemini-3-Pro は、StockAI-2API の「Chimera」エディションを Cloudflare Workers の単一ファイル(single-file)形式で提供する軽量ラッパーリポジトリです。Apache 2.0 ライセンスの下で公開され、worker.js 単一ファイルで動作するため、Cloudflare Workers へのデプロイが簡単に行えます。主に JavaScript で実装され、エッジでの低遅延な API 中継やプロキシ、簡易な AI モデル呼び出しの用途に向いています。ドキュメントや設定は最小限で、即時デプロイを想定した設計です。(約300字)
LMProbe — LLM可用性プローブと統一ローカルAPI
2025/12/7
LMProbeは、複数のLLM(大規模言語モデル)APIエンドポイントを自動でプローブ(可用性確認)し、利用可能なモデルを検出してローカルで統一されたAPIとして提供する軽量プロキシです。OpenAI形式とAnthropic Claude形式の両方に互換するエンドポイントを備え、事前プローブ済み設定の保存、バックグラウンドでの継続的ポーリング、正規表現によるモデルフィルター機能などを持ち、開発環境やテスト、フォールバック構成の確認に便利です。ローカルで複数プロバイダをまとめて扱いたい開発者向けのツールです。
Memory Transformer — テキスト向けニューラルメモリ
2025/12/7
Transformer風のエンコーダと学習可能なメモリスロットを組み合わせ、外部ベクトルデータベースを使わずにテキスト記憶の保存と検索を行う軽量なPyTorchライブラリ。オフラインでの高速な参照、エージェントやチャット履歴のメモリ保持、埋め込みベースの近似検索を小さなモデルで実現することを目的としている。
Yet Another Claude Code の日本語タイトル
2025/12/7
Claude(Sonnet 4.5)をコアにした、最小限で拡張しやすいAIコードアシスタント実装。Python 3.10+で書かれ、MITライセンスの下で提供されるプロトタイプ的リポジトリで、シンプルな設計と短いコードベースにより学習用途やカスタム実装の土台として扱いやすい点が特徴です。(約300字)
DeepRWKVによる推論強化フレームワーク
2025/12/7
RWKVアーキテクチャを活用し、推論時に高度な探索アルゴリズムを組み合わせてLLMの「System 2」的思考能力を強化するフレームワーク。非同期で高並列なモンテカルロ木探索(MCTS)エンジンと「Parallel Universe Search」を中核に、テスト時探索(test-time search)での効率的な状態管理やGPU活用に配慮した実装を提供するプロジェクトです。(約300字)
The Crucible Writing System — Claude向け小説執筆支援システム
2025/12/7
The Crucible Writing Systemは、Claude向けに設計された三つのスキル(Claude skills)を統合したAI支援型の小説執筆システムです。36ビートで構成される「Crucible Structure」を中核に、物語を三重の筋として編成し、発想段階からプロット作成、章ごとの執筆と推敲までをガイドすることで、テーマの一貫性と構造的完成度の高い初稿作成を支援します(約300字)。
スクリーンショットからコードへ — code-from-screenshot
2025/12/7
このリポジトリは、スクリーンショットやURLから自動的にフロントエンドのコードを生成するツールです。GPT‑4 Visionで画像中のレイアウトやテキストを解析し、HTML/Tailwind CSS、React、Vue、Bootstrapなどのコードを出力します。さらにDALL·E 3で類似の画像を生成したり、ライブサイトのクローンを試せる機能を備え、プロトタイピングやデザインのコード化を高速化します。TypeScriptで実装された小規模なプロジェクトです。
LDA_PCA — LDAとPCAによる次元圧縮と識別(宿題ノートブック)
2025/12/8
Jupyter Notebook形式で提出された宿題リポジトリ。主にPCA(主成分分析)とLDA(線形判別分析)を扱うノートブックが含まれており、次元削減とクラス識別の基礎的な実装・可視化・評価を目的としていると推測されます。データ前処理、投影、可視化(散布図や分散寄与の確認)、および簡易的な分類評価が示されている可能性が高い教材的な内容です(約300字)。
AIエージェントシステム(ai-agent-system)
2025/12/8
このリポジトリは、モジュール式のAIエージェントワークフローを提供するPythonベースのプロジェクトです。専門化された複数のエージェントをオーケストレーションして複雑なタスクを自動化し、カスタムツールや継続的な評価を組み合わせる設計が特徴です。環境設定用の.env例やエージェント実装を格納するディレクトリなど、実装と運用を始めるための構成が含まれています(約300字)。
Constructivist-AI — 構成主義的パターン学習アーキテクチャ
2025/12/8
Constructivist-AI は、パターンを学習しそれらの構造的性質を発見、そしてその性質を利用して自身の学習を加速させることを目指した研究プロトタイプの認知アーキテクチャです。本リポジトリは Java 実装(Java 7+)でシンプルに構成されており、透明で合成的なパターン形成を通じて効率的な知識獲得を達成するという「構成主義(constructivist)」の考え方を実験的に実装しています。MIT ライセンスの下で公開された初期アルファ版です。
Awesome Pixel Flow — ピクセル空間拡散モデル論文集
2025/12/8
ピクセル空間(raw pixel)で動作する拡散モデルに特化した論文を系統的に収集したキュレーションリポジトリです。画像・映像生成を対象とし、潜在表現に依存しないエンドツーエンドのピクセル拡散手法を年代順に整理しています。最新のトランスフォーマーベース手法から古典的アプローチまでを網羅し、研究者や実装者の文献レビューや学習の起点として有用です(READMEのみで軽量な構成)。
semantic-memory — PGlite と pgvector を使ったローカル意味記憶
2025/12/8
Bun 上で動く軽量なローカル「意味記憶」ライブラリ。Postgres を WASM 化した PGlite を組み合わせ、pgvector (HNSW) による本格的なベクトル検索を実現します。外部ベクトルDB不要でコレクション単位の整理が可能、AIエージェントやローカル検索用途に最適です。(約300字)
toolkit — イベントカメラ用レンズフレア除去ツールキット
2025/12/8
イベントカメラにおけるレンズフレア除去を学習するためのツールキットです。本リポジトリは、イベントカメラ特有の出力(イベントストリーム)に対してレンズフレアを検出・除去する学習ベースの手法を提供します。ドキュメントやデモGIFを含み、英語・簡体中文のREADMEが用意されています。研究実装、データ準備、評価指標や実験設定を再現するための資料が整備されています。300字程度の説明。
DAComp — データエージェント評価ベンチマーク
2025/12/8
DACompは「Benchmarking Data Agents across the Full Data Intelligence Lifecycle」を目的としたオープンソースのベンチマークスイートです。データ発見から前処理、変換、解析、可視化、パイプライン化までのデータインテリジェンス全工程に対して、"データエージェント"(自動化されたエージェント/モデル)の能力を体系的に評価するフレームワーク、タスクセット、評価基準、およびデータセットを提供します。再現性のある評価と拡張性を重視し、研究者や実務者がエージェント設計や比較検証を行えるように設計されています。(約300字)
Editorial AI — 人間味を取り戻すライティング支援ツール
2025/12/8
Editorial AIは、機械的な「AIが書いた」印象を抑えて、人間らしい文体・トーンへと文章を整えるためのオープンソーステンプレートです。React/TypeScriptとTailwind CSSで構築され、Google Gemini APIを用いた深層推論で「AIらしさ」の検出と修正候補を提示。分割画面のエディタやトーン調整、デプロイ手順やバックエンド設計案を含み、実運用を見据えた実装ガイドが揃っています(約300字)。
Open-AutoGLM — モバイル向け AutoGLM ベースのスマートアシスタント
2025/12/8
Phone Agent を核とする Open-AutoGLM は、AutoGLM をベースにした「スマホ端末上の自動化アシスタント」フレームワークです。ADB(Android Debug Bridge)経由で実機を操作し、視覚言語モデルで画面内容を多モーダルに理解、意図解析と行動計画を組み合わせてユーザーの自然言語要求を自動実行します。ログインや認証などの敏感操作は確認や人手による引き継ぎが可能で、リモートADBデバッグもサポートします(開発初期段階のリポジトリ、サンプル実装中心)。今後の拡張でモバイルUX自動化やRPA用途に応用できます。
AI映画解説マスター(Cozeテンプレート)
2025/12/9
本リポジトリは「AI映画解説 — Cozeテンプレート」として、映画や短編ドラマの解説動画を“一気通貫”で自動生成する商用向けワークフローを提供します。脚本生成(流行スタイル模倣)、AI音声合成(多声・多様な表現)、自動素材収集とクリップ結合、BGMの感情マッチング、字幕生成までをAIで自動化し、MySQLによるデータ管理や商用利用(OEM/再販)を想定したテンプレートが含まれます。使い方や導入手順をまとめたPDFとデータベース初期化スクリプトが同梱されています。
Tempo API Proxy — Deno版(OpenAI互換ラッパー)
2025/12/9
Tempo.build の AI チャットインターフェースを OpenAI Chat Completions 互換のフォーマットで扱えるようにする、Deno 単一ファイル実行可能なプロキシ実装。依存なしで動作し、SSE ストリーミング、トークン自動更新、無料モード、Canvas 指定などの機能を備え、既存の OpenAI 呼び出しを最小限の変更で Tempo にリダイレクトできます。
AuthflowでChatGPTのカスタムGPTを収益化するガイド
2025/12/9
Authflow.aiを使ってChatGPT上のカスタムGPTを収益化するための初心者向け完全ガイドです。READMEでは、Paywallの追加、GPTの認証保護、サブスクリプション階層の作成、決済連携やアクセス制御の実装方法をステップごとに解説します。実務で使えるベストプラクティスや実装上の注意点、スクリーンショットを交えた手順で、開発経験が浅くてもカスタムGPTから収益を開始できるよう設計されています。(約300字)
DiffusionDriveV2 — 自動運転のためのRL制約付き切り詰め拡散モデル
2025/12/9
DiffusionDriveV2は、自動運転のエンドツーエンド制御を対象にした研究実装で、拡散モデル(Diffusion Model)を出発点として、強化学習(RL)で得られる行動制約や報酬情報を組み込んだ「Reinforcement Learning-Constrained Truncated Diffusion Modeling」を提案しています。サンプリングの切り詰め(truncation)により推論効率と安全性を向上させ、行動生成の多様性と現実的制御の両立を目指すアプローチです(約300字)。
OpenRouterBench — LLMルーティングのベンチマーク&ソリューション
2025/12/9
OpenRouterBenchは、複数の大規模言語モデル(LLM)やモデル提供元をまたいだ「ルーティング(どのモデルにどのリクエストを割り振るか)」の評価と最適化を目的としたワンストップのベンチマークおよびソリューションスイートです。データセット、評価スクリプト、ベースライン実装、Hugging Face連携などを備え、ルーティング戦略の定量的比較と実運用での適用検討を容易にします(MITライセンス)。
Integrative Practice for Intelligent Data(インテリジェントデータの統合実践)
2025/12/10
DescomplicaDigitalの講座課題として提出されたJupyter Notebook形式の小規模リポジトリ。課題名「Integrative Practice for Intelligent Data」に対応する学生の演習成果物で、データ分析やモデル構築の学習過程をノートブックでまとめたものと想定されます。ファイル数は少ないながら、教育目的の演習ノートとして再現性や解説のしやすさが特徴です(約300字)。
AN1 Core — 意味フィールドのリファレンス実装
2025/12/10
AN1 Coreは「意味フィールド(meaning fields)」という現象を示す研究用リファレンス実装です。Llama-70Bの早期層の活性化を低ランクの意味フィールドに圧縮し、層を凍結したまま小さなヘッドでフルファインチューニングと同等以上の精度を達成します。本リポジトリは論文と再現可能なベースラインを含み、商用のTurbo最適化などの独自実装はIP保護のため除外されています。研究者やエンジニア向けに、現象のコア部分を明快に示す設計と実験コードを提供します。
CLIProxyAPIPlus — 複数AIを一つのOpenAI互換APIで使うローカルプロキシ(簡単インストール)
2025/12/10
CLIProxyAPIPlus-Easy-Installationは、複数のAIプロバイダ(Gemini、Claude、GPT系、Qwen等)を単一のOpenAI互換APIエンドポイントから利用できるローカルプロキシ「CLIProxyAPIPlus」のワンクリック導入パッケージです。セットアップスクリプトと設定ファイルをまとめ、ローカル環境でプロバイダのルーティング、認証、切替を簡潔に始められるように整備しています。開発者やローカル運用者向けの導入支援リポジトリです。
P2M — LiDAR中心の動的環境向けエンドツーエンドナビゲーション
2025/12/10
P2Mは「RA-L'25」論文に基づく、LiDARを中心に据えたシンプルなエンドツーエンド型ナビゲーションフレームワークです。本リポジトリは、動的障害物が存在する環境下でセンサ入力(主にLiDAR)から制御命令までを学習・評価できる実装を提供します。論文、デモ動画へのリンクやシステム図、設定ファイル群、学習・評価用のアセットが含まれ、拡張や実験の再現に適した構成になっています(300字程度)。
vLLM-Kunlun — Kunlun XPU向け vLLM ハードウェアプラグイン
2025/12/10
vLLM-Kunlun は、Baidu の Kunlun XPU 上で高速に vLLM を動作させるためのコミュニティ保守ハードウェアプラグインです。vLLM の推論エンジンとハードウェア固有の実装を橋渡しし、デバイス抽象化、メモリ管理、カーネル最適化、通信レイヤーの統合を目指します。本リポジトリは Kunlun 環境向けのドライバ/ランタイム連携、設定例、ドキュメント、およびコミュニティサポートへのリンクを提供し、vLLM を Kunlun XPU 上でシームレスに運用するための出発点を示します。(約300字)
IITP_AGI_STT:AGI向けSTT/LLM微調整実験リポジトリ
2025/12/10
このリポジトリは、BridgeDataV2を用いて大規模言語モデル(LLM)を微調整(fine-tuning)するためのサンプル実装と実験成果をまとめたものです。データ変換から学習、評価、デモ用APIや結果ディレクトリ(例:canary-qwen-2.5b_ft_result)まで含まれており、研究開発や追加実験の出発点として利用できます。ドキュメントは最小限で、実行には外部データやモデル、計算資源が必要です(300字程度)。
LiveTalk — リアルタイム・マルチモーダル対話型ビデオ生成
2025/12/10
LiveTalkは「Real-Time Multimodal Interactive Video Diffusion via Improved On-Policy Distillation」を掲げるプロジェクトで、マルチモーダル条件(テキスト、音声、視覚入力など)に応答してリアルタイムにビデオを生成・操作することを目的としたディフュージョンベースのシステムです。研究論文・モデル(Hugging Face)・デモサイトへのリンクが用意されており、オンポリシー蒸留(on-policy distillation)による高速化と対話的制御を中心に、実用的なレイテンシ削減技術や推論最適化を組み合わせてリアルタイム性を達成しています。コードベースは比較的コンパクトで、設定ファイルやアセット、モデル参照を含みます(事前学習済みモデルは外部提供)。
Qwen-Image-Edit-StreamDiffusion — 高速リアルタイム画像編集WebUI
2025/12/10
Qwen-Image-Edit-2509モデルを用いた高速リアルタイム画像編集のためのWebUI実装です。StreamDiffusion系の手法に着想を得て、推論ステップ数削減やtorch.compile、量子化などの最適化を組み合わせることで、元の設定に比べて17〜28倍の大幅な速度改善を達成しています。ベンチマークスクリプトや最適化用の仕組みが含まれ、実験・評価がしやすい構成になっています(300字程度)。
HNタイムカプセル — 10年越しのHacker NewsをLLMで振り返る
2025/12/10
Hacker Newsの「ちょうど10年前」のフロントページを取得し、記事本文やコメントをスクレイピングして大規模言語モデル(LLM)で「後知恵」をもとに評価・分析し、HTMLレポートを生成する小さなパイプライン。過去の議論がどれだけ時代の先を行っていたか(あるいは外れていたか)を定量・定性的に検証する用途に向くツールで、データ取得からプロンプト設計、結果の整形までをワンファイル(pipeline.py)でまとめているリポジトリです(軽量で再現性が高い設計)。
リアルタイム翻訳字幕(macOS向け)
2025/12/10
Apple Silicon最適化の Whisper ベースによる macOS 向けリアルタイム音声認識+翻訳アプリ。faster-whisper(または mlx-whisper)を利用した低遅延な逐次文字表示、単語単位のストリーミング、非同期翻訳による UI ブロッキングの回避、画面オーバーレイによる字幕表示などを備え、ミーティングや配信で即時に音声を文字と翻訳で表示することを目的とした軽量ツールキットです。設定ファイルや音声キャプチャ周りのサンプルコードを含み、ローカルで高速に動作させることを想定しています。
Stirrup — 軽量エージェント構築基盤
2025/12/10
Stirrupは、LLMベースのエージェントを素早く構築できることを目的とした軽量なPythonライブラリです。依存を最小限に抑えたコア設計により、プロンプト管理、ツール統合、非同期実行などの基本機能を提供し、カスタムツールや外部プロバイダとの接続を容易に拡張できます。PyPIで配布され、シンプルなAPIで開発者がエージェントプロトタイプを素早く立ち上げられる点が特徴です。
AIによる顔の感情認識
2025/12/11
本リポジトリは、ビデオやウェブカメラの映像から人の顔を検出し、表情から感情を推定するAIプロジェクトです。OpenCV を用いた顔検出と、TensorFlow / Keras 相当の深層学習モデルを組み合わせてリアルタイムまたはバッチ処理で感情ラベル(例:喜び・悲しみ・驚きなど)を出力します。オリジナルの petercunha/Emotion をベースに、TensorFlow 2.x 互換化や pandas の最新仕様対応、環境構築ガイドと自動検証スクリプトを追加し、実環境で動かせるよう修正・最適化しています。
SocIA — CAIXAのバーチャルアシスタント(Next Sandbox)
2025/12/11
Experimento SocIAは、ブラジルの公的銀行 Caixa(Caixa Econômica Federal)向けに設計されたサンドボックス型のチャットボット実装リポジトリです。フロントエンドにHTML/CSS/JavaScriptを使用し、対話型アシスタントとして社会プログラムや銀行サービスに関する問い合わせに応答することを想定したプロトタイプを含みます。MITライセンスで公開され、デモ画像やアバター、バックエンド用ディレクトリを備えたシンプルな構成です。(約300字)
Arium — AI搭載のローカルファーストIDEとエージェントプラットフォーム
2025/12/11
Ariumは「ローカルファースト」設計のモジュラー型AI IDEです。コード編集、独立した自律エージェント、拡張可能なツールエンジン、マルチモデルアダプタ、仮想ファイルシステムを統合し、再現性・監査性・安全性に配慮した開発環境を提供します。オフラインでのローカル実行やプラグイン的なツール追加が可能で、研究・エンジニアリング・クリエイター向けのワークフローに適しています(約300字)。
Tele-Main — 遠隔操作ベースのVLAデータ収集
2025/12/11
Tele-Mainは、ROSを用いた遠隔操作(teleoperation)を中心に据えたVLAデータ収集アルゴリズムです。人間の示範をリアルタイムでロボットに転送するデュアルアーム方式や、取得したセンサデータの同期・整形・フィルタリングといったデータ精製処理を組み合わせることで、ロボット学習用の高品質なデータセットを効率的に構築することを目的としています。主にPythonで実装され、ROS通信とデータ前処理のワークフローを提供します(300字程度)。
AItestcase: AIによるテストケース自動生成ツール
2025/12/11
Qwen系大規模モデルを活用した「智能AI测试用例生成助手」のリポジトリ。要件文書(PDF/Word/TXT/HTML)やUI原型画像を解析し、OCRと自然言語処理で機能点を抽出、標準化されたテストケースをバッチ生成することを目的としたPythonベースのプロジェクト。ドッカー構成やデプロイスクリプトを含み、実運用向けのワークフローを想定した設計になっています(約300字)。
ComfyUI ローダー・ユーティリティ — モデル読み込み順の調整
2025/12/11
ComfyUI のモデル読み込みを柔軟に制御する軽量拡張です。全てのローダーノードに「Any」パラメータを追加して、出力タイプに依存せず接続できるようにし、ユーザーがノードの配置でモデルの読み込み順を調整できます。これにより起動時の一斉読み込みを避け、必要に応じた遅延読み込みや重複読み込みの回避(メモ化)を実現します。セットアップはシンプルで、ComfyUI のノード定義を上書き/拡張する形で動作します(約10ファイル、Pythonベース)。
適応知能フレームワーク(Adaptive Intelligence Framework)
2025/12/12
Adaptive Intelligence Framework(AIF)は、「境界で制御される適応過程」として知能を定式化する試みです。SymC(Symmetry-Constrained / SymC原理)に基づき、不確実性下でシステムがどのように整合性(coherence)を維持するかを、制約の交渉・規制・相転移という視点から研究します。ベンチマーク最適化や単純なスケールアップとは異なり、「適応的安定性(adaptive stability)」を重視する理論的・方法論的枠組みを提示することを目的としています。(約300字)
IPHS 391 最終プロジェクト — 市場不確実性とAIモデル不一致
2025/12/12
AIモデル間の「意見の不一致(disagreement)」を経済的不確実性の新たな指標として提案する学生最終プロジェクトのリポジトリ。リポジトリ自体は README とプロンプト定義のみのコンパクトな構成だが、アイデアは興味深く、モデルアンサンブルの出力分散を不確実性メトリクスとして活用し、VIXや伝統的な不確実性指標との相関や因果関係を検証する方向性が想定される。実装・データは限定的なため、再現性強化や計量分析の拡張が今後の課題となる。
Firearm Mortality & Gun Law Strength Dashboard(銃規制強度と死亡率ダッシュボード)
2025/12/12
アメリカ各州の銃規制の変化を「累積法規強度スコア」に変換し、州別の銃による死亡率と時間推移で関連性を探るインタラクティブなPlotly Dashダッシュボードと解析ノートブックのリポジトリ。データ加工・可視化・ダッシュボード配備までを含み、州別比較、時系列トレンド、地図表示などで政策とアウトカムの関係を直感的に追える構成になっています。(デプロイ済みのダッシュボードあり)
mvs — Mark V. Shaney風の最小限マルコフ乱文生成器
2025/12/12
Mark V. Shaney を模した非常に小さな Python 実装です。入力テキスト(book.txt)から単純なマルコフ連鎖モデルを構築し、ランダムに「らしさ」のある文節を生成します。実験や教育、プロトタイプ用途に適した最低限のコード(約32行)で、モデル構築の流れや拡張点が理解しやすいのが特徴です。
tenk — SEC開示書類対話AI
2025/12/12
SEC(米国証券取引委員会)の10-K/10-Qなど開示書類に対して自然言語で質問し、該当箇所を引用付きで返答することを目的としたPythonベースのプロジェクト。投資家やアナリストが大量の開示情報から素早く答えを得るためのRAG(検索強化生成)ワークフローを想定しており、Python 3.10+を前提とした軽量プロトタイプとして公開されています。(約300字)
Kiro用 OpenAI互換ゲートウェイ
2025/12/13
Kiro OpenAI Gatewayは、Kiro IDE(AWS CodeWhisperer)向けに設計されたOpenAI互換のプロキシゲートウェイです。FastAPIで実装され、OpenAIクライアントからのリクエストを受け取り、Claudeなどの代替モデル経由で応答を返すことで、OpenAI APIに対応したツールやIDEを無料のClaudeモデルや他のバックエンドと組み合わせて利用できるようにします。設定は環境変数で行い、シンプルにローカルやサーバー上へ導入できます(AGPL v3)。
音声・音響処理(Speech and Audio Processing)
2025/12/13
慶應義塾大学大学院の講義資料をまとめたリポジトリ。2025年度分の講義スライド(PDF)を中心に、音声生成、音声合成、音響特徴量、モデル化など音声・音響処理の基礎から応用までを扱う教材リソース。研究や授業、自己学習用のリファレンスとして利用できる。
EI-Beginner:具身智能入門演習
2025/12/13
EI-Beginner は具身(embodied)知能とヒューマノイド/ロボット制御の入門演習リポジトリです。OpenMOSS実験室の参加希望者やロボティクス初心者向けに、伝統的な運動学・制御理論から PyBullet/MuJoCo シミュレーション、実機(任意)までを学ぶための課題を整理しています。Git・Linux・検索ツールの基本を前提とし、段階的に実装・実験を進められる構成になっています。
VS Code Agents — ローカルワークスペース用エージェント定義集
2025/12/13
このリポジトリは、ローカルの VS Code ワークスペース内で使う「エージェント」役割定義を集めたコレクションです。各エージェントは *.agent.md 形式のマークダウンファイルで、責務(Responsibilities)、引き継ぎ(Handoffs)、ワークフロー(Workflows)などを明確に定義します。開発・設計・実装・QA・DevOps・セキュリティ・メモリ管理など、マルチエージェント協調のための役割分担テンプレートが含まれており、チーム内での役割設計や自動化パイプラインの定義、AI アシスタント群の振る舞い設計に活用できます。(約300字)
Inbox Zero for Claude — メール自動仕分けワークフロー
2025/12/14
Claude Code を活用して「Inbox Zero」を目指すためのオープンソースプロジェクト。メールの緊急度判定(VIP、キーワード、経過時間)、送信元やドメイン・本文に基づく自動分類、ルールに従った自動ファイリング、ユーザー志向の下書き生成、人物やトピックの文脈追跡などを組み合わせ、利用者の整理パターンを学習して処理効率を高める。Python ベースで構成され、Claude(Anthropic)のコード駆動ワークフローに対応するドキュメントや設定ファイルが含まれるリポジトリ。実運用ではメール API(IMAP/Gmail 等)や認証・ストレージと組み合わせて使う想定。
ML_DS-course — 120日で就職を目指す機械学習/データサイエンス学習記録
2025/12/14
これは作者が「120日(4ヶ月)」で機械学習/データサイエンスの就職準備を目指す過程を公開するリポジトリです。毎日の学習・演習・プロジェクトをドキュメント化し、Pythonの基礎からデータ処理、モデル構築、評価まで段階的に学ぶ構成を取っています。学習ログとコードを共有することで自己管理とポートフォリオ形成を同時に行うことを目的としています(約300字)。
police — AI監視映像検索ツール
2025/12/14
Moondream2を用いたローカル動作のAI搭載ビデオ検索ツール。PySide6によるデスクトップGUIとPythonバックエンドで、監視映像をフレーム単位で解析し「赤い服の人」や「白い車」のような自然言語クエリで検索できます。GPUの有無をチェックするユーティリティを備え、プライバシーを重視したローカル推論で運用できるMITライセンスのプロジェクトです。(約300字)
Harmonic ROUND(ハーモニック・ラウンド)
2025/12/14
Harmonic ROUND(ROUND_Harmonic)は、位相(phase)を内部状態として扱い、読み出し時にハーモニック(フーリエ式)ポテンシャルで位相を量子化する「U-Neuron」再帰ユニットのリファレンス実装です。リーマン多様体上での最適化や神経記号的要素を取り入れた設計により、離散的・周期的な表現と連続的なダイナミクスを融合し、汎化性と安定性を狙います。本リポジトリはリファレンスコード、テスト、ライセンス等を含み研究・実験向けに提供されています。
大気質(AQI)予測 - Air-Quality-Prediction
2025/12/14
本リポジトリは、環境データを用いて大気質指標(AQI: Air Quality Index)を解析・予測するためのエンドツーエンド機械学習プロジェクトです。回帰(単回帰、重回帰、非線形回帰)や分類(ロジスティック回帰など)、そして教師なし学習を通じてデータ前処理、特徴量エンジニアリング、モデル評価までを含むワークフローを提供します。評価指標にはMAE、MSE、RMSE、R²などが利用されており、実践的なAQIモデリングの入門として有用です。
CML — ミニマルなC製機械学習ライブラリ
2025/12/14
C言語で書かれた小規模な機械学習ライブラリ。ベクトル化(行列演算ライブラリ)には依存せず、シンプルなループベースの実装で線形回帰、Lasso、K近傍(回帰・分類)、ロジスティック回帰など基本的なアルゴリズムを提供します。Pythonの機械学習ライクなAPI感覚を目指して設計されており、組み込み環境や学習目的、軽量な実装を求めるプロジェクトに向きます。将来的にベクトル化や追加アルゴリズムの実装が見込まれます(300字程度の要約)。
既存技術からアイデアを生成するツール
2025/12/14
本リポジトリは、ICLR/NeurIPS/ICMLなどトップ会議の論文情報を収集・処理し、「既存の技術」を新しい応用シナリオやホットトピックと組み合わせて独自の研究アイデアを自動生成するためのパイプラインです。モジュール化されたPythonスクリプト群でデータ取得・整形・マージ・JSON化を行い、拡張可能なテンプレートやプロンプトを通じて効率的にアイデア創出の素材を整えます。軽量でカスタマイズしやすく、研究テーマのブレインストーミングや論文調査の起点として活用できます。(約300字)
Question-Bank(面接問題集)
2025/12/14
このリポジトリは、データサイエンス、機械学習、プログラミング、アプリ開発、SQL、DSA、Linuxなどの分野で頻出の面接問題集をPDF形式でまとめたコレクションです。学生や転職準備中のエンジニアが短期間で重要トピックを復習できるよう設計されており、理論的な問いから実装例、行動面接の問答まで幅広くカバーしています。軽量でオフライン参照しやすい一方、実行可能なコードや対話的教材は含まれていません。
LM-RAG ノートブック — LangChainベースのRAGノートアプリ
2025/12/15
ローカルで動作するLangChainベースのデスクトップ「ノートブック」アプリ。高度なRAG(Retrieval-Augmented Generation)を用いて、手元のファイルやメモをインデックス化し、AIチャットや要約、検索に活用できます。知識はユーザーのシステム内に留まり、クラウドストレージ不要でプライバシーを保ちながら利用可能。Electronでパッケージされ、設定可能な構成ファイルやビルド設定が含まれています。(約300字)
Shy to Text — プライバシー重視のローカル音声認識
2025/12/15
Whisperベースのローカル音声認識アプリケーション「Shy to Text」。インターネット接続不要で端末内だけで音声を録音・リアルタイムに文字起こしできます。軽量でプライバシーを重視し、任意のWhisperモデルを使って多言語対応やホットキー操作による即時録音・文字起こしを実現します(300字程度の簡潔な説明)。