AI-Dynamics — グローバルAI動向トラッカー

AI/ML

概要

AI-Dynamicsは、グローバルなAI業界のニュースや研究成果、プロダクト情報、投融資・政策動向などを自動で集約して日次で要約・分類する個人向けツールです。主要なニュースソースやarXivなど学術リポジトリ、コミュニティ掲示板をRSSでクロールし、LLMを用いて中文(主に中国語ソース)を含む記事の意訳・タグ付け・重要度評価を行います。三段階のLLMエンジン戦略(Gemini → Groq → Ollama)で可用性とコストをバランスし、5件まとめて一度のAPI呼び出しに集約することでAPIコストと回数を抑制。日次Top10のブリーフやカテゴリ別一覧、キーワード検索、保存・アーカイブ機能を備え、業界の動きを効率的に追うことができます。

GitHub

リポジトリの統計情報

  • スター数: 2
  • フォーク数: 0
  • ウォッチャー数: 2
  • コミット数: 3
  • ファイル数: 9
  • メインの言語: Python

主な特徴

  • RSS自動収集(10:00 / 17:00の定時取得+手動更新)
  • LLMによる自動翻訳・分類(7カテゴリ)・重要度スコアリング(1-5)
  • バッチ合成プロンプトでAPI呼び出しを削減(5件まとめて1回)
  • 日次のトップ10ブリーフ、検索・フィルタ・お気に入り管理、月次アーカイブ

技術的なポイント

AI-Dynamicsの設計は「情報収集の自動化」「コスト効率の高いLLM利用」「データライフサイクル管理」を軸にしています。情報収集はRSSベースで13以上のソース(研究機関、商用企業、コミュニティ)を定期クロールし、メタデータと本文を正規化してデータベースに格納する流れです。取得スケジュールは2回/日を標準とし、手動での再取得も可能にすることでリアルタイム性と安定性を両立しています。

LLM活用は三重戦略を採用。まずGeminiを第一候補、その次にGroq、最後にローカル/軽量モデルのOllamaへフォールバックすることで、APIの可用性や料金の変動に強い構成です。記事処理時には「バッチ合成プロンプト」を使い、5記事をひとまとまりにして一回のAPI呼び出しで要約・翻訳・タグ付け・重要度評価を行います。これによりAPIコールを約80%削減するという設計目標を掲げ、コスト削減とレイテンシ改善を両立しています。

分類は7種類のラベル体系を用いており、LLMが記事を自動判定します。重要度は1〜5のスコアリングで表現し、ランキング生成や日次Top10抽出に利用。UI側は時系列の情報流(タイムライン)とカテゴリ別閲覧をサポートし、キーワード検索や星マークでの保存管理も備えます。

データ管理面では「月次自動クリーンアップ」を実装。1ヶ月を超える古いデータはアーカイブして圧縮保存し、主要DBの肥大化を防ぎます。プロンプトデザインやLLM呼び出しの冗長化、エラーハンドリング(API失敗時のリトライとフォールバック)、およびスケジューラの堅牢化が技術的な注目点です。さらに将来的な拡張性を考え、情報ソース追加やラベル体系の拡張、 multilingual対応、ベクタ検索導入(類似記事検索)といった改善余地が明確に残されています。バックエンドはPythonベースで、外部LLMとの接続やRSSパーシング、バッチ処理の実装が中心であるため、デプロイはコンテナ化や定期実行環境(cron / Airflow等)との相性が良い設計です。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .env.example: file
  • .gitignore: file
  • DESIGN.md: file
  • PROGRESS.md: file
  • README.md: file

…他 4 ファイル

まとめ

少人数で構築された実用的なAI業界動向トラッキング基盤。拡張性とコスト効率が魅力。

リポジトリ情報: