小野AI(xiaoye-ai) — マルチモーダルAIコンテンツ作成プラットフォーム

AI/ML

概要

xiaoye-ai(小野AI)は、画像・動画を含むマルチモーダルコンテンツの生成を目的としたオープンソースプラットフォームです。フロントエンドにVueを採用し、Google Gemini や火山引擎(Seedream / Seedance)など外部の生成モデルAPIと連携して、ユーザーがインスピレーションを得る「灵感广场(インスピレーション広場)」や実際に生成を行う「生成界面」を提供します。AGPL-3.0ライセンスで公開され、リポジトリ自体は小規模ながらオンラインデモ(https://xiaoye.io)の存在により実運用イメージを確認できます。READMEは中国語と英語を用意し、スクリーンショットやライセンス情報も含まれます。(約300字)

GitHub

リポジトリの統計情報

  • スター数: 18
  • フォーク数: 5
  • ウォッチャー数: 18
  • コミット数: 2
  • ファイル数: 9
  • メインの言語: Vue

主な特徴

  • マルチモーダル生成(画像・動画)をサポートするUIを提供
  • Google Gemini、火山引擎(Seedream / Seedance)など複数の生成モデルとの連携を想定
  • インスピレーション共有用の「灵感广场」などUX重視の画面構成
  • AGPL-3.0のオープンソースで商用/非商用双方の利用ポリシーに注意が必要

技術的なポイント

xiaoye-aiはリポジトリ規模自体は小さく(ファイル数9、コミット数2)ながら、マルチモーダル生成を前提としたフロントエンド実装を含む点が特徴です。メイン言語がVueであることから、コンポーネント指向のUI構築とリアクティブな状態管理(VuexやPiniaの利用が想定される)が行われていると推測できます。READMEやスクリーンショットに示される「灵感广场」や「生成界面」は、ユーザーが生成済みコンテンツを閲覧・共有しつつ、新規生成リクエストを行う典型的なワークフローを表しており、フロントエンドは外部生成API(Google Geminiや火山引擎)へのプロキシ呼び出しや認証トークンの管理、ジョブ状態のポーリング/WebSocketによるリアルタイム更新などを担う設計が考えられます。

モデル連携部分では、テキスト→画像・テキスト→動画の生成パイプラインを抽象化することで、複数ベンダーのAPI差分を吸収している可能性があります。たとえば、リクエストフォーマット、レートリミット、非同期生成の結果取得(ジョブID/コールバック)、アセットのホスティングやサムネイル生成といった処理を共通化する設計は実用上重要です。さらに、生成結果のプレビュー機能、ユーザーによるパラメータ調整、プロンプト管理やテンプレート保存機能などがUXの核になります。

ライセンスがAGPL-3.0である点は重要です。AGPLはネットワーク経由で利用可能なソフトウェアに対してソース公開義務が強く働くため、商用ホスティングやSaaS提供を考える場合は法的要件を慎重に検討する必要があります。総じて、xiaoye-aiはフロントエンドを中心にマルチベンダーの生成モデルを統合する設計思想を持ち、プロダクト化や拡張性を意識した実装が行われていることがうかがえます。(約700字)

プロジェクトの構成

主要なファイルとディレクトリ:

  • .github: dir
  • .gitignore: file
  • LICENSE: file
  • README.md: file
  • README_EN.md: file

…他 4 ファイル

まとめ

マルチモデル連携のフロントエンドとして実用的な設計を示す、拡張性の高い小規模なオープンソースプロジェクト。

リポジトリ情報:

READMEの抜粋:

小野AI 内容创作平台

License: AGPL-3.0

开源多模态 AI 内容创作平台,支持 Google Gemini、火山引擎 Seedream/Seedance 等模型进行图像和视频生成。

在线体验: https://xiaoye.io

中文 | English

截图预览

灵感广场生成界面
生成![灵感广场](docs/sc…