GPT-OSSスペースゲーム:AIと音声UIによる宇宙冒険体験

AI/ML

概要

GPT-OSSスペースゲームは、オープンソースのGPTモデルを活用し、音声インターフェースに対応した宇宙冒険ストーリーゲームです。プレイヤーは宇宙船「Gradient Ascent」の唯一の乗組員として、原因不明の船の故障をAIと協力して解決し、宇宙ステーションや惑星への安全到達を目指します。ゲームはTypeScriptで構築されており、音声認識にはWhisper、音声合成にはKokoro TTS、通信処理にPipecatを採用。これらの技術をローカルで統合し、クラウドサービスへの切り替えも簡単に実現可能な柔軟な構成が特徴です。

GitHub

リポジトリの統計情報

  • スター数: 15
  • フォーク数: 1
  • ウォッチャー数: 15
  • コミット数: 24
  • ファイル数: 6
  • メインの言語: TypeScript

主な特徴

  • GPT-OSSを使ったテキスト生成AIと音声UIを組み合わせたインタラクティブゲーム
  • Whisperによる高精度な音声認識で自然な会話インターフェースを実現
  • Kokoro TTSを用いたリアルタイム音声合成で臨場感のあるゲーム体験
  • 柔軟なモジュール設計により、ローカル・クラウド両方の環境で動作可能

技術的なポイント

本プロジェクトの最大の技術的特長は、オープンソースのGPTモデルである「gpt-oss」をコアに据え、音声認識・合成技術と組み合わせて完全ローカル環境で動作する点にあります。ゲームの対話部分はGPT-OSSが生成する文章を基に進行し、ユーザーの音声入力はWhisperがテキスト化。これにより、キーボード入力に頼らず自然な会話形式でゲームを進められます。

音声出力にはKokoro TTSを採用し、テキストを高品質な音声に変換。ユーザーはキャラクターやAIの声をリアルタイムに聞きながら、臨場感あふれるストーリー体験を得られます。さらに、Pipecatによる通信処理モジュールが各コンポーネント間のデータフローを円滑に管理し、処理遅延を最小化。全体として、マイクロサービス的に分離された各技術の連携がスムーズに行われる設計がなされています。

TypeScriptで実装されているため、コードの保守性と拡張性が高く、プロジェクトのカスタマイズや機能追加が容易です。設定ファイルやテンプレート(例: gpt-oss-template.jinja)も用意されており、開発者はゲームのストーリーやUIを自由に調整可能。クラウドサービスへの切り替えも考慮されており、WhisperやTTSのAPIを利用したハイブリッド構成にも対応しています。

このように、最新のAI技術群と音声UIを融合させたゲーム開発の先駆的事例として注目に値します。AIとユーザーの対話を自然に織り交ぜたゲーム体験は、今後の対話型アプリケーションやインタラクティブコンテンツの可能性を広げるものです。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .gitignore: Git管理対象外ファイルの指定
  • README.md: プロジェクト概要と利用方法の説明
  • assets: ゲーム内で使用する画像などの静的リソース
  • client: クライアント側のTypeScriptコード。UIや音声入出力を制御
  • gpt-oss-template.jinja: GPT-OSS用のテンプレートファイル。対話生成に利用

その他、設定やビルド関連ファイルが含まれています。各ディレクトリは機能別に分離され、拡張やメンテナンスがしやすい構造です。

まとめ

AIと音声UIを融合した革新的な宇宙冒険ゲームの実装例。

リポジトリ情報: