AI Voice Agent(ロジスティクス向け音声AIエージェント管理ツール)

Web

概要

AI Voice Agentは、ロジスティクスの配車業務で使う音声AIエージェントを管理・検証するための管理画面ツールです。管理者はエージェントのプロンプトや高度な音声設定をUI上で編集し、電話やWeb・シミュレーションで通話をトリガーして動作を確認できます。結果は構造化されたキー・バリューのサマリとフルトランスクリプトで確認でき、Supabaseを使った永続化やローカルJSONのフォールバックも備えています。

GitHub

リポジトリの統計情報

  • スター数: 1
  • フォーク数: 0
  • ウォッチャー数: 1
  • コミット数: 17
  • ファイル数: 6
  • メインの言語: Python

主な特徴

  • エージェント設定UI:プロンプト編集と音声の詳細設定をブラウザ上で行える
  • 通話トリガー:電話・Web・シミュレーションによる通話発生機能
  • 結果表示:構造化されたサマリ(キー・バリュー)と全文トランスクリプトを保存・表示
  • ストレージとローカルフォールバック:Supabaseを本番ストレージに、JSONのローカルフォールバックを開発用に用意

技術的なポイント

バックエンドはFastAPIを採用しており、Webhook受信やポストプロセス処理を担います。非同期処理や外部音声API(READMEから推測するとRetell AIなど)との連携に適した構成で、通話結果の受け取りやトランスクリプト解析を効率的に行えます。フロントエンドはReact(Vite + TypeScript)で実装され、レスポンシブな管理画面と設定UIを提供。状態管理やAPI呼び出しを分離することで、設定の即時反映や結果確認がスムーズです。

データ保存にはSupabaseを利用し、認証や永続化、クエリ復元が可能です。開発環境ではSupabaseが利用できない場合に備え、ローカルのJSONファイルをフォールバックとして扱う設計により、オフラインや小規模な検証でも動作するよう配慮されています。通話トリガーは電話・Web・シミュレートの3種類に対応しており、実際の音声発信経路を差し替えて検証できるため、運用導入前の挙動確認が容易です。

また、結果は構造化されたキー・バリューのサマリとフルトランスクリプトという二層で保存され、運用側は重要情報のみを抽出して一覧確認、必要に応じて詳細トランスクリプトを参照できます。設計的には外部APIキーやシークレットを環境変数で管理し、Webhookの署名検証やアクセス制御を実装することでセキュリティを確保する想定です。拡張ポイントとしては、音声合成/認識エンジンの差し替え、通話ワークフローのステートマシン化、ログ収集・監査機能の追加などが考えられます。(約700字)

プロジェクトの構成

主要なファイルとディレクトリ:

  • .gitignore: file
  • LICENSE: file
  • README.md: file
  • backend: dir
  • frontend: dir

…他 1 ファイル

まとめ

実運用に向けた音声AIの設定・検証が手軽にできる管理ツール。

リポジトリ情報:

READMEの抜粋:

AI Voice Agent Tool

A functional admin web application to configure, test, and review calls made by an adaptive AI voice agent. It supports:

  • Agent Configuration UI (prompts + advanced voice settings)
  • Call Triggering (Phone, Web, or Simulated)
  • Results UI (structured key-value summary + full transcript)

Backend: FastAPI (webhook + post-processing)
Frontend: React (Vite + TS)
Storage: Supabase (with local JSON fallback for development)
Voice: Retell AI (…