Super Soundboard — Discord VC 効果音ボット

Tool

概要

Super Soundboard は、音声認識でトリガーしたワードに応じて Discord のボイスチャンネルへ効果音を流すローカルアプリです。アーキテクチャは比較的シンプルで、ブラウザ(Google Chrome)上のフロントエンドが Web Speech API を使って音声をテキスト化し、検出したキーワードを WebSocket 経由で Node.js 実装の Discord ボットへ送信します。ボット側は受け取った命令に従って音声ファイルを再生し、サーバーを介さないため高速かつプライベートに動作します。導入は Node.js 20 以上や Chrome、Discord アカウントなど最低限の環境で可能で、外部の音声認識モデル(Whisper 等)やクラウドコストが不要なのが利点です。

GitHub

リポジトリの統計情報

  • スター数: 15
  • フォーク数: 2
  • ウォッチャー数: 15
  • コミット数: 2
  • ファイル数: 9
  • メインの言語: TypeScript

主な特徴

  • ローカル完結の音声認識トリガーで Discord に効果音を再生(サーバ不要)
  • ブラウザ側は Web Speech API(Chrome 推奨)を使用、低遅延でキーワード検出
  • Node.js(TypeScript)でボイス再生を担当、Discord Bot として動作
  • シンプルな WebSocket ベースの連携でフロントとバックエンドが通信

技術的なポイント

Super Soundboard の技術的な特徴は「既存ブラウザ機能+軽量サーバ」で実現している点です。フロントエンドは Chrome の Web Speech API を使うことでローカルの音声入力をブラウザ内でテキスト変換(STT)し、あらかじめ定義したキーワードを検出すると即座に WebSocket 経由でサーバ(ローカルの Node.js ボット)へ命令を送ります。バックエンドは TypeScript で書かれた Discord ボットで、Discord のボイスチャネル接続と音声再生(ffmpeg 等の外部コマンドを利用する環境が必要)を担当します。設計上、外部の大規模音声モデルやクラウド API を必要としないためコストと遅延の面で有利ですが、Web Speech API の認識精度・挙動に依存するためノイズ許容性や多言語対応は環境に左右されます。またローカル専用設計のため、複数ユーザーの分散環境や耐障害性を求める用途には拡張が必要です。TypeScript を採用しているため型安全性があり、bot-node ディレクトリ内でプレイリストやキーワードの対応表を管理する拡張が容易です。

プロジェクトの構成

主要なファイルとディレクトリ:

  • .gitignore: file(ビルド成果物や環境依存ファイルを無視)
  • AGENTS.md: file(エージェントや動作方針のドキュメント)
  • LICENSE: file(ライセンス情報)
  • README.md: file(導入手順や概要、要件の説明)
  • bot-node: dir(Node.js / TypeScript 実装の Discord ボット本体)
  • package.json: file(依存関係とスクリプト)
  • tsconfig.json: file(TypeScript コンパイラ設定)
  • public / frontend 関連ファイル: dir(Chrome 側の簡易フロントエンド)
  • assets / sounds: dir(効果音ファイル等を格納)

…他 4 ファイル

bot-node ディレクトリには Discord 接続処理、WebSocket サーバ、音声ファイル再生のラッパーが入っている想定です。README には必要な環境(Node.js 20+, Google Chrome、Discord アカウント、Windows の場合は ffmpeg の導入)や、実行手順、限定的にサポートする旨の注意書きが記載されています。実運用に向けては、キーワード辞書のチューニングや Web Speech API の設定(言語設定や連続認識の挙動)、ffmpeg のパス設定などを確認する必要があります。

まとめ

ローカルだけで手軽に音声トリガーから Discord 効果音再生を実現する実用的なプロジェクト。

リポジトリ情報:

READMEの抜粋:

Discord VC 効果音ボット (Super Soundboard)

質問や改善案があったとしても、元々私的利用のクソアプリとして開発したので受け付けておりません。ごめんね!

https://qiita.com/kokushin/items/a21f2045a033b689383e

概要

Super Soundboard は、音声認識したキーワードをトリガーに Discord のボイスチャンネルへ効果音を流すローカルアプリです。Node.js で動く Discord Bot(音の再生)と、Chrome で動く STT(音声認識)フロントエンドを WebSocket で連携させるため、高価なサーバーや Whisper などの追加モデルは不要です。

必要なもの (Windows / Mac)

  • 共通: Node.js 20 以上、Google Chrome(Web Speech API が安定しているため推奨)、Discord アカウント。
  • Windows: ffmpeg([公式ビルド](https://github.com/BtbN/