Fun-ASR:大規模マルチリンガル音声認識モデル
2025/12/15
Fun-ASR は FunAudioLLM が公開しているエンドツーエンド音声認識(ASR)リポジトリです。README によれば数千万時間の実音声で学習された大規模モデルをベースに、低遅延のリアルタイム書き起こし、多言語(31言語)対応、教育や金融などの垂直領域での専門用語認識に強みを持ち、幻覚や語種混同の抑制を目標としています。本リポジトリはデモスクリプトと簡易モデルラッパーを含み、まずは試用・検証を行うための最小構成を提供します。