MiMo-Audio:オーディオ言語モデルのFew-Shot学習
2025/9/19
XiaomiMiMo が公開する MiMo-Audio は,「Audio Language Models are Few-Shot Learners」を掲げるリポジトリで、オーディオと言語を結びつけるモデル設計や評価に関する技術資料とサンプル資産を含みます。音声特徴抽出からモデル評価までのワークフロー、技術報告書(PDF)やアセット類が同梱され、音声ベースの少量学習(few-shot)研究の出発点として利用可能です(リポジトリ自体は軽量で実装・説明資料中心)。