SoulX Podcast TTS(Metal/CUDA 自動対応)日本語解説
2025/10/30
SoulX-Podcast-1.7B-dialect をベースにしたローカル高品質音声合成サービスのラッパー実装。Apple Silicon(Metal/MPS)やNVIDIA CUDAを自動検出して高速化し、Web UI・REST API・マルチ話者・多方言・感情表現・ゼロショット声クローン(3〜10秒の参照音声で可能)など放送向けの機能を備えます。Docker 化やシンプルなサーバ起動(app.py)によりローカル環境で即利用可能です。