overview
Microsoft MAI-Voice-2とは?
Microsoft MAI-Voice-2は、Microsoftが開発したテキスト読み上げ(TTS)モデルで、開発者や組織が非常に表現豊かで自然な響きの高忠実度な音声を生成できるようにします。音声クローンと15言語にわたる多言語出力をサポートしています。Microsoftの広範なMAI(Microsoft AI)ファミリーの一部であるMAI-Voice-2は、書かれたテキストを話し言葉のオーディオに変換し、人間のようなイントネーション、リズム、感情のニュアンスを捉えます。このモデルは2026年6月2日にMicrosoft Build 2026で正式に発表され、言語サポートと制御において大幅な機能強化を伴いMAI-Voice-1の後継となりました。Microsoft Azure Foundryで利用可能であり、VSCodeおよびDynamics 365 Contact Centerに統合されています。