overview
¿Qué es Microsoft MAI-Voice-2?
Microsoft MAI-Voice-2 es un modelo de texto a voz (TTS) desarrollado por Microsoft que permite a desarrolladores y organizaciones generar habla altamente expresiva, de sonido natural y de alta fidelidad. Soporta la clonación de voz y la salida multilingüe en 15 idiomas. Parte de la familia más amplia de MAI (Microsoft AI) de Microsoft, MAI-Voice-2 convierte texto escrito en audio hablado, capturando la entonación, el ritmo y los matices emocionales similares a los humanos. El modelo fue lanzado oficialmente el 2 de junio de 2026, en Microsoft Build 2026, sucediendo a MAI-Voice-1 con mejoras significativas en el soporte y control de idiomas. Está disponible en Microsoft Azure Foundry y se está integrando en VSCode y Dynamics 365 Contact Center.