AI Microsoft , sebuah divisi yang didedikasikan untuk mengembangkan dan mengintegrasikan teknologi AI di seluruh Microsoft, mengumumkan peluncuran MAI-Voice-1, model pembangkitan ucapan ekspresif dan berfidelitas tinggi pertamanya. Model ini saat ini tersedia di Copilot Daily dan Podcast, serta di pengalaman Copilot Labs yang baru, yang memungkinkan pengguna untuk mengeksplorasi kemampuan ucapan ekspresif dan bercerita.
MAI-Voice-1 menghadirkan audio alami baik dalam skenario satu maupun multi-speaker, dan dirancang untuk kecepatan tinggi. Menghasilkan satu menit penuh suara dalam waktu kurang dari satu detik pada satu GPU, menjadikannya salah satu sistem pembangkit suara paling efisien yang tersedia saat ini. Model ini memungkinkan aplikasi seperti cerita interaktif "pilih petualangan Anda sendiri" atau meditasi terpandu yang dipersonalisasi, menunjukkan potensi suara sebagai antarmuka utama bagi pendamping AI.
Selain itu, Microsoft AI telah memulai uji coba publik MAI-1-preview di LMArena, sebuah platform yang banyak digunakan untuk evaluasi model komunitas. Ini menandai model dasar pertama yang terlatih penuh dari divisi ini dan memberikan gambaran awal tentang kapabilitas yang akan diintegrasikan ke dalam Copilot. MAI-1-preview merupakan model gabungan pakar internal, yang telah dilatih pra dan pasca-pelatihan pada sekitar 15,000 GPU NVIDIA H100, dirancang untuk menangani instruksi dan memberikan respons yang bermanfaat untuk tugas sehari-hari.
Model ini akan diperkenalkan secara bertahap untuk kasus penggunaan berbasis teks tertentu di Copilot, yang memungkinkan Microsoft AI mengumpulkan umpan balik dan menyempurnakan kinerja. Tim menggabungkan model internal, kontribusi mitra, dan inovasi sumber terbuka untuk mengoptimalkan hasil di jutaan interaksi setiap hari. Pratinjau MAI-1 juga tersedia untuk penguji tepercaya, dengan aplikasi akses API terbuka untuk mengumpulkan wawasan tentang kekuatan dan area yang perlu ditingkatkan.
Ke depannya, Microsoft AI berencana untuk mengembangkan model ini lebih lanjut sambil mengorkestrasi serangkaian model khusus yang dirancang untuk berbagai tujuan dan skenario pengguna. Divisi ini bertujuan untuk terus mengembangkan solusi AI terkemuka dan membuatnya dapat diakses oleh pengguna di seluruh dunia.