Microsoft meluncurkan avatar text-to-speech AI di Ignite 2023

Microsoft meluncurkan avatar text-to-speech AI di Ignite 2023

Road.co.id

Dalam beberapa bulan terakhir, Microsoft telah memulai misi untuk memasukkan kecerdasan buatan (AI) ke dalam rangkaian produknya, mulai dari Microsoft Office yang berfokus pada konsumen hingga Copilot 365 untuk bisnis. Pada konferensi Ignite 2023 terbarunya, raksasa teknologi ini mengumumkan beberapa produk baru berbasis AI seperti Copilot Studio, dan Windows AI Studio, sekaligus mengganti nama Bing Chat menjadi Copilot. Perusahaan juga meluncurkan program avatar text-to-speech yang disebut Azure AI Speech yang dapat membantu membuat video avatar berbicara. Ini sedang diluncurkan dalam pratinjau publik. Ketahui semua tentang fitur baru ini.

Pidato Microsoft Azure AI

Azure AI Speech adalah avatar text-to-speech yang memungkinkan Anda mengonversi teks menjadi video 2D avatar berbicara mirip manusia. Microsoft mengatakan model Avatar text-to-speech Neural dilatih oleh jaringan saraf dalam berdasarkan sampel rekaman video manusia, dan suara avatar disediakan oleh model suara text-to-speech. Pengguna dapat menggunakan input teks untuk membuat video pelatihan, pengenalan produk, testimoni pelanggan, dan banyak lagi, sehingga memungkinkan lebih banyak interaksi digital.

Bagaimana itu bekerja

Alur kerja pembuatan konten avatar Azure AI Speech melibatkan 3 langkah – penganalisis teks, penyintesis audio TTS, dan penyintesis video avatar TTS. Pertama, masukan teks disediakan oleh pengguna dan penganalisis teks mengeluarkannya dalam bentuk rangkaian fonem. Kemudian, penyintesis audio TTS memprediksi fitur akustik teks masukan dan mensintesis suaranya. Kedua fitur ini didukung oleh model suara text-to-speech.

Terakhir, model avatar neural text-to-speech memprediksi gambar sinkronisasi bibir dengan fitur akustik, sehingga dihasilkan video sintetis.

Layanan Azure AI Speech ditawarkan dalam dua tingkatan. Yang pertama adalah suara saraf bawaan yang menampilkan suara alami yang unik. Untuk mengaksesnya, pengguna dapat membuat akun Azure dan berlangganan layanan Speech. Kemudian, mereka dapat menggunakan Speech SDK atau mengunjungi portal Speech Studio untuk memilih suara bawaan.

Di sisi lain, Microsoft juga menawarkan fasilitas untuk membuat suara saraf khusus. Fitur ini disebut Suara Neural Khusus. Ini adalah layanan mandiri yang mudah digunakan untuk menciptakan suara merek yang natural, dengan akses terbatas untuk penggunaan yang bertanggung jawab. Microsoft saat ini hanya menawarkan akses terbatas ke fitur ini.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

You might also like