Lompat ke konten Lompat ke sidebar Lompat ke footer

Kecerdasan Buatan Microsoft Bisa Kloning Suara dari Klip Audio 3 Detik

Microsoft mengembangkan teknologi kecerdasan buatan baru yang bisa mengkloning suara hanya dalam waktu 3 detik. Teknologi ini dikenal dengan sebutan VALL-E, yang dikembangkan untuk sintesis teks-ke-suara.

Untuk membuat teknologi ini, tim peneliti Microsoft membuat sistem mendengarkan 60.000 jam narasi buku audio bahasa Inggris dari lebih dari 7.000 pembicara yang berbeda. Hal ini dilakukan untuk mereproduksi ucapan yang terdengar seperti manusia dan sampel ini ratusan kali lebih besar daripada program text-to-speech lainnya.

VALL-E tidak hanya mampu mengkloning suara seseorang dari klip audio 3 detik, tetapi juga memanipulasi suara klon untuk mengucapkan apa saja yang diinginkan. 

Program ini juga dapat mereplikasi emosi dalam suara seseorang atau dikonfigurasi ke dalam gaya bicara yang berbeda.

Meskipun kloning suara tidaklah baru, namun penelitian Microsoft menonjol karena teknologi ini dapat mereplikasi suara siapa saja hanya dengan cuplikan singkat data audio. 

Namun, teknologi ini juga bisa menyebabkan kejahatan dunia maya dan diakui oleh tim Microsoft sebagai potensi ancaman.

Tim Microsoft mempertimbangkan untuk membangun program yang dapat membedakan apakah klip audio disintesis oleh VALL-E. Progam ini sendiri menafsirkan ucapan audio sebagai "token diskrit", lalu mereproduksi token untuk berbicara dengan teks yang berbeda.

Meskipun teknologi ini masih jauh dari sempurna dan terkadang kesulitan atau gagal mengucapkan kata-kata tertentu, penelitian menunjukkan bahwa membuat program kloning suara yang lebih akurat dapat dicapai jika dilatih pada lebih banyak klip audio.

Microsoft belum merilis VALL-E ke publik, kemungkinan besar untuk mencegah penyalahgunaan. Namun, penelitian ini menunjukkan kemajuan yang mengesankan dalam bidang kecerdasan buatan dan teknologi text-to-speech.

Posting Komentar untuk "Kecerdasan Buatan Microsoft Bisa Kloning Suara dari Klip Audio 3 Detik"