Courtesy of TechCrunch

Sesame Rilis Model AI Suara Realistis Terbuka yang Bisa Dipakai Bebas

14 Mar 2025, 05.45 WIB

130 dibaca

Ikhtisar 15 Detik

Model CSM-1B dari Sesame menawarkan teknologi asisten suara yang sangat realistis.
Maya, asisten suara yang dikembangkan, mampu berbicara dengan disfluensi dan interaksi alami.
Penggunaan model ini harus dilakukan dengan etika, mengingat risiko penyalahgunaan yang ada.

Perusahaan AI bernama Sesame telah merilis model dasar yang mendukung asisten suara Maya, yang sangat realistis. Model ini bernama CSM-1B dan memiliki ukuran 1 miliar parameter. CSM-1B dapat menghasilkan kode audio dari input teks dan audio menggunakan teknik yang disebut residual vector quantization (RVQ). Model ini menggunakan teknologi dari keluarga Llama milik Meta dan memiliki kemampuan untuk menghasilkan berbagai suara, meskipun belum disesuaikan untuk suara tertentu. Namun, model ini tidak memiliki perlindungan yang kuat dan hanya mengandalkan sistem kehormatan, meminta pengguna untuk tidak meniru suara orang lain tanpa izin.

Sesame, yang didirikan oleh salah satu pencipta Oculus, Brendan Iribe, menjadi viral karena teknologi asisten suaranya yang mendekati realisme. Asisten Maya dan Miles dapat berbicara dengan cara yang lebih alami, seperti mengambil napas dan berbicara dengan jeda. Selain mengembangkan teknologi asisten suara, perusahaan ini juga sedang merancang kacamata AI yang dapat digunakan sepanjang hari dengan model suara mereka.

Referensi:
[1] https://techcrunch.com/2025/03/13/sesame-the-startup-behind-the-viral-virtual-assistant-maya-releases-its-base-ai-model/

Analisis Ahli

Andrew Ng

"Pengembangan model suara open-source dengan parameter besar memungkinkan lebih banyak pengembang untuk berinovasi dan mempercepat adopsi AI suara."

Fei-Fei Li

"Sementara teknologi suara realistis sangat menjanjikan, harus ada perhatian serius terhadap privasi dan potensi misinformasi yang muncul dari kemampuan kloning suara."

Analisis Kami

"Dengan membuka akses gratis untuk model AI suara realistis, Sesame mendorong inovasi luas di bidang asisten suara komersial namun juga menghadirkan risiko besar terkait keamanan dan penyalahgunaan suara. Saya yakin kebutuhan regulasi dan pengembangan mekanisme pengamanan akan segera menjadi fokus utama agar teknologi ini dapat digunakan secara bertanggung jawab."

Prediksi Kami

Penggunaan model suara AI open-source seperti CSM-1B akan berkembang pesat, mendorong inovasi asisten suara yang semakin personal dan realistis, namun juga menimbulkan tantangan etis terkait penyalahgunaan suara kloning.