Pomodo Logo IconPomodo Logo Icon
Tanya PomodoSemua Artikel
Semua
Sesame Rilis Model AI Suara Realistis Terbuka yang Bisa Dipakai Bebas
Courtesy of TechCrunch
Teknologi
Kecerdasan Buatan

Sesame Rilis Model AI Suara Realistis Terbuka yang Bisa Dipakai Bebas

14 Mar 2025, 05.45 WIB
127 dibaca
Share
Ikhtisar 15 Detik
  • Model CSM-1B dari Sesame menawarkan teknologi asisten suara yang sangat realistis.
  • Maya, asisten suara yang dikembangkan, mampu berbicara dengan disfluensi dan interaksi alami.
  • Penggunaan model ini harus dilakukan dengan etika, mengingat risiko penyalahgunaan yang ada.
Perusahaan AI bernama Sesame telah merilis model dasar yang mendukung asisten suara Maya, yang sangat realistis. Model ini bernama CSM-1B dan memiliki ukuran 1 miliar parameter. CSM-1B dapat menghasilkan kode audio dari input teks dan audio menggunakan teknik yang disebut residual vector quantization (RVQ). Model ini menggunakan teknologi dari keluarga Llama milik Meta dan memiliki kemampuan untuk menghasilkan berbagai suara, meskipun belum disesuaikan untuk suara tertentu. Namun, model ini tidak memiliki perlindungan yang kuat dan hanya mengandalkan sistem kehormatan, meminta pengguna untuk tidak meniru suara orang lain tanpa izin.
Baca juga: Apple Pertimbangkan AI OpenAI dan Anthropic untuk Tingkatkan Siri
Sesame, yang didirikan oleh salah satu pencipta Oculus, Brendan Iribe, menjadi viral karena teknologi asisten suaranya yang mendekati realisme. Asisten Maya dan Miles dapat berbicara dengan cara yang lebih alami, seperti mengambil napas dan berbicara dengan jeda. Selain mengembangkan teknologi asisten suara, perusahaan ini juga sedang merancang kacamata AI yang dapat digunakan sepanjang hari dengan model suara mereka.
--------------------
Analisis Kami: Dengan membuka akses gratis untuk model AI suara realistis, Sesame mendorong inovasi luas di bidang asisten suara komersial namun juga menghadirkan risiko besar terkait keamanan dan penyalahgunaan suara. Saya yakin kebutuhan regulasi dan pengembangan mekanisme pengamanan akan segera menjadi fokus utama agar teknologi ini dapat digunakan secara bertanggung jawab.
--------------------
Analisis Ahli:
Andrew Ng: Pengembangan model suara open-source dengan parameter besar memungkinkan lebih banyak pengembang untuk berinovasi dan mempercepat adopsi AI suara.
Fei-Fei Li: Sementara teknologi suara realistis sangat menjanjikan, harus ada perhatian serius terhadap privasi dan potensi misinformasi yang muncul dari kemampuan kloning suara.
--------------------
Baca juga: Mahasiswa Ciptakan Model AI Suara Podcast Terbuka Menyaingi Google
What's Next: Penggunaan model suara AI open-source seperti CSM-1B akan berkembang pesat, mendorong inovasi asisten suara yang semakin personal dan realistis, namun juga menimbulkan tantangan etis terkait penyalahgunaan suara kloning.
Referensi:
[1] https://techcrunch.com/2025/03/13/sesame-the-startup-behind-the-viral-virtual-assistant-maya-releases-its-base-ai-model/

Pertanyaan Terkait

Q
Apa itu CSM-1B?
A
CSM-1B adalah model dasar yang digunakan untuk menggerakkan asisten suara Maya, dengan 1 miliar parameter.
Q
Siapa pendiri Sesame?
A
Pendiri Sesame adalah Brendan Iribe, yang juga dikenal sebagai salah satu pencipta Oculus.
Q
Apa yang membuat Maya unik sebagai asisten suara?
A
Maya unik karena kemampuannya untuk berbicara dengan cara yang sangat realistis, mendekati batas uncanny valley.
Q
Apa yang dimaksud dengan RVQ dalam konteks model ini?
A
RVQ atau residual vector quantization adalah teknik untuk mengkodekan audio menjadi token diskrit yang disebut kode.
Q
Apa saja risiko yang terkait dengan penggunaan model CSM-1B?
A
Risiko terkait penggunaan model CSM-1B termasuk potensi penyalahgunaan untuk meniru suara orang tanpa izin dan menciptakan konten yang menyesatkan.

Artikel Serupa

Amazon Perkenalkan Nova Sonic dan Nova Reel 1.1, AI Suara dan Video Lebih Canggih
Amazon Perkenalkan Nova Sonic dan Nova Reel 1.1, AI Suara dan Video Lebih Canggih
Dari TheVerge
Amazon Perkenalkan Nova Sonic, Model AI Suara Generatif Cepat dan Murah
Amazon Perkenalkan Nova Sonic, Model AI Suara Generatif Cepat dan Murah
Dari TechCrunch
OpenAI Tingkatkan Advanced Voice Mode ChatGPT Supaya Lebih Personal dan Minim Interupsi
OpenAI Tingkatkan Advanced Voice Mode ChatGPT Supaya Lebih Personal dan Minim Interupsi
Dari TechCrunch
Google Tambahkan Model Suara Chirp 3 ke Platform AI untuk Inovasi Suara
Google Tambahkan Model Suara Chirp 3 ke Platform AI untuk Inovasi Suara
Dari TechCrunch
Google Luncurkan Chirp 3, Suara AI HD untuk Platform Vertex AI
Google Luncurkan Chirp 3, Suara AI HD untuk Platform Vertex AI
Dari TechCrunch
Maya dari Sesame: Asisten Suara AI Baru yang Bikin Percakapan Lebih Hidup
Maya dari Sesame: Asisten Suara AI Baru yang Bikin Percakapan Lebih Hidup
Dari TheVerge
Amazon Perkenalkan Nova Sonic dan Nova Reel 1.1, AI Suara dan Video Lebih CanggihTheVerge
Teknologi
4 bulan lalu
116 dibaca

Amazon Perkenalkan Nova Sonic dan Nova Reel 1.1, AI Suara dan Video Lebih Canggih

Amazon Perkenalkan Nova Sonic, Model AI Suara Generatif Cepat dan MurahTechCrunch
Teknologi
4 bulan lalu
138 dibaca

Amazon Perkenalkan Nova Sonic, Model AI Suara Generatif Cepat dan Murah

OpenAI Tingkatkan Advanced Voice Mode ChatGPT Supaya Lebih Personal dan Minim InterupsiTechCrunch
Teknologi
4 bulan lalu
110 dibaca

OpenAI Tingkatkan Advanced Voice Mode ChatGPT Supaya Lebih Personal dan Minim Interupsi

Google Tambahkan Model Suara Chirp 3 ke Platform AI untuk Inovasi SuaraTechCrunch
Teknologi
5 bulan lalu
112 dibaca

Google Tambahkan Model Suara Chirp 3 ke Platform AI untuk Inovasi Suara

Google Luncurkan Chirp 3, Suara AI HD untuk Platform Vertex AITechCrunch
Teknologi
5 bulan lalu
98 dibaca

Google Luncurkan Chirp 3, Suara AI HD untuk Platform Vertex AI

Maya dari Sesame: Asisten Suara AI Baru yang Bikin Percakapan Lebih HidupTheVerge
Bisnis
5 bulan lalu
208 dibaca

Maya dari Sesame: Asisten Suara AI Baru yang Bikin Percakapan Lebih Hidup