Courtesy of TechCrunch
ElevenLabs Luncurkan Model Scribe, Saingi Google dan OpenAI di Speech-to-Text
27 Feb 2025, 01.00 WIB
79 dibaca
Share
Ikhtisar 15 Detik
- ElevenLabs meluncurkan model Scribe untuk bersaing dalam layanan speech-to-text.
- Model Scribe mendukung lebih dari 99 bahasa dengan akurasi tinggi.
- Perusahaan berencana untuk merilis versi real-time dari model Scribe di masa depan.
ElevenLabs, sebuah startup AI yang baru saja mengumpulkan dana sebesar Rp 2.96 triliun ($180 juta) , telah meluncurkan model speech-to-text pertama mereka yang bernama Scribe. Model ini mendukung lebih dari 99 bahasa dan memiliki akurasi tinggi untuk lebih dari 25 bahasa, termasuk Inggris, Prancis, Jerman, dan Spanyol. Scribe juga memiliki fitur canggih seperti diarization pembicara, yang dapat menentukan siapa yang berbicara, serta penandaan otomatis untuk suara seperti tawa penonton. Meskipun saat ini Scribe hanya dapat digunakan untuk audio yang sudah direkam, perusahaan berencana untuk merilis versi real-time yang dapat digunakan untuk transkripsi pertemuan.
CEO ElevenLabs, Mati Staniszewski, mengatakan bahwa mereka ingin meningkatkan pemahaman dan transkripsi percakapan. Meskipun banyak orang berpendapat bahwa masalah speech-to-text sudah terpecahkan, mereka percaya masih ada banyak bahasa yang akurasinya perlu ditingkatkan. Scribe dipasarkan dengan harga Rp 657.80 ribu ($0,40) per jam untuk audio yang ditranskripsikan, meskipun beberapa pesaing menawarkan harga yang lebih rendah.
--------------------
Analisis Kami: ElevenLabs menunjukkan kemajuan signifikan dalam teknologi speech-to-text dengan menawarkan model yang kompetitif dan inovatif di pasar global. Namun, untuk benar-benar menandingi para pemimpin industri seperti Whisper dan Google, mereka harus terus mempercepat pengembangan versi real-time dan menurunkan harga sambil mempertahankan kualitas tinggi.
--------------------
Analisis Ahli:
Andrew Ng: Teknologi speech-to-text masih berkembang pesat dan pemain baru seperti ElevenLabs membawa dinamika penting dengan fokus ke data anotasi berkualitas dan dukungan multibahasa yang kuat.
Fei-Fei Li: Sistem transkripsi yang akurat dalam berbagai bahasa sangat penting untuk inklusivitas teknologi, dan pendekatan ElevenLabs dalam anotasi data bisa menjadi game changer di pasar global.
--------------------
What's Next: Dalam waktu dekat, ElevenLabs kemungkinan besar akan meluncurkan versi real-time dari model Scribe, memperluas penggunaan modelnya dari audio pra-rekam ke aplikasi langsung seperti transkripsi rapat dan catatan suara secara real-time.
Referensi:
[1] https://techcrunch.com/2025/02/26/elevenlabs-is-launching-its-own-speech-to-text-model/
[1] https://techcrunch.com/2025/02/26/elevenlabs-is-launching-its-own-speech-to-text-model/
Pertanyaan Terkait
Q
Apa yang diluncurkan oleh ElevenLabs?A
ElevenLabs meluncurkan model speech-to-text pertama mereka yang disebut Scribe.Q
Berapa banyak bahasa yang didukung oleh model Scribe?A
Model Scribe mendukung lebih dari 99 bahasa.Q
Apa yang menjadi fokus utama CEO ElevenLabs, Mati Staniszewski?A
Mati Staniszewski fokus pada pengembangan model deteksi suara yang lebih baik.Q
Bagaimana akurasi model Scribe dibandingkan dengan model lain?A
Model Scribe mengungguli Google Gemini 2.0 Flash dan Whisper Large V3 dalam pengujian akurasi.Q
Apa fitur utama yang ditawarkan oleh model Scribe?A
Fitur utama Scribe termasuk diarization pembicara, timestamp pada level kata, dan penandaan otomatis peristiwa suara.