ElevenLabs Luncurkan Model Scribe, Saingi Google dan OpenAI di Speech-to-Text
Courtesy of TechCrunch

ElevenLabs Luncurkan Model Scribe, Saingi Google dan OpenAI di Speech-to-Text

27 Feb 2025, 01.00 WIB
79 dibaca
Share
Ikhtisar 15 Detik
  • ElevenLabs meluncurkan model Scribe untuk bersaing dalam layanan speech-to-text.
  • Model Scribe mendukung lebih dari 99 bahasa dengan akurasi tinggi.
  • Perusahaan berencana untuk merilis versi real-time dari model Scribe di masa depan.
ElevenLabs, sebuah startup AI yang baru saja mengumpulkan dana sebesar Rp 2.96 triliun ($180 juta) , telah meluncurkan model speech-to-text pertama mereka yang bernama Scribe. Model ini mendukung lebih dari 99 bahasa dan memiliki akurasi tinggi untuk lebih dari 25 bahasa, termasuk Inggris, Prancis, Jerman, dan Spanyol. Scribe juga memiliki fitur canggih seperti diarization pembicara, yang dapat menentukan siapa yang berbicara, serta penandaan otomatis untuk suara seperti tawa penonton. Meskipun saat ini Scribe hanya dapat digunakan untuk audio yang sudah direkam, perusahaan berencana untuk merilis versi real-time yang dapat digunakan untuk transkripsi pertemuan.
CEO ElevenLabs, Mati Staniszewski, mengatakan bahwa mereka ingin meningkatkan pemahaman dan transkripsi percakapan. Meskipun banyak orang berpendapat bahwa masalah speech-to-text sudah terpecahkan, mereka percaya masih ada banyak bahasa yang akurasinya perlu ditingkatkan. Scribe dipasarkan dengan harga Rp 657.80 ribu ($0,40) per jam untuk audio yang ditranskripsikan, meskipun beberapa pesaing menawarkan harga yang lebih rendah.
--------------------
Analisis Kami: ElevenLabs menunjukkan kemajuan signifikan dalam teknologi speech-to-text dengan menawarkan model yang kompetitif dan inovatif di pasar global. Namun, untuk benar-benar menandingi para pemimpin industri seperti Whisper dan Google, mereka harus terus mempercepat pengembangan versi real-time dan menurunkan harga sambil mempertahankan kualitas tinggi.
--------------------
Analisis Ahli:
Andrew Ng: Teknologi speech-to-text masih berkembang pesat dan pemain baru seperti ElevenLabs membawa dinamika penting dengan fokus ke data anotasi berkualitas dan dukungan multibahasa yang kuat.
Fei-Fei Li: Sistem transkripsi yang akurat dalam berbagai bahasa sangat penting untuk inklusivitas teknologi, dan pendekatan ElevenLabs dalam anotasi data bisa menjadi game changer di pasar global.
--------------------
What's Next: Dalam waktu dekat, ElevenLabs kemungkinan besar akan meluncurkan versi real-time dari model Scribe, memperluas penggunaan modelnya dari audio pra-rekam ke aplikasi langsung seperti transkripsi rapat dan catatan suara secara real-time.
Referensi:
[1] https://techcrunch.com/2025/02/26/elevenlabs-is-launching-its-own-speech-to-text-model/

Pertanyaan Terkait

Q
Apa yang diluncurkan oleh ElevenLabs?
A
ElevenLabs meluncurkan model speech-to-text pertama mereka yang disebut Scribe.
Q
Berapa banyak bahasa yang didukung oleh model Scribe?
A
Model Scribe mendukung lebih dari 99 bahasa.
Q
Apa yang menjadi fokus utama CEO ElevenLabs, Mati Staniszewski?
A
Mati Staniszewski fokus pada pengembangan model deteksi suara yang lebih baik.
Q
Bagaimana akurasi model Scribe dibandingkan dengan model lain?
A
Model Scribe mengungguli Google Gemini 2.0 Flash dan Whisper Large V3 dalam pengujian akurasi.
Q
Apa fitur utama yang ditawarkan oleh model Scribe?
A
Fitur utama Scribe termasuk diarization pembicara, timestamp pada level kata, dan penandaan otomatis peristiwa suara.

Artikel Serupa

Synthflow AI: Platform No-Code Untuk Agen Suara AI Perusahaan yang Mudah dan AndalYahooFinance
Bisnis
1 bulan lalu
26 dibaca

Synthflow AI: Platform No-Code Untuk Agen Suara AI Perusahaan yang Mudah dan Andal

Wispr Flow Raih Dana Rp 493.35 miliar ($30 Juta)  Kembangkan AI Suara Mudahkan ProduktivitasTechCrunch
Bisnis
1 bulan lalu
98 dibaca

Wispr Flow Raih Dana Rp 493.35 miliar ($30 Juta) Kembangkan AI Suara Mudahkan Produktivitas

Wispr Flow: Teknologi Dikte Suara Andal untuk 100+ Bahasa Mengungguli AI BesarTechCrunch
Teknologi
2 bulan lalu
122 dibaca

Wispr Flow: Teknologi Dikte Suara Andal untuk 100+ Bahasa Mengungguli AI Besar

Mahasiswa Ciptakan Model AI Suara Podcast Terbuka Menyaingi GoogleTechCrunch
Teknologi
3 bulan lalu
144 dibaca

Mahasiswa Ciptakan Model AI Suara Podcast Terbuka Menyaingi Google

OpenAI Hadirkan Model Suara dan Transkripsi AI Lebih Realistis dan AkuratTechCrunch
Teknologi
5 bulan lalu
195 dibaca

OpenAI Hadirkan Model Suara dan Transkripsi AI Lebih Realistis dan Akurat

Podcastle Luncurkan Model AI Text-to-Speech Murah dengan 450 Suara UnikTechCrunch
Teknologi
5 bulan lalu
204 dibaca

Podcastle Luncurkan Model AI Text-to-Speech Murah dengan 450 Suara Unik