Courtesy of TechCrunch

ElevenLabs Luncurkan Model Scribe, Saingi Google dan OpenAI di Speech-to-Text

27 Feb 2025, 01.00 WIB

268 dibaca

Ikhtisar 15 Detik

ElevenLabs meluncurkan model Scribe untuk bersaing dalam layanan speech-to-text.
Model Scribe mendukung lebih dari 99 bahasa dengan akurasi tinggi.
Perusahaan berencana untuk merilis versi real-time dari model Scribe di masa depan.

ElevenLabs, sebuah startup AI yang baru saja mengumpulkan dana sebesar Rp 2.96 triliun ($180 juta) , telah meluncurkan model speech-to-text pertama mereka yang bernama Scribe. Model ini mendukung lebih dari 99 bahasa dan memiliki akurasi tinggi untuk lebih dari 25 bahasa, termasuk Inggris, Prancis, Jerman, dan Spanyol. Scribe juga memiliki fitur canggih seperti diarization pembicara, yang dapat menentukan siapa yang berbicara, serta penandaan otomatis untuk suara seperti tawa penonton. Meskipun saat ini Scribe hanya dapat digunakan untuk audio yang sudah direkam, perusahaan berencana untuk merilis versi real-time yang dapat digunakan untuk transkripsi pertemuan.

CEO ElevenLabs, Mati Staniszewski, mengatakan bahwa mereka ingin meningkatkan pemahaman dan transkripsi percakapan. Meskipun banyak orang berpendapat bahwa masalah speech-to-text sudah terpecahkan, mereka percaya masih ada banyak bahasa yang akurasinya perlu ditingkatkan. Scribe dipasarkan dengan harga Rp 657.80 ribu ($0,40) per jam untuk audio yang ditranskripsikan, meskipun beberapa pesaing menawarkan harga yang lebih rendah.

Referensi:
[1] https://techcrunch.com/2025/02/26/elevenlabs-is-launching-its-own-speech-to-text-model/

Analisis Ahli

Andrew Ng

"Teknologi speech-to-text masih berkembang pesat dan pemain baru seperti ElevenLabs membawa dinamika penting dengan fokus ke data anotasi berkualitas dan dukungan multibahasa yang kuat."

Fei-Fei Li

"Sistem transkripsi yang akurat dalam berbagai bahasa sangat penting untuk inklusivitas teknologi, dan pendekatan ElevenLabs dalam anotasi data bisa menjadi game changer di pasar global."

Analisis Kami

"ElevenLabs menunjukkan kemajuan signifikan dalam teknologi speech-to-text dengan menawarkan model yang kompetitif dan inovatif di pasar global. Namun, untuk benar-benar menandingi para pemimpin industri seperti Whisper dan Google, mereka harus terus mempercepat pengembangan versi real-time dan menurunkan harga sambil mempertahankan kualitas tinggi."

Prediksi Kami

Dalam waktu dekat, ElevenLabs kemungkinan besar akan meluncurkan versi real-time dari model Scribe, memperluas penggunaan modelnya dari audio pra-rekam ke aplikasi langsung seperti transkripsi rapat dan catatan suara secara real-time.