Headphone Cerdas Terjemahkan Banyak Pembicara dengan Suara Asli dan Arah Petunjuk
Courtesy of InterestingEngineering

Headphone Cerdas Terjemahkan Banyak Pembicara dengan Suara Asli dan Arah Petunjuk

Mengembangkan sistem headphone yang dapat menerjemahkan beberapa pembicara sekaligus sambil mempertahankan arah suara dan kualitas unik suara masing-masing pembicara dalam waktu nyata.

InterestingEngineering
DariĀ InterestingEngineering
10 Mei 2025 pukul 21.40 WIB
89 dibaca
Share
Ikhtisar 15 Detik
  • Sistem terjemahan suara spasial mampu menerjemahkan beberapa pembicara dengan mempertahankan karakteristik suara masing-masing.
  • Penelitian ini menandai langkah awal menuju integrasi persepsi spasial dalam terjemahan suara.
  • Sistem ini tidak menggunakan komputasi awan untuk menjaga privasi pengguna.
Para peneliti dari University of Washington mengembangkan sistem headphone pintar yang mampu menerjemahkan beberapa pembicara sekaligus, sambil tetap mempertahankan suara asli dan arah sumber suara tiap orang. Sistem ini menggunakan headphone biasa yang dilengkapi mikrofon dan mengandalkan algoritma canggih untuk mengelola suara secara spatial. Sistem yang disebut Spatial Speech Translation ini dapat langsung mendeteksi berapa banyak orang yang berbicara dalam ruang yang sama, baik di dalam ruangan maupun di luar ruangan, dengan teknologi yang mirip radar untuk memindai 360 derajat secara terus menerus. Selain menerjemahkan, sistem juga menjaga ekspresi suara dan volume setiap pembicara, serta mampu mengikuti pergerakan kepala pembicara sehingga suara yang diterima oleh pengguna terasa alami dan realistis. Hal ini membuat pengalaman mendengar jadi jauh lebih baik dibanding model terjemahan suara sebelumnya. Pengujian sistem dilakukan pada 29 partisipan di 10 lokasi berbeda dan hasilnya mereka lebih menyukai sistem ini, terutama dengan delay terjemahan sekitar 3-4 detik, walaupun para peneliti masih bekerja untuk mempercepat waktu terjemahan tanpa mengurangi kualitasnya. Sistem ini dioperasikan di perangkat lokal seperti laptop dengan chip Apple M2 tanpa perlu koneksi internet, sehingga lebih aman dari risiko pelanggaran privasi. Saat ini, sistem baru mendukung bahasa sehari-hari seperti Spanyol, Jerman, dan Perancis, dan belum mampu menangani bahasa teknis atau khusus. Namun, teknologi ini menjadi langkah awal penting dalam mengintegrasikan pemahaman spatial atau ruang ke dalam teknologi terjemahan suara yang selama ini belum ada.

Pertanyaan Terkait

Q
Apa itu sistem terjemahan suara spasial?
A
Sistem terjemahan suara spasial adalah sistem headphone yang dapat menerjemahkan beberapa pembicara secara bersamaan sambil mempertahankan arah dan kualitas suara mereka.
Q
Siapa yang mengembangkan sistem ini?
A
Sistem ini dikembangkan oleh peneliti dari Universitas Washington.
Q
Apa inovasi utama dari sistem ini?
A
Inovasi utama dari sistem ini adalah kemampuan untuk mendeteksi jumlah pembicara, menerjemahkan ucapan dengan mempertahankan kualitas suara, dan melacak arah suara saat pembicara bergerak.
Q
Dalam pengujian, bagaimana pengguna merespons sistem ini?
A
Dalam pengujian, sebagian besar pengguna lebih memilih sistem ini dibandingkan model yang tidak melacak pembicara.
Q
Apakah sistem ini dapat menerjemahkan semua jenis bahasa?
A
Sistem ini saat ini hanya dapat menerjemahkan ucapan umum, tetapi dapat dilatih untuk menerjemahkan sekitar 100 bahasa.

Artikel Serupa

OpenAI meningkatkan model AI transkripsi dan penghasil suara.TechCrunch
Teknologi
1 bulan lalu
128 dibaca

OpenAI meningkatkan model AI transkripsi dan penghasil suara.

Teknologi pembengkokan suara memungkinkan Anda mendengarkan musik tanpa earphone sementara orang lain tidak terganggu.InterestingEngineering
Teknologi
1 bulan lalu
42 dibaca

Teknologi pembengkokan suara memungkinkan Anda mendengarkan musik tanpa earphone sementara orang lain tidak terganggu.

AirPods Apple akan mendapatkan peningkatan seperti di Star Trek dengan terjemahan langsung.SCMP
Teknologi
1 bulan lalu
85 dibaca

AirPods Apple akan mendapatkan peningkatan seperti di Star Trek dengan terjemahan langsung.

Apple dilaporkan membawa terjemahan langsung ke AirPodsTheVerge
Teknologi
1 bulan lalu
39 dibaca

Apple dilaporkan membawa terjemahan langsung ke AirPods

China meluncurkan antarmuka otak-komputer dua arah pertama di dunia dengan efisiensi 100x.InterestingEngineering
Sains
2 bulan lalu
45 dibaca

China meluncurkan antarmuka otak-komputer dua arah pertama di dunia dengan efisiensi 100x.

Aplikasi Pembunuh untuk Kacamata Pintar dan Earbud: Terjemahan Waktu NyataForbes
Teknologi
2 bulan lalu
114 dibaca

Aplikasi Pembunuh untuk Kacamata Pintar dan Earbud: Terjemahan Waktu Nyata