Courtesy of TechCrunch
Google Gabungkan AI Gemini dan Veo untuk Asisten Digital yang Lebih Cerdas
Mengembangkan model AI multimodal yang dapat memahami dan mensintesis berbagai bentuk media untuk menciptakan asisten digital universal.
11 Apr 2025, 04.13 WIB
177 dibaca
Share
Ikhtisar 15 Detik
- Google berfokus pada pengembangan model AI yang dapat memahami berbagai bentuk media.
- Data dari YouTube digunakan untuk melatih model AI dalam memahami fisika dunia.
- Model multimodal diharapkan dapat menciptakan asisten digital yang lebih efektif untuk pengguna.
California, United States - CEO Google DeepMind, Demis Hassabis, mengungkapkan rencana Google untuk menggabungkan model AI Gemini dengan model video-generating Veo. Langkah ini bertujuan untuk meningkatkan pemahaman AI tentang dunia fisik dan menciptakan asisten digital universal yang dapat membantu di dunia nyata.
Model Gemini Google dirancang untuk menjadi multimodal sejak awal, mampu menghasilkan audio, gambar, dan teks. Selain itu, OpenAI dan Amazon juga mengembangkan model AI serupa yang dapat memahami dan mensintesis berbagai bentuk media.
Data video untuk model Veo sebagian besar berasal dari YouTube, yang dimiliki oleh Google. Google telah memperluas ketentuan layanannya untuk memungkinkan penggunaan lebih banyak data dari YouTube guna melatih model AI-nya.
--------------------
Analisis Kami: Google DeepMind benar-benar mengambil langkah maju yang signifikan dengan mengintegrasikan data video nyata untuk melatih pemahaman AI terhadap fisika dunia nyata, sebuah pendekatan yang mendekati pemodelan kecerdasan manusia yang sebenarnya. Namun, pemanfaatan data dari YouTube menimbulkan kekhawatiran soal etika penggunaan konten dan perlindungan hak cipta yang perlu diawasi ketat agar tidak merugikan kreator konten.
--------------------
Analisis Ahli:
Yoshua Bengio: Penggunaan data multimodal, apalagi yang sangat beragam seperti video, sangat penting untuk mencapai AI yang 'benar-benar' memahami konteks dunia nyata, tetapi tantangan utama tetap di sisi regulasi data dan privasi pengguna.
Fei-Fei Li: Integrasi visual data dari video akan membuat model AI lebih adaptif dan efektif dalam interaksi sehari-hari, membuka peluang besar dalam aplikasi praktis seperti robotika dan asisten pintar.
--------------------
What's Next: Penggabungan model Gemini dan Veo akan memungkinkan terciptanya asisten digital AI yang lebih canggih dan serba bisa, mampu memahami dan berinteraksi dengan lingkungan dunia nyata secara lebih efektif, serta memicu persaingan besar dalam pengembangan AI multimodal global.
Referensi:
[1] https://techcrunch.com/2025/04/10/deepmind-ceo-demis-hassabis-says-google-will-eventually-combine-its-gemini-and-veo-ai-models/
[1] https://techcrunch.com/2025/04/10/deepmind-ceo-demis-hassabis-says-google-will-eventually-combine-its-gemini-and-veo-ai-models/
Pertanyaan Terkait
Q
Apa yang direncanakan Google dengan model Gemini dan Veo?A
Google berencana untuk menggabungkan model Gemini dengan model Veo untuk meningkatkan pemahaman AI tentang dunia fisik.Q
Siapa yang menjadi CEO Google DeepMind?A
CEO Google DeepMind adalah Demis Hassabis.Q
Dari mana data video untuk model Veo berasal?A
Data video untuk model Veo sebagian besar berasal dari YouTube.Q
Apa tujuan dari pengembangan model multimodal?A
Tujuan dari pengembangan model multimodal adalah untuk menciptakan asisten digital universal yang dapat membantu pengguna di dunia nyata.Q
Apa yang diumumkan oleh Amazon terkait model AI?A
Amazon mengumumkan rencana untuk meluncurkan model 'any-to-any' yang dapat memahami berbagai bentuk media.