Courtesy of TechCrunch

Google Gabungkan AI Gemini dan Veo untuk Asisten Digital yang Lebih Cerdas

Mengembangkan model AI multimodal yang dapat memahami dan mensintesis berbagai bentuk media untuk menciptakan asisten digital universal.

11 Apr 2025, 04.13 WIB

283 dibaca

Ikhtisar 15 Detik

Google berfokus pada pengembangan model AI yang dapat memahami berbagai bentuk media.
Data dari YouTube digunakan untuk melatih model AI dalam memahami fisika dunia.
Model multimodal diharapkan dapat menciptakan asisten digital yang lebih efektif untuk pengguna.

California, United States - CEO Google DeepMind, Demis Hassabis, mengungkapkan rencana Google untuk menggabungkan model AI Gemini dengan model video-generating Veo. Langkah ini bertujuan untuk meningkatkan pemahaman AI tentang dunia fisik dan menciptakan asisten digital universal yang dapat membantu di dunia nyata.

Model Gemini Google dirancang untuk menjadi multimodal sejak awal, mampu menghasilkan audio, gambar, dan teks. Selain itu, OpenAI dan Amazon juga mengembangkan model AI serupa yang dapat memahami dan mensintesis berbagai bentuk media.

Data video untuk model Veo sebagian besar berasal dari YouTube, yang dimiliki oleh Google. Google telah memperluas ketentuan layanannya untuk memungkinkan penggunaan lebih banyak data dari YouTube guna melatih model AI-nya.

Referensi:
[1] https://techcrunch.com/2025/04/10/deepmind-ceo-demis-hassabis-says-google-will-eventually-combine-its-gemini-and-veo-ai-models/

Analisis Ahli

Yoshua Bengio

"Penggunaan data multimodal, apalagi yang sangat beragam seperti video, sangat penting untuk mencapai AI yang 'benar-benar' memahami konteks dunia nyata, tetapi tantangan utama tetap di sisi regulasi data dan privasi pengguna."

Fei-Fei Li

"Integrasi visual data dari video akan membuat model AI lebih adaptif dan efektif dalam interaksi sehari-hari, membuka peluang besar dalam aplikasi praktis seperti robotika dan asisten pintar."

Analisis Kami

"Google DeepMind benar-benar mengambil langkah maju yang signifikan dengan mengintegrasikan data video nyata untuk melatih pemahaman AI terhadap fisika dunia nyata, sebuah pendekatan yang mendekati pemodelan kecerdasan manusia yang sebenarnya. Namun, pemanfaatan data dari YouTube menimbulkan kekhawatiran soal etika penggunaan konten dan perlindungan hak cipta yang perlu diawasi ketat agar tidak merugikan kreator konten."

Prediksi Kami

Penggabungan model Gemini dan Veo akan memungkinkan terciptanya asisten digital AI yang lebih canggih dan serba bisa, mampu memahami dan berinteraksi dengan lingkungan dunia nyata secara lebih efektif, serta memicu persaingan besar dalam pengembangan AI multimodal global.