
Google DeepMind baru saja meluncurkan Genie 3, sebuah model simulasi dunia paling canggih yang bisa menghasilkan lingkungan interaktif secara real time hanya dari perintah teks. Model ini memungkinkan pengguna untuk menjelajahi dunia yang dibuat dengan resolusi 720p dan kecepatan 24 frame per detik.
Genie 3 merupakan pengembangan dari versi sebelumnya yang belum mendukung interaktivitas real time dan konsistensi visual jangka panjang. Kini, Genie 3 dapat mempertahankan ingatan visual hingga satu menit sehingga dunia yang dibuat tampak stabil dan alami.
Model ini bisa mensimulasikan berbagai fenomena fisik seperti cahaya, air, serta menghadirkan ekosistem, karakter animasi, dan juga bisa digunakan untuk membangun dunia nyata atau fiksi berdasarkan perintah pengguna.
Salah satu fitur menarik Genie 3 adalah kemampuannya untuk menerima perintah yang mengubah dunia tersebut, seperti merubah cuaca, menambah objek, atau karakter baru, sehingga menawarkan fleksibilitas tinggi dalam eksplorasi dan pembelajaran AI.
Meski demikian, ada keterbatasan seperti interaksi multi-agen yang masih menjadi tantangan dan ketidakmampuan mensimulasikan lokasi geografis nyata secara sempurna. Namun, ini menandai kemajuan penting menuju AI yang lebih umum dan otonom di masa depan.