AI Google Gemini 2.5 Pro Berhasil Selesaikan Pokémon Blue, Mengalahkan Claude AI
Courtesy of TechCrunch

Rangkuman Berita: AI Google Gemini 2.5 Pro Berhasil Selesaikan Pokémon Blue, Mengalahkan Claude AI

Menginformasikan tentang pencapaian AI Google Gemini 2.5 Pro dalam menyelesaikan permainan Pokémon Blue dan membandingkannya dengan model AI lainnya.

TechCrunch
Dari TechCrunch
03 Mei 2025 pukul 23.45 WIB
51 dibaca
Share
Ikhtisar 15 Detik
  • Gemini 2.5 Pro dari Google berhasil menyelesaikan Pokémon Blue, menunjukkan kemajuan dalam AI.
  • Perbandingan antara model AI seperti Gemini dan Claude tidak dapat dilakukan secara langsung karena perbedaan alat dan informasi.
  • Pengembangan AI dalam konteks permainan video dapat melibatkan intervensi manusia untuk meningkatkan kemampuan pengambilan keputusan.
Amerika Serikat - Google telah mencapai tonggak besar dengan model AI termahalnya, Gemini 2.5 Pro, yang berhasil menyelesaikan permainan video Pokémon Blue yang berusia 29 tahun. CEO Google, Sundar Pichai, mengumumkan pencapaian ini di media sosial. Meskipun proyek ini dibuat oleh seorang insinyur perangkat lunak bernama Joel Z, eksekutif Google sangat mendukung upaya ini.
Logan Kilpatrick, pemimpin produk untuk Google AI Studio, sebelumnya mengumumkan bahwa Gemini telah membuat kemajuan besar dalam menyelesaikan Pokémon dan telah mendapatkan lencana kelima. Sebagai perbandingan, model AI Claude dari Anthropic belum berhasil menyelesaikan Pokémon Red. Kedua model AI ini menggunakan alat dan informasi yang berbeda untuk bermain game.
Joel Z menjelaskan bahwa ada intervensi pengembang untuk membantu Gemini menyelesaikan permainan, tetapi ini tidak dianggap sebagai kecurangan. Intervensi tersebut bertujuan untuk meningkatkan kemampuan pengambilan keputusan dan penalaran Gemini. Proyek Gemini Plays Pokémon masih dalam pengembangan aktif dan kerangka kerjanya terus berkembang.

Pertanyaan Terkait

Q
Apa yang diumumkan oleh Sundar Pichai terkait Gemini 2.5 Pro?
A
Sundar Pichai mengumumkan bahwa Gemini 2.5 Pro berhasil menyelesaikan permainan Pokémon Blue.
Q
Siapa yang mengembangkan livestream Gemini Plays Pokémon?
A
Livestream Gemini Plays Pokémon dikembangkan oleh Joel Z, seorang insinyur perangkat lunak yang tidak terafiliasi dengan Google.
Q
Apa perbedaan antara Pokémon Blue dan Pokémon Red?
A
Pokémon Blue dan Pokémon Red adalah versi berbeda dari permainan GameBoy yang dirilis pada tahun 1996, dengan tantangan dan karakter yang sedikit berbeda.
Q
Mengapa Joel Z mengatakan bahwa tidak ada perbandingan langsung antara Gemini dan Claude?
A
Joel Z mengatakan bahwa tidak ada perbandingan langsung antara Gemini dan Claude karena keduanya menggunakan alat dan informasi yang berbeda.
Q
Apa yang dimaksud dengan 'agent harness' dalam konteks permainan ini?
A
'Agent harness' adalah alat yang memberikan model dengan tangkapan layar permainan yang dilengkapi informasi tambahan untuk membantu model dalam mengambil keputusan.

Rangkuman Berita Serupa

Model AI Robotika Gemini dari Google Menjangkau Dunia FisikWired
Teknologi
1 bulan lalu
95 dibaca

Model AI Robotika Gemini dari Google Menjangkau Dunia Fisik

Tonton robot AI DeepMind melakukan slam dunk bola basket.NatureMagazine
Teknologi
1 bulan lalu
105 dibaca

Tonton robot AI DeepMind melakukan slam dunk bola basket.

Orang-orang sekarang menggunakan Super Mario untuk mengukur kinerja AI.TechCrunch
Teknologi
2 bulan lalu
94 dibaca

Orang-orang sekarang menggunakan Super Mario untuk mengukur kinerja AI.

Claude AI dari Anthropic sedang bermain Pokémon di Twitch — dengan lambat.TechCrunch
Teknologi
2 bulan lalu
106 dibaca

Claude AI dari Anthropic sedang bermain Pokémon di Twitch — dengan lambat.

Anthropic menggunakan Pokémon untuk mengukur kinerja model AI terbarunya.TechCrunch
Teknologi
2 bulan lalu
49 dibaca

Anthropic menggunakan Pokémon untuk mengukur kinerja model AI terbarunya.

Google menggabungkan lebih banyak tim AI ke dalam DeepMind untuk 'mempercepat alur penelitian ke pengembang'.TechCrunch
Teknologi
3 bulan lalu
146 dibaca

Google menggabungkan lebih banyak tim AI ke dalam DeepMind untuk 'mempercepat alur penelitian ke pengembang'.