Pomodo Logo IconPomodo Logo Icon
Tanya PomodoSemua Artikel
Semua
Gemini 2.5 Pro dan Claude: AI yang Panik dan Salah Strategi saat Main Pokémon
Courtesy of TechCrunch
Teknologi
Kecerdasan Buatan

Gemini 2.5 Pro dan Claude: AI yang Panik dan Salah Strategi saat Main Pokémon

Untuk mengamati dan menganalisis bagaimana model AI seperti Gemini 2.5 Pro dan Claude berperilaku saat memainkan permainan Pokémon, termasuk bagaimana mereka mengelola tekanan dan memecahkan masalah dalam konteks permainan tersebut.

18 Jun 2025, 03.53 WIB
64 dibaca
Share
Ikhtisar 15 Detik
  • AI dapat menunjukkan perilaku yang mirip dengan manusia, seperti panik, ketika dihadapkan pada situasi sulit.
  • Model AI Gemini 2.5 Pro dan Claude menunjukkan kekurangan dalam bermain Pokémon meskipun memiliki kelebihan dalam menyelesaikan puzzle.
  • Studi tentang AI yang bermain video game dapat memberikan wawasan yang bermanfaat tentang cara kerja dan batasan model AI.
tidak spesifik, dunia maya - Beberapa perusahaan AI seperti Google DeepMind dan Anthropic sedang menguji kemampuan model AI mereka dengan bermain game klasik Pokémon yang berusia lebih dari 25 tahun. Tujuan utamanya adalah untuk melihat bagaimana AI ini dapat menyelesaikan masalah dan mengikuti strategi dalam situasi game yang kompleks.
Baca juga: Google DeepMind Luncurkan Gemini 2.5 Deep Think, Model AI Pemecah Masalah Terbaik
Dalam pengujian tersebut, ditemukan bahwa model Gemini 2.5 Pro mengalami kondisi 'panik' saat Pokémon miliknya hampir kalah. Kondisi ini menyebabkan AI membuat keputusan yang buruk, mirip dengan bagaimana manusia dapat kehilangan fokus saat tertekan.
Selain itu, AI lain bernama Claude juga menunjukkan perilaku aneh. Claude mencoba strategi mematikan Pokémon-nya sendiri dengan harapan dapat berpindah ke lokasi yang berbeda di dalam game, tetapi itu adalah salah kaprah dari cara kerja game Pokémon.
Meski memiliki kekurangan, AI seperti Gemini mampu menyelesaikan teka-teki yang sulit dengan bantuan manusia dan bahkan membuat alat bantu untuk mempercepat penyelesaian tantangan tertentu seperti teka-teki boulder di Victory Road. Hal ini menunjukkan potensi AI dalam memecahkan masalah yang rumit.
Baca juga: DeepMind AlphaEvolve: AI Baru Untuk Kurangi Kesalahan dan Optimalkan Infrastruktur
Overall, pengujian bermain Pokémon ini tidak hanya menghibur, tetapi juga memberi wawasan berharga mengenai cara kerja model AI, terutama dalam menghadapi situasi yang tidak pasti dan menekan. Hal ini membantu dalam memahami dan memperbaiki kemampuan AI di masa depan.
Sumber: https://techcrunch.com/2025/06/17/googles-gemini-panicked-when-playing-pokemon/

Pertanyaan Terkait

Q
Apa yang terjadi ketika Gemini 2.5 Pro dalam situasi panik saat bermain Pokémon?
A
Ketika Gemini 2.5 Pro dalam situasi panik, performanya dapat menurun dan ia mungkin berhenti menggunakan alat yang tersedia.
Q
Bagaimana cara Claude mencoba menyelesaikan masalah di dalam permainan Pokémon?
A
Claude mencoba menyelesaikan masalah dengan cara yang keliru, seperti berpikir bahwa ia dapat 'mati' untuk pindah ke Pokémon Center.
Q
Apa yang menarik dari cara AI bermain Pokémon menurut artikel ini?
A
Kepentingan utama bukan pada waktu penyelesaian, tetapi perilaku AI saat menghadapi tantangan, yang dapat meniru keputusan buruk manusia saat stres.
Q
Apa saja kelebihan Gemini 2.5 Pro dibandingkan pemain manusia?
A
Gemini 2.5 Pro dapat menyelesaikan puzzle dengan akurasi yang mengesankan dengan bantuan manusia.
Q
Mengapa penelitian tentang AI bermain video game dianggap berguna?
A
Penelitian ini dianggap berguna karena memberikan wawasan tentang cara kerja model AI melalui interaksi dalam permainan.

Artikel Serupa

Kontroversi Benchmarking AI: Gemini vs Claude dalam Game Pokémon
Kontroversi Benchmarking AI: Gemini vs Claude dalam Game Pokémon
Dari TechCrunch
Google mengatakan bahwa model AI 'reasoning' Gemini yang baru adalah yang terbaik sejauh ini.
Google mengatakan bahwa model AI 'reasoning' Gemini yang baru adalah yang terbaik sejauh ini.
Dari TheVerge
Model AI Robotika Gemini dari Google Menjangkau Dunia Fisik
Model AI Robotika Gemini dari Google Menjangkau Dunia Fisik
Dari Wired
Tonton robot AI DeepMind melakukan slam dunk bola basket.
Tonton robot AI DeepMind melakukan slam dunk bola basket.
Dari NatureMagazine
Orang-orang sekarang menggunakan Super Mario untuk mengukur kinerja AI.
Orang-orang sekarang menggunakan Super Mario untuk mengukur kinerja AI.
Dari TechCrunch
Claude AI dari Anthropic sedang bermain Pokémon di Twitch — dengan lambat.
Claude AI dari Anthropic sedang bermain Pokémon di Twitch — dengan lambat.
Dari TechCrunch
Kontroversi Benchmarking AI: Gemini vs Claude dalam Game PokémonTechCrunch
Teknologi
3 bulan lalu
43 dibaca

Kontroversi Benchmarking AI: Gemini vs Claude dalam Game Pokémon

Google mengatakan bahwa model AI 'reasoning' Gemini yang baru adalah yang terbaik sejauh ini.TheVerge
Teknologi
4 bulan lalu
64 dibaca

Google mengatakan bahwa model AI 'reasoning' Gemini yang baru adalah yang terbaik sejauh ini.

Model AI Robotika Gemini dari Google Menjangkau Dunia FisikWired
Teknologi
4 bulan lalu
108 dibaca

Model AI Robotika Gemini dari Google Menjangkau Dunia Fisik

Tonton robot AI DeepMind melakukan slam dunk bola basket.NatureMagazine
Teknologi
4 bulan lalu
124 dibaca

Tonton robot AI DeepMind melakukan slam dunk bola basket.

Orang-orang sekarang menggunakan Super Mario untuk mengukur kinerja AI.TechCrunch
Teknologi
5 bulan lalu
136 dibaca

Orang-orang sekarang menggunakan Super Mario untuk mengukur kinerja AI.

Claude AI dari Anthropic sedang bermain Pokémon di Twitch — dengan lambat.TechCrunch
Teknologi
5 bulan lalu
180 dibaca

Claude AI dari Anthropic sedang bermain Pokémon di Twitch — dengan lambat.