Courtesy of TechCrunch

Gemini 2.5 Pro dan Claude: AI yang Panik dan Salah Strategi saat Main Pokémon

Untuk mengamati dan menganalisis bagaimana model AI seperti Gemini 2.5 Pro dan Claude berperilaku saat memainkan permainan Pokémon, termasuk bagaimana mereka mengelola tekanan dan memecahkan masalah dalam konteks permainan tersebut.

18 Jun 2025, 03.53 WIB

286 dibaca

Ikhtisar 15 Detik

AI dapat menunjukkan perilaku yang mirip dengan manusia, seperti panik, ketika dihadapkan pada situasi sulit.
Model AI Gemini 2.5 Pro dan Claude menunjukkan kekurangan dalam bermain Pokémon meskipun memiliki kelebihan dalam menyelesaikan puzzle.
Studi tentang AI yang bermain video game dapat memberikan wawasan yang bermanfaat tentang cara kerja dan batasan model AI.

tidak spesifik, dunia maya - Beberapa perusahaan AI seperti Google DeepMind dan Anthropic sedang menguji kemampuan model AI mereka dengan bermain game klasik Pokémon yang berusia lebih dari 25 tahun. Tujuan utamanya adalah untuk melihat bagaimana AI ini dapat menyelesaikan masalah dan mengikuti strategi dalam situasi game yang kompleks.

Dalam pengujian tersebut, ditemukan bahwa model Gemini 2.5 Pro mengalami kondisi 'panik' saat Pokémon miliknya hampir kalah. Kondisi ini menyebabkan AI membuat keputusan yang buruk, mirip dengan bagaimana manusia dapat kehilangan fokus saat tertekan.

Selain itu, AI lain bernama Claude juga menunjukkan perilaku aneh. Claude mencoba strategi mematikan Pokémon-nya sendiri dengan harapan dapat berpindah ke lokasi yang berbeda di dalam game, tetapi itu adalah salah kaprah dari cara kerja game Pokémon.

Meski memiliki kekurangan, AI seperti Gemini mampu menyelesaikan teka-teki yang sulit dengan bantuan manusia dan bahkan membuat alat bantu untuk mempercepat penyelesaian tantangan tertentu seperti teka-teki boulder di Victory Road. Hal ini menunjukkan potensi AI dalam memecahkan masalah yang rumit.

Overall, pengujian bermain Pokémon ini tidak hanya menghibur, tetapi juga memberi wawasan berharga mengenai cara kerja model AI, terutama dalam menghadapi situasi yang tidak pasti dan menekan. Hal ini membantu dalam memahami dan memperbaiki kemampuan AI di masa depan.

Referensi:
[1] https://techcrunch.com/2025/06/17/googles-gemini-panicked-when-playing-pokemon/

Analisis Ahli

Analisis Kami

"null"

Prediksi Kami

Pertanyaan Terkait

Apa yang terjadi ketika Gemini 2.5 Pro dalam situasi panik saat bermain Pokémon?

Ketika Gemini 2.5 Pro dalam situasi panik, performanya dapat menurun dan ia mungkin berhenti menggunakan alat yang tersedia.

Bagaimana cara Claude mencoba menyelesaikan masalah di dalam permainan Pokémon?

Claude mencoba menyelesaikan masalah dengan cara yang keliru, seperti berpikir bahwa ia dapat 'mati' untuk pindah ke Pokémon Center.

Apa yang menarik dari cara AI bermain Pokémon menurut artikel ini?

Kepentingan utama bukan pada waktu penyelesaian, tetapi perilaku AI saat menghadapi tantangan, yang dapat meniru keputusan buruk manusia saat stres.

Apa saja kelebihan Gemini 2.5 Pro dibandingkan pemain manusia?

Gemini 2.5 Pro dapat menyelesaikan puzzle dengan akurasi yang mengesankan dengan bantuan manusia.

Mengapa penelitian tentang AI bermain video game dianggap berguna?

Penelitian ini dianggap berguna karena memberikan wawasan tentang cara kerja model AI melalui interaksi dalam permainan.

Artikel Serupa

Kontroversi Benchmark AI Pokémon: Gemini Google dan Claude Anthropic Beda Langkah Karena Bantuan Minimaps

Dari TechCrunch

Google Luncurkan Gemini 2.5, AI Multimodal Terdepan dengan Kemampuan Reasoning

Dari TheVerge

Google DeepMind Hadirkan Model AI Gemini Robotics untuk Robot Lebih Cerdas dan Aman

Dari Wired

Super Mario Bros Tantang AI, Model Claude Pimpin Performa dalam Permainan Waktu Nyata

Dari TechCrunch

Claude 3.7 Sonnet: AI Baru Anthropic Bermain Pokémon dan Uji Kemampuannya

Dari TechCrunch

Anthropic Uji AI Claude 3.7 Sonnet dengan Bermain Pokémon Red

Dari TechCrunch

Teknologi

9 bulan lalu

138 dibaca

Kontroversi Benchmark AI Pokémon: Gemini Google dan Claude Anthropic Beda Langkah Karena Bantuan Minimaps

Teknologi

9 bulan lalu

275 dibaca

Google Luncurkan Gemini 2.5, AI Multimodal Terdepan dengan Kemampuan Reasoning

Teknologi

10 bulan lalu

62 dibaca

Google DeepMind Hadirkan Model AI Gemini Robotics untuk Robot Lebih Cerdas dan Aman

Teknologi

10 bulan lalu

27 dibaca

Super Mario Bros Tantang AI, Model Claude Pimpin Performa dalam Permainan Waktu Nyata

Teknologi

10 bulan lalu

120 dibaca

Claude 3.7 Sonnet: AI Baru Anthropic Bermain Pokémon dan Uji Kemampuannya

Teknologi

10 bulan lalu

112 dibaca