Courtesy of SCMP

Model AI Alibaba Qwen3-Max-Thinking Raih Skor Sempurna di Kompetisi Matematika AS

Menginformasikan keberhasilan model AI terbaru Alibaba, Qwen3-Max-Thinking, yang mencapai skor sempurna pada kompetisi matematika bergengsi di AS, serta menegaskan peran penting kemampuan reasoning dalam pengembangan AI canggih global.

04 Nov 2025, 17.00 WIB

255 dibaca

Ikhtisar 15 Detik

Qwen3-Max-Thinking dari Alibaba mencapai skor 100% dalam kompetisi matematika bergengsi.
Keberhasilan ini menunjukkan kemajuan signifikan dalam pengembangan model AI di China.
Kompetisi matematika seperti AIME dan HMMT menjadi indikator penting dari kemampuan penalaran AI.

Beijing, Republik Rakyat Tiongkok - Alibaba mengumumkan model AI terbarunya, Qwen3-Max-Thinking, yang berhasil meraih skor sempurna dalam dua kompetisi matematika bergengsi di Amerika Serikat, yaitu American Invitational Mathematics Examination (AIME) 2025 dan Harvard-MIT Mathematics Tournament (HMMT). Prestasi ini menunjukkan kemampuan reasoning dan pemecahan masalah yang sangat tinggi dari model tersebut.

Kompetisi AIME dan HMMT dikenal sebagai ajang matematika internasional yang sangat menantang, fokus pada soal-soal terkait aritmatika, aljabar, teori bilangan, dan probabilita. Mencapai skor 100% di kompetisi ini merupakan bukti keunggulan kemampuan AI dalam memproses dan menyelesaikan masalah matematis kompleks.

Sebelumnya, hanya beberapa model AI terkemuka, termasuk GPT-5 Pro dari OpenAI, yang melaporkan pencapaian skor sempurna pada kompetisi ini. Qwen3-Max-Thinking menjadi model AI reasoning pertama asal China yang berhasil menandingi atau bahkan melampaui pencapaian tersebut.

Qwen3-Max-Thinking dibangun berdasarkan model Qwen3-Max yang diluncurkan pada September dan memiliki lebih dari 1 triliun parameter. Parameter yang sangat besar memungkinkan model ini untuk melakukan reasoning yang kompleks dan akurat dalam menghadapi beragam soal matematika.

Keberhasilan ini menandai kemajuan pesat dalam pengembangan AI di Tiongkok, serta memicu persaingan global dalam menciptakan model AI dengan kemampuan reasoning yang lebih kuat. Hal ini juga berpotensi membuka peluang baru untuk pemanfaatan AI dalam pendidikan dan riset ilmiah.

Referensi:
[1] https://www.scmp.com/tech/tech-trends/article/3331467/alibabas-ai-aces-top-global-maths-contests-challenging-openais-dominance?module=top_story&pgtype=section

Analisis Ahli

Andrew Ng

"Skor sempurna pada kompetisi matematika adalah tolok ukur penting bagi perkembangan AI dalam memahami logika dan reasoning, dan keberhasilan ini menunjukkan kemajuan besar di bidang tersebut."

Yann LeCun

"Kemampuan AI untuk mengatasi masalah matematika kompleks menunjukkan bahwa model-model ini telah melewati tahap pembelajaran sederhana dan mulai memahami konsep analitis yang lebih abstrak."

Analisis Kami

"Prestasi Qwen3-Max-Thinking menunjukkan kemajuan teknis yang sangat signifikan dalam bidang AI reasoning buatan Tiongkok, yang kini mampu menyaingi teknologi AI terdepan dari AS. Hal ini juga menandai bahwa pemahaman dan pengembangan AI dalam konteks bahasa dan problem solving semakin universal dan tidak hanya didominasi oleh satu wilayah."

Prediksi Kami

Keberhasilan ini kemungkinan akan mendorong perlombaan global untuk mengembangkan model AI dengan kemampuan reasoning semakin canggih dan aplikasi AI di bidang pendidikan serta riset matematika akan meningkat secara signifikan.

Pertanyaan Terkait

Apa yang dicapai oleh Qwen3-Max-Thinking?

Qwen3-Max-Thinking mencapai skor 100% dalam kompetisi AIME dan HMMT.

Siapa yang mengembangkan model Qwen3-Max-Thinking?

Model Qwen3-Max-Thinking dikembangkan oleh Alibaba Group Holding.

Apa itu AIME dan HMMT?

AIME adalah American Invitational Mathematics Examination dan HMMT adalah Harvard-MIT Mathematics Tournament, keduanya adalah kompetisi matematika bergengsi.

Mengapa skor tinggi dalam kompetisi matematika penting untuk model AI?

Skor tinggi dalam kompetisi matematika penting untuk mengevaluasi kemampuan pemecahan masalah dan penalaran model AI.

Apa perbandingan antara Qwen3-Max-Thinking dan model OpenAI?

Qwen3-Max-Thinking dan OpenAI's GPT-5 Pro sama-sama mencapai skor sempurna dalam kompetisi yang sama.