Courtesy of SCMP

DeepSWE Berbasis Qwen3-32B Melesat di Benchmark AI Open-Source Industri

Menunjukkan keberhasilan DeepSWE yang dilatih dengan model Qwen3-32B dalam mengungguli model pesaing di benchmark industri, sekaligus menegaskan posisi Alibaba sebagai pemimpin dalam komunitas AI open-source.

04 Jul 2025, 06.11 WIB

47 dibaca

Ikhtisar 15 Detik

DeepSWE berhasil mengungguli kompetitor dalam benchmark industri.
Kolaborasi antara organisasi dan start-up penting untuk inovasi di bidang AI.
Pendekatan open-source meningkatkan kolaborasi dan pengembangan dalam komunitas teknologi.

Hangzhou, Tiongkok - DeepSWE adalah framework agentic yang dikembangkan bersama oleh Agentica dan Together AI, yang menggunakan model bahasa besar Qwen3-32B dari Alibaba Cloud. DeepSWE berhasil meraih akurasi 59 persen dalam pengujian SWEBench-Verified, lebih unggul dari pesaingnya seperti DeepSeek-V3.

Agentic framework adalah platform yang menyediakan berbagai alat dan fungsi untuk membangun, menjalankan, dan mengelola AI agent secara efektif agar bisa bekerja sama dan mengambil keputusan secara mandiri dalam tugas yang kompleks.

AI agent seperti yang dikembangkan oleh beberapa startup termasuk Butterfly Effect dapat secara otomatis merancang rencana tugas dan melaksanakan subtugas untuk mencapai tujuan dengan memanfaatkan sumber daya yang ada.

Keberhasilan DeepSWE menunjukkan posisi Alibaba yang semakin kuat dalam komunitas open-source global, terutama di bidang kecerdasan buatan yang berkembang pesat.

Pendekatan open-source memungkinkan pengembang lain mengakses kode sumber untuk memperbaiki, mengembangkan, atau mengadaptasi perangkat lunak tersebut, membuka peluang inovasi yang lebih luas di dunia teknologi AI.

Referensi:
[1] https://www.scmp.com/tech/big-tech/article/3316821/alibabas-open-source-ai-model-shines-qwen-based-agentic-framework-tops-global-ranking?module=top_story&pgtype=section

Analisis Ahli

Andrew Ng

"Menggunakan model open-source dalam agentik framework memungkinkan pengembangan yang lebih cepat dan transparan dibandingkan pendekatan tertutup, yang pada akhirnya meningkatkan kepercayaan dan kolaborasi dalam ekosistem AI."

Fei-Fei Li

"Keunggulan DeepSWE memberikan bukti kuat bahwa integrasi AI otonom berbasis kerangka agentik bisa menangani kompleksitas tugas nyata dengan lebih efektif, menjadi langkah besar untuk aplikasi AI di dunia nyata."

Analisis Kami

"Keberhasilan DeepSWE merupakan indikator penting bahwa platform agentik yang dibangun di atas model besar open-source bisa membawa inovasi signifikan dalam AI otonom. Ini juga menunjukkan bahwa perusahaan besar seperti Alibaba semakin serius dalam memperkuat ekosistem AI open-source global, yang akan mendorong persaingan dan inovasi lebih terbuka di industri ini."

Prediksi Kami

Dengan keberhasilan DeepSWE di benchmark terbaru, kemungkinan besar akan terjadi peningkatan adopsi teknologi agentik berbasis model open-weight, yang akan mempercepat pengembangan AI lebih otonom dan kolaboratif.