Courtesy of SCMP
DeepSWE Berbasis Qwen3-32B Melesat di Benchmark AI Open-Source Industri
Menunjukkan keberhasilan DeepSWE yang dilatih dengan model Qwen3-32B dalam mengungguli model pesaing di benchmark industri, sekaligus menegaskan posisi Alibaba sebagai pemimpin dalam komunitas AI open-source.
04 Jul 2025, 06.11 WIB
144 dibaca
Share
Ikhtisar 15 Detik
- DeepSWE berhasil mengungguli kompetitor dalam benchmark industri.
- Kolaborasi antara organisasi dan start-up penting untuk inovasi di bidang AI.
- Pendekatan open-source meningkatkan kolaborasi dan pengembangan dalam komunitas teknologi.
Hangzhou, Tiongkok - DeepSWE adalah framework agentic yang dikembangkan bersama oleh Agentica dan Together AI, yang menggunakan model bahasa besar Qwen3-32B dari Alibaba Cloud. DeepSWE berhasil meraih akurasi 59 persen dalam pengujian SWEBench-Verified, lebih unggul dari pesaingnya seperti DeepSeek-V3.
Agentic framework adalah platform yang menyediakan berbagai alat dan fungsi untuk membangun, menjalankan, dan mengelola AI agent secara efektif agar bisa bekerja sama dan mengambil keputusan secara mandiri dalam tugas yang kompleks.
AI agent seperti yang dikembangkan oleh beberapa startup termasuk Butterfly Effect dapat secara otomatis merancang rencana tugas dan melaksanakan subtugas untuk mencapai tujuan dengan memanfaatkan sumber daya yang ada.
Keberhasilan DeepSWE menunjukkan posisi Alibaba yang semakin kuat dalam komunitas open-source global, terutama di bidang kecerdasan buatan yang berkembang pesat.
Pendekatan open-source memungkinkan pengembang lain mengakses kode sumber untuk memperbaiki, mengembangkan, atau mengadaptasi perangkat lunak tersebut, membuka peluang inovasi yang lebih luas di dunia teknologi AI.
Referensi:
[1] https://www.scmp.com/tech/big-tech/article/3316821/alibabas-open-source-ai-model-shines-qwen-based-agentic-framework-tops-global-ranking?module=top_story&pgtype=section
[1] https://www.scmp.com/tech/big-tech/article/3316821/alibabas-open-source-ai-model-shines-qwen-based-agentic-framework-tops-global-ranking?module=top_story&pgtype=section
Analisis Kami
"Keberhasilan DeepSWE merupakan indikator penting bahwa platform agentik yang dibangun di atas model besar open-source bisa membawa inovasi signifikan dalam AI otonom. Ini juga menunjukkan bahwa perusahaan besar seperti Alibaba semakin serius dalam memperkuat ekosistem AI open-source global, yang akan mendorong persaingan dan inovasi lebih terbuka di industri ini."
Analisis Ahli
Andrew Ng
"Menggunakan model open-source dalam agentik framework memungkinkan pengembangan yang lebih cepat dan transparan dibandingkan pendekatan tertutup, yang pada akhirnya meningkatkan kepercayaan dan kolaborasi dalam ekosistem AI."
Fei-Fei Li
"Keunggulan DeepSWE memberikan bukti kuat bahwa integrasi AI otonom berbasis kerangka agentik bisa menangani kompleksitas tugas nyata dengan lebih efektif, menjadi langkah besar untuk aplikasi AI di dunia nyata."
Prediksi Kami
Dengan keberhasilan DeepSWE di benchmark terbaru, kemungkinan besar akan terjadi peningkatan adopsi teknologi agentik berbasis model open-weight, yang akan mempercepat pengembangan AI lebih otonom dan kolaboratif.
Pertanyaan Terkait
Q
Apa itu DeepSWE?A
DeepSWE adalah kerangka kerja agensi yang dirancang untuk membangun dan mengelola agen AI.Q
Model apa yang digunakan untuk melatih DeepSWE?A
DeepSWE dilatih menggunakan model Qwen3-32B.Q
Siapa yang mengembangkan DeepSWE?A
DeepSWE dikembangkan oleh inisiatif open-source Agentica dan start-up Together AI.Q
Apa hasil kinerja DeepSWE dalam benchmark SWEBench-Verified?A
DeepSWE mencetak akurasi 59 persen dalam benchmark SWEBench-Verified, mengungguli model DeepSeek-V3.Q
Apa keuntungan dari pendekatan open-source?A
Pendekatan open-source memungkinkan akses publik ke kode sumber, sehingga pengembang pihak ketiga dapat memodifikasi dan berbagi desain.