DeepSWE Berbasis Qwen3-32B Melesat di Benchmark AI Open-Source Industri
Courtesy of SCMP

DeepSWE Berbasis Qwen3-32B Melesat di Benchmark AI Open-Source Industri

Menunjukkan keberhasilan DeepSWE yang dilatih dengan model Qwen3-32B dalam mengungguli model pesaing di benchmark industri, sekaligus menegaskan posisi Alibaba sebagai pemimpin dalam komunitas AI open-source.

04 Jul 2025, 06.11 WIB
144 dibaca
Share
Ikhtisar 15 Detik
  • DeepSWE berhasil mengungguli kompetitor dalam benchmark industri.
  • Kolaborasi antara organisasi dan start-up penting untuk inovasi di bidang AI.
  • Pendekatan open-source meningkatkan kolaborasi dan pengembangan dalam komunitas teknologi.
Hangzhou, Tiongkok - DeepSWE adalah framework agentic yang dikembangkan bersama oleh Agentica dan Together AI, yang menggunakan model bahasa besar Qwen3-32B dari Alibaba Cloud. DeepSWE berhasil meraih akurasi 59 persen dalam pengujian SWEBench-Verified, lebih unggul dari pesaingnya seperti DeepSeek-V3.
Agentic framework adalah platform yang menyediakan berbagai alat dan fungsi untuk membangun, menjalankan, dan mengelola AI agent secara efektif agar bisa bekerja sama dan mengambil keputusan secara mandiri dalam tugas yang kompleks.
AI agent seperti yang dikembangkan oleh beberapa startup termasuk Butterfly Effect dapat secara otomatis merancang rencana tugas dan melaksanakan subtugas untuk mencapai tujuan dengan memanfaatkan sumber daya yang ada.
Keberhasilan DeepSWE menunjukkan posisi Alibaba yang semakin kuat dalam komunitas open-source global, terutama di bidang kecerdasan buatan yang berkembang pesat.
Pendekatan open-source memungkinkan pengembang lain mengakses kode sumber untuk memperbaiki, mengembangkan, atau mengadaptasi perangkat lunak tersebut, membuka peluang inovasi yang lebih luas di dunia teknologi AI.
Referensi:
[1] https://www.scmp.com/tech/big-tech/article/3316821/alibabas-open-source-ai-model-shines-qwen-based-agentic-framework-tops-global-ranking?module=top_story&pgtype=section

Analisis Kami

"Keberhasilan DeepSWE merupakan indikator penting bahwa platform agentik yang dibangun di atas model besar open-source bisa membawa inovasi signifikan dalam AI otonom. Ini juga menunjukkan bahwa perusahaan besar seperti Alibaba semakin serius dalam memperkuat ekosistem AI open-source global, yang akan mendorong persaingan dan inovasi lebih terbuka di industri ini."

Analisis Ahli

Andrew Ng
"Menggunakan model open-source dalam agentik framework memungkinkan pengembangan yang lebih cepat dan transparan dibandingkan pendekatan tertutup, yang pada akhirnya meningkatkan kepercayaan dan kolaborasi dalam ekosistem AI."
Fei-Fei Li
"Keunggulan DeepSWE memberikan bukti kuat bahwa integrasi AI otonom berbasis kerangka agentik bisa menangani kompleksitas tugas nyata dengan lebih efektif, menjadi langkah besar untuk aplikasi AI di dunia nyata."

Prediksi Kami

Dengan keberhasilan DeepSWE di benchmark terbaru, kemungkinan besar akan terjadi peningkatan adopsi teknologi agentik berbasis model open-weight, yang akan mempercepat pengembangan AI lebih otonom dan kolaboratif.

Pertanyaan Terkait

Q
Apa itu DeepSWE?
A
DeepSWE adalah kerangka kerja agensi yang dirancang untuk membangun dan mengelola agen AI.
Q
Model apa yang digunakan untuk melatih DeepSWE?
A
DeepSWE dilatih menggunakan model Qwen3-32B.
Q
Siapa yang mengembangkan DeepSWE?
A
DeepSWE dikembangkan oleh inisiatif open-source Agentica dan start-up Together AI.
Q
Apa hasil kinerja DeepSWE dalam benchmark SWEBench-Verified?
A
DeepSWE mencetak akurasi 59 persen dalam benchmark SWEBench-Verified, mengungguli model DeepSeek-V3.
Q
Apa keuntungan dari pendekatan open-source?
A
Pendekatan open-source memungkinkan akses publik ke kode sumber, sehingga pengembang pihak ketiga dapat memodifikasi dan berbagi desain.

Artikel Serupa

Alibaba Luncurkan Qwen3, Model AI Open-Source Terbaru dengan Performa UnggulSCMP
Teknologi
4 bulan lalu
204 dibaca

Alibaba Luncurkan Qwen3, Model AI Open-Source Terbaru dengan Performa Unggul

Alibaba Luncurkan Model AI Ringkas yang Kalahkan DeepSeek R1 dalam Koding dan MatematikaSCMP
Teknologi
6 bulan lalu
251 dibaca

Alibaba Luncurkan Model AI Ringkas yang Kalahkan DeepSeek R1 dalam Koding dan Matematika

Alibaba Luncurkan Model AI QwQ-32B yang Lebih Kuat dan Hemat Sumber DayaSCMP
Teknologi
6 bulan lalu
79 dibaca

Alibaba Luncurkan Model AI QwQ-32B yang Lebih Kuat dan Hemat Sumber Daya

Alibaba Qwen2.5-Max Meroket ke Peringkat Tujuh di Ajang Chatbot ArenaSCMP
Teknologi
7 bulan lalu
154 dibaca

Alibaba Qwen2.5-Max Meroket ke Peringkat Tujuh di Ajang Chatbot Arena

Alibaba Luncurkan Qwen 2.5 Max, Lawan Berat DeepSeek di Perang AI ChinaInterestingEngineering
Teknologi
7 bulan lalu
120 dibaca

Alibaba Luncurkan Qwen 2.5 Max, Lawan Berat DeepSeek di Perang AI China

Persaingan Sengit AI di China: Alibaba Keluarkan Qwen 2.5-Max Tantang DeepSeek-V3TheJakartaPost
Teknologi
7 bulan lalu
158 dibaca

Persaingan Sengit AI di China: Alibaba Keluarkan Qwen 2.5-Max Tantang DeepSeek-V3