Courtesy of SCMP

DeepSeek V3-0324: Model AI China Dengan Performa Matematika dan Coding Lebih Hebat

25 Mar 2025, 17.00 WIB

260 dibaca

Ikhtisar 15 Detik

DeepSeek V3 memiliki kemampuan yang lebih baik dalam pemrograman dan matematika.
Model baru ini diluncurkan dengan lisensi MIT yang populer di kalangan pengembang.
DeepSeek-V3-0324 menjadi model teratas di Hugging Face dengan banyak komentar positif.

DeepSeek, sebuah perusahaan kecerdasan buatan (AI) dari China, telah meluncurkan versi terbaru dari model bahasa besar mereka yang disebut DeepSeek-V3-0324. Model ini memiliki lebih banyak parameter dan kemampuan yang lebih baik dalam pemrograman serta menyelesaikan masalah matematika. Versi baru ini juga memiliki kemampuan berpikir yang lebih baik, pengembangan web yang lebih optimal, dan kemampuan menulis dalam bahasa Mandarin yang lebih baik. DeepSeek-V3-0324 kini menjadi model yang paling banyak dibicarakan di platform AI Hugging Face.

Model ini telah menunjukkan peningkatan yang signifikan dalam beberapa tes, seperti ujian matematika AIME, di mana skor model baru mencapai 59,4, jauh lebih tinggi dibandingkan dengan 39,6 dari versi sebelumnya. DeepSeek-V3-0324 memiliki 685 miliar parameter dan menggunakan lisensi perangkat lunak MIT, yang populer di kalangan pengembang. Model ini dapat digunakan dalam berbagai aplikasi, termasuk sebagai chatbot.

Referensi:
[1] https://www.scmp.com/tech/big-tech/article/3303798/deepseeks-upgraded-foundational-model-excels-coding-and-maths?module=top_story&pgtype=section

Analisis Ahli

Andrej Karpathy

"Peningkatan parameter dan kemampuan reasoning dalam model DeepSeek adalah langkah besar yang menunjukkan bagaimana fokus pada niche pasar bahasa lokal bisa sejalan dengan performa global."

Fei-Fei Li

"Mengadaptasi model AI untuk bahasa dan konteks lokal seperti bahasa Mandarin penting untuk memastikan teknologi AI dapat menjangkau lebih banyak pengguna dengan hasil yang relevan dan berkualitas tinggi."

Analisis Kami

"DeepSeek-V3-0324 menunjukkan bahwa investasi dalam jumlah parameter yang lebih besar dan pelatihan yang lebih baik membawa dampak signifikan pada performa, terutama di bidang matematika dan bahasa, yang selama ini menjadi tantangan utama AI. Lisensi MIT juga membuka jalan bagi komunitas pengembang untuk berkolaborasi, sehingga mempercepat kemajuan teknologi AI berbasis bahasa China dalam konteks global."

Prediksi Kami

Dengan peningkatan kemampuan dan lisensi terbuka, model DeepSeek-V3-0324 dapat menjadi lebih populer dan banyak diadopsi di berbagai aplikasi AI dan pengembang independen, mempercepat inovasi dalam teknologi AI berbahasa China.