Courtesy of SCMP
DeepSeek V3-0324: Model AI China Dengan Performa Matematika dan Coding Lebih Hebat
25 Mar 2025, 17.00 WIB
52 dibaca
Share
Ikhtisar 15 Detik
- DeepSeek V3 memiliki kemampuan yang lebih baik dalam pemrograman dan matematika.
- Model baru ini diluncurkan dengan lisensi MIT yang populer di kalangan pengembang.
- DeepSeek-V3-0324 menjadi model teratas di Hugging Face dengan banyak komentar positif.
DeepSeek, sebuah perusahaan kecerdasan buatan (AI) dari China, telah meluncurkan versi terbaru dari model bahasa besar mereka yang disebut DeepSeek-V3-0324. Model ini memiliki lebih banyak parameter dan kemampuan yang lebih baik dalam pemrograman serta menyelesaikan masalah matematika. Versi baru ini juga memiliki kemampuan berpikir yang lebih baik, pengembangan web yang lebih optimal, dan kemampuan menulis dalam bahasa Mandarin yang lebih baik. DeepSeek-V3-0324 kini menjadi model yang paling banyak dibicarakan di platform AI Hugging Face.
Model ini telah menunjukkan peningkatan yang signifikan dalam beberapa tes, seperti ujian matematika AIME, di mana skor model baru mencapai 59,4, jauh lebih tinggi dibandingkan dengan 39,6 dari versi sebelumnya. DeepSeek-V3-0324 memiliki 685 miliar parameter dan menggunakan lisensi perangkat lunak MIT, yang populer di kalangan pengembang. Model ini dapat digunakan dalam berbagai aplikasi, termasuk sebagai chatbot.
--------------------
Analisis Kami: DeepSeek-V3-0324 menunjukkan bahwa investasi dalam jumlah parameter yang lebih besar dan pelatihan yang lebih baik membawa dampak signifikan pada performa, terutama di bidang matematika dan bahasa, yang selama ini menjadi tantangan utama AI. Lisensi MIT juga membuka jalan bagi komunitas pengembang untuk berkolaborasi, sehingga mempercepat kemajuan teknologi AI berbasis bahasa China dalam konteks global.
--------------------
Analisis Ahli:
Andrej Karpathy: Peningkatan parameter dan kemampuan reasoning dalam model DeepSeek adalah langkah besar yang menunjukkan bagaimana fokus pada niche pasar bahasa lokal bisa sejalan dengan performa global.
Fei-Fei Li: Mengadaptasi model AI untuk bahasa dan konteks lokal seperti bahasa Mandarin penting untuk memastikan teknologi AI dapat menjangkau lebih banyak pengguna dengan hasil yang relevan dan berkualitas tinggi.
--------------------
What's Next: Dengan peningkatan kemampuan dan lisensi terbuka, model DeepSeek-V3-0324 dapat menjadi lebih populer dan banyak diadopsi di berbagai aplikasi AI dan pengembang independen, mempercepat inovasi dalam teknologi AI berbahasa China.
Referensi:
[1] https://www.scmp.com/tech/big-tech/article/3303798/deepseeks-upgraded-foundational-model-excels-coding-and-maths?module=top_story&pgtype=section
[1] https://www.scmp.com/tech/big-tech/article/3303798/deepseeks-upgraded-foundational-model-excels-coding-and-maths?module=top_story&pgtype=section
Pertanyaan Terkait
Q
Apa yang diupgrade dalam model DeepSeek V3?A
Model DeepSeek V3 diupgrade dengan menambahkan parameter dan meningkatkan kemampuan dalam pemrograman dan pemecahan masalah matematika.Q
Berapa banyak parameter yang dimiliki DeepSeek V3?A
DeepSeek V3 memiliki 671 miliar parameter, sedangkan model baru memiliki 685 miliar parameter.Q
Apa yang ditunjukkan oleh skor AIME DeepSeek V3?A
Skor AIME DeepSeek V3 menunjukkan peningkatan dari 39.6 menjadi 59.4.Q
Di mana DeepSeek-V3-0324 diluncurkan?A
DeepSeek-V3-0324 diluncurkan di komunitas AI Hugging Face dan situs web perusahaan.Q
Apa lisensi yang digunakan oleh model baru ini?A
Model baru ini menggunakan lisensi perangkat lunak MIT.