Courtesy of SCMP
Ikhtisar 15 Detik
- DeepSeek meluncurkan model Prover-V2 yang fokus pada matematika.
- Persaingan dalam pengembangan AI generatif semakin ketat dengan peluncuran model oleh Alibaba dan DeepSeek.
- Model Prover-V2 diunggah ke Hugging Face tanpa pengumuman resmi dari DeepSeek.
Hangzhou, China - Start-up China bernama DeepSeek baru saja merilis model AI spesialis baru bernama Prover-V2, sehari setelah Alibaba meluncurkan generasi ketiga dari keluarga Qwen. Peluncuran ini dilakukan tanpa pengumuman resmi di media sosial, dan model tersebut diunggah ke Hugging Face, komunitas AI open-source terbesar di dunia.
Prover-V2 adalah model yang dirancang khusus untuk menyelesaikan masalah matematika dan dibangun di atas model V3 DeepSeek yang memiliki 671 miliar parameter. Model ini menggunakan arsitektur mixture-of-experts untuk efisiensi biaya pelatihan dan operasi, yang menunjukkan bahwa DeepSeek serius dalam mengembangkan kemampuan AI generatif.
Selain itu, ada spekulasi bahwa DeepSeek akan segera meluncurkan model reasoning R2 yang baru. Meskipun belum ada detail lebih lanjut yang diberikan, langkah ini menunjukkan bahwa persaingan dalam pengembangan AI generatif semakin ketat, dengan berbagai perusahaan berlomba-lomba untuk merilis model-model terbaru mereka.
Pertanyaan Terkait
Q
Apa yang dirilis oleh DeepSeek?A
DeepSeek merilis model Prover-V2.Q
Kapan DeepSeek merilis model Prover-V2?A
DeepSeek merilis model Prover-V2 pada hari Rabu, sehari setelah Alibaba meluncurkan Qwen3.Q
Apa tujuan dari model Prover-V2?A
Tujuan dari model Prover-V2 adalah untuk menyelesaikan masalah terkait matematika.Q
Di mana DeepSeek mengunggah model mereka?A
DeepSeek mengunggah model mereka ke Hugging Face.Q
Apa yang diharapkan dari model R2 yang akan datang?A
Diharapkan model R2 akan diluncurkan segera dan akan berfokus pada kemampuan penalaran.