Courtesy of TechCrunch
Ikhtisar 15 Detik
- DeepSeek telah memperbarui model AI Prover untuk membuktikan teorema matematis.
- Model Prover V2 dibangun di atas arsitektur MoE dengan 671 miliar parameter.
- DeepSeek sedang mempertimbangkan untuk mendapatkan pendanaan luar untuk pengembangan lebih lanjut.
China - DeepSeek, sebuah laboratorium AI di China, telah memperbarui model AI mereka yang dikenal sebagai Prover ke versi V2. Pembaruan ini diunggah ke platform pengembangan AI Hugging Face pada hari Rabu. Prover V2 dibangun di atas model V3 yang memiliki 671 miliar parameter dan menggunakan arsitektur mixture-of-experts (MoE).
Arsitektur MoE memungkinkan model untuk memecah tugas menjadi subtugas dan mendelegasikannya ke komponen 'ahli' yang lebih kecil dan khusus. DeepSeek terakhir memperbarui Prover pada bulan Agustus dan menggambarkannya sebagai model AI yang tersedia secara terbuka untuk pembuktian teorema formal dan penalaran matematika.
Pada bulan Februari, Reuters melaporkan bahwa DeepSeek sedang mempertimbangkan untuk mencari pendanaan eksternal untuk pertama kalinya. Perusahaan ini baru-baru ini merilis versi yang ditingkatkan dari model V3, sebuah model tujuan umum, dan diharapkan segera memperbarui model R1 'reasoning'.
Pertanyaan Terkait
Q
Apa yang dilakukan oleh DeepSeek?A
DeepSeek adalah laboratorium AI yang mengembangkan model untuk membuktikan teorema dan bukti matematis.Q
Apa itu Prover dan untuk apa digunakan?A
Prover adalah model AI yang dirancang untuk menyelesaikan bukti dan teorema matematis.Q
Apa yang baru dalam versi V2 dari Prover?A
Versi V2 dari Prover baru saja dirilis dan dibangun di atas model V3 yang memiliki 671 miliar parameter.Q
Apa itu arsitektur MoE yang digunakan dalam model V3?A
Arsitektur MoE membagi tugas menjadi subtugas dan mendelegasikannya ke komponen 'ahli' yang lebih kecil dan khusus.Q
Apa yang direncanakan DeepSeek untuk masa depan?A
DeepSeek berencana untuk memperbarui model R1 mereka yang berfokus pada penalaran.