Courtesy of SCMP
Ikhtisar 15 Detik
- DeepSeek merilis dua proyek open-source yang inovatif untuk meningkatkan efisiensi AI.
- Proyek ini membantu membantah tuduhan bahwa DeepSeek tidak transparan dalam prosedur pelatihannya.
- Model AI yang dirilis oleh DeepSeek bersaing dengan produk dari perusahaan-perusahaan besar di AS.
Perusahaan riset asal Hangzhou, DeepSeek, baru-baru ini merilis dua proyek infrastruktur AI sumber terbuka yang dijanjikan. Proyek tersebut, yang disebut FlashMLA dan DeepEP, bertujuan untuk meningkatkan kinerja chip dalam pelatihan dan inferensi model dengan biaya yang efisien. Dengan merilis teknik dan hasil kerja mereka, DeepSeek membantah tuduhan bahwa mereka telah salah menginformasikan biaya pelatihan model mereka.
DeepSeek juga telah meluncurkan dua model AI sumber terbuka yang inovatif, yaitu model bahasa besar V3 dan model penalaran R1. Model-model ini bersaing dengan produk-produk terbaik dari perusahaan AI besar di AS, seperti OpenAI dan Anthropic. Komunitas pengembang sumber terbuka menyambut baik langkah DeepSeek, menganggapnya sebagai kemajuan penting dalam infrastruktur AI.