Courtesy of InterestingEngineering
Mengungkap Fakta Biaya dan Teknologi DeepSeek di Tengah Persaingan AI
31 Jan 2025, 23.50 WIB
253 dibaca
Share
Laporan terbaru dari SemiAnalysis menyoroti DeepSeek, sebuah perusahaan yang sedang naik daun di bidang kecerdasan buatan (AI). Banyak orang mengira bahwa biaya pelatihan DeepSeek V3 mencapai sekitar Rp 98.67 miliar ($6 juta) , tetapi laporan tersebut menjelaskan bahwa angka ini tidak memperhitungkan banyak faktor penting lainnya, seperti investasi dalam penelitian, pengembangan, dan infrastruktur. Total pengeluaran modal DeepSeek mencapai Rp 21.38 triliun ($1,3 miliar) , yang sebagian besar digunakan untuk mengoperasikan dan memelihara kluster GPU yang besar. DeepSeek memiliki sekitar 50.000 GPU, tetapi tidak semuanya adalah model yang sama, melainkan campuran dari berbagai jenis GPU.
Dari segi kinerja, model R1 DeepSeek menunjukkan kemampuan yang sebanding dengan model dari OpenAI, tetapi tidak bisa disebut sebagai yang terbaik di semua metrik. DeepSeek juga memperkenalkan teknologi baru yang disebut Multi-Head Latent Attention (MLA), yang dapat mengurangi biaya inferensi hingga 93,3%. Meskipun ada potensi untuk efisiensi yang lebih baik, DeepSeek harus menghadapi tantangan dari kontrol ekspor yang ketat di AS. Secara keseluruhan, laporan ini menunjukkan bahwa DeepSeek adalah pemain yang kuat di dunia AI, dan banyak yang menantikan bagaimana perusahaan ini akan berkembang di masa depan.
--------------------
Analisis Kami: DeepSeek menunjukkan kemajuan luar biasa dalam menurunkan biaya pelatihan dan inferensi dengan inovasi teknologi terkini, yang membuatnya layak diperhitungkan di pasar AI global. Namun, mereka harus terus berinovasi sambil menghadapi hambatan geopolitik yang bisa menghambat ekspansi dan efisiensi perusahaan.
--------------------
Analisis Ahli:
Andrew Ng: Pengurangan biaya inferensi melalui pendekatan seperti MLA adalah lompatan besar bagi efisiensi AI dan dapat menjadi standar industri di masa mendatang.
Fei-Fei Li: Keberhasilan DeepSeek menunjukkan bahwa struktur organisasi yang ramping dan fleksibel memberikan keunggulan strategis di industri teknologi yang sangat kompetitif.
--------------------
What's Next: Biaya operasional AI DeepSeek berpotensi turun drastis hingga lima kali lipat dalam waktu dekat, namun mereka harus menghadapi tantangan ketat dari kontrol ekspor AS yang membatasi akses teknologi.
Referensi:
[1] https://interestingengineering.com/culture/deepseeks-ai-training-cost-billion
[1] https://interestingengineering.com/culture/deepseeks-ai-training-cost-billion
Pertanyaan Terkait
Q
Apa yang diungkapkan oleh laporan SemiAnalysis tentang biaya pelatihan DeepSeek?A
Laporan SemiAnalysis menyatakan bahwa estimasi biaya pelatihan DeepSeek sebesar $6 juta tidak mempertimbangkan investasi penting lainnya seperti R&D dan infrastruktur.Q
Bagaimana struktur organisasi DeepSeek berbeda dari laboratorium AI besar lainnya?A
DeepSeek memiliki model organisasi yang lebih ramping dan mengoperasikan pusat datanya sendiri, yang meningkatkan efisiensi dan kelincahan.Q
Apa teknologi inovatif yang diperkenalkan oleh DeepSeek dan bagaimana dampaknya?A
Teknologi Multi-Head Latent Attention (MLA) yang diperkenalkan oleh DeepSeek dapat mengurangi biaya inferensi hingga 93,3%, menjadikannya solusi AI yang lebih hemat biaya.Q
Mengapa biaya operasional DeepSeek menjadi perhatian dalam laporan tersebut?A
Biaya operasional DeepSeek diperkirakan dapat turun lima kali lipat, tetapi tantangan terkait kontrol ekspor AS menjadi perhatian utama.Q
Apa tantangan yang dihadapi DeepSeek terkait kontrol ekspor AS?A
DeepSeek harus menavigasi tantangan yang muncul akibat kontrol ekspor AS yang semakin ketat, yang dapat mempengaruhi kemampuan mereka untuk memperluas operasi.