Courtesy of SCMP

DeepSeek Perkenalkan Teknologi AI Baru untuk Proses Data Lebih Cepat dan Hemat

19 Feb 2025, 19.22 WIB

121 dibaca

Ikhtisar 15 Detik

DeepSeek fokus pada pengembangan teknologi AI yang efisien dan hemat biaya.
Native Sparse Attention (NSA) dapat meningkatkan kinerja model AI tanpa mengorbankan biaya pelatihan.
Partisipasi Liang Wenfeng dalam simposium menunjukkan pentingnya kolaborasi antara teknologi dan kebijakan pemerintah.

DeepSeek, sebuah perusahaan rintisan yang didirikan oleh Liang Wenfeng, baru saja menerbitkan studi teknis tentang "native sparse attention" (NSA), yang bertujuan untuk membuat model kecerdasan buatan (AI) lebih efisien dalam memproses data besar. Studi ini ditulis oleh Liang dan 15 penulis lainnya, dan dipublikasikan di arXiv sehari sebelum Liang berpartisipasi dalam simposium yang diadakan oleh Presiden Xi Jinping di Beijing. DeepSeek kini lebih fokus pada penelitian dan tidak terburu-buru untuk mengumpulkan dana atau melakukan kegiatan komersial baru.

Dalam studi tersebut, Liang dan tim ilmuwan muda di DeepSeek menunjukkan kemajuan mereka dalam mengembangkan model AI open-source yang canggih, seperti V3 dan R1, dengan biaya dan daya komputasi yang jauh lebih rendah dibandingkan perusahaan teknologi besar. NSA dirancang untuk mempercepat proses inferensi, yaitu saat model AI mulai mengenali pola dalam data yang belum pernah dilihat sebelumnya, tanpa mengorbankan kinerja.

Referensi:
[1] https://www.scmp.com/tech/big-tech/article/3299312/deepseek-founder-provides-clue-start-ups-ai-priorities-new-technical-study?module=top_story&pgtype=section

Analisis Ahli

Yoshua Bengio

"Inovasi seperti Native Sparse Attention sangat krusial untuk kemajuan AI karena memungkinkan pengurangan sumber daya komputasi tanpa kehilangan akurasi, yang akan membuat teknologi AI lebih inklusif dan terjangkau."

Andrew Ng

"Fokus pada efisiensi dan optimasi hardware-aligned seperti yang dilakukan DeepSeek adalah langkah penting untuk mempercepat adopsi luas AI di berbagai industri, terutama di negara berkembang."

Analisis Kami

"Teknologi Native Sparse Attention yang diusung DeepSeek menunjukkan bahwa mereka berhasil menembus hambatan besar dalam efisiensi komputasi AI yang selama ini menjadi kendala utama. Jika DeepSeek mampu mempertahankan fokus riset dan inovasi mereka, mereka dapat menggeser dominasi perusahaan besar dan menjadi pelopor utama dalam pengembangan model AI hemat biaya di dunia."

Prediksi Kami

Dengan inovasi NSA dan fokus riset yang kuat, DeepSeek kemungkinan akan menjadi pemain utama dalam teknologi model bahasa besar dengan biaya rendah, memicu kompetisi yang lebih ketat dalam industri AI global.