Courtesy of SCMP

Terobosan ByteDance Optimalkan Pelatihan AI Bisa Kurangi Permintaan GPU Nvidia

11 Mar 2025, 20.00 WIB

178 dibaca

Ikhtisar 15 Detik

ByteDance telah meningkatkan efisiensi pelatihan model bahasa besar secara signifikan.
Kemajuan dalam teknik Mixture-of-Experts dapat mengurangi ketergantungan pada GPU Nvidia.
Keberhasilan perusahaan seperti DeepSeek dapat mempengaruhi pasar dan nilai perusahaan teknologi besar.

Perusahaan teknologi asal China, ByteDance, yang memiliki TikTok, baru-baru ini mengumumkan bahwa mereka telah meningkatkan efisiensi pelatihan model bahasa besar (LLM) hingga 1,71 kali lipat. Mereka menggunakan sistem yang disebut COMET, yang merupakan teknik Mixture-of-Experts (MoE) yang dioptimalkan. Teknik ini membagi masalah menjadi bagian-bagian yang lebih kecil dan lebih mudah dipecahkan, sehingga memungkinkan pelatihan model AI yang lebih besar tanpa meningkatkan biaya komputasi. Dengan sistem baru ini, ByteDance berhasil menghemat jutaan jam penggunaan GPU, yang merupakan chip penting untuk pelatihan AI.

Peningkatan efisiensi ini dapat mengurangi permintaan untuk chip dari Nvidia, yang dikenal dengan GPU berkinerja tinggi. Setelah perusahaan lain, DeepSeek, juga mencapai kemajuan dalam mengurangi biaya pelatihan AI, nilai pasar Nvidia turun hampir Rp 9.87 quadriliun ($600 miliar) dalam satu hari. Meskipun teknik MoE banyak digunakan, ada beberapa masalah yang dihadapi, seperti efisiensi komputasi yang menurun. Tim ByteDance berusaha mengatasi masalah ini dengan meningkatkan komunikasi dan adaptabilitas sistem mereka.

Referensi:
[1] https://www.scmp.com/tech/big-tech/article/3301979/bytedance-says-new-ai-technology-boosts-model-training-efficiency-17-times?module=top_story&pgtype=section

Analisis Ahli

Andrew Ng

"Inovasi seperti optimasi MoE sangat penting untuk mengurangi hambatan biaya dan energi dalam pengembangan AI, yang pada akhirnya membuka akses lebih luas untuk teknologi ini."

Fei-Fei Li

"Memperbaiki efisiensi pelatihan LLM bukan hanya soal hardware, tetapi juga algoritma dan arsitektur, sehingga temuan ByteDance adalah langkah maju yang menjanjikan."

Analisis Kami

"Terobosan ByteDance ini menunjukkan bahwa inovasi dalam algoritma dan sistem dapat mengimbangi atau bahkan menggeser dominasi hardware mahal seperti GPU Nvidia. Jika tren ini berlanjut, kita akan melihat perpindahan kekuatan dalam ekosistem AI yang selama ini sangat bergantung pada perangkat keras tertentu."

Prediksi Kami

Dalam waktu dekat, permintaan global untuk GPU Nvidia kemungkinan akan melambat seiring meningkatnya adopsi teknik optimasi pelatihan LLM, yang akan merubah peta persaingan di pasar hardware AI.

Pertanyaan Terkait

Apa yang dicapai oleh ByteDance dalam pelatihan model bahasa besar?

ByteDance mencapai peningkatan efisiensi sebesar 1,71 kali dalam pelatihan model bahasa besar.

Apa itu sistem Mixture-of-Experts yang digunakan oleh ByteDance?

Sistem Mixture-of-Experts adalah teknik pembelajaran mesin yang menggunakan beberapa jaringan ahli untuk membagi ruang masalah menjadi bagian yang homogen.

Mengapa kemajuan dalam efisiensi pelatihan model AI dapat mempengaruhi permintaan GPU Nvidia?

Kemajuan dalam efisiensi pelatihan model AI dapat mengurangi kebutuhan akan GPU Nvidia yang mahal.

Apa dampak dari keberhasilan DeepSeek terhadap nilai pasar Nvidia?

Keberhasilan DeepSeek menyebabkan penurunan nilai pasar Nvidia hampir $600 miliar dalam satu hari.

Apa masalah yang dihadapi oleh teknik Mixture-of-Experts menurut ilmuwan ByteDance?

Teknik Mixture-of-Experts menghadapi masalah 'overlapping komunikasi-komputasi' yang mengurangi efisiensi komputasi.

Artikel Serupa

Tsinghua Kembangkan Framework AI Baru Mengurangi Ketergantungan Chip Nvidia

Dari SCMP

DeepSeek Buka Jalan bagi Chip AI China Bersaing Lawan Nvidia Dengan Fokus Inferensi

Dari YahooFinance

Terobosan DeepSeek Dorong China Kurangi Ketergantungan Chip Nvidia

Dari SCMP

Keberhasilan DeepSeek Mengubah Persepsi Industri tentang Peran Nvidia di AI

Dari SCMP

DeepSeek dan Paradigma Baru AI: Inovasi Murah yang Guncang Dunia Teknologi

Dari Wired

DeepSeek: Startup AI China yang Kalahkan Model Terbaik Dunia dengan Inovasi Software

Dari Wired

Teknologi

9 bulan lalu

100 dibaca

Tsinghua Kembangkan Framework AI Baru Mengurangi Ketergantungan Chip Nvidia

Teknologi

10 bulan lalu

278 dibaca

DeepSeek Buka Jalan bagi Chip AI China Bersaing Lawan Nvidia Dengan Fokus Inferensi

Teknologi

10 bulan lalu

282 dibaca