Pomodo Logo IconPomodo Logo Icon
Tanya PomodoSemua Artikel
Semua
Terobosan ByteDance Optimalkan Pelatihan AI Bisa Kurangi Permintaan GPU Nvidia
Courtesy of SCMP
Teknologi
Kecerdasan Buatan

Terobosan ByteDance Optimalkan Pelatihan AI Bisa Kurangi Permintaan GPU Nvidia

11 Mar 2025, 20.00 WIB
83 dibaca
Share
Ikhtisar 15 Detik
  • ByteDance telah meningkatkan efisiensi pelatihan model bahasa besar secara signifikan.
  • Kemajuan dalam teknik Mixture-of-Experts dapat mengurangi ketergantungan pada GPU Nvidia.
  • Keberhasilan perusahaan seperti DeepSeek dapat mempengaruhi pasar dan nilai perusahaan teknologi besar.
Perusahaan teknologi asal China, ByteDance, yang memiliki TikTok, baru-baru ini mengumumkan bahwa mereka telah meningkatkan efisiensi pelatihan model bahasa besar (LLM) hingga 1,71 kali lipat. Mereka menggunakan sistem yang disebut COMET, yang merupakan teknik Mixture-of-Experts (MoE) yang dioptimalkan. Teknik ini membagi masalah menjadi bagian-bagian yang lebih kecil dan lebih mudah dipecahkan, sehingga memungkinkan pelatihan model AI yang lebih besar tanpa meningkatkan biaya komputasi. Dengan sistem baru ini, ByteDance berhasil menghemat jutaan jam penggunaan GPU, yang merupakan chip penting untuk pelatihan AI.
Baca juga: Huawei Kembangkan Teknik AI Baru untuk Kurangi Ketergantungan Teknologi AS
Peningkatan efisiensi ini dapat mengurangi permintaan untuk chip dari Nvidia, yang dikenal dengan GPU berkinerja tinggi. Setelah perusahaan lain, DeepSeek, juga mencapai kemajuan dalam mengurangi biaya pelatihan AI, nilai pasar Nvidia turun hampir Rp 9.87 quadriliun ($600 miliar) dalam satu hari. Meskipun teknik MoE banyak digunakan, ada beberapa masalah yang dihadapi, seperti efisiensi komputasi yang menurun. Tim ByteDance berusaha mengatasi masalah ini dengan meningkatkan komunikasi dan adaptabilitas sistem mereka.
--------------------
Analisis Kami: Terobosan ByteDance ini menunjukkan bahwa inovasi dalam algoritma dan sistem dapat mengimbangi atau bahkan menggeser dominasi hardware mahal seperti GPU Nvidia. Jika tren ini berlanjut, kita akan melihat perpindahan kekuatan dalam ekosistem AI yang selama ini sangat bergantung pada perangkat keras tertentu.
--------------------
Analisis Ahli:
Andrew Ng: Inovasi seperti optimasi MoE sangat penting untuk mengurangi hambatan biaya dan energi dalam pengembangan AI, yang pada akhirnya membuka akses lebih luas untuk teknologi ini.
Fei-Fei Li: Memperbaiki efisiensi pelatihan LLM bukan hanya soal hardware, tetapi juga algoritma dan arsitektur, sehingga temuan ByteDance adalah langkah maju yang menjanjikan.
--------------------
Baca juga: DeepSeek Ungkap Rahasia Keberhasilan AI Murah Lewat Co-Design Perangkat Keras dan Lunak
What's Next: Dalam waktu dekat, permintaan global untuk GPU Nvidia kemungkinan akan melambat seiring meningkatnya adopsi teknik optimasi pelatihan LLM, yang akan merubah peta persaingan di pasar hardware AI.
Referensi:
[1] https://www.scmp.com/tech/big-tech/article/3301979/bytedance-says-new-ai-technology-boosts-model-training-efficiency-17-times?module=top_story&pgtype=section

Pertanyaan Terkait

Q
Apa yang dicapai oleh ByteDance dalam pelatihan model bahasa besar?
A
ByteDance mencapai peningkatan efisiensi sebesar 1,71 kali dalam pelatihan model bahasa besar.
Q
Apa itu sistem Mixture-of-Experts yang digunakan oleh ByteDance?
A
Sistem Mixture-of-Experts adalah teknik pembelajaran mesin yang menggunakan beberapa jaringan ahli untuk membagi ruang masalah menjadi bagian yang homogen.
Q
Mengapa kemajuan dalam efisiensi pelatihan model AI dapat mempengaruhi permintaan GPU Nvidia?
A
Kemajuan dalam efisiensi pelatihan model AI dapat mengurangi kebutuhan akan GPU Nvidia yang mahal.
Q
Apa dampak dari keberhasilan DeepSeek terhadap nilai pasar Nvidia?
A
Keberhasilan DeepSeek menyebabkan penurunan nilai pasar Nvidia hampir $600 miliar dalam satu hari.
Q
Apa masalah yang dihadapi oleh teknik Mixture-of-Experts menurut ilmuwan ByteDance?
A
Teknik Mixture-of-Experts menghadapi masalah 'overlapping komunikasi-komputasi' yang mengurangi efisiensi komputasi.

Artikel Serupa

Tsinghua Kembangkan Framework AI Baru Mengurangi Ketergantungan Chip Nvidia
Tsinghua Kembangkan Framework AI Baru Mengurangi Ketergantungan Chip Nvidia
Dari SCMP
Permintaan Chip Nvidia H20 Meningkat Drastis Karena Model AI Murah DeepSeek di Tiongkok
Permintaan Chip Nvidia H20 Meningkat Drastis Karena Model AI Murah DeepSeek di Tiongkok
Dari YahooFinance
DeepSeek Buka Jalan bagi Chip AI China Bersaing Lawan Nvidia Dengan Fokus Inferensi
DeepSeek Buka Jalan bagi Chip AI China Bersaing Lawan Nvidia Dengan Fokus Inferensi
Dari YahooFinance
Terobosan DeepSeek Dorong China Kurangi Ketergantungan Chip Nvidia
Terobosan DeepSeek Dorong China Kurangi Ketergantungan Chip Nvidia
Dari SCMP
Klaim Biaya Rendah DeepSeek di AI Picu Keraguan dan Guncangan Pasar Nvidia
Klaim Biaya Rendah DeepSeek di AI Picu Keraguan dan Guncangan Pasar Nvidia
Dari SCMP
Model AI Baru yang Lebih Efisien Bisa Menggeser Raksasa Teknologi Dunia
Model AI Baru yang Lebih Efisien Bisa Menggeser Raksasa Teknologi Dunia
Dari Forbes
Tsinghua Kembangkan Framework AI Baru Mengurangi Ketergantungan Chip NvidiaSCMP
Teknologi
5 bulan lalu
105 dibaca

Tsinghua Kembangkan Framework AI Baru Mengurangi Ketergantungan Chip Nvidia

Permintaan Chip Nvidia H20 Meningkat Drastis Karena Model AI Murah DeepSeek di TiongkokYahooFinance
Teknologi
5 bulan lalu
343 dibaca

Permintaan Chip Nvidia H20 Meningkat Drastis Karena Model AI Murah DeepSeek di Tiongkok

DeepSeek Buka Jalan bagi Chip AI China Bersaing Lawan Nvidia Dengan Fokus InferensiYahooFinance
Teknologi
6 bulan lalu
123 dibaca

DeepSeek Buka Jalan bagi Chip AI China Bersaing Lawan Nvidia Dengan Fokus Inferensi

Terobosan DeepSeek Dorong China Kurangi Ketergantungan Chip NvidiaSCMP
Teknologi
6 bulan lalu
157 dibaca

Terobosan DeepSeek Dorong China Kurangi Ketergantungan Chip Nvidia

Klaim Biaya Rendah DeepSeek di AI Picu Keraguan dan Guncangan Pasar NvidiaSCMP
Bisnis
6 bulan lalu
263 dibaca

Klaim Biaya Rendah DeepSeek di AI Picu Keraguan dan Guncangan Pasar Nvidia

Model AI Baru yang Lebih Efisien Bisa Menggeser Raksasa Teknologi DuniaForbes
Teknologi
6 bulan lalu
143 dibaca

Model AI Baru yang Lebih Efisien Bisa Menggeser Raksasa Teknologi Dunia