Microsoft Luncurkan BitNet: Model AI 1-Bit Terbesar dan Tercepat
Courtesy of TechCrunch

Rangkuman Berita: Microsoft Luncurkan BitNet: Model AI 1-Bit Terbesar dan Tercepat

Menunjukkan keunggulan model AI 1-bit yang dikembangkan oleh Microsoft dalam hal efisiensi memori dan kecepatan komputasi dibandingkan dengan model tradisional.

TechCrunch
DariĀ TechCrunch
16 April 2025 pukul 22.48 WIB
112 dibaca
Share
Ikhtisar 15 Detik
  • BitNet b1.58 2B4T adalah model AI 1-bit terbesar yang efisien dan cepat.
  • Kuantisasi bobot menjadi tiga nilai (-1, 0, 1) meningkatkan efisiensi memori dan kecepatan.
  • Bitnet.cpp memiliki keterbatasan kompatibilitas yang perlu diatasi untuk penggunaan yang lebih luas.
Amerika Serikat - Para peneliti Microsoft telah mengembangkan model AI 1-bit terbesar yang disebut BitNet b1.58 2B4T. Model ini dirancang untuk berjalan pada perangkat keras ringan dengan mengkuantisasi bobot menjadi hanya tiga nilai: -1, 0, dan 1, sehingga lebih efisien dalam penggunaan memori dan komputasi.
BitNet b1.58 2B4T memiliki 2 miliar parameter dan dilatih pada dataset 4 triliun token, setara dengan sekitar 33 juta buku. Model ini mengungguli model tradisional dengan ukuran serupa dalam beberapa benchmark seperti GSM8K dan PIQA, serta lebih cepat dalam beberapa kasus.
Namun, untuk mencapai kinerja tersebut, model ini memerlukan kerangka kerja khusus Microsoft, bitnet.cpp, yang saat ini hanya bekerja dengan perangkat keras tertentu dan tidak mendukung GPU. Meskipun demikian, bitnets menunjukkan potensi besar, terutama untuk perangkat dengan sumber daya terbatas.

Pertanyaan Terkait

Q
Apa itu BitNet b1.58 2B4T?
A
BitNet b1.58 2B4T adalah model AI 1-bit terbesar yang dikembangkan oleh Microsoft, yang dapat berjalan di CPU.
Q
Bagaimana cara kerja kuantisasi dalam model AI?
A
Kuantisasi dalam model AI mengurangi jumlah bit yang diperlukan untuk merepresentasikan bobot, sehingga model dapat berjalan lebih efisien di perangkat dengan memori terbatas.
Q
Apa keunggulan BitNet dibandingkan model AI lainnya?
A
BitNet mengungguli model AI lain dalam hal kecepatan dan efisiensi memori, meskipun tidak selalu mengalahkan semua model sebanding.
Q
Mengapa bitnet.cpp menjadi kendala dalam penggunaan BitNet?
A
Bitnet.cpp hanya mendukung perangkat keras tertentu dan tidak kompatibel dengan GPU, yang merupakan infrastruktur dominan untuk AI.
Q
Apa saja entitas yang dibandingkan dengan BitNet dalam pengujian?
A
Entitas yang dibandingkan dengan BitNet dalam pengujian termasuk Llama 3.2, Gemma 3, dan Qwen 2.5.

Rangkuman Berita Serupa

Mengapa Peneliti Peduli dengan Model Bahasa Kecil?QuantaMagazine
Teknologi
1 bulan lalu
102 dibaca

Mengapa Peneliti Peduli dengan Model Bahasa Kecil?

AI untuk harga sandwich: Qwen dari Alibaba memungkinkan terobosan di ASSCMP
Teknologi
2 bulan lalu
134 dibaca

AI untuk harga sandwich: Qwen dari Alibaba memungkinkan terobosan di AS

DeepSeek Berarti Akhir dari Big Data, Bukan Akhir dari NvidiaForbes
Teknologi
3 bulan lalu
66 dibaca

DeepSeek Berarti Akhir dari Big Data, Bukan Akhir dari Nvidia

Hugging Face mengklaim bahwa model AI baru mereka adalah yang terkecil di jenisnya.TechCrunch
Teknologi
3 bulan lalu
70 dibaca

Hugging Face mengklaim bahwa model AI baru mereka adalah yang terkecil di jenisnya.

Minggu Ini dalam AI: OpenAI mendapatkan keuntungan infrastruktur yang tak ternilai.TechCrunch
Teknologi
3 bulan lalu
95 dibaca

Minggu Ini dalam AI: OpenAI mendapatkan keuntungan infrastruktur yang tak ternilai.

57 Episode Dalam Sejarah AI yang Menakjubkan Selama 70 TahunForbes
Teknologi
3 bulan lalu
177 dibaca

57 Episode Dalam Sejarah AI yang Menakjubkan Selama 70 Tahun