Tulu3-405B: Model AI Open Source AS Melampaui DeepSeek dan GPT-4o
Courtesy of TechCrunch

Tulu3-405B: Model AI Open Source AS Melampaui DeepSeek dan GPT-4o

30 Jan 2025, 21.00 WIB
38 dibaca
Share
Ai2, sebuah lembaga penelitian AI nirlaba yang berbasis di Seattle, baru saja meluncurkan model AI baru bernama Tulu3-405B. Model ini diklaim lebih unggul dibandingkan dengan DeepSeek V3 dari perusahaan China dan juga OpenAI’s GPT-4o dalam beberapa pengujian. Yang menarik, Tulu3-405B bersifat open source, artinya semua orang bisa mengakses dan mengembangkan model ini secara gratis. Ai2 percaya bahwa peluncuran ini menunjukkan potensi Amerika Serikat untuk memimpin dalam pengembangan model AI generatif yang terbaik di dunia.
Tulu3-405B adalah model yang sangat besar, dengan 405 miliar parameter, dan memerlukan 256 GPU untuk dilatih. Salah satu teknik yang digunakan untuk mencapai kinerja yang baik adalah pembelajaran penguatan dengan hadiah yang dapat diverifikasi. Dalam pengujian, Tulu3-405B berhasil mengalahkan model-model lain dalam menjawab pertanyaan dan menyelesaikan masalah matematika tingkat sekolah dasar. Model ini dapat diuji melalui aplikasi chatbot Ai2 dan kode untuk melatih model ini tersedia di GitHub dan platform AI Hugging Face.
Referensi:
[1] https://techcrunch.com/2025/01/30/ai2-says-its-new-ai-model-beats-one-of-deepseeks-best/

Analisis Ahli

Yoshua Bengio
"Penting bagi pengembangan AI agar ada model open source besar yang dapat diakses secara bebas, karena ini mendorong kolaborasi dan keamanan teknologi dalam jangka panjang."
Fei-Fei Li
"Lompatan teknologi seperti Tulu3-405B bisa mempercepat riset AI yang lebih inklusif dan beretika, terutama jika tersedia secara terbuka dan transparan."

Analisis Kami

"Keberhasilan Tulu3-405B menunjukkan bahwa pendekatan open source dengan teknologi canggih bisa menjadi strategi efektif untuk mendorong inovasi AI tanpa harus bergantung pada korporasi besar. Namun, tantangan terbesar adalah memastikan komunitas global mampu memanfaatkan dan mengembangkan model ini lebih lanjut agar tidak stagnan di satu titik."

Prediksi Kami

Dengan keberhasilan Tulu3-405B, kemungkinan akan ada lebih banyak pengembangan model AI open source dari institusi dan komunitas di AS, yang dapat mengurangi dominasi model AI dari perusahaan besar dan mempercepat inovasi AI secara global.

Pertanyaan Terkait

Q
Apa yang diluncurkan oleh Ai2 baru-baru ini?
A
Ai2 baru-baru ini meluncurkan model AI yang disebut Tulu3-405B.
Q
Apa keunggulan Tulu3-405B dibandingkan model AI lainnya?
A
Tulu3-405B diklaim mengungguli DeepSeek V3 dan OpenAI GPT-4o dalam beberapa benchmark AI.
Q
Mengapa Tulu3-405B dianggap sebagai model AI terbuka?
A
Tulu3-405B dianggap sebagai model AI terbuka karena semua komponen yang diperlukan untuk mereplikasinya tersedia secara bebas dan dilisensikan dengan permisif.
Q
Apa teknik yang digunakan untuk melatih Tulu3-405B?
A
Teknik yang digunakan untuk melatih Tulu3-405B adalah reinforcement learning dengan verifiable rewards.
Q
Siapa saja pesaing utama Tulu3-405B di pasar AI?
A
Pesaing utama Tulu3-405B di pasar AI termasuk DeepSeek V3, OpenAI GPT-4o, dan Meta Llama 3.1.