Para peneliti menciptakan pesaing terbuka untuk model 'penalaran' o1 milik OpenAI dengan biaya kurang dari Rp 822.25 ribu ($50) .
Courtesy of TechCrunch

Rangkuman Berita: Para peneliti menciptakan pesaing terbuka untuk model 'penalaran' o1 milik OpenAI dengan biaya kurang dari Rp 822.25 ribu ($50) .

TechCrunch
DariĀ TechCrunch
06 Februari 2025 pukul 06.38 WIB
97 dibaca
Share
Peneliti AI dari Stanford dan Universitas Washington berhasil melatih model AI bernama s1 dengan biaya kurang dari Rp 822.25 miliar ($50 m) enggunakan kredit komputasi awan. Model ini menunjukkan kemampuan yang mirip dengan model-model canggih lainnya dalam mengerjakan soal matematika dan pemrograman. Proses pelatihan s1 melibatkan teknik yang disebut distilasi, di mana kemampuan "penalaran" diambil dari model AI lain, dalam hal ini dari model Google, Gemini 2.0. S1 dapat diakses di GitHub, lengkap dengan data dan kode yang digunakan untuk melatihnya.
Keberhasilan s1 menimbulkan pertanyaan tentang bagaimana model AI dapat dibuat dengan biaya rendah, yang mungkin mengancam perusahaan besar yang menghabiskan banyak uang untuk mengembangkan model mereka. Meskipun distilasi adalah metode yang efektif untuk mereplikasi kemampuan model AI, peneliti mencatat bahwa metode ini tidak menghasilkan model baru yang jauh lebih baik dari yang sudah ada. Di masa depan, perusahaan besar seperti Meta, Google, dan Microsoft berencana untuk menginvestasikan ratusan miliar dolar dalam infrastruktur AI untuk melatih model-model generasi berikutnya.

Pertanyaan Terkait

Q
Apa yang dilakukan oleh peneliti di Stanford dan University of Washington?
A
Peneliti di Stanford dan University of Washington melatih model AI 'reasoning' dengan biaya kurang dari $50.
Q
Apa nama model AI yang mereka latih?
A
Nama model AI yang mereka latih adalah s1.
Q
Apa metode yang digunakan untuk melatih model s1?
A
Mereka menggunakan metode distillation dan supervised fine-tuning untuk melatih model s1.
Q
Mengapa model s1 menarik perhatian dalam konteks inovasi AI?
A
Model s1 menarik perhatian karena menunjukkan bahwa inovasi dalam AI masih bisa dilakukan dengan biaya rendah tanpa dukungan dana besar.
Q
Apa rencana investasi perusahaan besar dalam infrastruktur AI pada tahun 2025?
A
Meta, Google, dan Microsoft berencana untuk menginvestasikan ratusan miliar dolar dalam infrastruktur AI pada tahun 2025.

Rangkuman Berita Serupa

Dupe DeepSeek seharga Rp 493.35 ribu ($30) ? Ilmuwan AS mengklaim telah menduplikasi model AI dengan biaya murah.InterestingEngineering
Teknologi
2 bulan lalu
82 dibaca

Dupe DeepSeek seharga Rp 493.35 ribu ($30) ? Ilmuwan AS mengklaim telah menduplikasi model AI dengan biaya murah.

Para ilmuwan berbondong-bondong ke DeepSeek: bagaimana mereka menggunakan model AI yang sangat populer ini.NatureMagazine
Teknologi
3 bulan lalu
117 dibaca

Para ilmuwan berbondong-bondong ke DeepSeek: bagaimana mereka menggunakan model AI yang sangat populer ini.

Model AI Baru DeepSeek Memicu Kejutan, Kekaguman, dan Pertanyaan dari Pesaing ASWired
Teknologi
3 bulan lalu
65 dibaca

Model AI Baru DeepSeek Memicu Kejutan, Kekaguman, dan Pertanyaan dari Pesaing AS

Model AI murah dan terbuka dari China, DeepSeek, menggembirakan para ilmuwan.NatureMagazine
Teknologi
3 bulan lalu
187 dibaca

Model AI murah dan terbuka dari China, DeepSeek, menggembirakan para ilmuwan.

DeepSeek mengklaim bahwa model 'penalaran' mereka mengalahkan o1 dari OpenAI pada beberapa tolok ukur tertentu.TechCrunch
Teknologi
3 bulan lalu
171 dibaca

DeepSeek mengklaim bahwa model 'penalaran' mereka mengalahkan o1 dari OpenAI pada beberapa tolok ukur tertentu.

DeepSeek mengklaim bahwa model penalarannya mengungguli o1 dari OpenAI pada beberapa tolok ukur tertentu.TechCrunch
Teknologi
3 bulan lalu
177 dibaca

DeepSeek mengklaim bahwa model penalarannya mengungguli o1 dari OpenAI pada beberapa tolok ukur tertentu.