Courtesy of TechCrunch

Para peneliti menciptakan pesaing terbuka untuk model 'penalaran' o1 milik OpenAI dengan biaya kurang dari Rp 822.25 ribu ($50) .

06 Feb 2025, 06.38 WIB

166 dibaca

Peneliti AI dari Stanford dan Universitas Washington berhasil melatih model AI bernama s1 dengan biaya kurang dari Rp 822.25 miliar ($50 m) enggunakan kredit komputasi awan. Model ini menunjukkan kemampuan yang mirip dengan model-model canggih lainnya dalam mengerjakan soal matematika dan pemrograman. Proses pelatihan s1 melibatkan teknik yang disebut distilasi, di mana kemampuan "penalaran" diambil dari model AI lain, dalam hal ini dari model Google, Gemini 2.0. S1 dapat diakses di GitHub, lengkap dengan data dan kode yang digunakan untuk melatihnya.

Keberhasilan s1 menimbulkan pertanyaan tentang bagaimana model AI dapat dibuat dengan biaya rendah, yang mungkin mengancam perusahaan besar yang menghabiskan banyak uang untuk mengembangkan model mereka. Meskipun distilasi adalah metode yang efektif untuk mereplikasi kemampuan model AI, peneliti mencatat bahwa metode ini tidak menghasilkan model baru yang jauh lebih baik dari yang sudah ada. Di masa depan, perusahaan besar seperti Meta, Google, dan Microsoft berencana untuk menginvestasikan ratusan miliar dolar dalam infrastruktur AI untuk melatih model-model generasi berikutnya.

Sumber: https://techcrunch.com/2025/02/05/researchers-created-an-open-rival-to-openais-o1-reasoning-model-for-under-50/

Pertanyaan Terkait

Apa yang dilakukan oleh peneliti di Stanford dan University of Washington?

Peneliti di Stanford dan University of Washington melatih model AI 'reasoning' dengan biaya kurang dari $50.

Apa nama model AI yang mereka latih?

Nama model AI yang mereka latih adalah s1.

Apa metode yang digunakan untuk melatih model s1?

Mereka menggunakan metode distillation dan supervised fine-tuning untuk melatih model s1.

Mengapa model s1 menarik perhatian dalam konteks inovasi AI?

Model s1 menarik perhatian karena menunjukkan bahwa inovasi dalam AI masih bisa dilakukan dengan biaya rendah tanpa dukungan dana besar.

Apa rencana investasi perusahaan besar dalam infrastruktur AI pada tahun 2025?

Meta, Google, dan Microsoft berencana untuk menginvestasikan ratusan miliar dolar dalam infrastruktur AI pada tahun 2025.

Artikel Serupa

o3-Mini dari OpenAI adalah model AI yang lebih ramping yang dapat bersaing dengan DeepSeek.

Dari Wired

Dupe DeepSeek seharga Rp 493.35 ribu ($30) ? Ilmuwan AS mengklaim telah menduplikasi model AI dengan biaya murah.

Dari InterestingEngineering

Para ilmuwan berbondong-bondong ke DeepSeek: bagaimana mereka menggunakan model AI yang sangat populer ini.

Dari NatureMagazine

Model AI Baru DeepSeek Memicu Kejutan, Kekaguman, dan Pertanyaan dari Pesaing AS

Dari Wired

DeepSeek mengklaim bahwa model penalarannya mengungguli o1 dari OpenAI pada beberapa tolok ukur tertentu.

Dari TechCrunch

DeepSeek mengklaim bahwa model 'penalaran' mereka mengalahkan o1 dari OpenAI pada beberapa tolok ukur tertentu.

Dari TechCrunch

Teknologi

6 bulan lalu

54 dibaca

o3-Mini dari OpenAI adalah model AI yang lebih ramping yang dapat bersaing dengan DeepSeek.

Teknologi

6 bulan lalu

101 dibaca

Dupe DeepSeek seharga Rp 493.35 ribu ($30) ? Ilmuwan AS mengklaim telah menduplikasi model AI dengan biaya murah.

Teknologi

6 bulan lalu

273 dibaca

Para ilmuwan berbondong-bondong ke DeepSeek: bagaimana mereka menggunakan model AI yang sangat populer ini.

Teknologi

6 bulan lalu

181 dibaca

Model AI Baru DeepSeek Memicu Kejutan, Kekaguman, dan Pertanyaan dari Pesaing AS

Teknologi

6 bulan lalu

274 dibaca

DeepSeek mengklaim bahwa model penalarannya mengungguli o1 dari OpenAI pada beberapa tolok ukur tertentu.

Teknologi

6 bulan lalu

282 dibaca