Courtesy of TechCrunch
Peneliti AI dari Stanford dan Universitas Washington berhasil melatih model AI bernama s1 dengan biaya kurang dari Rp 822.25 miliar ($50 m) enggunakan kredit komputasi awan. Model ini menunjukkan kemampuan yang mirip dengan model-model canggih lainnya dalam mengerjakan soal matematika dan pemrograman. Proses pelatihan s1 melibatkan teknik yang disebut distilasi, di mana kemampuan "penalaran" diambil dari model AI lain, dalam hal ini dari model Google, Gemini 2.0. S1 dapat diakses di GitHub, lengkap dengan data dan kode yang digunakan untuk melatihnya.
Keberhasilan s1 menimbulkan pertanyaan tentang bagaimana model AI dapat dibuat dengan biaya rendah, yang mungkin mengancam perusahaan besar yang menghabiskan banyak uang untuk mengembangkan model mereka. Meskipun distilasi adalah metode yang efektif untuk mereplikasi kemampuan model AI, peneliti mencatat bahwa metode ini tidak menghasilkan model baru yang jauh lebih baik dari yang sudah ada. Di masa depan, perusahaan besar seperti Meta, Google, dan Microsoft berencana untuk menginvestasikan ratusan miliar dolar dalam infrastruktur AI untuk melatih model-model generasi berikutnya.
Pertanyaan Terkait
Q
Apa yang dilakukan oleh peneliti di Stanford dan University of Washington?A
Peneliti di Stanford dan University of Washington melatih model AI 'reasoning' dengan biaya kurang dari $50.Q
Apa nama model AI yang mereka latih?A
Nama model AI yang mereka latih adalah s1.Q
Apa metode yang digunakan untuk melatih model s1?A
Mereka menggunakan metode distillation dan supervised fine-tuning untuk melatih model s1.Q
Mengapa model s1 menarik perhatian dalam konteks inovasi AI?A
Model s1 menarik perhatian karena menunjukkan bahwa inovasi dalam AI masih bisa dilakukan dengan biaya rendah tanpa dukungan dana besar.Q
Apa rencana investasi perusahaan besar dalam infrastruktur AI pada tahun 2025?A
Meta, Google, dan Microsoft berencana untuk menginvestasikan ratusan miliar dolar dalam infrastruktur AI pada tahun 2025.