Peneliti AS mengembangkan model penalaran AI dengan biaya hanya Rp 822.25 ribu ($50) , menantang OpenAI dan DeepSeek.
Courtesy of InterestingEngineering

Rangkuman Berita: Peneliti AS mengembangkan model penalaran AI dengan biaya hanya Rp 822.25 ribu ($50) , menantang OpenAI dan DeepSeek.

InterestingEngineering
Dari InterestingEngineering
06 Februari 2025 pukul 23.20 WIB
134 dibaca
Share
Tim peneliti dari Stanford dan Universitas Washington telah mengembangkan model AI bernama s1 dengan biaya kurang dari Rp 822.25 ribu ($50) . Ini merupakan pencapaian besar karena biasanya pengembangan model AI memerlukan dana yang besar. Model s1 dirancang untuk tugas-tugas pemecahan masalah yang kompleks dan dapat menjawab pertanyaan yang memerlukan pemikiran logis. Dalam pengujian, s1 menunjukkan kinerja yang sebanding dengan model-model canggih lainnya, seperti OpenAI’s o1 dan DeepSeek’s R1. Mereka menggunakan teknik yang disebut "distillation" untuk melatih s1 agar meniru kemampuan pemikiran dari model AI lain, yaitu Google’s Gemini 2.0.
Peneliti juga menemukan bahwa menambahkan instruksi "wait" dalam proses pemikiran model dapat meningkatkan akurasi jawabannya. Dengan memberikan waktu untuk merenung, model dapat memeriksa kembali jawabannya dan memperbaiki langkah-langkah pemikiran yang salah. Pengembangan ini terjadi di tengah persaingan untuk menciptakan model pemikiran yang efisien dengan biaya yang jauh lebih rendah dibandingkan dengan lab AI besar lainnya. Tim peneliti berharap bahwa inovasi ini dapat mempercepat kemajuan yang bermanfaat bagi masyarakat.

Pertanyaan Terkait

Q
Apa itu model AI s1 dan siapa yang mengembangkannya?
A
Model AI s1 adalah model penalaran yang dikembangkan oleh tim peneliti di Stanford dan University of Washington.
Q
Bagaimana s1 dapat mencapai kinerja yang setara dengan model-model canggih lainnya?
A
S1 dapat mencapai kinerja yang setara dengan model-model canggih lainnya dengan menggunakan teknik distilasi untuk meniru kemampuan penalaran model AI lain.
Q
Apa teknik yang digunakan untuk melatih model s1?
A
Teknik yang digunakan untuk melatih model s1 adalah Supervised Fine-Tuning (SFT) dengan dataset yang telah dikurasi.
Q
Mengapa instruksi 'wait' penting dalam proses penalaran model s1?
A
Instruksi 'wait' penting karena dapat meningkatkan akurasi model dengan memberikan waktu untuk merenung sebelum memberikan jawaban.
Q
Apa klaim yang dibuat oleh DeepSeek mengenai biaya pengembangan model R1?
A
DeepSeek mengklaim bahwa biaya pengembangan model R1 hanya sekitar $6 juta, meskipun ada laporan yang menyebutkan biaya sebenarnya bisa mencapai $1,3 miliar.

Rangkuman Berita Serupa

Dupe DeepSeek seharga Rp 493.35 ribu ($30) ? Ilmuwan AS mengklaim telah menduplikasi model AI dengan biaya murah.InterestingEngineering
Teknologi
2 bulan lalu
83 dibaca

Dupe DeepSeek seharga Rp 493.35 ribu ($30) ? Ilmuwan AS mengklaim telah menduplikasi model AI dengan biaya murah.

Para ilmuwan berbondong-bondong ke DeepSeek: bagaimana mereka menggunakan model AI yang sangat populer ini.NatureMagazine
Teknologi
3 bulan lalu
118 dibaca

Para ilmuwan berbondong-bondong ke DeepSeek: bagaimana mereka menggunakan model AI yang sangat populer ini.

Model AI Baru DeepSeek Memicu Kejutan, Kekaguman, dan Pertanyaan dari Pesaing ASWired
Teknologi
3 bulan lalu
65 dibaca

Model AI Baru DeepSeek Memicu Kejutan, Kekaguman, dan Pertanyaan dari Pesaing AS

DeepSeek China berhasil memecahkan 'cawan suci AI' untuk menggulingkan Google, Meta, dan OpenAI dari AS.InterestingEngineering
Teknologi
3 bulan lalu
113 dibaca

DeepSeek China berhasil memecahkan 'cawan suci AI' untuk menggulingkan Google, Meta, dan OpenAI dari AS.

Model AI murah dan terbuka dari China, DeepSeek, menggembirakan para ilmuwan.NatureMagazine
Teknologi
3 bulan lalu
187 dibaca

Model AI murah dan terbuka dari China, DeepSeek, menggembirakan para ilmuwan.

DeepSeek mengklaim bahwa model 'penalaran' mereka mengalahkan o1 dari OpenAI pada beberapa tolok ukur tertentu.TechCrunch
Teknologi
3 bulan lalu
171 dibaca

DeepSeek mengklaim bahwa model 'penalaran' mereka mengalahkan o1 dari OpenAI pada beberapa tolok ukur tertentu.