Courtesy of InterestingEngineering

Peneliti AS mengembangkan model penalaran AI dengan biaya hanya Rp 822.25 ribu ($50) , menantang OpenAI dan DeepSeek.

06 Feb 2025, 23.20 WIB

257 dibaca

Tim peneliti dari Stanford dan Universitas Washington telah mengembangkan model AI bernama s1 dengan biaya kurang dari Rp 822.25 ribu ($50) . Ini merupakan pencapaian besar karena biasanya pengembangan model AI memerlukan dana yang besar. Model s1 dirancang untuk tugas-tugas pemecahan masalah yang kompleks dan dapat menjawab pertanyaan yang memerlukan pemikiran logis. Dalam pengujian, s1 menunjukkan kinerja yang sebanding dengan model-model canggih lainnya, seperti OpenAI’s o1 dan DeepSeek’s R1. Mereka menggunakan teknik yang disebut "distillation" untuk melatih s1 agar meniru kemampuan pemikiran dari model AI lain, yaitu Google’s Gemini 2.0.

Peneliti juga menemukan bahwa menambahkan instruksi "wait" dalam proses pemikiran model dapat meningkatkan akurasi jawabannya. Dengan memberikan waktu untuk merenung, model dapat memeriksa kembali jawabannya dan memperbaiki langkah-langkah pemikiran yang salah. Pengembangan ini terjadi di tengah persaingan untuk menciptakan model pemikiran yang efisien dengan biaya yang jauh lebih rendah dibandingkan dengan lab AI besar lainnya. Tim peneliti berharap bahwa inovasi ini dapat mempercepat kemajuan yang bermanfaat bagi masyarakat.

Sumber: https://interestingengineering.com/innovation/ai-reasoning-model-developed-for-50

Pertanyaan Terkait

Apa itu model AI s1 dan siapa yang mengembangkannya?

Model AI s1 adalah model penalaran yang dikembangkan oleh tim peneliti di Stanford dan University of Washington.

Bagaimana s1 dapat mencapai kinerja yang setara dengan model-model canggih lainnya?

S1 dapat mencapai kinerja yang setara dengan model-model canggih lainnya dengan menggunakan teknik distilasi untuk meniru kemampuan penalaran model AI lain.

Apa teknik yang digunakan untuk melatih model s1?

Teknik yang digunakan untuk melatih model s1 adalah Supervised Fine-Tuning (SFT) dengan dataset yang telah dikurasi.

Mengapa instruksi 'wait' penting dalam proses penalaran model s1?

Instruksi 'wait' penting karena dapat meningkatkan akurasi model dengan memberikan waktu untuk merenung sebelum memberikan jawaban.

Apa klaim yang dibuat oleh DeepSeek mengenai biaya pengembangan model R1?

DeepSeek mengklaim bahwa biaya pengembangan model R1 hanya sekitar $6 juta, meskipun ada laporan yang menyebutkan biaya sebenarnya bisa mencapai $1,3 miliar.