Courtesy of InterestingEngineering
Model AI Reasoning s1 Hanya dengan Biaya Rp 822.25 ribu ($50) , Tantang Raksasa AI
06 Feb 2025, 23.20 WIB
278 dibaca
Share
Tim peneliti dari Stanford dan Universitas Washington telah mengembangkan model AI bernama s1 dengan biaya kurang dari Rp 822.25 ribu ($50) . Ini merupakan pencapaian besar karena biasanya pengembangan model AI memerlukan dana yang besar. Model s1 dirancang untuk tugas-tugas pemecahan masalah yang kompleks dan dapat menjawab pertanyaan yang memerlukan pemikiran logis. Dalam pengujian, s1 menunjukkan kinerja yang sebanding dengan model-model canggih lainnya, seperti OpenAI’s o1 dan DeepSeek’s R1. Mereka menggunakan teknik yang disebut "distillation" untuk melatih s1 agar meniru kemampuan pemikiran dari model AI lain, yaitu Google’s Gemini 2.0.
Peneliti juga menemukan bahwa menambahkan instruksi "wait" dalam proses pemikiran model dapat meningkatkan akurasi jawabannya. Dengan memberikan waktu untuk merenung, model dapat memeriksa kembali jawabannya dan memperbaiki langkah-langkah pemikiran yang salah. Pengembangan ini terjadi di tengah persaingan untuk menciptakan model pemikiran yang efisien dengan biaya yang jauh lebih rendah dibandingkan dengan lab AI besar lainnya. Tim peneliti berharap bahwa inovasi ini dapat mempercepat kemajuan yang bermanfaat bagi masyarakat.
--------------------
Analisis Kami: Penurunan drastis biaya pelatihan model reasoning lewat teknik distillation adalah terobosan penting yang membuka peluang lebih luas untuk inovasi AI. Namun, aspek keamanan dan keandalan tetap harus menjadi prioritas agar kemajuan ini tidak disalahgunakan atau menimbulkan risiko baru.
--------------------
Analisis Ahli:
Andrew Ng: Efisiensi biaya dalam pengembangan AI seperti yang dilakukan dengan s1 memperlihatkan potensi besar untuk demokratisasi teknologi AI, namun fokus pada kualitas data dan pelatihan tetap kunci utama.
Fei-Fei Li: Model yang transparan dan bisa diakses publik seperti s1 sangat membantu komunitas riset mempercepat inovasi, tapi pengujian keamanan wajib dilakukan guna mencegah exploitasi.
Yann LeCun: Memanfaatkan teknik distillation untuk membuat model kecil dengan kemampuan reasoning tinggi adalah langkah cerdas yang memperlihatkan bahwa kualitas bukan hanya soal ukuran model besar.
--------------------
What's Next: Model AI reasoning murah dan transparan akan semakin banyak bermunculan, mempercepat riset dan aplikasi AI yang lebih inklusif dan aman di masa depan.
Referensi:
[1] https://interestingengineering.com/innovation/ai-reasoning-model-developed-for-50
[1] https://interestingengineering.com/innovation/ai-reasoning-model-developed-for-50
Pertanyaan Terkait
Q
Apa itu model AI s1 dan siapa yang mengembangkannya?A
Model AI s1 adalah model penalaran yang dikembangkan oleh tim peneliti di Stanford dan University of Washington.Q
Bagaimana s1 dapat mencapai kinerja yang setara dengan model-model canggih lainnya?A
S1 dapat mencapai kinerja yang setara dengan model-model canggih lainnya dengan menggunakan teknik distilasi untuk meniru kemampuan penalaran model AI lain.Q
Apa teknik yang digunakan untuk melatih model s1?A
Teknik yang digunakan untuk melatih model s1 adalah Supervised Fine-Tuning (SFT) dengan dataset yang telah dikurasi.Q
Mengapa instruksi 'wait' penting dalam proses penalaran model s1?A
Instruksi 'wait' penting karena dapat meningkatkan akurasi model dengan memberikan waktu untuk merenung sebelum memberikan jawaban.Q
Apa klaim yang dibuat oleh DeepSeek mengenai biaya pengembangan model R1?A
DeepSeek mengklaim bahwa biaya pengembangan model R1 hanya sekitar $6 juta, meskipun ada laporan yang menyebutkan biaya sebenarnya bisa mencapai $1,3 miliar.