Courtesy of SCMP
DeepSeek dan Tsinghua Kembangkan Teknik Baru untuk Model AI Lebih Pintar dan Cepat
06 Apr 2025, 06.00 WIB
156 dibaca
Share
Ikhtisar 15 Detik
- DeepSeek mengembangkan teknik baru untuk meningkatkan model bahasa besar.
- Kolaborasi dengan Universitas Tsinghua menunjukkan pentingnya penelitian akademis dalam pengembangan AI.
- Model DeepSeek-R1 telah mendapatkan perhatian global karena kinerjanya yang kompetitif.
DeepSeek, sebuah perusahaan start-up kecerdasan buatan (AI) asal China, telah mengembangkan teknik baru untuk meningkatkan kemampuan berpikir model bahasa besar (LLM). Mereka bekerja sama dengan peneliti dari Universitas Tsinghua untuk menciptakan metode yang menggabungkan generative reward modelling (GRM) dan self-principled critique tuning. Tujuan dari teknik ini adalah agar model LLM dapat memberikan hasil yang lebih baik dan lebih cepat untuk berbagai pertanyaan.
Model DeepSeek-GRM yang dihasilkan telah menunjukkan kinerja yang lebih baik dibandingkan metode yang ada sebelumnya. Proses reward modelling membantu model LLM untuk lebih memahami preferensi manusia. DeepSeek berencana untuk menjadikan model GRM ini sebagai sumber terbuka, meskipun mereka belum memberikan jadwal pasti untuk peluncurannya.
Saat ini, banyak orang menunggu peluncuran model terbaru DeepSeek, yaitu DeepSeek-R2, yang merupakan penerus dari model R1. Model R1 sebelumnya telah menarik perhatian dunia teknologi karena kinerjanya yang efisien dan mampu bersaing dengan model-model terkemuka lainnya. Meskipun ada spekulasi tentang peluncuran R2, DeepSeek belum memberikan komentar resmi mengenai hal ini.
--------------------
Analisis Kami: Kolaborasi antara DeepSeek dan Tsinghua University menunjukkan langkah strategis dalam menggabungkan pemodelan reward generatif dan kritik mandiri untuk mengurangi bias dan meningkatkan kualitas output LLM. Pendekatan ini berpotensi menjadi standar baru dalam pengembangan model AI yang benar-benar memahami konteks dan preferensi manusia secara mendalam.
--------------------
Analisis Ahli:
Yoshua Bengio: Penggabungan teknik reward modeling dan self-critique tuning adalah revolusioner karena memungkinkan model AI belajar tidak hanya dari data tetapi juga dari evaluasi diri, yang dapat mempercepat kemajuan AI menjadi lebih manusiawi.
Fei-Fei Li: Pendekatan kombinasi ini bisa memperbaiki keakuratan dan relevansi respons model bahasa, sangat penting untuk aplikasi praktis yang membutuhkan penalaran mendalam dan sensitivitas terhadap preferensi pengguna.
--------------------
What's Next: Model DeepSeek-R2 kemungkinan akan segera dirilis dan membawa peningkatan signifikan dalam performa model bahasa besar di pasar AI global, sekaligus memperkuat posisi DeepSeek sebagai pemain utama di industri AI.
Referensi:
[1] https://www.scmp.com/tech/tech-trends/article/3305259/deepseek-unveils-new-ai-reasoning-method-anticipation-its-next-gen-model-rises?module=top_story&pgtype=subsection
[1] https://www.scmp.com/tech/tech-trends/article/3305259/deepseek-unveils-new-ai-reasoning-method-anticipation-its-next-gen-model-rises?module=top_story&pgtype=subsection