DeepSeek Diduga Gunakan Data Model AI Google dan OpenAI Tanpa Izin
Courtesy of TechCrunch

DeepSeek Diduga Gunakan Data Model AI Google dan OpenAI Tanpa Izin

Mengungkap dugaan bahwa model AI DeepSeek menggunakan data dari model pesaing seperti Google Gemini dan OpenAI, serta membahas isu keamanan dan regulasi terkait penggunaan data dalam pelatihan model AI.

TechCrunch
DariĀ TechCrunch
03 Jun 2025, 23.17 WIB
122 dibaca
Share
Ikhtisar 15 Detik
  • DeepSeek dituduh menggunakan data dari model AI pesaing, termasuk Gemini.
  • Teknik distilasi digunakan untuk melatih model AI, tetapi melanggar ketentuan layanan OpenAI.
  • AI perusahaan mulai meningkatkan langkah keamanan untuk mencegah distilasi dan pengambilan data yang tidak sah.
Melbourne, Australia - DeepSeek, lab AI dari China, baru-baru ini merilis model R1-0528 yang bisa menyelesaikan soal matematika dan coding dengan baik. Beberapa peneliti AI curiga model ini dilatih menggunakan data dari model AI pesaing seperti Google Gemini dan juga ChatGPT dari OpenAI.
Seorang developer bernama Sam Paeach mengamati bahwa cara model DeepSeek berbicara mirip dengan gaya bahasa Google Gemini 2.5 Pro. Seorang developer lainnya juga menemukan bahwa proses berpikir model DeepSeek menyerupai jejak-jejak yang biasanya ada pada model Gemini.
Tuduhan pelatihan data dari model lain sebelumnya juga pernah dialamatkan kepada DeepSeek saat model versi sebelumnya mengidentifikasi dirinya sebagai ChatGPT. OpenAI bahkan mengatakan ada bukti DeepSeek menggunakan teknik distilasi dari model AI besar mereka, yang termasuk pelanggaran aturan.
Banyak AI yang mulai melakukan proses verifikasi ketat untuk mencegah distilasi tanpa izin, seperti OpenAI yang mewajibkan ID resmi untuk akses model canggih. Google dan Anthropic sekarang merangkum jejak digital model mereka untuk melindungi data training dari penyalinan oleh pesaing.
AI experts menganggap langkah DeepSeek cukup masuk akal secara teknis, sebab mereka kekurangan hardware tapi punya dana cukup untuk memanfaatkan API model besar untuk membuat data sintetis, sehingga menghemat biaya dan waktu daripada membangun model sendiri.

Pertanyaan Terkait

Q
Apa yang dirilis oleh DeepSeek minggu lalu?
A
DeepSeek merilis versi terbaru dari model AI R1 yang menunjukkan kinerja baik pada berbagai tolok ukur matematika dan pemrograman.
Q
Apa yang dikatakan Sam Paeach tentang model R1-0528?
A
Sam Paeach mengklaim bahwa model R1-0528 lebih suka kata-kata dan ungkapan yang mirip dengan yang digunakan oleh Gemini 2.5 Pro.
Q
Mengapa DeepSeek dituduh menggunakan data dari model pesaing?
A
DeepSeek telah dituduh sebelumnya menggunakan data dari model-model seperti ChatGPT dan Gemini untuk melatih model mereka.
Q
Apa langkah yang diambil OpenAI untuk mencegah distilasi?
A
OpenAI mulai mewajibkan organisasi untuk menyelesaikan proses verifikasi ID untuk mengakses model tertentu.
Q
Siapa yang memberikan pandangan tentang kemungkinan DeepSeek menggunakan data dari Gemini?
A
Nathan Lambert, seorang peneliti di AI2, memberikan pandangannya tentang kemungkinan tersebut.

Artikel Serupa

4 Peringatan Tentang DeepSeek yang Perlu Anda Ketahui Sebelum MenggunakannyaForbes
Teknologi
4 bulan lalu
200 dibaca

4 Peringatan Tentang DeepSeek yang Perlu Anda Ketahui Sebelum Menggunakannya

Bagaimana DeepSeek mengubah lanskap AI di Silicon ValleyTechCrunch
Teknologi
4 bulan lalu
178 dibaca

Bagaimana DeepSeek mengubah lanskap AI di Silicon Valley

Tidak, DeepSeek Bukanlah 'Momen Sputnik'Forbes
Teknologi
4 bulan lalu
127 dibaca

Tidak, DeepSeek Bukanlah 'Momen Sputnik'

OpenAI mengatakan bahwa DeepSeek mencuri data AI-nya, tetapi seberapa umum praktik 'distilasi'?SCMP
Teknologi
4 bulan lalu
224 dibaca

OpenAI mengatakan bahwa DeepSeek mencuri data AI-nya, tetapi seberapa umum praktik 'distilasi'?

Pencurian data DeepSeek: OpenAI mengeluh sementara para kritikus mempertanyakan etika mereka sendiri.InterestingEngineering
Teknologi
4 bulan lalu
199 dibaca

Pencurian data DeepSeek: OpenAI mengeluh sementara para kritikus mempertanyakan etika mereka sendiri.

OpenAI mengatakan bahwa DeepSeek mungkin telah "menggunakan" output modelnya secara "tidak pantas".Axios
Bisnis
4 bulan lalu
106 dibaca

OpenAI mengatakan bahwa DeepSeek mungkin telah "menggunakan" output modelnya secara "tidak pantas".