Courtesy of TechCrunch

DeepSeek Diduga Gunakan Data Model AI Google dan OpenAI Tanpa Izin

Mengungkap dugaan bahwa model AI DeepSeek menggunakan data dari model pesaing seperti Google Gemini dan OpenAI, serta membahas isu keamanan dan regulasi terkait penggunaan data dalam pelatihan model AI.

03 Jun 2025, 23.17 WIB

152 dibaca

Ikhtisar 15 Detik

DeepSeek dituduh menggunakan data dari model AI pesaing, termasuk Gemini.
Teknik distilasi digunakan untuk melatih model AI, tetapi melanggar ketentuan layanan OpenAI.
AI perusahaan mulai meningkatkan langkah keamanan untuk mencegah distilasi dan pengambilan data yang tidak sah.

Melbourne, Australia - DeepSeek, lab AI dari China, baru-baru ini merilis model R1-0528 yang bisa menyelesaikan soal matematika dan coding dengan baik. Beberapa peneliti AI curiga model ini dilatih menggunakan data dari model AI pesaing seperti Google Gemini dan juga ChatGPT dari OpenAI.

Seorang developer bernama Sam Paeach mengamati bahwa cara model DeepSeek berbicara mirip dengan gaya bahasa Google Gemini 2.5 Pro. Seorang developer lainnya juga menemukan bahwa proses berpikir model DeepSeek menyerupai jejak-jejak yang biasanya ada pada model Gemini.

Tuduhan pelatihan data dari model lain sebelumnya juga pernah dialamatkan kepada DeepSeek saat model versi sebelumnya mengidentifikasi dirinya sebagai ChatGPT. OpenAI bahkan mengatakan ada bukti DeepSeek menggunakan teknik distilasi dari model AI besar mereka, yang termasuk pelanggaran aturan.

Banyak AI yang mulai melakukan proses verifikasi ketat untuk mencegah distilasi tanpa izin, seperti OpenAI yang mewajibkan ID resmi untuk akses model canggih. Google dan Anthropic sekarang merangkum jejak digital model mereka untuk melindungi data training dari penyalinan oleh pesaing.

AI experts menganggap langkah DeepSeek cukup masuk akal secara teknis, sebab mereka kekurangan hardware tapi punya dana cukup untuk memanfaatkan API model besar untuk membuat data sintetis, sehingga menghemat biaya dan waktu daripada membangun model sendiri.

Referensi:
[1] https://techcrunch.com/2025/06/03/deepseek-may-have-used-googles-gemini-to-train-its-latest-model/

Analisis Ahli

Analisis Kami

"null"

Prediksi Kami

Pertanyaan Terkait

Apa yang dirilis oleh DeepSeek minggu lalu?

DeepSeek merilis versi terbaru dari model AI R1 yang menunjukkan kinerja baik pada berbagai tolok ukur matematika dan pemrograman.

Apa yang dikatakan Sam Paeach tentang model R1-0528?

Sam Paeach mengklaim bahwa model R1-0528 lebih suka kata-kata dan ungkapan yang mirip dengan yang digunakan oleh Gemini 2.5 Pro.

Mengapa DeepSeek dituduh menggunakan data dari model pesaing?

DeepSeek telah dituduh sebelumnya menggunakan data dari model-model seperti ChatGPT dan Gemini untuk melatih model mereka.

Apa langkah yang diambil OpenAI untuk mencegah distilasi?

OpenAI mulai mewajibkan organisasi untuk menyelesaikan proses verifikasi ID untuk mengakses model tertentu.

Siapa yang memberikan pandangan tentang kemungkinan DeepSeek menggunakan data dari Gemini?

Nathan Lambert, seorang peneliti di AI2, memberikan pandangannya tentang kemungkinan tersebut.

Artikel Serupa

Klaim Model AI Murah DeepSeek Bikin Heboh, Tapi Apakah Sesuai Fakta?

Dari Forbes

Tuduhan Distilasi Model AI DeepSeek Picu Kontroversi Perlindungan Data GPT

Dari SCMP

Kontroversi OpenAI vs DeepSeek: Tuduhan Pelanggaran Data AI dan Tantangannya

Dari InterestingEngineering

DeepSeek, AI China yang Mengguncang Pasar dan Persaingan Global

Dari TechCrunch

DeepSeek dan Paradigma Baru AI: Inovasi Murah yang Guncang Dunia Teknologi

Dari Wired

DeepSeek: Model AI Murah Asal China Tantang ChatGPT dan Picu Kekhawatiran

Dari Forbes

Teknologi

11 bulan lalu

227 dibaca