DeepSeek Tingkatkan OCR dengan Model Open Source Alibaba untuk Performa Lebih Baik
Courtesy of SCMP

DeepSeek Tingkatkan OCR dengan Model Open Source Alibaba untuk Performa Lebih Baik

Memperkenalkan versi terbaru model OCR DeepSeek yang lebih canggih dan efisien berkat integrasi teknologi open source Alibaba Cloud, sehingga meningkatkan kemampuan pemrosesan dokumen secara lebih natural dan semantik.

27 Jan 2026, 21.00 WIB
2 dibaca
Share
Ikhtisar 15 Detik
  • DeepSeek mengembangkan model OCR terbaru yang meningkatkan kinerja dengan teknologi open-source dari Alibaba.
  • Penggantian dari CLIP ke Qwen2-0.5b memungkinkan pemrosesan dokumen yang lebih efektif.
  • Evolusi teknologi AI di Tiongkok semakin dipengaruhi oleh ekosistem open-source.
Tiongkok, Tiongkok - DeepSeek, sebuah perusahaan teknologi AI dari China, baru saja memperkenalkan pembaruan besar untuk model optical character recognition (OCR) mereka. Model baru bernama DeepSeek-OCR 2 ini menggunakan teknologi terbaru dari Alibaba Cloud untuk meningkatkan kemampuannya dalam mengenali teks dalam gambar.
Sebelumnya, DeepSeek menggunakan teknologi CLIP yang dibuat oleh OpenAI dan Microsoft untuk menghubungkan teks dengan gambar. Namun, untuk versi baru ini, mereka mengganti CLIP dengan model Qwen2-0.5b buatan Alibaba Cloud yang lebih ringan dan efisien.
Perubahan ini membuat sistem OCR DeepSeek dapat membaca dokumen dengan cara yang lebih menyerupai cara manusia membaca. Sistem ini mampu mengikuti pola pemindaian yang fleksibel namun masih menjaga makna teks secara koheren, sehingga hasil interpretasi menjadi lebih baik.
Langkah ini juga menunjukkan bagaimana ekosistem open source di China semakin berkembang dan membantu perusahaan lokal dalam mengembangkan teknologi AI yang lebih maju. Dalam waktu hanya tiga bulan sejak peluncuran versi awal, DeepSeek sudah berhasil memperbaiki teknologi mereka secara signifikan.
Kombinasi antara teknologi open source dan pengembangan internal di China diprediksi akan mendorong lebih banyak kemajuan di bidang kecerdasan buatan, khususnya dalam aplikasi pengenalan teks dan pengolahan gambar, sehingga membantu memenuhi kebutuhan bisnis dan teknologi lokal.
Referensi:
[1] https://www.scmp.com/tech/article/3341437/deepseek-taps-alibaba-open-source-ai-technology-boost-ocr-performance?module=top_story&pgtype=section

Analisis Ahli

Fei-Fei Li
"Penggantian model OCR oleh DeepSeek menggambarkan langkah strategis penting menuju kemandirian teknologi AI di Asia dengan menggunakan sumber daya lokal yang kuat."
Andrew Ng
"Menggunakan model open source yang ringan dan efektif dari Alibaba bisa menjadi contoh bagi startup AI lain agar lebih efisien dan cepat dalam pengembangan teknologi NLP dan OCR."

Analisis Kami

"Keputusan DeepSeek mengganti CLIP dengan model dari Alibaba menunjukkan paradigma baru di mana perusahaan China semakin mandiri dalam membangun teknologi AI kelas dunia. Ini juga mencerminkan potensi besar ekosistem open source domestik yang mampu menyediakan solusi yang lebih adaptif dan sesuai kebutuhan lokal."

Prediksi Kami

Integrasi teknologi open source Alibaba Cloud dalam OCR mengindikasikan bahwa lebih banyak perusahaan AI domestik di China akan mengadopsi model sejenis untuk menyaingi solusi global, mempercepat inovasi lokal dalam pengolahan bahasa dan gambar.

Pertanyaan Terkait

Q
Apa yang diluncurkan oleh DeepSeek pada hari Selasa?
A
DeepSeek meluncurkan versi terbaru dari model pengenalan karakter optik (OCR) yang disebut DeepSeek-OCR 2.
Q
Apa yang menjadi pengganti dalam model DeepSeek-OCR 2?
A
Model DeepSeek-OCR 2 menggantikan komponen kunci dari arsitektur sebelumnya dengan model Qwen2-0.5b yang dikembangkan oleh Alibaba Cloud.
Q
Mengapa DeepSeek mengganti CLIP dengan model Qwen2-0.5b?
A
DeepSeek mengganti CLIP dengan model Qwen2-0.5b untuk meningkatkan kemampuan pemrosesan dokumen agar lebih mirip dengan cara manusia membaca.
Q
Siapa yang mengembangkan model Qwen2-0.5b?
A
Model Qwen2-0.5b dikembangkan oleh Alibaba Cloud, yang merupakan bagian dari Alibaba Group Holding.
Q
Apa peran Alibaba Cloud dalam pengembangan model OCR DeepSeek?
A
Alibaba Cloud berperan dalam menyediakan sistem open-source yang digunakan untuk meningkatkan kemampuan model OCR DeepSeek.