Courtesy of TechCrunch

Hugging Face Rilis Model AI Kecil untuk Analisis Gambar dan Teks di Perangkat Ringan

23 Jan 2025, 21.57 WIB

288 dibaca

Tim dari platform pengembangan AI, Hugging Face, telah merilis model AI terkecil yang dapat menganalisis gambar, video pendek, dan teks, yaitu SmolVLM-256M dan SmolVLM-500M. Model ini dirancang untuk digunakan pada perangkat dengan spesifikasi rendah, seperti laptop dengan RAM kurang dari 1GB, dan cocok untuk pengembang yang ingin memproses data dalam jumlah besar dengan biaya rendah. SmolVLM-256M memiliki 256 juta parameter, sedangkan SmolVLM-500M memiliki 500 juta parameter. Keduanya dapat melakukan tugas seperti mendeskripsikan gambar atau video dan menjawab pertanyaan tentang dokumen PDF.

Meskipun model-model kecil ini murah dan serbaguna, mereka juga memiliki kelemahan yang tidak terlihat pada model yang lebih besar. Penelitian terbaru menunjukkan bahwa banyak model kecil kurang efektif dalam tugas penalaran yang kompleks. Hal ini mungkin disebabkan oleh fakta bahwa model kecil lebih baik dalam mengenali pola permukaan dalam data, tetapi kesulitan menerapkan pengetahuan tersebut dalam konteks baru.

Referensi:
[1] https://techcrunch.com/2025/01/23/hugging-face-claims-its-new-ai-models-are-the-smallest-of-their-kind/

Analisis Ahli

Yann LeCun

"Model kecil memberikan opsi menarik untuk komputasi terbatas, tapi kemampuan adaptasi dan penalaran mereka masih harus ditingkatkan untuk aplikasi nyata yang kompleks."

Fei-Fei Li

"Pengembangan model multimodal kecil adalah langkah maju dalam demokratisasi AI, terutama untuk penggunaan di berbagai perangkat, walau masih ada tantangan kualitas data dan generalisasi model."

Analisis Kami

"Model kecil SmolVLM adalah terobosan penting untuk membuat AI multimodal dapat diakses secara luas dengan sumber daya minim, membuka jalan bagi inovasi di perangkat edge. Namun, keterbatasan performa pada tugas penalaran kompleks menunjukkan bahwa kita belum bisa sepenuhnya menggantikan model besar untuk aplikasi yang menuntut akurasi tinggi."

Prediksi Kami

Model kecil untuk AI multimodal kemungkinan akan semakin populer untuk penggunaan di perangkat terbatas dan aplikasi yang hemat biaya, namun akan tetap butuh pengembangan lebih lanjut untuk meningkatkan kemampuan penalaran kompleksnya.