Courtesy of SCMP

Qwen2.5-Omni-7B: AI Multimodal Alibaba yang Ringan dan Cepat untuk Perangkat Mobile

27 Mar 2025, 17.00 WIB

225 dibaca

Ikhtisar 15 Detik

Qwen2.5-Omni-7B adalah model AI multimodal yang dirancang untuk perangkat mobile.
Model ini menawarkan kemampuan canggih dalam pemrosesan teks, gambar, audio, dan video.
Alibaba berusaha untuk memperkuat posisinya dalam teknologi AI generatif dengan meluncurkan model open-source ini.

Alibaba Group Holding telah meluncurkan model kecerdasan buatan (AI) baru bernama Qwen2.5-Omni-7B. Model ini dapat memproses teks, gambar, audio, dan video, dan dirancang untuk digunakan di ponsel pintar, tablet, dan laptop. Dengan hanya 7 miliar parameter, model ini membuat kemampuan AI yang canggih lebih mudah diakses oleh pengguna sehari-hari. Qwen2.5-Omni-7B juga tersedia secara open-source di platform seperti Hugging Face dan GitHub, serta terintegrasi dalam aplikasi Qwen Chat.

Model ini memiliki berbagai kegunaan, seperti membantu pengguna yang memiliki gangguan penglihatan dengan deskripsi audio secara real-time dan memberikan panduan memasak langkah demi langkah dengan menganalisis bahan-bahan. Qwen2.5-Omni-7B menunjukkan performa yang kuat dalam berbagai tes, mengalahkan model-model lain seperti Google Gemini dan model sebelumnya dari Alibaba sendiri. Ini menunjukkan bahwa permintaan untuk sistem AI yang lebih canggih dan serbaguna semakin meningkat.

Referensi:
[1] https://www.scmp.com/tech/article/3304116/alibaba-launches-ai-model-can-process-images-and-video-phones-and-laptops?module=top_story&pgtype=section

Analisis Ahli

Andrew Ng

"Kemampuan model multimodal seperti Qwen2.5-Omni-7B untuk berjalan di perangkat mobile adalah langkah maju dalam demokratisasi AI, memungkinkan pengguna akhir merasakan manfaat AI tanpa ketergantungan pada infrastruktur cloud besar."

Fei-Fei Li

"Integrasi berbagai modalitas input dalam satu model membuka peluang besar bagi interaksi manusia-mesin yang lebih alami dan responsif, terutama dalam membantu pengguna dengan kebutuhan khusus."

Analisis Kami

"Pengembangan Qwen2.5-Omni-7B menandai kemajuan signifikan dalam mengoptimalkan AI multimodal agar bisa berjalan efisien di perangkat berkapasitas rendah. Ini akan membuka peluang besar bagi inovasi aplikasi AI yang lebih inklusif dan fleksibel di berbagai sektor, terutama kesehatan dan pendidikan."

Prediksi Kami

Model AI multimodal ringan seperti Qwen2.5-Omni-7B akan semakin populer, mendorong pengembangan aplikasi AI yang lebih personal dan mudah diakses di perangkat mobile tanpa perlu infrastruktur cloud berat.