Meta Bantah Rumor Pelatihan Model AI pada Set Tes untuk Tolok Ukur
Courtesy of TechCrunch

Meta Bantah Rumor Pelatihan Model AI pada Set Tes untuk Tolok Ukur

Menjelaskan bahwa Meta tidak melatih model AI barunya pada set tes untuk meningkatkan hasil tolok ukur secara artifisial.

08 Apr 2025, 01.45 WIB
190 dibaca
Share
Ikhtisar 15 Detik
  • Meta membantah rumor bahwa mereka melatih model AI mereka pada test set.
  • Model Llama 4 Maverick dan Scout mengalami variasi kualitas di berbagai penyedia cloud.
  • Meta berkomitmen untuk memperbaiki bug dan meningkatkan pengalaman pengguna dengan model-modelnya.
tidak disebutkan - Seorang eksekutif Meta, Ahmad Al-Dahle, membantah rumor bahwa perusahaan melatih model AI barunya, Llama 4 Maverick dan Llama 4 Scout, pada set tes untuk meningkatkan hasil tolok ukur secara artifisial.
Rumor ini muncul dari sebuah posting di media sosial China dan diperkuat oleh laporan bahwa model tersebut berkinerja buruk pada tugas tertentu serta penggunaan versi eksperimental Maverick untuk tolok ukur LM Arena.
Al-Dahle mengakui bahwa beberapa pengguna melihat kualitas campuran dari model tersebut di berbagai penyedia cloud dan mengatakan bahwa Meta akan terus bekerja untuk memperbaiki bug dan mengintegrasikan mitra.

Pertanyaan Terkait

Q
Apa yang dikatakan Ahmad Al-Dahle tentang rumor pelatihan model AI Meta?
A
Ahmad Al-Dahle menyatakan bahwa rumor tersebut 'sama sekali tidak benar'.
Q
Apa nama model AI baru yang diluncurkan oleh Meta?
A
Model AI baru yang diluncurkan oleh Meta adalah Llama 4 Maverick dan Llama 4 Scout.
Q
Mengapa rumor tentang Meta melatih modelnya di test set muncul?
A
Rumor muncul karena laporan bahwa Maverick dan Scout berkinerja buruk dalam tugas tertentu.
Q
Apa yang diakui Al-Dahle tentang kualitas model Maverick dan Scout?
A
Al-Dahle mengakui bahwa beberapa pengguna melihat 'kualitas campuran' dari Maverick dan Scout.
Q
Apa yang diharapkan Meta terkait implementasi publik dari model-modelnya?
A
Meta berharap akan memerlukan beberapa hari untuk semua implementasi publik disesuaikan.

Artikel Serupa

Kritik Terhadap Penggunaan Platform Benchmarking Crowdsourced oleh Laboratorium AITechCrunch
Teknologi
1 bulan lalu
42 dibaca

Kritik Terhadap Penggunaan Platform Benchmarking Crowdsourced oleh Laboratorium AI

Perbedaan Hasil Benchmark Model AI o3 OpenAI Menimbulkan PertanyaanTechCrunch
Teknologi
1 bulan lalu
77 dibaca

Perbedaan Hasil Benchmark Model AI o3 OpenAI Menimbulkan Pertanyaan

Meta Dikritik Karena Gunakan Model Eksperimental untuk Skor Tinggi di LM ArenaTechCrunch
Teknologi
2 bulan lalu
200 dibaca

Meta Dikritik Karena Gunakan Model Eksperimental untuk Skor Tinggi di LM Arena

Kontroversi Perilisan Model AI Baru Meta: Llama 4 dan MaverickTheVerge
Teknologi
2 bulan lalu
116 dibaca

Kontroversi Perilisan Model AI Baru Meta: Llama 4 dan Maverick

"Perbedaan Antara Maverick di LM Arena dan Versi Publik: Apa yang Terjadi?"TechCrunch
Teknologi
2 bulan lalu
109 dibaca

"Perbedaan Antara Maverick di LM Arena dan Versi Publik: Apa yang Terjadi?"

Meta AI mendapatkan dua model baru saat Meta merilis Llama 4.TheVerge
Teknologi
2 bulan lalu
158 dibaca

Meta AI mendapatkan dua model baru saat Meta merilis Llama 4.