Meta Bantah Rumor Pelatihan Model AI pada Set Tes untuk Tolok Ukur
Courtesy of TechCrunch

Rangkuman Berita: Meta Bantah Rumor Pelatihan Model AI pada Set Tes untuk Tolok Ukur

Menjelaskan bahwa Meta tidak melatih model AI barunya pada set tes untuk meningkatkan hasil tolok ukur secara artifisial.

TechCrunch
Dari TechCrunch
08 April 2025 pukul 01.45 WIB
99 dibaca
Share
Ikhtisar 15 Detik
  • Meta membantah rumor bahwa mereka melatih model AI mereka pada test set.
  • Model Llama 4 Maverick dan Scout mengalami variasi kualitas di berbagai penyedia cloud.
  • Meta berkomitmen untuk memperbaiki bug dan meningkatkan pengalaman pengguna dengan model-modelnya.
tidak disebutkan - Seorang eksekutif Meta, Ahmad Al-Dahle, membantah rumor bahwa perusahaan melatih model AI barunya, Llama 4 Maverick dan Llama 4 Scout, pada set tes untuk meningkatkan hasil tolok ukur secara artifisial.
Rumor ini muncul dari sebuah posting di media sosial China dan diperkuat oleh laporan bahwa model tersebut berkinerja buruk pada tugas tertentu serta penggunaan versi eksperimental Maverick untuk tolok ukur LM Arena.
Al-Dahle mengakui bahwa beberapa pengguna melihat kualitas campuran dari model tersebut di berbagai penyedia cloud dan mengatakan bahwa Meta akan terus bekerja untuk memperbaiki bug dan mengintegrasikan mitra.

Pertanyaan Terkait

Q
Apa yang dikatakan Ahmad Al-Dahle tentang rumor pelatihan model AI Meta?
A
Ahmad Al-Dahle menyatakan bahwa rumor tersebut 'sama sekali tidak benar'.
Q
Apa nama model AI baru yang diluncurkan oleh Meta?
A
Model AI baru yang diluncurkan oleh Meta adalah Llama 4 Maverick dan Llama 4 Scout.
Q
Mengapa rumor tentang Meta melatih modelnya di test set muncul?
A
Rumor muncul karena laporan bahwa Maverick dan Scout berkinerja buruk dalam tugas tertentu.
Q
Apa yang diakui Al-Dahle tentang kualitas model Maverick dan Scout?
A
Al-Dahle mengakui bahwa beberapa pengguna melihat 'kualitas campuran' dari Maverick dan Scout.
Q
Apa yang diharapkan Meta terkait implementasi publik dari model-modelnya?
A
Meta berharap akan memerlukan beberapa hari untuk semua implementasi publik disesuaikan.

Rangkuman Berita Serupa

Kritik Terhadap Penggunaan Platform Benchmarking Crowdsourced oleh Laboratorium AITechCrunch
Teknologi
8 hari lalu
25 dibaca

Kritik Terhadap Penggunaan Platform Benchmarking Crowdsourced oleh Laboratorium AI

Perbedaan Hasil Benchmark Model AI o3 OpenAI Menimbulkan PertanyaanTechCrunch
Teknologi
10 hari lalu
36 dibaca

Perbedaan Hasil Benchmark Model AI o3 OpenAI Menimbulkan Pertanyaan

Meta Dikritik Karena Gunakan Model Eksperimental untuk Skor Tinggi di LM ArenaTechCrunch
Teknologi
19 hari lalu
120 dibaca

Meta Dikritik Karena Gunakan Model Eksperimental untuk Skor Tinggi di LM Arena

Kontroversi Perilisan Model AI Baru Meta: Llama 4 dan MaverickTheVerge
Teknologi
23 hari lalu
89 dibaca

Kontroversi Perilisan Model AI Baru Meta: Llama 4 dan Maverick

"Perbedaan Antara Maverick di LM Arena dan Versi Publik: Apa yang Terjadi?"TechCrunch
Teknologi
24 hari lalu
97 dibaca

"Perbedaan Antara Maverick di LM Arena dan Versi Publik: Apa yang Terjadi?"

Meta AI mendapatkan dua model baru saat Meta merilis Llama 4.TheVerge
Teknologi
25 hari lalu
124 dibaca

Meta AI mendapatkan dua model baru saat Meta merilis Llama 4.