Courtesy of TechCrunch

Kecerdasan Buatan

Meta Bantah Rumor Pelatihan Model AI pada Set Tes untuk Tolok Ukur

Menjelaskan bahwa Meta tidak melatih model AI barunya pada set tes untuk meningkatkan hasil tolok ukur secara artifisial.

08 Apr 2025, 01.45 WIB

225 dibaca

Ikhtisar 15 Detik

Meta membantah rumor bahwa mereka melatih model AI mereka pada test set.
Model Llama 4 Maverick dan Scout mengalami variasi kualitas di berbagai penyedia cloud.
Meta berkomitmen untuk memperbaiki bug dan meningkatkan pengalaman pengguna dengan model-modelnya.

tidak disebutkan - Seorang eksekutif Meta, Ahmad Al-Dahle, membantah rumor bahwa perusahaan melatih model AI barunya, Llama 4 Maverick dan Llama 4 Scout, pada set tes untuk meningkatkan hasil tolok ukur secara artifisial.

Baca juga: Kontroversi di Balik Chatbot Arena: Dugaan Ketidakadilan dalam Penilaian AI

Rumor ini muncul dari sebuah posting di media sosial China dan diperkuat oleh laporan bahwa model tersebut berkinerja buruk pada tugas tertentu serta penggunaan versi eksperimental Maverick untuk tolok ukur LM Arena.

Baca juga: Meta Berjuang Menarik Pengembang di Tengah Persaingan Ketat AI

Al-Dahle mengakui bahwa beberapa pengguna melihat kualitas campuran dari model tersebut di berbagai penyedia cloud dan mengatakan bahwa Meta akan terus bekerja untuk memperbaiki bug dan mengintegrasikan mitra.

Sumber: https://techcrunch.com/2025/04/07/meta-exec-denies-the-company-artificially-boosted-llama-4s-benchmark-scores/

Pertanyaan Terkait

Q

Apa yang dikatakan Ahmad Al-Dahle tentang rumor pelatihan model AI Meta?

A

Ahmad Al-Dahle menyatakan bahwa rumor tersebut 'sama sekali tidak benar'.

Q

Apa nama model AI baru yang diluncurkan oleh Meta?

A

Model AI baru yang diluncurkan oleh Meta adalah Llama 4 Maverick dan Llama 4 Scout.

Q

Mengapa rumor tentang Meta melatih modelnya di test set muncul?

A

Rumor muncul karena laporan bahwa Maverick dan Scout berkinerja buruk dalam tugas tertentu.

Q

Apa yang diakui Al-Dahle tentang kualitas model Maverick dan Scout?

A

Al-Dahle mengakui bahwa beberapa pengguna melihat 'kualitas campuran' dari Maverick dan Scout.

Q

Apa yang diharapkan Meta terkait implementasi publik dari model-modelnya?

A

Meta berharap akan memerlukan beberapa hari untuk semua implementasi publik disesuaikan.

Artikel Serupa

Kritik Terhadap Penggunaan Platform Benchmarking Crowdsourced oleh Laboratorium AI

Kritik Terhadap Penggunaan Platform Benchmarking Crowdsourced oleh Laboratorium AI

Dari TechCrunch

Perbedaan Hasil Benchmark Model AI o3 OpenAI Menimbulkan Pertanyaan

Perbedaan Hasil Benchmark Model AI o3 OpenAI Menimbulkan Pertanyaan

Dari TechCrunch

Meta Dikritik Karena Gunakan Model Eksperimental untuk Skor Tinggi di LM Arena

Meta Dikritik Karena Gunakan Model Eksperimental untuk Skor Tinggi di LM Arena

Dari TechCrunch

Kontroversi Perilisan Model AI Baru Meta: Llama 4 dan Maverick

Kontroversi Perilisan Model AI Baru Meta: Llama 4 dan Maverick

"Perbedaan Antara Maverick di LM Arena dan Versi Publik: Apa yang Terjadi?"

"Perbedaan Antara Maverick di LM Arena dan Versi Publik: Apa yang Terjadi?"

Dari TechCrunch

Meta AI mendapatkan dua model baru saat Meta merilis Llama 4.

Meta AI mendapatkan dua model baru saat Meta merilis Llama 4.

Kritik Terhadap Penggunaan Platform Benchmarking Crowdsourced oleh Laboratorium AI

TechCrunch

Teknologi

3 bulan lalu

52 dibaca

Kritik Terhadap Penggunaan Platform Benchmarking Crowdsourced oleh Laboratorium AI

Perbedaan Hasil Benchmark Model AI o3 OpenAI Menimbulkan Pertanyaan

TechCrunch

Teknologi

3 bulan lalu

90 dibaca

Perbedaan Hasil Benchmark Model AI o3 OpenAI Menimbulkan Pertanyaan

Meta Dikritik Karena Gunakan Model Eksperimental untuk Skor Tinggi di LM Arena

TechCrunch

Teknologi

3 bulan lalu

230 dibaca

Meta Dikritik Karena Gunakan Model Eksperimental untuk Skor Tinggi di LM Arena

Kontroversi Perilisan Model AI Baru Meta: Llama 4 dan Maverick

TheVerge

Teknologi

3 bulan lalu

158 dibaca

Kontroversi Perilisan Model AI Baru Meta: Llama 4 dan Maverick

"Perbedaan Antara Maverick di LM Arena dan Versi Publik: Apa yang Terjadi?"

TechCrunch

Teknologi

3 bulan lalu

119 dibaca

"Perbedaan Antara Maverick di LM Arena dan Versi Publik: Apa yang Terjadi?"

Meta AI mendapatkan dua model baru saat Meta merilis Llama 4.

TheVerge

Teknologi

3 bulan lalu

190 dibaca

Meta AI mendapatkan dua model baru saat Meta merilis Llama 4.