Courtesy of TechCrunch
OpenAI Luncurkan GDPval, Tes AI Menyaingi Pekerja Profesional di 9 Industri
Mengukur kemampuan model AI dalam menyelesaikan tugas-tugas pekerjaan yang bernilai ekonomi dan menilai progres AI dalam menyaingi kualitas kerja manusia profesional di berbagai bidang.
25 Sep 2025, 23.11 WIB
15 dibaca
Share
Ikhtisar 15 Detik
- Model AI seperti GPT-5 dan Claude Opus 4.1 semakin mendekati kualitas kerja profesional industri.
- Benchmark GDPval menunjukkan bahwa model AI dapat membantu profesional mengalihkan fokus mereka ke tugas yang lebih bernilai.
- OpenAI berencana untuk mengembangkan pengujian yang lebih robust di masa depan untuk menilai kemampuan AI di lebih banyak aspek pekerjaan.
Amerika Serikat - OpenAI baru-baru ini meluncurkan sebuah benchmark baru bernama GDPval yang menguji bagaimana performa model AI terhadap pekerjaan manusia di sembilan industri utama Amerika Serikat. Tujuan dari tes ini adalah untuk melihat sejauh mana AI bisa menyaingi atau bahkan melampaui kualitas kerja manusia di berbagai bidang yang bernilai secara ekonomi.
Benchmark ini menguji model AI dalam 44 pekerjaan seperti insinyur perangkat lunak, perawat, dan jurnalis dengan meminta model AI menghasilkan laporan riset yang kemudian dibandingkan dengan laporan yang dibuat oleh profesional berpengalaman. Penilaian dilakukan dengan membandingkan mana yang lebih baik atau setara antara laporan AI dan manusia.
Hasil pengujian menunjukkan bahwa GPT-5-high dapat mencapai tingkat kinerja setara atau lebih baik dari manusia sebesar 40,6%, sedangkan model Claude Opus 4.1 mencapai 49%. Namun, GDPval saat ini hanya mengevaluasi bagian tertentu dari pekerjaan seperti membuat laporan riset, bukan seluruh kompleksitas tugas harian para profesional.
OpenAI mengakui batasan ini dan berencana mengembangkan GDPval agar mampu menguji cakupan pekerjaan yang lebih luas dan proses kerja yang lebih interaktif di masa depan, sehingga pengukuran kemajuan AI menjadi lebih menyeluruh dan relevan dengan dunia nyata.
Para ekonom dan analis OpenAI optimis bahwa AI dapat membantu para pekerja untuk menghemat waktu pada tugas rutin dan fokus pada pekerjaan yang lebih bernilai. Ini menandakan bahwa seiring waktu, AI bisa menjadi alat penting yang memperkuat produktivitas manusia di dunia kerja.
Referensi:
[1] https://techcrunch.com/2025/09/25/openai-says-gpt-5-stacks-up-to-humans-in-a-wide-range-of-jobs/
[1] https://techcrunch.com/2025/09/25/openai-says-gpt-5-stacks-up-to-humans-in-a-wide-range-of-jobs/
Analisis Ahli
Dr. Aaron Chatterji
"Dengan model AI yang semakin baik, pekerja dapat mengalihdayakan tugas-tugas rutin ke AI sehingga dapat berfokus pada tugas yang lebih bernilai dan bermakna."
Tejal Patwardhan
"Kecepatan peningkatan performa AI dari GPT-4o ke GPT-5 menunjukkan tren kuat bahwa kemampuan AI akan terus meningkat dalam waktu dekat."
Analisis Kami
"GDPval merupakan langkah penting untuk mentransisikan pengukuran kemampuan AI dari soal-soal akademis ke tugas dunia nyata yang relevan secara ekonomi. Namun, karena cakupan awal sangat terbatas, hasil yang ada masih sangat jauh dari menggantikan manusia secara utuh di banyak profesi yang kompleks dan interaktif."
Prediksi Kami
Di masa depan, AI kemungkinan akan semakin mampu mengerjakan beragam tugas profesional secara efisien, sehingga banyak pekerja dapat menggunakan AI untuk mengurangi beban kerja rutin dan fokus pada pekerjaan bernilai lebih tinggi.
Pertanyaan Terkait
Q
Apa itu GDPval?A
GDPval adalah benchmark yang menguji kemampuan model AI dibandingkan dengan profesional di berbagai industri.Q
Siapa yang mengembangkan model GPT-5?A
Model GPT-5 dikembangkan oleh OpenAI.Q
Bagaimana performa GPT-5 dibandingkan dengan profesional industri?A
GPT-5 dinilai lebih baik atau sebanding dengan profesional industri 40,6% dari waktu.Q
Apa yang diharapkan OpenAI dari pengujian GDPval di masa depan?A
OpenAI berharap untuk membuat pengujian yang lebih komprehensif untuk mengukur kemampuan AI di lebih banyak industri dan alur kerja interaktif.Q
Mengapa penting untuk memiliki benchmark seperti GDPval?A
Benchmark seperti GDPval penting untuk menilai kemajuan model AI dalam tugas-tugas dunia nyata.