Courtesy of NatureMagazine
Bahaya Studi Kesehatan Formulaik dari Data Terbuka dan AI yang Semakin Marak
Mengungkapkan masalah meningkatnya jumlah publikasi ilmiah yang formulaik dan berpotensi menyesatkan yang menggunakan data NHANES yang diproses dengan AI tanpa transparansi, sehingga memerlukan evaluasi untuk memetakan besarnya permasalahan ini.
21 Mei 2025, 07.00 WIB
84 dibaca
Share
Ikhtisar 15 Detik
- Ada peningkatan tajam dalam jumlah penelitian berbasis data NHANES, namun banyak yang memiliki metodologi yang lemah.
- Banyak publikasi ilmiah yang tampak formulaik dan berpotensi menyesatkan pembaca.
- Penting untuk melakukan evaluasi sistematis terhadap penelitian untuk memastikan validitas dan keakuratan klaim kesehatan.
Guildford, Inggris - Ada peningkatan besar jumlah publikasi ilmiah yang menggunakan data kesehatan terbuka dari NHANES di AS. Data ini mudah diolah menggunakan alat kecerdasan buatan, yang mendorong para peneliti membuat studi dengan pola yang sangat mirip dan sederhana.
Masalahnya adalah banyak penelitian hanya mengaitkan satu faktor, seperti kadar vitamin D atau kualitas tidur, dengan penyakit kompleks seperti depresi atau penyakit jantung. Mereka mengabaikan fakta bahwa penyakit tersebut punya banyak faktor penyebab.
Para peneliti menemukan bahwa beberapa studi ini juga melakukan cherry-picking data, yaitu memilih data yang hanya mendukung hasil yang diinginkan sementara data lain diabaikan. Ini membuat hasil studi menjadi kurang dapat dipercaya secara statistik.
Para ahli menduga bahwa sebagian studi ini bahkan mungkin dibuat dengan bantuan teknologi AI seperti large language models, yang membantu mempercepat pembuatan studi formulaik tanpa analisis mendalam.
Karena potensi kerugian akibat informasi kesehatan yang menyesatkan ini, para ilmuwan menyerukan pentingnya evaluasi sistematis agar dapat menilai dan mengatasi masalah tersebut dalam publikasi kesehatan.
--------------------
Analisis Kami: Ketersediaan data terbuka memang membuka peluang besar untuk penelitian inovatif, tapi tanpa standar ketat dan transparansi penggunaan AI, hasilnya bisa menjadi spam ilmiah yang justru merugikan. Perlu ada aturan dan pengawasan lebih ketat agar teknologi AI menjadi alat yang memberdayakan bukan malah merusak kualitas penelitian medis.
--------------------
Analisis Ahli:
Matt Spick: Perlu adanya kewaspadaan terhadap ledakan publikasi yang sangat formulaik dan kemungkinan besar dihasilkan oleh model bahasa besar (large language models).
Charlie Harrison: Metode 'cherry-picking' data seperti menjawab ujian dengan membuang soal yang salah bisa menyesatkan hasil penelitian.
Ioana Alina Cristea: Kebutuhan akan evaluasi sistematis untuk mengukur seberapa parah masalah kualitas studi berbasis data terbuka dan AI.
--------------------
What's Next: Volume besar studi kesehatan dengan metode serupa dan validitas rendah akan terus meningkat bila tidak ada regulasi dan pemeriksaan yang ketat terhadap penggunaan AI dan analisis data terbuka, sehingga dapat merusak kepercayaan publik serta efektivitas kebijakan kesehatan berbasis bukti.
Referensi:
[1] https://nature.com/articles/d41586-025-01592-0
[1] https://nature.com/articles/d41586-025-01592-0
Pertanyaan Terkait
Q
Apa yang menjadi fokus utama penelitian yang dipublikasikan di PLoS Biology?A
Fokus utama penelitian adalah masalah publikasi ilmiah yang membuat klaim kesehatan menyesatkan berdasarkan data terbuka seperti NHANES.Q
Mengapa data NHANES menarik perhatian peneliti akhir-akhir ini?A
Data NHANES menarik perhatian karena tersedia secara publik dan mudah diolah menggunakan alat AI untuk analisis.Q
Apa yang ditemukan peneliti tentang kualitas publikasi berbasis data NHANES?A
Peneliti menemukan bahwa banyak publikasi tidak memenuhi standar statistik dan beberapa tampak memilih data secara sembarangan.Q
Siapa saja peneliti yang terlibat dalam studi ini?A
Peneliti yang terlibat termasuk Matt Spick, Charlie Harrison, dan Ioana Alina Cristea.Q
Apa yang diharapkan dari evaluasi sistematis terhadap penelitian ini?A
Diharapkan evaluasi sistematis dapat memberikan gambaran yang jelas tentang sejauh mana masalah ini terjadi dalam publikasi ilmiah.