Courtesy of QuantaMagazine
Data sering kali tidak lengkap, seperti ketika pasien berhenti mengikuti uji klinis atau responden survei melewatkan pertanyaan. Ketika data hilang, metode statistik standar seperti menghitung rata-rata tidak lagi berguna. Misalnya, jika dalam sebuah studi obat tekanan darah, beberapa pasien tidak datang lagi, mengabaikan mereka akan membuat hasil penelitian terlihat lebih baik dari yang sebenarnya. Donald Rubin, seorang ahli statistik, mengembangkan metode yang disebut "multiple imputation" pada tahun 1970-an untuk mengatasi masalah ini. Metode ini melibatkan membuat beberapa salinan data dan mengisi data yang hilang dengan berbagai tebakan, sehingga mencerminkan ketidakpastian dari setiap tebakan.
Metode multiple imputation menjadi populer karena dapat digunakan di banyak bidang, termasuk penelitian medis dan analisis data. Dengan kemajuan teknologi komputer, metode ini kini lebih mudah diakses oleh peneliti. Meskipun ada metode lain, multiple imputation tetap menjadi pilihan utama karena fleksibilitas dan ketepatannya. Metode ini membantu peneliti untuk tetap jujur tentang apa yang mereka ketahui, baik saat menguji obat baru maupun menganalisis pola pemungutan suara.