Logo id.boatexistence.com

Apa kekurangan dari memasukkan nilai yang hilang dengan mean?

Daftar Isi:

Apa kekurangan dari memasukkan nilai yang hilang dengan mean?
Apa kekurangan dari memasukkan nilai yang hilang dengan mean?

Video: Apa kekurangan dari memasukkan nilai yang hilang dengan mean?

Video: Apa kekurangan dari memasukkan nilai yang hilang dengan mean?
Video: Mengatasi Data Hilang (missing value) Dengan SPSS 2024, Mungkin
Anonim

Imputasi rata-rata distorsi hubungan antar variabel Tetapi imputasi rata-rata juga mendistorsi hubungan multivariat dan memengaruhi statistik seperti korelasi. Misalnya, panggilan berikut ke PROC CORR menghitung korelasi antara variabel Orig_Height dan variabel Weight and Age.

Mengapa menggunakan mean untuk data yang hilang adalah ide yang buruk?

Mean mengurangi varians data Mendalami matematika, varians yang lebih kecil menyebabkan interval kepercayaan yang lebih sempit dalam distribusi probabilitas[3]. Ini tidak mengarah pada apa pun selain memperkenalkan bias pada model kami.

Mengapa nilai yang hilang menjadi masalah?

Data yang hilang menghadirkan berbagai masalah. Pertama, tidak adanya data mengurangi kekuatan statistik, yang mengacu pada probabilitas bahwa tes akan menolak hipotesis nol ketika hipotesis itu salah. Kedua, data yang hilang dapat menyebabkan bias dalam pendugaan parameter. Ketiga, dapat mengurangi keterwakilan sampel.

Mengapa imputasi rata-rata buruk?

Masalah 1: Berarti imputasi tidak mempertahankan hubungan antar variabel. Benar, memasukkan mean mempertahankan mean dari data yang diamati. Jadi jika data hilang seluruhnya secara acak, estimasi mean tetap tidak bias.

Haruskah Anda mengganti data yang hilang dengan mean?

Titik data outlier akan berdampak signifikan pada mean dan karenanya, dalam kasus seperti itu, tidak disarankan untuk menggunakan mean untuk mengganti nilai yang hilang. Menggunakan nilai rata-rata untuk mengganti nilai yang hilang mungkin tidak membuat model yang bagus dan karenanya dikesampingkan.

Direkomendasikan: