Dampak Imputasi Terhadap Error Klasifikasi Pada Analisis Diskriminan.

ABSTRAK

Judul Tesis

: Dampak Imputasi Terhadap Error Klasifikasi Pada Analisis
Diskriminan

Kata Kunci

: 1. Data Hilang
2. Metode Imputasi Regresi
3. Metode Imputasi Predictive Mean Matching
4. Analisis Diskriminan
5. Error Klasifikasi

Abstrak

Suatu penelitian yang menggunakan metode survei sangat jarang sekali akan
didapatkan data yang terbebas dari data hilang. Adanya data hilang akibat nonrespon
akan menimbulkan data hasil survei menjadi tidak lengkap yang akan menyebabkan
hilangnya informasi dan penaksiran parameter menjadi tidak efisien. Untuk mengatasi

data hilang dapat dilakukan dengan menggunakan analisis statistika yaitu dengan
menggunakan metode imputasi. Beberapa metode imputasi untuk mengatasi data
hilang antara lain Metode Imputasi Regresi dan Metode Predictive Mean Matching
(PMM) yang merupakan metode imputasi berganda. Pada penelitian ini kedua metode
tersebut diuji melalui simulasi dan diterapkan pada data klasifikasi jantung kemudian
hasilnya diperbandingkan. Penaksiran data hilang dengan metode imputasi PMM
memberikan hasil penaksiran yang lebih beragam daripada metode imputasi regresi.
Hal ini terlihat dimana secara umum nilai rata-rata koefisien varians dari metode
imputasi PMM lebih besar daripada metode imputasi regresi. Pada analisis
diskriminan, hasil penaksiran data hilang memberikan perubahan terhadap error
klasifikasi jika dibandingkan dengan data lengkap sebenarnya. Penaksiran dengan
metode imputasi PMM memberikan dampak menurunkan error klasifikasi lebih besar
daripada metode imputasi regresi.

v

Abstract

A research w using survey method is very rarely that the data would be obtained free
of missing data. The missing data will lead to a result nonrespon survey data to be

incomplete which will result in the loss of information and parameter estimation
becomes inefficient. To overcome the missing data can be done using statistical
analysis is by using the imputation method. Several methods of imputation to
overcome missing data include Imputed Regression Methods and Predictive Mean
Matching Method (PMM) which is a multiple imputation method. In this study, these
methods are tested through simulations and applied to the data classification of the
heart, then the results compared. Estimation of missing data imputation method PMM
provides the results of the assessment is more diverse than regression imputation
method. This can be seen where in general the average value of the coefficient of
variance of the imputation method PMM greater than regression imputation method.
In discriminant analysis, missing data estimation results provide the changes to the
classification error when compared with actual complete data. Estimating PMM
imputation method gives lower the impact of classification error is greater than
regression imputation method.

vi