11
2.2 Outlier Dalam Regresi: Sumber, Jenis dan Deteksi Outlier
2.2.1 Sumber Outlier
Outlier adalah satu atau lebih data yang tidak biasa, yang tidak cocok dari sebagian data lainnya one or more atypical data points that do not fit with the
rest of the data. Outlier mungkin disebabkan karena dalam melakukan observasi melakukan beberapa kesalahan, hal ini yang biasa disebut observasi
terkontaminasi, juga bisa outlier merepresentasikan observasi yang akurat dari kasus yang jarang. Apapun sumber outlier, dalam beberapa kasus menyebabkan
dampak yang sangat besar dalam mengestimasi koefisien regresi , standar error, dan estimasi keseluruhan variabel prediktor,
2
R .[2] Outlier muncul karena data terkontaminasi dalam beberapa cara.
Observasi yang terkontaminasi dapat dan harus diminimalisir dengan prosedur penelitian dan pengolahan data yang hati-hati. Observasi yang terkontaminasi
disebabkan [2]: 1. Kesalahan pelaksanaan prosedur penelitian; misalnya: interviewer salah baca
dalam beberapa pertanyaan, atau eksperimenter melakukan yang salah atau perlakuan yang kurang sempurna.
2. Ketidakakuratan dalam pengukuran variabel dependen; misalnya peralatan mengalami kerusakan sehingga pengukuran variabel dependen tidak akurat.
3. Kesalahan penulisan atau pengetikan data. 4. Kesalahan perhitungan dari pengukuran; mislnya peneliti kurang tepat
menghitung sejumlah variabel independen atau membuat kesalahan dalam perhitungan dari ukuran
12 5. Partisipan yang kurang perhatian. Misal dala kasus tertentu, partisipan sedang
dalam keadaan lelah, sakit atau mabuk, dan tidak mampu merespon dengan baik terhadap materi percobaan.
Tiap statistik diagnostik yang akan dibahas nanti, secara potensial dapat menolong dalam pendeketsian data yang terkontaminasi. Ketika peneliti
mendeteksi outlier, perlakuan pertamanya adalah melihat kemungkinan bahwa outlier merupakan data yang terkontaminasi. Data dan perhitungan harus
diperiksa keakurasiannya. Jika dapat diverifikasi bahwa outlier merupakan data yang terkontaminasi, maka data tersebut tidak harus dimasukkan dalam
penganalisisan data. Jika memungkinkan, peneliti bisa mengganti data yang terkontaminasi ini dengan data yang benar dari kasus yang ditelitinya, atau
menghapusnya dari himpunan data yang diteliti. Untuk kasus yang lain, outlier dapat juga merepresentasikan data yang
valid, tidak terkontaminasi, akan tetapi outlier tersebut merupakan kasus yang jarang dalam populasi. Ketika outlier yang dideteksi bukan data yang
terkontaminasi, maka outlier dapat diperlakukan dengan dua penekanan dalam mengatasi outlier. Pertama, mengeliminasi pengaruh dari kasus jarang tersebut.
Kedua, outlier mungkin merepresentasikan signal yang halus dari suatu fenomena yang sangat penting atau ketidak-tepatan dari penentuan model regresi yang telah
diujikan, dan penelitian berusaha untuk memahami kasus yang jarang ini sebagai sesuatu yang membawa ke bentuk yang sangat penting dalam penelitian ilmiah.
13
2.2.2 Jenis Outlier