Sumber Outlier Outlier Dalam Regresi: Sumber, Jenis dan Deteksi Outlier

11

2.2 Outlier Dalam Regresi: Sumber, Jenis dan Deteksi Outlier

2.2.1 Sumber Outlier

Outlier adalah satu atau lebih data yang tidak biasa, yang tidak cocok dari sebagian data lainnya one or more atypical data points that do not fit with the rest of the data. Outlier mungkin disebabkan karena dalam melakukan observasi melakukan beberapa kesalahan, hal ini yang biasa disebut observasi terkontaminasi, juga bisa outlier merepresentasikan observasi yang akurat dari kasus yang jarang. Apapun sumber outlier, dalam beberapa kasus menyebabkan dampak yang sangat besar dalam mengestimasi koefisien regresi , standar error, dan estimasi keseluruhan variabel prediktor, 2 R .[2] Outlier muncul karena data terkontaminasi dalam beberapa cara. Observasi yang terkontaminasi dapat dan harus diminimalisir dengan prosedur penelitian dan pengolahan data yang hati-hati. Observasi yang terkontaminasi disebabkan [2]: 1. Kesalahan pelaksanaan prosedur penelitian; misalnya: interviewer salah baca dalam beberapa pertanyaan, atau eksperimenter melakukan yang salah atau perlakuan yang kurang sempurna. 2. Ketidakakuratan dalam pengukuran variabel dependen; misalnya peralatan mengalami kerusakan sehingga pengukuran variabel dependen tidak akurat. 3. Kesalahan penulisan atau pengetikan data. 4. Kesalahan perhitungan dari pengukuran; mislnya peneliti kurang tepat menghitung sejumlah variabel independen atau membuat kesalahan dalam perhitungan dari ukuran 12 5. Partisipan yang kurang perhatian. Misal dala kasus tertentu, partisipan sedang dalam keadaan lelah, sakit atau mabuk, dan tidak mampu merespon dengan baik terhadap materi percobaan. Tiap statistik diagnostik yang akan dibahas nanti, secara potensial dapat menolong dalam pendeketsian data yang terkontaminasi. Ketika peneliti mendeteksi outlier, perlakuan pertamanya adalah melihat kemungkinan bahwa outlier merupakan data yang terkontaminasi. Data dan perhitungan harus diperiksa keakurasiannya. Jika dapat diverifikasi bahwa outlier merupakan data yang terkontaminasi, maka data tersebut tidak harus dimasukkan dalam penganalisisan data. Jika memungkinkan, peneliti bisa mengganti data yang terkontaminasi ini dengan data yang benar dari kasus yang ditelitinya, atau menghapusnya dari himpunan data yang diteliti. Untuk kasus yang lain, outlier dapat juga merepresentasikan data yang valid, tidak terkontaminasi, akan tetapi outlier tersebut merupakan kasus yang jarang dalam populasi. Ketika outlier yang dideteksi bukan data yang terkontaminasi, maka outlier dapat diperlakukan dengan dua penekanan dalam mengatasi outlier. Pertama, mengeliminasi pengaruh dari kasus jarang tersebut. Kedua, outlier mungkin merepresentasikan signal yang halus dari suatu fenomena yang sangat penting atau ketidak-tepatan dari penentuan model regresi yang telah diujikan, dan penelitian berusaha untuk memahami kasus yang jarang ini sebagai sesuatu yang membawa ke bentuk yang sangat penting dalam penelitian ilmiah. 13

2.2.2 Jenis Outlier