61
Proses analisis regresi robust dimulai dengan regresi kuadrat terkecil terlebih dahulu, kemudian pengidentifikasian outlier dan selanjutnya dengan
metode regresi robust estimasi-M dan estimasi-MM. Pengolahan data komputasi yang digunakan sebagai alat bantu adalah program SPSS 16 dan SAS 9.
4.2.1 Metode Kuadrat Terkecil
Analisis dimulai dengan menganalisis regresi biasa menggunakan metode kuadrat terkecil. Berdasarkan hasil output tabel 4.1, diperoleh model regresi antara
variabel independen dan variabel dependen data produksi padi di Jawa Tengah tahun 2007 sebagai berikut
2 1
18646 ,
298 10703
, 61685
, 41
ˆ X
X Y
i
+ +
− =
dengan =
i
Yˆ produksi padi ton
=
1
X luas panen hektar
=
2
X jumlah penduduk juta jiwa
Model regresi tersebut mempunyai nilai
2
R sebesar 0,5332 = 53,32. Tahapan selanjutnya adalah melakukan pendeteksian outlier untuk mengetahui
ada atau tidaknya outlier dalam data observasi.
4.2.2 Pendeteksian Outlier
Suatu data diduga dan dinyatakan sebagai suatu outlier dapat dilakukan dengan berbagai macam metode. Beberapa metode diantaranya sebagai berikut.
62
4.2.2.1 Metode Boxplot Metode boxplot dapat disajikan dalam bentuk perhitungan manual maupun
dengan bantuan komputer. Hasil Boxplot dengan program SPSS dapat dilihat pada gambar 4.1. Boxplot dengan perhitungan manual dapat dilihat pada tabel 4.2.
Dengan metode boxplot, suatu data dikatakan outlier jika nilai data pengamatan lebih kecil dari Q1-1,5IQR atau lebih besar dari Q3+1,5IQR.
Berdasarkan tabel 4.2, terlihat bahwa pada variabel X
1
luas panen terdapat data outlier
, yaitu pada data ke-30 484127,799 dan data ke-31347127,799. Boxplot
yang disajikan dengan bantuan program SPSS 16 terlihat sebagai berikut
Gambar 4.1 Boxplot untuk ketiga variabel. Dari ketiga tampilan boxplot di atas dapat terlihat bahwa data ke-30 dan 31
merupakan data outlier.
63
4.2.2.2 Metode Leverage Value Untuk menentukan ada atau tidaknya outlier, dapat dilihat dari nilai
leverage berikut ini. Nilai-nilai dari leverage yang melebihi nilai dari titik potong cut off point yaitu
n p
1 2
−
dapat di indikasikan sebagai outlier. Hasil diagnosis metode leverage terhadap data itu sebagaimana dapat
ditampilkan pada tabel 4.3, dengan p adalah banyaknya parameter dan n adalah banyaknya data diperoleh nilai
2p-1n
=
535= 0,1429 .
Berdasarkan hasil perhitungan, diperoleh bahwa data ke-30 dan 31 diduga sebagai outlier karena memiliki nilai Leverage0,1429. Nilai leverage
30
= 0,63695, nilai leverage
31
= 0,27254. 4.2.2.3 Metode Cook’s distance
Hasil diagnosis metode cook’s distance pada tiap observasi terhadap data juga dapat dilihat pada tabel 4.4 maupun gambar 4.2. Suatu observasi diduga
sebagai outlier apabila nilai Cook’s distance4n, dengan n adalah banyaknya data.
Berdasarkan hasil yang diperoleh pada tabel 4.4 , nilai Cook’s distance pada data ke- 1, 30, 31 dan 33 diduga sebagai outlier karena memiliki nilai Cook’s
distance yang lebih besar dari nilai 4n = 0,11429.
64
Index C
ooks D istance
10 20
30 0.0
0.1 0.2
0.3 33
30 31
Gambar 4.2 Hasil Plot Nilai Cook’s distance
4.2.2.4 Standardized residual Hasil diagnosis dengan standarisasi dalam nilai Z atau yang biasa disebut
Z-skore pada tiap observasi terhadap data juga dapat dilihat pada tabel 4.5 Untuk
melakukan identifikasi outlier, diperhatikan nilai-nilai dari standardized residual. Jika nilai dari standardized residual memiliki nilai yang lebih dari 3,5 atau kurang
dari -3,5 maka data tersebut dikatakan sebagai data outlier. Berdasarkan hasil pada tabel 4.5, diperoleh bahwa data ke-30 pada
variabel X
1
luas panen diduga sebagai outlier karena memiliki nilai z
30
= 4,49740 3,5.
Dari hasil pengidentifikasian outlier dengan keempat metode di atas, diperoleh hasil yang tidak sama. Berbagai cara perhitungan yang ditawarkan
diatas guna memberikan gambaran peneliti dalam mendeteksi outlier. Oleh karena itu, tergantung dari peneliti dalam memilih metode yang sesuai dengan kajian
65
penelitian atau hal yang mendukung penelitian. Jadi dalam data luas produksi padi terdapat beberapa outlier.
Adanya outlier dalam data observasi mengakibatkan hasil estimasi koefisien garis regresi dengan metode kuadrat terkecil tidak tepat. Apabila tidak
terdapat outlier maka hasil estimasi yang diperoleh dengan metode kuadrat terkecil tepat. Oleh karena itu, penulis menghilangkan outlier dari data observasi,
kemudian menganalisis data tanpa outlier tersebut dengan metode kuadrat terkecil. Hal tersebut penulis lakukan untuk menilai berpengaruh atau tidaknya
outlier dalam OLS. Dalam contoh kasus ini, penulis membuang data outlier
observasi ke- ke- 1,30,31 dan 33, kemudian menganalisis data tanpa outlier dengan metode kuadrat terkecil.
Berdasarkan hasil output tabel 4.6, diperoleh model regresi sebagai berikut
2 1
42425 ,
6 50022
, 5
53173 ,
2 ˆ
X X
Y
i
− +
+ −
= .
Hasil estimasi model regresi tersebut diperoleh dengan OLS tanpa pengikutsertaan outlier. Pembuangan outlier dalam data pengamatan, ternyata
dapat mengecilkan standar error yang diperoleh dengan OLS dengan data yang terdapat outlier. Hal ini berarti outlier sangat berpengaruh terhadap OLS karena
dapat memperbesar standar error yang dihasilkan. Langkah untuk membuang outlier
tersebut dari data pengamatan peneliti lakukan untuk menilai berpengaruh tidaknya outlier terhadap OLS. Di satu sisi membuang outlier dapat mengecilkan
standar error. Akan tetapi di sisi lain pengikutsertaan outlier dapat memperbesar standar error. Pengikutsertaan atau penyisihan outlier bukan masalah sederhana,
tetapi butuh pertimbangan yang sangat hati-hati. Outlier dapat dibuang apabila
66
setelah ditelusuri data outlier tersebut bukan bagian representatif dari data pengamatan data outlier diperoleh dari kesalahan teknis peneliti dalam mencatat
data. Namun secara statistik, membuang outlier bukanlah tindakan yang bijaksana, karena suatu outlier dapat memberikan informasi yang cukup berarti.
Oleh karena itu, diperlukan suatu alternatif terhadap keberadaan outlier, yaitu dengan regresi robust.
Analisis regresi robust memberikan solusi terhadap keberadaan outlier, dengan tetap memasukan outlier pada data dan menghasilkan model estimasi yang
resisten terhadap pengaruh outlier. Secara statistik, apabila standar error yang dihasilkan regresi robust dapat mengecilkan standar error yang dihasilkan dengan
OLS yang terdapat outlier, maka dapat disimpulkan regresi robust dapat menghasilkan model yang resisten terhadap pengaruh outlier. Alternatif lain juga
dapat dilihat dari membandingkan standar error OLS tanpa outlier dengan regresi robust. Jika hasil estimasi atau standar error yang dihasilkan metode kuadrat
terkecil tanpa outlier dengan regresi robust dengan adanya outlier hampir sama, maka dapat dikatakan hasil estimasi regresi robust sama baiknya dengan OLS
ketika tanpa outlier. Sehingga regresi robust dapat mengatasi kelemahan OLS yang sangat peka terhadap kehadiran outlier. Disini peneliti menggunakan dua
metode dalam regresi robust, yaitu metode estimasi-M dan metode estimasi-MM.
4.2.3 Regresi Robust Estimasi-M