Metode Kuadrat Terkecil Pendeteksian Outlier

61 Proses analisis regresi robust dimulai dengan regresi kuadrat terkecil terlebih dahulu, kemudian pengidentifikasian outlier dan selanjutnya dengan metode regresi robust estimasi-M dan estimasi-MM. Pengolahan data komputasi yang digunakan sebagai alat bantu adalah program SPSS 16 dan SAS 9.

4.2.1 Metode Kuadrat Terkecil

Analisis dimulai dengan menganalisis regresi biasa menggunakan metode kuadrat terkecil. Berdasarkan hasil output tabel 4.1, diperoleh model regresi antara variabel independen dan variabel dependen data produksi padi di Jawa Tengah tahun 2007 sebagai berikut 2 1 18646 , 298 10703 , 61685 , 41 ˆ X X Y i + + − = dengan = i Yˆ produksi padi ton = 1 X luas panen hektar = 2 X jumlah penduduk juta jiwa Model regresi tersebut mempunyai nilai 2 R sebesar 0,5332 = 53,32. Tahapan selanjutnya adalah melakukan pendeteksian outlier untuk mengetahui ada atau tidaknya outlier dalam data observasi.

4.2.2 Pendeteksian Outlier

Suatu data diduga dan dinyatakan sebagai suatu outlier dapat dilakukan dengan berbagai macam metode. Beberapa metode diantaranya sebagai berikut. 62 4.2.2.1 Metode Boxplot Metode boxplot dapat disajikan dalam bentuk perhitungan manual maupun dengan bantuan komputer. Hasil Boxplot dengan program SPSS dapat dilihat pada gambar 4.1. Boxplot dengan perhitungan manual dapat dilihat pada tabel 4.2. Dengan metode boxplot, suatu data dikatakan outlier jika nilai data pengamatan lebih kecil dari Q1-1,5IQR atau lebih besar dari Q3+1,5IQR. Berdasarkan tabel 4.2, terlihat bahwa pada variabel X 1 luas panen terdapat data outlier , yaitu pada data ke-30 484127,799 dan data ke-31347127,799. Boxplot yang disajikan dengan bantuan program SPSS 16 terlihat sebagai berikut Gambar 4.1 Boxplot untuk ketiga variabel. Dari ketiga tampilan boxplot di atas dapat terlihat bahwa data ke-30 dan 31 merupakan data outlier. 63 4.2.2.2 Metode Leverage Value Untuk menentukan ada atau tidaknya outlier, dapat dilihat dari nilai leverage berikut ini. Nilai-nilai dari leverage yang melebihi nilai dari titik potong cut off point yaitu n p 1 2 − dapat di indikasikan sebagai outlier. Hasil diagnosis metode leverage terhadap data itu sebagaimana dapat ditampilkan pada tabel 4.3, dengan p adalah banyaknya parameter dan n adalah banyaknya data diperoleh nilai 2p-1n = 535= 0,1429 . Berdasarkan hasil perhitungan, diperoleh bahwa data ke-30 dan 31 diduga sebagai outlier karena memiliki nilai Leverage0,1429. Nilai leverage 30 = 0,63695, nilai leverage 31 = 0,27254. 4.2.2.3 Metode Cook’s distance Hasil diagnosis metode cook’s distance pada tiap observasi terhadap data juga dapat dilihat pada tabel 4.4 maupun gambar 4.2. Suatu observasi diduga sebagai outlier apabila nilai Cook’s distance4n, dengan n adalah banyaknya data. Berdasarkan hasil yang diperoleh pada tabel 4.4 , nilai Cook’s distance pada data ke- 1, 30, 31 dan 33 diduga sebagai outlier karena memiliki nilai Cook’s distance yang lebih besar dari nilai 4n = 0,11429. 64 Index C ooks D istance 10 20 30 0.0 0.1 0.2 0.3 33 30 31 Gambar 4.2 Hasil Plot Nilai Cook’s distance 4.2.2.4 Standardized residual Hasil diagnosis dengan standarisasi dalam nilai Z atau yang biasa disebut Z-skore pada tiap observasi terhadap data juga dapat dilihat pada tabel 4.5 Untuk melakukan identifikasi outlier, diperhatikan nilai-nilai dari standardized residual. Jika nilai dari standardized residual memiliki nilai yang lebih dari 3,5 atau kurang dari -3,5 maka data tersebut dikatakan sebagai data outlier. Berdasarkan hasil pada tabel 4.5, diperoleh bahwa data ke-30 pada variabel X 1 luas panen diduga sebagai outlier karena memiliki nilai z 30 = 4,49740 3,5. Dari hasil pengidentifikasian outlier dengan keempat metode di atas, diperoleh hasil yang tidak sama. Berbagai cara perhitungan yang ditawarkan diatas guna memberikan gambaran peneliti dalam mendeteksi outlier. Oleh karena itu, tergantung dari peneliti dalam memilih metode yang sesuai dengan kajian 65 penelitian atau hal yang mendukung penelitian. Jadi dalam data luas produksi padi terdapat beberapa outlier. Adanya outlier dalam data observasi mengakibatkan hasil estimasi koefisien garis regresi dengan metode kuadrat terkecil tidak tepat. Apabila tidak terdapat outlier maka hasil estimasi yang diperoleh dengan metode kuadrat terkecil tepat. Oleh karena itu, penulis menghilangkan outlier dari data observasi, kemudian menganalisis data tanpa outlier tersebut dengan metode kuadrat terkecil. Hal tersebut penulis lakukan untuk menilai berpengaruh atau tidaknya outlier dalam OLS. Dalam contoh kasus ini, penulis membuang data outlier observasi ke- ke- 1,30,31 dan 33, kemudian menganalisis data tanpa outlier dengan metode kuadrat terkecil. Berdasarkan hasil output tabel 4.6, diperoleh model regresi sebagai berikut 2 1 42425 , 6 50022 , 5 53173 , 2 ˆ X X Y i − + + − = . Hasil estimasi model regresi tersebut diperoleh dengan OLS tanpa pengikutsertaan outlier. Pembuangan outlier dalam data pengamatan, ternyata dapat mengecilkan standar error yang diperoleh dengan OLS dengan data yang terdapat outlier. Hal ini berarti outlier sangat berpengaruh terhadap OLS karena dapat memperbesar standar error yang dihasilkan. Langkah untuk membuang outlier tersebut dari data pengamatan peneliti lakukan untuk menilai berpengaruh tidaknya outlier terhadap OLS. Di satu sisi membuang outlier dapat mengecilkan standar error. Akan tetapi di sisi lain pengikutsertaan outlier dapat memperbesar standar error. Pengikutsertaan atau penyisihan outlier bukan masalah sederhana, tetapi butuh pertimbangan yang sangat hati-hati. Outlier dapat dibuang apabila 66 setelah ditelusuri data outlier tersebut bukan bagian representatif dari data pengamatan data outlier diperoleh dari kesalahan teknis peneliti dalam mencatat data. Namun secara statistik, membuang outlier bukanlah tindakan yang bijaksana, karena suatu outlier dapat memberikan informasi yang cukup berarti. Oleh karena itu, diperlukan suatu alternatif terhadap keberadaan outlier, yaitu dengan regresi robust. Analisis regresi robust memberikan solusi terhadap keberadaan outlier, dengan tetap memasukan outlier pada data dan menghasilkan model estimasi yang resisten terhadap pengaruh outlier. Secara statistik, apabila standar error yang dihasilkan regresi robust dapat mengecilkan standar error yang dihasilkan dengan OLS yang terdapat outlier, maka dapat disimpulkan regresi robust dapat menghasilkan model yang resisten terhadap pengaruh outlier. Alternatif lain juga dapat dilihat dari membandingkan standar error OLS tanpa outlier dengan regresi robust. Jika hasil estimasi atau standar error yang dihasilkan metode kuadrat terkecil tanpa outlier dengan regresi robust dengan adanya outlier hampir sama, maka dapat dikatakan hasil estimasi regresi robust sama baiknya dengan OLS ketika tanpa outlier. Sehingga regresi robust dapat mengatasi kelemahan OLS yang sangat peka terhadap kehadiran outlier. Disini peneliti menggunakan dua metode dalam regresi robust, yaitu metode estimasi-M dan metode estimasi-MM.

4.2.3 Regresi Robust Estimasi-M