10
2.4.3 Pendeteksian Pencilan
Menurut Soemartini 2007 beberapa metode dan nilai yang dapat digunakan untuk mendeteksi ada atau tidak adanya pencilan ialah sebagai berikut:
1. Metode Grafik
Metode grafik merupakan salah satu cara pendeteksian pencilan yang mudah dipahami karena menampilkan data secara grafis gambar tanpa melibatkan
perhitungan yang rumit. Namun, kelemahan metode ini yaitu yang menentukan data tersebut sebagai pencilan atau tidak tergantung pada kebijakan
judgement peneliti, karena metode ini hanya mengandalkan visualisasi gambar. Pendeteksian pencilan dengan metode grafik di antaranya ialah:
a. Diagram Pencar Scatter Plot Metode ini dilakukan dengan cara memplot data dengan observasi ke-
� � = 1, 2, …,
�. Selain itu, setelah diperoleh model regresi maka dapat dilakukan dengan cara memplot antara residual
� dengan nilai prediksi Y ��. Jika terdapat satu atau beberapa data yang terletak jauh dari pola kumpulan data
keseluruhan maka hal ini mengindikasikan adanya pencilan.
b. Boxplot Metode boxplot merupakan metode yang paling umum yaitu dengan
menggunakan nilai kuartil dan jangkauan. Jangkauan IQR, Interquartile Range didefinisikan sebagai selisih kuartil 1 terhadap kuartil 3, atau IQR =
�
�
− �
�
. Pendeteksian pencilan dapat ditentukan jika nilai yang kurang dari 1,5IQR terhadap kuartil 1 dan nilai yang lebih dari 1,5IQR terhadap kuartil
3.
11
Gambar 2.1 Skema Identifikasi Data Pencilan dengan IQR atau Box Plot
2. Leverage Values, DFFITS, Cook’s Distance, dan DfBETAs
Cara mendeteksi pencilan dapat juga dengan menentukan nilai Leverage, DFFITS, Cook’s Distance, dan DfBETAs. Definisi dari masing-masing nilai
tersebut ialah sebagai berikut: a. Leverage Values; menampilkan nilai leverage pengaruh terpusat.
b. DFFITS atau Standardized DfFIT; menampilkan nilai perubahan dalam harga yang diprediksi bilamana case tertentu dikeluarkan dan sudah
distandarkan. c. Cook’s Distance; menampilkan nilai jarak Cook.
d. DfBETAs; menampilkan nilai perubahan koefisien regresi sebagai hasil perubahan yang disebabkan oleh pengeluaran case tertentu. Digunakan
untuk mendeteksi pencilan pada variabel bebas.
12
Ketentuan dalam pendeteksian pencilan dengan nilai-nilai tersebut adalah:
Gambar 2.2 Kriteria Pengambilan Keputusan Adanya Pencilan atau Tidak
Keterangan: n = jumlah observasi sampel.
p = jumlah parameter.
2.5 Regresi Robust
Menurut Drafer dan Smith 1981, penolakan begitu saja suatu pencilan bukanlah prosedur yang bijaksana, adakalanya pencilan memberikan informasi yang tidak
bisa diberikan oleh titik data lainnya. Metode kuadrat terkecil MKT merupakan metode yang baik untuk menduga
� pada model regresi linier. Tetapi jika dalam penelitian diketahui terdapat pengamatan yang merupakan pencilan, maka
penggunaan MKT akan menghasilkan kesimpulan yang tidak sempurna. Sebagai alternatif digunakan regresi robust.
Secara umum robust memiliki arti kekar. Regresi robust merupakan alat yang penting untuk menganalisis data yang terkontaminasi oleh pencilan dan
memberikan hasil yang lebih fleksibel. Regresi robust tetap menggunakan seluruh
data, tetapi dengan memberikan bobot yang kecil untuk data pencilan Soemartini,
2007: 12. Regresi robust digunakan untuk mendeteksi pencilan dan memberikan hasil terhadap adanya pencilan Chen, 2002.
����
⎩ ⎪
⎪ ⎨
⎪ ⎪
⎧ �. ��������
�� − � �
�. ������ 2 ∗ ���� � �
�� �. ����
′
� � ��. �; �, � − � �. �������
� �����
⎭ ⎪
⎪ ⎬
⎪ ⎪
⎫ ���������������
13
2.5.1 Regresi Robust Penduga-S