c. Buat plot antara jarak robust vs residu robust [10]
Dan terakhir plot antara residu robust dan jarak robust memungkinkanpengguna untuk mencirikanmembedakan 4 model titik yaitu:
observasi biasa,pencilan vertikal, titik good leverage dan titik bad leverage. 1.
Observasi regular yaitu suatu titik yang memiliki nilai residu robust dan nilaijarak robust kecil.
2. Pencilan vertikal yaitu suatu titik yang memiliki nilai residu robust besar
dannilai jarak robust kecil. 3.
Good leverage yaitu suatu titik yang memiliki nilai residu robust kecil dannilai jarak robust besar. Ini berarti bahwa X
i
menjauh tetapi Y
i
cocok dengangaris linear.
4. Bad leverage yaitu suatu titik yang memiliki nilai residu robust dan nilaijarak
robust besar. Titik ini lebih berbahaya dari pada pencilan karenamemiliki pengaruh paling besar pada regresi linear klasik.
Tentu saja tidak selalu semua titik ini dimiliki oleh data.
2.4 Least Trimmed Squares
Least Trimmed SquaresLTS merupakan suatu metode pendugaan parameter regresi robust untuk meminimumkan jumlah kuadrat h residual fungsi objektif.
β =
∑
= h
i n
i
r
1 2
:
2.6 Dengan
h=
[ ] [ ]
2 1
2 +
+ p n
Keterangan :
2 i
r
: Kuadrat residual yang diurutkan dari terkecil ke terbesar.
2 1
r
2 2
r
2 3
r
….
2 i
r
…
2 h
r
…
2 n
r
n : Banyaknyapengamatan p: Parameter regresi
Universitas Sumatera Utara
Jumlah h menunjukkan sejumlah subset data dengan kuadrat fungsi objektif terkecil. Nilai h pada persamaan 2.6 akan membangun breakdown point yang besar
sebanding dengan 50. Algoritma LTS menurut Rousseeauw dan Van Driessen 1999 dalam Willems dan Aels 2005 adalah gabungan FAST-LTS dan C-steps.
Tahapan algoritma yang digunakan FAST LTS, C-steps dan FWLS yaitu : 1
Menghitung estimasi parameter b
o
2 Menentukan n residual
2 2
ˆ
o i
i i
b X
y r
− =
yang bersesuaian dengan b
o
kemudian menghitung sejumlah
2 1
+ +
= p
n h
o
pengamatan dengan nilai
2 i
e
terkecil. 3
Menghitung
∑
=
o
h i
i
r
1 2
4 Melakukan estimasi parameter b
new
dari h
o
pengamatan. 5
Menentukan n kuadrat residual
2 2
ˆ
new i
i i
b X
y r
− =
yang bersesuaian dengan b
new
kemudian menghitung sejumlah h
new
pengamatan dengan nilai
2 i
e
terkecil. 6
Menghitung
∑
=
new
h i
i
r
1 2
7 Melakukan C-steps yaitu tahap 4 sampai 6 untuk mendapatkan fungsi objektif yang
kecil dan konvergen.
Dengan metode LTS, model hubungan antara WRI Jan dan LP I diperoleh h = 9 subset data dengan kuadrat fungsi objektif terkecil. Kemudian melalui FWLS
didapatkan hanya variabel intercept yang signifikan berpengaruh, R Square 18,19 dan standard deviasi 12,38.
2.5
Penggunaan LTS dalam masalah outlier
Untuk menanggulangi pencilan pada data, yaitu dengan mengeluarkan ataumembuang observasi ke-i pada data yang diduga merupakan pencilan. Kemudiandilakukan
pengujian kembali untuk mendeteksi terdapat atau tidaknya pencilanpada data sampai tidak terdapat lagi pencilan pada data tersebut.Meskipun pencilan identik dengan data
yang tidak bagus, akan tetapi iamerupakan bagian terpenting dari data, karena
Universitas Sumatera Utara
menyimpan informasi tertentu. Untuk itu alternatif yang dapat diambil terhadap data yang terkontaminasipencilan adalah dengan menggunakan metode Least Trimmed
Square LTS dalampenaksiran model regresi.
Universitas Sumatera Utara
BAB 3
PEMBAHASAN
3.1 Permasalahan pada Regresi Sederhana