Regresi Robust Mengatasi Outlier Dengan Metode Least Trimmed Squares (LTS) Pada Regresi Robust.

2.3 Regresi Robust

Metode kuadrat terkecil atau OLS ordinary least square merupakan metode penduga terbaik untuk analisis regresi, namun metode ini sangat sensitif terhadap pencilan. Bahkan jika hanya terdapat satu saja pencilan extrim dalam data, maka akan mengakibatkan penyimpangan pada dugaan OLS.Untuk mengatasi data yang mengandung pencilan diperlukan metode yang tegar terhadap pencilan yang disebut sebagai metode robust. Titik pencilan dapat dideteksi dengan menggunakan nilai residualnya.Titik pencilan dikatakan 0 jika 3 r ≤ dan 1 untuk lainnya. Dengan 1 1 2 2 , 1,..., i i i i r Y X X i n β β β   = − + + =     2.4 Titik Leverage dapat dideteksi dengan menggunakan jarak robust yaitu 1 T i i i RD X X T X C X X T X −   = − −   2.5 Dimana : RD : Jarak Robust TX : vektor rata-rata robust CX : matriks kovarians robust. [10] Langkah-langkahpendeteksian outlier dengan metode Least Trimmed Squares pada Regresi Robust meliputi beberapa tahap : 1. Tentukan pencilan pada data 2. Tentukan nilai coverage yakni h = [ ] [ ] 2 1 2 + + p n 3. Buat subset dari data yaitu sebanyak kombinasi n dari h. 4. Gunakan metode kuadrat terkecil biasa untuk mendapatkan nilai parameter dan residu dari tiap subset 5. Tentukan model fit dengan mencari jumlah kuadrat residu yang terkecil dari keseluruhan subset Setelah didapat model yang fit, kemudian a. Hitung nilai residu robust untuk menentukan titik pencilan, yang diperoleh dari model fit Least Trimmed Squares b. Hitung nilai jarak robust untuk menentukan titik leverage Universitas Sumatera Utara c. Buat plot antara jarak robust vs residu robust [10] Dan terakhir plot antara residu robust dan jarak robust memungkinkanpengguna untuk mencirikanmembedakan 4 model titik yaitu: observasi biasa,pencilan vertikal, titik good leverage dan titik bad leverage. 1. Observasi regular yaitu suatu titik yang memiliki nilai residu robust dan nilaijarak robust kecil. 2. Pencilan vertikal yaitu suatu titik yang memiliki nilai residu robust besar dannilai jarak robust kecil. 3. Good leverage yaitu suatu titik yang memiliki nilai residu robust kecil dannilai jarak robust besar. Ini berarti bahwa X i menjauh tetapi Y i cocok dengangaris linear. 4. Bad leverage yaitu suatu titik yang memiliki nilai residu robust dan nilaijarak robust besar. Titik ini lebih berbahaya dari pada pencilan karenamemiliki pengaruh paling besar pada regresi linear klasik. Tentu saja tidak selalu semua titik ini dimiliki oleh data.

2.4 Least Trimmed Squares