51 96 Least Trimmed Square LTS

Lampiran 5 Deteksi pencilan dengan Discrepancy No. ¼ ½ ¼ ¾ ¼ ¿ ¼ À » Õ ÕÖ×ØÙ TRES1 Jenis Data 1. 6.7 62 81 2.59 200 ±1,7081 -0,38371 Bukan 2. 5.1 59 66 1.70 101 ±1,7081 0,08697 Bukan 3. 7.4 57 83 2.16 204 ±1,7081 -0,40231 Bukan 4. 6.5 73 41 2.01 101 ±1,7081 -0,34059 Bukan 5. 7.8 65 115 4.30 509 ±1,7081 0,91030 Bukan 6. 6.0 85 28 2.98 87 ±1,7081 -0,65775 Bukan 7. 5.8 38 72 1.42 80 ±1,7081 0,67221 Bukan 8. 5.7 46 63 1.91 80 ±1,7081 0,51742 Bukan 9. 3.7 68 81 2.57 127 ±1,7081 -0,32524 Bukan 10. 6.0 67 92 2.50 202 ±1,7081 -0,86114 Bukan 11. 3.7 76 94 2.40 203 ±1,7081 -0,50164 Bukan 12. 6.3 84 83 4.13 329 ±1,7081 -0,36066 Bukan 13. 6.7 51 43 1.89 65 ±1,7081 0,48429 Bukan 14. 5.8 83 88 3.95 330 ±1,7081 -0,26732 Bukan 15. 11.2 76 90 5.59 574 ±1,7081 0,51205 Bukan 16. 7.7 62 67 3.40 168 ±1,7081 -0,65495 Bukan 17. 7.4 74 68 2.40 217 ±1,7081 -0,70818 Bukan 18.

3.7 51

41 1.55 34 ±1,7081 1,78368 Pencilan 19. 7.3 68 74 3.56 215 ±1,7081 -0,63372 Bukan 20. 5.6 57 87 3.02 172 ±1,7081 -0,23501 Bukan 21. 5.2 52 76 2.86 109 ±1,7081 0,02118 Bukan 22.

5.8 96

114 3.95 830 ±1,7081 6,44554 Pencilan 23. 3.4 83 53 1.12 136 ±1,7081 0,39126 Bukan 24. 8.7 45 23 2.52 58 ±1,7081 0,84870 Bukan 25.

5.8 72

93 3.30 295 ±1,7081 -0,12785 Bukan 26. 6.3 59 100 2.95 276 ±1,7081 -0,02256 Bukan 27.

5.8 72

93 3.30 104 ±1,7081 -2,57479 Pencilan 28. 3.2 64 65 0.74 71 ±1,7081 0,40651 Bukan 29. 5.3 57 99 2.60 184 ±1,7081 -0,45440 Bukan 30. 2.6 74 86 2.05 118 ±1,7081 -0,51585 Bukan Universitas Sumatera Utara Lampiran 6 Deteksi pencilan dengan menggunakan metode DfFITS Difference in fit Standardized No. 2u , DfFITS |DfFITS| Jenis Data 1. 0,7303 -0,10369 0,10369 Bukan 2. 0,7303 0,02365 0,02365 Bukan 3. 0,7303 -0,21016 0,21016 Bukan 4. 0,7303 -0,16280 0,16280 Bukan 5. 0,7303 0,43295 0,43295 Bukan 6. 0,7303 -0,49450 0,49450 Bukan 7. 0,7303 0,34650 0,34650 Bukan 8. 0,7303 0,18326 0,18326 Bukan 9. 0,7303 -0,12743 0,12743 Bukan 10. 0,7303 -0,27874 0,27874 Bukan 11. 0,7303 -0,18414 0,18414 Bukan 12. 0,7303 -0,15312 0,15312 Bukan 13. 0,7303 0,18437 0,18437 Bukan 14. 0,7303 -0,10633 0,10633 Bukan

15. 0,7303 0,40483

0,40483 Bukan 16. 0,7303 -0,19565 0,19565 Bukan

17. 0,7303 -0,37042

0,37042 Bukan

18. 0,7303 1,04708

1,04708 Pencilan 19. 0,7303 -0,16966 0,16966 Bukan 20. 0,7303 -0,07888 0,07888 Bukan 21. 0,7303 0,00974 0,00974 Bukan

22. 0,7303 3,77060

3,77060 Pencilan

23. 0,7303 0,24642

0,24642 Bukan

24. 0,7303 0,59103

0,59103 Bukan 25. 0,7303 -0,03205 0,03205 Bukan 26. 0,7303 -0,00750 0,00750 Bukan 27. 0,7303 -0,64547 0,64547 Bukan

28. 0,7303 0,19557

0,19557 Bukan 29. 0,7303 -0,15914 0,15914 Bukan 30. 0,7303 -0,23551 0,23551 Bukan Universitas Sumatera Utara Lampiran 7 Mengestimasi menggunakan metode LTS: Iterasi 1 No. ¼ ½ ¼ ¾ ¼ ¿ ¼ À » »X Ô 8» Ô − »X Ô : ¾ 1. 6,7 62 81 2,59 200 233,800 1.142,465 2. 5,1 59 66 1,70 101 93,320 58,984 3. 7,4 57 83 2,16 204 236,528 1.058,098 4. 6,5 73 41 2,01 101 129,058 787,269 5. 7,8 65 115 4,30 509 435,025 5.472,339 6. 6,0 85 28 2,98 87 134,692 2.274,547 7. 5,8 38 72 1,42 80 25,819 2.935,563 8. 5,7 46 63 1,91 80 35,606 1.970,855 9. 3,7 68 81 2,57 127 154,657 764,888 10. 6,0 67 92 2,50 202 275,855 5.454,626 11. 3,7 76 94 2,40 203 245,878 1.838,531 12. 6,3 84 83 4,13 329 359,303 918,296 13. 6,7 51 43 1,89 65 23,776 1.699,456 14. 5,8 83 88 3,95 330 352,701 515,320 15. 11,2 76 90 5,59 574 537,434 1.337,042 16. 7,7 62 67 3,40 168 224,932 3.241,207 17. 7,4 74 68 2,40 217 273,845 3.231,395 18.

3,7 51

41 1,55 34 -98,294 17.501,724 19. 7,3 68 74 3,56 215 270,567 3.087,731 20. 5,6 57 87 3,02 172 192,369 414,898 21. 5,2 52 76 2,86 109 107,238 3,103 22.

5,8 96

114 3,95 830 521,867 94.945,833 23. 3,4 83 53 1,12 136 105,794 912,376 24. 8,7 45 23 2,52 58 -4,810 3.945,112 25.

5,8 72

93 3,30 295 306,347 128,744 26. 6,3 59 100 2,95 276 277,960 3,840 27.

5,8 72

93 3,30 104 306,347 40.944,126 28. 3,2 64 65 0,74 71 37,586 1.116,506 29. 5,3 57 99 2,60 184 223,085 1.527,633 30. 2,6 74 86 2,05 118 160,714 1.824,525 S 178.2 1.976 2.259 81,42 6.179 6.179 201.057,033 Dimana untuk memperoleh jumlah data pada iterasi kedua dengan: ℎ = ‡ ˆ ‡ ¹I ˆ = 17,5 ≈ 18 data. Sedangkan nilai ∑ = d N 201.057,033. Dan model regresi linear berganda pada iterasi 1 adalah: h = −682 + 37,2 5,42 3,80 8,8 ¹ Universitas Sumatera Utara Hasil Output Iterasi ke-1 Metode LTS Menggunakan SPSS 21 Universitas Sumatera Utara Lampiran 8 Iterasi 2 No. ¹ h 8 − h : 1. 5,2 52 76 2,86 109 102,489 42,394 2. 6,3 59 100 2,95 276 254,389 467,034 3. 5,1 59 66 1,70 101 92,83551 66,659 4.

5,8 72

93 3,30 295 283,9873 121,279 5. 5,6 57 87 3,02 172 178,3381 40,172 6. 5,8 83 88 3,95 330 332,5531 6,518 7. 3,7 68 81 2,57 127 135,6398 74,647 8. 6,5 73 41 2,01 101 151,0395 2.503,954 9. 3,4 83 53 1,12 136 103,0099 1.088,344 10. 6,3 84 83 4,13 329 345,0836 258,682 11. 7,4 57 83 2,16 204 230,3445 694,034 12. 3,2 64 65 0,74 71 28,70136 1.789,175 13. 6,7 62 81 2,59 200 226,3314 693,341 14. 11,2 76 90 5,59 574 537,434 1.337,042 15. 5,3 57 99 2,60 184 197,0933 171,435 16. 6,7 51 43 1,89 65 50,82487 200,934 17. 2,6 74 86 2,05 118 131,2249 174,899 18. 3,7 76 94 2,40 203 213,1429 102,878 S 100,5 1.207 1.409 47,63 3.595 3.595,000 9.794,411 Dimana untuk memperoleh jumlah data pada iterasi ketiga dengan: ℎ = ‡ Ç ˆ ‡ ¹I ˆ = 11,5 ≈ 12 data. Sedangkan nilai ∑ = d N 9.794,411. Dan model regresi linear bergandanya adalah: h = −682 + 40,4 5,13 2,94 10,5 ¹ Universitas Sumatera Utara Hasil Output Iterasi ke-2 Metode LTS Menggunakan SPSS 21 Universitas Sumatera Utara Lampiran 9 Iterasi 3 No. ¼ ½ ¼ ¾ ¼ ¿ ¼ À » »X Ô 8» Ô − »X Ô : ¾ 1. 5,8 83 88 3,95 330 325,491 20,331 2. 5,6 57 87 3,02 172 179,986 63,783 3. 5,2 52 76 2,86 109 101,532 55,771 4. 5,1 59 66 1,70 101 99,877 1,260 5. 3,7 68 81 2,57 127 124,910 4,366 6. 3,7 76 94 2,40 203 204,874 3,512 7. 5,8 72 93 3,30 295 284,235 115,895 8. 5,3 57 99 2,60 184 201,603 309,869 9. 2,6 74 86 2,05 118 116,704 1,680 10. 6,7 51 43 1,89 65 66,597 2,549 11. 6,3 84 83 4,13 329 339,649 113,406 12. 6,3 59 100 2,95 276 263,541 155,219 S 62,1 792 996 33,42 2.309 2.309,000 847,642 Model regresi linear bergandanya adalah: h = -649 + 48,3 5,06 3,06 1,42 ¹ Dimana nilai residual: ∑ = d N 847,642 Universitas Sumatera Utara DAFTAR PUSTAKA Draper, N. dan Smith, H. 1992. Analisis Regresi Terapan. Edisi Kedua. Bambang Sumantri. Jakarta: Gramedia Pustaka Utama. Huber, Peter, J., and Ronchetti, Elvezio, M. 2009. Robust Statistics. A John Wiley and Sons, Inc., Publication. Hoboken. New Jersey. Musafirah, Raupong, Nasrah. 2010. Perbandingan Metode Robust Least Trimmed Square LTS Dengan Metode Scale Dalam Mengestimasi Parameter Regresi Linear Berganda Untuk Data Pencilan. Universitas Hasanuddin Oktarinanda, Arista . Jurnal Ilmiah. Perbandingan LTS dan Scale Dalam Mengestimasi Parameter Regresi Linear Berganda. Universitas Hasanuddin. Rousseeuw, P.J., A. M. Leroy. 1987. Robust Regression and Outlier Detection. John Wiley Sons Inc: New York. Ronald, E. Walpole. 1982. Pengantar Statistika. PT. Gramedia Pustaka Utama Jakarta. Santoso, S. 2000. Buku Latihan SPSS Statistik Parametrik. Elex Media Komputindo. Jakarta Sembiring. R.K . Analisis Regresi. ITB. Bandung Siregar, Sofyan. 2015. Statistika Terapan Untuk Perguruan Tinggi. PT.Kharisma Putra Utama. Jakarta Siregar, Sofyan. Ir. 2014. Statistik Parametrik untuk Penelitian Kuantitatif. PT. Bumi Aksara. Jakarta Suyanti, Sukestiryano, YL. Jurnal Ilmiah.2014. Deteksi Outlier Menggunakan Diagnosa Regresi Berbasis Estimator Parameter Robust. Universitas Negeri Semarang. Yamin, Sofyan., Rachmach, Lien, A., Kurniawan, Heri. 2011. Aplikasi dengan Software SPSS, EViews, MINITAB, dan STATGRAPHICS. Salemba Empat. Jakarta Universitas Sumatera Utara BAB 3 HASIL DAN PEMBAHASAN

3.1. Least Trimmed Square LTS

Sebelum membahas mengenai least trimmed square LTS, akan dibahas terlebih dahulu sifat-sifat ke-equivariant-an yang harus dimiliki oleh suatu estimator equivariant dalam statistik merujuk pada transformasi sebagaimana mestinya. Kebalikan dari equivariant yaitu invariant yang merujuk pada kuantitas yang tetap tidak berubah, yaitu: regresi equivariant, skala equivariant, dan affine equivariant. Sifat-sifat tersebut diperlukan agar hasil transformasi tetap dapat diartikan sama dengan data sebelum ditransformasi. Suatu estimator T disebut sebagai regresi equivariant jika memenuhi: –+ , L + + 7; = 1,2, ⋯ , — = –+ , L ; = 1,2, ⋯ , — + 7 3.1 Dengan 7 merupakan sebarang vektor kolom. Regresi equivariant digunakan dalam mendeskripsikan bagaimana studi Monte Carlo dilakukan dimulai ˜ = 0 , yang berarti hasil transformasi valid pada sebarang vektor parameter. Suatu estimator T disebut sebagai skala equivariant jika memenuhi: –+ , ™L ; = 1,2, ⋯ , — = ™ – + , L ; = 1,2, ⋯, — 3.2 untuk sebarang konstanta ™, skala equivariant menyebabkan bahwa kecocokan secara esensial independen dari pemilihan satuan pengukuran pada variabel terikat L . Sedangkan, suatu estimator adalah affine equivariant jika memenuhi: – + š, L ; = 1,2, ⋯ , — = š D – + , L ; = 1,2, ⋯ , — 3.3 Universitas Sumatera Utara untuk sebarang matrik persegi A yang nonsingular. Dimana affine equivariant menjelaskan transformasi linear dari + akan berpengaruh langsung pada estimator , karena LM = + ˜ = + šš D ˜ . Sehingga dengan demikian peubah bebas dapat menggunakan sistem kordinat lainnya tanpa berpengaruh pada hasil estimasi LM . Sifat Umum Estimator Regresi LTS Estimator LTS mempunyai sifat regresi equivariant, skala equivariant, dan affine equivariant. Regrsi Equivariant : ∑ L + 7 − + –7 + ˜— : = ∑ L − + ˜ : d 9N d N Skala Equivariant : ∑ ™L − + –™˜— : = ™ ∑ L − + ˜ : d 9N d N Affine Equivariant : ∑ L –+ š—–š D ˜— : = ∑ L − + ˜ : d 9N d N dengan 7 = vektor kolom sebarang ™ = konstanta sebarang š = matriks bujur sangkar non-singular ˜ = Transformasi T Teorema 3.1. Sebarang regresi equivariant dari estimator memenuhi: ∗ , ‹ ≤ •‡ ›œ• C ˆI € 3.5 pada seluruh sampel ‹. Menurut Rousseeuw least trimmed square LTS didefinisikan sebagai: min ¡X ∑ ] : N 3.6 Sebelumnya dengan menyusun residual kuadrat dari yang terkecil sampai dengan yang terbesar, yaitu: : ≤ : ≤ ⋯ ≤ : Dengan ℎ = ‡ ˆ + 1, sehingga LTS akan memiliki breakdown point yang sama dengan Y •‡ › C ˆD[I € Z dengan , merupakan variabel bebas dan notasi Universitas Sumatera Utara [] menyatakan bagian bilangan bulat terbesar yang kurang dari atau sama dengan bilangan bulat tersebut. Selain itu, untuk ℎ = ‡ ˆ + ‡ [I ˆ LTS yang mungkin mencapai nilai maksimum dari teorema 3.1. Sifat ke-robust-an dari LTS didasarkan pada breakdown point-nya yang didefinisikan oleh Rousseeuw. Nilai breakdown point dari metode LTS yang didefinisikan pada persamaan 3.5 dengan ℎ = ‡ ˆ + ‡ [I ˆ sama dengan: ∗ , ‹ = •‡ ›œ• C ˆI € ` Bukti: Asumsikan bahwa semua pengamatan dengan variabel 8+ , + , ⋯ , + [ : = 0 dihapuskan dan pengamatan-pengamatannya merupakan dalam keadaan umum. Yang dimaksud dalam keadaan umum adalah jika sebarang , dari variabel bebas menentukan ˜ secara unik. Langkah pertama adalah dengan menunjukkan bahwa ∗ , ‹ ≥ •‡ ›œ• C ˆI € ` karena sampel ‹ = – + , L ; = 1,2, ⋯ , — terdiri dari n titik dalam kondisi yang umum, hal ini akan memenuhi: ¤ = inf –¦ 0; terdapat suatu , − 1 dimensi subruang dari § L = 0 , sedemikian hingga §′ meliputi sekurang-kurangnya , dari + — yang selalu bernilai positif, dengan §′ adalah himpunan dari semua variabel bebas dengan jarak terhadap § tidak lebih dari ¦. Andaikan ˜ meminimumkan persamaan 3.5 untuk ‹, dan dinotasikan dengan e yang berkorespondensi dengan hyperplane yang diberikan dengan persamaan L = +˜ . Diberikan c = Œ+ |] | dengan ] = L − + ˜ . Sekarang akan dikontruksikan sebarang sampel terkontaminasi ‹ = – + , L ; = 1,2, ⋯, — dengan menyimpan − ‡ D[ ˆ = ‡ I[I ˆ pengamatan-pengamatan dari ‹ dan dengan menggantikannya yang lainnya dengan nilai-nilai yang berubah-ubah. Hal ini cukup untuk membuktikan bahwa ‖˜ − ˜ ‖ terbatas, dengan ˜′ berkorespondensi terhadap ‹′ yang dinotasikan dengan e′, jadi hyperplane e′ Universitas Sumatera Utara yang berkorespondensi merupakan hal yang berbeda dari e . Tanpa kehilangan keumumannya dapat diasumsikan bahwa ˜′ ≠ ˜ , karena itu e′ ≠ e. Dengan teorema dimensi dari aljabar linear, irisan dari e ∩ e′ mempunyai dimensi , − 1. Jika ,]e ∩ e′ merupakan proyeksi vertical dari e ∩ e′ terhadap L = 0 , sehingga diasumsikan paling banyak , − 1 dari + yang baik bukan pencilan dapat terletak pada 8,] e ∩ e′ : ¬ . Sekarang didefinisikan š sebagai himpunan pengamatan-pengamatan baik yang tersisa. Kemudian misalkan sebarang + m , L m termasuk di š dan ] m = L m − + m ˜ dan ] m = L m − + m ˜ . Kontruksikan vertical plane 2-dimensi - m melalui + m , L m dan tegak lurus terhadap ,] e ∩ e . Sebelumnya akan dikontruksikan nilai residual pada - m yaitu sebagai berikut menurut Rousseeuw: |] | = |+ ˜ − L | ≥ ®|+ ˜| − |L |® dengan |+ ˜| ¤|tan ~ | , dengan ~ merupakan sudut dalam •− ± , ± € yang dibentuk antara e dengan garis horizontal pada - m . Oleh karena itu, |~| merupakan sudut antara garis tegak lurus terhadap e dan 0,1 , karena itu: |~| = ]™™6•² | −˜, 1 0,1 | ‖−˜, 1‖‖0,1‖ ³ = ]™™6•²− 1 ´1 + ‖˜‖ ³ Dan akhirnya diperoleh |tan ~ | = ‖˜‖. Berdasarkan pernyataan diatas, maka: | m − m | = |+ m ˜ − + m ˜| ¤|tan ~ − tan ~ | ≥ ¤®|tan ~ | − |tan ~ |® = ¤|‖˜ ‖ − ‖˜‖| Karena ‖˜ − ˜‖ ≤ ‖˜‖ + ‖˜ ‖ = 2‖˜‖ + ‖˜ ‖ − ‖˜‖ ≤ |‖˜ ‖ − ‖˜‖| + 2‖˜‖ Berdasarkan pertidaksamaan diatas diperoleh: | m − m | ¤ ‖˜ − ˜‖ − 2‖˜‖ Universitas Sumatera Utara dengan m dan m adalah residual yang berhubungan dengan e dan e berkorespondensi dengan titik + m , L m . Sekarang diperoleh jumlah ℎ residual kuadrat pertama dari sampel baru ‹ yang berhubungan dengan ˜ yang sebelumnya, dimana sekurang-kurangnya nilai ‡ I[I ˆ ≥ ℎ dari residual- residual ini menjadi sama seperti sebelumnya, yaitu kurang dari atau sama dengan ℎc . Karena ˜ berkorespondensi dengan ‹ berdasarkan pernyataan ini diperoleh: ∑ L − + ˜ : ≤ ℎc d N 3.7 Jika diasumsikan bahwa: ‖˜ − ˜‖ ≥ 2‖˜‖ + c 1 + √ℎ ¤ Maka untuk semua di š memenuhi | m − m | ¤ ‖˜ − ˜‖ − 2‖˜‖ ≥ c 1 + √ℎ Jadi, | m | ≥ | m − m | − | m | c81 + √ℎ: − c = c√ℎ Sekarang perhatikan bahwa − |š| ≤ ℎ − 1. Oleh karena itu, himpunan ℎ dari + , L harus terdiri sekurangnya satu dari + m , L m , maka: ∑ L − + ˜ : ≥ m ℎc d N 3.8 Suatu kontradiksi. Ini menyebabkan bahwa ‖˜ − ˜‖ 2‖˜‖ + c 1 + √ℎ ¤ ∞ Untuk semua sampel ‹ . Langkah kedua adalah mendapatkan pertidaksamaan sebaliknya yaitu ∗ , ‹ ≤ •‡ ›œ• C ˆI € ` yang diperoleh berdasarkan teorema 3.1 dan lemma 3.1. Universitas Sumatera Utara Cara lain menginterpretasikan persamaan 3.5 adalah dengan mengasumsikan bernilai terbatas jika nilainya lebih dari + , − 1 pengamatan dan tidak terkontaminasi nilai dari h. Dimana ℎ menghasilkan nilai yang maksimum dari breakdown point. Di sisi lain, jumlah pengamatan yang tidak baik − |š| harus tetap kurang dari ℎ dan |š| − 1 ≥ − ℎ dan |š| − 1 ≥ ℎ − , , yang menghasilkan ℎ = ‡ ˆ + ‡ [I ˆ. Pada umumnya, ℎ mungkin bergantung pada beberapa proporsi trimming ~ , dengan menggunakan ℎ = 2 1 − ~ 3 + 2~ , + 1 3~ atau ℎ = 2 1 − ~ 3 + 1 . Maka dengan breakdown point ∗ sama dengan proporsi ~. Untuk ~ mendekati 50, maka akan didapatkan LTS estimator, sedangkan untuk ~ mendekati 0 maka diperoleh OLS estimator. Suatu estimator LTS juga akan memenuhi sifat kecocokan yang tepat yang dinyatakan sebagai berikut: Jika terdapat beberapa ˜ sedemikian hingga cendrung lebih dari + , − 1 dari suatu observasi yang memenuhi L = + ˜ secara tepat dan dalam posisi umum, maka penyelesaian LTS sama dengan ˜ apapun bentuk observasinya. LTS mempunyai kekonvergenan D F C dengan efisiensi keasimptotikan terhadap distribusi normal. Langkah-langkah penentuan estimasi dengan menggunakan LTS adalah sebagai berikut: 1. Bentuk − ℎ + 1 subsampel dengan tiap subsampel terdiri dari ℎ observasi. 2. Setiap subsampel dihitung: LM = 1 ℎ S L : d N ⋮ LM DdI = 1 ℎ S L : NDdI Universitas Sumatera Utara 3. Hitung jumlah kuadrat dari tiap subsampel: „ = S·L : − LM ¸ d N ⋮ „ DdI = S ·L : − LM DdI ¸ NDdI 4. Solusi yang dipilih adalah LM 9 yang memberikan nilai „ 9 paling kecil.

3.2. Contoh Ilustrasi Kasus