Lampiran 5 Deteksi pencilan dengan Discrepancy
No.
¼
½
¼
¾
¼
¿
¼
À
» Õ
ÕÖ×ØÙ
TRES1 Jenis
Data
1.
6.7 62
81 2.59
200
±1,7081 -0,38371
Bukan
2.
5.1 59
66 1.70
101
±1,7081 0,08697
Bukan
3.
7.4 57
83 2.16
204
±1,7081 -0,40231
Bukan
4.
6.5 73
41 2.01
101
±1,7081 -0,34059
Bukan
5.
7.8 65
115 4.30
509
±1,7081 0,91030
Bukan
6.
6.0 85
28 2.98
87
±1,7081 -0,65775
Bukan
7.
5.8 38
72 1.42
80
±1,7081 0,67221
Bukan
8.
5.7 46
63 1.91
80
±1,7081 0,51742
Bukan
9.
3.7 68
81 2.57
127
±1,7081 -0,32524
Bukan
10.
6.0 67
92 2.50
202
±1,7081 -0,86114
Bukan
11.
3.7 76
94 2.40
203
±1,7081 -0,50164
Bukan
12.
6.3 84
83 4.13
329
±1,7081 -0,36066
Bukan
13.
6.7 51
43 1.89
65
±1,7081 0,48429
Bukan
14.
5.8 83
88 3.95
330
±1,7081 -0,26732
Bukan
15.
11.2 76
90 5.59
574
±1,7081 0,51205
Bukan
16.
7.7 62
67 3.40
168
±1,7081 -0,65495
Bukan
17.
7.4 74
68 2.40
217
±1,7081 -0,70818
Bukan
18.
3.7 51
41 1.55
34
±1,7081 1,78368
Pencilan
19.
7.3 68
74 3.56
215
±1,7081 -0,63372
Bukan
20.
5.6 57
87 3.02
172
±1,7081 -0,23501
Bukan
21.
5.2 52
76 2.86
109
±1,7081 0,02118
Bukan
22.
5.8 96
114 3.95
830
±1,7081 6,44554
Pencilan
23.
3.4 83
53 1.12
136
±1,7081 0,39126
Bukan
24.
8.7 45
23 2.52
58
±1,7081 0,84870
Bukan
25.
5.8 72
93 3.30
295
±1,7081 -0,12785
Bukan
26.
6.3 59
100 2.95
276
±1,7081 -0,02256
Bukan
27.
5.8 72
93 3.30
104
±1,7081 -2,57479
Pencilan
28.
3.2 64
65 0.74
71
±1,7081 0,40651
Bukan
29.
5.3 57
99 2.60
184
±1,7081 -0,45440
Bukan
30.
2.6 74
86 2.05
118
±1,7081 -0,51585
Bukan
Universitas Sumatera Utara
Lampiran 6 Deteksi pencilan dengan menggunakan metode DfFITS Difference in fit
Standardized
No.
2u ,
DfFITS |DfFITS|
Jenis Data
1. 0,7303
-0,10369 0,10369
Bukan
2. 0,7303
0,02365 0,02365
Bukan
3. 0,7303
-0,21016 0,21016
Bukan
4. 0,7303
-0,16280 0,16280
Bukan
5. 0,7303
0,43295 0,43295
Bukan
6. 0,7303
-0,49450 0,49450
Bukan
7. 0,7303
0,34650 0,34650
Bukan
8. 0,7303
0,18326 0,18326
Bukan
9. 0,7303
-0,12743 0,12743
Bukan
10. 0,7303 -0,27874
0,27874
Bukan
11. 0,7303 -0,18414
0,18414
Bukan
12. 0,7303 -0,15312
0,15312
Bukan
13. 0,7303 0,18437
0,18437
Bukan
14. 0,7303 -0,10633
0,10633
Bukan
15. 0,7303 0,40483
0,40483
Bukan
16. 0,7303 -0,19565
0,19565
Bukan
17. 0,7303 -0,37042
0,37042
Bukan
18. 0,7303 1,04708
1,04708
Pencilan
19. 0,7303 -0,16966
0,16966
Bukan
20. 0,7303 -0,07888
0,07888
Bukan
21. 0,7303 0,00974
0,00974
Bukan
22. 0,7303 3,77060
3,77060
Pencilan
23. 0,7303 0,24642
0,24642
Bukan
24. 0,7303 0,59103
0,59103
Bukan
25. 0,7303 -0,03205
0,03205
Bukan
26. 0,7303 -0,00750
0,00750
Bukan
27. 0,7303 -0,64547
0,64547
Bukan
28. 0,7303 0,19557
0,19557
Bukan
29. 0,7303 -0,15914
0,15914
Bukan
30. 0,7303 -0,23551
0,23551
Bukan
Universitas Sumatera Utara
Lampiran 7 Mengestimasi menggunakan metode LTS: Iterasi 1
No.
¼
½
¼
¾
¼
¿
¼
À
» »X
Ô
8»
Ô
− »X
Ô
:
¾
1.
6,7 62
81 2,59
200
233,800 1.142,465
2.
5,1 59
66 1,70
101
93,320 58,984
3.
7,4 57
83 2,16
204
236,528 1.058,098
4.
6,5 73
41 2,01
101
129,058 787,269
5.
7,8 65
115 4,30
509
435,025 5.472,339
6.
6,0 85
28 2,98
87
134,692 2.274,547
7.
5,8 38
72 1,42
80
25,819 2.935,563
8.
5,7 46
63 1,91
80
35,606 1.970,855
9.
3,7 68
81 2,57
127
154,657 764,888
10.
6,0 67
92 2,50
202
275,855 5.454,626
11.
3,7 76
94 2,40
203
245,878 1.838,531
12.
6,3 84
83 4,13
329
359,303 918,296
13.
6,7 51
43 1,89
65
23,776 1.699,456
14.
5,8 83
88 3,95
330
352,701 515,320
15.
11,2 76
90 5,59
574
537,434 1.337,042
16.
7,7 62
67 3,40
168
224,932 3.241,207
17.
7,4 74
68 2,40
217
273,845 3.231,395
18.
3,7 51
41 1,55
34
-98,294 17.501,724
19.
7,3 68
74 3,56
215
270,567 3.087,731
20.
5,6 57
87 3,02
172
192,369 414,898
21.
5,2 52
76 2,86
109
107,238 3,103
22.
5,8 96
114 3,95
830
521,867 94.945,833
23.
3,4 83
53 1,12
136
105,794 912,376
24.
8,7 45
23 2,52
58
-4,810 3.945,112
25.
5,8 72
93 3,30
295
306,347 128,744
26.
6,3 59
100 2,95
276
277,960 3,840
27.
5,8 72
93 3,30
104
306,347 40.944,126
28.
3,2 64
65 0,74
71
37,586 1.116,506
29.
5,3 57
99 2,60
184
223,085 1.527,633
30.
2,6 74
86 2,05
118
160,714 1.824,525
S 178.2 1.976 2.259 81,42 6.179 6.179
201.057,033
Dimana untuk memperoleh jumlah data pada iterasi kedua dengan: ℎ = ‡ ˆ ‡
¹I
ˆ = 17,5 ≈ 18 data. Sedangkan nilai ∑ =
d N
201.057,033. Dan model regresi linear berganda pada iterasi 1 adalah:
h = −682 + 37,2 5,42
3,80 8,8
¹
Universitas Sumatera Utara
Hasil Output Iterasi ke-1 Metode LTS Menggunakan SPSS 21
Universitas Sumatera Utara
Lampiran 8 Iterasi 2
No.
¹
h 8 − h :
1.
5,2 52
76 2,86
109
102,489 42,394
2.
6,3 59
100 2,95
276
254,389 467,034
3.
5,1 59
66 1,70
101
92,83551 66,659
4.
5,8 72
93 3,30
295
283,9873 121,279
5.
5,6 57
87 3,02
172
178,3381 40,172
6.
5,8 83
88 3,95
330
332,5531 6,518
7.
3,7 68
81 2,57
127
135,6398 74,647
8.
6,5 73
41 2,01
101
151,0395 2.503,954
9.
3,4 83
53 1,12
136
103,0099 1.088,344
10.
6,3 84
83 4,13
329
345,0836 258,682
11.
7,4 57
83 2,16
204
230,3445 694,034
12.
3,2 64
65 0,74
71
28,70136 1.789,175
13.
6,7 62
81 2,59
200
226,3314 693,341
14.
11,2 76
90 5,59
574
537,434 1.337,042
15.
5,3 57
99 2,60
184
197,0933 171,435
16.
6,7 51
43 1,89
65
50,82487 200,934
17.
2,6 74
86 2,05
118
131,2249 174,899
18.
3,7 76
94 2,40
203
213,1429 102,878
S 100,5 1.207 1.409 47,63 3.595 3.595,000
9.794,411
Dimana untuk memperoleh jumlah data pada iterasi ketiga dengan: ℎ = ‡
Ç
ˆ ‡
¹I
ˆ = 11,5 ≈ 12 data. Sedangkan nilai ∑ =
d N
9.794,411. Dan model regresi linear bergandanya adalah:
h = −682 + 40,4 5,13
2,94 10,5
¹
Universitas Sumatera Utara
Hasil Output Iterasi ke-2 Metode LTS Menggunakan SPSS 21
Universitas Sumatera Utara
Lampiran 9 Iterasi 3
No.
¼
½
¼
¾
¼
¿
¼
À
» »X
Ô
8»
Ô
− »X
Ô
:
¾
1. 5,8
83 88
3,95 330
325,491 20,331
2. 5,6
57 87
3,02 172
179,986 63,783
3. 5,2
52 76
2,86 109
101,532 55,771
4. 5,1
59 66
1,70 101
99,877 1,260
5. 3,7
68 81
2,57 127
124,910 4,366
6. 3,7
76 94
2,40 203
204,874 3,512
7. 5,8
72 93
3,30 295
284,235 115,895
8. 5,3
57 99
2,60 184
201,603 309,869
9. 2,6
74 86
2,05 118
116,704 1,680
10. 6,7
51 43
1,89 65
66,597 2,549
11. 6,3
84 83
4,13 329
339,649 113,406
12. 6,3
59 100
2,95 276
263,541 155,219
S 62,1
792 996
33,42 2.309
2.309,000 847,642
Model regresi linear bergandanya adalah: h = -649 + 48,3
5,06 3,06
1,42
¹
Dimana nilai residual: ∑
=
d N
847,642
Universitas Sumatera Utara
DAFTAR PUSTAKA
Draper, N. dan Smith, H. 1992. Analisis Regresi Terapan. Edisi Kedua. Bambang Sumantri. Jakarta: Gramedia Pustaka Utama.
Huber, Peter, J., and Ronchetti, Elvezio, M. 2009. Robust Statistics. A John Wiley and Sons, Inc., Publication. Hoboken. New Jersey.
Musafirah, Raupong, Nasrah. 2010. Perbandingan Metode Robust Least Trimmed Square LTS Dengan Metode Scale Dalam Mengestimasi Parameter
Regresi Linear Berganda Untuk Data Pencilan. Universitas Hasanuddin
Oktarinanda, Arista . Jurnal Ilmiah. Perbandingan LTS dan Scale Dalam Mengestimasi Parameter Regresi Linear Berganda. Universitas
Hasanuddin.
Rousseeuw, P.J., A. M. Leroy. 1987. Robust Regression and Outlier Detection. John Wiley Sons Inc: New York.
Ronald, E. Walpole. 1982. Pengantar Statistika. PT. Gramedia Pustaka Utama Jakarta.
Santoso, S. 2000. Buku Latihan SPSS Statistik Parametrik. Elex Media Komputindo. Jakarta
Sembiring. R.K . Analisis Regresi. ITB. Bandung Siregar, Sofyan. 2015. Statistika Terapan Untuk Perguruan Tinggi. PT.Kharisma
Putra Utama. Jakarta Siregar, Sofyan. Ir. 2014. Statistik Parametrik untuk Penelitian Kuantitatif. PT.
Bumi Aksara. Jakarta Suyanti, Sukestiryano, YL. Jurnal Ilmiah.2014. Deteksi Outlier Menggunakan
Diagnosa Regresi Berbasis Estimator Parameter Robust. Universitas Negeri Semarang.
Yamin, Sofyan., Rachmach, Lien, A., Kurniawan, Heri. 2011. Aplikasi dengan Software SPSS, EViews, MINITAB, dan STATGRAPHICS. Salemba
Empat. Jakarta
Universitas Sumatera Utara
BAB 3 HASIL DAN PEMBAHASAN
3.1. Least Trimmed Square LTS
Sebelum membahas mengenai least trimmed square LTS, akan dibahas terlebih dahulu sifat-sifat ke-equivariant-an yang harus dimiliki oleh suatu
estimator equivariant dalam statistik merujuk pada transformasi sebagaimana mestinya. Kebalikan dari equivariant yaitu invariant yang merujuk pada
kuantitas yang tetap tidak berubah, yaitu: regresi equivariant, skala equivariant, dan affine equivariant. Sifat-sifat tersebut diperlukan agar hasil
transformasi tetap dapat diartikan sama dengan data sebelum ditransformasi. Suatu estimator T disebut sebagai regresi equivariant jika memenuhi:
–+ , L + + 7; = 1,2, ⋯ , — = –+ , L ; = 1,2, ⋯ , — + 7 3.1
Dengan 7 merupakan sebarang vektor kolom. Regresi equivariant
digunakan dalam mendeskripsikan bagaimana studi Monte Carlo dilakukan dimulai
˜ = 0 , yang berarti hasil transformasi valid pada sebarang vektor
parameter. Suatu estimator T disebut sebagai skala equivariant jika memenuhi:
–+ , ™L ; = 1,2, ⋯ , — = ™ – + , L ; = 1,2, ⋯, — 3.2
untuk sebarang konstanta ™, skala equivariant menyebabkan bahwa kecocokan
secara esensial independen dari pemilihan satuan pengukuran pada variabel terikat
L . Sedangkan, suatu estimator adalah affine equivariant jika memenuhi:
– + š, L ; = 1,2, ⋯ , — = š
D
– + , L ; = 1,2, ⋯ , — 3.3
Universitas Sumatera Utara
untuk sebarang matrik persegi A yang nonsingular. Dimana affine equivariant menjelaskan transformasi linear dari
+ akan berpengaruh langsung pada estimator
, karena LM = + ˜ = + šš
D
˜ . Sehingga dengan demikian peubah bebas dapat menggunakan sistem kordinat lainnya tanpa berpengaruh
pada hasil estimasi LM .
Sifat Umum Estimator Regresi LTS
Estimator LTS mempunyai sifat regresi equivariant, skala equivariant, dan affine equivariant.
Regrsi Equivariant : ∑ L + 7 − + –7 + ˜—
:
= ∑ L − + ˜
: d
9N d
N
Skala Equivariant : ∑
™L − + –™˜—
:
= ™ ∑ L − + ˜
: d
9N d
N
Affine Equivariant : ∑
L –+ š—–š
D
˜—
:
= ∑ L − + ˜
: d
9N d
N
dengan 7
= vektor kolom sebarang ™
= konstanta sebarang š
= matriks bujur sangkar non-singular ˜
= Transformasi T
Teorema 3.1. Sebarang regresi equivariant dari estimator memenuhi:
∗
, ‹ ≤
•‡
›œ• C
ˆI €
3.5 pada seluruh sampel
‹. Menurut Rousseeuw least trimmed square LTS didefinisikan sebagai:
min
¡X
∑ ]
: N
3.6
Sebelumnya dengan menyusun residual kuadrat dari yang terkecil sampai dengan yang terbesar, yaitu:
:
≤
:
≤ ⋯ ≤
:
Dengan ℎ = ‡
ˆ + 1, sehingga LTS akan memiliki breakdown point yang sama dengan
Y
•‡
› C
ˆD[I €
Z dengan , merupakan variabel bebas dan notasi
Universitas Sumatera Utara
[] menyatakan bagian bilangan bulat terbesar yang kurang dari atau sama dengan bilangan bulat tersebut. Selain itu, untuk
ℎ = ‡ ˆ + ‡
[I
ˆ LTS yang mungkin mencapai nilai maksimum dari teorema 3.1.
Sifat ke-robust-an dari LTS didasarkan pada breakdown point-nya yang didefinisikan oleh Rousseeuw. Nilai breakdown point dari metode LTS
yang didefinisikan pada persamaan 3.5 dengan ℎ = ‡
ˆ + ‡
[I
ˆ sama dengan:
∗
, ‹ =
•‡
›œ• C
ˆI € `
Bukti: Asumsikan
bahwa semua
pengamatan dengan
variabel 8+ , + , ⋯ , +
[
: = 0 dihapuskan dan pengamatan-pengamatannya merupakan dalam keadaan umum. Yang dimaksud dalam keadaan umum adalah jika
sebarang , dari variabel bebas menentukan ˜ secara unik.
Langkah pertama adalah dengan menunjukkan bahwa
∗
, ‹ ≥
•‡
›œ• C
ˆI € `
karena sampel ‹ = – + , L ; = 1,2, ⋯ , — terdiri dari n titik dalam
kondisi yang umum, hal ini akan memenuhi: ¤ = inf –¦ 0; terdapat suatu , − 1 dimensi subruang dari § L = 0 ,
sedemikian hingga §′ meliputi sekurang-kurangnya , dari + — yang selalu
bernilai positif, dengan §′ adalah himpunan dari semua variabel bebas dengan
jarak terhadap § tidak lebih dari ¦. Andaikan ˜ meminimumkan persamaan
3.5 untuk ‹, dan dinotasikan dengan e yang berkorespondensi dengan
hyperplane yang diberikan dengan persamaan L = +˜ . Diberikan c =
Œ+ |] | dengan ] = L − + ˜ . Sekarang akan dikontruksikan sebarang sampel terkontaminasi
‹ = – +
, L ; = 1,2, ⋯, — dengan menyimpan
− ‡
D[
ˆ = ‡
I[I
ˆ pengamatan-pengamatan dari ‹ dan dengan menggantikannya yang lainnya dengan nilai-nilai yang berubah-ubah. Hal ini
cukup untuk
membuktikan bahwa
‖˜ − ˜ ‖ terbatas, dengan ˜′
berkorespondensi terhadap ‹′ yang dinotasikan dengan e′, jadi hyperplane e′
Universitas Sumatera Utara
yang berkorespondensi merupakan hal yang berbeda dari e . Tanpa
kehilangan keumumannya dapat diasumsikan bahwa ˜′ ≠ ˜ , karena itu
e′ ≠ e. Dengan teorema dimensi dari aljabar linear, irisan dari
e ∩ e′ mempunyai dimensi
, − 1. Jika ,]e ∩ e′ merupakan proyeksi vertical dari e ∩ e′ terhadap L = 0 , sehingga diasumsikan paling banyak , − 1 dari +
yang baik bukan pencilan dapat terletak pada 8,] e ∩ e′ :
¬
. Sekarang didefinisikan
š sebagai himpunan pengamatan-pengamatan baik yang tersisa. Kemudian misalkan sebarang
+
m
, L
m
termasuk di š dan ]
m
= L
m
− +
m
˜ dan ]
m
= L
m
− +
m
˜ . Kontruksikan vertical plane 2-dimensi
-
m
melalui +
m
, L
m
dan tegak lurus terhadap ,] e ∩ e
. Sebelumnya akan dikontruksikan nilai residual pada
-
m
yaitu sebagai berikut menurut Rousseeuw: |] | = |+ ˜ − L | ≥ ®|+ ˜| − |L |® dengan |+ ˜| ¤|tan ~ | , dengan ~
merupakan sudut dalam •−
±
,
±
€ yang dibentuk antara e dengan garis horizontal pada
-
m
. Oleh karena itu, |~| merupakan sudut antara garis tegak
lurus terhadap e dan 0,1 , karena itu:
|~| = ]™™6•² | −˜, 1 0,1
| ‖−˜, 1‖‖0,1‖ ³ = ]™™6•²−
1 ´1 + ‖˜‖
³
Dan akhirnya diperoleh |tan ~ | = ‖˜‖.
Berdasarkan pernyataan diatas, maka: |
m
−
m
| = |+
m
˜ − +
m
˜| ¤|tan ~ − tan ~ |
≥ ¤®|tan ~ | − |tan ~ |®
= ¤|‖˜ ‖ − ‖˜‖|
Karena ‖˜
− ˜‖ ≤ ‖˜‖ + ‖˜ ‖ = 2‖˜‖ + ‖˜
‖ − ‖˜‖ ≤ |‖˜ ‖ − ‖˜‖| + 2‖˜‖
Berdasarkan pertidaksamaan diatas diperoleh: |
m
−
m
| ¤ ‖˜ − ˜‖ − 2‖˜‖
Universitas Sumatera Utara
dengan
m
dan
m
adalah residual yang berhubungan dengan e dan e
berkorespondensi dengan titik +
m
, L
m
. Sekarang diperoleh jumlah ℎ residual
kuadrat pertama dari sampel baru ‹
yang berhubungan dengan ˜ yang
sebelumnya, dimana sekurang-kurangnya nilai ‡
I[I
ˆ ≥ ℎ dari residual- residual ini menjadi sama seperti sebelumnya, yaitu kurang dari atau sama
dengan ℎc . Karena ˜
berkorespondensi dengan ‹
berdasarkan pernyataan ini diperoleh:
∑ L
− + ˜
:
≤ ℎc
d N
3.7 Jika diasumsikan bahwa:
‖˜ − ˜‖ ≥ 2‖˜‖ + c
1 + √ℎ ¤
Maka untuk semua di š memenuhi
|
m
−
m
| ¤ ‖˜ − ˜‖ − 2‖˜‖ ≥ c 1 + √ℎ
Jadi, |
m
| ≥ |
m
−
m
| − |
m
| c81 + √ℎ: − c = c√ℎ Sekarang perhatikan bahwa
− |š| ≤ ℎ − 1. Oleh karena itu, himpunan ℎ dari
+ , L
harus terdiri sekurangnya satu dari +
m
, L
m
, maka: ∑
L − +
˜
:
≥
m
ℎc
d N
3.8 Suatu kontradiksi. Ini menyebabkan bahwa
‖˜ − ˜‖ 2‖˜‖ + c
1 + √ℎ ¤
∞
Untuk semua sampel ‹
. Langkah kedua adalah mendapatkan pertidaksamaan sebaliknya yaitu
∗
, ‹ ≤
•‡
›œ• C
ˆI € `
yang diperoleh berdasarkan teorema 3.1 dan lemma 3.1.
Universitas Sumatera Utara
Cara lain menginterpretasikan persamaan 3.5 adalah dengan mengasumsikan bernilai terbatas jika nilainya lebih dari
+ , − 1 pengamatan dan tidak terkontaminasi nilai dari h. Dimana
ℎ menghasilkan nilai yang maksimum dari breakdown point. Di sisi lain, jumlah pengamatan yang tidak baik
− |š| harus tetap kurang dari
ℎ dan |š| − 1 ≥ − ℎ dan |š| − 1 ≥ ℎ − , , yang menghasilkan
ℎ = ‡ ˆ + ‡
[I
ˆ. Pada umumnya, ℎ mungkin bergantung pada beberapa proporsi trimming
~ , dengan menggunakan ℎ = 2 1 − ~ 3 + 2~ , + 1 3~ atau ℎ = 2 1 − ~ 3 + 1 . Maka dengan breakdown point
∗
sama dengan proporsi ~. Untuk ~ mendekati 50, maka akan didapatkan LTS
estimator, sedangkan untuk ~ mendekati 0 maka diperoleh OLS estimator.
Suatu estimator LTS juga akan memenuhi sifat kecocokan yang tepat yang dinyatakan sebagai berikut:
Jika terdapat beberapa ˜ sedemikian hingga cendrung lebih dari + , − 1
dari suatu observasi yang memenuhi L = + ˜ secara tepat dan dalam posisi
umum, maka penyelesaian LTS sama dengan ˜ apapun bentuk observasinya.
LTS mempunyai kekonvergenan
D
F C
dengan efisiensi keasimptotikan terhadap distribusi normal.
Langkah-langkah penentuan estimasi dengan menggunakan LTS adalah sebagai berikut:
1. Bentuk
− ℎ + 1 subsampel dengan tiap subsampel terdiri dari ℎ observasi.
2. Setiap subsampel dihitung:
LM = 1
ℎ S L
: d
N
⋮ LM
DdI
= 1
ℎ S L
: NDdI
Universitas Sumatera Utara
3. Hitung jumlah kuadrat dari tiap subsampel:
„ = S·L
:
− LM ¸
d N
⋮ „
DdI
= S ·L
:
− LM
DdI
¸
NDdI
4. Solusi yang dipilih adalah
LM
9
yang memberikan nilai „
9
paling kecil.
3.2. Contoh Ilustrasi Kasus