3 diagnosa model pemeriksaan sisaan
Analisis Regresi 1
Pokok Bahasan :
Diagnosa Model Melalui Pemeriksaan
Sisaan dan I dentifikasi Pengamatan
BerpengaruhSisaan Sisaan adalah menyimpangnya nilai amatan y i terhadap dugaan nilai harapannya
) ) ) E [Y | x ] → E [Y | x ] = y = + b b x i i i 1 i
) e y y
= − Sisaan untuk suatu amatan ke-i: i i i
Bisa digunakan untuk ˆ y − y e
( ) i i i memeriksa kebenaran
= = r
Sisaan baku i ε i menyebar N(0,1) s s y y
− ˆ
( ) i i
σ
1 Kurang tepat sebab x x
- 2
− ( ) i
e
i
n2 ragam (e ) = s (1-h ) r = , h = i ii
i ii
n2
s − h ( 1 ) ii x − x
( ) k
∑ Contoh: menghitung sisaan Berikut adalah 1 set (25 pengamatan) data berpasangan x1 dan y yang didapat dari sebuah percobaan. Dari data ini ingin diketahui model matematika hubungan antara x1 dan Y.
i
1
2
3
4
5
6
7
8
9
10
11
12
13 Y
10.98
11.13
12.51
8.4
9.27
8.73
6.36
8.5
7.82
9.14
8.24
12.19
11.88 X1
20
20
23
20
21
22
11
23
21
20
20
21
21 i
14
15
16
17
18
19
20
21
22
23
24
25 Y
9.57
10.94
9.58
10
8.11
6.83
8.88
7.7
8.47
8.86
10.4
11.08 X1
19
23
20
22
22
11
23
20
21
20
20
22 Contoh: menghitung sisaan (lanjutan)
Scatterplot of Y vs X1 13 Dari tebaran x1 terhadap Y digunakan 12 persamaan garis regresi linier sederhana 11 ordo satu :
1 Dengan Minitab didapatkan dugaan 8
Y x = + + β β ε Y 10 9
ˆ 7 persamaannya : = 3.56 + 0.290 X1 Y 6 10 12 14 16 X1 18 20 22 24 Untuk setiap amatan dihitung nilai dugaannya, kemudian hitung sisaannya
Contoh: menghitung sisaan (lanjutan)
Y duga = 3.56 + 0.290 X1 sisaan ke i = amatan ke-i – dugaan pd titik x ke-i
i1
2
3
4
5
6
7
8
9
10
11
12
13 y
10.98
11.13
12.51
8.40
9.27
8.73
6.36
8.50
7.82
9.14
8.24
12.19
11.88 y_duga
9.35
9.35
10.22
9.35
9.64
9.93
6.75
10.22
9.64
9.35
9.35
9.64
9.64 sisaan
1.63
1.78 2.29 -0.95 -0.37 -1.20 -0.39 -1.72 -1.82 -0.21 -1.11
2.55
2.24 i
14
15
16
17
18
19
20
21
22
23
24
25 y
9.57
10.94
9.58
10.09
8.11
6.83
8.88
7.68
8.47
8.86
10.36
11.08 y_duga
9.06
10.22
9.35
9.93
9.93
6.75
10.22
9.35
9.64
9.35
9.35
9.93 sisaan
0.51
0.72
0.23 0.16 -1.82 0.08 -1.34 -1.67 -1.17 -0.49
1.01
1.15 I nformasi-informasi yang Didapat Melalui Sisaan
Bisa melihat pola sebaran peubah acak Y
Melalui sisaan, kita dapat mengetahui apakah asumsi-asumsi yang disyaratkan pada pendugaan dengan MKT dipenuhi atau tidak
Melalui sisaan, kita juga dapat menguji parameter regresi, sehingga kita perlu mengetahui sebaran sisaan
Melalui sisaan, kita juga bisa melihat apakah model yang kita pilih pas atau tidak
Melalui sisaan, kita juga bisa melihat apakah sebuah pengamatan merupakan pencilan atau bukan
Melalui sisaan, kita juga bisa melihat apakah sebuah pengamatan merupakan pengamatan berpengaruh atau bukan
Pemeriksaan Pola Sebaran Peubah Respon Y
- Y =
- x β
β ε
1 MODEL REGRESI Acaknya Y disebabkan E [ Y | x ] i karena acaknya eror
Acak Acak Fix ε
Bentuk sebaran Y = bentuk sebaran eror Memeriksa bentuk sebaran Y = memeriksa bentuk sebaran eror
Plot Sisaan untuk: Pemeriksaan Bentuk Sebaran S is a a n Fr e k u e n s i
3 2 - 2 1 - 1 - 3 4 3 2 1 N o r m a l H i s t o g r a m S i s a a n
Tebaran sisaan dan histogram di samping untuk melihat : BENTUK SEBARAN SI SAAN, simetri atau tidak
HASI L DI AGNOSA : Sebaran sisaan agak menjulur ke kanan
Plot Sisaan untuk: Pemeriksaan Sebaran Normal Sisaan P e lu a n g n o rm a l
- 2 1 -1 -3 -4 99 95 90 80 70 60 50 40 30 20 10 5 1 Normal - 95% CI Probability Plot of Sisaan
- 10
- 20
- 30
- 40
- Sisaan di sekitar nilai nol / tidak
- Lebar pita sisaan sama atau tidak
- 1
- 2
- Tebaran berpola atau tidak
- 0,5
- 1,0
- 1,5
- 5
- 10
- 1
- 2
- 1
- Tebaran tidak membentuk pola
- 2
- 2
- 1
- 1
- 2
- 3
- 4 1,0 1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 1,0 1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8
- Hasil PRESS melalui proses = hasil Minitab
- Y = 3,00 + 0,500 X
- Amatan ke-3 memberikan
- Dugaan parameter regresi
- -1
- Hitung nilai
- i
- 8.15 12 -0.75518
- mampu memperbaiki pola tebaran sisaan yang tadinya berpola (garis lurus) • harus dilakukan dengan kehati-hatian yang tinggi.
- 1
- -2,50
- 0,72 1,6 4,29 0,50 0,49 0,11 1,6 3,33 -0,47 -0,45 -0,11 1,6 3,10 -0,70 -0,68 -0,16 4 15,00 0,42 1,34
5
4
3
2
Plot sisaan terhadap peluang Normal untuk : Mencocokkan apakah sebaran sisaan merupakan sebaran Normal atau tidak. Ya jika pola tebaran membentuk garis lurus Hasil Diagnosa : bisa dianggap lurus Æ menyebar Normal
Plot Sisaan untuk: Melihat Ketidakpasan Model Plot SI SAAN vs Y duga
Plot sisaan vs y_ duga
Plot sisaan terhadap
40 y_duga masih berpola
30 (kuadratik)
20
Sisaan masih
10 n a mengandung a is s komponen kuadratik
Model belum pas Æ
model harus ditambah
dg komponen kuadratik 50 100 150 200 y_duga
1
untuk semua nilai dugaan Æ kehomogenan ragam
Æ nilai harapan
ε Kondisi Gauss-Markov Pada tebaran sisaan terhadap nilai dugaan Y dapat dilihat :
E E ε ε σ ε
⇒ =
j i
i
2
i ⇒ ≠ = ⇒ =2
1
] penuhi tidak ter E[ 2. ] terpenuhi [ .
Plot Sisaan vs y_duga , terpenuhi j i ] [ 3.
2
3
7.0
7.5
8.0
8.5
9.0
9.5
10.0
10.5
Plot Sisaan untuk : Pemeriksaan Asumsi MKT y_duga s is a a n
Æ ketidakpasan model Æ sisaan bebas atau tidak Plot SI SAAN vs Y duga
Y i
Pola tebaran sisaan memenuhi asumsi MKT: berpusat di NOL, lebar pita sama, tidak berpola Pola tebaran sisaan yang tidak memenuhi asumsi MKT:
Ragam tidak homogen (perlu analisis kua- drat terkecil terboboti; atau transformasi thdp Y) Penyimpangan terhadap persamaan regresi bersifat sistematis; atau karena tdk disertakannya kedalam model
β Model tidak pas (perlu suku-suku lain dalam model atau transformasi thdp Y) Transformasi untuk : Menghomogenkan Ragam Transformasi terhadap peubah respon Y
2 b
Anggap : σ = a μ Setelah respon Y ditransformasi, lakukan analisis regresi seperti biasa,
1 jika b = 4 ⇒ Y* = sisaan harus diperiksa lagi, jika masih
Y belum memenuhi asumsi, model
1 diubah, kemungkinan ada suku b = 3 ⇒ Y* = Y nonlinier yg belum masuk model, atau lakukan pendugaan dg MKT b = 2 ⇒ Y* = ln Y terboboti. b = 1 ⇒ Y* = Y
Contoh Transformasi untuk Menghomogenkan Ragam Fitted Value R e s id u a l
25
20
15
10
5
10
5
Residuals Versus the Fitted Values (response is Y)
Fitted Value
R
e
s
id
u
a
l
5,0 4,5 4,0 3,5 3,0 2,5 1,0 0,5 0,0
Residuals Versus the Fitted Values (response is akar Y)
Plot Sisaan vs Y duga “data asli” Plot Sisaan vs “data transformasi Y*= “
Y Yˆ Plot Sisaan untuk: Pemeriksaan Kebebasan Sisaan Scatterplot of RESI 1 vs urutan Plot sisaan terhadap urutan
2 untuk : Memeriksa apakah sisaan
1 bebas satu dengan lainnya atau tidak. Bebas jika tdk
I1 S E . membentuk pola
R
Hasil Diagnosa : Tebaran tidak membentuk
pola
2
4
6
8
10
12 urutan
Æ Sisaan saling bebas
Pola tebaran sisaan yang menginformasikan bahwa pengaruh waktu belum diperhitungkan
Ragam tidak homogen (perlu analisis kuadrat terkecil terboboti) Suatu suku linier dalam waktu harus ditambahkan ke dalam model Suku linier dan kuadratik dalam waktu perlu ditambahkan ke dalam model
Pengaruh waktu jangka panjang tidak mempengaruhi data.
Pola Tebaran Sisaan terhadap Urutan Waktu
Plot Sisaan untuk: Pemeriksaan Pengaruh Waktu Scatterplot of RESI 1 vs urutan Plot sisaan terhadap urutan
2 waktu yg jaraknya sama.
Perhatikan :
1 Æ lebar pita sama/ tidak
I1 Æ berpola/ tidak
S E R
Hasil Diagnosa : Lebar pita sama Æ • homogen
Æ tidak perlu ditambahkan penga-
2
4
6
8
10
12 urutan ruh waktu ke dalam model Sisaan Terstandardkan (Sisaan Terbakukan) Bisa digunakan untuk y − y ˆ e
( ) i i i r
SI SAAN TERBAKUKAN : = = memeriksa kebenaran
ε i s s menyebar N(0,1) y − ˆ y
( )
i i
σ Sisaan akan memiliki Pd sebaran Normal Baku peluang nilai r i ragam yg relatif besar terletak antara -1,96 s.d 1,96 adalah jika x di sekitar 95% . Æ | r | > 2 patut dicurigai i x i
2
1 x − x
( )
i e i ragam(e )= s , kurang tepat n i r = , h = i ii
2
2 Æ ragam(e ) = s (1- h ) i ii s ( 1 − h ) x − x
( ) ii k
∑ e = sisaan amatan ke-i i n = banyaknya pengamatan
2 s = dugaan bagi ragam Y Æ KT i sisaan
h = unsur diagonal ke-i matriks H = X(X’X) X’ ii Sisaan Terstandarkan (Sisaan Baku) (lanjutan)
Plot Sisaan e vs Dugaan Y Plot Sisaan Baku r vs Dugaan Y
i iResiduals Versus the Fitted Values Scatterplot of SRES1 vs FI TS1 (response is ln(y)) 1,0
1 0,5 l
1 a S
0,0 u
E
id R s S e R
Fitted Value FITS1 Pola tebaran plot sisaan e dan r tidak berbeda. i i
Æ pemeriksaan sisaan thdp pola tebaran, keduanya dapat digunakan
Nilai PRESS
PRESS = Prediction Sum of Squares, adalah prosedur
yang merupakan kombinasi dari: semua kemung-kinan regresi, analisis sisaan, dan teknik validasi.
Digunakan untuk mengukur validitas model.: nilai respon pada x=x i
= R 2 pred adalah statistik la- innya yg berhub dg PRESS. Model valid jika R
⎝ ⎛
−
n i ii i he
= ⎟⎟ ⎠ ⎞ ⎜⎜
1 ∑
1
2
ˆ
− ,
(data lengkap) : nilai ramalan y pd x=x i yg diramal melalui dugaan persamaan regresi dari data tanpa amatan ke-i Model valid jika memiliki PRESS yg kecil i i y
− − = y y i PRED y i
( ) ( )
1 R ∑
2 PRESS
2
y y ( )
−i i i
∑ ∑ = − =
e ˆ PRESS
2 ,
2 i,-i
2 pred besar. Nilai PRESS (lanjutan)
PROSEDUR PRESS
Mis. k adalah banyaknya peubah dalam suatu persamaan regresi,
n adalah banyaknya amatan Langkah-langkahnya: 1. Sisihkan amatan ke-1, amatan ke-1 tidak digunakan, data tinggal n-1.
2. Dugalah semua ”kemungkinan model regresi” thdp n-1 data tersebut. (jika
k=1Æ banyaknya ”kemungkinan model” hanya 1)3. Ramal y dengan model yang didapat pd no.2. (lakukan untuk semua
1 kemungkinan model Æ hanya 1 jika k=1)
ˆ y y
− k
1
1
4. Hitung perbedaan y yg disisihkan tadi dengan hasil no.3. Æ
1 5. Ulangi langkah 1-4 dengan menyisihkan amatan ke-2, ke-3,...., ke-n.
Didapat y y ˆ y y ˆ y y ˆ
− , − , ..., − k k n nk
2
2
3
3
2 n
ˆ PRESS = y − y
( ) i ik
6. Untuk setiap model regresi yang mungkin hitung : ∑ i =
1
7. Pilih model yang relatif memiliki nilai PRESS terkecil, dan melibatkan peubah penjelas sedikit.
Nilai PRESS (lanjutan)
9 Y tnp 4 = 3,04 + 0,500 X tnp 4 7,54 -0,43 0,18490 7,81
5 Y tnp 11 = 2,88 + 0,511 X tnp11 5,435 0,295 0,08703
7 Y tnp 10 = 3,03 + 0,498 X tnp10 6,516 -0,096 0,00921 5,73
12 Y tnp 9 = 2,84 + 0,528 X tnp 9 9,176 -1,026 1,05267 6,42
4 Y tnp 8 = 2,72 + 0,526 X tnp 8 4,824 0,566 0,32035 8,15
6 Y tnp 7 = 2,97 + 0,502 X tnp 7 5,982 0,098 0,00960 5,39
14 Y tnp 6 = 2,46 + 0,577 X tnp 6 10,538 -1,698 2,88320 6,08
11 Y tnp 5 = 2,95 + 0,514 X tnp 5 8,604 -0,794 0,63043 8,84
13 Y tnp 3 = 4,01 + 0,345 X tnp 3 8,495 4,245 18,02003 7,11
Y
8 Y tnp 2 = 3,05 + 0,497 X tnp 2 7,026 -0,256 0,06553 12,74
10 Y tnp 1 = 3,01 + 0,505 X tnp 1 8,06 -0,6 0,36 6,77
kuadrat 7,46
e i,-i
i,-i
e
X Dugaan Garis Regresi dg Data tanpa amatan ke-i ramalan Yi tnp amatan ke-i
Total = PRESS = 23,6229
Contoh Proses PRESS, untuk n= 11 dan k= 1
Nilai PRESS (lanjutan)
Output Minitab untuk data contoh tsb
The regression equation is
Untuk k=1 hanya ada 1 model
Predictor Coef SE Coef T P
simpangan ramalan terbesar
Constant 3,002 1,124 2,67 0,026
Amatan ke-3 dapat dipandang •
X 0,4997 0,1179 4,24 0,002
sebagai amatan berpengaruh
S = 1,23631 R-Sq = 66,6% R-Sq(adj) = 62,9%
tanpa amatan ke-3 sangat PRESS = 23,6210 R- Sq( pred) = 42,70% berbeda dg lainnyaÆ dugaan
Analysis of Variance
yg ini relatif yg benar/baik
Source DF SS MS F P Regression 1 27,470 27,470 17,97 0,002 Residual Error 9 13,756 1,528 Total 10 41,226 Keluarkan amatan ke-3 dari analisis.
2 Cek nilai PRESS-nya. Cek nilai R nya The regression equation is Y tnp 3 = 4,01 + 0,345 X tnp 3 Predictor Coef SE Coef T P Constant 4,00619 0,00221 1811,78 0,000 X tnp 3 0,345334 0,000237 1454,74 0,000 S = 0,00308655 R-Sq = 100,0
PRESS = 0,000174853 R-Sq(pred) = 100,00%
Analysis of Variance Source DF SS MS F P Regression 1 20,161 20,161 2116264,34 0,000 Residual Error 15 0,000 0,000 Total 16 20,161
Output Minitab data lengkap Output Minitab data tanpa amatan ke-3
The regression equation is Y = 3,00 + 0,500 X Predictor Coef SE Coef T P Constant 3,002 1,124 2,67 0,026 X 0,4997 0,1179 4,24 0,002 S = 1,23631 R-Sq = 66,6%
PRESS = 23,6210 R-Sq(pred) = 42,70%
Analysis of Variance Source DF SS MS F P Regression 1 27,470 27,470 17,97 0,002 Residual Error 9 13,756 1,528 Total 10 41,226
Nilai PRESS (lanjutan)
Menyisihkan amatan ke-3 mempengaruhi dugaan parameter, menurunkan nilai PRESS
Dari sisi model, “persamaan tanpa amatan ke-3” yg terbaik. R-Sq(pred)=100,00% Æ model sangat valid Æ PELUANG salah memprediksi = 0X Y 15,0 12,5 10,0 7,5 5,0
3 15,0 12,5 10,0 7,5 5,0
Dugaan garis regresi tanpa amatan ke-3 PRESS = 0,000174853 R-Sq(pred) = 100,0%
(lanjutan) Dugaan garis regresi dg data lengkap PRESS = 23,6210 R-Sq(pred) = 42,70%
5 Fitted Line Plot Y tnp 3 = 4,006 + 0,3453 X tnp 3 Nilai PRESS
6
7
8
9
4 Fitted Line Plot Y = 3,002 + 0,4997 X X tnp 3 Y t n p
13
5
6
7
8
9
10
11
12
Semakin kecil nilai PRESS-nya Æ model semakin valid Æ semakin baik untuk memprediksi. Setiap 1 model regresi thdp 1 set data memiliki 1 nilai PRESS
Pencilan “Pencilan adalah pengamatan yang nilai mutlak sisaan- nya jauh lebih besar daripada sisaan-sisaan lainnya”
Bisa jadi terletak pada tiga atau empat simpangan
baku atau lebih jauh lagi dari rata-rata sisaannya.
Keberadaan pencilan harus diperiksa dengan seksama, apakah pencilan itu merupakan kesalahan dalam pencatatan amatan atau pencilan tersebut muncul dari kombinasi keadaan yang tidak biasa yang mungkin saja sangat penting dan perlu diselidiki lebih jauh.
Pencilan (lanjutan)
Plot antara Sisaan e vs dugaan Y Plot antara Sisaan r vs dugaan Y i i i i 3 Scatterplot of Sisaan baku-2 vs dugaan-Y2 Scatterplot of sisaan2 vs dugaan-Y2 3 a -2 a k u b n a
2 1 is a a n 2 s 1 2 S is -1
5 6 7 dugaan- Y2 8 9 10 5 6 7 dugaan- Y2 8 9 10 Dugaan persamaan regresi Y = 3.00 + 0.500 X dgn R-Sq = 66.6% • Pola tebaran sisaan thdp e dan r sama • i i
Ada sisaan yang nilainya sangat besar Æ potensi sebagai pencilan •
Pencilan (lanjutan)
Y X r i i i
MENDETEKSI PENCI LAN 7.46 10 -0.46018 e
i
6.77 8 -0.19633
r = i
12.74 13 2.99999 s
1 h
−
( ) ii7.11 9 -0.33085
2 7.81 11 -0.59695
x − x
( )
1 dengan h = n ii n
8.84 14 -1.13497
2 x − x
( ) k
∑
6.08 6 0.07042 i =
1
5.39 4 0.3807
Jika nilai | ri| > 2, amatan tsb 6.42 7 -0.06974 dapat dikatakan sebagai
5.73 5 0.21188 pencilan
(lanjutan) Pencilan
DATA LENGKAP DATA TANPA PENCI LAN
12 13 Scatterplot of Y-3 vs X-3 12 13 Scatterplot of Y tnp pclan vs X tnp pclan -3 Y 10
11 9 p la c n n p 10 11 9 6 7 8 Y t 6 7 8 5 5,0 7,5 10,0 12,5 15,0 5,0 7,5 10,0 12,5 15,0 X- 3
5 X t np pclan Y = 3.00 + 0.500 X Y = 4.01 + 0.345 X
Predictor Coef SE Coef T P Predictor Coef SE Coef P Constant 3.002 1.124 2.67 0.026 Constant 4.00565 0.00292 0.000 X 0.4997 0.1179 4.24 0.002 X 0.345390 0.000321 0.000 S = 1.23631
S = 0.00308168
R-Sq = 66.6% R-Sq = 100.0%
(lanjutan) Pencilan
Plot sisaan baku (r ) vs dugaan Y
iData Lengkap Data Tanpa Pencilan 3 Scatterplot of sisaan2 vs dugaan-Y2 Scatterplot of s baku tnp pcl vs dugaan tnppcl 1.5 2.0 s 2 a a is n 1 2 l a c k p u t n p
1.0 0.0 0.5 -1 s b -0.5 -1.0 5 6 7 dugaan- Y2 8 9 10 -1.5 5 6 dugaan t nppcl 7 8 9 Tebaran berpola, karena (1) ada Tebaran tidak berpola, menyebar di se- pencilan, atau (2) model tidak pas kitar nilai nol, lebar pita relatif sama Mengeluarkan data pencilan dari analisis:
Amatan Berpengaruh :
AMATAN BERPENGARUH
berkaitan dengan besarnya perubahan yang terjadi pada dugaan parameter regresi jika pengamatan tersebut disisihkan
X1
1
1 1 1,2 1,2 1,2 1,3 1,3 1,3 1,4 1,4 1,4 1,5 1,5 1,5 1,6 1,6 1,6 4,0 Y1 2,11 1,39 0,78 2,02 2,46 3,67 2,56 1,74 1,88 5,15 2,41 2,00 3,56 3,09 0,78 4,29 3,33 3,10 15,00 16 Scatterplot of Y1 vs X1 12 14 Unusual Observations 10 Obs X1 Y1 Fit SE Fit Residual St Resid Y 1 8
10 1,40 5,147 2,895 0,244 2,252 2,19 R 6 15 1,50 0,776 3,345 0,243 -2,569 -2,50 R 2 4
19 4,00 15,000 14,576 1,009 0,424 1,34 X R denotes an observation with a large standardized residual. 1,0 1,5 2,0 2,5 3,0 3,5 4,0 X1 X denotes an observation whose X value gives it large influence.
Amatan Berpengaruh (lanjutan)
OUTPUT MINITAB
The regression equation is
Hasil analisis regresi dari Y1 = - 3,39 + 4,49 X1 data tersebut menunjukkan
S = 1,05749 R-Sq = 88,8% R-Sq(adj) = 88,1% bahwa ada 3 amatan yg
aneh, yaitu amatan ke
Analysis of Variance
10,15, dan 19. Amatan 10
Source DF SS MS F P
dan 15 berpotensi sebagai
Regression 1 150,10 150,10 134,22 0,000 Residual Error 17 19,01 1,12
pencilan. Amatan 19
Total 18 169,11
berpotensi sebagai amatan berpengaruh
Unusual Observations Obs X1 Y1 Fit SE Fit Residual St Resid 10 1,40 5,147 2,895 0,244 2,252 2,19 R
15 1,50 0,776 3,345 0,243 -2,569 -2,50 R
Bandingkan dg data tanpa
19 4,00 15,000 14,576 1,009 0,424 1,34 X
amatan 19. Apakah perubahan dugaan para-
R denotes an observation with a large standardized residual.
meter regresi cukup nyata? X denotes an observation whose X value gives it large influence. The regression equation is
Y1 = - 1,26 + 2,88 X1
S = 1,03065 R-Sq = 25,4% R-Sq(adj) = 20,8% Analysis of Variance Source DF SS MS F P Regression 1 5,797 5,797 5,46 0,033 Residual Error 16 16,996 1,062 Total 17 22,793 Unusual Observations Obs X1 Y1 Fit SE Fit Resid St Resid 10 1,40 5,147 2,764 0,256 2,383 2,39 R
15 1,50 0,776 3,052 0,318 -2,276 -2,32 R The regression equation is
Y1 = - 3,39 + 4,49 X1
S = 1,05749 R-Sq = 88,8% R-Sq(adj) = 88,1% Analysis of Variance Source DF SS MS F P Regression 1 150,10 150,10 134,22 0,000 Residual Error 17 19,01 1,12 Total 18 169,11 Unusual Observations Obs X1 Y1 Fit SE Fit Resid St Resid 10 1,40 5,147 2,895 0,244 2,252 2,19 R
15 1,50 0,776 3,345 0,243 -2,569 -2,50 R 19 4,00 15,000 14,576 1,009 0,424 1,34 X
Analisis Regresi thdp Data Lengkap An Regresi thdp Data Tanpa Amatan 19
Penyisihan “pengamatan berpengaruh” mengubah secara berarti dugaan persamaan regresiAmatan Berpengaruh (lanjutan)
Amatan Berpengaruh (lanjutan)
Dugaan Garis Regresi Data Lengkap Dugaan Grs Regresi Data Tnp Amatan 19
Fitted Line Plot 16 14 Y1 = - 3,394 + 4,493 X1 16 14 Y1 tnp amatan 19 = - 1,265 + 2,878 X1 tnp amatan 19 Fitted Line Plot 1 Y 1012 8 a ta n 1 9 m a 12 10 8 4 6 2 Y p 1 t n 4 6 1,0 1,5 2,0 2,5 3,0 3,5 4,0 X1
2 1,0 1,5 2,0 2,5 3,0 3,5 4,0 X1 t np amat an 19 Penyisihan AMATAN BERPENGARUH menyebabkan perubahan dugaan kemiringan garis. BERBAHAYA, apabila pemanfaatan hasil analisis regresi bertumpu pada
Æ pemaknaan parameter
Amatan Berpengaruh (lanjutan)
Statistik Uji untuk Mendeteksi Amatan Berpengaruh Pengaruh titik data ke-i diukur dengan jarak :
2
2
⎧ ⎫ ⎧ ⎫1 e h i ii
D =
1 i ⎨ ⎬ ⎨ ⎬
2 1 − h p
1 s − h
( ) ii ii ⎩ ⎭
⎩ ⎭ Keterangan:
2 s = dugaan bagi ragam Y = KT i sisaan
h = unsur diagonal ke-i matriks H = X(X’X) X’ ii
Nilai D dibandingkan dengan F . Dengan n = banyaknya i (p,n-p; 1- α) pengamatan dan p = banyaknya parameter D > F . menandakan bahwa amatan ke-i berpengaruh. i (p,n-p;1- α)
Amatan Berpengaruh (lanjutan)
X (i) Y (i) e (i) r (i) D (i) 1 2,11 1,01 1,00 0,30 1 1,39 0,30 0,29 0,09 1 0,78 -0,32 -0,32 -0,09
1,2 2,02 0,02 0,02 0,01 1,2 2,46 0,46 0,45 0,11 1,2 3,67 1,68 1,64 0,45 1,3 2,56 0,11 0,11 0,03 1,3 1,74 -0,71 -0,69 -0,17 1,3 1,88 -0,56 -0,55 -0,13 1,4 5,15 2,25
2,19 0,59 1,4 2,41 -0,49 -0,47 -0,11
1,4 2,00 -0,90 -0,87 -0,21 1,5 3,56 0,21 0,21 0,05 1,5 3,09 -0,26 -0,25 -0,06 1,5 0,78 -2,57
4,40 Dugaan persamaan regresi DATA LENGKAP : Y1 = - 3,39 + 4,49 X1 Banyaknya parameter = 2 Æ p = 2 Banyaknya pengamatan = 19 Æ n = 19 Pengamatan ke -19 memiliki nilai D
19 = 4,40 Dengan
α = 5% Nilai tabel F (p,n-p; 1- α)
= F (2,17; 0,95)
= 3,59 D
19 > F
(2,17; 0,95) Dengan α = 5%, amatan ke 19 (terakhir) merupakan amatan berpengaruh.
CONTOH PENGGUNAAN D i
Amatan Berpengaruh
(lanjutan)