Analisis Variansi dan Statistik Matemati
Analisis Variansi dan Statistik Matematika Yang Terkait
http://oc.its.ac.id/jurusan.php?fid=1&jid=3
Wiwiek Setya Winahju
wiwiek@statistika.its.ac.id
Analisis Variansi merupakan alat yang digunakan
untuk mengevaluasi kebaikan model regresi. Model
regresi yang baik, salah satunya ditandai oleh tingginya koefisien determinasi, dinotasikan R2 atau
2
Radj
, yang dapat dihasilkan oleh Tabel Analisis
Va-riansi.
n
(Yˆ
Y )(Yi Yˆi ) 0
i
i 1
Bukti :
Review b0 dan b1 :
n
Apabila terdapat himpunan data random yang saling
independen, dan tidak ada faktor yang mempengaruhi, maka data tersebut akan bervariasi terhadap
meannya. Pada data random yang dipengaruhi oleh
suatu faktor, variasi terhadap pengaruh faktor ikut
berkontribusi.
b1
(X
n
(X
i
X )2
b0 Y b1 X
n
n
i
i 1
n
(Yˆ
Y )(Yi Yˆi ) b1 ( X i X ){(Yi Y ) b1 ( X i X )}
i
Yi Yˆi
Y )(Yi Yˆi ) b1 ( X i X ){(Yi Y ) b1 ( X i X )}
i 1
n
i 1
i 1
n
Yˆi Y
Y
Y
S XY
, maka S XY b1 S XX
S XX
i 1
(Yˆ
Yˆi
X )(Yi Y )
Yˆi Y b0 b1 X i Y Y b1 X b1 X i Y b1 ( X i X )
Yi Yˆi Yi Y b1 ( X i X )
Secara geometri kedudukan titik pengamatan ke i ,
yaitu Yi (digambarkan oleh titik bulatan hitam), dugaan model regresi (digambarkan oleh garis biru),
sumbu X dan sumbu Y dinyatakan pada Gambar 1.
Yi
i
i 1
{b1 ( X i X )(Yi Y ) b12 ( X i X ) 2 }
i 1
Yˆ b0 b1 X
n
b1 ( X i X )(Yi Y )
i 1
n
2
1
b
i 1
n
i 1
b1 S XY b S XX b1b1 S XX b12 S XX 0
n
(Yi Y ) (Yˆi Y ) (Yi Yˆi )
(Y
i
n
n
n
i 1
i 1
i 1
i 1
n
Y ) 2 : Jumlah Kuadrat Sekitar Rataan,
(Yi Y ) (Yˆi Y ) 2 (Yi Yˆi ) 2 2 (Yˆi Y )(Yi Yˆi )
i 1
i 1
2
1
Berdasarkan kedudukan titik pengamatan dan dugaan model regresi dapat disusun persamaan berikut :
2
n
b1 ( X i X )(Yi Y ) b12 ( X i X ) 2
Gambar 1. Kedudukan Titik Pengamatan Dan Dugaan
Model Regresi
n
(X i X )2
Sum of Square Total, SST
(Yˆ Y )
i
2
: Jumlah Kuadrat Karena Regresi
i 1
Sum of Square Regressionl, SSR
n
(Y
i
Yˆi ) 2 : Jumlah Kuadrat Sekitar Regresi,
i 1
atau Error,
Sum of Square Error, SSE
SST = SSR + SSE
Tiga suku di atas akan menjadi komponen Tabel Analisis Variansi (ANOVA) sebagai berikut :
Tabel ANOVA
Sumber
Variasi
(Source)
Derajat
Bebas
(db)
(df)
Jumlah
Kuadrat
(JK)
(SS)
1
(Yˆ Y )
n
Regresi
i
Kuadrat
tengah
(KT) =
JK/db
(MS)
2
KTRegresi
i 1
1
n
(Yi Yˆi ) 2
n-2
Error atau
Residual
s2
i 1
n
Total,
terkoreksi
(Y Y )
n-1
i
JK
n 2
2
i
i 1
Keterangan : Judul yang ditulis miring, yaitu : Source, df,
SS, dan MS, merupakan istilah yang lazim
digunakan pada program MINITAB.
Koefisien Determinasi, R2
Koefisien ini dinyatakan dalam %, yang menyatakan kontribusi regresi, secara fisik adalah akibat
prediktor, terhadap variasi total variabel respon, yaitu Y. Makin besar nilai R2, makin besar pula kontribusi atau peranan prediktor terhadap variasi respon.
Biasanya model regresi dengan nilai R2 sebesar 70%
atau lebih dianggap cukup baik, meskipun tidak selalu. Rumus koefisien determinasi adalah sebagai
berikut :
n
2
R
JK Regresi
JK Total
(Yˆi Y )2
1
n
(Yi Y )2
= 2
rX2 ,Y b12 i 1
b1
n
2
(Xi X )
i 1
n
2
( X i X )
i 1
n
(Yi Y ) 2
i 1
n
(Y
(Y b X b X
1
1
n
(Y
i
n
(b1 ( X i X )) 2
i 1
n
(Y
(Y
i 1
2
1
b
R2
r
(X
X)
i
i 1
n
(Y Y )
n
(X
2
b12
2
2
i
i 1
n
(Yˆ Yˆ )(Y Y )
i
rYˆ ,Y
i
i 1
n
n
(Yˆi Yˆ )2
n
(b
0
=
(Y Y )
i 1
b1 X i Y )(Yi Y )
i 1
n
n
(Yˆi Yˆ )2
(Y Y )
i 1
(Y b X b X
1
1
i
Y )(Yi Y )
i 1
n
(Yˆi Yˆ )2
i 1
n
b (X
1
=
2
i
n
=
2
i
i 1
Bukti :
rX ,Y
X )2
(Y Y )
i 1
2
Y ,Yˆ
1/ 2
i
i 1
n
i
R r
n
2
(
Y
Y
)
i
= b1 ni 1
2
(Xi X )
i 1
Y )2
i
i 1
n
rX ,Y
(X i X )2
i 1 n
Y )2
i
2
1
b
i 1
2
Y )2
i 1
Buktikanlah !
2
X ,Y
Y )2
Y )2
i
n
1/ 2
Rumus R2 ini juga menyatakan kuadrat koefisien
korelasi antara Yˆ dengan Y, sehingga bila dikaitkan
dengan rX,Y terdapat hubungan sebagai berikut :
i
i 1
n
i 1
b1 X i Y ) 2
0
n
i 1
i 1
2
(Yi Y )
b1 = ni 1
( X i X )2
i 1
i 1
(Yi Y ) 2
(Yi Y )2
n
(b
R 2 i n 1
i n1
Hubungan antara prediktor X dengan respon Y, selain dapat dinyatakan oleh koefisien regresi, yaitu b1,
dapat pula dinyatakan dengan koefisien korelasi,
yang dinotasikan rX,Y. Bedanya, koefisien regresi
dapat digunakan untuk memprediksi nilai respon,
sedang pada koefisien korelasi tidak dapat. Persamaan yang menyatakan hubungan ini adalah :
n
(Yˆi Y ) 2
i
n
(Y Y )
2
i
i 1
Y )(Yi Y )
i 1
n
2
1
b (X
i 1
i
Y )2
n
(Y Y )
2
i
i 1
2
lack of fit artinya pengujian untuk mendeteksi apakah model linier order pertama tepat. Bila lack of fit
tidak bermakna maka model linier order pertama tepat, sedang bila lack of fit bermakna maka model linier order pertama tidak tepat, perlu dikembangkan
menjadi model linier kuadratik atau model nonlinier. Pengujian lack of fit ini diperlukan bila terdapat
pengamatan berulang, yaitu satu nilai prediktor atau satu kombinasi nilai prediktor (bila digunakan
beberapa prediktor) yang berpasangan dengan beberapa nilai respon.
n
b1 ( X i Y )(Yi Y )
rX ,Y
i 1
=
b1
n
(X
i
Y)
2
i 1
n
(Y Y )
2
i
i 1
rY ,Yˆ rX ,Y , maka
rY2,Yˆ rX2 ,Y R 2
Berikut ini akan ditampilkan organisasi data hasil
pengamatan berulang pada eksperimen dengan satu
dan dua prediktor.
Lack of Fit
Lack of fit artinya penyimpangan atau ketidak tepatan terhadap model linier order pertama. Pengujian
Organisasi Data Untuk Perhitungan Jumlah Kuadrat Error Murni
Mean
Respon
Nilai
Prediktor
Xj
Nilai-nilai Respon
Yju
Yj
Jumlah Kuadrat Penyimpangan
Terhadap Mean Respon,
nj
(Y
Pengulangan
ni
u 1
nj
ju
2
ju
Y
Derajat
Bebas
db
Y j )2 =
n jY j2
u 1
n1
(Y
Y1
X1
Y11 , Y12 , . . . , Y1n1
1u
u 1
n1
n1
Y1 ) 2 =
n1 – 1
2
1u
Y
n1Y1 2
u 1
n2
(Y
Y2
X2
Y21 , Y22 , . . . , Y2 n2
2u
u 1
n2
n2
Y2 ) 2 =
n2 – 1
2
2u
Y
2
2 2
nY
u 1
nm
(Y
Ym
Xm
Y11 , Y12 , . . . , Ynnm
mu
nn
u 1
nm
Ym ) 2 =
nm – 1
2
mu
Y
2
m m
n Y
u 1
Total Jumlah Kuadrat Penyimpangan Terhadap Mean Respon, disebut:
Error Murni, Galat Murni, Pure Error
Contoh 1:
Berikut ini data hasil eksperimen :
Eksperimen
ke
1
2
3
Y
X
2,3
1,8
2,8
1,3
1,3
2,0
Eksperimen
ke
9
10
11
Y
X
1,7
2,8
2,8
3,7
4
4
Eksperimen
ke
17
18
19
Y
X
3,5
2,8
2,1
5,3
5,3
5,3
3
4
1,5
2,0
12
2,2
4
20
3,4
5
2,2
2,7
13
5,4
4,7
21
3,2
6
3,8
3,3
14
3,2
4,7
22
3
7
1,8
3,3
15
1,9
4,7
23
3
8
3,7
3,7
16
1,8
5
24
5,9
Sumber : Applied Regression Analysis, Second Edition, Norman Draper dan Harry Smith, halaman 38.
5,7
6
6
6,3
6,3
Untuk mempermudah, data disusun ke bentuk berikut :
Nilai Prediktor yg
diulang,
Xj
1,3
2
3,3
3,7
4
4,7
5,3
6
Mean
Respon,
Nilai-nilai Respon,
Yju
2,3
2,8
3,8
3,7
2,8
5,4
3,5
3,2
1,8
1,5
1,8
1,7
2,8
3,2
2,8
3,0
Yj
Pengulangan,
nj
Jumlah Kuadrat Penyimpangan
Terhadap Mean Respon
Derajat
Bebas
db
2
2
2
2
3
3
3
2
0,125
0,845
2,000
2,000
0,240
6,260
0,980
0,020
1
1
1
1
2
2
2
1
12,470
11
2,05
2,07
...
...
...
...
...
...
2,2
1,9
2,1
Pengujian kemaknaan lack of fit dilakukan dengan
cara memecah Jumlah Kuadrat Error menjadi dua,
yaitu Jumlah Kuadrat Error Murni dan Jumlah Kuadrat Lack of Fit. Perhitungan jumlah kuadrat error
murni dilakukan seperti yang ditampilan pada tabel
di atas, sedang Jumlah Kuadrat Lack of Fit merupakan selisih antara Jumlah Kuadrat Error dengan
Jumlah Kuadrat Error Murni. Tabel ANOVA menjadi seperti berikut :
Tabel ANOVA 1
Sumber
Variasi
Derajat
Bebas
(db)
Jumlah
Kuadrat
(JK)
(KT) = JK/db
(Source)
Regresi
(df)
1
(SS)
6,326
(MS)
6,326
Error
atau
Residual
Total,
terkoreksi
22
21,192
s 2 0,963
23
27,518
Kuadrat
tengah
F
KT Reg /
KT Error
6,569
Error
Murni
Total,
terkoreksi
11
12,470
1,134
(KTL of F
dibagi
KTerror murni)
23
27,518
Keterangan : L of F = Lack of Fit
Penggunaan Tabel Anova ada dua, pertama untuk
menguji kemaknaan pengaruh variabel bebas (Tabel
ANOVA 1), dan ke dua untuk menguji kemaknaan
Lack of Fit (Tabel ANOVA 2). Statistik uji yang
digunakan adalah F.
Pengujian secara cepat, yaitu dengan memanfaatkan
hasil atau keluaran MINITAB. Tabel ANOVA yang
memuat Lack of Fit ditampilkan dengan cara mengklik Pure Error pada Window Option.
Pada tabel di bawah ini ditambahkan baris ke tiga
yang berisikan Kuadrat Tengah Error atau MSE
yang dipecah menjadi dua, yaitu Kuadrat Tengah
Lack of Fit dan Kuadrat Tengah Error Murni.
Tabel ANOVA 2
Kuadrat
tengah
Sumber
Variasi
Derajat
Bebas
(db)
Jumlah
Kuadrat
(JK)
(Source)
(df)
(SS)
(MS)
Regresi
1
6,326
6,326
Error atau
Residual
22
21,192
Lack of
Fit
11
8,722
(KT) =
JK/db
F
Analysis of Variance 1
6,569
(KTRegresi
s 2 0,963 dibagi
KTerror)
0,793
Data pada contoh 1 bila diolah menggunakan MINITAB tanpa memperhatikan lack of fit menghasilkan
Tabel ANOVA 1 berikut :
0,699
Source
Regression
Residual Error
Total
DF
1
22
23
SS
6,3247
21,1937
27,5183
MS
6,3247
0,9633
F
6,57
P
0,018
Apabila pengolahan dilakukan dengan memperhatikan lack of fit, didapatkan hasil keluaran berikut :
4
Source
Regression
Residual Error
Lack of Fit
Pure Error
Total
DF
1
22
11
11
23
SS
6,3247
21,1937
8,7237
12,4700
27,5183
MS
6,3247
0,9633
0,7931
1,1336
F
6,57
P
0,018
0,70
0,718
Cara cepat menyimpulkan hasil pengujian, yaitu
dengan memanfaatkan hasil MINITAB dapat dilakukan dengan melihat nilai P. Nilai P sebesar
0,018, yang kurang dari 0,05 pada Analysis Variansi 1, menandakan prediktor berpengaruh pada respon. Pada Analysis Variansi 2, didapatkan nilai P
Lack of Fit sebesar 0,718 yang lebih dari 0,05,
sehingga disimpulkan Lack of Fit tidak bermakna;
ini berarti model linier order pertama sudah sesuai.
Cara lain mendeteksi lack of fit dengan menggunakan statistik uji F = (MS Lack of Fit)/(MS Pure
Error). Bila F < 1, maka Lack of Fit tidak
bermakna, sementara kalau F>1 belum tentu Lack
of Fit ber-makna.
Kalau diterapkan pada soal contoh 1 di atas, nilai F
sebesar 0,7931/1,1336; nilai ini kurang dari satu.
Jadi Lack of Fit tidak bermakna. Hasil melalui F ini
tidak bertentangan dengan hasil melalui P. Kedua
tolok ukur ini menghasilkan kesimpulan yang sama,
yaitu Lack of fit tidak bermakna.
Contoh 2, Soal K
Y
0,971
0,979
0,982
0,971
0,957
0,961
0,956
0,972
0,889
0,961
0,982
0,975
0,942
0,932
0,908
0,97
0,985
0,933
0,858
0,987
0,958
0,909
0,859
0,863
0,811
0,877
0,798
0,855
0,788
0,821
X
3
4,7
8,3
9,3
9,9
11
12,3
12,5
12,6
15,9
16,7
18,8
18,8
18,9
21,7
21,9
22,8
24,2
25,8
30,6
36,2
39,8
44,3
46,8
46,8
58,1
62,3
70,6
71,1
71,3
RESI1
-0,02239
-0,00945
0,003999
-0,0041
-0,01636
-0,00916
-0,01039
0,006193
-0,07652
0,005065
0,028388
0,027485
-0,00551
-0,01522
-0,03109
0,031486
0,0491
0,001164
-0,06919
0,073747
0,061007
0,022459
-0,01448
-0,00322
-0,05522
0,043593
-0,02321
0,057887
-0,00766
0,02592
0,83
0,718
0,642
0,658
83,2
83,6
99,5
111,2
0,069472
-0,04137
-0,0712
-0,02123
0,760528
0,759367
0,713201
0,67923
Sebagai langkah awal adalah memplot Y terhadap
X. Dihasilkan plot berikut :
Scatterplot of Y vs X
1,0
0,9
Y
Analysis of Variance 2
0,8
0,7
0,6
0
20
40
60
X
80
100
120
Hasil plot Y terhadap X di atas menunjukkan bahwa
model regresi cukup baik, ditandai dengan titik-titik
pengamatan yang merata disekitar garis regresi. Beberapa hasil perhitungan ditampilkan sebagai berikut :
MTB
MTB
MTB
MTB
MTB
MTB
>
>
>
>
>
>
let k1=sum(X)
let k2=sum(Y)
let k3=sum(X**2)
let k4=sum(Y**2)
let k5=sum(X*Y)
print k1-k5
Data Display
FITS1
0,99339
0,988454
0,978001
0,975098
0,973356
0,970162
0,966387
0,965807
0,965516
0,955935
0,953612
0,947515
0,947515
0,947224
0,939094
0,938514
0,935901
0,931836
0,92719
0,913253
0,896993
0,886541
0,873475
0,866216
0,866216
0,833407
0,821212
0,797113
0,795661
0,79508
n
n
X
i
= K1 = 1244,50
i 1
Y
2
i
= K4 =
i 1
27,5736
n
Y
i
n
= K2 = 30,4580
i 1
XY
= K5 =
i 1
1032,49
n
X
2
i
= K3 = 73920,1
i 1
Dengan menggunakan command regresi didapatkan
model regresi berikut :
MTB > Name c3 "RESI1" c4 "FITS1"
MTB > Regress 'Y' 1 'X';
SUBC>
Residuals 'RESI1';
SUBC>
Fits 'FITS1';
SUBC>
Constant;
SUBC>
Brief 1.
Regression Analysis: Y versus X
The regression equation is
Y = 1,00 - 0,00290 X
Predictor
Constant
X
Coef
1,00210
-0,0029035
S = 0,0393282
SE Coef
0,01089
0,0002335
R-Sq = 82,9%
T
92,04
-12,43
P
0,000
0,000
R-Sq(adj) = 82,3%
Analysis of Variance
Source
DF
SS
MS
F
Regression
1 0,23915 0,23915 154,62
Residual Error 32 0,04949 0,00155
Total
33 0,28864
P
0,000
5
Kesimpulannya model cukup baik, berdasarkan
pada :
- Plot Y terhadap X menunjukkan model
linier order pertama yang baik.
- Variabel bebas berbeda dengan nol secara bermakana, ditandai dengan nilai
P yang kurang dari 0,05, jadi X
berpenga-ruh pada Y.
- Nilai R2 = 82%, menunjukan variasi Y
karena pengaruh X tinggi.
- Empat plot residual tampak baik, seperti yang ditampilkan pada gambar di bawah ini.
90
Percent
Residuals Versus the Fitted Values
Standardized Residual
99
50
10
1
-2
-1
0
1
Standardized Residual
2
1
0
-2
0,7
Histogram of the Residuals
Standardized Residual
Frequency
5,0
2,5
0,0
-2
-1
0
1
Standardized Residual
0,8
0,9
Fitted Value
1,0
Residuals Versus the Order of the Data
7,5
2
Mean
StDev
N
AD
P-Value
95
90
-1,47059E-07
0,03873
34
0,390
0,364
Percent
80
70
60
50
40
30
20
10
5
1
-0,10
-0,05
0,00
C1
0,05
0,10
Pada soal K di atas, tampak terdapat nilai-nilai prediktor yang sangat dekat, sehingga pantas dianggap
ulangan, dinamai ulangan hampiran.
-1
2
10,0
Normal - 95% CI
99
Contoh 3, Soal L
Residual Plots for Y
Normal Probability Plot of the Residuals
Probability Plot of C1
2
1
0
-1
-2
1
5
10
15
20
25
Observation Order
30
Data ulangan hampiran berdasarkan data soal K:
X = 9,3
9,9
X = 12,3 12,5 12,6
X = 18,8 18,8 18,9
X = 21,7 21,9
X = 46,8 46,8
X = 70,6 71,1 71,3
X = 83,2 83,6
Dengan dihimpunnya data ulangan hampiran ini
maka dapat dideteksi kemaknaan lack of fit. Namun
demikian, perhitungan tidak dapat dilakukan menggunakan program paket, harus secara manual.
Untuk mempermudah, data disusun ke bentuk berikut :
Nilai Prediktor
yg diulang, atau
ulangan
hampiran
(Xj )
9,3 9,9
12,3 12,5 12,6
18,8 18,8 18,9
21,7 21,9
46,8 46,8
70,6 71,1 71,3
83,2 83,6
Nilai-nilai Respon,
(Yju)
0,971
0,956
0,975
0,908
0,863
0,855
0,830
Mean Respon,
(Yj )
Pengulangan,
(nj)
Jumlah Kuadrat
Penyimpangan Terhadap
Mean Respon
Derajat
Bebas
(db)
9,6
12,5
18,83
21,8
46,8
71
...
2
3
3
2
2
3
2
...
...
...
...
...
...
...
0,01678
1
2
2
1
1
2
1
10
0,957
0,972 0,889
0,942 0,932
0,970
0,811
0,788 0,821
0,718
Lengkapilah perhitungan dan isikan pada tabel di atas. Selanjutnya, lengkapilah pula tabel ANOVA berikut :
Analysis of Variance
Source
Regression
Residual Error
Lack of Fit
Pure Error
Total
DF
1
32
SS
0,23915
0,04949
...
10
...
0,01678
33
0,28864
MS
0,23915
0,00155
F
154,62
P
0,000
...
...
...
...
Lakukanlah evaluasi, apakah lack of fit bermakna ? Lakukan analisis kebaikan model.
Bandingkan dengan hasil analisis model di soal K.
6
Statistik Matematika Pada ANOVA
Yang akan diuraikan pada topik Statistik Matematika pada ANOVA ini adalah :
- Distribusi setiap komponen Tabel Analisis Variansi
- Hubungan antara komponen
- Ekspektasi setiap komponen
Untuk mengingat kembali, akan ditampilkan lagi
Tabel ANOVA berikut ini.
Tabel ANOVA
Derajat
Bebas
(db)
(df)
Sumber
Variasi
(Source)
Kuadrat
tengah
(KT) =
JK/db
(MS)
Jumlah
Kuadrat
(JK)
(SS)
n
Regresi
(Yˆi Y ) 2
1
KTRegresi
i 1
n
Error atau
Residual
Total,
terkoreksi
(Yi Yˆi ) 2
n-2
s2
i 1
Bila dinyatakan dengan persamaan:
k
(Yi Yi )
ni
i 1 j 1
i 1 j 1
suku 2
suku 3
Penalaran suku 1,
Diasumsikan : Yij~N(,2)
Yij
Yij ~ N ( , 2 ), maka
~ N (0,1),
2
Yij
Yij Y
i 1 j 1
Didapatkan
k
ni
ni
Y
i 1 j 1
2
Yij
~ 2k
i 1 j 1
ni
i 1
k
~ 12 , maka
ij
i 1
ni
k
i 1 j 1
suku 1
Y
2
ni
k
( yij y )2 ( yij yi )2 ( yi. y )2
k
n
n-1
JK
n 2
variansi mean setiap perlakuan terhadap mean keseluruhan.
ni
2
ni
k
~ 2k
, Yij Y
ni 1 i 1 j 1
i 1
hasil :
2
2
~ 2k
2
ni 1
i 1
~ 2k 2
ni 1
i 1
Keterangan : Judul yang ditulis miring, yaitu : Source, df,
SS, dan MS, merupakan istilah yang lazim
digunakan pada program MINITAB.
Distribusi Komponen Tabel ANOVA
Yang akan dibahas adalah distribusi : Jumlah Kuadrat Regresi, Jumlah Kuadrat Residual, dan Jumlah
Kuadrat Total.
Review ANOVA searah :
Penalaran suku 2,
Diasumsikan : Yij~N(i,2)
Yij ~ N ( i , 2 ), maka
Yij i
~ N (0,1),
2
Yij i
~ 12 , maka
2
ni
Yij Yi
2
~ n i 1 ,
j 1
Organisasi Data :
i
1
y11
y12
.
.
.
2
y21
y22
.
.
.
...
...
...
...
...
...
y1n1
y2n 2
yknk
y1
y2
yk
1
2
k
yk1
yk2
.
.
.
k
ni
Y
ij
i 1 j 1
2
Yij i
~ n2i ,
j 1
ni
ni
2
Yij Yi
2
~ k ni k
i 1 j 1
i 1
k
Yi ~ 2k
ni k
2
i 1
Didapatkan hasil :
k
ni
( y
ij
i 1 j 1
k
yi ) 2 ni (Yi. Y ) 2 ~ k2 1 2
i 1
y
Model ANOVA,Yij=i+ij, i=1,2,...k,
j=1,2,...,ni
k
1 ni
yi. yij
ni j 1
n y
i i
y
i
k
n
i
i
Variasi total respon merupakan
jumlahan dari variasi respon terhadap mean setiap perlakuan dengan
7
k
ni
Y
Yi ~
2
ij
i 1 j 1
2
Y ~ N ( , 2 ), E (Y ), 2 var(Y )
Y E (Y )
Y
~ N (0,1)
1/ 2
(var(Y ))
2
k
ni k
i 1
Penalaran suku 3,
Yi.
2
Yi. ~ N ( , ),
~ N (0,1)
1/ 2
ni
2
ni
(Yi . )
2
ni
k n (Y ) 2
i
i.
2
i 1
~ 12
2
k
i 1
(Yi. )
2
ni
k
~ k2
i 1
2
~ k2
Kembali ke Regresi
n
Penalaran distribusi
(Yˆ Y )
i
2
,
i 1
ni (Yi. Y ) 2
~ k2 1
2
Hasil Keseluruhan :
k
ni
Y
ij
Y
2
i 1 j 1
~ 2k 2
ni 1
i 1
k
ni
Y
ij
i 1 j 1
Yi ~ 2k
ni k
2
i 1
k
ni
k
(Yi. Y ) 2 ni (Yi. Y ) 2 ~ k2 1 2
i 1 j 1
i 1
Perlu diingat :
8
9
http://oc.its.ac.id/jurusan.php?fid=1&jid=3
Wiwiek Setya Winahju
wiwiek@statistika.its.ac.id
Analisis Variansi merupakan alat yang digunakan
untuk mengevaluasi kebaikan model regresi. Model
regresi yang baik, salah satunya ditandai oleh tingginya koefisien determinasi, dinotasikan R2 atau
2
Radj
, yang dapat dihasilkan oleh Tabel Analisis
Va-riansi.
n
(Yˆ
Y )(Yi Yˆi ) 0
i
i 1
Bukti :
Review b0 dan b1 :
n
Apabila terdapat himpunan data random yang saling
independen, dan tidak ada faktor yang mempengaruhi, maka data tersebut akan bervariasi terhadap
meannya. Pada data random yang dipengaruhi oleh
suatu faktor, variasi terhadap pengaruh faktor ikut
berkontribusi.
b1
(X
n
(X
i
X )2
b0 Y b1 X
n
n
i
i 1
n
(Yˆ
Y )(Yi Yˆi ) b1 ( X i X ){(Yi Y ) b1 ( X i X )}
i
Yi Yˆi
Y )(Yi Yˆi ) b1 ( X i X ){(Yi Y ) b1 ( X i X )}
i 1
n
i 1
i 1
n
Yˆi Y
Y
Y
S XY
, maka S XY b1 S XX
S XX
i 1
(Yˆ
Yˆi
X )(Yi Y )
Yˆi Y b0 b1 X i Y Y b1 X b1 X i Y b1 ( X i X )
Yi Yˆi Yi Y b1 ( X i X )
Secara geometri kedudukan titik pengamatan ke i ,
yaitu Yi (digambarkan oleh titik bulatan hitam), dugaan model regresi (digambarkan oleh garis biru),
sumbu X dan sumbu Y dinyatakan pada Gambar 1.
Yi
i
i 1
{b1 ( X i X )(Yi Y ) b12 ( X i X ) 2 }
i 1
Yˆ b0 b1 X
n
b1 ( X i X )(Yi Y )
i 1
n
2
1
b
i 1
n
i 1
b1 S XY b S XX b1b1 S XX b12 S XX 0
n
(Yi Y ) (Yˆi Y ) (Yi Yˆi )
(Y
i
n
n
n
i 1
i 1
i 1
i 1
n
Y ) 2 : Jumlah Kuadrat Sekitar Rataan,
(Yi Y ) (Yˆi Y ) 2 (Yi Yˆi ) 2 2 (Yˆi Y )(Yi Yˆi )
i 1
i 1
2
1
Berdasarkan kedudukan titik pengamatan dan dugaan model regresi dapat disusun persamaan berikut :
2
n
b1 ( X i X )(Yi Y ) b12 ( X i X ) 2
Gambar 1. Kedudukan Titik Pengamatan Dan Dugaan
Model Regresi
n
(X i X )2
Sum of Square Total, SST
(Yˆ Y )
i
2
: Jumlah Kuadrat Karena Regresi
i 1
Sum of Square Regressionl, SSR
n
(Y
i
Yˆi ) 2 : Jumlah Kuadrat Sekitar Regresi,
i 1
atau Error,
Sum of Square Error, SSE
SST = SSR + SSE
Tiga suku di atas akan menjadi komponen Tabel Analisis Variansi (ANOVA) sebagai berikut :
Tabel ANOVA
Sumber
Variasi
(Source)
Derajat
Bebas
(db)
(df)
Jumlah
Kuadrat
(JK)
(SS)
1
(Yˆ Y )
n
Regresi
i
Kuadrat
tengah
(KT) =
JK/db
(MS)
2
KTRegresi
i 1
1
n
(Yi Yˆi ) 2
n-2
Error atau
Residual
s2
i 1
n
Total,
terkoreksi
(Y Y )
n-1
i
JK
n 2
2
i
i 1
Keterangan : Judul yang ditulis miring, yaitu : Source, df,
SS, dan MS, merupakan istilah yang lazim
digunakan pada program MINITAB.
Koefisien Determinasi, R2
Koefisien ini dinyatakan dalam %, yang menyatakan kontribusi regresi, secara fisik adalah akibat
prediktor, terhadap variasi total variabel respon, yaitu Y. Makin besar nilai R2, makin besar pula kontribusi atau peranan prediktor terhadap variasi respon.
Biasanya model regresi dengan nilai R2 sebesar 70%
atau lebih dianggap cukup baik, meskipun tidak selalu. Rumus koefisien determinasi adalah sebagai
berikut :
n
2
R
JK Regresi
JK Total
(Yˆi Y )2
1
n
(Yi Y )2
= 2
rX2 ,Y b12 i 1
b1
n
2
(Xi X )
i 1
n
2
( X i X )
i 1
n
(Yi Y ) 2
i 1
n
(Y
(Y b X b X
1
1
n
(Y
i
n
(b1 ( X i X )) 2
i 1
n
(Y
(Y
i 1
2
1
b
R2
r
(X
X)
i
i 1
n
(Y Y )
n
(X
2
b12
2
2
i
i 1
n
(Yˆ Yˆ )(Y Y )
i
rYˆ ,Y
i
i 1
n
n
(Yˆi Yˆ )2
n
(b
0
=
(Y Y )
i 1
b1 X i Y )(Yi Y )
i 1
n
n
(Yˆi Yˆ )2
(Y Y )
i 1
(Y b X b X
1
1
i
Y )(Yi Y )
i 1
n
(Yˆi Yˆ )2
i 1
n
b (X
1
=
2
i
n
=
2
i
i 1
Bukti :
rX ,Y
X )2
(Y Y )
i 1
2
Y ,Yˆ
1/ 2
i
i 1
n
i
R r
n
2
(
Y
Y
)
i
= b1 ni 1
2
(Xi X )
i 1
Y )2
i
i 1
n
rX ,Y
(X i X )2
i 1 n
Y )2
i
2
1
b
i 1
2
Y )2
i 1
Buktikanlah !
2
X ,Y
Y )2
Y )2
i
n
1/ 2
Rumus R2 ini juga menyatakan kuadrat koefisien
korelasi antara Yˆ dengan Y, sehingga bila dikaitkan
dengan rX,Y terdapat hubungan sebagai berikut :
i
i 1
n
i 1
b1 X i Y ) 2
0
n
i 1
i 1
2
(Yi Y )
b1 = ni 1
( X i X )2
i 1
i 1
(Yi Y ) 2
(Yi Y )2
n
(b
R 2 i n 1
i n1
Hubungan antara prediktor X dengan respon Y, selain dapat dinyatakan oleh koefisien regresi, yaitu b1,
dapat pula dinyatakan dengan koefisien korelasi,
yang dinotasikan rX,Y. Bedanya, koefisien regresi
dapat digunakan untuk memprediksi nilai respon,
sedang pada koefisien korelasi tidak dapat. Persamaan yang menyatakan hubungan ini adalah :
n
(Yˆi Y ) 2
i
n
(Y Y )
2
i
i 1
Y )(Yi Y )
i 1
n
2
1
b (X
i 1
i
Y )2
n
(Y Y )
2
i
i 1
2
lack of fit artinya pengujian untuk mendeteksi apakah model linier order pertama tepat. Bila lack of fit
tidak bermakna maka model linier order pertama tepat, sedang bila lack of fit bermakna maka model linier order pertama tidak tepat, perlu dikembangkan
menjadi model linier kuadratik atau model nonlinier. Pengujian lack of fit ini diperlukan bila terdapat
pengamatan berulang, yaitu satu nilai prediktor atau satu kombinasi nilai prediktor (bila digunakan
beberapa prediktor) yang berpasangan dengan beberapa nilai respon.
n
b1 ( X i Y )(Yi Y )
rX ,Y
i 1
=
b1
n
(X
i
Y)
2
i 1
n
(Y Y )
2
i
i 1
rY ,Yˆ rX ,Y , maka
rY2,Yˆ rX2 ,Y R 2
Berikut ini akan ditampilkan organisasi data hasil
pengamatan berulang pada eksperimen dengan satu
dan dua prediktor.
Lack of Fit
Lack of fit artinya penyimpangan atau ketidak tepatan terhadap model linier order pertama. Pengujian
Organisasi Data Untuk Perhitungan Jumlah Kuadrat Error Murni
Mean
Respon
Nilai
Prediktor
Xj
Nilai-nilai Respon
Yju
Yj
Jumlah Kuadrat Penyimpangan
Terhadap Mean Respon,
nj
(Y
Pengulangan
ni
u 1
nj
ju
2
ju
Y
Derajat
Bebas
db
Y j )2 =
n jY j2
u 1
n1
(Y
Y1
X1
Y11 , Y12 , . . . , Y1n1
1u
u 1
n1
n1
Y1 ) 2 =
n1 – 1
2
1u
Y
n1Y1 2
u 1
n2
(Y
Y2
X2
Y21 , Y22 , . . . , Y2 n2
2u
u 1
n2
n2
Y2 ) 2 =
n2 – 1
2
2u
Y
2
2 2
nY
u 1
nm
(Y
Ym
Xm
Y11 , Y12 , . . . , Ynnm
mu
nn
u 1
nm
Ym ) 2 =
nm – 1
2
mu
Y
2
m m
n Y
u 1
Total Jumlah Kuadrat Penyimpangan Terhadap Mean Respon, disebut:
Error Murni, Galat Murni, Pure Error
Contoh 1:
Berikut ini data hasil eksperimen :
Eksperimen
ke
1
2
3
Y
X
2,3
1,8
2,8
1,3
1,3
2,0
Eksperimen
ke
9
10
11
Y
X
1,7
2,8
2,8
3,7
4
4
Eksperimen
ke
17
18
19
Y
X
3,5
2,8
2,1
5,3
5,3
5,3
3
4
1,5
2,0
12
2,2
4
20
3,4
5
2,2
2,7
13
5,4
4,7
21
3,2
6
3,8
3,3
14
3,2
4,7
22
3
7
1,8
3,3
15
1,9
4,7
23
3
8
3,7
3,7
16
1,8
5
24
5,9
Sumber : Applied Regression Analysis, Second Edition, Norman Draper dan Harry Smith, halaman 38.
5,7
6
6
6,3
6,3
Untuk mempermudah, data disusun ke bentuk berikut :
Nilai Prediktor yg
diulang,
Xj
1,3
2
3,3
3,7
4
4,7
5,3
6
Mean
Respon,
Nilai-nilai Respon,
Yju
2,3
2,8
3,8
3,7
2,8
5,4
3,5
3,2
1,8
1,5
1,8
1,7
2,8
3,2
2,8
3,0
Yj
Pengulangan,
nj
Jumlah Kuadrat Penyimpangan
Terhadap Mean Respon
Derajat
Bebas
db
2
2
2
2
3
3
3
2
0,125
0,845
2,000
2,000
0,240
6,260
0,980
0,020
1
1
1
1
2
2
2
1
12,470
11
2,05
2,07
...
...
...
...
...
...
2,2
1,9
2,1
Pengujian kemaknaan lack of fit dilakukan dengan
cara memecah Jumlah Kuadrat Error menjadi dua,
yaitu Jumlah Kuadrat Error Murni dan Jumlah Kuadrat Lack of Fit. Perhitungan jumlah kuadrat error
murni dilakukan seperti yang ditampilan pada tabel
di atas, sedang Jumlah Kuadrat Lack of Fit merupakan selisih antara Jumlah Kuadrat Error dengan
Jumlah Kuadrat Error Murni. Tabel ANOVA menjadi seperti berikut :
Tabel ANOVA 1
Sumber
Variasi
Derajat
Bebas
(db)
Jumlah
Kuadrat
(JK)
(KT) = JK/db
(Source)
Regresi
(df)
1
(SS)
6,326
(MS)
6,326
Error
atau
Residual
Total,
terkoreksi
22
21,192
s 2 0,963
23
27,518
Kuadrat
tengah
F
KT Reg /
KT Error
6,569
Error
Murni
Total,
terkoreksi
11
12,470
1,134
(KTL of F
dibagi
KTerror murni)
23
27,518
Keterangan : L of F = Lack of Fit
Penggunaan Tabel Anova ada dua, pertama untuk
menguji kemaknaan pengaruh variabel bebas (Tabel
ANOVA 1), dan ke dua untuk menguji kemaknaan
Lack of Fit (Tabel ANOVA 2). Statistik uji yang
digunakan adalah F.
Pengujian secara cepat, yaitu dengan memanfaatkan
hasil atau keluaran MINITAB. Tabel ANOVA yang
memuat Lack of Fit ditampilkan dengan cara mengklik Pure Error pada Window Option.
Pada tabel di bawah ini ditambahkan baris ke tiga
yang berisikan Kuadrat Tengah Error atau MSE
yang dipecah menjadi dua, yaitu Kuadrat Tengah
Lack of Fit dan Kuadrat Tengah Error Murni.
Tabel ANOVA 2
Kuadrat
tengah
Sumber
Variasi
Derajat
Bebas
(db)
Jumlah
Kuadrat
(JK)
(Source)
(df)
(SS)
(MS)
Regresi
1
6,326
6,326
Error atau
Residual
22
21,192
Lack of
Fit
11
8,722
(KT) =
JK/db
F
Analysis of Variance 1
6,569
(KTRegresi
s 2 0,963 dibagi
KTerror)
0,793
Data pada contoh 1 bila diolah menggunakan MINITAB tanpa memperhatikan lack of fit menghasilkan
Tabel ANOVA 1 berikut :
0,699
Source
Regression
Residual Error
Total
DF
1
22
23
SS
6,3247
21,1937
27,5183
MS
6,3247
0,9633
F
6,57
P
0,018
Apabila pengolahan dilakukan dengan memperhatikan lack of fit, didapatkan hasil keluaran berikut :
4
Source
Regression
Residual Error
Lack of Fit
Pure Error
Total
DF
1
22
11
11
23
SS
6,3247
21,1937
8,7237
12,4700
27,5183
MS
6,3247
0,9633
0,7931
1,1336
F
6,57
P
0,018
0,70
0,718
Cara cepat menyimpulkan hasil pengujian, yaitu
dengan memanfaatkan hasil MINITAB dapat dilakukan dengan melihat nilai P. Nilai P sebesar
0,018, yang kurang dari 0,05 pada Analysis Variansi 1, menandakan prediktor berpengaruh pada respon. Pada Analysis Variansi 2, didapatkan nilai P
Lack of Fit sebesar 0,718 yang lebih dari 0,05,
sehingga disimpulkan Lack of Fit tidak bermakna;
ini berarti model linier order pertama sudah sesuai.
Cara lain mendeteksi lack of fit dengan menggunakan statistik uji F = (MS Lack of Fit)/(MS Pure
Error). Bila F < 1, maka Lack of Fit tidak
bermakna, sementara kalau F>1 belum tentu Lack
of Fit ber-makna.
Kalau diterapkan pada soal contoh 1 di atas, nilai F
sebesar 0,7931/1,1336; nilai ini kurang dari satu.
Jadi Lack of Fit tidak bermakna. Hasil melalui F ini
tidak bertentangan dengan hasil melalui P. Kedua
tolok ukur ini menghasilkan kesimpulan yang sama,
yaitu Lack of fit tidak bermakna.
Contoh 2, Soal K
Y
0,971
0,979
0,982
0,971
0,957
0,961
0,956
0,972
0,889
0,961
0,982
0,975
0,942
0,932
0,908
0,97
0,985
0,933
0,858
0,987
0,958
0,909
0,859
0,863
0,811
0,877
0,798
0,855
0,788
0,821
X
3
4,7
8,3
9,3
9,9
11
12,3
12,5
12,6
15,9
16,7
18,8
18,8
18,9
21,7
21,9
22,8
24,2
25,8
30,6
36,2
39,8
44,3
46,8
46,8
58,1
62,3
70,6
71,1
71,3
RESI1
-0,02239
-0,00945
0,003999
-0,0041
-0,01636
-0,00916
-0,01039
0,006193
-0,07652
0,005065
0,028388
0,027485
-0,00551
-0,01522
-0,03109
0,031486
0,0491
0,001164
-0,06919
0,073747
0,061007
0,022459
-0,01448
-0,00322
-0,05522
0,043593
-0,02321
0,057887
-0,00766
0,02592
0,83
0,718
0,642
0,658
83,2
83,6
99,5
111,2
0,069472
-0,04137
-0,0712
-0,02123
0,760528
0,759367
0,713201
0,67923
Sebagai langkah awal adalah memplot Y terhadap
X. Dihasilkan plot berikut :
Scatterplot of Y vs X
1,0
0,9
Y
Analysis of Variance 2
0,8
0,7
0,6
0
20
40
60
X
80
100
120
Hasil plot Y terhadap X di atas menunjukkan bahwa
model regresi cukup baik, ditandai dengan titik-titik
pengamatan yang merata disekitar garis regresi. Beberapa hasil perhitungan ditampilkan sebagai berikut :
MTB
MTB
MTB
MTB
MTB
MTB
>
>
>
>
>
>
let k1=sum(X)
let k2=sum(Y)
let k3=sum(X**2)
let k4=sum(Y**2)
let k5=sum(X*Y)
print k1-k5
Data Display
FITS1
0,99339
0,988454
0,978001
0,975098
0,973356
0,970162
0,966387
0,965807
0,965516
0,955935
0,953612
0,947515
0,947515
0,947224
0,939094
0,938514
0,935901
0,931836
0,92719
0,913253
0,896993
0,886541
0,873475
0,866216
0,866216
0,833407
0,821212
0,797113
0,795661
0,79508
n
n
X
i
= K1 = 1244,50
i 1
Y
2
i
= K4 =
i 1
27,5736
n
Y
i
n
= K2 = 30,4580
i 1
XY
= K5 =
i 1
1032,49
n
X
2
i
= K3 = 73920,1
i 1
Dengan menggunakan command regresi didapatkan
model regresi berikut :
MTB > Name c3 "RESI1" c4 "FITS1"
MTB > Regress 'Y' 1 'X';
SUBC>
Residuals 'RESI1';
SUBC>
Fits 'FITS1';
SUBC>
Constant;
SUBC>
Brief 1.
Regression Analysis: Y versus X
The regression equation is
Y = 1,00 - 0,00290 X
Predictor
Constant
X
Coef
1,00210
-0,0029035
S = 0,0393282
SE Coef
0,01089
0,0002335
R-Sq = 82,9%
T
92,04
-12,43
P
0,000
0,000
R-Sq(adj) = 82,3%
Analysis of Variance
Source
DF
SS
MS
F
Regression
1 0,23915 0,23915 154,62
Residual Error 32 0,04949 0,00155
Total
33 0,28864
P
0,000
5
Kesimpulannya model cukup baik, berdasarkan
pada :
- Plot Y terhadap X menunjukkan model
linier order pertama yang baik.
- Variabel bebas berbeda dengan nol secara bermakana, ditandai dengan nilai
P yang kurang dari 0,05, jadi X
berpenga-ruh pada Y.
- Nilai R2 = 82%, menunjukan variasi Y
karena pengaruh X tinggi.
- Empat plot residual tampak baik, seperti yang ditampilkan pada gambar di bawah ini.
90
Percent
Residuals Versus the Fitted Values
Standardized Residual
99
50
10
1
-2
-1
0
1
Standardized Residual
2
1
0
-2
0,7
Histogram of the Residuals
Standardized Residual
Frequency
5,0
2,5
0,0
-2
-1
0
1
Standardized Residual
0,8
0,9
Fitted Value
1,0
Residuals Versus the Order of the Data
7,5
2
Mean
StDev
N
AD
P-Value
95
90
-1,47059E-07
0,03873
34
0,390
0,364
Percent
80
70
60
50
40
30
20
10
5
1
-0,10
-0,05
0,00
C1
0,05
0,10
Pada soal K di atas, tampak terdapat nilai-nilai prediktor yang sangat dekat, sehingga pantas dianggap
ulangan, dinamai ulangan hampiran.
-1
2
10,0
Normal - 95% CI
99
Contoh 3, Soal L
Residual Plots for Y
Normal Probability Plot of the Residuals
Probability Plot of C1
2
1
0
-1
-2
1
5
10
15
20
25
Observation Order
30
Data ulangan hampiran berdasarkan data soal K:
X = 9,3
9,9
X = 12,3 12,5 12,6
X = 18,8 18,8 18,9
X = 21,7 21,9
X = 46,8 46,8
X = 70,6 71,1 71,3
X = 83,2 83,6
Dengan dihimpunnya data ulangan hampiran ini
maka dapat dideteksi kemaknaan lack of fit. Namun
demikian, perhitungan tidak dapat dilakukan menggunakan program paket, harus secara manual.
Untuk mempermudah, data disusun ke bentuk berikut :
Nilai Prediktor
yg diulang, atau
ulangan
hampiran
(Xj )
9,3 9,9
12,3 12,5 12,6
18,8 18,8 18,9
21,7 21,9
46,8 46,8
70,6 71,1 71,3
83,2 83,6
Nilai-nilai Respon,
(Yju)
0,971
0,956
0,975
0,908
0,863
0,855
0,830
Mean Respon,
(Yj )
Pengulangan,
(nj)
Jumlah Kuadrat
Penyimpangan Terhadap
Mean Respon
Derajat
Bebas
(db)
9,6
12,5
18,83
21,8
46,8
71
...
2
3
3
2
2
3
2
...
...
...
...
...
...
...
0,01678
1
2
2
1
1
2
1
10
0,957
0,972 0,889
0,942 0,932
0,970
0,811
0,788 0,821
0,718
Lengkapilah perhitungan dan isikan pada tabel di atas. Selanjutnya, lengkapilah pula tabel ANOVA berikut :
Analysis of Variance
Source
Regression
Residual Error
Lack of Fit
Pure Error
Total
DF
1
32
SS
0,23915
0,04949
...
10
...
0,01678
33
0,28864
MS
0,23915
0,00155
F
154,62
P
0,000
...
...
...
...
Lakukanlah evaluasi, apakah lack of fit bermakna ? Lakukan analisis kebaikan model.
Bandingkan dengan hasil analisis model di soal K.
6
Statistik Matematika Pada ANOVA
Yang akan diuraikan pada topik Statistik Matematika pada ANOVA ini adalah :
- Distribusi setiap komponen Tabel Analisis Variansi
- Hubungan antara komponen
- Ekspektasi setiap komponen
Untuk mengingat kembali, akan ditampilkan lagi
Tabel ANOVA berikut ini.
Tabel ANOVA
Derajat
Bebas
(db)
(df)
Sumber
Variasi
(Source)
Kuadrat
tengah
(KT) =
JK/db
(MS)
Jumlah
Kuadrat
(JK)
(SS)
n
Regresi
(Yˆi Y ) 2
1
KTRegresi
i 1
n
Error atau
Residual
Total,
terkoreksi
(Yi Yˆi ) 2
n-2
s2
i 1
Bila dinyatakan dengan persamaan:
k
(Yi Yi )
ni
i 1 j 1
i 1 j 1
suku 2
suku 3
Penalaran suku 1,
Diasumsikan : Yij~N(,2)
Yij
Yij ~ N ( , 2 ), maka
~ N (0,1),
2
Yij
Yij Y
i 1 j 1
Didapatkan
k
ni
ni
Y
i 1 j 1
2
Yij
~ 2k
i 1 j 1
ni
i 1
k
~ 12 , maka
ij
i 1
ni
k
i 1 j 1
suku 1
Y
2
ni
k
( yij y )2 ( yij yi )2 ( yi. y )2
k
n
n-1
JK
n 2
variansi mean setiap perlakuan terhadap mean keseluruhan.
ni
2
ni
k
~ 2k
, Yij Y
ni 1 i 1 j 1
i 1
hasil :
2
2
~ 2k
2
ni 1
i 1
~ 2k 2
ni 1
i 1
Keterangan : Judul yang ditulis miring, yaitu : Source, df,
SS, dan MS, merupakan istilah yang lazim
digunakan pada program MINITAB.
Distribusi Komponen Tabel ANOVA
Yang akan dibahas adalah distribusi : Jumlah Kuadrat Regresi, Jumlah Kuadrat Residual, dan Jumlah
Kuadrat Total.
Review ANOVA searah :
Penalaran suku 2,
Diasumsikan : Yij~N(i,2)
Yij ~ N ( i , 2 ), maka
Yij i
~ N (0,1),
2
Yij i
~ 12 , maka
2
ni
Yij Yi
2
~ n i 1 ,
j 1
Organisasi Data :
i
1
y11
y12
.
.
.
2
y21
y22
.
.
.
...
...
...
...
...
...
y1n1
y2n 2
yknk
y1
y2
yk
1
2
k
yk1
yk2
.
.
.
k
ni
Y
ij
i 1 j 1
2
Yij i
~ n2i ,
j 1
ni
ni
2
Yij Yi
2
~ k ni k
i 1 j 1
i 1
k
Yi ~ 2k
ni k
2
i 1
Didapatkan hasil :
k
ni
( y
ij
i 1 j 1
k
yi ) 2 ni (Yi. Y ) 2 ~ k2 1 2
i 1
y
Model ANOVA,Yij=i+ij, i=1,2,...k,
j=1,2,...,ni
k
1 ni
yi. yij
ni j 1
n y
i i
y
i
k
n
i
i
Variasi total respon merupakan
jumlahan dari variasi respon terhadap mean setiap perlakuan dengan
7
k
ni
Y
Yi ~
2
ij
i 1 j 1
2
Y ~ N ( , 2 ), E (Y ), 2 var(Y )
Y E (Y )
Y
~ N (0,1)
1/ 2
(var(Y ))
2
k
ni k
i 1
Penalaran suku 3,
Yi.
2
Yi. ~ N ( , ),
~ N (0,1)
1/ 2
ni
2
ni
(Yi . )
2
ni
k n (Y ) 2
i
i.
2
i 1
~ 12
2
k
i 1
(Yi. )
2
ni
k
~ k2
i 1
2
~ k2
Kembali ke Regresi
n
Penalaran distribusi
(Yˆ Y )
i
2
,
i 1
ni (Yi. Y ) 2
~ k2 1
2
Hasil Keseluruhan :
k
ni
Y
ij
Y
2
i 1 j 1
~ 2k 2
ni 1
i 1
k
ni
Y
ij
i 1 j 1
Yi ~ 2k
ni k
2
i 1
k
ni
k
(Yi. Y ) 2 ni (Yi. Y ) 2 ~ k2 1 2
i 1 j 1
i 1
Perlu diingat :
8
9