b
R
= r
xx
+ c I
-1
r
xy
matriks korelasi dimana:
c = biasing constant I = identity matrix
b
R [p-1 x 1]
=
Tahapan dalam metode regresi ridge : 1. Lakukan transformasi tehadap matriks X menjadi Z dan vektor Y menjadi Y
R
, melalui centering and rescaling.
2. Hitung matriks ZZ = matriks korelasi dari variable bebas, serta hitung ZY
R
= korelasi dari variable bebas terhadap variable tak bebas y.
3. Hitung nilai penaksir parameter b
R
dengan kemungkinan tetapan bias c. 4. Hitung nilai VIF dengan berbagai nilai c 0c1
5. Tentukan nilai c dengan mempertimbangkan nilai VIF dan b
R
. Tentukan koefisien penduga estimator regresi ridge dari nilai c yang terpilih..
6. Buat persamaan model regresi ridge 7. Uji Hipotesis secara Simultan dengan ANOVA regresi ridge dan Parsial .
8. Transformasikan ke bentuk asal.
a. Metode Centering and Rescaling
Dalam persamaan regresi yang memiliki model :
Yi = β0 + β1Xi1 + β2Xi2 + εi
Persamaan tersebut di atas dapat dibentuk menjadi :
Yi = β0 + β1 Xi1 – + β1 + β2Xi2 - + β2 + εi
= β0 + β1 + β2 + β1 Xi1 - + β2 Xi2 - + εi
menurut rumus untuk mendapatkan β
yaitu :
β0 = - β1 - β2
Universitas Sumatera Utara
= β
+ β
1
+ β
2
Sehingga
Yi – β0 + β1 + β2 = β1 Xi1 - + β2Xi2 - + εi
Yi - = β1 Xi1 - + β2Xi2 - + εi
Jika yi = Yi -
x
i1
= X
i1
- x
i2
= X
i2
- maka didapat persamaan baru yaitu :
y
i
= β
1
x
i1
+ β
2
x
i2
+ ε
i
Prosedur untuk membentuk persamaan pertama menjadi persamaan terakhir disebut dengan prosedur
centering.
Prosedur ini mengakibatkan hilangnya β
intercept yang membuat perhitungan untuk mencari model regresi menjadi lebih sederhana.
Bila dari persamaan di atas dibentuk persamaan : Y
i R
= β
1
Z
i1
+ β
2
Z
i2
+ ε
i
’
Y
i R
= =
Z
i1
= =
Z
i2
= =
Keterangan: : nilai variabel tak bebas ke-i hasil trasformasi
: nilai variabel tak bebas ke-i : rata-rata variabel tak bebas
: Jumlah Observasi :
: nilai variabel bebas 1 ke-i hasil trasformasi : nilai variabel bebas 1 ke i
: rata-rata variabel bebas 1
Universitas Sumatera Utara
:
:
maka prosedur ini disebut dengan prosedur Rescaling. Keseluruhan dari prosedur di atas disebut prosedur centering and rescaling.
b. Menentukan tetapan bias biasing constant c
Ridge trace merupakan plot dari estimator ridge regresi secara bersama dengan berbagai kemungkinan nilai tetapan bias c. Konstanta c mencerminkan jumlah bias
dalam estimator c . Saat c bernilai 0 maka estimator c akan bernilai sama dengan estimator kuadrat terkecil yang telah dalam bentuk standardized. Ketika c
0 estimator ridge regression akan bias tetapi cenderung menjadi lebih stabil daripada estimator kuadrat terkecil. Umumnya nilai c terletak pada interval 0c1.
Pemilihan besarnya tetapan bias c merupakan masalah yang perlu diperhatikan. Tetapan bias yang diinginkan adalah tetapan bias yang relative kecil
dan menghasilkan koefisien estimator yang relatif stabil. Suatu acuan yang digunakan untuk memilih besarnya c, dengan melihat
besarnya VIF dan melihat pola kecenderungan Ridge Trace. VIF merupakan faktor yang mengukur seberapa besar kenaikan variansi dari koefisien estimator
dibandingkan terhadap variable bebas lain yang saling orthogonal. Bila diantara variabel bebas tersebut terdapat korelasi yang tinggi, nilai VIF akan besar. VIF
memiliki nilai mendekati 1 jika variabel bebas X tidak saling berkorelasi dengan variabel-variabel bebas lainnya.
Nilai VIF untuk koefisien ridge regression adalah element diagonal pada matriks p- 1 x p-1 berikut:
r
xx
+ c I
-1
r
xx
r
xx
+ c I
-1
Universitas Sumatera Utara
Cara pemilihan ini memang bersifat subyektif, artinya jika ada 2 orang pemilih memilih nilai c dengan data yang sama mungkin akan mendapatkan nilai c yang tidak
sama Myers, 1990.
Contoh kasus :
Untuk mengetahui penggunaan metode regresi ridge dan analisis komponen utama dalam menyelesaikan masalah multikolinearitas, akan digunakan suatu contoh kasus
yang terdapat multikolinearitas diantara variabel-variabel bebasnya. Data yang akan dibahas adalah data yang tertera pada tabel berikut ini :
Tabel 4.1. Data Banyaknya Serangan Virus Pada penggerek Batang Padi Afrika di Pantai Gading Afrika Barat dan Faktor-faktor yang
Mempengaruhinya.
NO Y
X
1
X
2
X
3
X
4
X
5
X
6
1 1,140
11,120 224,600
1,577 602,000
0,223 166,000
2 1,620
12,150 224,800
1,639 490,100
0,235 53,500
3 1,410
12,350 223,900
1,666 462,300
0,249 6,000
4 1,370
12,000 222,500
1,631 543,000
0,285 6,000
5 1,170
12,100 227,300
1,649 631,000
0,378 7,500
6 0,960
10,000 228,000
1,548 781,000
0,289 188,000
7 1,836
8,800 213,100
1,493 901,000
0,093 74,800
8 1,710
12,500 237,400
1,707 839,000
0,458 55,000
9 1,520
11,300 230,200
1,606 876,000
0,350 72,700
10 1,070
8,600 211,900
1,485 646,000
0,126 210,500
11 1,380
8,800 206,200
1,533 996,000
0,212 14,250
12 1,800
10,200 230,800
1,593 753,500
0,159 11,900
13 0,996
10,700 227,000
1,599 529,300
0,300 51,500
14 1,430
12,050 239,000
1,697 701,000
0,364 40,000
Sumber: Pollet, A and Nasrullah 1994
Universitas Sumatera Utara
Keterangan : Y = Virus mikron
X
1
= rerata selisih suhu harian tertinggi dan suhu harian terendah
C X
2
= rerata suhu harian tertinggi C
X
3
= logaritma kelembaban relatif maksimum Kgm
3
X
4
= kecepatan angin knot X
5
= logaritma evepotranspirasi mm X
6
= curah hujan mm
4.2. Metode Regresi Linier Ganda