5.4.2 Regresi Reduksi Dimensi Terampat RR-VGLM
Yee Hastie 2003 menuliskan model dalam sebuah kelas pemodelan yang disebut Reduce Rank Vector GLM RR-VGLM bagi analisis data kategorik yang
mengaplikasikan konsep reduced-rank regression pada kelas pemodelan VGLM. VGLM sendiri melingkupi secara luas berbagai model statistika, algoritmanya
berpusat pada iteratively reweighted least squares IRLS dan Fisher scoring yang menghasilkan penduga maksimum likelihood. Kali ini kita akan membatasi
pembahasan RR-VGLM pada respon beberapa tipe data cacahan pada tabel dua arah dengan memodelkan pengaruh utama baris atau kolom dan pengaruh
interaksi secara multiplikatif. Anggaplah kita mempunyai data
untuk dengan adalah vektor peubah penjelas untuk pengamatan ke-i dan
adalah peubah respon. Nilai pertama pada
adalah 1 sebagai lambang intersep. VGLM pada dasarnya adalah GLM biasa tetapi memungkinkan prediktor linear berganda
multiple linear predictors. VGLM mampu menangani sebanyak-M prediktor linear dimensi M bergantung pada model yang akan diduga dan pada dimesi ke-j
dapat dituliskan sebagai ∑
. 5.6 Sebagaimana pada GLM, prediktor linear pada VGLM,
j
dapat dikenakan secara langsung pada parameter sebaran,
j, tidak hanya pada nilai tengah = EY, yaitu dengan
j j
j
g η
untuk beberapa fungsi hubung link function
j
g
dan parameter
j
.
x x
x x
x x
M T
M T
1 T
1
B .
. B
. .
B η
η
5.7
Matriks B berukuran p × M adalah matriks parameter koefisien regresi M bisa
jadi sangat besar, banyak parameter koefisien dalam model regresi tersebut. Pada beberapa situasi, koefisien-koefisien regresi ini berhubungan satu sama lain.
Misalya suatu
k j
mungkin sama, bernilai nol, atau merupakan penjumlahan
89 pada nilai tertentu. Kondisi semacam ini mungkin berkaitan dengan penggunaan
matriks kendala. Bentuk umum VGLMs adalah
p k
k k
k j
M j
x x
n
1
, 1,....,
,
B .
5.8
Matriks H
1
, H
2
,…, H
p
adalah matriks kendala yang diketahui dan memiliki rank- penuh dan
k
adalah vector koefisien regresi yang tidak diketahui. Bila tanpa
kendala sama sekali, H
1
= H
2
… H
p
= I
M
. sehingga,
2 2
1 1
p p
T
H H
H
B .
5.9
Mempartisi x menjadi
T T
T
x x
2 1
, dengan dimensi
p p
p
2 1
dan B =
T T
T 2
1
,B B
jika
2
B
memiliki parameter regresi yang terlalu banyak maka kita dapat mereduksinya dengan reduced-rank regression. RR-VGLM diformulasikan
dalam bentuk:
2 2
1 1
x x
T T
B B
.
5.10 Selanjutnya
2
B
didekati dengan reduced-rank regression .
2 T
A C
B
Dengan C dan
A
berturut-turut adalah matriks berukuran
R p
2
dan
R M
, dan memiliki rank R yang rendah, umumnya R = 1 atau 2. Sehingga,
v x
T
A B
1 1
5.11
dengan
2
x v
T
C
vektor R-buah peubah laten atau apapun namanya ia merupakan kombinasi liner dari unsur-unsur
2
x
. Untuk menjamin diperoleh penduga parameter yang unik,
2
x
digunakan sebuah konstrain pada matriks
A
. Biasanya digunakan konstrain sudut corner constrain, namun adakalanya kita
menggunakan konstrain yang lain. Perbedaan konstrain ini seringkali memberikan perbedaan-perbedaan baik itu pada alasan penggunaannya, penamaan modelnya
maupun pada interpretasi hasil.
5.4.3 Model Asosiasi Baris-Kolom RCAM untuk Data Cacahan dalam RR-VGLM
Berikut ini akan kita bicarakan bagaimana menggunakan kerangka kerja VGLMs untuk mengepas model. Anggaplah matriks Y = {y
ij
} berukuran n × M berisi
data cacahan. Model baris-kolom Goodman merupakan suatu tipe reduced-rank model
bagi Y dengan mengasumsikan Y
ij
memiliki sebaran Poisson dan
, log
1
R k
jk ik
j i
ij
c
5.12
dengan
ij ij
Y E
adalah nilai tengah sel ke-ij. Sebuah konstrain diperlukan
pada persamaan 5.12 untuk pengaruh baris dan kolom
i
dan
j
RCAM model menggunakan kendala sudut
j i
. Parameter
ik
a dan
jk
c
juga membutuhkan kendala, dan digunakan kendala
jk ik
c
untuk
R k
, ,
1
. Sehingga persamaan 5.12 dapat ditulis:
, log
ij j
i ij
Matriks
} {
ij
berukuran n × M adalah matriks suku interaksi yang diaproksimasi oleh pereduksi
R
k jk
ik
c
1
. Model asosiasi baris-kolom Goodman
dengan rank=R cocok menjadi suatu kerangka kerja VGLMs melalui
i i
log
dengan
i i
Y E
adalah nilai tengah dari baris ke-i dan kolom ke-j dari matriks
Y.
Demikian juga dengan matriks
T n
, ,
1
merupakan sebuah RR-VGLM
sebagaimana penjelasan berikut. Dari bagian sebelumnya kita memperoleh
j T
x
1 1
B =
1
1 1
1 2
1 1
,...., Diag
1 .....
1 1
M i
T M
M n
M M
e
5.13
subskrip “-1” menunjukkan elemen atau baris pertama dibuang dari vektor atau matriks tersebut. Dalam hal ini menunjukkan bahwa intersep atau skor peubah
baris merupakan satuan, 1
M
sebagaimana matriks kendalanya. Demikian juga halnya, karena B
2
didekati dengan
T
CA
, baris ke-i dari matriks
akan didekati oleh
T T
i
CA x
2
, atau dengan kata lain, matriks
diaproksimasi oleh: .