Regresi Reduksi Dimensi Terampat RR-VGLM
data cacahan. Model baris-kolom Goodman merupakan suatu tipe reduced-rank model
bagi Y dengan mengasumsikan Y
ij
memiliki sebaran Poisson dan
, log
1
R k
jk ik
j i
ij
c
5.12
dengan
ij ij
Y E
adalah nilai tengah sel ke-ij. Sebuah konstrain diperlukan
pada persamaan 5.12 untuk pengaruh baris dan kolom
i
dan
j
RCAM model menggunakan kendala sudut
j i
. Parameter
ik
a dan
jk
c
juga membutuhkan kendala, dan digunakan kendala
jk ik
c
untuk
R k
, ,
1
. Sehingga persamaan 5.12 dapat ditulis:
, log
ij j
i ij
Matriks
} {
ij
berukuran n × M adalah matriks suku interaksi yang diaproksimasi oleh pereduksi
R
k jk
ik
c
1
. Model asosiasi baris-kolom Goodman
dengan rank=R cocok menjadi suatu kerangka kerja VGLMs melalui
i i
log
dengan
i i
Y E
adalah nilai tengah dari baris ke-i dan kolom ke-j dari matriks
Y.
Demikian juga dengan matriks
T n
, ,
1
merupakan sebuah RR-VGLM
sebagaimana penjelasan berikut. Dari bagian sebelumnya kita memperoleh
j T
x
1 1
B =
1
1 1
1 2
1 1
,...., Diag
1 .....
1 1
M i
T M
M n
M M
e
5.13
subskrip “-1” menunjukkan elemen atau baris pertama dibuang dari vektor atau matriks tersebut. Dalam hal ini menunjukkan bahwa intersep atau skor peubah
baris merupakan satuan, 1
M
sebagaimana matriks kendalanya. Demikian juga halnya, karena B
2
didekati dengan
T
CA
, baris ke-i dari matriks
akan didekati oleh
T T
i
CA x
2
, atau dengan kata lain, matriks
diaproksimasi oleh: .
91 Hal ini berarti baris-baris matriks
dapat diaproksimasi oleh .
Aproksimasi reduksi dimensi bagi matriks dapat diperoleh jika
sehingga . Catatlah bahwa matriks
adalah ̃
[ ],
dan baris pertama matris A berisi nol yang terstruktur yang akan terbuang oleh regresi reduksi dimensi dari matriks
. Kita dapat mendefinisikan RCAM sebagai RR-VGLM dengan menuliskan
� ∑
�
. 5.14
Kita perhatikan bahwa pada persamaan 5.12 berlaku bagi prediktor
linearaditif yang pertama, sedangkan untuk model dengan M 1, prediktor linear
M
,...,
2
tetap tidak berubah. Tentu saja, memilih
1
bagi persamaan 5.12 hanya untuk kenyamanan. Ringkasnya, RCAM dan RR-VGLM pada umumnya
memiliki prediktor linear aditif pertama yang dimodelkan sebagai jumlah dari efek baris, efek kolom, dan efek interaksi yang dinyatakan sebagai reduce rank
regression. 5.4.4 Model
Zero-Inflated Poisson dalam RR-VGLM
Model ZIP sangat powerfull dalam menangani data cacahan yang mengalami kelebihan nol dibanding sebaran Poisson yang biasa. Sebagian hal ini disebabkan
karena model ZIP juga menangani overdispersi. Sebaran ZIP sebagaimana persamaan 5.1 dapat disebutkan bahwa kejadian Y = 0 berasal dari dua sumber
dan dalam hal ini RR-VGLM memodelkannya dengan dan
sebagai .
5.15 Terdapat dua proses bagaimana data terjadi, yang pertama data bernilai nol
dan data cacahan Poisson. Kedua proses tersebut dimodelkan berturut-turut oleh dan
namun keduanya dapat digabungkan melalui beberapa hubungan yang sistematis. Liu dan Chan 2010 memberikan contoh yang melibatkan penelitian
survei dimana agregasi spatio-temporal akan menunjukkan peluang tangkapan yang positif mirip dengan fungsi nilai tengah yang monotonik.