Sebaran Zero-inflated Poisson Pengembangan Model GAMMI untuk Zero-Inlfated Poisson

5.4.2 Regresi Reduksi Dimensi Terampat RR-VGLM

Yee Hastie 2003 menuliskan model dalam sebuah kelas pemodelan yang disebut Reduce Rank Vector GLM RR-VGLM bagi analisis data kategorik yang mengaplikasikan konsep reduced-rank regression pada kelas pemodelan VGLM. VGLM sendiri melingkupi secara luas berbagai model statistika, algoritmanya berpusat pada iteratively reweighted least squares IRLS dan Fisher scoring yang menghasilkan penduga maksimum likelihood. Kali ini kita akan membatasi pembahasan RR-VGLM pada respon beberapa tipe data cacahan pada tabel dua arah dengan memodelkan pengaruh utama baris atau kolom dan pengaruh interaksi secara multiplikatif. Anggaplah kita mempunyai data untuk dengan adalah vektor peubah penjelas untuk pengamatan ke-i dan adalah peubah respon. Nilai pertama pada adalah 1 sebagai lambang intersep. VGLM pada dasarnya adalah GLM biasa tetapi memungkinkan prediktor linear berganda multiple linear predictors. VGLM mampu menangani sebanyak-M prediktor linear dimensi M bergantung pada model yang akan diduga dan pada dimesi ke-j dapat dituliskan sebagai ∑ . 5.6 Sebagaimana pada GLM, prediktor linear pada VGLM,  j dapat dikenakan secara langsung pada parameter sebaran, j, tidak hanya pada nilai tengah  = EY, yaitu dengan j j j  g η  untuk beberapa fungsi hubung link function j g dan parameter j  .                               x x x x x x M T M T 1 T 1 B . . B . . B η η   5.7 Matriks B berukuran p × M adalah matriks parameter koefisien regresi M bisa jadi sangat besar, banyak parameter koefisien dalam model regresi tersebut. Pada beberapa situasi, koefisien-koefisien regresi ini berhubungan satu sama lain. Misalya suatu k j  mungkin sama, bernilai nol, atau merupakan penjumlahan 89 pada nilai tertentu. Kondisi semacam ini mungkin berkaitan dengan penggunaan matriks kendala. Bentuk umum VGLMs adalah     p k k k k j M j x x n 1 , 1,...., ,  B . 5.8 Matriks H 1 , H 2 ,…, H p adalah matriks kendala yang diketahui dan memiliki rank- penuh dan k  adalah vector koefisien regresi yang tidak diketahui. Bila tanpa kendala sama sekali, H 1 = H 2 … H p = I M . sehingga,   2 2 1 1 p p T H H H      B . 5.9 Mempartisi x menjadi   T T T x x 2 1 , dengan dimensi p p p   2 1 dan B =   T T T 2 1 ,B B jika 2 B memiliki parameter regresi yang terlalu banyak maka kita dapat mereduksinya dengan reduced-rank regression. RR-VGLM diformulasikan dalam bentuk: 2 2 1 1 x x T T B B    . 5.10 Selanjutnya 2 B didekati dengan reduced-rank regression . 2 T A C B  Dengan C dan A berturut-turut adalah matriks berukuran R p  2 dan R M  , dan memiliki rank R yang rendah, umumnya R = 1 atau 2. Sehingga, v x T A B   1 1  5.11 dengan 2 x v T C  vektor R-buah peubah laten atau apapun namanya ia merupakan kombinasi liner dari unsur-unsur 2 x . Untuk menjamin diperoleh penduga parameter yang unik, 2 x digunakan sebuah konstrain pada matriks A . Biasanya digunakan konstrain sudut corner constrain, namun adakalanya kita menggunakan konstrain yang lain. Perbedaan konstrain ini seringkali memberikan perbedaan-perbedaan baik itu pada alasan penggunaannya, penamaan modelnya maupun pada interpretasi hasil.

5.4.3 Model Asosiasi Baris-Kolom RCAM untuk Data Cacahan dalam RR-VGLM

Berikut ini akan kita bicarakan bagaimana menggunakan kerangka kerja VGLMs untuk mengepas model. Anggaplah matriks Y = {y ij } berukuran n × M berisi data cacahan. Model baris-kolom Goodman merupakan suatu tipe reduced-rank model bagi Y dengan mengasumsikan Y ij memiliki sebaran Poisson dan , log 1       R k jk ik j i ij c      5.12 dengan ij ij Y E   adalah nilai tengah sel ke-ij. Sebuah konstrain diperlukan pada persamaan 5.12 untuk pengaruh baris dan kolom i  dan j  RCAM model menggunakan kendala sudut   j i   . Parameter ik a dan jk c juga membutuhkan kendala, dan digunakan kendala   jk ik c  untuk R k , , 1   . Sehingga persamaan 5.12 dapat ditulis: , log ij j i ij          Matriks } { ij    berukuran n × M adalah matriks suku interaksi yang diaproksimasi oleh pereduksi   R k jk ik c 1  . Model asosiasi baris-kolom Goodman dengan rank=R cocok menjadi suatu kerangka kerja VGLMs melalui i i   log  dengan i i Y E   adalah nilai tengah dari baris ke-i dan kolom ke-j dari matriks Y. Demikian juga dengan matriks   T n   , , 1  merupakan sebuah RR-VGLM sebagaimana penjelasan berikut. Dari bagian sebelumnya kita memperoleh j T x 1 1 B =              1 1 1 1 2 1 1 ,...., Diag 1 ..... 1 1 M i T M M n M M e      5.13 subskrip “-1” menunjukkan elemen atau baris pertama dibuang dari vektor atau matriks tersebut. Dalam hal ini menunjukkan bahwa intersep atau skor peubah baris merupakan satuan, 1 M sebagaimana matriks kendalanya. Demikian juga halnya, karena B 2 didekati dengan T CA , baris ke-i dari matriks  akan didekati oleh T T i CA x 2 , atau dengan kata lain, matriks  diaproksimasi oleh: .