Generalized Estimating Equation (GEE)

4. Generalized Estimating Equation (GEE)

Liang dan Zeger (1986), menyampaikan bahwa analisis logistik maupun probit pada data panel dengan menggunakan pendekatan univariat, yakni mengabaikan adanya korelasi akan menghasilkan estimator parameter yang masih konsinten tetapi jika terdapat korelasi yang besar maka penaksir tersebut menjadi tidak efisien. Untuk meningkatkan efisiensi penaksiran parameter model marginal, Liang dan Zeger [1986] dan Prentice [1988] telah mengembangkan GEE. Pendekatan GEE menghasilkan estimator konsisten untuk parameter regresi, di bawah spesifikasi yang benar untuk fungsi mean,  i yang merupakan vektor respons untuk masing-masing individu. Pendekatan GEE adalah pengembangan metode quasi likelihood pada analisis data panel maupun data multivariat. GEE menggunakan pendekatan distribusi marginal.

Bidang Statistika

Jaka Nugraha

GEE untuk  didefinisikan sebagai

   1 G() =

 S i (Y' i  π' i )  0 (23)

i  1   ' dengan  = (’ 1 ,..,  T )’ = (( 11 ,..,  p1 )’,...., ( 1T ,..,  pT )’)’ dengan  t =( 1t ,..,  pt )’ Y i = (Y i1 ,....,Y iT );  i = ( i1 ,....,  iT ); it =(V it ) dan S i adalah matrik kovariansi T respons (pendekatan), sehingga S i merupakan matrik TxT dan dituliskan sebagai

i = A i R i A i dengan

 Var ( Y i 1 ) ...

A i   ... ...

...  , didefinisikan A i  

0 .... Var ( Y iT )  dan R i adalah matrik “working” korelasi Y i yang berukuran TxT. GEE dapat dituliskan dalam bentuk

 0 .... Var ( Y iT )

 G() = 1 

W i  i S i (Y' i  π' i )  0 (24)

 X i 0 .. 0 

  Z i 1 0 .. 0 

dengan W i   0 Z i 2 .. 0  dan  i  diag   [(  t  1 ) X i   t Z it ] 

 0 0 .. X i 

  0 0 .. Z iT 

W i dapat disebut sebagai matrik observasi. Pada persamaan utiliti secara umum, matrik observasinya adalah

 W i 1 0 ..

 0 W i 2 ..

W   i .. .. ..

  0 0 .. W i ( T  1 ) 0 

0 W iT 

Seminar Nasional Matematika-FKMS3MI 2008

Estimasi Model Probit pada Respon Biner ...

dengan W it = (W i1t ,....,W iPt )’. Estimator GEE merupakan penyelesaian persamaan penaksir (24) pada data sampel W.

Koefisien korelasi berpasangan diasumsikan  isr = corr(Y is ,Y ir ) untuk i = 1,2,..n dan s,r=1,2,…T . Untuk mengestimasi R i , didefinisikan T(T-1)/2 vektor korelasi empirik, r i dengan elemen-elemen

( Y is   is )( Y it   it ) r ist 

[  is ( 1   is )  it ( 1   it )]

Korelasi empirik r ist yang memuat parameter  is dan  it merupakan estimator tak bias untuk  ist , Jika diasumsikan  ist = st untuk semua i maka penaksirnya adalah

st   r ist

(26) n i  1

Persamaan (24) dan (26) diselesaikan secara bersamaan untuk mendapatkan penaksir parameter  dan . Persamaan (24) dapat diselesaikan dengan metode Newton-Raphson. Prosedur mendapatkan penaksir  dan  adalah

1. memberikan nilai penduga awal untuk R i untuk menghitung parameter  secara iterasi.

2. nilai  yang diperoleh pada langkah (1) digunakan untuk menghitung 

3. menggunakan nilai  dari langkah (2) untuk menghitung paramater .

4. langkah (2) dan (3) diulang sampai mencapai titik konvergen. Salah satu pendekatan untuk mengestimasi matrik kovariansi parameter  adalah menggunakan invers matrik Informasi Fisher diperoleh

V ar (  ) M 0 dengan M 0     S i  

Matrik Informasi Fisher sama dengan Var [G()],

   1  1     Var [G()] = Var

i (Y' i  π' i )    S i Var(Y' i  π' i ) S

Bidang Statistika

Jaka Nugraha

   1     Jika

S i  Var(Y' i  π' i ) maka

Var

[G()]=

 =M 0 . Jika

S i  Var(Y' i  π' i ) maka Var [G()]=  S i Var(Y' i  π' i ) S i   M 0 . Jadi Jika

    terjadi misspesifikasi terhadap nilai ”working” korelasi R i , maka estimator yang diperoleh tidak konsisten. Liang dan Zeger (1986) merekomendasikan estimator lain yang bersifat konsisten, yaitu matrik kovariansi  diestimasi dengan

V ar (  )  M 0 M 1 M 0 dengan M 1     S i ( y ' i   ˆ ' i )( y ' i   ˆ ' i )' S i  

    Parameter  dihitung berdasarkan persamaan penaksir (24) menggunakan modifikasi matrik Informasi Fisher (berdasarkan nilai matrik ”working” korelasi). Persamaan iterasi ke (k+1) adalah

   S i       S i ( y ' i   ˆ ' i )   (29)

 Jika ˆ G merupakan estimator GEE, maka lim n (  ˆ

G  )  berdistribusi normal multivariat, 

lim n (  ˆ  ) ~ NM ( 0 ; n . Var (  ˆ ))

dengan

    ˆ i   1    ˆ i         ˆ i   1  1    ˆ i         ˆ i   1    ˆ  Var  (  G )  i lim

n  n    S i      S i [ Var ( y ' i )] S i  

  i  1           Sehingga persamaan iterasi ke (k+1) untuk persamaan penaksir (24) adalah

 1 (k) 

(k+1) (k)

= -   W i Δ i S i Δ i W i    W i Δ i S i (Y' i  π' i ) 