Pendekatan Gee dan Quasi-Likelihood Dalam Generalized Linfar Mixed Model
PENDEKATAN GEE DAN QUASI-LIKELIHOOD
DALAM GENERALIZED LINEAR MIXED MODELS
PROGRAM PASCA SARJANA
INSTITLIT PERTANIAN BOGOR
BOGOR
2000
RINGKASAN
ANANG KURNIA. Pendekatan GEE dan Quasi-Li kelihood dalam G e n e r a m
Linear Mixed Models. (Dibawah
bimbingan ASEf SAEFUDDIN dan
BAMBANG JUANDA).
Gawalized Linear Mixed Models (GLMM) merupakan tmri model linear
,J
yang menyerbkan pengaruh acak dan pengaruh tetap ddam model dengan
peubah respons (outcome) yang tidak hams menyebar normal. GLMM adalah
hasil perkembangan dari dua model yaitu linear mixed models (LMM) dan
generalized linear model3 (GLM). Dalam perkembangannya GLMM rnenawarkan
suatu Wri model linear yang lebih menyeluruh dalam mengungkap hal-ha1
yang lebih kompleks terutama yang berkaitan dengan pengaruh acak,
komponen ragam dan bentuk sebaran data peubah respons yang tidak normal.
Untuk menduga parameter dalam GLMM, metode maksimum likelihood
digunakan sebagai pendekatrtn standar. Akan tetapi masalah kornputasi masih
menjadi hambatan karma fungsi likelihood yang diperoleh menjadi tidak
sesederhana seperti pada model linear klasik Metodemetode pendekatan dan
alternatif telah banyak disampaikan para pakar seperti : metode Monk Carlo
ML (Karim dan Zeger, 1W; McCuUoch, 1997), aplikasi algoritma EM (Stele,
19%; Aitkin, 1999), quasi-likelihoad (Brelow dan Clayton, 1983; Wolfinger dan
VConnell, 1983;Pawitan, 1998).
Dalam penelitian ini klaah dipusatkan pada aplikasi metode quasilikelihood dengan algoribna Shall/ Wolfinger dan pendekatan Gamdizd
Estimating Eqwtiotts, GEE (Zeger dan Liang, 1986). Pendekatan GEE digunakan
untuk melihat kemungkinan pendekatan secara marginal yaitu apabila evaluasi
hanya difokuskan pada komponen ktap dari model campuran.
Hasil yang diperoleh menunjukkan bahwa GEE cukup mempunyai
harapan untuk digunakan sebagai pendekatan marginal pada kasus GLMM.
Pendugaan parameter yang dihasilkan GEE tidak berbeda dengan hasil metode
quasi-likdihood dan bahkan menunjukkan kecenderungan menghasilkan
penduga ragam koefisien yang lebih k i l .
PENDEKATAN GEE DAN QUASI-LIKELIHOOD
DALAM GENERALIZED LINEAR MIXED MODELS
Oleh
ANANG KURNlA
97108
TESIS
Sebagai Salah Satu Syarat untuk Mernperoleh
Gelar Magister Sains
pada Program Studi Statistika Program Pasca Saqana
di
Insititut Pertanian Bogor
PROGRAM STUD1 STATISTLKA
PROGRAM PASCA SARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2000
Judul
: PENDEKATAN GEE DAN QUASI-LIKELIHOOD DALAM
GENERALIZED LINEAR MIXED MODELS
Nama Mahasiswa
: ANANG KURNlA
Program Studi
: STATISTIKA
Nomor Pokok
: 97108
Menyetujui :
1. Komisi Pembimbing
Dr. Ir. A s e ~Saefuddin MSG.
Ketua
Dr. Ir. B6mbana Juanda. MS.
2. Ketua Program Studi
Statistika
3. Direktur Program
Dr. Ir. Aunuddin
Tanggal Lulus : 5 Mei 2000
Anggota
RIWAYAT HLDUP
Penulis dilahirkan di Tasikmalaya pada tanggal 24 Agustus 1973 sebagai putera
kedua dari dua bersaudara keluarga Bapak Hadian Supratman dan Ibu M. Suryati.
Pada tahun I986 penulis menyelesaikan pendidikan Sekolah Dasar pada SD
Negeri 1 Rajadatu. Penulis menyelesaikan pendidikan Sekolah Menengah Pertama di
SMP Negeri Cineam pada tahun 1989 dan menyeledan Sekolah Menengah Atas di
SMA Negeri I Tasikmalaya pada tahun 1992.
Tahun 1996 Penulis berhasil menyelesaikan pendidikan Sarjana di Institut
Pertanian Bogor dengan bidang keahlian Statistika. Pada tahun 1 997 Penulis diterirna
sebagai mahasiswa Program Pasca Saijana di Institut PertarW Bogor pada Program
Studi Statistika.
Sejak tahun 1997 sarnpai sekarang Penulis menjadi dosen pada Jurusan Statistika
Fakuitas Matematika dan Ilmu Pengetahuan A l a r q Institut Pertanian Bogor.
Penulis menikah dengan Dian Handayani pada tahun 1998 dan pada s a t ini
tengah menunggu kelahlran putra pertamanya.
KATA PENGANTAR
Puji dan syukur dipanjatkan kepada Tuhan Yang Maha Esa, atas berkat dan
rahmat-Nya tulisan dengan judul Pendekatan GEE dan Quasi-Likelihood dalam
Generalized Linear Mixed Models telah dapat diselesaikan dengan baik.
Tulisan ini rnerupakan d a h satu syarat dalam menyelesaikan pendidikan S2
pada Program Studi Statistika , Program Pasca Sarjana, lnsititut Pertanian Bogor.
Pada kesempatan ini penulis mengucapkan terirna k s i h kepada Dr. Ir Asep
Saefuddin, MSG. dan Dr. Ir. Bambang Juanda, MS, atas segala bimbingan dan
pengarahannya sejak persiapan penelitian hingga tersusunnya tulisan ini.
Ungkapan
senada Penulis sampaikan kepada:
1 . Ketua Jurusan dan segenap dosen pada Jurusan Statistika FMIPA-IPB yang telah
banyak
memberikan dorongan dan
pengertian
selama penelitian dan
penyelesaian tulisan ini.
2. Istri, orang tua dan saudara-saudaraku yang senantiasa memberikan semangat,
dorongan dan doa yang tulus.
3. Semua pihak yang telah memberikan bantuan, bak moril maupun mated, yang
tidak dapat Penulis sebutkan satu per satu.
Semoga karya kecil ini dapat memberikan manfaat bagi yang membutuhkan.
Bogor, Mei 2000
Penulis
DAETAR IS1
Hal
I. PENDAHULUAN .........................................................................................
1
1.1. Latar Belakang ....................................................................................
1.2. Tujuan dan Manfaat Penelitian
I
.......................................................
2
II. TINJAUAN PUSTAKA .................................................................................
2.1. Data Biner ..........................................................................................
2.2. Generalized Linear Models (GLM) ..................................................
2.3. Generalized Linear Mixed Models (GLMM) .......................... ..
2.4. Fungsi Likelihood ............................
2.5. Penduga Ma ksimum Likelihood
....
.
.
.............................................
......................................................
2.6. Quasi-Likelihood ..............................................................................
2.7. Restricted Maximum Likelihood ....................................................
2.8. Generalized Estimating Equations ....................................................
IV. HASKL DAN PEMBAHASAN..................
............................................
.
.
22
4.1. nustrasi dengan The Snlamnnder Mafing Dntn dalam
McCullagh & Nelder (1989)................
.........................................
.
.
22
4.2. Ilustrasi dengan The Cell lrrndiatiun Dntn dalam Schall(1991) ........ 24
...................................
. . . . .
.................................................
4.4. Hasi l Simulasi .......................... .
.
.
4.5. Pembahasan ........................................................................................
4.3. IIusbasi Data Produksi Gula
V . KESMPULAN DAN SARAN ....................
..........
....................
................................*.............
5.1. Kesimpulan ................................ .
.
.
5.2. Saran ...................................................................................................
25
27
29
32
32
32
I. PENDAHULUAN
Generalized Linear Mixed Modcls (GLMM) merupakan teori m ode1 linear
yang menyertakan pengaruh acak dan pengaruh tetap dalam model dengan
peubah respons (oulcomes} yang tidak harus menyebar normal. GLMM
adalah hasil perkembangan dari dua model yaitu linear 111ixedmodels (LMM)
dan gmernlizd linear tr~odels (GLM).
Dalam perkembangannya GLMM
menawarkan suatu teori model linear yang lebih menyeluruh dalam
mengungkap hal-ha1 yang lebi h kom pleks terutama yang brkaitan dengan
pengaruh acak, komponen ragam dan bentuk sebaran data peubah respons
yang tidak normal. Model dengan pengaruh acak diharaykan lebih efisien
dalam
mengidentifikasi sebaran komponen
acak sehingga mampu
menerangkan lebih tepat pengaruh komponen acak tersebut
Untuk mend uga parameter dalam GLMM, metode maksimum
likelihood digunakan sebagai pendekatan standar. Akan tetapi masalah
komputasi masih menjadi ham batan karena hngsi likelihood yang diperoleh
menjadi tidak sesederhana seperti pada model linear ktasik. Metode-metode
pendekatan dan alternatif telah banyak disampaikan para pakar seperti :
metode Monte Carlo ML (Karim & Zeger, 1992; McCulloch, 1997), aplikasi
algorilma EM (Steele, 1996; Aitkin, 3 999, q uasi-li kelihood (Breslow &
Clayton, 1993; Wolfinger & UConnell, 1993; Pawitan, 1998).
1.2. Tujuan dan Manfaat Penelitian
Penelitian ini bertujudn untuk mengkaji metode penyelesaian kasus
GLM dan GLM M melalui aplikasi quasi-likelihood dengan algoritma
Schall/Wolfinger dan pendekatan gmeralizd estimating equations (GEE).
Adapun hasil penelitian ini diharapkan dapat memberikan rekomendasi dan
rnampu mengidentifikasi keunggulan-keunggulan pada metode quasilikelihood rnaupun generalized estimatitlg eqlinlions. Selain itu hasil kajian
metode yang dilakukan akan memperkaya khasdnah teori GLM dan GLMM.
DALAM GENERALIZED LINEAR MIXED MODELS
PROGRAM PASCA SARJANA
INSTITLIT PERTANIAN BOGOR
BOGOR
2000
RINGKASAN
ANANG KURNIA. Pendekatan GEE dan Quasi-Li kelihood dalam G e n e r a m
Linear Mixed Models. (Dibawah
bimbingan ASEf SAEFUDDIN dan
BAMBANG JUANDA).
Gawalized Linear Mixed Models (GLMM) merupakan tmri model linear
,J
yang menyerbkan pengaruh acak dan pengaruh tetap ddam model dengan
peubah respons (outcome) yang tidak hams menyebar normal. GLMM adalah
hasil perkembangan dari dua model yaitu linear mixed models (LMM) dan
generalized linear model3 (GLM). Dalam perkembangannya GLMM rnenawarkan
suatu Wri model linear yang lebih menyeluruh dalam mengungkap hal-ha1
yang lebih kompleks terutama yang berkaitan dengan pengaruh acak,
komponen ragam dan bentuk sebaran data peubah respons yang tidak normal.
Untuk menduga parameter dalam GLMM, metode maksimum likelihood
digunakan sebagai pendekatrtn standar. Akan tetapi masalah kornputasi masih
menjadi hambatan karma fungsi likelihood yang diperoleh menjadi tidak
sesederhana seperti pada model linear klasik Metodemetode pendekatan dan
alternatif telah banyak disampaikan para pakar seperti : metode Monk Carlo
ML (Karim dan Zeger, 1W; McCuUoch, 1997), aplikasi algoritma EM (Stele,
19%; Aitkin, 1999), quasi-likelihoad (Brelow dan Clayton, 1983; Wolfinger dan
VConnell, 1983;Pawitan, 1998).
Dalam penelitian ini klaah dipusatkan pada aplikasi metode quasilikelihood dengan algoribna Shall/ Wolfinger dan pendekatan Gamdizd
Estimating Eqwtiotts, GEE (Zeger dan Liang, 1986). Pendekatan GEE digunakan
untuk melihat kemungkinan pendekatan secara marginal yaitu apabila evaluasi
hanya difokuskan pada komponen ktap dari model campuran.
Hasil yang diperoleh menunjukkan bahwa GEE cukup mempunyai
harapan untuk digunakan sebagai pendekatan marginal pada kasus GLMM.
Pendugaan parameter yang dihasilkan GEE tidak berbeda dengan hasil metode
quasi-likdihood dan bahkan menunjukkan kecenderungan menghasilkan
penduga ragam koefisien yang lebih k i l .
PENDEKATAN GEE DAN QUASI-LIKELIHOOD
DALAM GENERALIZED LINEAR MIXED MODELS
Oleh
ANANG KURNlA
97108
TESIS
Sebagai Salah Satu Syarat untuk Mernperoleh
Gelar Magister Sains
pada Program Studi Statistika Program Pasca Saqana
di
Insititut Pertanian Bogor
PROGRAM STUD1 STATISTLKA
PROGRAM PASCA SARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2000
Judul
: PENDEKATAN GEE DAN QUASI-LIKELIHOOD DALAM
GENERALIZED LINEAR MIXED MODELS
Nama Mahasiswa
: ANANG KURNlA
Program Studi
: STATISTIKA
Nomor Pokok
: 97108
Menyetujui :
1. Komisi Pembimbing
Dr. Ir. A s e ~Saefuddin MSG.
Ketua
Dr. Ir. B6mbana Juanda. MS.
2. Ketua Program Studi
Statistika
3. Direktur Program
Dr. Ir. Aunuddin
Tanggal Lulus : 5 Mei 2000
Anggota
RIWAYAT HLDUP
Penulis dilahirkan di Tasikmalaya pada tanggal 24 Agustus 1973 sebagai putera
kedua dari dua bersaudara keluarga Bapak Hadian Supratman dan Ibu M. Suryati.
Pada tahun I986 penulis menyelesaikan pendidikan Sekolah Dasar pada SD
Negeri 1 Rajadatu. Penulis menyelesaikan pendidikan Sekolah Menengah Pertama di
SMP Negeri Cineam pada tahun 1989 dan menyeledan Sekolah Menengah Atas di
SMA Negeri I Tasikmalaya pada tahun 1992.
Tahun 1996 Penulis berhasil menyelesaikan pendidikan Sarjana di Institut
Pertanian Bogor dengan bidang keahlian Statistika. Pada tahun 1 997 Penulis diterirna
sebagai mahasiswa Program Pasca Saijana di Institut PertarW Bogor pada Program
Studi Statistika.
Sejak tahun 1997 sarnpai sekarang Penulis menjadi dosen pada Jurusan Statistika
Fakuitas Matematika dan Ilmu Pengetahuan A l a r q Institut Pertanian Bogor.
Penulis menikah dengan Dian Handayani pada tahun 1998 dan pada s a t ini
tengah menunggu kelahlran putra pertamanya.
KATA PENGANTAR
Puji dan syukur dipanjatkan kepada Tuhan Yang Maha Esa, atas berkat dan
rahmat-Nya tulisan dengan judul Pendekatan GEE dan Quasi-Likelihood dalam
Generalized Linear Mixed Models telah dapat diselesaikan dengan baik.
Tulisan ini rnerupakan d a h satu syarat dalam menyelesaikan pendidikan S2
pada Program Studi Statistika , Program Pasca Sarjana, lnsititut Pertanian Bogor.
Pada kesempatan ini penulis mengucapkan terirna k s i h kepada Dr. Ir Asep
Saefuddin, MSG. dan Dr. Ir. Bambang Juanda, MS, atas segala bimbingan dan
pengarahannya sejak persiapan penelitian hingga tersusunnya tulisan ini.
Ungkapan
senada Penulis sampaikan kepada:
1 . Ketua Jurusan dan segenap dosen pada Jurusan Statistika FMIPA-IPB yang telah
banyak
memberikan dorongan dan
pengertian
selama penelitian dan
penyelesaian tulisan ini.
2. Istri, orang tua dan saudara-saudaraku yang senantiasa memberikan semangat,
dorongan dan doa yang tulus.
3. Semua pihak yang telah memberikan bantuan, bak moril maupun mated, yang
tidak dapat Penulis sebutkan satu per satu.
Semoga karya kecil ini dapat memberikan manfaat bagi yang membutuhkan.
Bogor, Mei 2000
Penulis
DAETAR IS1
Hal
I. PENDAHULUAN .........................................................................................
1
1.1. Latar Belakang ....................................................................................
1.2. Tujuan dan Manfaat Penelitian
I
.......................................................
2
II. TINJAUAN PUSTAKA .................................................................................
2.1. Data Biner ..........................................................................................
2.2. Generalized Linear Models (GLM) ..................................................
2.3. Generalized Linear Mixed Models (GLMM) .......................... ..
2.4. Fungsi Likelihood ............................
2.5. Penduga Ma ksimum Likelihood
....
.
.
.............................................
......................................................
2.6. Quasi-Likelihood ..............................................................................
2.7. Restricted Maximum Likelihood ....................................................
2.8. Generalized Estimating Equations ....................................................
IV. HASKL DAN PEMBAHASAN..................
............................................
.
.
22
4.1. nustrasi dengan The Snlamnnder Mafing Dntn dalam
McCullagh & Nelder (1989)................
.........................................
.
.
22
4.2. Ilustrasi dengan The Cell lrrndiatiun Dntn dalam Schall(1991) ........ 24
...................................
. . . . .
.................................................
4.4. Hasi l Simulasi .......................... .
.
.
4.5. Pembahasan ........................................................................................
4.3. IIusbasi Data Produksi Gula
V . KESMPULAN DAN SARAN ....................
..........
....................
................................*.............
5.1. Kesimpulan ................................ .
.
.
5.2. Saran ...................................................................................................
25
27
29
32
32
32
I. PENDAHULUAN
Generalized Linear Mixed Modcls (GLMM) merupakan teori m ode1 linear
yang menyertakan pengaruh acak dan pengaruh tetap dalam model dengan
peubah respons (oulcomes} yang tidak harus menyebar normal. GLMM
adalah hasil perkembangan dari dua model yaitu linear 111ixedmodels (LMM)
dan gmernlizd linear tr~odels (GLM).
Dalam perkembangannya GLMM
menawarkan suatu teori model linear yang lebih menyeluruh dalam
mengungkap hal-ha1 yang lebi h kom pleks terutama yang brkaitan dengan
pengaruh acak, komponen ragam dan bentuk sebaran data peubah respons
yang tidak normal. Model dengan pengaruh acak diharaykan lebih efisien
dalam
mengidentifikasi sebaran komponen
acak sehingga mampu
menerangkan lebih tepat pengaruh komponen acak tersebut
Untuk mend uga parameter dalam GLMM, metode maksimum
likelihood digunakan sebagai pendekatan standar. Akan tetapi masalah
komputasi masih menjadi ham batan karena hngsi likelihood yang diperoleh
menjadi tidak sesederhana seperti pada model linear ktasik. Metode-metode
pendekatan dan alternatif telah banyak disampaikan para pakar seperti :
metode Monte Carlo ML (Karim & Zeger, 1992; McCulloch, 1997), aplikasi
algorilma EM (Steele, 1996; Aitkin, 3 999, q uasi-li kelihood (Breslow &
Clayton, 1993; Wolfinger & UConnell, 1993; Pawitan, 1998).
1.2. Tujuan dan Manfaat Penelitian
Penelitian ini bertujudn untuk mengkaji metode penyelesaian kasus
GLM dan GLM M melalui aplikasi quasi-likelihood dengan algoritma
Schall/Wolfinger dan pendekatan gmeralizd estimating equations (GEE).
Adapun hasil penelitian ini diharapkan dapat memberikan rekomendasi dan
rnampu mengidentifikasi keunggulan-keunggulan pada metode quasilikelihood rnaupun generalized estimatitlg eqlinlions. Selain itu hasil kajian
metode yang dilakukan akan memperkaya khasdnah teori GLM dan GLMM.