# A robust approach for joint models based on t distribution

PENDEKATAN KEKAR UNTUK MODEL BERSAMA
(JOINT MODEL) ATAS DASAR SEBARAN t

INDAHWATI

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2012

PERNYATAAN MENGENAI DISERTASI DAN
SUMBER INFORMASI

Dengan ini saya menyatakan bahwa disertasi ″Pendekatan Kekar untuk
Model Bersama (Joint Model) Atas Dasar Sebaran t″ adalah karya saya sendiri
dan belum diajukan dalam bentuk apapun kepada perguruan tinggi manapun.
Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan atau tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam
Daftar Pustaka di bagian akhir disertasi ini.

Bogor, Januari 2012

Indahwati
NRP G161050031

ABSTRACT

INDAHWATI. A Robust Approach for Joint Models Based on t Distribution.
Supervised by AUNUDDIN, KHAIRIL ANWAR NOTODIPUTRO and I GUSTI
PUTU PURNABA.
Existing methods for joint modeling are usually based on normality
assumption of random effects and intra-subject errors. We propose a joint model
based on t distribution of the intra subject errors to improve robustness of the
estimation. In addition, study is also performed to evaluate the effects of number
of longitudinal data series on normality assumption. Our model consists of two
submodels: a mixed linear mixed effects model for the longitudinal data, and a
generalized linear model for continuous/binary primary response. The proposed
method is evaluated by means of simulation studies as well as application to HIV
data. Results of simulation study show that the effects of random effect
distribution on bias and MSE of parameter estimates will be small if large number
of longitudinal data series are used. Otherwise, the number of longitudinal data
series give little effects when intra-subject error is not normal. But long tail intrasubject error distribution will give large bias and MSE if modeled as normal. For
small number of longitudinal data series, robust approach based on t distribution
give smaller bias and MSE, mainly for parameters that joint longitudinal covariate
with the the primary response variable.
Keywords: longitudinal data, joint model, mixed model, generalized linear model,
robust, t-distribution

RINGKASAN
INDAHWATI. Pendekatan Kekar untuk Model Bersama (Joint Model) Atas
Dasar Sebaran t. Dibimbing oleh AUNUDDIN, KHAIRIL ANWAR
NOTODIPUTRO dan I GUSTI PUTU PURNABA.
Dalam bidang biomedis seringkali ada kebutuhan untuk menganalisis
hubungan antara peubah penjelas yang pengukurannya dilakukan secara berulang
antar waktu (kovariat longitudinal) dengan peubah respon dalam suatu model
regresi primer. Hasil pengukuran longitudinal dalam hal ini dapat dijadikan
perhatian. Dalam kasus-kasus semacam di atas, ingin diketahui bagaimana
pengaruh profil longitudinal dari peubah penjelas terhadap peubah respon yang
menjadi perhatian. Pendekatan yang dilakukan untuk memodelkan hubungan
antara peubah penjelas longitudinal dengan peubah respon primer dalam
penelitian ini adalah pemodelan bersama (joint modeling) yang menggabungkan
dua submodel: model linear campuran untuk proses respon longitudinal, serta
model linier terampat untuk respon primer yang berasal dari sebaran keluarga
eksponensial. Pemodelan bersama yang digunakan disini didasarkan atas model
berbagi bersama (shared parameter models) yang mengasumsikan kedua proses
diinduksi oleh pengaruh acak yang sama.
Model bersama (joint model) umumnya didasarkan atas asumsi bahwa
pengaruh acak dan galat intra subyek menyebar normal. Pada kenyataannya tak
jarang terjadi pelanggaran atas asumsi ini. Penelitian ini bertujuan untuk mengkaji
penggunaan sebaran t untuk galat intra subyek sebagai pendekatan yang lebih
kekar terhadap asumsi kenormalan, serta mengevaluasi pengaruh banyaknya deret
data longitudinal terhadap asumsi kenormalan. Hal ini dilakukan melalui kajian
simulasi. Kajian empiris dilakukan terhadap contoh kasus data HIV/AIDS.
Berdasarkan hasil simulasi diperoleh beberapa temuan sebagai berikut:
Secara umum bias dan MSE dari penduga parameter model bersama akan semakin
kecil jika frekuensi pengamatan longitudinalnya semakin banyak. Semakin
banyak frekuensi pengamatan longitudinal, sebaran pengaruh acak semakin tidak
berpengaruh, apakah sebaran simetrik berekor pendek atau panjang. Sebaliknya
frekuensi pengamatan longitudinal hanya sedikit pengaruhnya terhadap bias dan
MSE jika sebaran pengaruh galat intra-subyeknya yang tidak normal. Namun
sebaran galat intra-subyek yang berekor sangat panjang memberikan bias dan
MSE yang besar jika dimodelkan dengan sebaran normal. Untuk frekuensi
pengamatan longitudinal yang sedikit (jarang), pendekatan kekar atas dasar
sebaran t untuk galat intra-subyek dalam pemodelan bersama memberikan hasil
yang lebih baik (ARB dan MSE yang lebih kecil), terutama untuk parameter yang
menghubungkan kovariat longitudinal dengan peubah respon primernya.
Berdasarkan hasil pemodelan bersama terhadap contoh kasus data
HIV/AIDS, jumlah sel CD4+ awal pasien maupun perubahannya per satuan waktu
Semakin sedikit jumlah sel CD4+ awal pasien serta semakin besar penurunannya
per satuan waktu, semakin besar pula peluang kematian pasien tersebut. Peubah
lain yang juga mempengaruhi peluang kematian penderita HIV adalah jenis obat.

Pemakaian obat ddC lebih efektif dalam memperkecil resiko kematian penderita
HIV dibandingkan obat ddI. Dengan tingkat kepercayaan 95%, kematian pasien
terjadi 1.026 - 2.065 kali lebih sering di antara penerima obat ddI dibandingkan
ddC. Selain itu pasien yang terdiagnosis AIDS pada awal studi memiliki peluang
kematian yang lebih tinggi dibandingkan pasien yang tidak terdiagnosis AIDS,
yaitu berkisar antara 1.857 - 3.828 kali dibandingkan pasien yang tidak
terdiagnosis AIDS.
Kata kunci : data longitudinal, joint model, model linier campuran, model linier
terampat, kekar, sebaran t

@Hak Cipta Milik Institut Pertanian Bogor (IPB), tahun 2012
Hak Cipta Dilindungi Undang-undang
1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa
mencantumkan atau menyebutkan sumber:
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan
karya ilmiah, penyusunan laporan, penulisan kritik atau tinjauan suatu
masalah
b. Pengutipan tidak merugikan kepentingan yang wajar IPB
2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya
tulis dalam bentuk apapun tanpa ijin IPB.

PENDEKATAN KEKAR UNTUK MODEL BERSAMA
(JOINT MODEL) ATAS DASAR SEBARAN t

INDAHWATI

Disertasi
Sebagai salah satu syarat untuk memperoleh gelar Doktor

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
2012

Penguji Luar Komisi pada Ujian Tertutup, 30 Januari 2012:
1. Prof. Dr. Ir. A. Ansori Mattjik, M.Sc
2. Dr. Ir. I Made Sumertajaya, MSi.

(Dosen Dept. Statistika IPB)
(Dosen Dept. Statistika IPB)

Penguji Luar Komisi pada Ujian Terbuka, 31 Januari 2012:
1. Dr. Ir. I Wayan Mangku
2. Dr. Ir. Aji Hamim Wigena, M.Sc

(Dosen Dept. Matematika IPB)
(Ketua PS Statistika SPs IPB)

Judul Disertasi

:

Pendekatan Kekar untuk Model Bersama (Joint Model)
Atas Dasar Sebaran t

Nama Mahasiswa

:

Indahwati

NIM

:

G161050031

Program Studi

:

Statistika

Disetujui :
Komisi Pembimbing

Prof. Dr. Ir. Aunuddin, MSc.
Ketua

Prof. Dr. Ir. Khairil Anwar Notodiputro, MS
Anggota

Dr. Ir. I Gusti Putu Purnaba, DEA
Anggota

Diketahui :
Ketua Program Studi Statistika

Dekan Sekolah Pascasarjana

Dr. Ir. Aji Hamim Wigena, MSc.

Dr. Ir. Dahrul Syah, M.ScAgr

Tanggal Ujian: 31 Januari 2012

Tanggal Lulus:

PRAKATA
Puji syukur penulis panjatkan kepada Allah SWT, karena hanya atas rahmat
dan karunia-Nya disertasi ini dapat diselesaikan. Penelitian dengan judul
″Pendekatan Kekar untuk Model Bersama (Joint Model) Atas Dasar Sebaran t″ ini
sebaran normal dalam pemodelan bersama (Joint Modeling). Pemilihan sebaran t
sebagai alternatif bagi sebaran normal didasarkan atas sifat sebaran t yang ekornya
lebih fleksibel dalam menggambarkan sebaran data.
pembimbing: Prof. Dr. Ir. Aunuddin, MSc., Prof. Dr. Ir. Khairil Anwar
Notodiputro, MS, serta Dr. Ir. I Gusti Putu Purnaba, DEA yang telah memberikan
arahan, kritikan, saran dan masukan yang sangat berarti dalam penyusunan
disertasi ini. Selain itu penulis juga mengucapkan terima kasih kepada:
1. Pimpinan Institut Pertanian Bogor yang telah memberikan kesempatan untuk
mendapatkan beasiswa BPPS guna melanjutkan studi di Sekolah Pascasarjana
IPB Bogor dan memberikan kesempatan untuk mengikuti Hibah Penelitian
Disertasi Doktor.
2. Pimpinan Sekolah Pascasarjana, Ketua Departemen Statistika, Ketua Program
Studi Statistika, serta staf administrasi yang telah memberikan layanan
pendidikan/pengajaran dan layanan administrasi dengan baik.
3. Seluruh penguji, baik pada saat ujian preliminasi lisan dan tertulis, maupun
saat ujian tertutup dan terbuka.
4. Kedua orang tua (almarhum), kakak dan adik, dan seluruh keluarga penulis
yang senantiasa memberikan dorongan dan doa.
5. Rekan-rekan sejawat di departemen Statistika FMIPA IPB: Pak Mattjik, Pak
Asep, Bu Anik, Bu Erfi, Bu Yenni serta lainnya atas perhatian, dorongan
semangat dan motivasinya.
6. Rekan-rekan mahasiswa Program Studi Statistika Sekolah Pascasarjana IPB
atas diskusi, bantuan dan pemberian semangat hingga selesainya disertasi ini.
Penulis menyadari bahwa disertasi ini masih jauh dari sempurna, namun
penulis berharap karya ilmiah ini bermanfaat bagi pihak-pihak yang
memerlukannya.
.
Bogor, Januari 2012
Indahwati

RIWAYAT HIDUP
Penulis dilahirkan di Jember pada tanggal 12 Juli 1965, sebagai anak kedua
dari 7 bersaudara pasangan Achmad Ismail (almarhum) dan Untung Masturah
(almarhum). Pendidikan sarjana ditempuh pada Departemen Statistika, FMIPA
IPB, dan lulus pada tahun 1989. Pada tahun 1991, penulis melanjutkan jenjang
pendidikan S2 pada Program Studi Statistika, Sekolah Pascasarjana IPB dengan
2005 penulis berkesempatan untuk melanjutkan jenjang pendidikan S3 pada
Program Studi Statistika Sekolah Pascasarjana IPB dengan beasiswa BPPS. Sejak
tahun 1990 hingga sekarang penulis bekerja sebagai staf pengajar pada
Departemen Statistika FMIPA IPB
Selama mengikuti program S3, beberapa karya ilmiah telah dipublikasikan
baik melalui seminar nasional, prosiding, maupun jurnal ilmiah dengan rincian
sebagai berikut:
1. Indahwati dan Notodiputro KA. 2006. Effects of Inconsistency of Sampling
Design on Reliability of Small Area Estimates. Proceeding at The First
International Conference on Mathematics and Statistics (ICoMS-1), Juni
2006, UNISBA - Bandung.
2. Indahwati, Sadik K dan Nurmasari R. 2008. Pendekatan Metode
Pemulusan Kernel pada Pendugaan Area Kecil (Small Area Estimation).
Prosiding pada Seminar Nasional Matematika dan Pendidikan
Matematika, Nopember 2008. FMIPA UNY - Yogyakarta.
3. Indahwati, Syafitri UD dan Mayasari RS. 2008. Penerapan Metode
Pemulusan Kernel pada Pendugaan Area Kecil (Studi Kasus Pendugaan
Pengeluaran Per Kapita di Kota Bogor tahun 2005). Prosiding pada
Seminar Nasional Matematika dan Pendidikan Matematika, Nopember
2008. FMIPA UNY - Yogyakarta.
4. Nadhiroh IM, Notodiputro KA dan Indahwati. 2008. Zero Inflated
Negative Binomial Models in Small Area Estimation. Prosiding pada
Seminar Nasional Matematika dan Pendidikan Matematika, Nopember
2008. FMIPA UNY - Yogyakarta.
5. Indahwati, Kusumaningrum D, Widiyani W. 2009. Aplikasi Regresi Dua
Nasional Matematika dan Pendidikan Matematika, 5 Desember 2009.
FMIPA UNY - Yogyakarta.
6. Indahwati, Angraeni YA, Sastuti TW. 2009. Pemodelan Regresi Tiga
Matematika dan Pendidikan Matematika, 5 Desember 2009. FMIPA UNY
- Yogyakarta.

7. Indahwati, Kusumaningrum D, Maena I. 2010. Aplikasi Regresi Logistik
Ordinal Multilevel untuk Pemodelan dan Klasifikasi Huruf Mutu Mata
Kuliah Metode Statistika. Forum Statistika dan Komputasi. ISSN 08538115 Vol. 15 No. 2.
8. Indahwati, Aunuddin, Notodiputro KA, dan Purnaba IGP. 2011. Kajian
Simulasi Ketaknormalan Pengaruh Acak dan Banyaknya Deret Data
Longitudinal dalam Pemodelan Bersama (Joint Modeling). Forum
Statistika dan Komputasi. ISSN 0853-8115 Vol. 16 No. 2 (Siap terbit).
9. Indahwati, Aunuddin, Notodiputro KA, dan Purnaba IGP. 2012.
Pendekatan Kekar untuk Model Bersama (Joint Model) atas Dasar
Sebaran-t. Forum Statistika dan Komputasi. ISSN 0853-8115 Vol. 17 No.1
(Siap terbit).

DAFTAR ISI
Halaman
DAFTAR TABEL .....................................................................................
DAFTAR GAMBAR ................................................................................
DAFTAR LAMPIRAN ................................................................….........

xiv
xv
xix

1 PENDAHULUAN ..............................................................................

1

Latar Belakang .............................................................................
Tujuan Penelitian .........................................................................
Kebaruan Penelitian (Novelty) ......................................................
Sistematika Penulisan Disertasi ....................................................

1
4
4
5

2 ANALISIS DATA LONGITUDINAL ..............................................

6

1.1
1.2
1.3
1.4

2.1
2.2
2.3
2.4

Model Linear Campuran ................................................................
Metode Pendugaan Parameter ….................................................
Pengujian Hipotesis dan Pembandingan Model Tersarang ……...
Penerapan terhadap Data Kasus HIV/AIDS …………………......

3 PEMODELAN BERSAMA (JOINT MODELING) …………………
3.1
3.2
3.3
3.4

Beberapa Pendekatan Model Bersama ……………………........
Pendugaan Parameter …………………………………………....
Model Dasar bagi Model Bersama …………….….……………..
Penerapan pada Data Kasus HIV/AIDS .......................................
3.4.1 Penerapan pada Data Kasus HIV/AIDS ………………...
3.4.2 Pemodelan ............………………………………………..

4 PENDEKATAN KEKAR ATAS DASAR SEBARAN t ...................
4.1 Sebaran Peubah Ganda t ………………………………………..
4.2 Model Bersama Atas Dasar Sebaran t ………………...................
4.2.1 Pendekatan Kekar untuk Pengaruh Acak …………………
4.2.2 Pendekatan Kekar untuk Galat Intra Subyek .....................
4.3 Kajian Simulasi Ketaknormalan Pengaruh Acak ………………..
4.3.1 Rancangan Simulasi .................................…………………
4.3.2 Hasil Simulasi .....................................................................
4.4 Kajian Simulasi Ketaknormalan Galat Intra Subyek ………….....
4.4.1 Rancangan Simulasi .................................…………………
4.4.2 Hasil Simulasi .....................................................................
4.4.3 Simulasi Pendekatan Kekar Atas Dasar Sebaran t ..............

6
7
9
10
15
15
18
18
21
21
22
27
27
27
27
30
31
31
33
51
51
52
57

5 PEMBAHASAN UMUM ....................................................................

61

6 KESIMPULAN DAN SARAN ……………........................................

64

DAFTAR PUSTAKA ...............................................................................

65

LAMPIRAN ..............................................................................................

68

DAFTAR TABEL
Halaman
2.1
3.1
4.1

4.2

4.3

4.4

4.5

4.6

4.7

Nilai dugaan parameter beserta hasil uji dan SK 95%
Nilai dugaan parameter model bersama beserta hasil uji dan SK
95%
Nilai ARB(%) penduga parameter model bersama dengan
pengaruh acak menyebar t-student dan normal diasumsikan
menyebar normal
Nilai MSE penduga parameter model bersama dengan pengaruh
acak menyebar t-student dan normal diasumsikan menyebar
normal
Nilai ARB(%) penduga parameter model bersama dengan galat
intra-subyek menyebar t-student dan normal diasumsikan
menyebar normal
Nilai MSE penduga parameter model bersama dengan galat
intra-subyek menyebar t-student dan normal diasumsikan
menyebar normal
Nilai ARB (%) dan MSE penduga parameter model bersama
dengan galat intra-subyek menyebar lognormal diasumsikan
menyebar t-student dan normal, frekuensi pengamatan
longitudinal = 4
Nilai ARB (%) penduga parameter model bersama dengan galat
intra-subyek menyebar normal, t, dan lognormal diasumsikan
menyebar normal dan t
Nilai MSE penduga parameter model bersama dengan galat
intra-subyek menyebar normal, t, dan lognormal diasumsikan
menyebar normal dan t

13
24
33

35

53

55

57

58

59

DAFTAR GAMBAR
Halaman
2.1
2.2
2.3
2.4
3.1
4.1
4.2

4.3

4.4

4.5

4.6

4.7

4.8

4.9

4.10

4.11

4.12

4.13

Boxplot data asal
Boxplot data hasil transformasi akar
Plot interaksi antara waktu pengamatan dengan jenis obat
Korelasi antara intersep dan slope
Banyaknya pasien pada lima titik waktu pengamatan
Fungsi kepekatan peluang normal dan t-student dengan derajat
bebas 3, 4, dan 5
Grafik ARB (%) penduga parameter model bersama dengan
pengaruh acak menyebar t-student dan normal diasumsikan
menyebar normal, frekuensi pengamatan longitudinal = 4
Grafik ARB (%) penduga parameter model bersama dengan
pengaruh acak menyebar t-student dan normal diasumsikan
menyebar normal, frekuensi pengamatan longitudinal = 9
Grafik MSE penduga parameter model bersama dengan
pengaruh acak menyebar t-student dan normal diasumsikan
menyebar normal, frekuensi pengamatan longitudinal = 4
Grafik MSE penduga parameter model bersama dengan
pengaruh acak menyebar t-student dan normal diasumsikan
menyebar normal, frekuensi pengamatan longitudinal = 9
Hubungan antara ARB (%) dengan frekuensi pengamatan
longitudinal untuk penduga parameter intersep (b10) pada
submodel-1
Hubungan antara MSE dengan frekuensi pengamatan
longitudinal untuk penduga parameter intersep (b10) pada
submodel-1
Hubungan antara ARB (%) dengan frekuensi pengamatan
longitudinal untuk penduga parameter slope (b11) pada
submodel-1
Hubungan antara MSE dengan frekuensi pengamatan
longitudinal
untuk penduga parameter slope (b11) pada
submodel-1
Hubungan antara ARB (%) dengan frekuensi pengamatan
longitudinal untuk penduga parameter ragam intersep (a11) pada
submodel-1
Hubungan antara MSE dengan frekuensi pengamatan
longitudinal untuk penduga parameter ragam intersep (a11) pada
submodel-1
Hubungan antara ARB (%) dengan frekuensi pengamatan
longitudinal untuk penduga parameter ragam slope (a22) pada
submodel-1
Hubungan antara MSE dengan frekuensi pengamatan
longitudinal untuk penduga parameter ragam slope (a22) pada
submodel-1

11
11
12
14
22
28
34

34

36

36

37

38

38

39

40

41

41

42

4.14 Hubungan antara ARB (%) dengan frekuensi pengamatan
longitudinal untuk penduga parameter peragam(intersep,slope)
4.15 Hubungan antara MSE dengan frekuensi pengamatan
longitudinal untuk penduga parameter peragam(intersep,slope)
4.16 Hubungan antara ARB (%) dengan frekuensi pengamatan
longitudinal untuk penduga parameter galat intra subyek (s21)
4.17 Hubungan antara MSE dengan frekuensi pengamatan
longitudinal untuk penduga parameter galat intra subyek (s21)
4.18 Hubungan antara ARB (%) dengan frekuensi pengamatan
longitudinal untuk penduga parameter b20 pada submodel-2
4.19 Hubungan antara MSE dengan frekuensi pengamatan
longitudinal untuk penduga parameter b20 pada submodel-2
4.20 Hubungan antara ARB (%) dengan frekuensi pengamatan
longitudinal untuk penduga parameter b21 pada submodel-2
4.21 Hubungan antara MSE dengan frekuensi pengamatan
longitudinal untuk penduga parameter b21 pada submodel-2
4.22 Hubungan antara ARB (%) dengan frekuensi pengamatan
longitudinal untuk penduga parameter b21 pada submodel-2
4.23 Hubungan antara MSE dengan frekuensi pengamatan
longitudinal untuk penduga parameter b21 pada submodel-2
4.24 Hubungan antara ARB (%) dengan frekuensi pengamatan
longitudinal untuk penduga parameter ragam submodel-2 (s22)
4.25 Hubungan antara MSE dengan frekuensi pengamatan
longitudinal untuk penduga parameter ragam submodel-2 (s22)
4.26 Grafik ARB (%) penduga parameter model bersama dengan
galat intra-subyek menyebar t-student dan normal diasumsikan
menyebar normal, frekuensi pengamatan longitudinal = 4
4.27 Grafik ARB (%) penduga parameter model bersama dengan
galat intra-subyek menyebar t-student dan normal diasumsikan
menyebar normal, frekuensi pengamatan longitudinal = 9
4.28 Grafik MSE penduga parameter model bersama dengan galat
intra-subyek menyebar t-student dan normal diasumsikan
menyebar normal, frekuensi pengamatan longitudinal = 4
4.29 Grafik MSE penduga parameter model bersama dengan galat
intra-subyek menyebar t-student dan normal diasumsikan
menyebar normal, frekuensi pengamatan longitudinal = 9
4.30 Grafik ARB (%) penduga parameter model bersama dengan
galat intra-subyek menyebar lognormal diasumsikan menyebar tstudent dan normal, frekuensi pengamatan longitudinal = 4
4.31 Grafik MSE penduga parameter model bersama dengan galat
intra-subyek menyebar lognormal diasumsikan menyebar tstudent dan normal, frekuensi pengamatan longitudinal = 4

42

43

44

45

46
46
47
48
48
49
50
50
52

53

54

55

56

56

4.32 Grafik ARB (%) penduga parameter model bersama dengan
galat intra-subyek menyebar normal, t, dan lognormal
diasumsikan menyebar normal dan t
4.33 Grafik MSE penduga parameter model bersama dengan galat
intra-subyek menyebar normal, t, dan lognormal diasumsikan
menyebar normal dan t

58

60

DAFTAR LAMPIRAN
Halaman
1
2

3

4
5
6
7

Output SAS untuk analisis data longitudinal
Boxplot nilai ARB (%) untuk pengaruh acak menyebar normal
ganda dan bivariate-t diasumsikan normal pada frekuensi
pengamatan longitudinal sering dan jarang
Boxplot nilai MSE untuk pengaruh acak menyebar normal ganda
dan bivariate-t diasumsikan normal pada frekuensi pengamatan
longitudinal sering dan jarang
Nilai ARB (%) penduga parameter submodel-1
Nilai MSE penduga parameter submodel-1
Nilai ARB (%) penduga parameter submodel-2
Nilai MSE penduga parameter submodel-2

69
70

75

80
81
82
83

1

1. PENDAHULUAN
1.1. Latar Belakang
Dalam bidang biomedis seringkali ada kebutuhan untuk menganalisis
hubungan antara peubah penjelas yang pengukurannya dilakukan secara berulang
antar waktu (kovariat longitudinal) dengan peubah respon dalam suatu model
regresi primer. Sebagai ilustrasi adalah hubungan antara daya tahan hidup pasien
AIDS dengan banyaknya sel CD4+ dalam limfosit yang pengukurannya dilakukan
Lahir Rendah) dengan status gizi ibu yang direpresentasikan oleh berat badan ibu
sebelum dan selama kehamilan. Hasil pengukuran longitudinal dalam hal ini dapat
yang menjadi perhatian. Dalam kasus-kasus semacam ini, ingin diketahui
bagaimana pengaruh profil longitudinal dari peubah penjelas (yang mungkin
Dalam analisis data longitudinal yang baku, seperti dapat dijumpai dalam
Laird dan Ware (1982), atau Verbeke dan Mollenberghs (2000), peubah respon
merupakan hasil pengukuran longitudinal, sedangkan peubah penjelas bisa
longitudinal atau sesaat, atau gabungan dari keduanya. Dengan demikian
pemodelan peubah respon skalar dengan peubah penjelas longitudinal dalam hal
ini tidak dapat diterapkan secara langsung.
Salah satu pendekatan yang dilakukan untuk memodelkan hubungan antara
peubah penjelas longitudinal dengan peubah respon skalar - yang dalam
kepustakaan seringkali disebut primary endpoint - adalah pemodelan bersama
(joint modeling). Pendekatan ini seringkali digunakan untuk memodelkan
hubungan antara data longitudinal (sebagai peubah penjelas) dengan data daya
tahan hidup (sebagai peubah respon), seperti dapat dijumpai dalam Henderson et
al. (2000), serta Tsiatis dan Davidian (2004). Pemodelan bersama dengan respon
primer berupa data biner diantaranya dapat dijumpai dalam Zhang dan Lin (1999),
Li et al. (2004, 2007a, 2007b), serta Horrocks dan Heuvel (2009).
Prinsip umum dari pendekatan model bersama adalah penggabungan dua
model, yaitu submodel-1 yang diasumsikan mengikuti model linier campuran
(linear mixed model) - mungkin setelah ditransformasi - untuk memodelkan data

2

pengukuran berulang, serta submodel-2 yaitu model regresi primer yang
diasumsikan mengikuti model linier terampat (generalized linear model) untuk
respon primer yang mengikuti sebaran keluarga eksponensial, atau model
proporsional hazard untuk respon primer yang berupa data daya tahan hidup.
Dalam pendekatan model bersama, peubah respon dalam model regresi primer
bergantung pada kovariat longitudinal melalui pengaruh acak spesifik subyek.
Dengan kata lain, pengaruh acak yang dihasilkan dari model campuran
Namun karena pengaruh acak tak teramati, maka pendekatan naive dengan
cara mensubstitusi langsung nilai dugaan OLS (Ordinary Least Squares) setiap
subyek dari submodel-1 ke dalam submodel-2 sebagai peubah penjelas akan
menghasilkan nilai dugaan parameter model regresi primer yang berbias,
khususnya yang mengukur pengaruh kovariat longitudinal terhadap peubah respon
primer (Zhang dan Lin 1999; Wang et al. 2000). Studi pembandingan beberapa
metode pendugaan parameter dalam model bersama antara lain dilakukan oleh
Zhang dan Lin (1999) dan Wang et al. (2000).
Selama ini metode pendugaan parameter pada model bersama didasarkan
atas asumsi bahwa hasil pengukuran longitudinal mengikuti model linier
campuran dengan pengaruh acak dan galat intra-subyek menyebar normal. Namun
dalam prakteknya tidak semua data dapat memenuhi asumsi ini. Ketidaknormalan
dalam data longitudinal adakalanya deret data yang diamati tidak terlalu panjang,
dan seringkali tidak lengkap. Karena itu perlu dicari pendekatan lain yang lebih
kekar (robust) terhadap sebaran pengaruh acak maupun galat intra-subyek.
Berkaitan

dengan

asumsi

kenormalan,

beberapa

penulis

berusaha

mengajukan pendekatan yang lebih kekar terhadap asumsi sebaran normal dari
pengaruh acak. Misalnya Tsiatis dan Davidian (2001) menurunkan suatu penduga
yang tidak memerlukan asumsi parametrik dari pengaruh acak untuk respon
primer berupa daya tahan hidup. Demikian juga Li et al. (2004) mengajukan
penduga kecukupan (sufficiency estimator) dan penduga bersyarat (conditional
estimator) untuk respon primer yang berasal dari sebaran keluarga eksponensial.
Pendekatan lain diajukan dengan mengendurkan asumsi kenormalan pengaruh

3

acak. Song (2002) mengajukan model bersama semiparametrik pada respon
primer berupa data daya tahan hidup, dimana sebaran pengaruh acak tidak
dispesifikasikan, namun hanya diasumsikan mengikuti fungsi kepekatan mulus
yang dinyatakan sebagai fungsi kepekatan normal dikalikan suatu fungsi
polinomial. Pendekatan serupa juga dilakukan oleh Li et al. (2007) terhadap
respon primer yang berupa data biner. Namun pendekatan ini menimbulkan beban
komputasi jika pengaruh acaknya banyak.
Beberapa kajian terhadap pengaruh salah spesifikasi sebaran pengaruh acak
peubah respon primer yang berupa daya tahan hidup, kajian tentang asumsi
kenormalan pengaruh acak dilakukan oleh Song et al. (2002) dan Hsieh et al.
(2006). Hasil temuan penulis-penulis tersebut mengindikasikan bahwa penduga
parameter model bersama cukup kekar terhadap salah spesifikasi sebaran
pengaruh acak. Namun Li et al. (2007) yang mengkaji hal yang sama terhadap
peubah respon primer biner yang dimodelkan dengan regresi logistik memperoleh
hasil yang berlawanan, bias cukup besar terjadi terutama untuk sebaran pengaruh
acak yang bimodus. Rizopoulos dan Verbeke (2008) menyatakan bahwa ketika
banyaknya pengukuran berulang untuk setiap subyek meningkat, maka salah
spesifikasi sebaran pengaruh acak memberikan efek yang minimum untuk
beberapa nilai dugaan parameter.
Selama tiga dekade terakhir, sebaran peubah ganda t (multivariate t
distribution) telah dikenal sebagai salah satu generalisasi yang berguna sebagai
pendekatan kekar, terutama terhadap pencilan, misalnya dalam model regresi
linier (Zellner 1976; Lange et al. 1989) dan model linier campuran (Pinheiro et al.
2001; Song et al. 2007; Lin 2008; Wang & Fan 2010). Kotz dan Nadarajah (2004),
serta Nadarajah dan Kotz (2008) menyatakan bahwa dibandingkan sebaran normal
ganda, sebaran peubah ganda t menawarkan alternatif yang lebih dapat hidup terus
(viable) berkaitan dengan sebaran data di dunia riil, karena mempunyai ekor yang
lebih realistis. Dalam bidang ekonomi sebaran t juga sering digunakan untuk
pemodelan data ekonomi yang seringkali sebarannya berekor gemuk atau panjang.
Namun Lange (1989) juga mencatat bahwa analisis yang sesuai untuk lokasi jika
sebaran data tidak simetrik merupakan isu yang perlu diperhatikan.

4

Dalam konteks pemodelan bersama dengan respon primer berupa data daya
tahan hidup, pendekatan kekar terhadap pencilan dikaji oleh Li et al. (2009)
dengan mengasumsikan galat intra-subyek menyebar t-student. Namun untuk
jenis peubah respon primer yang lain, belum ada kajian mengenai penggunaan
sebaran t sebagai pendekatan kekar terhadap asumsi kenormalan dalam model
bersama.
Berkaitan dengan permasalahan di atas, beberapa hal yang diajukan dalam
1. Bagaimana pengaruh pelanggaran asumsi sebaran normal terhadap sifatsifat penduga parameter model bersama ?
2. Bagaimana pengaruh banyaknya deret data longitudinal pada submodel1 terhadap sifat-sifat penduga parameter model bersama ?
3. Bagaimana kinerja sebaran t sebagai pendekatan kekar terhadap assumsi
kenormalan galat intra-subyek dalam model bersama?

1.2. Tujuan Penelitian
Berdasarkan pertanyaan penelitian yang diuraikan di atas, maka penelitian
ini bertujuan untuk:
1. Membuat formulasi model bersama dengan pengaruh acak menyebar t
beserta pendugaan parameternya.
2. Mengevaluasi pengaruh banyaknya deret data longitudinal pada
submodel-1 terhadap sifat-sifat penduga parameter model bersama.
3. Mengkaji penggunaan sebaran t untuk galat intra-subyek sebagai
pendekatan yang lebih kekar terhadap asumsi kenormalan.

1.3. Kebaruan Penelitian (Novelty)
Dalam penelitian ini dikaji pendekatan kekar terhadap asumsi kenormalan
menggunakan sebaran t sebagai alternatif terhadap asumsi kenormalan galat intrasubyek. Penelitian dilakukan melalui kajian sifat-sifat statistika dari penduga

5

Penelitian tentang model bersama belum banyak dilakukan, bahkan mungkin
belum ada di Indonesia. Untuk respon primer yang berasal dari sebaran keluarga
eksponensial, model bersama tidak dapat diimplementasikan secara langsung
melalui perangkat lunak yang tersedia. Walaupun pada awalnya penelitian tentang
model

bersama

dikembangkan

dalam

bidang

biomedis,

tetap

terbuka

kemungkinan diaplikasikan pada bidang lain seperti pertanian, peternakan,
kehutanan, pendidikan dan sebagainya yang mempunyai permasalahan serupa.

1.4. Sistematika Penulisan Disertasi
Secara keseluruhan disertasi ini dirancang menjadi enam bab. Pendahuluan
disajikan dalam Bab 1. Bab 2 berisi tinjauan ulang mengenai analisis data
longitudinal dengan pendekatan model linier campuran beserta pendugaan
meliputi beberapa pendekatan terhadap model bersama, metode pendugaan
parameter, pengujian hipotesis serta contoh penerapan terhadap data.
Pendekatan kekar yang diajukan dibahas dalam Bab 4. Pada bab ini dikaji
mengenai sebaran peubah ganda t, serta formulasi pemodelan bersama atas dasar
sebaran t beserta pendugaan parameternya. Dalam bab ini juga dibahas kajian
simulasi ketaknormalan pengaruh acak dan galat intra-subyek, berikut pendekatan
kekar atas dasar sebaran t untuk galat intra-subyek.
Selanjutnya pembahasan secara umum dipaparkan dalam Bab 5, sedangkan
berbagai temuan dalam penelitian ini disajikan dalam bentuk kesimpulan dan

6

2. ANALISIS DATA LONGITUDINAL
Data longitudinal merupakan salah satu bentuk data berkorelasi. Pada data
longitudinal, peubah respon diukur pada beberapa titik waktu untuk setiap subyek.
Dalam studi longitudinal dimungkinkan untuk mempelajari perubahan respon
antar waktu beserta faktor-faktor yang mempengaruhi perubahan tersebut, baik
pada level populasi maupun level individu.
Data longitudinal dicirikan oleh fakta bahwa pengamatan berulang dalam
subyek yang sama cenderung berkorelasi (Zeger et al. 1988), sehingga modelmodel untuk analisis data longitudinal harus mengenali hubungan antara
pengamatan berkala dalam subyek yang sama (Laird & Ware 1982). Korelasi
antar pengamatan berulang dapat dimodelkan secara eksplisit (melalui pola
matriks kovarian), maupun secara implisit (melalui pengaruh acak).
Untuk memodelkan keheterogenan antar subyek, ada dua pendekatan dalam
analisis data longitudinal (Zeger et al. 1988). Pertama dengan memodelkan
keheterogenan secara eksplisit, dikenal sebagai pendekatan spesifik subyek,
misalnya melalui model campuran dimana pengaruh spesifik subyek diasumsikan
mengikuti suatu sebaran parametrik tertentu. Untuk data longitudinal kontinu,
model linear campuran dari Laird dan Ware (1982) merupakan model yang sering
digunakan. Kedua, respon rataan populasi dapat dimodelkan sebagai fungsi dari
kovariat tanpa secara eksplisit memperhitungkan keheterogenan dari subyek ke
subyek. Pendekatan ini dikenal sebagai model rataan populasi. Dalam pendekatan
ini, matriks kovarian dari peubah respon secara langsung dimodelkan melalui
struktur kovarian bagi galat intra-subyek. Model spesifik subyek dikenal juga
sebagai model bersyarat, sedangkan model rataan populasi sering disebut model
marginal (Pinheiro 2006). Perbedaan mendasar dari kedua model di atas adalah
model spesifik subyek memungkinkan inferensi terhadap subyek tertentu,
sedangkan pada model rataan populasi tidak.
2.1. Model Linear Campuran
Model linier campuran untuk peubah respon kontinu bagi subyek ke-i
(i=1,2,...,n) adalah sebagai berikut (Laird & Ware 1982):
Yi

Xi

Z i b i ε i , i 1,, n

7

Dalam hal ini

( Yi1 ,, Yimi )

Yi

adalah vektor peubah respon dari subyek ke-i, n =

total banyaknya subyek, dan mi = banyaknya deret data longitudinal dari subyek
ke-i. Adapun Xi dan Zi adalah matriks rancangan masing-masing berdimensi mi x
p dan mi x q yang bersesuaian dengan vektor pengaruh tetap
pengaruh acak bi(qx1), sedangkan

i

dan vektor

(px1)

merupakan vektor galat intra-subyek

berdimensi mi x 1.
Pada model di atas, diasumsikan bahwa q vektor pengaruh acak bi menyebar
normal ganda dengan nilaitengah 0 dan matriks kovarian D, yakni bi ~ N(0,D).
Demikian pula

i

~ N(0,Ri), serta bi dan

i

saling bebas. Hal ini berimplikasi

sebaran marginal dari Yi adalah normal dengan nilaitengah E(Yi) = Xi

dan

matriks kovarian Vi = ZiDZi + Ri. Matriks D dan Ri keduanya merupakan
matriks simetrik definit positif.
2.2. Metode Pendugaan Parameter
Metode pendugaan yang umum digunakan untuk menduga parameter dalam
model linier campuran adalah metode kemungkinan maksimum (maximum
likelihood/ML) atau metode kemungkinan maksimum berkendala (restricted
maximum likelihood/REML).
Jika

fungsi kepekatan peluang normal ganda bagi Yi, f(yi| , ) adalah:
f (y i | , )

(2 )

ni
2

Vi

1
2

exp[

1
2

X i ) Vi 1 (y i

(y i

X i )]

Fungsi kemungkinannya dapat dituliskan sebagai:
L( , )

i

f (y i | , )

i

(2 )

ni
2

Vi

1
2

exp[

1
2

(y i

X i ) Vi 1 (y i

X i )]

l( , )

ln L( , )

n
2

ln( 2 )

1
2

ln Vi
i

1
2

(y i

X i ) Vi 1 (y i

Xi )

(2.1)

dan

secara

i

sedangkan n = ni adalah banyaknya amatan dalam gugus data.
Walaupun memungkinkan untuk menduga parameter

simultan dengan memaksimumkan fungsi di atas, banyak algoritma komputasi
yang menyederhanakan optimasi dengan cara menyembunyikan (profiling out)
parameter

dari fungsi log-kemungkinan.

8

Dengan asumsi

, dan sebagai akibatnya Vi diketahui, maka fungsi log-

kemungkinan, l( , ) menjadi fungsi dari
1
2

q( )

saja, yaitu:

X i ) Vi 1 (y i

(y i

Xi )

i

Dengan generalized least squares (GLS), penduga bagi

dapat diperoleh

secara analitik sebagai berikut:
1

ˆ

1

X i Vi 1 y i

X i Vi X i
i

(2.2)

i

Penduga di atas memiliki sifat statistik yang diinginkan, yakni merupakan
penduga tak bias linier terbaik (BLUE) bagi .
dan pengaruh tetap

Pendugaan parameter kovarian

dengan asumsi

tidak diketahui diuraikan sebagai berikut. Pertama untuk menduga

dibentuk

fungsi profil log-kemungkinan lML( ), yaitu dengan menggantikan parameter
dalam persamaan (2.1) dengan penduganya pada persamaan (2.2), yaitu:
n
2

l ML ( )

ln( 2 )

1
2

ri Vi 1ri

1
2

ln Vi
i

i
1

sedangkan

ri

yi

1

Xi

X i Vi 1 y i

X i Vi X i
i

i

merupakan optimasi tak

sedemikian sehingga persyaratan definit positif

bagi matriks D dan Ri terpenuhi. Nilai dugaan bagi

dapat diperoleh dengan cara

iterasi sampai konvergen.
Setelah penduga ML bagi

diperoleh melalui proses iterasi, nilai ˆ dapat

dihitung tanpa iterasi dengan menggunakan persamaan (2.3) dan (2.4) sebagai
berikut:

ˆ
V
i

ˆZ
Zi D
i

ˆ
R
i

(2.3)

1

ˆ

ˆ X
Xi V
i
i

ˆ 1y
Xi V
i
i

1

i

i

(2.4)

9

Karena Vi digantikan oleh penduganya V̂i , maka ˆ pada persamaan (2.4)
dikatakan sebagai penduga tak bias linier terbaik empirik (Empirical Best Linear
Unbiased Estimator/EBLUE) bagi .
Ragam bagi ˆ merupakan matriks ragam-peragam berdimensi pxp, yaitu:
1

var( ˆ )

ˆ 1X
Xi V
i
i
i

Karena tidak mempertimbangkan hilangnya derajat bebas sebagai akibat
merupakan penduga yang berbias. Untuk

menduga , maka penduga ML bagi

mengeliminasi bias ini dikembangkan bentuk alternatif dari metode ML yakni
pendugaan REML.
Penduga REML bagi

diperoleh berdasarkan optimasi fungsi log-

kemungkinan REML sebagai berikut:
l REML ( )

(n p)
2

ln( 2 )

1
2

ln Vi
i

ri Vi 1ri

1
2

ln X i Vi 1 X i

1
2

i

i

Deskripsi dan pembandingan berbagai metode pendugaan dalam model
linier campuran dapat dijumpai misalnya dalam Searle et al. 1992.
Nilai prediksi bagi pengaruh acak merupakan nilai harapan bersyarat dari
pengaruh acak jika nilai peubah respon diketahui, yang dapat dinyatakan sebagai:
bˆ i

E(b i | Yi

yi )

ˆZ V
ˆ 1
D
i i (y i

Xi ˆ )

Nilai harapan beryarat di atas merupakan prediktor tak bias linear terbaik
empiris (Empirical Best Linear Unbiased Predictor/EBLUP) bagi pengaruh acak
bi, karena diperoleh berdasarkan nilai dugaan matriks kovarian V̂i . Adapun
matriks kovarian bagi prediktor pengaruh acak b̂ i adalah:
Var (bˆ i )

ˆ Z (V
ˆ
D
i
i

1

ˆ 1X (
V
i
i

ˆ 1X ) 1 X V
ˆ 1
ˆ
Xi V
i
i
i i )Z i D
i

2.3. Pengujian Hipotesis dan Pembandingan Model Tersarang
Hipotesis dari dua model yang memiliki hubungan tersarang dapat dibuat
menjadi suatu formula. Model reference (model penuh) merupakan model yang
lebih umum yang mencakup kedua hipotesis (H0 dan Ha), sedangkan model yang
hanya mencakup H0 disebut model nested (model tersarang). Model penuh
mengandung semua parameter yang diuji sedangkan model tersarang hanya

10

mengandung sebagian dari parameter tersebut. Uji yang digunakan untuk
membandingkan kedua model tersebut adalah Likelihood Ratio Tests (LRTs).
LRTs merupakan suatu uji yang membandingkan nilai fungsi likelihood untuk
kedua model dengan persamaan:
-2log(

Ltersarang
L penuh

) = -2 log (Ltersarang) – (-2log(Lpenuh))~

2
df

sedangkan:
Ltersarang = nilai fungsi likelihood pada model tersarang
Lpenuh

= nilai fungsi likelihood pada model penuh

df

= selisih banyaknya parameter antara model penuh dan model tersarang
LRTs juga dapat digunakan untuk menguji hipotesis parameter acak dan

tetap di dalam model. Pengujian parameter tetap dalam model menggunakan
pendugaan ML, sedangkan dalam pengujian parameter acak digunakan pendugaan
REML. Statistik ujinya adalah selisih (-2 ML/REML log likelihood) antara model
penuh dan model tersarang seperti dinyatakan dalam persamaan di atas.
2.4. Penerapan terhadap Data Kasus HIV/AIDS
Data yang digunakan untuk analisis data longitudinal merupakan hasil suatu
percobaan klinis untuk membandingkan kemanjuran dan keamanan dua jenis obat
antiretroviral dalam menangani pasien-pasien yang gagal atau tidak toleran
terhadap terapi zidovudine (AZT). Percobaan melibatkan n = 467 pasien terinfeksi
HIV yang terdiagnosa sebagai penderita AIDS atau memiliki jumlah sel CD4+ ≤
300 per ml3 darah. Pasien dibagi secara acak untuk menerima salah satu dari dua
jenis obat, yaitu didanosine (ddI) atau zalzitabine (ddC). Banyaknya sel CD4+
dicatat pada saat terlibat dalam studi (t = 0), dan kunjungan pada bulan ke 2, 6, 12
dan 18, sehingga maks mi = 5. Data ini digunakan oleh Guo dan Carlin (2004)
untuk pemodelan bersama data longitudinal dan data daya tahan hidup (waktu
sampai

kematian)

dari

penderita

HIV.

Data

diambil

dari

Peubah penjelasnya adalah Drug (ddI = 1, ddC = 0), Gender (male = 1,
female = -1), PrevOI (AIDS diagnosis at study entry = 1, no AIDS diagnosis = -1),
dan Stratum (AZT failure = 1, AZT intolerance = -1).

11

Sebelum dimodelkan dengan model linier campuran, terlebih dahulu
waktu pengamatan untuk kedua jenis obat disajikan pada Gambar 2.1. Dari
Gambar 2.1 tampak bahwa sebaran banyaknya sel CD4+ sangat menjulur ke kanan
dengan banyak pencilan, mengindikasikan perlunya dilakukan transformasi data
sebelum analisis berikutnya.
Boxplot of CD4
0

2

ddC

6

12

18

ddI

600
500

CD4

400
300
200
100
0
0

2

6

12

18
Obstime

Panel variable: Drug-Type

Gambar 2.1. Boxplot data asal
Transformasi akar dipilih untuk mengurangi kemenjuluran pola sebaran
sekaligus untuk menstabilkan ragam, juga karena datanya merupakan data
cacahan. Boxplot setelah data ditransformasi dapat dilihat pada Gambar 2.2.
Setelah ditransformasi data terlihat lebih homogen serta lebih simetrik.
Boxplot of Sqrt(CD4)
0
ddC

2

6

12

ddI

25

Sqrt(CD4)

20
15
10
5
0
0

2

6

12

18
Obstime

Panel variable: Drug Type

Gambar 2.2. Boxplot data hasil transformasi akar

18

12

Efek pengobatan umumnya tidak sama antar waktu, yaitu memungkinkan
adanya interaksi antara jenis obat dengan waktu pengamatan. Pemeriksaan
interaksi antara jenis obat dengan waktu pengamatan secara grafis disajikan
melalui plot interaksi data hasil transformasi pada Gambar 2.3. Dari Gambar 2.3
dapat dilihat adanya perbedaan pola jumlah sel CD4+ antar waktu untuk kedua
jenis obat. Untuk kelompok ddI, terjadi kenaikan jumlah sel CD4+ begitu
diberikan obat ddI sampai bulan ke-2, namun turun lagi pada bulan ke-6, naik lagi
untuk kelompok ddC terjadi penurunan jumlah sel CD4+ sampai bulan ke-6,
namun kemudian jumlah sel CD4+ naik terus sampai bulan ke-18. Berdasarkan
hasil ini efek interaksi akan dimasukkan dalam pemodelan.

Interaction Plot for Sqrt(CD4)
Data Means
8,0

Drug-Type
ddC
ddI

Mean

7,5

7,0

6,5

6,0
0

2

6
Obstime

12

18

Gambar 2.3. Plot interaksi antara waktu pengamatan dengan jenis obat
Data longitudinal hasil transformasi akar banyaknya sel CD4+ dalam
submodel-1 selanjutnya dimodelkan sebagai model linier campuran dengan
persamaan sebagai berikut:
wij

01

11Time ij

51 Stratum i

i 1,2,  ,467

sedangkan b

b0 i

21Time ij

Drug i

b1i Timeij

31Genderi

41

Pr evOI

ij ,

j 1,2,  , mi

(b0i , b1i ) ~ N 2 ( , Σ) dan

(

ij

~ N (0,

01 ,

11 ,

21 ,

2

)
31 ,

41 ,

51 )

merupakan parameter

efek tetap, sedangkan b (b0i , b1i ) merupakan parameter efek acak untuk pasien ke-

13

i. Dalam hal ini b0i merupakan intersep acak untuk subyek ke-i, dan b1i adalah
laju perubahan peubah respon per satuan waktu untuk pasien ke-i. Adapun

ij

merupakan galat intra-subyek yang diasumsikan menyebar normal dengan ragam
yang sama.
Hasil pemodelan dengan menggunakan model linier campuran disajikan
Tabel 2.1. Nilai dugaan parameter beserta hasil uji dan SK 95%
Parameter

Nilai
dugaan

Galat
baku

t

Intercept (β01)
Time (β11)
Time x Drug (β21)

8.0129
-0.1668
0.02998

0.3511
0.02038
0.02891

22.82
-8.19
1.04

<.0001
<.0001
0.3003

7.3230
-0.2069
-0.02682

8.7027
-0.1268
0.08678

Gender (β31)

-0.1582

0.3249

-0.49

0.6265

-0.7965

0.4800

PrevOI (β41)

-2.3152

0.2382

-9.72

<.0001

-2.7831

-1.8474

Stratum (β51)

-0.1309

0.2352

-0.56

0.5780

-0.5929

0.3311

σ

bo

15.9111

1.1702

13.60

<.0001

13.8453

18.4789

σbo,b1

-0.1300

0.06169

-2.11

0.0350

-0.2509

-0.00913

σ

0.02854

0.005968

4.78

<.0001

0.01969

0.04509

3.0716

0.1713

17.93

<.0001

2.7617

3.4370

2

2
b1

σ2

Nilai-p

SK 95%

Berdasarkan Tabel 2.1 dapat dilihat bahwa peubah bebas yang berpengaruh
nyata pada banyaknya sel CD4+ penderita HIV adalah obstime dan prevOI dengan
nilai-p kurang dari 0.0001. Peubah prevOI yang nyata menunjukkan bahwa
penderita yang terdeteksi AIDS pada awal studi memiliki jumlah sel CD4+ lebih
rendah dibandingkan yang tidak terdeteksi AIDS, dengan rata-rata perbedaan
jumlah sel CD4+ antara pasien yang tidak terdiagnosis AIDS pada awal studi dan
yang terdeteksi AIDS sebesar 2.3152. Adapun peubah gender dan stratum tidak
Untuk kelompok obat ddI, nilai dugaan koefisien regresinya untuk Time
sebesar -0.1668 + 0.02998 = -0.13682, sedangkan untuk kelompok ddC sebesar 0.1668. Dengan kata lain rata-rata penurunan jumlah sel CD4+ sebesar kelompok
ddI sebesar 0.13682 per bulan, sedangkan untuk kelompok ddC sebesar 0.1668
per bulan. Namun perbedaan ini tidak nyata seperti dapat dilihat dari nilai-p
sebesar 0.3003.

14

Semua komponen ragam pada model ini nyata pada taraf nyata 5%. Dari
Tabel 2.1 diperoleh ragam jumlah sel CD4+ antar waktu untuk setiap pasien
berkisar antara 2.7617 dan 3.4370 pada taraf kepercayaan 95% dengan nilai
dugaan titik sebesar 3.0716. Nilai dugaan bagi ragam intersep sebesar 15.9111,
dengan selang kepercayaan 95% yaitu (13.8453, 18.4789), yang berarti ada
keragaman jumlah sel CD4+ awal antar pasien sewaktu masuk dalam studi.
Ragam slope juga nyata dengan nilai dugaan ragam sebesar 0.02854, artinya laju
penurunan jumlah sel CD4+ per bulan bervariasi antar pasien dengan keragaman
berkisar antara 0.01969 dan 0.04509. Terdapat korelasi negatif antara intersep dan
slope, yang ditunjukkan oleh nilai peragam antara intersep dan slope sebesar -0.13,
atau korelasinya sebesar -0.193. Hasil pengujian nyata pada α = 5%, yang berarti
penurunan jumlah sel CD4+ antar pasien dipengaruhi oleh jumlah sel CD4+ yang
dimiliki sebelumnya (sewaktu masuk dalam studi). Semakin besar jumlah sel
CD4+ awal yang dimiliki, semakin rendah laju penurunan jumlah sel CD4+ per
bulan. Diagram pencar antara intersep dan slope serta boxplot untuk kedua
pengaruh acak tersebut dapat dilihat pada Gambar 2.1.
Marginal Plot of slope vs intersep

0,6

slope

0,4
0,2
0,0
-0,2
-0,4
-10

-5

0

5

10

15

intersep

Gambar 2.4. Korelasi antara intersep dan slope

15

3. PEMODELAN BERSAMA (JOINT MODELING)
Pemodelan bersama umumnya digunakan untuk memodelkan hubungan
antara proses respon longitudinal dengan data daya tahan hidup, dimana model
untuk data daya tahan hidup dan data longitudinal digabung melalui pengaruh
acak laten. Literatur yang membahas mengenai hal ini beserta permasalahan dan
pengembangannya cukup berlimpah. Namun untuk respon primer yang berupa
data kategorik atau data kontinu lainnya, tidak banyak literatur yang
membahasnya.
Dalam penelitian ini dikembangkan pemodelan bersama terhadap respon
primer yang berupa data kontinu lain atau biner yang berasal dari sebaran
massa tulang < persentil-33) pada wanita perimenopause dikaitkan dengan profil
longitudinal dari hormon progesteron dalam suatu siklus menstruasi (Li et al.
2004, 2007). Demikian pula bagaimana berat badan ibu sebelum dan selama
kehamilan mempengaruhi berat lahir bayi dikoreksi terhadap masa kehamilan
(Dunson et al. 2010). Dalam kasus-kasus seperti ini dikembangkan model
bersama yang menggabungkan model untuk data longitudinal dengan model linier
terampat.
3.1. Beberapa Pendekatan Model Bersama
Tujuan umun dari pemodelan bersama adalah memberikan kerangka bagi
pertanyaan ilmiah mengenai hubungan sistematik di antara beberapa hasil
(multiple outcomes) beserta faktor-faktor lainnya (perlakuan, dosis, dll) secara
formal.

Untuk

menjamin

validitas

kesimpulan,

model

bersama

harus

mempertimbangkan korelasi yang ada di antara hasil tersebut.
Sejumlah pendekatan terhadap pemodelan bersama, dimana beberapa atau
semua hasil berupa data longitudinal telah banyak dibahas. Verbeke dan Davidian
(2009) telah memberikan pengantar singkat mengenai perspektif konseptual yang
mendasari pendekatan-pendekatan ini.

16

Misalkan Y1 dan Y2 adalah dua hasil yang diukur pada sebuah subyek yang
akan dimodelkan secara bersama, dimana salah satu atau keduanya dikumpulkan
secara

18  764  7

3  64  21

5  117  17

9  107  13

0  55  1

20  574  147

6  93  53

6  69  0

10  251  172

4  109  1

8  118  86

0  3  13

26  739  16

13  209  43

6  148  23

1  115  24

11  163  23

8  204  14

7  201  50

4  122  17

4  202  30

9  234  23