A robust approach for joint models based on t distribution

(1)

PENDEKATAN

KEKAR UNTUK MODEL BERSAMA

(

JOINT MODEL

_{) ATAS DASAR SEBARAN}

t

INDAHWATI

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

BOGOR

2012

(2)

(3)

PERNYATAAN MENGENAI DISERTASI DAN

SUMBER INFORMASI

Dengan ini saya menyatakan bahwa disertasi ″Pendekatan Kekar untuk Model Bersama (Joint Model) Atas Dasar Sebaran t″ adalah karya saya sendiri dan belum diajukan dalam bentuk apapun kepada perguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan atau tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir disertasi ini.

Bogor, Januari 2012

Indahwati NRP G161050031

(4)

ABSTRACT

INDAHWATI. A Robust Approach for Joint Models Based on t Distribution. Supervised by AUNUDDIN, KHAIRIL ANWAR NOTODIPUTRO and I GUSTI PUTU PURNABA.

Existing methods for joint modeling are usually based on normality assumption of random effects and intra-subject errors. We propose a joint model based on t distribution of the intra subject errors to improve robustness of the estimation. In addition, study is also performed to evaluate the effects of number of longitudinal data series on normality assumption. Our model consists of two submodels: a mixed linear mixed effects model for the longitudinal data, and a generalized linear model for continuous/binary primary response. The proposed method is evaluated by means of simulation studies as well as application to HIV data. Results of simulation study show that the effects of random effect distribution on bias and MSE of parameter estimates will be small if large number of longitudinal data series are used. Otherwise, the number of longitudinal data series give little effects when subject error is not normal. But long tail intra-subject error distribution will give large bias and MSE if modeled as normal. For small number of longitudinal data series, robust approach based on t distribution give smaller bias and MSE, mainly for parameters that joint longitudinal covariate with the the primary response variable.

Keywords: longitudinal data, joint model, mixed model, generalized linear model, robust, t-distribution

(5)

RINGKASAN

INDAHWATI. Pendekatan Kekar untuk Model Bersama (Joint Model) Atas Dasar Sebaran t. Dibimbing oleh AUNUDDIN, KHAIRIL ANWAR NOTODIPUTRO dan I GUSTI PUTU PURNABA.

Dalam bidang biomedis seringkali ada kebutuhan untuk menganalisis hubungan antara peubah penjelas yang pengukurannya dilakukan secara berulang antar waktu (kovariat longitudinal) dengan peubah respon dalam suatu model regresi primer. Hasil pengukuran longitudinal dalam hal ini dapat dijadikan sebagai penanda biologis (biomarker) bagi terjadinya suatu kejadian yang menjadi perhatian. Dalam kasus-kasus semacam di atas, ingin diketahui bagaimana pengaruh profil longitudinal dari peubah penjelas terhadap peubah respon yang menjadi perhatian. Pendekatan yang dilakukan untuk memodelkan hubungan antara peubah penjelas longitudinal dengan peubah respon primer dalam penelitian ini adalah pemodelan bersama (joint modeling) yang menggabungkan dua submodel: model linear campuran untuk proses respon longitudinal, serta model linier terampat untuk respon primer yang berasal dari sebaran keluarga eksponensial. Pemodelan bersama yang digunakan disini didasarkan atas model berbagi bersama (shared parameter models) yang mengasumsikan kedua proses diinduksi oleh pengaruh acak yang sama.

Model bersama (joint model) umumnya didasarkan atas asumsi bahwa pengaruh acak dan galat intra subyek menyebar normal. Pada kenyataannya tak jarang terjadi pelanggaran atas asumsi ini. Penelitian ini bertujuan untuk mengkaji penggunaan sebaran t untuk galat intra subyek sebagai pendekatan yang lebih kekar terhadap asumsi kenormalan, serta mengevaluasi pengaruh banyaknya deret data longitudinal terhadap asumsi kenormalan. Hal ini dilakukan melalui kajian simulasi. Kajian empiris dilakukan terhadap contoh kasus data HIV/AIDS.

Berdasarkan hasil simulasi diperoleh beberapa temuan sebagai berikut: Secara umum bias dan MSE dari penduga parameter model bersama akan semakin kecil jika frekuensi pengamatan longitudinalnya semakin banyak. Semakin banyak frekuensi pengamatan longitudinal, sebaran pengaruh acak semakin tidak berpengaruh, apakah sebaran simetrik berekor pendek atau panjang. Sebaliknya frekuensi pengamatan longitudinal hanya sedikit pengaruhnya terhadap bias dan MSE jika sebaran pengaruh galat intra-subyeknya yang tidak normal. Namun sebaran galat intra-subyek yang berekor sangat panjang memberikan bias dan MSE yang besar jika dimodelkan dengan sebaran normal. Untuk frekuensi pengamatan longitudinal yang sedikit (jarang), pendekatan kekar atas dasar sebaran t untuk galat intra-subyek dalam pemodelan bersama memberikan hasil yang lebih baik (ARB dan MSE yang lebih kecil), terutama untuk parameter yang menghubungkan kovariat longitudinal dengan peubah respon primernya.

Berdasarkan hasil pemodelan bersama terhadap contoh kasus data HIV/AIDS, jumlah sel CD4+ awal pasien maupun perubahannya per satuan waktu keduanya berpengaruh terhadap peluang terjadinya kematian penderita HIV. Semakin sedikit jumlah sel CD4+ awal pasien serta semakin besar penurunannya per satuan waktu, semakin besar pula peluang kematian pasien tersebut. Peubah lain yang juga mempengaruhi peluang kematian penderita HIV adalah jenis obat.

(6)

Pemakaian obat ddC lebih efektif dalam memperkecil resiko kematian penderita HIV dibandingkan obat ddI. Dengan tingkat kepercayaan 95%, kematian pasien terjadi 1.026 - 2.065 kali lebih sering di antara penerima obat ddI dibandingkan ddC. Selain itu pasien yang terdiagnosis AIDS pada awal studi memiliki peluang kematian yang lebih tinggi dibandingkan pasien yang tidak terdiagnosis AIDS, yaitu berkisar antara 1.857 - 3.828 kali dibandingkan pasien yang tidak terdiagnosis AIDS.

Kata kunci : data longitudinal, joint model, model linier campuran, model linier terampat, kekar, sebaran t

(7)

@Hak Cipta Milik Institut Pertanian Bogor (IPB), tahun 2012

Hak Cipta Dilindungi Undang-undang

1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumber:

a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau tinjauan suatu masalah

b. Pengutipan tidak merugikan kepentingan yang wajar IPB

2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis dalam bentuk apapun tanpa ijin IPB.

(8)

PENDEKATAN

KEKAR UNTUK MODEL BERSAMA

(

JOINT MODEL

_{) ATAS DASAR SEBARAN}

t

INDAHWATI

Disertasi

Sebagai salah satu syarat untuk memperoleh gelar Doktor

pada Program Studi Statistika

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

(9)

Penguji Luar Komisi pada Ujian Tertutup, 30 Januari 2012:

1. Prof. Dr. Ir. A. Ansori Mattjik, M.Sc (Dosen Dept. Statistika IPB) 2. Dr. Ir. I Made Sumertajaya, MSi. (Dosen Dept. Statistika IPB)

Penguji Luar Komisi pada Ujian Terbuka, 31 Januari 2012:

1. Dr. Ir. I Wayan Mangku (Dosen Dept. Matematika IPB) 2. Dr. Ir. Aji Hamim Wigena, M.Sc (Ketua PS Statistika SPs IPB)

(10)

Judul Disertasi : Pendekatan Kekar untuk Model Bersama (Joint Model) Atas Dasar Sebaran t

Nama Mahasiswa : Indahwati

NIM : G161050031

Program Studi : Statistika

Disetujui : Komisi Pembimbing

Ketua

Prof. Dr. Ir. Aunuddin, MSc.

Prof. Dr. Ir. Khairil Anwar Notodiputro, MS

Anggota Anggota

Dr. Ir. I Gusti Putu Purnaba, DEA

Diketahui :

Ketua Program Studi Statistika Dekan Sekolah Pascasarjana

Dr. Ir. Aji Hamim Wigena, MSc. Dr. Ir. Dahrul Syah, M.ScAgr Tanggal Ujian: 31 Januari 2012 Tanggal Lulus:

(11)

PRAKATA

Puji syukur penulis panjatkan kepada Allah SWT, karena hanya atas rahmat dan karunia-Nya disertasi ini dapat diselesaikan. Penelitian dengan judul

″Pendekatan Kekar untuk Model Bersama (Joint Model) Atas Dasar Sebaran t″ ini pada prinsipnya ingin memberikan alternatif pendekatan kekar terhadap asumsi sebaran normal dalam pemodelan bersama (Joint Modeling). Pemilihan sebaran t

sebagai alternatif bagi sebaran normal didasarkan atas sifat sebaran t yang ekornya lebih fleksibel dalam menggambarkan sebaran data.

Pada kesempatan ini penulis mengucapkan terima kasih kepada komisi pembimbing: Prof. Dr. Ir. Aunuddin, MSc., Prof. Dr. Ir. Khairil Anwar Notodiputro, MS, serta Dr. Ir. I Gusti Putu Purnaba, DEA yang telah memberikan arahan, kritikan, saran dan masukan yang sangat berarti dalam penyusunan disertasi ini. Selain itu penulis juga mengucapkan terima kasih kepada:

1. Pimpinan Institut Pertanian Bogor yang telah memberikan kesempatan untuk mendapatkan beasiswa BPPS guna melanjutkan studi di Sekolah Pascasarjana IPB Bogor dan memberikan kesempatan untuk mengikuti Hibah Penelitian Disertasi Doktor.

2. Pimpinan Sekolah Pascasarjana, Ketua Departemen Statistika, Ketua Program Studi Statistika, serta staf administrasi yang telah memberikan layanan pendidikan/pengajaran dan layanan administrasi dengan baik.

3. Seluruh penguji, baik pada saat ujian preliminasi lisan dan tertulis, maupun saat ujian tertutup dan terbuka.

4. Kedua orang tua (almarhum), kakak dan adik, dan seluruh keluarga penulis yang senantiasa memberikan dorongan dan doa.

5. Rekan-rekan sejawat di departemen Statistika FMIPA IPB: Pak Mattjik, Pak Asep, Bu Anik, Bu Erfi, Bu Yenni serta lainnya atas perhatian, dorongan semangat dan motivasinya.

6. Rekan-rekan mahasiswa Program Studi Statistika Sekolah Pascasarjana IPB atas diskusi, bantuan dan pemberian semangat hingga selesainya disertasi ini.

Penulis menyadari bahwa disertasi ini masih jauh dari sempurna, namun penulis berharap karya ilmiah ini bermanfaat bagi pihak-pihak yang memerlukannya.

Bogor, Januari 2012 Indahwati

(12)

RIWAYAT HIDUP

Penulis dilahirkan di Jember pada tanggal 12 Juli 1965, sebagai anak kedua dari 7 bersaudara pasangan Achmad Ismail (almarhum) dan Untung Masturah (almarhum). Pendidikan sarjana ditempuh pada Departemen Statistika, FMIPA IPB, dan lulus pada tahun 1989. Pada tahun 1991, penulis melanjutkan jenjang pendidikan S2 pada Program Studi Statistika, Sekolah Pascasarjana IPB dengan bea siswa BPPS, dan menyelesaikannya pada tahun 1995. Selanjutnya pada tahun 2005 penulis berkesempatan untuk melanjutkan jenjang pendidikan S3 pada Program Studi Statistika Sekolah Pascasarjana IPB dengan beasiswa BPPS. Sejak tahun 1990 hingga sekarang penulis bekerja sebagai staf pengajar pada Departemen Statistika FMIPA IPB

Selama mengikuti program S3, beberapa karya ilmiah telah dipublikasikan baik melalui seminar nasional, prosiding, maupun jurnal ilmiah dengan rincian sebagai berikut:

1. Indahwati dan Notodiputro KA. 2006. Effects of Inconsistency of Sampling Design on Reliability of Small Area Estimates. Proceeding at The First International Conference on Mathematics and Statistics (ICoMS-1), Juni 2006, UNISBA - Bandung.

2. Indahwati, Sadik K dan Nurmasari R. 2008. Pendekatan Metode Pemulusan Kernel pada Pendugaan Area Kecil (Small Area Estimation). Prosiding pada Seminar Nasional Matematika dan Pendidikan Matematika, Nopember 2008. FMIPA UNY - Yogyakarta.

3. Indahwati, Syafitri UD dan Mayasari RS. 2008. Penerapan Metode Pemulusan Kernel pada Pendugaan Area Kecil (Studi Kasus Pendugaan Pengeluaran Per Kapita di Kota Bogor tahun 2005). Prosiding pada Seminar Nasional Matematika dan Pendidikan Matematika, Nopember 2008. FMIPA UNY - Yogyakarta.

4. Nadhiroh IM, Notodiputro KA dan Indahwati. 2008. Zero Inflated Negative Binomial Models in Small Area Estimation. Prosiding pada Seminar Nasional Matematika dan Pendidikan Matematika, Nopember 2008. FMIPA UNY - Yogyakarta.

5. Indahwati, Kusumaningrum D, Widiyani W. 2009. Aplikasi Regresi Dua Level terhadap Nilai Akhir Metode Statistika. Prosiding pada Seminar Nasional Matematika dan Pendidikan Matematika, 5 Desember 2009. FMIPA UNY - Yogyakarta.

6. Indahwati, Angraeni YA, Sastuti TW. 2009. Pemodelan Regresi Tiga Level pada Data Pengamatan Berulang. Prosiding pada Seminar Nasional Matematika dan Pendidikan Matematika, 5 Desember 2009. FMIPA UNY - Yogyakarta.

(13)

7. Indahwati, Kusumaningrum D, Maena I. 2010. Aplikasi Regresi Logistik Ordinal Multilevel untuk Pemodelan dan Klasifikasi Huruf Mutu Mata Kuliah Metode Statistika. Forum Statistika dan Komputasi. ISSN 0853-8115 Vol. 15 No. 2.

8. Indahwati, Aunuddin, Notodiputro KA, dan Purnaba IGP. 2011. Kajian Simulasi Ketaknormalan Pengaruh Acak dan Banyaknya Deret Data Longitudinal dalam Pemodelan Bersama (Joint Modeling). Forum Statistika dan Komputasi. ISSN 0853-8115 Vol. 16 No. 2 (Siap terbit). 9. Indahwati, Aunuddin, Notodiputro KA, dan Purnaba IGP. 2012.

Pendekatan Kekar untuk Model Bersama (Joint Model) atas Dasar Sebaran-t. Forum Statistika dan Komputasi. ISSN 0853-8115 Vol. 17 No.1 (Siap terbit).

(14)

DAFTAR ISI

Halaman

DAFTAR TABEL ... xiv

DAFTAR GAMBAR ... xv

DAFTAR LAMPIRAN ...…... xix

1 PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Tujuan Penelitian ... 4

1.3 Kebaruan Penelitian (Novelty) ... 4

1.4 Sistematika Penulisan Disertasi ... 5

2 ANALISIS DATA LONGITUDINAL ... 6

2.1 Model Linear Campuran ... 6

2.2 Metode Pendugaan Parameter …... 7

2.3 Pengujian Hipotesis dan Pembandingan Model Tersarang ……... 9

2.4 Penerapan terhadap Data Kasus HIV/AIDS ………... 10

3 PEMODELAN BERSAMA(JOINT MODELING) ……… 15

3.1 Beberapa Pendekatan Model Bersama ………... 15

3.2 Pendugaan Parameter ……….... 18

3.3 Model Dasar bagi Model Bersama ……….….……….. 18

3.4 Penerapan pada Data Kasus HIV/AIDS ... 21

3.4.1 Penerapan pada Data Kasus HIV/AIDS ………... 21

3.4.2 Pemodelan ...……….. 22

4 PENDEKATAN KEKAR ATAS DASAR SEBARAN t ... 27

4.1 Sebaran Peubah Ganda t ……….. 27

4.2 Model Bersama Atas Dasar Sebaran t ………... 27

4.2.1 Pendekatan Kekar untuk Pengaruh Acak ……… 27

4.2.2 Pendekatan Kekar untuk Galat Intra Subyek ... 30

4.3 Kajian Simulasi Ketaknormalan Pengaruh Acak ……….. 31

4.3.1 Rancangan Simulasi ...……… 31

4.3.2 Hasil Simulasi ... 33

4.4 Kajian Simulasi Ketaknormalan Galat Intra Subyek …………... 51

4.4.1 Rancangan Simulasi ...……… 51

4.4.2 Hasil Simulasi ... 52

(15)

5 PEMBAHASAN UMUM ... 61

6 KESIMPULAN DAN SARAN ………... 64

DAFTAR PUSTAKA ... 65

(16)

DAFTAR TABEL

Halaman 2.1 Nilai dugaan parameter beserta hasil uji dan SK 95% 13 3.1 Nilai dugaan parameter model bersama beserta hasil uji dan SK

95%

24 4.1 Nilai ARB(%) penduga parameter model bersama dengan

pengaruh acak menyebar t-student dan normal diasumsikan menyebar normal

33 4.2 Nilai MSE penduga parameter model bersama dengan pengaruh

acak menyebar t-student dan normal diasumsikan menyebar normal

35 4.3 Nilai ARB(%) penduga parameter model bersama dengan galat

intra-subyek menyebar t-student dan normal diasumsikan menyebar normal

53 4.4 Nilai MSE penduga parameter model bersama dengan galat

intra-subyek menyebar t-student dan normal diasumsikan menyebar normal

4.5 Nilai ARB (%) dan MSE penduga parameter model bersama dengan galat intra-subyek menyebar lognormal diasumsikan menyebar t-student dan normal, frekuensi pengamatan longitudinal = 4

4.6 Nilai ARB (%) penduga parameter model bersama dengan galat intra-subyek menyebar normal, t, dan lognormal diasumsikan menyebar normal dan t

58 4.7 Nilai MSE penduga parameter model bersama dengan galat

intra-subyek menyebar normal, t, dan lognormal diasumsikan menyebar normal dan t

(17)

DAFTAR GAMBAR

Halaman

2.1 Boxplot data asal 11

2.2 Boxplot data hasil transformasi akar 11

2.3 Plot interaksi antara waktu pengamatan dengan jenis obat 12

2.4 Korelasi antara intersep dan slope 14

3.1 Banyaknya pasien pada lima titik waktu pengamatan 22 4.1 Fungsi kepekatan peluang normal dan t-student dengan derajat

bebas 3, 4, dan 5

28 4.2 Grafik ARB (%) penduga parameter model bersama dengan

pengaruh acak menyebar t-student dan normal diasumsikan menyebar normal, frekuensi pengamatan longitudinal = 4

34 4.3 Grafik ARB (%) penduga parameter model bersama dengan

pengaruh acak menyebar t-student dan normal diasumsikan menyebar normal, frekuensi pengamatan longitudinal = 9

34 4.4 Grafik MSE penduga parameter model bersama dengan

pengaruh acak menyebar t-student dan normal diasumsikan menyebar normal, frekuensi pengamatan longitudinal = 4

36 4.5 Grafik MSE penduga parameter model bersama dengan

pengaruh acak menyebar t-student dan normal diasumsikan menyebar normal, frekuensi pengamatan longitudinal = 9

36 4.6 Hubungan antara ARB (%) dengan frekuensi pengamatan

longitudinal untuk penduga parameter intersep (b10) pada submodel-1

37 4.7 Hubungan antara MSE dengan frekuensi pengamatan

longitudinal untuk penduga parameter intersep (b10) pada submodel-1

38 4.8 Hubungan antara ARB (%) dengan frekuensi pengamatan

longitudinal untuk penduga parameter slope (b11) pada submodel-1

38 4.9 Hubungan antara MSE dengan frekuensi pengamatan

longitudinal untuk penduga parameter slope (b11) pada submodel-1

4.10 Hubungan antara ARB (%) dengan frekuensi pengamatan longitudinal untuk penduga parameter ragam intersep (a11) pada submodel-1

40 4.11 Hubungan antara MSE dengan frekuensi pengamatan

longitudinal untuk penduga parameter ragam intersep (a11) pada submodel-1

41 4.12 Hubungan antara ARB (%) dengan frekuensi pengamatan

longitudinal untuk penduga parameter ragam slope (a22) pada submodel-1

41 4.13 Hubungan antara MSE dengan frekuensi pengamatan

longitudinal untuk penduga parameter ragam slope (a22) pada submodel-1

(18)

4.14 Hubungan antara ARB (%) dengan frekuensi pengamatan longitudinal untuk penduga parameter peragam(intersep,slope) (a12) pada submodel-1

4.15 Hubungan antara MSE dengan frekuensi pengamatan longitudinal untuk penduga parameter peragam(intersep,slope) (a12) pada submodel-1

43 4.16 Hubungan antara ARB (%) dengan frekuensi pengamatan

longitudinal untuk penduga parameter galat intra subyek (s21) pada submodel-1

44 4.17 Hubungan antara MSE dengan frekuensi pengamatan

longitudinal untuk penduga parameter galat intra subyek (s21) pada submodel-1

45 4.18 Hubungan antara ARB (%) dengan frekuensi pengamatan

longitudinal untuk penduga parameter b20 pada submodel-2

46 4.19 Hubungan antara MSE dengan frekuensi pengamatan

longitudinal untuk penduga parameter b20 pada submodel-2

46 4.20 Hubungan antara ARB (%) dengan frekuensi pengamatan

longitudinal untuk penduga parameter b21 pada submodel-2

47 4.21 Hubungan antara MSE dengan frekuensi pengamatan

longitudinal untuk penduga parameter b21 pada submodel-2

48 4.22 Hubungan antara ARB (%) dengan frekuensi pengamatan

longitudinal untuk penduga parameter b21 pada submodel-2

48 4.23 Hubungan antara MSE dengan frekuensi pengamatan

longitudinal untuk penduga parameter b21 pada submodel-2

49 4.24 Hubungan antara ARB (%) dengan frekuensi pengamatan

longitudinal untuk penduga parameter ragam submodel-2 (s22)

50 4.25 Hubungan antara MSE dengan frekuensi pengamatan

longitudinal untuk penduga parameter ragam submodel-2 (s22)

50 4.26 Grafik ARB (%) penduga parameter model bersama dengan

galat intra-subyek menyebar t-student dan normal diasumsikan menyebar normal, frekuensi pengamatan longitudinal = 4

52 4.27 Grafik ARB (%) penduga parameter model bersama dengan

galat intra-subyek menyebar t-student dan normal diasumsikan menyebar normal, frekuensi pengamatan longitudinal = 9

53 4.28 Grafik MSE penduga parameter model bersama dengan galat

intra-subyek menyebar t-student dan normal diasumsikan menyebar normal, frekuensi pengamatan longitudinal = 4

54 4.29 Grafik MSE penduga parameter model bersama dengan galat

intra-subyek menyebar t-student dan normal diasumsikan menyebar normal, frekuensi pengamatan longitudinal = 9

55 4.30 Grafik ARB (%) penduga parameter model bersama dengan

galat intra-subyek menyebar lognormal diasumsikan menyebar t-student dan normal, frekuensi pengamatan longitudinal = 4

56 4.31 Grafik MSE penduga parameter model bersama dengan galat

intra-subyek menyebar lognormal diasumsikan menyebar t-student dan normal, frekuensi pengamatan longitudinal = 4

(19)

4.32 Grafik ARB (%) penduga parameter model bersama dengan galat intra-subyek menyebar normal, t, dan lognormal diasumsikan menyebar normal dan t

4.33 Grafik MSE penduga parameter model bersama dengan galat intra-subyek menyebar normal, t, dan lognormal diasumsikan menyebar normal dan t

(20)

DAFTAR LAMPIRAN

Halaman 1 Output SAS untuk analisis data longitudinal 69 2 Boxplot nilai ARB (%) untuk pengaruh acak menyebar normal

ganda dan bivariate-t diasumsikan normal pada frekuensi pengamatan longitudinal sering dan jarang

70 3 Boxplot nilai MSE untuk pengaruh acak menyebar normal ganda

dan bivariate-t diasumsikan normal pada frekuensi pengamatan longitudinal sering dan jarang

75 4 Nilai ARB (%) penduga parameter submodel-1 80

5 Nilai MSE penduga parameter submodel-1 81

6 Nilai ARB (%) penduga parameter submodel-2 82

7 Nilai MSE penduga parameter submodel-2 83

(21)

1. PENDAHULUAN 1.1. Latar Belakang

Dalam bidang biomedis seringkali ada kebutuhan untuk menganalisis hubungan antara peubah penjelas yang pengukurannya dilakukan secara berulang antar waktu (kovariat longitudinal) dengan peubah respon dalam suatu model regresi primer. Sebagai ilustrasi adalah hubungan antara daya tahan hidup pasien AIDS dengan banyaknya sel CD4+ dalam limfosit yang pengukurannya dilakukan secara berulang. Contoh lain adalah hubungan antara kejadian BBLR (Berat Bayi Lahir Rendah) dengan status gizi ibu yang direpresentasikan oleh berat badan ibu sebelum dan selama kehamilan. Hasil pengukuran longitudinal dalam hal ini dapat dijadikan sebagai penanda biologis (biomarker) bagi terjadinya suatu kejadian yang menjadi perhatian. Dalam kasus-kasus semacam ini, ingin diketahui bagaimana pengaruh profil longitudinal dari peubah penjelas (yang mungkin cukup kompleks) terhadap peubah respon yang menjadi perhatian.

Dalam analisis data longitudinal yang baku, seperti dapat dijumpai dalam Laird dan Ware (1982), atau Verbeke dan Mollenberghs (2000), peubah respon merupakan hasil pengukuran longitudinal, sedangkan peubah penjelas bisa longitudinal atau sesaat, atau gabungan dari keduanya. Dengan demikian pemodelan peubah respon skalar dengan peubah penjelas longitudinal dalam hal ini tidak dapat diterapkan secara langsung.

Salah satu pendekatan yang dilakukan untuk memodelkan hubungan antara peubah penjelas longitudinal dengan peubah respon skalar - yang dalam kepustakaan seringkali disebut primary endpoint - adalah pemodelan bersama (joint modeling). Pendekatan ini seringkali digunakan untuk memodelkan hubungan antara data longitudinal (sebagai peubah penjelas) dengan data daya tahan hidup (sebagai peubah respon), seperti dapat dijumpai dalam Henderson et al. (2000), serta Tsiatis dan Davidian (2004). Pemodelan bersama dengan respon primer berupa data biner diantaranya dapat dijumpai dalam Zhang dan Lin (1999), Li et al. (2004, 2007a, 2007b), serta Horrocks dan Heuvel (2009).

Prinsip umum dari pendekatan model bersama adalah penggabungan dua model, yaitu submodel-1 yang diasumsikan mengikuti model linier campuran (linear mixed model) - mungkin setelah ditransformasi - untuk memodelkan data

(22)

pengukuran berulang, serta submodel-2 yaitu model regresi primer yang diasumsikan mengikuti model linier terampat (generalized linear model) untuk respon primer yang mengikuti sebaran keluarga eksponensial, atau model proporsional hazard untuk respon primer yang berupa data daya tahan hidup. Dalam pendekatan model bersama, peubah respon dalam model regresi primer bergantung pada kovariat longitudinal melalui pengaruh acak spesifik subyek. Dengan kata lain, pengaruh acak yang dihasilkan dari model campuran (submodel-1) menjadi peubah bebas pada model regresi primer (submodel-2).

Namun karena pengaruh acak tak teramati, maka pendekatan naive dengan cara mensubstitusi langsung nilai dugaan OLS (Ordinary Least Squares) setiap subyek dari submodel-1 ke dalam submodel-2 sebagai peubah penjelas akan menghasilkan nilai dugaan parameter model regresi primer yang berbias, khususnya yang mengukur pengaruh kovariat longitudinal terhadap peubah respon primer (Zhang dan Lin 1999; Wang et al. 2000). Studi pembandingan beberapa metode pendugaan parameter dalam model bersama antara lain dilakukan oleh Zhang dan Lin (1999) dan Wang et al. (2000).

Selama ini metode pendugaan parameter pada model bersama didasarkan atas asumsi bahwa hasil pengukuran longitudinal mengikuti model linier campuran dengan pengaruh acak dan galat intra-subyek menyebar normal. Namun dalam prakteknya tidak semua data dapat memenuhi asumsi ini. Ketidaknormalan dapat terjadi pada pengaruh acak, galat intra-subyek maupun keduanya. Selain itu dalam data longitudinal adakalanya deret data yang diamati tidak terlalu panjang, dan seringkali tidak lengkap. Karena itu perlu dicari pendekatan lain yang lebih kekar (robust) terhadap sebaran pengaruh acak maupun galat intra-subyek.

Berkaitan dengan asumsi kenormalan, beberapa penulis berusaha mengajukan pendekatan yang lebih kekar terhadap asumsi sebaran normal dari pengaruh acak. Misalnya Tsiatis dan Davidian (2001) menurunkan suatu penduga yang tidak memerlukan asumsi parametrik dari pengaruh acak untuk respon primer berupa daya tahan hidup. Demikian juga Li et al. (2004) mengajukan penduga kecukupan (sufficiency estimator) dan penduga bersyarat (conditional estimator) untuk respon primer yang berasal dari sebaran keluarga eksponensial. Pendekatan lain diajukan dengan mengendurkan asumsi kenormalan pengaruh

(23)

acak. Song (2002) mengajukan model bersama semiparametrik pada respon primer berupa data daya tahan hidup, dimana sebaran pengaruh acak tidak dispesifikasikan, namun hanya diasumsikan mengikuti fungsi kepekatan mulus yang dinyatakan sebagai fungsi kepekatan normal dikalikan suatu fungsi polinomial. Pendekatan serupa juga dilakukan oleh Li et al. (2007) terhadap respon primer yang berupa data biner. Namun pendekatan ini menimbulkan beban komputasi jika pengaruh acaknya banyak.

Beberapa kajian terhadap pengaruh salah spesifikasi sebaran pengaruh acak terhadap sifat-sifat penduga parameter model bersama telah dilakukan. Pada peubah respon primer yang berupa daya tahan hidup, kajian tentang asumsi kenormalan pengaruh acak dilakukan oleh Song et al. (2002) dan Hsieh et al. (2006). Hasil temuan penulis-penulis tersebut mengindikasikan bahwa penduga parameter model bersama cukup kekar terhadap salah spesifikasi sebaran pengaruh acak. Namun Li et al. (2007) yang mengkaji hal yang sama terhadap peubah respon primer biner yang dimodelkan dengan regresi logistik memperoleh hasil yang berlawanan, bias cukup besar terjadi terutama untuk sebaran pengaruh acak yang bimodus. Rizopoulos dan Verbeke (2008) menyatakan bahwa ketika banyaknya pengukuran berulang untuk setiap subyek meningkat, maka salah spesifikasi sebaran pengaruh acak memberikan efek yang minimum untuk beberapa nilai dugaan parameter.

Selama tiga dekade terakhir, sebaran peubah ganda t (multivariate t distribution) telah dikenal sebagai salah satu generalisasi yang berguna sebagai pendekatan kekar, terutama terhadap pencilan, misalnya dalam model regresi linier (Zellner 1976; Lange et al. 1989) dan model linier campuran (Pinheiro et al. 2001; Song et al. 2007; Lin 2008; Wang & Fan 2010). Kotz dan Nadarajah (2004), serta Nadarajah dan Kotz (2008) menyatakan bahwa dibandingkan sebaran normal ganda, sebaran peubah ganda t menawarkan alternatif yang lebih dapat hidup terus (viable) berkaitan dengan sebaran data di dunia riil, karena mempunyai ekor yang lebih realistis. Dalam bidang ekonomi sebaran t juga sering digunakan untuk pemodelan data ekonomi yang seringkali sebarannya berekor gemuk atau panjang. Namun Lange (1989) juga mencatat bahwa analisis yang sesuai untuk lokasi jika sebaran data tidak simetrik merupakan isu yang perlu diperhatikan.

(24)

Dalam konteks pemodelan bersama dengan respon primer berupa data daya tahan hidup, pendekatan kekar terhadap pencilan dikaji oleh Li et al. (2009) dengan mengasumsikan galat intra-subyek menyebar t-student. Namun untuk jenis peubah respon primer yang lain, belum ada kajian mengenai penggunaan sebaran t sebagai pendekatan kekar terhadap asumsi kenormalan dalam model bersama.

Berkaitan dengan permasalahan di atas, beberapa hal yang diajukan dalam pertanyaan penelitian ini adalah:

1. Bagaimana pengaruh pelanggaran asumsi sebaran normal terhadap sifat-sifat penduga parameter model bersama ?

2. Bagaimana pengaruh banyaknya deret data longitudinal pada submodel-1 terhadap sifat-sifat penduga parameter model bersama ?

3. Bagaimana kinerja sebaran t sebagai pendekatan kekar terhadap assumsi kenormalan galat intra-subyek dalam model bersama?

1.2. Tujuan Penelitian

Berdasarkan pertanyaan penelitian yang diuraikan di atas, maka penelitian ini bertujuan untuk:

1. Membuat formulasi model bersama dengan pengaruh acak menyebar t beserta pendugaan parameternya.

2. Mengevaluasi pengaruh banyaknya deret data longitudinal pada submodel-1 terhadap sifat-sifat penduga parameter model bersama. 3. Mengkaji penggunaan sebaran t untuk galat intra-subyek sebagai

pendekatan yang lebih kekar terhadap asumsi kenormalan.

1.3. Kebaruan Penelitian (Novelty)

Dalam penelitian ini dikaji pendekatan kekar terhadap asumsi kenormalan menggunakan sebaran t sebagai alternatif terhadap asumsi kenormalan galat intra-subyek. Penelitian dilakukan melalui kajian sifat-sifat statistika dari penduga model bersama dalam keadaan terjadi pelanggaran asumsi kenormalan galat intra-subyek.

(25)

Penelitian tentang model bersama belum banyak dilakukan, bahkan mungkin belum ada di Indonesia. Untuk respon primer yang berasal dari sebaran keluarga eksponensial, model bersama tidak dapat diimplementasikan secara langsung melalui perangkat lunak yang tersedia. Walaupun pada awalnya penelitian tentang model bersama dikembangkan dalam bidang biomedis, tetap terbuka kemungkinan diaplikasikan pada bidang lain seperti pertanian, peternakan, kehutanan, pendidikan dan sebagainya yang mempunyai permasalahan serupa.

1.4. Sistematika Penulisan Disertasi

Secara keseluruhan disertasi ini dirancang menjadi enam bab. Pendahuluan disajikan dalam Bab 1. Bab 2 berisi tinjauan ulang mengenai analisis data longitudinal dengan pendekatan model linier campuran beserta pendugaan parameternya. Pada Bab 3 dilakukan kajian terhadap pemodelan bersama, meliputi beberapa pendekatan terhadap model bersama, metode pendugaan parameter, pengujian hipotesis serta contoh penerapan terhadap data.

Pendekatan kekar yang diajukan dibahas dalam Bab 4. Pada bab ini dikaji mengenai sebaran peubah ganda t, serta formulasi pemodelan bersama atas dasar sebaran t beserta pendugaan parameternya. Dalam bab ini juga dibahas kajian simulasi ketaknormalan pengaruh acak dan galat intra-subyek, berikut pendekatan kekar atas dasar sebaran t untuk galat intra-subyek.

Selanjutnya pembahasan secara umum dipaparkan dalam Bab 5, sedangkan berbagai temuan dalam penelitian ini disajikan dalam bentuk kesimpulan dan saran pada Bab 6.

(26)

2. ANALISIS DATA LONGITUDINAL

Data longitudinal merupakan salah satu bentuk data berkorelasi. Pada data longitudinal, peubah respon diukur pada beberapa titik waktu untuk setiap subyek. Dalam studi longitudinal dimungkinkan untuk mempelajari perubahan respon antar waktu beserta faktor-faktor yang mempengaruhi perubahan tersebut, baik pada level populasi maupun level individu.

Data longitudinal dicirikan oleh fakta bahwa pengamatan berulang dalam subyek yang sama cenderung berkorelasi (Zeger et al. 1988), sehingga model-model untuk analisis data longitudinal harus mengenali hubungan antara pengamatan berkala dalam subyek yang sama (Laird & Ware 1982). Korelasi antar pengamatan berulang dapat dimodelkan secara eksplisit (melalui pola matriks kovarian), maupun secara implisit (melalui pengaruh acak).

Untuk memodelkan keheterogenan antar subyek, ada dua pendekatan dalam analisis data longitudinal (Zeger et al. 1988). Pertama dengan memodelkan keheterogenan secara eksplisit, dikenal sebagai pendekatan spesifik subyek, misalnya melalui model campuran dimana pengaruh spesifik subyek diasumsikan mengikuti suatu sebaran parametrik tertentu. Untuk data longitudinal kontinu, model linear campuran dari Laird dan Ware (1982) merupakan model yang sering digunakan. Kedua, respon rataan populasi dapat dimodelkan sebagai fungsi dari kovariat tanpa secara eksplisit memperhitungkan keheterogenan dari subyek ke subyek. Pendekatan ini dikenal sebagai model rataan populasi. Dalam pendekatan ini, matriks kovarian dari peubah respon secara langsung dimodelkan melalui struktur kovarian bagi galat intra-subyek. Model spesifik subyek dikenal juga sebagai model bersyarat, sedangkan model rataan populasi sering disebut model marginal (Pinheiro 2006). Perbedaan mendasar dari kedua model di atas adalah model spesifik subyek memungkinkan inferensi terhadap subyek tertentu, sedangkan pada model rataan populasi tidak.

2.1. Model Linear Campuran

Model linier campuran untuk peubah respon kontinu bagi subyek ke-i (i=1,2,...,n) adalah sebagai berikut (Laird & Ware 1982):

n i

i, 1, , i

i i

i X Zb ε 

(27)

Dalam hal ini _i (Y₁, , )

i im i Y

Y adalah vektor peubah respon dari subyek ke-i, n =

total banyaknya subyek, dan mi = banyaknya deret data longitudinal dari subyek ke-i. Adapun Xi dan Zi adalah matriks rancangan masing-masing berdimensi mi x p dan mi x q yang bersesuaian dengan vektor pengaruh tetap (px1) dan vektor pengaruh acak bi(qx1), sedangkan i merupakan vektor galat intra-subyek berdimensi mi x 1.

Pada model di atas, diasumsikan bahwa q vektor pengaruh acak bi menyebar normal ganda dengan nilaitengah 0 dan matriks kovarian D, yakni bi ~ N(0,D). Demikian pula i ~ N(0,Ri), serta bi dan i saling bebas. Hal ini berimplikasi sebaran marginal dari Yi adalah normal dengan nilaitengah E(Yi) = Xi dan matriks kovarian Vi = ZiDZi + Ri. Matriks D dan Ri keduanya merupakan matriks simetrik definit positif.

2.2. Metode Pendugaan Parameter

Metode pendugaan yang umum digunakan untuk menduga parameter dalam model linier campuran adalah metode kemungkinan maksimum (maximum likelihood/ML) atau metode kemungkinan maksimum berkendala (restricted maximum likelihood/REML).

Jika adalah parameter pengaruh tetap, dan adalah parameter kovarian, fungsi kepekatan peluang normal ganda bagi Yi, f(yi| , ) adalah:

)] ( ) ( exp[ ) 2 ( ) , | ( 2 1 2 1

2 _V _y _X _V _y _X

y_i _i _i _i _i1 _i _i

i n

Fungsi kemungkinannya dapat dituliskan sebagai:

i i i

1 i i i i i i i n f

L( , ) ( | , ) (2 ) 2 exp[ ₂1( ) ( )]

2 _V _y _X _V _y _X

Dengan demikian fungsi log-kemungkinannya adalah:

i i i 1 i i i i i n L

l( , ) ln ( , ) ln(2 ) ln ₂1 ( ) ( )

2 1

2 V y X V y X (2.1)

sedangkan n = ni adalah banyaknya amatan dalam gugus data.

Walaupun memungkinkan untuk menduga parameter dan secara simultan dengan memaksimumkan fungsi di atas, banyak algoritma komputasi yang menyederhanakan optimasi dengan cara menyembunyikan (profiling out) parameter dari fungsi log-kemungkinan.

(28)

Dengan asumsi , dan sebagai akibatnya Vi diketahui, maka fungsi log-kemungkinan, l( , ) menjadi fungsi dari saja, yaitu:

q( ) 1₂ (_y_i _X_i )_V_i1(_y _X_i )

Dengan generalized least squares (GLS), penduga bagi dapat diperoleh secara analitik sebagai berikut:

i 1 i i 1 i 1 i

ˆ _X _V _X _X _V _y

i i

i (2.2)

Penduga di atas memiliki sifat statistik yang diinginkan, yakni merupakan penduga tak bias linier terbaik (BLUE) bagi .

Pendugaan parameter kovarian dan pengaruh tetap dengan asumsi tidak diketahui diuraikan sebagai berikut. Pertama untuk menduga dibentuk fungsi profil log-kemungkinan lML( ), yaitu dengan menggantikan parameter dalam persamaan (2.1) dengan penduganya pada persamaan (2.2), yaitu:

i i i i i i n ML

l V ₂1 rV 1r

2 1

2ln(2 ) ln

) (

sedangkan i

1 i i i i 1 i i i i i

i y X X V X XV y

Pada umumnya pemaksimuman lML( ) terhadap merupakan optimasi tak linier, dengan kendala terhadap sedemikian sehingga persyaratan definit positif bagi matriks D dan Riterpenuhi. Nilai dugaan bagi dapat diperoleh dengan cara iterasi sampai konvergen.

Setelah penduga ML bagi diperoleh melalui proses iterasi, nilai ˆ dapat dihitung tanpa iterasi dengan menggunakan persamaan (2.3) dan (2.4) sebagai berikut:

i i i

i Z DZ R

Vˆ ˆ ˆ (2.3)

i 1 i i i i 1 i i

iV X X V y

X ˆ ˆ

(29)

Karena Vi digantikan oleh penduganya Vˆi, maka ˆ pada persamaan (2.4)

dikatakan sebagai penduga tak bias linier terbaik empirik (Empirical Best Linear Unbiased Estimator/EBLUE) bagi .

Ragam bagi ˆ merupakan matriks ragam-peragam berdimensi pxp, yaitu:

)

var( _i1 _i

iV X

Karena tidak mempertimbangkan hilangnya derajat bebas sebagai akibat menduga , maka penduga ML bagi merupakan penduga yang berbias. Untuk mengeliminasi bias ini dikembangkan bentuk alternatif dari metode ML yakni pendugaan REML.

Penduga REML bagi diperoleh berdasarkan optimasi fungsi log-kemungkinan REML sebagai berikut:

i i 1 i i i i i i i i p n REML

l ( ) ( ₂ )ln(2 ) 1₂ lnV ₂1 rV 1r 1₂ lnX V X

Deskripsi dan pembandingan berbagai metode pendugaan dalam model linier campuran dapat dijumpai misalnya dalam Searle et al. 1992.

Nilai prediksi bagi pengaruh acak merupakan nilai harapan bersyarat dari pengaruh acak jika nilai peubah respon diketahui, yang dapat dinyatakan sebagai:

) ˆ ( ˆ ˆ ) | (

ˆ _b _Y _y _D_Z _V 1 _y _X

b_i E _i _i _i _i _i _i _i

Nilai harapan beryarat di atas merupakan prediktor tak bias linear terbaik empiris (Empirical Best Linear Unbiased Predictor/EBLUP) bagi pengaruh acak

bi, karena diperoleh berdasarkan nilai dugaan matriks kovarian Vˆi . Adapun

matriks kovarian bagi prediktor pengaruh acak bˆ_i adalah:

D Z V X X V X X V V Z D

bˆ ) ˆ (ˆ ˆ ( ˆ ) ˆ ) ˆ

( 1 1 1 1 _i _i 1 _i

i i i i i i i i i Var

2.3. Pengujian Hipotesis dan Pembandingan Model Tersarang

Hipotesis dari dua model yang memiliki hubungan tersarang dapat dibuat menjadi suatu formula. Model reference (model penuh) merupakan model yang lebih umum yang mencakup kedua hipotesis (H0 dan Ha), sedangkan model yang hanya mencakup H0 disebut model nested (model tersarang). Model penuh mengandung semua parameter yang diuji sedangkan model tersarang hanya

(30)

mengandung sebagian dari parameter tersebut. Uji yang digunakan untuk membandingkan kedua model tersebut adalah Likelihood Ratio Tests (LRTs). LRTs merupakan suatu uji yang membandingkan nilai fungsi likelihood untuk kedua model dengan persamaan:

-2log(

penuh tersarang

L L

) = -2 log (Ltersarang) – (-2log(Lpenuh))~ _df2 sedangkan:

Ltersarang = nilai fungsi likelihood pada model tersarang Lpenuh = nilai fungsi likelihood pada model penuh

df = selisih banyaknya parameter antara model penuh dan model tersarang LRTs juga dapat digunakan untuk menguji hipotesis parameter acak dan tetap di dalam model. Pengujian parameter tetap dalam model menggunakan pendugaan ML, sedangkan dalam pengujian parameter acak digunakan pendugaan REML. Statistik ujinya adalah selisih (-2 ML/REML log likelihood) antara model penuh dan model tersarang seperti dinyatakan dalam persamaan di atas.

2.4. Penerapan terhadap Data Kasus HIV/AIDS

Data yang digunakan untuk analisis data longitudinal merupakan hasil suatu percobaan klinis untuk membandingkan kemanjuran dan keamanan dua jenis obat antiretroviral dalam menangani pasien-pasien yang gagal atau tidak toleran terhadap terapi zidovudine (AZT). Percobaan melibatkan n = 467 pasien terinfeksi HIV yang terdiagnosa sebagai penderita AIDS atau memiliki jumlah sel CD4+ ≤ 300 per ml3 darah. Pasien dibagi secara acak untuk menerima salah satu dari dua jenis obat, yaitu didanosine (ddI) atau zalzitabine (ddC). Banyaknya sel CD4+ dicatat pada saat terlibat dalam studi (t = 0), dan kunjungan pada bulan ke 2, 6, 12 dan 18, sehingga maks mi = 5. Data ini digunakan oleh Guo dan Carlin (2004) untuk pemodelan bersama data longitudinal dan data daya tahan hidup (waktu sampai terjadinya kematian) dari penderita HIV. Data diambil dari http://www.biostat.umn.edu/~brad/software.html.

Peubah penjelasnya adalah Drug (ddI = 1, ddC = 0), Gender (male = 1, female = -1), PrevOI (AIDS diagnosis at study entry = 1, no AIDS diagnosis = -1), dan Stratum (AZT failure = 1, AZT intolerance = -1).

(31)

Sebelum dimodelkan dengan model linier campuran, terlebih dahulu dilakukan eksplorasi terhadap data. Boxplot banyaknya sel CD4+ pada lima titik waktu pengamatan untuk kedua jenis obat disajikan pada Gambar 2.1. Dari Gambar 2.1 tampak bahwa sebaran banyaknya sel CD4+ sangat menjulur ke kanan dengan banyak pencilan, mengindikasikan perlunya dilakukan transformasi data sebelum analisis berikutnya.

18 12 6 2 0 600 500 400 300 200 100 0 18 12 6 2 0 ddC Obstime C D 4 ddI

Boxplot of CD4

Panel variable: Drug-Type

Gambar 2.1. Boxplot data asal

Transformasi akar dipilih untuk mengurangi kemenjuluran pola sebaran sekaligus untuk menstabilkan ragam, juga karena datanya merupakan data cacahan. Boxplot setelah data ditransformasi dapat dilihat pada Gambar 2.2. Setelah ditransformasi data terlihat lebih homogen serta lebih simetrik.

18 12 6 2 0 25 20 15 10 5 0 18 12 6 2 0 ddC Obstime S q rt (C D 4 ) ddI

Boxplot of Sqrt(CD4)

Panel variable: Drug Type

(32)

Efek pengobatan umumnya tidak sama antar waktu, yaitu memungkinkan adanya interaksi antara jenis obat dengan waktu pengamatan. Pemeriksaan interaksi antara jenis obat dengan waktu pengamatan secara grafis disajikan melalui plot interaksi data hasil transformasi pada Gambar 2.3. Dari Gambar 2.3 dapat dilihat adanya perbedaan pola jumlah sel CD4+ antar waktu untuk kedua jenis obat. Untuk kelompok ddI, terjadi kenaikan jumlah sel CD4+ begitu diberikan obat ddI sampai bulan ke-2, namun turun lagi pada bulan ke-6, naik lagi sedikit pada bulan ke-12, kemudian terus menurun sampai bulan ke-18. Adapun untuk kelompok ddC terjadi penurunan jumlah sel CD4+ sampai bulan ke-6, namun kemudian jumlah sel CD4+ naik terus sampai bulan ke-18. Berdasarkan hasil ini efek interaksi akan dimasukkan dalam pemodelan.

18 12 6 2 0 8,0 7,5 7,0 6,5 6,0 Obstime M e a n ddC ddI Drug-Ty pe

Interaction Plot for Sqrt(CD4)

Data Means

Gambar 2.3. Plot interaksi antara waktu pengamatan dengan jenis obat Data longitudinal hasil transformasi akar banyaknya sel CD4+ dalam submodel-1 selanjutnya dimodelkan sebagai model linier campuran dengan persamaan sebagai berikut:

i ij ij i i i i i ij ij ij m j i Time b b Stratum evOI Gender Drug Time Time w , , 2 , 1 467 , , 2 , 1 , Pr 1 0 51 41 31 21 11 01  

sedangkan b (b₀_i,b₁_i) ~N₂( ,Σ)dan _ij ~N(0, 2)

Pada persamaan di atas, ( ₀₁, ₁₁, ₂₁, ₃₁, ₄₁, ₅₁)merupakan parameter efek tetap, sedangkan b (b0i,b1i)merupakan parameter efek acak untuk pasien

(33)

ke-i. Dalam hal ini b0i merupakan intersep acak untuk subyek ke-i, dan b1i adalah

laju perubahan peubah respon per satuan waktu untuk pasien ke-i. Adapun ij

merupakan galat intra-subyek yang diasumsikan menyebar normal dengan ragam yang sama.

Hasil pemodelan dengan menggunakan model linier campuran disajikan pada Tabel 2.1, sedangkan output SAS disajikan pada Lampiran 1.

Tabel 2.1. Nilai dugaan parameter beserta hasil uji dan SK 95%

Parameter Nilai dugaan

Galat baku

t Nilai-p SK 95%

Intercept (β01) 8.0129 0.3511 22.82 <.0001 7.3230 8.7027

Time (β11) -0.1668 0.02038 -8.19 <.0001 -0.2069 -0.1268

Time x Drug (β21) 0.02998 0.02891 1.04 0.3003 -0.02682 0.08678

Gender (β31) -0.1582 0.3249 -0.49 0.6265 -0.7965 0.4800

PrevOI (β41) -2.3152 0.2382 -9.72 <.0001 -2.7831 -1.8474

Stratum (β51) -0.1309 0.2352 -0.56 0.5780 -0.5929 0.3311

σ2

bo 15.9111 1.1702 13.60 <.0001 13.8453 18.4789

σbo,b1 -0.1300 0.06169 -2.11 0.0350 -0.2509 -0.00913

σ2

b1 0.02854 0.005968 4.78 <.0001 0.01969 0.04509

σ2

3.0716 0.1713 17.93 <.0001 2.7617 3.4370

Berdasarkan Tabel 2.1 dapat dilihat bahwa peubah bebas yang berpengaruh nyata pada banyaknya sel CD4+ penderita HIV adalah obstime dan prevOI dengan nilai-p kurang dari 0.0001. Peubah prevOI yang nyata menunjukkan bahwa penderita yang terdeteksi AIDS pada awal studi memiliki jumlah sel CD4+ lebih rendah dibandingkan yang tidak terdeteksi AIDS, dengan rata-rata perbedaan jumlah sel CD4+ antara pasien yang tidak terdiagnosis AIDS pada awal studi dan yang terdeteksi AIDS sebesar 2.3152. Adapun peubah gender dan stratum tidak nyata pengaruhnya terhadap jumlah sel CD4+ pada α = 5%.

Untuk kelompok obat ddI, nilai dugaan koefisien regresinya untuk Time sebesar -0.1668+ 0.02998 = 0.13682, sedangkan untuk kelompok ddC sebesar -0.1668. Dengan kata lain rata-rata penurunan jumlah sel CD4+ sebesar kelompok ddI sebesar 0.13682 per bulan, sedangkan untuk kelompok ddC sebesar 0.1668 per bulan. Namun perbedaan ini tidak nyata seperti dapat dilihat dari nilai-p sebesar 0.3003.

(34)

Semua komponen ragam pada model ini nyata pada taraf nyata 5%. Dari Tabel 2.1 diperoleh ragam jumlah sel CD4+ antar waktu untuk setiap pasien berkisar antara 2.7617 dan 3.4370 pada taraf kepercayaan 95% dengan nilai dugaan titik sebesar 3.0716. Nilai dugaan bagi ragam intersep sebesar 15.9111, dengan selang kepercayaan 95% yaitu (13.8453, 18.4789), yang berarti ada keragaman jumlah sel CD4+ awal antar pasien sewaktu masuk dalam studi. Ragam slope juga nyata dengan nilai dugaan ragam sebesar 0.02854, artinya laju penurunan jumlah sel CD4+ per bulan bervariasi antar pasien dengan keragaman berkisar antara 0.01969 dan 0.04509. Terdapat korelasi negatif antara intersep dan slope, yang ditunjukkan oleh nilai peragam antara intersep dan slope sebesar -0.13, atau korelasinya sebesar -0.193. Hasil pengujian nyata pada α = 5%, yang berarti penurunan jumlah sel CD4+ antar pasien dipengaruhi oleh jumlah sel CD4+ yang dimiliki sebelumnya (sewaktu masuk dalam studi). Semakin besar jumlah sel CD4+ awal yang dimiliki, semakin rendah laju penurunan jumlah sel CD4+ per bulan. Diagram pencar antara intersep dan slope serta boxplot untuk kedua pengaruh acak tersebut dapat dilihat pada Gambar 2.1.

15 10 5 0 -5 -10 0,6 0,4 0,2 0,0 -0,2 -0,4

intersep

Marginal Plot of slope vs intersep

(35)

3. PEMODELAN BERSAMA (JOINT MODELING)

Pemodelan bersama umumnya digunakan untuk memodelkan hubungan antara proses respon longitudinal dengan data daya tahan hidup, dimana model untuk data daya tahan hidup dan data longitudinal digabung melalui pengaruh acak laten. Literatur yang membahas mengenai hal ini beserta permasalahan dan pengembangannya cukup berlimpah. Namun untuk respon primer yang berupa data kategorik atau data kontinu lainnya, tidak banyak literatur yang membahasnya.

Dalam penelitian ini dikembangkan pemodelan bersama terhadap respon primer yang berupa data kontinu lain atau biner yang berasal dari sebaran keluarga eksponensial, karena adakalanya kepastian waktu terjadinya suatu kejadian bukan merupakan perhatian utama, namun lebih diarahkan pada apakah suatu kejadian terjadi atau tidak (respon biner), atau berupa respon kontinu lainnya. Misalnya bagaimana hubungan antara terjadinya osteopenia (kepadatan massa tulang < persentil-33) pada wanita perimenopause dikaitkan dengan profil longitudinal dari hormon progesteron dalam suatu siklus menstruasi (Li et al. 2004, 2007). Demikian pula bagaimana berat badan ibu sebelum dan selama kehamilan mempengaruhi berat lahir bayi dikoreksi terhadap masa kehamilan (Dunson et al. 2010). Dalam kasus-kasus seperti ini dikembangkan model bersama yang menggabungkan model untuk data longitudinal dengan model linier terampat.

3.1. Beberapa Pendekatan Model Bersama

Tujuan umun dari pemodelan bersama adalah memberikan kerangka bagi pertanyaan ilmiah mengenai hubungan sistematik di antara beberapa hasil (multiple outcomes) beserta faktor-faktor lainnya (perlakuan, dosis, dll) secara formal. Untuk menjamin validitas kesimpulan, model bersama harus mempertimbangkan korelasi yang ada di antara hasil tersebut.

Sejumlah pendekatan terhadap pemodelan bersama, dimana beberapa atau semua hasil berupa data longitudinal telah banyak dibahas. Verbeke dan Davidian (2009) telah memberikan pengantar singkat mengenai perspektif konseptual yang mendasari pendekatan-pendekatan ini.

(36)

Misalkan Y1 dan Y2 adalah dua hasil yang diukur pada sebuah subyek yang akan dimodelkan secara bersama, dimana salah satu atau keduanya dikumpulkan secara longitudinal. Berikut ini akan dijelaskan beberapa pendekatan yang dapat digunakan:

Model Marginal Berganda (Multivariate Marginal Models). Pendekatan ini berusaha menspesifikasi secara langsung fungsi kepekatan bersama f(y1,y2) dari (Y1,Y2). Pendekatan ini memerlukan asumsi mengenai asosiasi marginal di antara elemen-elemen yang diukur secara longitudinal dalam vektor Y1 dan Y2, serta asumsi mengenai sifat alamiah dari asosiasi antara elemen-elemen Y1 dan Y2. Khususnya jika Y1 dan Y2 berbeda tipe (misalnya kontinu dan diskret, kontinu dan survival) dan/atau banyak data tak lengkap, pendekatan ini menjadi tidak praktis. Terlebih lagi perluasan menjadi lebih dari dua dimensi akan memerlukan asumsi terhadap struktur matriks kovarian yang lebih besar dan asosiasi ordo tinggi.

Model Bersyarat (Conditional Models). Salah satu cara untuk menghindari spesifikasi langsung dari sebaran bersama bagi (Y1,Y2) adalah dengan cara faktorisasi fungsi kepekatan bersama sebagai hasil kali fungsi kepekatan marginal dan bersyarat sebagai berikut:

f(y1,y2) = f(y1|y2)f(y2) = f(y2|y1)f(y1)

Model Berbagi Parameter (Shared Parameter Models). Pendekatan ini merupakan pendekatan yang paling populer, dengan berdasarkan ide bahwa pengaruh acak dapat digunakan untk membangkitkan struktur asosiasi bagi model longitudinal peubah ganda, seperti halnya antar pengukuran berulang dalam suatu hasil spesifik.

Misalkan b adalah vektor pengaruh acak yang dimiliki bersama oleh model bagi Y1 dan Y2, yang diasumsikan saling bebas dengan bersyarat pada b. Maka fungsi kepekatan bersama bagi (Y1,Y2) dapat dinyatakan sebagai:

b b b y b y b b b y , y y

y f f d f f f d

f( ₁ ₂) ( ₁ ₂| ) ( ) ( ₁| ) ( ₂| ) ( ) _(3.1) Dalam hal ini, f(b) adalah fungsi kepekatan peluang dari pengaruh acak, yang umumnya diasumsikan normal. Pengaruh acak b adalah parameter bersama yang

(37)

menginduksi korelasi antara Y1 dan Y2 melalui ketergantungan bersama terhadap

b. Jika b diketahui, Y1 dan Y2 saling bebas, dapat diinterpretasikan sebagai refleksi kepercayaan bahwa segugus karakteristik dasar yang sama dari individu berpengaruh atas kedua proses hasil.

Keuntungan dari pendekatan ini adalah Y1 dan Y2 tidak harus bertipe sama. Demikian pula parameter dalam model bersama mempunyai interpretasi yang sama seperti dalam masing-masing model peubah tunggalnya. Perluasan lebih dari dua hasil juga dapat dilakukan secara langsung, karena dimensi dari integral dalam persamaan (3.1) tidak meningkat, tidak menambah beban komputasi.

Model Pengaruh Acak (Random Effect Models). Kelemahan dari Model Berbagi Parameter adalah model ini dapat berimplikasi asumsi yang sangat kuat mengenai asosiasi antar hasil yang dimodelkan, suatu fenomena yang khususnya terlihat jelas bila Y1 dan Y2 keduanya pengukuran longitudinal dari dua hasil. Hal ini memotivasi munculnya Model Pengaruh Acak Bersama (Joint Random-Effects Models) yang lebih fleksibel terhadap pola korelasi antara kedua hasil, walaupun kompleksitas model menjadi lebih besar. Dalam model pengaruh acak bersama, model bagi Y1 dan Y2 diperbolehkan bergantung pada pengaruh acak yang berbeda, b1 dan b2, yang keduanya berkorelasi.

Vektor pengaruh acak b = (b1,b2) diasumsikan saling bebas dengan galat intra-subyek dari kedua model, menyebar normal ganda dengan nilaitengah vektor nol dan matriks ragam-peragam G. Unsur di luar diagonal matriks G, yaitu G12 yang tidak nol menentukan struktur asosiasi antar hasil, yaitu Cor(b1,b2) =

) ( ) (

/ ₁ ₂

12 Varb Var b

G . Model Berbagi Parameter merupakan kasus khusus dari Model Pengaruh Acak dengan membatasi korelasi antara b1 dan b2 sama dengan 1.

Metode-metode Berdasarkan Pereduksian Dimensi. Dalam kasus-kasus lebih dari dua hasil yang akan dimodelkan secara simultan, beberapa dari pendekatan di atas tidak layak; mencakup kesulitan numerik; atau dilandasi asumsi yang sangat ekstrim, seringkali tidak realistis mengenai struktur hubungan antar hasil. Karenanya beberapa metode diajukan berdasarkan pereduksian dimensi. Ide umumnya adalah menggunakan analisis faktor atau analisis komponen utama untuk mereduksi dimensi vektor respon, kemudian faktor utamanya dianalisis

(38)

lebih lanjut menggunakan model-model longitudinal yang klasik. Kelemahan dari pendekatan semacam ini adalah keterbatasan kesimpulan terhadap faktor utama saja, tidak membolehkan kesimpulan mengenai aspek-aspek peubah asal. Selain itu teknik ini tidak dapat diterapkan terhadap kasus pengukuran berulang dengan banyak data tak lengkap, atau pengamatan-pengamatan dilakukan pada waktu yang berbeda-beda antar subyek.

3.2. Pendugaan Parameter

Atas dasar Model Berbagi Parameter, beberapa metode pendugaan parameter model bersama diajukan oleh beberapa penulis, sekaligus pembandingan sifat-sifat statistikanya. Dengan memandang sebagai masalah galat pengukuran, untuk mereduksi bias Wang et al. (2000) mengajukan beberapa metode pendugaan yaitu kalibrasi regresi (RC), pseudo-expected estimating equation, dan refined RC. Tanpa mengaitkan dengan masalah pengukuran, Zhang dan Lin (1999) melakukan studi simulasi pembandingan performa lima prosedur pendugaan, yakni pendugaan dua tahap, Best Linear Unbiased Predictor (BLUP), kuasi-kemungkinan (quasi-likelihood), kemungkinan bersyarat, dan kemungkinan maksimum. Dalam literatur tentang galat pengukuran, penduga dua tahap dapat dipandang sebagai penduga naive , sedangkan penduga BLUP dapat dipandang sebagai penduga kalibrasi regresi. Akhir-akhir ini banyak juga diterapkan metode pendugaan Bayes untuk model bersama, misalnya oleh Guo dan Carlin (2004), Horrocks dan Heuvel (2009), serta Ryu et al. (2009).

3.3. Model Dasar bagi Model Bersama

Model bersama yang diuraikan di sini adalah Model Berbagi Parameter yang mengasumsikan bahwa proses longitudinal dan proses respon primer diinduksi oleh pengaruh acak bi yang sama. Untuk model dasar ini, diasumsikan pengaruh acak dan galat intra-subyek keduanya menyebar normal.

Misalkan Yi adalah peubah respon dari subyek ke-i, i = 1,2,…,n pada model regresi primer, Zi adalah vektor kovariat berdimensi px1, dan Wi (Wi1,,Wimi)

(39)

menjadi perhatian adalah pemodelan pengaruh kovariat Zi dan trajektori dari kovariat longitudinal Wi terhadap peubah respon Yi.

Diasumsikan Wij mengikuti model pengaruh acak sebagai berikut (Laird dan Ware 1982):

ij i ' ij ij

W X b

sedangkan Xij adalah vektor kovariat berdimensi qx1, bi adalah vektor pengaruh acak yang menyebar N( , ), dan ij adalah galat intra-subyek yang menyebar N(0,

2_{). Jika}_X_{ij = (1, tij) , komponen b0i}_{dan b1i dari}_b_{i dapat diinterpretasikan}

sebagai nilai baseline dan laju perubahan X terhadap Y bagi subyek ke-i (Zhang dan Lin 1999).

Sebaran bersyarat Yi|bi diasumsikan berasal dari sebaran keluarga eksponen (McCullagh dan Nelder 1989) dengan nilaitengah E(Yi|bi) = i dan ragam

) ( )

(Y_i _i a_i1 _i

Var b , dimana adalah parameter dispersi, ai merupakan pembobot prior, dan (.) adalah fungsi ragam. Pengaruh dari (Wi, Zi) terhadap Yi dimodelkan melalui (bi, Zi) menggunakan model linier terampat:

2 i 1 i 0

)

( _i Z b

g (3.2)

sedangkan g(.) adalah fungsi hubung. Lebih lanjut diasumsikan bahwa Yi dan Wi bebas bersyarat terhadap bi. Dalam hal ini inferensi terutama ditujukan terhadap parameter regresi = ( 0, 1, 2).

Sebaran bersyarat dari Yi|Wi mengikuti model linier campuran terampat (Breslow dan Clayton 1993), yakni:

i i

g( ) ₀ Z_i ₁ bˆ_i ₂ a

dimana a_i ~ N(0, ₂A_i ₂), sedangkan 1 i 2 1

i) ( )

(a W Σ X X

Ai Var i i . Karena

koefisien regresi 2 ada dalam pengaruh tetap maupun komponen ragam, maka

metode-metode pendugaan yang dikembangkan untuk model linier campuran terampat, misalnya metode Penalized Quasi Likelihood (PQL) dari Breslow dan Clayton (1993) tidak dapat diterapkan secara langsung (Zhang & Lin 1999).

Berdasarkan Model Berbagi Parameter, hubungan antara Wi dan Yi dimodelkan melalui fungsi kepekatan bersama f(wi,yi). Dengan asumsi Yi|bi dan

(40)

(3.3)

Misalkan ( ,Σ, 2). Fungsi kemungkinan dan log-kemungkinan bagi = ( , ) adalah:

(3.4) dan

(3.5)

Untuk peubah kontinu yang menyebar normal, maka g(.) merupakan fungsi hubung identitas, sehingga i 0 Zi 1 bi 2 atau Yi 0 Zi 1 bi 2 i. Jika i

~ N(0, 2), maka bersyarat pada bi, Yi akan menyebar normal dengan nilaitengah

2 i 1 i 0 i) |

(Y_i b Z b

E dan ragam Var(Yi|bi) 2.

Dengan demikian secara lengkap fungsi log-kemungkinan bagi = ( , ) dapat dituliskan sebagai:

i i i i ij m j n i i d y w g lo y l i b b b b Z X w Θ } ) ( ) ( exp 2 1 ) ( exp 2 1 ) ( exp 2 1 { ) , | ( 1 2 1 2 2 i 1 i 0 2 1 2 ij 2 1 1 1 i 1 2 2 2 (3.6)

Selanjutnya penduga parameter joint model dapat diperoleh dengan memaksimumkan fungsi log-kemungkinan di atas terhadap parameter = ( , ). Bentuk fungsi log-kemungkinan di atas memerlukan teknik integrasi numerik, yang umum digunakan misalnya Gaussian Quadrature atau Monte Carlo (Song et al. 2002; Henderson et al. 2000). Rizopoulos et al. (2009) menggunakan menggunakan pendekatan Fully Exponential Laplace (FELA) untuk mengatasi beban komputasi akibat membesarnya dimensi integrasi dengan semakin besarnya

i i i i i m j i i i i i i i i i i i d f y f w f d f y f f d f y f d y f y f i b b b b b b b b w b b b w b b w w ) ( ) | ( ) | ( ) ( ) | ( ) | ( ) ( ) | , ( ) , , ( ) , ( ij 1 i i i i i i n i m j i i i i i i n i m j i i i i i i i i d f y f w f y d f y f w f y L 1 1 ij i 1 1 ij i ) ( ) | ( ) | ( log ) , | ( ) ( ) | ( ) | ( ) , | ( b b b b w Θ b b b b w Θ l

(41)

dimensi pengaruh acak. Algoritma EM juga sering dijadikan pilihan untuk memaksimumkan pendekatan fungsi log-kemungkinan, dimana pengaruh acak diperlakukan sebagai data hilang, misalnya dapat dijumpai dalam Li (2007) atau Li (2009). Pemaksimuman secara langsung terhadap fungsi log-kemungkinan, misalnya algoritma quasi-Newton seringkali memerlukan komputasi yang mirip dengan algoritma EM, sehingga pendekatan optimisasi hibrid yang dimulai dengan algoritma EM dilanjutkan dengan pemaksimuman langsung dapat digunakan dengan lebih mudah.

3.4.Penerapan pada Data Kasus HIV/AIDS

Sebagai aplikasi model, akan dilakukan pemodelan bersama data longitudinal (submodel-1) sebagai peubah penjelas beserta kovariat lainnya dan data biner sebagai peubah respon primer (submodel-2). Data longitudinal dimodelkan sebagai model linier campuran, sedangkan data biner dimodelkan dengan model linier terampat. Kedua model tersebut dihubungkan melalui pengaruh acak yang sama.

3.4.1. Deskripsi Data

Data yang digunakan merupakan hasil suatu percobaan klinis untuk membandingkan kemanjuran dan keamanan dua jenis obat antiretroviral dalam menangani pasien-pasien yang gagal atau tidak toleran terhadap terapi zidovudine (AZT). Percobaan melibatkan n = 467 pasien terinfeksi HIV yang terdiagnosa sebagai penderita AIDS atau memiliki jumlah sel CD4+ ≤ 300 per ml3 darah. Pasien dibagi secara acak untuk menerima salah satu dari dua jenis obat, yaitu didanosine (ddI) atau zalzitabine (ddC). Banyaknya sel CD4+ dicatat pada saat terlibat dalam studi (t = 0), dan kunjungan pada bulan ke 2, 6, 12 dan 18, sehingga maks mi = 5. Data ini juga digunakan oleh Guo dan Carlin (2004) untuk pemodelan bersama data longitudinal dan data daya tahan hidup (waktu sampai terjadinya kematian) dari penderita HIV. Karena data longitudinal sangat menjulur ke kanan, dilakukan transformasi data sebelum analisis berikutnya. Transformasi akar dipilih untuk mengurangi kemenjuluran pola sebaran sekaligus untuk CD4+ menstabilkan ragam, juga karena datanya merupakan data cacahan.

(42)

Peubah respon biner pada submodel-2 adalah terjadinya kematian pasien pada saat penelitian (Death = 1, NoDeath = 0), sedangkan peubah penjelasnya adalah Drug (ddI = 1, ddC = 0), Gender (male = 1, female = -1), PrevOI (AIDS diagnosis at study entry = 1, no AIDS diagnosis = -1), dan Stratum (AZT failure = 1, AZT intolerance = -1). Untuk submodel-1, sebagai peubah responnya adalah banyaknya sel CD4+ pada t = 0, 2, 6, 12, dan 18 bulan, sedangkan peubah penjelasnya sama dengan di atas ditambah pengaruh waktu.

Ukuran contoh pada kelima titik waktu menurun dengan cepat berkaitan dengan terjadinya kematian, drop-out, atau ketidakhadiran pada saat kunjungan. Penurunan drastis jumlah pasien terjadi pada bulan ke-18. Pada Gambar 3.1 disajikan jumlah pasien pada lima titik waktu untuk pasien penerima kedua jenis obat.

Gambar 3.1. Banyaknya pasien pada lima titik waktu pengamatan

3.4.2. Pemodelan

Data longitudinal hasil transformasi akar banyaknya sel CD4+ dalam submodel-1 selanjutnya dimodelkan sebagai model linier campuran dengan persamaan sebagai berikut:

i ij ij i i i i i ij ij ij m j i Time b b Stratum evOI Gender Drug Time Time w , , 2 , 1 467 , , 2 , 1 , Pr 1 0 51 41 31 21 11 01   0 50 100 150 200 250

0 2 6 12 18

237 186 157 123 15 230 182 153 103 22 Ju m lah p asi e n

Waktu pengamatan (bulan)

ddC

(43)

sedangkan b (b₀_i,b₁_i) ~N₂( ,Σ)dan _ij ~N(0, 2)

Pada persamaan di atas, ( ₀₁, ₁₁, ₂₁, ₃₁, ₄₁, ₅₁) merupakan parameter efek tetap, sedangkan b (b0i,b1i)merupakan parameter efek acak untuk pasien

ke-i. Dalam hal ini b0i merupakan intersep acak untuk subyek ke-i, dan b1i adalah

laju perubahan peubah respon per satuan waktu untuk pasien ke-i. Adapun _ij merupakan galat intra-subyek yang diasumsikan menyebar normal dengan ragam yang sama.

Selanjutnya peubah respon primer terjadi atau tidak terjadinya kematian dalam masa studi untuk pasien ke-i dalam submodel-2 dimodelkan sebagai model linier terampat untuk respon biner (regresi logistik) dengan persamaan berikut:

) Pr exp( 1 ) Pr exp( ) | 1 ( 1 2 0 1 42 32 22 12 02 1 2 0 1 42 32 22 12 02 i i i i i i i i i i i b b Stratum evOI Gender Drug b b Stratum evOI Gender Drug y P b

Pada persamaan di atas, 1 dan 2 merupakan koefisien yang menghubungkan kovariat longitudinal banyaknya sel CD4+ dengan peubah respon primer biner.

Yang menjadi perhatian utama dalam pemodelan bersama adalah apakah hasil pengukuran longitudinal berhubungan dengan peubah respon primer yang menjadi perhatian. Dalam pemodelan bersama, adanya hubungan tersebut ditunjukkan oleh hasil uji terhadap parameter 1 dan 2 dalam submodel-2.

Hasil pemodelan bersama antara submodel-1 dan submodel-2 disajikan pada Tabel 3.1. Pada Tabel 3.1 terlihat bahwa kedua parameter 1 dan 2 berbeda nyata dengan nol pada α = 5%, artinya baik jumlah sel CD4+ awal dari pasien (pada saat masuk dalam studi) maupun laju perubahannya per satuan waktu berpengaruh terhadap peluang kematian pasien. Nilai dugaan untuk 1 sebesar -0.2726 dengan selang kepercayaan 95% sebesar (-0.3624, -0.1828). Tanda negatif menunjukkan semakin banyak jumlah sel CD4+ awal dari pasien maka peluang terjadinya kematian pada pasien semakin rendah, dan sebaliknya. Adapun nilai dugaan bagi parameter 2 sebesar 3.9857 dengan selang kepercayaan 95% sebesar (7.2904, -0.6810), yang mengindikasikan bahwa semakin besar laju penurunan jumlah sel CD4+ pasien per bulan, maka peluang kematian pasien akan semakin tinggi.

(44)

Tabel 3.1. Nilai dugaan parameter model bersama beserta hasil uji dan SK 95%

Parameter Nilai Dugaan

Galat Baku

t Nilai-p SK 95%

Submodel-1

Intercept (β01) 8.0164 0.3520 22.77 <.0001 7.3246 8.7082

Time (β11) -0.1880 0.02163 -8.69 <.0001 -0.2305 -0.1455

Time x Drug (β21) 0.01981 0.02929 0.68 0.4991 -0.03774 0.07736

Gender (β31) -0.1367 0.3263 -0.42 0.6756 -0.7779 0.5046

PrevOI (β41) -2.3410 0.2397 -9.77 <.0001 -2.8119 -1.8700

Stratum (β51) -0.1349 0.2365 -0.57 0.5686 -0.5996 0.3297

σ2

bo 15.8739 1.1669 13.60 <.0001 13.5809 18.1670

σbo,b1 -0.09188 0.06193 -1.48 0.1386 -0.2136 0.02982

σ2

b1 0.02913 0.005972 4.88 <.0001 0.01739 0.04086

σ2

3.0501 0.1691 18.04 <.0001 2.7178 3.3823

Submodel-2

Intercept (β02) -1.0535 0.2829 -3.72 0.0002 -1.6094 -0.4975

Drug (β12) 0.4914 0.2377 2.07 0.0393 0.02421 0.9586

Gender (β22) -0.1625 0.2182 -0.74 0.4569 -0.5913 0.2663

PrevOI (β32) 0.9807 0.1845 5.32 <.0001 0.6182 1.3432

Stratum (β42) 0.1996 0.1446 1.38 0.1680 -0.08448 0.4838

1 -0.2726 0.04571 -5.96 <.0001 -0.3624 -0.1828 2 -3.9857 1.6817 -2.37 0.0182 -7.2904 -0.6810

Peubah bebas yang berpengaruh nyata pada α = 5% pada submodel-1 adalah Time dan PrevOI dengan koefisien bertanda negatif, artinya banyaknya sel CD4+ makin menurun seiring bertambahnya waktu, dan pasien yang pada saat masuk dalam studi sudah teridentifikasi sebagai penderita HIV rata-rata jumlah sel CD4+-nya lebih rendah dibandingkan yang tidak terdignosis AIDS. Walaupun secara grafis terlihat ada interaksi antara jenis obat dan waktu pengamatan, namun setelah diuji interaksi tersebut tidak nyata. Untuk kelompok obat ddI, nilai dugaan koefien regresinya untuk Time sebesar -0.1880 + 0.01981 = -0.16819 yang tidak berbeda nyata dengan kelompok ddC yaitu sebesar -0.1880. Peubah jenis kelamin (Gender) dan Stratum juga tidak nyata pengaruhnya terhadap respon, artinya tidak ada perbedaan rata-rata jumlah sel CD4+ antara pasien lelaki dan perempuan, demikian pula tidak ada perbedaan antara pasien yang gagal dan tidak toleran terhadap terapi zidovudine (AZT) dalam rata-rata jumlah sel CD4+-nya.

(1)

Tabel 3.1. Nilai dugaan parameter model bersama beserta hasil uji dan SK 95%

Parameter Nilai

Dugaan

Galat Baku

t Nilai-p SK 95%

Submodel-1

Intercept (β01) 8.0164 0.3520 22.77 <.0001 7.3246 8.7082

Time (β11) -0.1880 0.02163 -8.69 <.0001 -0.2305 -0.1455

Time x Drug (β21) 0.01981 0.02929 0.68 0.4991 -0.03774 0.07736

Gender (β31) -0.1367 0.3263 -0.42 0.6756 -0.7779 0.5046

PrevOI (β41) -2.3410 0.2397 -9.77 <.0001 -2.8119 -1.8700

Stratum (β51) -0.1349 0.2365 -0.57 0.5686 -0.5996 0.3297

σ2

bo 15.8739 1.1669 13.60 <.0001 13.5809 18.1670 σbo,b1 -0.09188 0.06193 -1.48 0.1386 -0.2136 0.02982

σ2

b1 0.02913 0.005972 4.88 <.0001 0.01739 0.04086 σ2

3.0501 0.1691 18.04 <.0001 2.7178 3.3823

Submodel-2

Intercept (β02) -1.0535 0.2829 -3.72 0.0002 -1.6094 -0.4975

Drug (β12) 0.4914 0.2377 2.07 0.0393 0.02421 0.9586

Gender (β22) -0.1625 0.2182 -0.74 0.4569 -0.5913 0.2663

PrevOI (β32) 0.9807 0.1845 5.32 <.0001 0.6182 1.3432

Stratum (β42) 0.1996 0.1446 1.38 0.1680 -0.08448 0.4838

1 -0.2726 0.04571 -5.96 <.0001 -0.3624 -0.1828

2 -3.9857 1.6817 -2.37 0.0182 -7.2904 -0.6810

(2)

Ragam intersep yang nyata pada α = 5% dengan nilai dugaan ragam sebesar 15.8739 menunjukkan adanya keragaman jumlah sel CD4+ antar pasien sewaktu masuk dalam studi, dengan keragaman berkisar antara 13.5809 - 18.1670 pada taraf kepercayaan 95%. Ragam slope juga nyata dengan nilai dugaan sebesar 0.02913, artinya laju penurunan jumlah sel CD4+ per bulan bervariasi antar pasien dengan keragaman berkisar 0.01739 - 0.04086 pada taraf kepercayaan 95% . Terdapat korelasi negatif antara intersep dan slope, yang ditunjukkan oleh nilai koragam antara intersep dan slope sebesar -0.0918, dengan kata lain korelasinya sebesar r = -0.315. Namun hasil pengujian tidak nyata pada α = 5%, yang berarti penurunan jumlah sel CD4+ antar pasien tidak dipengaruhi oleh jumlah sel CD4+ yang dimiliki sebelumnya (sewaktu masuk dalam studi). Selain itu diperoleh ragam jumlah sel CD4+ antar waktu untuk setiap pasien sebesar berkisar antara 2.7178 - 3.3823 pada taraf kepercayaan 95%. Nilai dugaan titik untuk keragaman dalam pasien tersebut sebesar 3.0501.

Peubah bebas yang berpengaruh nyata pada α = 5% terhadap respon primer terjadi atau tidak terjadinya kematian pasien pada submodel-2 adalah Drug dan PrevOI, sedangkan peubah Gender dan Stratum tidak nyata. Nilai dugaan untuk koefisien Drug sebesar 0.4914 dengan selang kepercayaan 95% yaitu (0.0242, 0.9586). Nilai positif ini menunjukkan bahwa peluang kematian pasien yang menggunakan obat ddI lebih tinggi dibandingkan pasien yang menerima obat ddC. Nilai dugaan parameter PrevOI sebesar 0.9807 dan selang kepercayaan 95%-nya (0.6182, 1.3432). Tanda positif menunjukkan pasien yang terdiagnosis AIDS pada awal studi mempunyai peluang kematian yang lebih tinggi dibandingkan yang tidak terdiagnosis AIDS. Adapun jenis kelamin (Lelaki vs Perempuan) dan status AZT (gagal vs tidak toleran) tidak mempengaruhi peluang terjadinya kematian pasien.

Karena submodel-2 merupakan model regresi logistik, maka untuk interpretasinya akan lebih informatif jika menggunakan rasio odds. Nilai dugaan rasio odds untuk Drug sebesar exp(0.4914) = 1.635 dengan selang kepercayaan 95% yaitu (1.026, 2.065), artinya dalam populasi kematian pasien terjadi antara 1.026 - 2.065 kali lebih sering di antara penerima obat ddI dibandingkan ddC. Demikian pula nilai dugaan rasio odds untuk PrevOI sebesar exp(0.9807) = 2.666

(3)

dengan selang kepercayaan 95% yaitu (1.857, 3.828), dengan kata lain pasien yang terdiagnosis AIDS pada awal studi memiliki resiko kematian antara 1.857 - 3.828 kali dibandingkan pasien yang tidak terdiagnosis AIDS.

(4)

DAFTAR PUSTAKA

Bigelow JL, Dunson DB. 2009. Bayesian semiparametric joint models for functional predictors. J Amer Statist Assoc. 104 (485):26-36.

Breslow NE, Clayton DG. 1993. Approximate inference in generalized linear mixed model. J Amer Statist Assoc. 88:9-25.

Dunson DB, Herring A, Siega-Riz AM. 2010. Semiparametric Bayes joint modeling with functional predictors. Working Paper. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.69.495&rep=rep1 &type=pdf [29-03-2010].

Henderson R, Diggle P, Dobson A. 2000. Joint modelling of longitudinal measurement and event time data. Biostatistics 1(4):465-480.

Guo X, Carlin BP. 2004. Separate and joint modeling of longitudinal and event time data using standard computer packages. Am Statist 58(1):1-9.

Horrocks J, Heuvel MJ van Den. 2009. Prediction of pregnancy: a joint model for longitudinal and binary data. Bayesian Analysis 4(3):523-538.

Hsieh F, Tseng YK, Wang JL. 2006. Joint modeling of survival and longitudinal data: likelihood approach revisited. Biometrics 62(4):1037-1043.

Huang X, Stefanski LA, Davidian M. 2006. Latent-model robustness in structural measurement error models. Biometrika 93: 53-64.

Huang X, Stefanski LA, Davidian M. 2009. Latent-model robustness in joint models for a primary endpoint and a longitudinal process. Biometrics 65(3): 719-727.

Kotz S, Nadarajah S. 2004. Multivariate t Distributions and Their Applications. New York: Cambridge University Press.

Laird NM, Ware JH. 1982. Random effects models for longitudinal data.

Biometrics 38:936-974.

Lange KL, Little RJA, Taylor JMG. 1989. Robust statistical modeling using the t

distribution. J Amer Statist Assoc. 84(408):881-896.

Li E, Zhang D, Davidian M. 2004. Conditional estimation for generalized linear model when covariates are subject-specific parameters in a mixed model for longitudinal measurement. Biometrics 60:1-7.

Li E, Wang N, Davidian M. 2007a. Joint models for a primary endpoint and multiple longitudinal covariate processes. Biometrics 63:1068-1078.

(5)

Li E, Wang N, Davidian M. 2007b. Likelihood and pseudo-likelihood methods for semiparametric joint model for a primary endpoint and longitudinal data.

Computational Statistics and Data Analysis 51:5776-5790.

Li N, Elashoff RM, Li G. 2009. Robust joint model of longitudinal measurements and competing risks failure time data. Biometrics 63(1):19-30.

Li TI. 2008. Longitudinal data analysis using t linear mixed models with autoregressive dependence structures. Journal of Data Science 6:333-355. Lindstorm MJ, Bates DM. 1990. Nonlinier mixed-effects models for repeated

measures data. Biometrics 46:673-687.

McCullagh P, Nelder JA. 1989. Generalized Linear Models, 2nd ed. London: Chapman and Hall.

McCulloch CE, Searle SR. 2001. Generalized, Linear and Mixed Model. New York. John Wiley and Sons.

Nadarajah S, Kotz S. 2008. Estimation methods for the multivariate t distribution.

Acta Appl Math 102:99-118.

Pinheiro JC, Liu CH, Wu YN. 2001. Efficient algorithms for robust estimation in linear mixed-effects models using the multivariate t distribution. Journal of Computational and Graphical Statistics 10:249-276.

Pinheiro JC. 2006. Conditional versus marginal covariance representation for linear and nonlinear models. Aust J Statist, 35(1):31-44.

Rizopoulos D, Verbeke G, Molenberghs G. 2008. Shared parameter models under random-effects misspecification. Biometrika 95:63-74.

Rizopoulos D, Verbeke G, Lesaffre E. 2009. Fully exponential Laplace approximations for the joint modelling of survival and longitudinal data. J R Statist Soc (B) 71(3):637-654.

Song PXK, Zhang P, Qu A. 2007. Maximum likelihood inference in robust linear mixed-effects models using multivariate t distribution. Statistica Sinica

17:929-943.

Song X, Davidian M, Tsiatis AA. 2002. A semiparametric likelihood approach to joint modeling of longitudinal and time-to-event data. Biometrics 58:742-753.

Song X, Wang CY. 2008. Semiparametric approaches for joint modeling of longitudinal and survival data with time-varying coefficients. Biometrics

(6)

Tsiatis AA, Davidian M. 2001. A semiparametric estimator for the proportional hazards model with longitudinal covariates measured with error. Biometrika

88(2):447-458.

Tsiatis AA, Davidian M. 2004. Joint modeling of longitudinal and time-to-event data: an overview. Statistica Sinica 14:809-834.

Verbeke G, Molenberghs G. 2000. Linear Mixed Models for Longitudinal Data. New York: Springer.

Verbeke G, Davidian M. 2009. Joint Models for Longitudinal Data: Introduction and Overview. Di dalam: Fitzmaurice G, Davidian M, Verbeke G, Molenberghs G, editor. Longitudinal Data Analysis. Boca Raton: CRC Pr. Hlm 319-326.

Wang CY, Wang N, Wang S. 2000. Regression analysis when covariates are regression parameters of a random effects model. Biometrics 56:487-495. Wang WL, Fan TH. 2010. Estimation in multivariate t linear mixed models for

multiple longitudinal data. Manuscript ID SS-09-306RI. http://www.stat.sinica.edu.tw/statistica/ [29-03-2011].

West BT, Welch KB, Galecki AT.2007. Linear Mixed Models: A Practical Guide Using Statistical Software. New York: Chapman & Hall.

Wu L, Hu XJ, Wu H. 2008. Joint inference for nonlinear mixed-effects models and time to event at the presence of missing data. Biostatistics 9(2):308-320. Zeger SL, Liang KY, Albert PS. 1986. Models for longitudinal data: a generalized

estimating equation approach. Biometrics 44(4):1049-1060.

Zhang D, Lin X. 1999. Generalized linear models with longitudinal covariates. Unpublish manuscript.

A robust approach for joint models based on t distribution

PENDEKATAN

KEKAR UNTUK MODEL BERSAMA

(

JOINT MODEL

) ATAS DASAR SEBARAN

t

INDAHWATI

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

BOGOR

2012

PERNYATAAN MENGENAI DISERTASI DAN

SUMBER INFORMASI

ABSTRACT

RINGKASAN

@Hak Cipta Milik Institut Pertanian Bogor (IPB), tahun 2012

Hak Cipta Dilindungi Undang-undang

PENDEKATAN

KEKAR UNTUK MODEL BERSAMA

(

JOINT MODEL

) ATAS DASAR SEBARAN

t

INDAHWATI

Disertasi

Sebagai salah satu syarat untuk memperoleh gelar Doktor

pada Program Studi Statistika

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

PRAKATA

RIWAYAT HIDUP

DAFTAR ISI

DAFTAR TABEL

DAFTAR GAMBAR

DAFTAR LAMPIRAN

Parts

Dokumen yang terkait

A robust approach for joint models based on t distribution

A Robust Range Accuracy Adaptation Criterion Based on Ziv-Zakai Lower Bound for Cognitive Positioning System

A Network Model for Spare Parts Distribution Based on Customer Segmentation and Demand Characteristics

Electricity Distribution Network For Low And Medium Voltages Based On Evolutionary Approach Optimization.

Comparative Study of EMG based Joint Torque Estimation ANN Models for Arm Rehabilitation Device.

A set english speaking materials based on task-based approach for english tutorial student.

Angular Distribution Models for Top of A

A robust obstacle avoidance for service robot using Bayesian approach

A SET OF ENGLISH SPEAKING MATERIALS BASED ON TASK-BASED APPROACH FOR ENGLISH TUTORIAL STUDENTS

FUZZY TRACKING CONTROL BASED ON ROBUST PERFORMANCE OF A QUADROTOR

Dokumen yang Anda mencari sudah siap untuk unduhkan

_{) ATAS DASAR SEBARAN}

_{) ATAS DASAR SEBARAN}