T1 662011009 Full text

BAYESIAN SURVIVAL ANALYSIS UNTUK MENGESTIMASI PARAMETER

MODEL KETAHANAN HIDUP PASIEN PENDERITA
JANTUNG KORONER
THE USE OF BAYESIAN SURVIVAL ANALYSIS TO ESTIMATE
PARAMETERS OF SURVIVAL MODEL FOR CORONARY HEART
DISEASE’S PATIENTS
Oleh:
A. DEWI LUKITASARI
662011009
TUGAS AKHIR
Diajukan kepada Program Studi Matematika, Fakultas Sains dan Matematika,
guna memenuhi sebagian dari persyaratan untuk memperoleh Gelar Sarjana Sains
(Matematika)

PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS KRISTEN SATYA WACANA
SALATIGA
2015


i

ii

iii

iv

MOTTO

“Do your best and lets God do the rest”
(Anonim)

“FULL TILT!”
(James Gwee)

“It doesn’t matter how hard the obstacles are, you must finish what you started”
(Vivi Adeliana)

PERSEMBAHAN

Tuhan Yesus Kristus
Keluarga

v

KATA PENGANTAR
Puji dan syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa karena atas
berkatnya yang melimpah penulis dapat menyelesaikan skripsi ini tepat waktu.
Penulis menyadari, penulisan skripsi ini tidak lepas dari bantuan dan dukungan dari
berbagai pihak. Oleh karena itu penulis ingin menyampaikan ucapan terima kasih
kepada :
1. Dr. Adi Setiawan, M.Sc selaku pembimbing I atas bimbingan, motivasi dan
kesabarannya dalam membimbing agar segera menyelesaikan skripsi ini.
2. Leopoldus Ricky Sasongko, M.Si sebagai pembimbing II untuk bimbingan
dan koreksi yang diberikan dalam penyusunan skripsi ini.
3. Dosen pengajar, Dr. Bambang Susanto,MS, Dr. Hanna Arini Parhusip, Dra.
Lilik Linawati, M.Kom, Dr. Didit Budi Nugroho, dan Tundjung Mahatma,
M.Kom untuk ilmu dan bimbingan yang diberikan kepada penulis selama
belajar di Program Studi Matematika.
4. Staf TU dan Pak Edy untuk bantuannya saat kesulitan instal software.

5. Bapak, Ibuk, Kakak dan Adik atas segala dukungan, semangat dan doa yang
diberikan.
6. Mas Restu yang selalu memberikan semangat untuk tidak pernah putus asa
selama proses penyelesaian skripsi.
7. Freda, Dek Tina dan Mbak Nina yang selalu memberikan semangat dalam
penyelesaian skripsi ini.
8. Rekan seperjuangan Matematika 2011 Daivi, Titis, Priska, Purwoto, Dwi,
Malik dan Kevin.
Penulis menyadari bahwa skripsi ini masih banyak kekurangan. Oleh sebab itu,
penulis mengharapkan kritik dan saran yang membangun dari pembaca. Semoga
skripsi ini dapat bermanfaat bagi semua pihak.
Salatiga, 21 Januari 2015
Penulis

vi

DAFTAR ISI
Halaman
HALAMAN JUDUL…………………………………………………………………
i

PERNYATAAN KEASLIAN KARYA TULIS TUGAS AKHIR…………………..

ii

PERNYATAAN PERSETUJUAN PUBLIKASI TUGAS AKHIR
UNTUK KEPENTINGAN AKADEMIS…………………………………………….

iii

HALAMAN PENGESAHAN…………………………………………………….….

iv

MOTTO DAN PERSEMBAHAN……………………………………………..…….

v

KATA PENGANTAR………………………………………………………….……

vi


DAFTAR ISI…………………………………………………………………..……..

vii

ABSTRAK……………………………………………………….…………………..

viii

ABSTRACT………………………………………………………………………….

ix

PENDAHULUAN……………………………………………………………………

x

MAKALAH 1 : Bayesian Survival Analysis untuk mengestimasi parameter
model Cox-Regression pada kasus ketahanan hidup pasien
penderita jantung koroner.

MAKALAH 2 : Bayesian Survival Analysis ntuk mengestimasi parameter
model Weibull-Regression pada kasus ketahanan hidup pasien
penderita jantung koroner.
PENUTUP………………………………………...…………………….………. .....
DAFTAR PUSTAKA………………………………………………………………..
LAMPIRAN 1 : Data survival pasien penderita jantung koroner………………..…
LAMPIRAN 2 : Program WINBUGS 1.4 untuk Bayesian Survival Analysis
menggunakan Cox-Regression …………………………………...

xiii
xiv
xvi

xvii

LAMPIRAN 3 : Program WINBUGS 1.4 untuk Bayesian Survival Analysis
menggunakan Weibull-Regression……………………………...……

xx


LAMPIRAN 4 : Manual penggunaan WINBUGS 1.4……………………………...

xxi

LAMPIRAN 5 : Makalah 1 Publikasi…………………………….............................

xxi

LAMPIRAN 6 : Sertifikat Publikasi…………………………….................................

xxi

vii

BAYESIAN SURVIVAL ANALYSIS UNTUK MENGESTIMASI PARAMETER

MODEL KETAHANAN HIDUP PASIEN PENDERITA
JANTUNG KORONER
A. Dewi Lukitasari1, Adi Setiawan2, Leopoldus Ricky Sasongko3
1,2,3


Program Sudi Matematika, Fakultas Sains dan Matematika,

Universitas Kristen Satya Wacana, Jl.Diponegoro No.52-60, Salatiga.
1

[email protected],2 [email protected],
3

[email protected]
ABSTRAK

Skripsi ini membahas mengenai analisis survival menggunakan CoxRegression dan Weibull-Regression untuk mengestimasi parameter model ketahanan

hidup pasien penderita jantung koroner dengan pendekatan Bayesian. Data yang
digunakan adalah data survival pasien penderita jantung koroner dan data tersensor
hasil simulasi meliputi waktu hidup pasien, status pasien (hidup/mati) dan treatment
yang dikenakan pada pasien yaitu ring dan bypass, dengan jumlah pasien sebanyak
40 orang. Pendekatan Bayesian (Bayesian approach) digunakan untuk mengestimasi
parameter yang belum diketahui dari model regresi yang digunakan. Metode Markov

Chain Monte Carlo (MCMC) menggunakan algoritma Gibbs Sampling digunakan

untuk membangkitkan Rantai Markov untuk mengestimasi distribusi posterior dari
parameter, meliputi koefisien regresi (  ) dari masing-masing model dan parameter r

dari model survival Weibull. Parameter  dan r yang diperoleh digunakan untuk
menghitung fungsi survival tiap pasien sesuai dengan treatment yang dikenakan.
Fungsi survival menunjukkan probabilitas bertahan hidup pasien penderita jantung
koroner. Berdasarkan analisis kedua model regresi, pada kasus penderita jantung
koroner, Weibull-Regression kurang mampu memodelkan data survival pasien
penderita jantung koroner karena diperoleh nilai probabilitas yang kurang wajar yakni
bernilai 0 untuk treatment bypass.

viii

Kata Kunci : Survival Analysis, model Weibull-Regression, Bayesian, Markov
Chain Monte Carlo (MCMC)

THE USE OF BAYESIAN SURVIVAL ANALYSIS TO ESTIMATE
PARAMETERS OF SURVIVAL MODEL FOR CORONARY HEART

DISEASE’S PATIENTS
A. Dewi Lukitasari1, Adi Setiawan2, Leopoldus Ricky Sasongko3
1,2,3

Mathematics Department, Faculty of Science and Mathematics,

Satya Wacana Christian University, Jl.Diponegoro No.52-60, Salatiga.
1

[email protected],2 [email protected],
3

[email protected]
ABSTRACT

This study examined survival analysis using Cox and Weibull-Regression to

estimate survival model for coronary heart disease’s patients. Survival and censored
data simulation of coronary heart disease’s patients were used for data collection,
including survival time, survival status (life or die) and custom treatment (ring and

bypass). The total number of patients was 40 patients. Bayesian approach was
applied to estimate unknown parameter from regression models. Markov Chain
Monte Carlo (MCMC) method using Gibbs Sampling algorithm generated Markov
Chain to estimate posterior distribution of parameter that included regression

coefficient (  ) from each models and r parameter from Weibull’s model. Parameter
that had been found was to count survival function from each patient in each

treatment. This showed life probability of coronary heart disease’s patients.
Regarding the analysis from the two models, in context of coronary heart’s diseases
Weibull-Regression not really good in modeling of survival data of coronary heart’s
diseases patients because the result of the probability were bad.
Keywords : Survival analysis, Cox-Regression model, Weibull-Regression,

Bayesian, Markov Chain Monte Carlo (MCMC)

ix

PENDAHULUAN
Latar Belakang
Kemajuan ilmu pengetahuan dan teknologi yang memunculkan inovasi di
berbagai aspek kehidupan, membawa dampak pada perubahan pola hidup masyarakat
yang cenderung serba instan.

Pola hidup tersebut membawa dampak negatif.

Diantaranya muncul berbagai jenis penyakit yang berbahaya dan mematikan, salah
satunya adalah penyakit jantung koroner. Karena penyakit ini sangat berbahaya maka
seseorang yang terkena penyakit ini mungkin melakukan investasi/ asuransi sebagai
bentuk antisipasi apabila sewaktu-waktu penyakit ini kambuh dan harus menjalani
perawatan ,operasi atau meninggal dunia. Perusahaan asuransi perlu untuk
menentukan peluang waktu hidup pemegang polis yang menderita jantung koroner.
Peluang hidupnya biasa direpresentasikan dengan tabel mortalitas.
Inovasi yang berkembang meliputi bidang aktuaria, engineering dan
biostatistik yaitu munculnya survival analysis yang digunakan untuk memodelkan
data survival Survival analysis bertujuan menduga probabilitas kelangsungan hidup,
kematian, dan peristiwa-peristiwa lainnya sampai pada periode waktu tertentu serta
menjelaskan pengaruh variabel independent terhadap waktu hidup. Teknik analisis
yang biasa digunakan antara lain parametric, semi-parametric dan non-parametric.
Salah satu teknik analisis parametric yang digunakan adalah Weibull-Regression
sedangkan teknik analisis

non-parametric sederhana yang digunakan untuk

memodelkan data survival adalah model Cox-regression.
Kenyataannya, selama proses observasi dimungkinkan terdapat data yang
tidak terobservasi secara penuh (not completely observed) yang disebut data
tersensor. Oleh karena itu untuk mengolah data tersensor digunakan teknik analisis
parametric menggunakan model Weibull. Distribusi Weibull digunakan secara

efektif untuk menganalisis data waktu hidup khususnya untuk data tersensor.
Saat ini dikenal ada dua pendekatan model yaitu pendekatan klasik (classical
approach) dan pendekatan Bayesian (Bayesian approach). Keunggulan pendekatan

Bayesian diantaranya mampu menyelesaikan masalah yang tidak dapat diselesaikan

x

secara analitis dan mampu menawarkan kemungkinan yang kaya dengan interferensia
serta mengeksplor perbedaan-perbedaan interpretasi data terhadap kriteria kinerja
prior. Pada proses pemodelannya menggunakan estimasi Bayesian dengan bantuan
Markov-Chain Monte-Carlo (MCMC) berdasarkan algoritma Gibbs Sampling.

Berdasarkan uraian di atas, pada skripsi ini dibahas analisis survival untuk
model dengan Cox-Regression dan Weibull-Regression menggunakan pendekatan
klasik kemudian dilanjutkan dengan menggunakan pendekatan Bayesian untuk
mengestimasi parameter dari model yang digunakan. Pada model Cox-Regression
digunakan data pasien penderita jantung koroner yang dikenakan pengobatan dengan
treatment Ring dan Bypass, sedangkan untuk model Weibull-Regression digunakan

data survival simulasi pasien penderita jantung koroner. Total pasien adalah sebanyak
40 pasien. Treatment Ring adalah teknik pengobatan jantung koroner dengan cara
memasangkan cincin pada jantung untuk melebarkan pembuluh darah yang
menyempit atau tersumbat di bagian jantung, sedangkan treatment Bypass adalah
teknik pengobatan dengan mengambil pembuluh darah vena yang diambil dari vena
lengan atau kaki.

Rumusan Masalah
Berdasarkan uraian latar belakang tersebut, permasalahan yang dibahas dalam
penelitian ini adalah :
1. Bagaimana mengestimasi parameter pada model Cox-Regression dengan
Bayesian survival analisis pada kasus ketahanan hidup pasien penderita
jantung koroner?
2. Bagaimana mengestimasi parameter pada model Weibull-Regression dengan
Bayesian survival analisis pada kasus ketahanan hidup pasien penderita
jantung koroner?

xi

Tujuan
Tujuan dari penelitian ini adalah :
1. Memperoleh

nilai

parameter

pada

model

Cox-Regression

dengan

menggunakan Bayesian survival analisis pada kasus ketahanan hidup pasien
penderita jantung koroner.
2. Memperoleh nilai parameter pada model Weibull-Regression dengan
menggunakan Bayesian survival analisis pada kasus ketahanan hidup pasien
penderita jantung koroner.

Batasan Masalah
Beberapa hal yang membatasi penelitian ini adalah :

 Diasumsikan bahwa tidak ada kegagalan yang dapat terjadi secara bersamaan.

 Diasumsikan data termasuk ke dalam tipe data Random Censoring.
Manfaat penelitian

Penelitian ini dapat bermanfaat untuk perusahaan asuransi jiwa kategori manfaat
penyakit kritis seperti asuransi operasi dalam membuat kalkulasi asuransi (insurance
calculations) seperti alat pengukur pembentuk rate premi yang akan digunakan untuk

membuat perhitungan asuransi sehubungan dengan orang-orang yang dipilih untuk
cakupan asuransi.

Untuk menyelesaikan rumusan masalah tersebut, maka dibuat dua makalah yaitu :
1. Bayesian

Survival

Analysis

menggunakan

Cox-Regression

untuk

mengestimasi model ketahanan hidup pasien penderita jantung koroner yang
telah diseminarkan di Universitas Muhammadiyah Purworejo pada tanggal 29
November 2014.
2. Bayesian Survival Analysis untuk mengetimasi parameter model WeibullRegression pada kasus ketahanan hidup pasien penderita jantung koroner.

xii

PENUTUP
Kesimpulan
yang diestimasi meliputi, koefisien regresi   dan  0 pada model Cox-Regression.
Berdasarkan analisis yang dilakukan, diperoleh nilai dari setiap parameter

Parameter r dan koefisien regresi   untuk model Weibull-Regression. Didapatkan

probabilitas pasien bertahan hidup untuk masing-masing treatment yakni treatment
Ring dan Bypass. Diperoleh adanya kelemahan untuk model Weibull-Regression

dalam memodelkan ketahanan hidup pasien penderita jatung koroner karena
menghasilkan nilai probabilitas yang kurang wajar dikarenakan pada analisis dengan
menggunakan Weibull-Regression diperoleh nilai probabilitas untuk treatment
Bypass sebesar nol.

Saran
Penelitian ini dapat diaplikasikan untuk perusahaan asuransi jiwa kategori
penyakit kritis seperti asuransi operasi dalam membuat kalkulasi asuransi (insurance
calculations) seperti alat pengukur pembentuk rate premi yakni menghitung nilai

probabiltas kematian pemegang polis yang akan digunakan untuk membuat
perhitungan asuransi sehubungan dengan orang-orang yang dipilih untuk cakupan
asuransi.

xiii

DAFTAR PUSTAKA
[1]

Hendrajaya, Yani, Adi Setiawan dan Hanna Arini Parhusip.2008. Penerapan
Analisis Survival untuk Menaksir Waktu Bertahan Hidup bagi Penderita
Penyakit Jantung. Program Studi Matematika. Fakultas Sains dan Matematika.
UKSW : Salatiga.

[2]

Departemen Kesehatan Republik Indonesia.2007.Profil Kesehatan Indonesia
2005. Jakarta.

[3]

World Health Organization. 2014. The top 10 causes of death. Swiss: WHO .
diakses pada Senin,15 September 2014 pukul 9.41.
http://www.who.int/mediacentre/factsheets/fs310/en/.

[4]

London,Dick FSA. 1997.Survival Model and Their Estimation. ACTEX
Publication : USA.

[5]

Reskianti,Kiki, Nuriti Sunusi dan Nasrah Sirajang.2014.Estimasi Bayesian pada
Analisis Data Ketahanan Hidup Berdistribusi Eksponensial melalui Pendekatan
SELF. Studi Kasus: Analisis Ketahanan Hidup Flourophores .Jurusan
Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam.Universitas
Harsanudin : Makassar.

[6]

Subanar.2013.Statistika Matematika .Graha Ilmu: Yogyakarta.

[7]

Perra, Silvia.2013. Objective Bayesian Variable Selection for Censored Data .
Universitas Cagliari: Italia.

[8]

Hidayah, Eny. 1994. Analisis Ketahanan Hidup dengan Metode Gehan MantelHaenszel dan Tarone-Ware untuk 2 Sampel Sampai K Sampel. Universitas
Diponegoro : Semarang.

[9]

Candra Siska, Ade. 2011. Inferensi Statistik Distribusi Binomial Dengan
Metode Bayes Menggunakan Prior Konjugat. Universitas Diponegoro:
Semarang.
http://eprints.undip.ac.id/29153/1/ade_candra.pdf

[10] Klein, J.P dan Moeschberger, M.L.1997. Survival Analysis : Techniques for
Censored and Truncated Data . New York. Springer-Verlag New York Inc.
[11] Andrew E Long. 1999. Leuk: survival analysis using Cox regression. Diakses
pada Selasa 16 September 2014 pukul 20.12.
http://users.aims.ac.za/~mackay/BUGS/Manual05/Examples1/node29.html

xiv

[12] Rahayu, Ninuk, Adi Setiawan, Tundjung Mahatma.2013. Analisis Regresi Cox
Proporsional Hazards pada Ketahanan Hidup Pasien Diabetes Mellitus.
Program Studi Matematika. Fakultas Sains dan Matematika. UKSW : Salatiga.
[13] Hidayah,Entin.2013.Model Disagregasi Data Hujan Temporal dengan
Pendekatan Bayesian sebagai Input Permodelan Banjir .ITS:Surabaya.
[14] Mustafa, Ayman dan Anis Ben Ghorbal.2011. Using WinBUGS to Cox Model
with Changing from the Baseline Hazard Function . Fakultas Matematika.
Universitas Islam Al-Imam Muhammad Ibn Saud : Saudi Arabia.

xv

BAYESIAN SURVIVAL ANALYSIS UNTUK MENGETIMASI PARAMETER

MODEL COX-REGRESSION PADA KASUS KETAHANAN HIDUP
PASIEN PENDERITA JANTUNG KORONER
A. Dewi Lukitasari1, Adi Setiawan2, Leopoldus Ricky Sasongko3
1,2,3

Program Sudi Matematika, Fakultas Sains dan Matematika,

Universitas Kristen Satya Wacana, Jl.Diponegoro No.52-60, Salatiga.
1

[email protected],2 [email protected],
3

[email protected]

ABSTRAK

Penerapan model Cox-Regression dalam konteks survival analysis dengan
pendekatan Bayesian untuk memodelkan ketahanan hidup pasien penderita jantung
koroner dibahas dalam paper ini. Data yang digunakan adalah waktu hidup pasien,
status pasien (hidup/mati) dan treatment yang dikenakan. Diambil dua treatment yang
digunakan oleh pasien penderita jantung koroner yaitu ring dan bypass. Pendekatan
yang digunakan adalah pendekatan Bayesian (Bayesian approach) untuk mencari
distribusi posterior parameter. Updating data menggunakan metode Markov Chain
Monte Carlo (MCMC) dengan algoritma Gibbs Sampling. Software winBUGS 1.4

membantu dalam mengestimasi nilai setiap parameter yaitu koefisien regresi

.

Parameter yang diestimasi dari model Cox-Regression digunakan untuk menghitung
probabilitas bertahan hidup pasien penderita jantung koroner.
Kata Kunci : Survival Analysis, model Cox-Regression, Bayesian, Markov Chain
Monte Carlo (MCMC)

1

PENDAHULUAN
Kemajuan ilmu pengetahuan dan teknologi yang kian pesat menuntut berbagai
aspek untuk menemukan inovasi guna mempermudah kehidupan manusia. Inovasi
teknologi yang serba canggih membawa dampak pada perubahan pola hidup
masyarakat yang cenderung serba instan. Tidak dapat dipungkiri pola hidup tersebut
membawa dampak negatif. Diantaranya muncul berbagai jenis penyakit yang
berbahaya dan mematikan, salah satunya adalah penyakit jantung koroner [1].
Menurut World Health Organization (WHO) atau Badan Kesehatan Dunia, penyakit
jantung koroner merupakan penyakit dengan urutan pertama penyebab kematian dan
tersebar di seluruh dunia. Pada tahun 2012 tercatat 7,2 juta orang di seluruh dunia
meninggal setiap tahunnya akibat penyakit ini. Banyaknya orang yang meninggal
akibat ini diperkirakan akan terus meningkat hingga 23,3 juta di tahun 2030 [2].
Karena penyakit ini sangat berbahaya maka seseorang yang terkena penyakit ini akan
melakukan investasi sebagai bentuk antisipasi apabila sewaktu-waktu penyakit ini
kambuh dan harus menjalani perawatan atau operasi. Perusahaan asuransi perlu untuk
menentukan peluang waktu hidup seseorang yang akan melakukan asuransi. Peluang
hidupnya biasa direpresentasikan dengan membuat tabel mortalitas.
Angka kematian yang tinggi akibat penyakit jantung koroner menimbulkan
perkembangan inovasi di bidang aktuaria, engineering dan biostatistik yaitu
munculnya survival analysis yang digunakan untuk memodelkan data survival [3].
Survival analysis bertujuan menduga probabilitas kelangsungan hidup, kekambuhan,

kematian, dan peristiwa-peristiwa lainnya sampai pada periode waktu tertentu serta
mejelaskan pengaruh variabel independent terhadap waktu survive [4]. Teknik
analisis yang biasa digunakan antara lain parametric, semi-parametric dan nonparametric [5]. Salah satu teknik analisis non-parametric sederhana yang digunakan

untuk memodelkan data survival adalah model Cox-regression. Sedangkan untuk
permodelan data dikenal ada dua pendekatan yaitu pendekatan klasik (classical
approach) dan pendekatan Bayesian (Bayesian approach) [6]. Pendekatan klasik

2

memandang parameter bernilai tetap, sedangkan pada pendekatan bayesian parameter
dipandang sebagai variabel random yang memiliki distribusi (distribusi Prior).
Keunggulan pendekatan Bayesian diantaranya mampu menyelesaikan masalah yang
tidak dapat diselesaikan secara analitis dan mampu menawarkan kemungkinan yang
kaya dengan interferensia serta mengeksplor perbedaan-perbedaan interpretasi data
terhadap kriteria kinerja prior [7]. Estimasi parameter model menggunakan estimasi
Bayesian dengan metode Markov-Chain Monte-Carlo (MCMC) berdasarkan
algoritma Gibbs Sampling. Salah satu kontribusi yang dapat bermanfaat bagi
perusahaan asuransi kejiwaan untuk penyakit kritis seperti asuransi operasi dalam
membuat kalkulasi asuransi (insurance calculations) yang akan digunakan untuk
membuat perhitungan asuransi sehubungan dengan orang-orang yang dipilih untuk
cakupan asuransi.
Berdasarkan uraian di atas, pada paper ini dibahas terlebih dahulu cara
mengestimasi parameter menggunakan pendekatan klasik dengan menggunakan
model regresi Cox-Proporsional Hazard pada kasus ketahanan hidup pasien
penderita jantung koroner, kemudian dilanjutkan dengan menggunakan pendekatan
Bayesian survival analysis menggunakan Cox-regression. Tujuan dari penelitian ini

untuk memperoleh model ketahanan hidup pasien penderita jantung koroner dengan
Bayesian survival analysis menggunakan Cox-regression. Dalam proses estimasi

diasumsikan bahwa tidak ada kegagalan yang dapat terjadi secara bersamaan. Hal
tersebut berarti terdapat asumsi bahwa satu pasien hanya dapat mengalami satu kali
kegagalan dan satu pasien hanya dikenakan satu treatment saja. Alat bantu
perhitungan menggunakan paket program winBUGS 1.4 yang telah memuat
algoritma BUGS (Bayesian Interface Using Gibbs Sampling).

3

DASAR TEORI
Fungsi Survival
Fungsi survival S (t ) merupakan probabilitas dari seseorang untuk bertahan
hidup setelah waktu yang ditetapkan sebut t . Fungsi survival merupakan merupakan
komplemen dari variabel random fungsi distribusi kumulatif F (t ) maka ditulis
S (t )

P (T

t ) 1 F (t ) [8]. Fungsi distribusi kumulatif dari variabel random T

dengan fungsi kepadatan probabilitas (probability density function) f (t ) , diperoleh
dengan cara mengintegralkan fungsi kepadatan probabilitas sehingga diperoleh
t

F (t )

P (T

f (t )dt dengan T adalah variabel random yang mencerminkan

t)
0

failure time atau waktu bertahan hidup sampai munculnya kejadian tertetu. Kejadian

yang dimaksud adalah kematian [9].
Fungsi Hazard
Fungsi Hazard

0

(t ) menunjukkan laju kegagalan individu untuk mampu

bertahan hidup setelah melewati waktu yang ditetapkan, t . Didefinisikan sebagai
berikut :
0

(t )

lim

dt

0

P (t

T

t dt | T
dt

t)

lim

dt

0

P (t

T t dt )
P (T t )

F ' (t )
S (t )

(1)

dengan T asumsikan kontinu sehingga memiliki fungsi kepadatan probabilitas dan
kejadian berlangsung untuk rentang waktu [t , t dt ) [10]. Untuk fungsi Hazard
kumulatif yaitu
t

0 (t )

0

(u )du

0

Proses Intensitas dan model regresi Cox
Data survival yang ada perlu dilakukan proses menghitung jumlah kegagalan
yang terjadi sampai waktu t . Proses tersebut dinamakan proses intensitas. Proses

4

(2)

intensitas I i (t ) , merepresentasikan hubungan probabilitas subjek i , i 1, 2, ..., n
pada interval [t , t

dt ) . Dirumuskan :

I i (t )dt

E (dN (t ) 1 | Ft )

(3)
N i (t ) menunjukkan kenaikan dari N i untuk interval [t , t

dt ) , Ft menunjukkan

data yang ada sebelum waktu t . Jika nilai i masuk di interval waktu maka diambil
nilai dN i (t ) 1 dan sebaliknya jika tidak maka diambil nilai dNi (t )
Jika nilai dt

0.

0 untuk D {N i (t ), Yi (t ), zi (t )} , probabilitas pada proses

intensitas berubah menjadi instantaneous hazard untuk waktu t dan subjek i
ditunjukkan pada persamaan di bawah ini
I i (t )

Yi (t ) 0 (t ) exp( ' zi )

(4)

dengan D mencerminkan data, Yi (t ) adalah indikator risiko yang ditunjukkan dari
status hidup pasien terdiri dari 0 atau 1 dan zi (t ) adalah vektor covariate. Model
Cox-Regression ditunjukkan dari

individu ke- i . Parameter

0

(t ) exp( ' zi ) yang menunjukan skor risiko untuk

menunjukkan koefisien regresi.

Fungsi eksponensial menjamin I i (t ) bernilai positif. Probabilitas fungsi
survival dirumuskan sebagai berikut :
t

S (t , z)

exp((

0

(u )du ) exp( z ) )

(5)

0
t

Parameter

dan nilai

0 (t )

0

(u )du yang akan diestimasi dengan estimasi non-

0

parametric yang akan digunakan untuk mengestimasi model survival [11].

Distribusi Prior
Distribusi prior mencerminkan kepercayaan subyektif parameter sebelum sampel
diambil. Penentuan distribusi prior dapat ditentukan berdasarkan ruang parameternya.

5

Penentuan

d

0

prior

(t ) ~ Gamma (cd

dengan
*
0

mengambil

(t ), c ) . d

hazard yang belum diketahui dan

c

*
0

Ni (t )

konjugat

sehingga

(t ) menunjukann perkiraan prior dari fungsi

menujukkan derajat konfidensi [11].

Fungsi Likelihood
Fungsi likelihood yang biasa digunakan adalah :
L( D | ,

0

(t )))

Li ( D | ,

0

(6)

(t ))

n

L( D | ,

I i (t ) dNi (t ) exp

0 (t )
i 1

t 0

t 0

I i (t ) dt

(7)

Mengganti nilai I i (t ) dengan persamaan (4) diperoleh persamaan likelihood sebagai
berikut:
n

L( D | ,

0 (t ))

(Yi (t ) exp( ' zi )d
i 1

(t )) dN (t ) exp
i

0

t 0

t 0

(Yi (t ) exp( ' zi )d

0

(t ) dt

(8)
dengan

d

0

(t )

mencerminkan

kenaikan

dari

fungsi

hazard,

dN i (t ) ~ Poisson( I i (t ))dt merupakan kenaikan yang sangat kecil dari N i (t ) dan
0

(t ) menunjukkan baseline hazard function terintegrasi selama interval [t , t dt )

[5].
Distribusi Posterior
Dalam estimasi Bayes, setelah informasi tentang sampel dan prior dapat
ditentukan maka distribusi posteriornya dicari dengan mengalikan priornya dengan
informasi sampel yang diperoleh dari likelihoodnya [7]. Dituliskan sebagai berikut:
P( ,

0

(t ) | D )

L( D | ,

Akan difokuskan dalam mengestimasi parameter

0

(t ) P ( ) P (

dan

0

0

(t )) .

(9)

(t ) . Karena model cukup

kompleks distribusi posterior susah untuk dicari secara langsung maka perlu adanya
suatu pendekatan menggunakan metode simulasi dengan MCMC (Markov Chain
Monte Carlo). Pada proses MCMC dipilih menggunakan algoritma Gibbs Sampling.
6

Kemudahan yang diperoleh dari penggunaan metode MCMC pada analisis
Bayesian antara lain metode MCMC dapat menyederhanakan bentuk integral yang
kompleks dengan dimensi besar menjadi bentuk integral yang sederhana dengan satu
dimensi. MCMC dapat mengestimasi densitas data dengan cara membangkitkan suatu
rantai Markov yang berurutan sebanyak N yang cukup besar sampai diperoleh
konvergen [12]. Salah satu keunggulan MCMC terletak pada performa yang tidak
terlalu sensitif pada penggunaan nilai awal.
Proses penyusunan algoritma Gibbs Sampling perlu ditentukan nilai awal dari
parameter yang akan diestimasi yaitu
penyusunan

( P ( | D,

0

algoritma

(t )), P (

0

Gibbs

0

~ Normal (0,

Sampling

2

) dan

mengikuti

0

prosedur

(t ) . Manual
penentuan

(t ) | D, )) dengan langkah pada persamaan (10) dan (11) yaitu
P ( | D,

0

(t ))

P ( )P (D | ,

0

(t ))

(10)

dan
P(

0

(t ) | D, )

P(

0

(t )) .

(11)

Langkah pada persamaan (10) dan (11) diulang sebanyak B yang cukup besar, dengan
B merupakan banyaknya update pada penyusunan rantai Markov hingga diperoleh
deret rantai Markov yang konvergen.
Gibbs Sampling termasuk ke dalam dua kategori algoritma utama

dalam MCMC selain algoritma Metropolis. Gibbs Sampling adalah teknik
membangkitkan variabel acak dari distribusi marginal secara tidak langsung tanpa
harus menghitung densitasnya.

7

METODE PENELITIAN
Profil data
Data yang digunakan adalah data waktu bertahan hidup, status hidup pasien dan
treatment yang digunakan pasien penderita jantung koroner [4]. Data ditunjukkan

pada Tabel 1. Pasien sebanyak 40 pasien dan pasien yang mengalami kegagalan
(meninggal) saat menjalani treatment sebanyak 8 pasien.
Langkah-langkah penelitian
Pengolahan data dengan menggunakan software winBUGS 1.4. Software
winBUGS 1.4 adalah paket program yang dirancang khusus untuk memfasilitasi
permodelan data Bayesian menggunakan implementasi MCMC yang bekerja dalam
sistem operasi windows. Pengolahan data survival dilakukan dengan tahapan dan
spesifikasi model meliputi pengecekan terhadap syntax model, loading data,
compiling model, inisialisasi, menentukan iterasi MCMC sebanyak 10.000 kali guna

membangkitkan Rantai-Markov. Penyusunan parameter

dan node Ring serta node

Bypass. Updating data parameter sebanyak 10.000. Dalam ploting masing-masing
node dan parameter beta nilai Markov dilakukan burn in sebanyak 5000 data, dan

diambil bangkitan rantai dari data ke 5001 sampai dengan 10.000.
Tabel 1. Data waktu bertahan hidup pasien penderita jantung koroner
No
1
2
3
4
5
6
7
8
9
10
11
12

Waktu
(bulan)
26
26
38
51
52
56
57
61
62
62
66
71

Status

Treatment

No

0
0
0
0
0
0
0
1
0
0
0
1

Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring

21
22
23
24
25
26
27
28
29
30
31
32

8

Waktu
(bulan)
32
33
42
42
56
56
60
65
78
87
87
93

Status

Treatment

0
0
0
0
0
0
1
0
0
0
0
0

Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass

13
14
15
16
17
18
19
20

71
75
83
106
123
128
156
183

0
0
0
0
0
0
0
0

Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring

33
34
35
36
37
38
39
40

102
116
116
146
161
173
178
182

0
0
1
1
0
1
1
1

Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass

ANALISIS HASIL
Proses analisis dilakukan pada data survival yang terdiri dari n 40 dan
T

8 , dengan n menyatakan total pasien dan T menunjukkan pasien yang mengalami

kegagalan dalam proses treatment. Digunakan dan diselidiki terlebih dahulu dengan
pendektan klasik yaitu Regresi Cox-Proporsional Hazard dengan load packages
survival yang ada pada software R i386 3.0.1. Waktu hidup dan status sebagai

variabel yang dependent terhadap treatment. Hal tersebut berarti treatment sebagai
variabel independent dan probabilitas survival tergantung pada jenis treatment yang
digunakan. Diperoleh gambaran hasil yang dinyatakan pada Tabel 2.
Tabel 2. Hasil estimasi node Ring dengan metode klasik non-parametrik

Node

Waktu

Survival

Ring [1]
Ring [2]

61
71

0.923
0.821

Standard

Batas

Batas

Error

minimum

Maksimum

0.0739
0.1169

0.798
0.621

1
1

Tabel 3. Hasil estimasi node Bypass dengan metode klasik non- parametric

Batas

Node

Waktu

Survival

Standard
Error

minimum

Batas
Maksimum

Bypass[1]
Bypass[2]
Bypass[3]
Bypass[4]

60
116
146
173

0.929
0.796
0.637
0.424

0.0688
0.1362
0.1793
0.2105

0.8030
0.5691
0.3667
0.1606

1
1
1
1

9

Bypass[5]
Bypass[6]

178
182

0.212
0.000

0.1833
-

0.0391
-

1
-

Tabel 4. Hasil estimasi parameter Beta dengan metode klasik

Node

Survival

Estimasi
Titik

Batas
minimum

Batas
Maksimum

Beta

0.408

-0.6851

0.0778

0.9053

Tabel 4. menunjukkan nilai estimasi titik yang sekaligus menunjukkan nilai
koefisien regresi yakni sebesar -0.6851. Tingkat signifikansi alfa sebesar 0.5%.
Estimasi interval diambil dengan mengambil exponensial dari minus lower.95 dan
minus upper.95. Batas bawah dan batas atas diperoleh (0.0778, 0.9053) dengan
probabilitas 0.408 yang sudah signifikan karena nilai probabilitasnya lebih besar dari
0.05. Dengan estimasi non parametrik gambaran nilai probabilitas pasien bertahan
hidup untuk masing-masing treatment yang dikenakan terdapat pada Tabel 2 dan
Tabel 3. Ditunjukkan bahwa nilai probabilitas tertinggi ada dalam kelompok bypass
dengan nilai probabilitas sebesar 0.929

hanya selisih cukup kecil yaitu 0.005

signifikan dengan pasien dengan ring yang memiliki probabilitas tertinggi 0.923.
Gambaran grafik

estimasi mean dari fungsi survival ditunjukan

pada

Gambar 1. Pada Gambar 1. Sumbu horizontal menunjukkan waktu bertahan hidup
pasien penderita jantung koroner dalam satuan bulan , sedangkan sumbu vertical
menunjukkan presentase subjek yang masih bertahan hidup. Garis putus-putus pada
Gambar 1. menunjukkan garis survival untuk treatment Ring dan Bypass. Grafik
memiliki kecenderungan mengalami penurunan secara bertahap, tidak dapat
dipungkiri probabilitas pasien untuk bertahan hidup juga semakin kecil. Pada Gambar
1. Terlihat bahwa probabilitas bertahan hidup penderita dengan treatment ring jauh
lebih besar karena penurunan probabilitas tidak sesignifikan jika dengan
menggunakan bypass
.

10

0.6
0.4

Survival Probability

0.8

1.0

Gambar 1. Estimasi mean fungsi survival untuk treatment Ring dan Bypass

Bypass

0.0

0.2

Ring

0

50

100

150

survival Time in Months

Hasil nilai estimasi dan karakteristik untuk masing-masing parameter
ditunjukkan pada Tabel 5, Tabel 6, dan Tabel 7.
Tabel 5. Hasil estimasi Bayesian node Ring

Node

Mean

Standard
Deviasi

Ring[1]
Ring[2]
Ring[3]
Ring[4]
Ring[5]
Ring[6]
Ring[7]
Ring[8]

0.9771
0.9536
0.9262
0.8781
0.8119
0.7185
0.613
0.4868

0.02706
0.04169
0.05832
0.09146
0.1333
0.182
0.2202
0.2417

MC error
( 10 4 )
3.18
5.01
7.47
12.58
19.61
26.98
33.35
37.97

11

Batas
minimum
2,5%
0.9025
0.841
0.7752
0.6403
0.4802
0.2892
0.1471
0.0564

Median
0.9865
0.9659
0.941
0.9009
0.8425
0.7567
0.6429
0.4902

Batas
maksimum
97,5%
0.9996
0.9972
0.9931
0.988
0.9797
0.967
0.9479
0.9169

Tabel 6. Hasil estimasi Bayesian node Bypass

Node

Mean

Standard
Deviasi

MC error

Bypass[1]
Bypass[2]
Bypass[3]
Bypass[4]
Bypass[5]
Bypass[6]
Bypass[7]
Bypass[8]

0.9532
0.9067
0.855
0.7701
0.6615
0.5194
0.3739
0.2289

0.04703
0.06644
0.08318
0.1131
0.1402
0.1651
0.1697
0.1565

4.48
6.53
8.23
10.3
12.73
14.42
14.65
12.8

( 10 4 )

Batas
minimum
2,5%
0.826
0.7398
0.6548
0.5051
0.357
0.189
0.07959
0.01491

Median
0.9679
0.9224
0.8702
0.7862
0.6743
0.5257
0.366
0.2018

Batas
maksimum
97,5%
0.9988
0.9887
0.9701
0.9398
0.8932
0.8192
0.7175
0.5872

Tabel 7. Hasil estimasi Bayesian parameter Beta

Node
Beta

Mean
-0.8789

Standard
Deviasi
0.9409

MC
error

Median

( 10 )

Batas
Minimum
2,5%

Batas
Maksimum
97,5%

0.01502

-2.919

-0.8126

0.7644

4

Mean dan Median dalam Tabel 5 dan Tabel 6 menunjukkan nilai estimasi
titik. Rata-rata dari parameter dalam Tabel 5 dan Tabel 6 merepresentasikan estimasi
nilai rata-rata posterior untuk pasien yang menggunakan treatment ring dan bypass
yang sekaligus mencerminkan peluang pasien untuk bertahan hidup jika
menggunakan treatment tersebut. Nilai mean yang tertinggi untuk pasien dengan
treatment ring adalah 0.9771 sedangkan dengan bypass 0.953 menunjukkan peluang
bertahan hidup seseorang bertahan dengan menggunakan treatment ring akan
menghasilkan nilai peluang bertahan hidup lebih besar dibandingkan dengan
menggunakan bypass yakni sebesar 0.9771. Nilai error dalam penyusunan MCMC
dengan algoritma Gibbs Sampling ditunjukkan dari MC error , diperoleh nilai error
yang kecil karena mendekati 0. Estimator interval untuk parameter ditunjukkan dari
interval konfidensi yakni batas minimum dan maksimum dengan pengambilan nilai
tingkat sifnifikansi

5 %. Estimasi parameter menunjukkan bahwa semua
12

parameter terletak dalam batas interval konfidensi pada posisi antara 2,50% dan
97,50% dan nilainya signifikan yang tidak melewati nilai nol. Adanya interval
konfidensi tersebut menjamin pencakupan dari parameter yang diselidiki. Nilai ratarata posterior yaitu standar error sekaligus menunjukkan koefisien regresi,
diperoleh ditunjukkan pada Tabel 7 sebesar -0.8789.
Gambar 2. Plot time series untuk MCMC Bayesian dan densitas kernel Ring[1], Bypass[1],
dan beta
Densitas Kerne l-Ring[1]

40
0

20

Ring1

0.85
0.70

Ring1

1.00

MCMC-Ring[1]

0

1000

2000

3000

4000

5000

0.70

Index

0.80

N = 5000

1.00

Bandw idth = 0.00302

Densitas Kerne l-Bypa ss[1]

0

1000

2000

3000

4000

0 5 10

Bypass1

0.8
0.6

Bypass1

1.0

MCMC-Bypa ss[1]

0.90

5000

0.6

Index

0.7

N = 5000

0.9

1.0

Bandw idth = 0.006248

Densitas Kerne l-Beta[1]

0.2

Beta

0.0

-4

Beta

0.4

0 2

MCMC-Beta

0.8

0

1000

2000

3000

4000

5000

-6

Index

-4
N = 5000

-2

0

2

Bandw idth = 0.1484

Plot time series untuk MCMC Bayesian dan densitas kernel ditujukkan dalam

Gambar 2. Rantai Markov yang terbentuk ditunjukkan dari garis hitam untuk
MCMC-Ring[1], MCMC-Bypass[1] dan MCMC-Beta. Plot dari time series
menunjukkan gambaran rantai Markov yang dibangkitkan. Updating rantai Markov
sebanyak 10.000 iterasi. Plot Gambar 2. menunjukkan nilai MCMC selalu positif,
hasil plot nampak rapat dan dapat merespon keseluruhan variabel berarti didapati
13

model telah konvergen.

Nilai estimasi densitas posterior dapat dilihat dari plot

dnsitas kernel. Estimasi densitas kernel memberikan plot yang bagus karena
dihasilkan densitas yang cenderung halus. Plot dari parameter beta menunjukkan
bahwa distribusi gambar yang dihasilkan berdistribusi normal. Gambaran MCMC
mengindikasikan bahwa nilai yang ditunjukkan berasal dari sebaran posterior yang
dibentuk oleh rantai Markov.
Gambar 3. Gambaran running quantiles dan autokorelasi
Ring[1]

Bypass[1]

1.0

Bypass[1]

1.0
0.95
0.9
0.85
0.8

0.95
0.9
2500

5000

7500

401

2500

iteration

7500

401

20

30

7500

1.0
ACF

0.6

0.8

1.0
0.8

0.2
0.0

0.0

0.2

0.4

ACF
10

5000

Se rie s Be ta [5001:10000]

0.6

0.8
0.6
0.4
0.2
0.0
0

2500

iteration

Se rie s Bypa ss1[5001:10000

1.0

Se rie s Ring1[5001:10000]

ACF

5000
iteration

0.4

401

1.0
0.95
0.9
0.85
0.8

0

10

Lag

20
Lag

30

0

10

20

30

Lag

Gambar 3. menunjukkan plot dari running quantiles yang merepresentasikan
gambaran mengenai nilai dari gambaran kinerja dari sampel yang bagus karena
ditunjukkan dari posisi plot garis berada di tengah dari batas atas dan bawah. Pada
gambaran running quantiles sumbu horizontal menunjukkan bangkitan rantai
Markov, sedangkan sumbu vertikal menunjukkan nilai estimasi titik nya. Nilai
autokorelasi untuk tiap node dan parameter ditunjukkan pula pada Gambar 3. Nilai
autokorelasi menunjukkan bahwa data yang dibangkitkan memenuhi sifar rantai

14

Markov. Untuk menggambar nilai autokorelasi digunakan fungsi acf pada R i386
3.0.1.
Berdasarkan analisis yang dilakukan diperoleh estimasi parameter beta dari
model Cox-Regresion untuk pasien penderita jantung koroner dengan
Bayesian

menggunakan dua treatment yakni ring dan bypass sebesar -0.8789

sehingga model Cox-Regression dari fungsi survival
S (t ; z)

estimasi

0

(t ) exp( 0.8789 zi ) ) dan

exp( 1.824764737) exp(-0.8789z ) .

Kesimpulan
Dalam paper ini diperoleh parameter dari model Cox-Regression untuk data
ketahanan hidup pasien penderita jantung koroner dengan Bayesian survival analysis.
Penelitian ini dapat dikembangkan untuk analisis survival model Weibul dengan
metode Bayesian.

DAFTAR PUSTAKA
[1] Departemen Kesehatan Republik Indonesia.2007.Profil Kesehatan Indonesia
2005. Jakarta
[2] World Health Organization. 2014. The top 10 causes of death. Swiss: WHO .
diakses
pada
Senin
15
September
2014
pukul
9.41.
http://www.who.int/mediacentre/factsheets/fs310/en/
[3] Reskianti,Kiki, Nuriti Sunusi dan Nasrah Sirajang.2014.Estimasi Bayesian pada
Analisis Data Ketahanan Hidup Berdistribusi Eksponensial melalui Pendekatan
SELF. Studi Kasus: Analisis Ketahanan Hidup Flourophores .Jurusan
Matematika,
Fakultas
Matematika
dan
Ilmu
Pengetahuan
Alam.UNHAS:Makassar.
[4] Hendrajaya, Yani, Adi Setiawan dan Hanna Arini Parhusip.2008. Penerapan
Analisis Survival untuk Menaksir Waktu Bertahan Hidup bagi Penderita
Penyakit Jantung. Program Studi Matematika. Fakultas Sains dan Matematika.
UKSW : Salatiga.

15

[5] Perra, Silvia.2013. Objective Bayesian Variable Selection for Censored Data .
Universitas Cagliari: Italia.
[6] Subanar,Prof.,Ph.D.2013.Statistika Matematika .Graha Ilmu: Yogyakarta
[7] Candra Siska, Ade. 2011. Inferensi Statistik Distribusi Binomial Dengan
Metode Bayes Menggunakan Prior Konjugat. Universitas Diponegoro:
Semarang.
http://eprints.undip.ac.id/29153/1/ade_candra.pdf
[8] Rahayu, Ninuk, Adi Setiawan, Tundjung Mahatma.2013. Analisis Regresi Cox
Proporsional Hazards pada Ketahanan Hidup Pasien Diabetes Mellitus. Program
Studi Matematika. Fakultas Sains dan Matematika. UKSW : Salatiga.
[9] Hidayah, Eny. 1994. Analisis Ketahanan Hidup dengan Metode Gehan MantelHaenszel dan Tarone-Ware untuk 2 Sampel Sampai K Sampel. Universitas
Diponegoro : Semarang.
[10] Mustafa, Ayman dan Anis Ben Ghorbal.2011. Using WinBUGS to Cox Model
with Changing from the Ba seline Hazard Function. Fakultas Matematika.
Universitas Islam Al-Imam Muhammad Ibn Saud : Saudi Arabia.
[11] Andrew E Long. 1999. Leuk: survival analysis using Cox regression. Diakses
pada
Selasa
16
September
2014
pukul
20.12
.
http://users.aims.ac.za/~mackay/BUGS/Manual05/Examples1/node29.html
[12] Hidayah,Entin. Model Disagregasi Data Hujan Temporal dengan Pendekatan
Bayesian sebagai Input Permodelan Banjir .ITS:Surabaya.
[13] London,Dick FSA. 1997.Survival Model and Their Estimation. ACTEX
Publication : USA.
.[14] Klein, J.P dan Moeschberger, M.L.1997. Survival Analysis : Techniques for
Censored and Truncated Data . New York. Springer-Verlag New York Inc.

16

BAYESIAN SURVIVAL ANALYSIS UNTUK MENGESTIMASI PARAMETER

MODEL WEIBULL-REGRESSION PADA KASUS KETAHANAN HIDUP
PASIEN PENDERITA JANTUNG KORONER
A. Dewi Lukitasari1, Adi Setiawan2, Leopoldus Ricky Sasongko3
1,2,3

Program Sudi Matematika, Fakultas Sains dan Matematika,

Universitas Kristen Satya Wacana, Jl.Diponegoro No.52-60, Salatiga.
1

[email protected],2 [email protected],
3

[email protected]

ABSTRAK

Paper ini membahas mengenai estimasi parameter model Weibull-Regression
untuk data tersensor pada kasus ketahanan hidup pasien penderita jantung koroner
dengan pendekatan Bayesian survival analysis. Data yang digunakan adalah data
simulasi waktu hidup pasien, status pasien (hidup/mati) dan treatment yang
dikenakan yaitu ring dan bypass. Pendekatan Bayesian (Bayesian approach)
digunakan untuk mencari distribusi posterior parameter.

Metode Markov Chain

Monte Carlo (MCMC) digunakan untuk membangkitkan Rantai Markov guna

mengestimasi parameter meliputi koefisien regresi (  ) dan parameter r dari model
survival Weibull. Parameter  dan r yang diperoleh digunakan untuk menghitung

fungsi survival tiap pasien untuk tiap treatment yang sekaligus menunjukkan
probabilitas bertahan hidup pasien penderita jantung koroner.
Kata Kunci : Survival Analysis, model Weibull-Regression, Bayesian, Markov
Chain Monte Carlo (MCMC)

1

PENDAHULUAN
Pada makalah [1] telah dibahas cara mengestimasi parameter model CoxRegression pada kasus ketahanan hidup pasien penderita jantung koroner [1].

Permodelan data survival dengan menggunakan Bayesian survival analysis
menggunakan Cox-Regression tidak memperhatikan adanya data tersensor.
Kenyataannya, selama proses pengamatan berlangsung terdapat data tersensor
(censored data ) yaitu data yang tidak terobservasi secara penuh (not completely
observable) dalam waktu pengamatan [2]. Hal ini berarti selama proses pengamatan

dalam rentang waktu yang ditentukan, terdapat pasien yang belum selesai menjalani
treatment dan waktu hidupnya tetap dicatat dalam pengamatan. Oleh karena itu

untuk mengolah data tersensor digunakan analisis model survival parametrik. Model
yang sering digunakan adalah model Weibull [2]. Distribusi Weibull digunakan
secara efektif untuk menganalisis data waktu hidup khususnya untuk data tersensor
[3]. Fungsi survival distribusi Weibull diestimasi dan digunakan sebagai distribusi
probabilitas untuk data waktu bertahan hidup pasien penderita jantung koroner.
Diasumsikan data yang digunakan termasuk ke dalam Random Censoring.

DASAR TEORI
Data Tersensor
Data tersensor adalah data yang tidak teramati secara penuh (not completely
observable). Biasanya data tersensor ini dijumpai untuk studi observasi dan penelitian

dengan adanya batasan waktu. Terdapat 3 tipe data tersensor yaitu Tersensor tipe I,
Tersensor tipe II dan Random Censoring. Data tersensor tipe I terjadi apabila subjek
berhenti sebelum pemberian waktu sensor. Data tersensor tipe II terjadi apabila
subjek melampaui batas waktu pengamatan dan waktu survivenya catat jika subjek
telah mengalami kegagalan. Random Censoring adalah tipe data tersensor yang sering
terjadi [2].

2

Distribusi Weibull
Distribusi Weibull merupakan distribusi yang sering digunakan dalam analisis
parametrik untuk fungsi survival. Distibusi Weibull banyak digunakan pada aplikasi
di bidang industri maupun biomedis. Realitas yang ditemui untuk bidang engineering
digunakan untuk menggambarkan waktu kegagalan (time to failure) pada barang
elektronik dan sistem mekanik serta untuk memodelkan ketahanan barang elektronik
[3]. Secara umum fungsi kepadatan probabilitas (probability density function) dari
distribusi Weibull adalah:
f (t ) 

r
r

t

r 1

  t r 
exp     dengan r ,   0 dan t  0 .
    

(1)

1
Dengan mensubtitusikan     ke dalam persamaan (1) maka diperoleh :
 
r

f (t )  r t r 1 exp( t r ) .

(2)

Shape parameter dan scale parameter berurutan ditunjukkan oleh nilai r dan  . Scale

parameter (parameter skala) adalah jenis khusus dari parameter numerik yang
menunjukkan besarnya distribusi data. Semakin kecil nilai dari scale arameter maka
distribusi data akan menyebar. Scale parameter (parameter bentuk) adalah jenis
khusus dari parameter numerik yang menunjukkan bentuk dari kurva.

Fungsi

survival untuk distribusi Weibull dapat diperoleh dengan mengintegralkan fungsi
kepadatan probabilitas pada persamaan (1) sehingga

S (t )   f (u )du  exp( t r ).


(3)

t

Laju kegagalan pasien ditunjukkan oleh fungsi hazard (hazard function) dari
distribusi Weibull yaitu:

 0 (t ) 

f (t ) d
 ln S (t )  r t r 1 .
S (t ) dt

(4)

Fungsi hazard kumulatifnya (cumulative hazard function) ditunjukkan seperti di
bawah ini:

3

 0 (t )    0 (u )du t r .
t

(5) [4].

0

Weibull-Regression

Model regresi Weibull untuk distribusi dari fungsi survival dapat dirumuskan
sebagai berikut:

f (t i , zi )  re  ' zi t i

r 1

exp( e  ' zi t i )
r

(6)

dengan mengganti  i  e  ' z maka persamaan (6) berubah menjadi:
i

f (t i ,  i )  r  i t i

r 1

exp(   i t i )
r

(7)
dengan t i menunjukkan waktu bertahan hidup untuk data pasien yang tersensor
dengan vektor covariate z i [5]. Dalam hal ini r sebagai parameter yang akan
diestimasi nilainya. Distribusi Weibull digunakan karena fleksibel meliputi bentuk

dan model sederhana yang memungkinkan perubahan kenaikan r  1 , penurunan

r  1 dan laju kegagalan yang konstan untuk r  1 [6]. Koefisien regresi dari model

Weibull adalah  yang diperoleh dengan mengasumsikannya sebagai prior yang

berdistribusi normal  ~ N (0,0.0001) . Parameterisasinya Ti ~ Weibull (ri ,  i ) .

Distribusi Prior Model Weibull
Penentuan distribusi prior model Weibull ditentukan dengan mengambil

distribusi yang sering digunakan sebagai standar yaitu Normal N (0,  2 ) dengan nilai

 2 diambil nilai 0.0001 sebagai vague precision untuk model regresi Weibull.

Penentuan distribusi Prior untuk penentuan shape parameter r menggunakan
distribusi Gamma(1,0.0001) untuk fungsi distribusi survival yang turun perlahan pada
saat nilai t  0 (positive real line) [5].

4

Fungsi Likelihood Model Weibull
Fungsi likelihood yang biasa digunakan untuk menganalisis data tersensor adalah
L( D | r ,  )   f (t i )  i S (t i )

(1 i )

n

i 1

.

(9)

Dengan mensubtitusikan f (t i ) diberikan pada persamaan (2) dan S (t i ) pada



 exp( t )

persamaan (3) maka diperoleh fungsi likelihood untuk Model Weibull yaitu:
L( D | r ,  )   re
n

i 1

 ' zi

ti

r 1

exp( e

 ' zi

i

r

ti )

r

(1 i )

(10)

dengan  i  0 jika observasi ke-i tersensor dan  i  1 jika observasi ke-i tidak
tersensor [2].
Aproksimasi Distribusi Posterior
Dalam estimasi Bayes, setelah informasi tentang sampel dan prior dapat
ditentukan maka distribusi posteriornya dicari dengan cara mengalikan priornya
dengan informasi sampel yang diperoleh dari likelihoodnya [7]. Dituliskan sebagai
berikut:

P (r ,  | D )  L( D | r ,  ) P (r ) P (  ) .

(11)

Akan difokuskan dalam mengestimasi parameter r dan  . Karena model rumit
karena mengandung banyak parameter maka distribusi posterior susah untuk
diestimasi secara langsung, maka perlu adanya suatu pendekatan menggunakan
metode simulasi dengan MCMC (Markov Chain Monte Carlo). Pada proses MCMC
dipilih menggunakan algoritma Gibbs Sampling.
Algoritma Gibbs Sampling dalam winBUGS membutuhkan nilai awal dari

parameter yang akan di estimasi. Nilai awal ditentukan yaitu  ~ Normal (0,0.0001)

(
) . Langkah manual penyusunan algoritma Gibbs Sampling
dan r ~Ga mma 1,0.0001

dibuat dengan prosedur penentuan ( P (r | D,  ), P (r | D,  )) dengan langkah pada
persamaan (12) dan (13) yaitu:

P (  | D, r )  P (  ) L( D | r ,  )

dan

5

(12)

P (r | D,  )  P (r ) L( D | r ,  ) .

(13)

Langkah pada persamaan (12) dan (13) diulang sebanyak bilangan B yang cukup
besar, dengan B merupakan banyaknya update pada software WinBUGS 1.4 yaitu
proses iterasi guna menyusun rantai Markov hingga diperoleh deret rantai Markov
yang konvergen.

METODE PENELITIAN
Profil data
Data yang digunakan adalah data waktu bertahan hidup, status hidup pasien dan
treatment yang digunakan pasien penderita jantung koroner [4]. Kemudian dilakukan

simulasi dengan menambah data yang tersensor. Data survival ditunjukkan pada
Tabel 1 dengan banyaknya pasien sejumlah 40 pasien dan dua treatment yang
dikenakan yaitu treatment Ring dan Bypass. Dalam hal ini tanda * menunjukkan data
yang tersensor. Banyaknya data yang tersensor untuk treatment Ring sebanyak 1
pasien dan untuk treatment Bypass sebanyak 7 pasien. Status hidup pasien bernilai 0
menunjukkan pasien tetap bertahan hidup saat menjalani treatment dan be