M01494
BAYESIAN SURVIVAL ANALYSIS UNTUK MENGETIMASI PARAMETER
MODEL COX-REGRESSION PADA KASUS KETAHANAN HIDUP
PASIEN PENDERITA JANTUNG KORONER
A. Dewi Lukitasari1, Adi Setiawan2, Leopoldus Ricky Sasongko3
1,2,3
Program Sudi Matematika, Fakultas Sains dan Matematika,
Universitas Kristen Satya Wacana, Jl.Diponegoro No.52-60, Salatiga.
1
[email protected],2 [email protected],
3
[email protected]
ABSTRAK
Penerapan model Cox-Regression dalam konteks survival analysis dengan
pendekatan Bayesian untuk memodelkan ketahanan hidup pasien penderita jantung
koroner dibahas dalam paper ini. Data yang digunakan adalah waktu hidup pasien,
status pasien (hidup/mati) dan treatment yang dikenakan. Diambil dua treatment yang
digunakan oleh pasien penderita jantung koroner yaitu ring dan bypass. Pendekatan
yang digunakan adalah pendekatan Bayesian (Bayesian approach) untuk mencari
distribusi posterior parameter. Updating data menggunakan metode Markov Chain
Monte Carlo (MCMC) dengan algoritma Gibbs Sampling. Software winBUGS 1.4
membantu dalam mengestimasi nilai setiap parameter yaitu koefisien regresi
.
Parameter yang diestimasi dari model Cox-Regression digunakan untuk menghitung
probabilitas bertahan hidup pasien penderita jantung koroner.
Kata Kunci : Survival Analysis, model Cox-Regression, Bayesian, Markov Chain
Monte Carlo (MCMC)
1
PENDAHULUAN
Kemajuan ilmu pengetahuan dan teknologi yang kian pesat menuntut berbagai
aspek untuk menemukan inovasi guna mempermudah kehidupan manusia. Inovasi
teknologi yang serba canggih membawa dampak pada perubahan pola hidup
masyarakat yang cenderung serba instan. Tidak dapat dipungkiri pola hidup tersebut
membawa dampak negatif. Diantaranya muncul berbagai jenis penyakit yang
berbahaya dan mematikan, salah satunya adalah penyakit jantung koroner [1].
Menurut World Health Organization (WHO) atau Badan Kesehatan Dunia, penyakit
jantung koroner merupakan penyakit dengan urutan pertama penyebab kematian dan
tersebar di seluruh dunia. Pada tahun 2012 tercatat 7,2 juta orang di seluruh dunia
meninggal setiap tahunnya akibat penyakit ini. Banyaknya orang yang meninggal
akibat ini diperkirakan akan terus meningkat hingga 23,3 juta di tahun 2030 [2].
Karena penyakit ini sangat berbahaya maka seseorang yang terkena penyakit ini akan
melakukan investasi sebagai bentuk antisipasi apabila sewaktu-waktu penyakit ini
kambuh dan harus menjalani perawatan atau operasi. Perusahaan asuransi perlu untuk
menentukan peluang waktu hidup seseorang yang akan melakukan asuransi. Peluang
hidupnya biasa direpresentasikan dengan membuat tabel mortalitas.
Angka kematian yang tinggi akibat penyakit jantung koroner menimbulkan
perkembangan inovasi di bidang aktuaria, engineering dan biostatistik yaitu
munculnya survival analysis yang digunakan untuk memodelkan data survival [3].
Survival analysis bertujuan menduga probabilitas kelangsungan hidup, kekambuhan,
kematian, dan peristiwa-peristiwa lainnya sampai pada periode waktu tertentu serta
mejelaskan pengaruh variabel independent terhadap waktu survive [4]. Teknik
analisis yang biasa digunakan antara lain parametric, semi-parametric dan nonparametric [5]. Salah satu teknik analisis non-parametric sederhana yang digunakan
untuk memodelkan data survival adalah model Cox-regression. Sedangkan untuk
permodelan data dikenal ada dua pendekatan yaitu pendekatan klasik (classical
approach) dan pendekatan Bayesian (Bayesian approach) [6]. Pendekatan klasik
2
memandang parameter bernilai tetap, sedangkan pada pendekatan bayesian parameter
dipandang sebagai variabel random yang memiliki distribusi (distribusi Prior).
Keunggulan pendekatan Bayesian diantaranya mampu menyelesaikan masalah yang
tidak dapat diselesaikan secara analitis dan mampu menawarkan kemungkinan yang
kaya dengan interferensia serta mengeksplor perbedaan-perbedaan interpretasi data
terhadap kriteria kinerja prior [7]. Estimasi parameter model menggunakan estimasi
Bayesian dengan metode Markov-Chain Monte-Carlo (MCMC) berdasarkan
algoritma Gibbs Sampling. Salah satu kontribusi yang dapat bermanfaat bagi
perusahaan asuransi kejiwaan untuk penyakit kritis seperti asuransi operasi dalam
membuat kalkulasi asuransi (insurance calculations) yang akan digunakan untuk
membuat perhitungan asuransi sehubungan dengan orang-orang yang dipilih untuk
cakupan asuransi.
Berdasarkan uraian di atas, pada paper ini dibahas terlebih dahulu cara
mengestimasi parameter menggunakan pendekatan klasik dengan menggunakan
model regresi Cox-Proporsional Hazard pada kasus ketahanan hidup pasien
penderita jantung koroner, kemudian dilanjutkan dengan menggunakan pendekatan
Bayesian survival analysis menggunakan Cox-regression. Tujuan dari penelitian ini
untuk memperoleh model ketahanan hidup pasien penderita jantung koroner dengan
Bayesian survival analysis menggunakan Cox-regression. Dalam proses estimasi
diasumsikan bahwa tidak ada kegagalan yang dapat terjadi secara bersamaan. Hal
tersebut berarti terdapat asumsi bahwa satu pasien hanya dapat mengalami satu kali
kegagalan dan satu pasien hanya dikenakan satu treatment saja. Alat bantu
perhitungan menggunakan paket program winBUGS 1.4 yang telah memuat
algoritma BUGS (Bayesian Interface Using Gibbs Sampling).
3
DASAR TEORI
Fungsi Survival
Fungsi survival S (t ) merupakan probabilitas dari seseorang untuk bertahan
hidup setelah waktu yang ditetapkan sebut t . Fungsi survival merupakan merupakan
komplemen dari variabel random fungsi distribusi kumulatif F (t ) maka ditulis
S (t )
P (T
t ) 1 F (t ) [8]. Fungsi distribusi kumulatif dari variabel random T
dengan fungsi kepadatan probabilitas (probability density function) f (t ) , diperoleh
dengan cara mengintegralkan fungsi kepadatan probabilitas sehingga diperoleh
t
F (t )
P (T
f (t )dt dengan T adalah variabel random yang mencerminkan
t)
0
failure time atau waktu bertahan hidup sampai munculnya kejadian tertetu. Kejadian
yang dimaksud adalah kematian [9].
Fungsi Hazard
Fungsi Hazard
0
(t ) menunjukkan laju kegagalan individu untuk mampu
bertahan hidup setelah melewati waktu yang ditetapkan, t . Didefinisikan sebagai
berikut :
0
(t )
lim
dt
0
P (t
T
t dt | T
dt
t)
lim
dt
0
P (t
T t dt )
P (T t )
F ' (t )
S (t )
(1)
dengan T asumsikan kontinu sehingga memiliki fungsi kepadatan probabilitas dan
kejadian berlangsung untuk rentang waktu [t , t dt ) [10]. Untuk fungsi Hazard
kumulatif yaitu
t
0 (t )
0
(u )du
0
Proses Intensitas dan model regresi Cox
Data survival yang ada perlu dilakukan proses menghitung jumlah kegagalan
yang terjadi sampai waktu t . Proses tersebut dinamakan proses intensitas. Proses
4
(2)
intensitas I i (t ) , merepresentasikan hubungan probabilitas subjek i , i 1, 2, ..., n
pada interval [t , t
dt ) . Dirumuskan :
I i (t )dt
E (dN (t ) 1 | Ft )
(3)
N i (t ) menunjukkan kenaikan dari N i untuk interval [t , t
dt ) , Ft menunjukkan
data yang ada sebelum waktu t . Jika nilai i masuk di interval waktu maka diambil
nilai dN i (t ) 1 dan sebaliknya jika tidak maka diambil nilai dNi (t )
Jika nilai dt
0.
0 untuk D {N i (t ), Yi (t ), zi (t )} , probabilitas pada proses
intensitas berubah menjadi instantaneous hazard untuk waktu t dan subjek i
ditunjukkan pada persamaan di bawah ini
I i (t )
Yi (t ) 0 (t ) exp( ' zi )
(4)
dengan D mencerminkan data, Yi (t ) adalah indikator risiko yang ditunjukkan dari
status hidup pasien terdiri dari 0 atau 1 dan zi (t ) adalah vektor covariate. Model
Cox-Regression ditunjukkan dari
individu ke- i . Parameter
0
(t ) exp( ' zi ) yang menunjukan skor risiko untuk
menunjukkan koefisien regresi.
Fungsi eksponensial menjamin I i (t ) bernilai positif. Probabilitas fungsi
survival dirumuskan sebagai berikut :
t
S (t , z)
exp((
0
(u )du ) exp( z ) )
(5)
0
t
Parameter
dan nilai
0 (t )
0
(u )du yang akan diestimasi dengan estimasi non-
0
parametric yang akan digunakan untuk mengestimasi model survival [11].
Distribusi Prior
Distribusi prior mencerminkan kepercayaan subyektif parameter sebelum sampel
diambil. Penentuan distribusi prior dapat ditentukan berdasarkan ruang parameternya.
5
Penentuan
d
0
prior
(t ) ~ Gamma (cd
dengan
*
0
mengambil
(t ), c ) . d
hazard yang belum diketahui dan
c
*
0
Ni (t )
konjugat
sehingga
(t ) menunjukann perkiraan prior dari fungsi
menujukkan derajat konfidensi [11].
Fungsi Likelihood
Fungsi likelihood yang biasa digunakan adalah :
L( D | ,
0
(t )))
Li ( D | ,
0
(6)
(t ))
n
L( D | ,
I i (t ) dNi (t ) exp
0 (t )
i 1
t 0
t 0
I i (t ) dt
(7)
Mengganti nilai I i (t ) dengan persamaan (4) diperoleh persamaan likelihood sebagai
berikut:
n
L( D | ,
0 (t ))
(Yi (t ) exp( ' zi )d
i 1
(t )) dN (t ) exp
i
0
t 0
t 0
(Yi (t ) exp( ' zi )d
0
(t ) dt
(8)
dengan
d
0
(t )
mencerminkan
kenaikan
dari
fungsi
hazard,
dN i (t ) ~ Poisson( I i (t ))dt merupakan kenaikan yang sangat kecil dari N i (t ) dan
0
(t ) menunjukkan baseline hazard function terintegrasi selama interval [t , t dt )
[5].
Distribusi Posterior
Dalam estimasi Bayes, setelah informasi tentang sampel dan prior dapat
ditentukan maka distribusi posteriornya dicari dengan mengalikan priornya dengan
informasi sampel yang diperoleh dari likelihoodnya [7]. Dituliskan sebagai berikut:
P( ,
0
(t ) | D )
L( D | ,
Akan difokuskan dalam mengestimasi parameter
0
(t ) P ( ) P (
dan
0
0
(t )) .
(9)
(t ) . Karena model cukup
kompleks distribusi posterior susah untuk dicari secara langsung maka perlu adanya
suatu pendekatan menggunakan metode simulasi dengan MCMC (Markov Chain
Monte Carlo). Pada proses MCMC dipilih menggunakan algoritma Gibbs Sampling.
6
Kemudahan yang diperoleh dari penggunaan metode MCMC pada analisis
Bayesian antara lain metode MCMC dapat menyederhanakan bentuk integral yang
kompleks dengan dimensi besar menjadi bentuk integral yang sederhana dengan satu
dimensi. MCMC dapat mengestimasi densitas data dengan cara membangkitkan suatu
rantai Markov yang berurutan sebanyak N yang cukup besar sampai diperoleh
konvergen [12]. Salah satu keunggulan MCMC terletak pada performa yang tidak
terlalu sensitif pada penggunaan nilai awal.
Proses penyusunan algoritma Gibbs Sampling perlu ditentukan nilai awal dari
parameter yang akan diestimasi yaitu
penyusunan
( P ( | D,
0
algoritma
(t )), P (
0
Gibbs
0
~ Normal (0,
Sampling
2
) dan
mengikuti
0
prosedur
(t ) . Manual
penentuan
(t ) | D, )) dengan langkah pada persamaan (10) dan (11) yaitu
P ( | D,
0
(t ))
P ( )P (D | ,
0
(t ))
(10)
dan
P(
0
(t ) | D, )
P(
0
(t )) .
(11)
Langkah pada persamaan (10) dan (11) diulang sebanyak B yang cukup besar, dengan
B merupakan banyaknya update pada penyusunan rantai Markov hingga diperoleh
deret rantai Markov yang konvergen.
Gibbs Sampling termasuk ke dalam dua kategori algoritma utama
dalam MCMC selain algoritma Metropolis. Gibbs Sampling adalah teknik
membangkitkan variabel acak dari distribusi marginal secara tidak langsung tanpa
harus menghitung densitasnya.
7
METODE PENELITIAN
Profil data
Data yang digunakan adalah data waktu bertahan hidup, status hidup pasien dan
treatment yang digunakan pasien penderita jantung koroner [4]. Data ditunjukkan
pada Tabel 1. Pasien sebanyak 40 pasien dan pasien yang mengalami kegagalan
(meninggal) saat menjalani treatment sebanyak 8 pasien.
Langkah-langkah penelitian
Pengolahan data dengan menggunakan software winBUGS 1.4. Software
winBUGS 1.4 adalah paket program yang dirancang khusus untuk memfasilitasi
permodelan data Bayesian menggunakan implementasi MCMC yang bekerja dalam
sistem operasi windows. Pengolahan data survival dilakukan dengan tahapan dan
spesifikasi model meliputi pengecekan terhadap syntax model, loading data,
compiling model, inisialisasi, menentukan iterasi MCMC sebanyak 10.000 kali guna
membangkitkan Rantai-Markov. Penyusunan parameter
dan node Ring serta node
Bypass. Updating data parameter sebanyak 10.000. Dalam ploting masing-masing
node dan parameter beta nilai Markov dilakukan burn in sebanyak 5000 data, dan
diambil bangkitan rantai dari data ke 5001 sampai dengan 10.000.
Tabel 1. Data waktu bertahan hidup pasien penderita jantung koroner
No
1
2
3
4
5
6
7
8
9
10
11
12
Waktu
(bulan)
26
26
38
51
52
56
57
61
62
62
66
71
Status
Treatment
No
0
0
0
0
0
0
0
1
0
0
0
1
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
21
22
23
24
25
26
27
28
29
30
31
32
8
Waktu
(bulan)
32
33
42
42
56
56
60
65
78
87
87
93
Status
Treatment
0
0
0
0
0
0
1
0
0
0
0
0
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
13
14
15
16
17
18
19
20
71
75
83
106
123
128
156
183
0
0
0
0
0
0
0
0
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
33
34
35
36
37
38
39
40
102
116
116
146
161
173
178
182
0
0
1
1
0
1
1
1
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
ANALISIS HASIL
Proses analisis dilakukan pada data survival yang terdiri dari n 40 dan
T
8 , dengan n menyatakan total pasien dan T menunjukkan pasien yang mengalami
kegagalan dalam proses treatment. Digunakan dan diselidiki terlebih dahulu dengan
pendektan klasik yaitu Regresi Cox-Proporsional Hazard dengan load packages
survival yang ada pada software R i386 3.0.1. Waktu hidup dan status sebagai
variabel yang dependent terhadap treatment. Hal tersebut berarti treatment sebagai
variabel independent dan probabilitas survival tergantung pada jenis treatment yang
digunakan. Diperoleh gambaran hasil yang dinyatakan pada Tabel 2.
Tabel 2. Hasil estimasi node Ring dengan metode klasik non-parametrik
Node
Waktu
Survival
Ring [1]
Ring [2]
61
71
0.923
0.821
Standard
Batas
Batas
Error
minimum
Maksimum
0.0739
0.1169
0.798
0.621
1
1
Tabel 3. Hasil estimasi node Bypass dengan metode klasik non- parametric
Batas
Node
Waktu
Survival
Standard
Error
minimum
Batas
Maksimum
Bypass[1]
Bypass[2]
Bypass[3]
Bypass[4]
60
116
146
173
0.929
0.796
0.637
0.424
0.0688
0.1362
0.1793
0.2105
0.8030
0.5691
0.3667
0.1606
1
1
1
1
9
Bypass[5]
Bypass[6]
178
182
0.212
0.000
0.1833
-
0.0391
-
1
-
Tabel 4. Hasil estimasi parameter Beta dengan metode klasik
Node
Survival
Estimasi
Titik
Batas
minimum
Batas
Maksimum
Beta
0.408
-0.6851
0.0778
0.9053
Tabel 4. menunjukkan nilai estimasi titik yang sekaligus menunjukkan nilai
koefisien regresi yakni sebesar -0.6851. Tingkat signifikansi alfa sebesar 0.5%.
Estimasi interval diambil dengan mengambil exponensial dari minus lower.95 dan
minus upper.95. Batas bawah dan batas atas diperoleh (0.0778, 0.9053) dengan
probabilitas 0.408 yang sudah signifikan karena nilai probabilitasnya lebih besar dari
0.05. Dengan estimasi non parametrik gambaran nilai probabilitas pasien bertahan
hidup untuk masing-masing treatment yang dikenakan terdapat pada Tabel 2 dan
Tabel 3. Ditunjukkan bahwa nilai probabilitas tertinggi ada dalam kelompok bypass
dengan nilai probabilitas sebesar 0.929
hanya selisih cukup kecil yaitu 0.005
signifikan dengan pasien dengan ring yang memiliki probabilitas tertinggi 0.923.
Gambaran grafik
estimasi mean dari fungsi survival ditunjukan
pada
Gambar 1. Pada Gambar 1. Sumbu horizontal menunjukkan waktu bertahan hidup
pasien penderita jantung koroner dalam satuan bulan , sedangkan sumbu vertical
menunjukkan presentase subjek yang masih bertahan hidup. Garis putus-putus pada
Gambar 1. menunjukkan garis survival untuk treatment Ring dan Bypass. Grafik
memiliki kecenderungan mengalami penurunan secara bertahap, tidak dapat
dipungkiri probabilitas pasien untuk bertahan hidup juga semakin kecil. Pada Gambar
1. Terlihat bahwa probabilitas bertahan hidup penderita dengan treatment ring jauh
lebih besar karena penurunan probabilitas tidak sesignifikan jika dengan
menggunakan bypass
.
10
0.6
0.4
Survival Probability
0.8
1.0
Gambar 1. Estimasi mean fungsi survival untuk treatment Ring dan Bypass
Bypass
0.0
0.2
Ring
0
50
100
150
survival Time in Months
Hasil nilai estimasi dan karakteristik untuk masing-masing parameter
ditunjukkan pada Tabel 5, Tabel 6, dan Tabel 7.
Tabel 5. Hasil estimasi Bayesian node Ring
Node
Mean
Standard
Deviasi
Ring[1]
Ring[2]
Ring[3]
Ring[4]
Ring[5]
Ring[6]
Ring[7]
Ring[8]
0.9771
0.9536
0.9262
0.8781
0.8119
0.7185
0.613
0.4868
0.02706
0.04169
0.05832
0.09146
0.1333
0.182
0.2202
0.2417
MC error
( 10 4 )
3.18
5.01
7.47
12.58
19.61
26.98
33.35
37.97
11
Batas
minimum
2,5%
0.9025
0.841
0.7752
0.6403
0.4802
0.2892
0.1471
0.0564
Median
0.9865
0.9659
0.941
0.9009
0.8425
0.7567
0.6429
0.4902
Batas
maksimum
97,5%
0.9996
0.9972
0.9931
0.988
0.9797
0.967
0.9479
0.9169
Tabel 6. Hasil estimasi Bayesian node Bypass
Node
Mean
Standard
Deviasi
MC error
Bypass[1]
Bypass[2]
Bypass[3]
Bypass[4]
Bypass[5]
Bypass[6]
Bypass[7]
Bypass[8]
0.9532
0.9067
0.855
0.7701
0.6615
0.5194
0.3739
0.2289
0.04703
0.06644
0.08318
0.1131
0.1402
0.1651
0.1697
0.1565
4.48
6.53
8.23
10.3
12.73
14.42
14.65
12.8
( 10 4 )
Batas
minimum
2,5%
0.826
0.7398
0.6548
0.5051
0.357
0.189
0.07959
0.01491
Median
0.9679
0.9224
0.8702
0.7862
0.6743
0.5257
0.366
0.2018
Batas
maksimum
97,5%
0.9988
0.9887
0.9701
0.9398
0.8932
0.8192
0.7175
0.5872
Tabel 7. Hasil estimasi Bayesian parameter Beta
Node
Beta
Mean
-0.8789
Standard
Deviasi
0.9409
MC
error
Median
( 10 )
Batas
Minimum
2,5%
Batas
Maksimum
97,5%
0.01502
-2.919
-0.8126
0.7644
4
Mean dan Median dalam Tabel 5 dan Tabel 6 menunjukkan nilai estimasi
titik. Rata-rata dari parameter dalam Tabel 5 dan Tabel 6 merepresentasikan estimasi
nilai rata-rata posterior untuk pasien yang menggunakan treatment ring dan bypass
yang sekaligus mencerminkan peluang pasien untuk bertahan hidup jika
menggunakan treatment tersebut. Nilai mean yang tertinggi untuk pasien dengan
treatment ring adalah 0.9771 sedangkan dengan bypass 0.953 menunjukkan peluang
bertahan hidup seseorang bertahan dengan menggunakan treatment ring akan
menghasilkan nilai peluang bertahan hidup lebih besar dibandingkan dengan
menggunakan bypass yakni sebesar 0.9771. Nilai error dalam penyusunan MCMC
dengan algoritma Gibbs Sampling ditunjukkan dari MC error , diperoleh nilai error
yang kecil karena mendekati 0. Estimator interval untuk parameter ditunjukkan dari
interval konfidensi yakni batas minimum dan maksimum dengan pengambilan nilai
tingkat sifnifikansi
5 %. Estimasi parameter menunjukkan bahwa semua
12
parameter terletak dalam batas interval konfidensi pada posisi antara 2,50% dan
97,50% dan nilainya signifikan yang tidak melewati nilai nol. Adanya interval
konfidensi tersebut menjamin pencakupan dari parameter yang diselidiki. Nilai ratarata posterior yaitu standar error sekaligus menunjukkan koefisien regresi,
diperoleh ditunjukkan pada Tabel 7 sebesar -0.8789.
Gambar 2. Plot time series untuk MCMC Bayesian dan densitas kernel Ring[1], Bypass[1],
dan beta
Densitas Kerne l-Ring[1]
40
0
20
Ring1
0.85
0.70
Ring1
1.00
MCMC-Ring[1]
0
1000
2000
3000
4000
5000
0.70
Index
0.80
N = 5000
1.00
Bandw idth = 0.00302
Densitas Kerne l-Bypa ss[1]
0
1000
2000
3000
4000
0 5 10
Bypass1
0.8
0.6
Bypass1
1.0
MCMC-Bypa ss[1]
0.90
5000
0.6
Index
0.7
N = 5000
0.9
1.0
Bandw idth = 0.006248
Densitas Kerne l-Beta[1]
0.2
Beta
0.0
-4
Beta
0.4
0 2
MCMC-Beta
0.8
0
1000
2000
3000
4000
5000
-6
Index
-4
N = 5000
-2
0
2
Bandw idth = 0.1484
Plot time series untuk MCMC Bayesian dan densitas kernel ditujukkan dalam
Gambar 2. Rantai Markov yang terbentuk ditunjukkan dari garis hitam untuk
MCMC-Ring[1], MCMC-Bypass[1] dan MCMC-Beta. Plot dari time series
menunjukkan gambaran rantai Markov yang dibangkitkan. Updating rantai Markov
sebanyak 10.000 iterasi. Plot Gambar 2. menunjukkan nilai MCMC selalu positif,
hasil plot nampak rapat dan dapat merespon keseluruhan variabel berarti didapati
13
model telah konvergen.
Nilai estimasi densitas posterior dapat dilihat dari plot
dnsitas kernel. Estimasi densitas kernel memberikan plot yang bagus karena
dihasilkan densitas yang cenderung halus. Plot dari parameter beta menunjukkan
bahwa distribusi gambar yang dihasilkan berdistribusi normal. Gambaran MCMC
mengindikasikan bahwa nilai yang ditunjukkan berasal dari sebaran posterior yang
dibentuk oleh rantai Markov.
Gambar 3. Gambaran running quantiles dan autokorelasi
Ring[1]
Bypass[1]
1.0
Bypass[1]
1.0
0.95
0.9
0.85
0.8
0.95
0.9
2500
5000
7500
401
2500
iteration
7500
401
10
20
30
5000
7500
1.0
Se rie s Be ta [5001:10000]
ACF
0.6
0.8
1.0
0.8
0.2
0.0
0.0
0.2
0.4
ACF
0.6
0.8
0.6
0.4
0.2
0.0
0
2500
iteration
Se rie s Bypa ss1[5001:10000]
1.0
Se rie s Ring1[5001:10000]
ACF
5000
iteration
0.4
401
1.0
0.95
0.9
0.85
0.8
0
10
Lag
20
Lag
30
0
10
20
30
Lag
Gambar 3. menunjukkan plot dari running quantiles yang merepresentasikan
gambaran mengenai nilai dari gambaran kinerja dari sampel yang bagus karena
ditunjukkan dari posisi plot garis berada di tengah dari batas atas dan bawah. Pada
gambaran running quantiles sumbu horizontal menunjukkan bangkitan rantai
Markov, sedangkan sumbu vertikal menunjukkan nilai estimasi titik nya. Nilai
autokorelasi untuk tiap node dan parameter ditunjukkan pula pada Gambar 3. Nilai
autokorelasi menunjukkan bahwa data yang dibangkitkan memenuhi sifar rantai
14
Markov. Untuk menggambar nilai autokorelasi digunakan fungsi acf pada R i386
3.0.1.
Berdasarkan analisis yang dilakukan diperoleh estimasi parameter beta dari
model Cox-Regresion untuk pasien penderita jantung koroner dengan
Bayesian
menggunakan dua treatment yakni ring dan bypass sebesar -0.8789
sehingga model Cox-Regression dari fungsi survival
S (t ; z)
estimasi
0
(t ) exp( 0.8789 zi ) ) dan
exp( 1.824764737) exp(-0.8789z ) .
Kesimpulan
Dalam paper ini diperoleh parameter dari model Cox-Regression untuk data
ketahanan hidup pasien penderita jantung koroner dengan Bayesian survival analysis.
Penelitian ini dapat dikembangkan untuk analisis survival model Weibul dengan
metode Bayesian.
DAFTAR PUSTAKA
[1] Departemen Kesehatan Republik Indonesia.2007.Profil Kesehatan Indonesia
2005. Jakarta
[2] World Health Organization. 2014. The top 10 causes of death. Swiss: WHO .
diakses
pada
Senin
15
September
2014
pukul
9.41.
http://www.who.int/mediacentre/factsheets/fs310/en/
[3] Reskianti,Kiki, Nuriti Sunusi dan Nasrah Sirajang.2014.Estimasi Bayesian pada
Analisis Data Ketahanan Hidup Berdistribusi Eksponensial melalui Pendekatan
SELF. Studi Kasus: Analisis Ketahanan Hidup Flourophores .Jurusan
Matematika,
Fakultas
Matematika
dan
Ilmu
Pengetahuan
Alam.UNHAS:Makassar.
[4] Hendrajaya, Yani, Adi Setiawan dan Hanna Arini Parhusip.2008. Penerapan
Analisis Survival untuk Menaksir Waktu Bertahan Hidup bagi Penderita
Penyakit Jantung. Program Studi Matematika. Fakultas Sains dan Matematika.
UKSW : Salatiga.
15
[5] Perra, Silvia.2013. Objective Bayesian Variable Selection for Censored Data .
Universitas Cagliari: Italia.
[6] Subanar,Prof.,Ph.D.2013.Statistika Matematika .Graha Ilmu: Yogyakarta
[7] Candra Siska, Ade. 2011. Inferensi Statistik Distribusi Binomial Dengan
Metode Bayes Menggunakan Prior Konjugat. Universitas Diponegoro:
Semarang.
http://eprints.undip.ac.id/29153/1/ade_candra.pdf
[8] Rahayu, Ninuk, Adi Setiawan, Tundjung Mahatma.2013. Analisis Regresi Cox
Proporsional Hazards pada Ketahanan Hidup Pasien Diabetes Mellitus. Program
Studi Matematika. Fakultas Sains dan Matematika. UKSW : Salatiga.
[9] Hidayah, Eny. 1994. Analisis Ketahanan Hidup dengan Metode Gehan MantelHaenszel dan Tarone-Ware untuk 2 Sampel Sampai K Sampel. Universitas
Diponegoro : Semarang.
[10] Mustafa, Ayman dan Anis Ben Ghorbal.2011. Using WinBUGS to Cox Model
with Changing from the Ba seline Hazard Function. Fakultas Matematika.
Universitas Islam Al-Imam Muhammad Ibn Saud : Saudi Arabia.
[11] Andrew E Long. 1999. Leuk: survival analysis using Cox regression. Diakses
pada
Selasa
16
September
2014
pukul
20.12
.
http://users.aims.ac.za/~mackay/BUGS/Manual05/Examples1/node29.html
[12] Hidayah,Entin. Model Disagregasi Data Hujan Temporal dengan Pendekatan
Bayesian sebagai Input Permodelan Banjir .ITS:Surabaya.
[13] London,Dick FSA. 1997.Survival Model and Their Estimation. ACTEX
Publication : USA.
.[14] Klein, J.P dan Moeschberger, M.L.1997. Survival Analysis : Techniques for
Censored and Truncated Data . New York. Springer-Verlag New York Inc.
16
MODEL COX-REGRESSION PADA KASUS KETAHANAN HIDUP
PASIEN PENDERITA JANTUNG KORONER
A. Dewi Lukitasari1, Adi Setiawan2, Leopoldus Ricky Sasongko3
1,2,3
Program Sudi Matematika, Fakultas Sains dan Matematika,
Universitas Kristen Satya Wacana, Jl.Diponegoro No.52-60, Salatiga.
1
[email protected],2 [email protected],
3
[email protected]
ABSTRAK
Penerapan model Cox-Regression dalam konteks survival analysis dengan
pendekatan Bayesian untuk memodelkan ketahanan hidup pasien penderita jantung
koroner dibahas dalam paper ini. Data yang digunakan adalah waktu hidup pasien,
status pasien (hidup/mati) dan treatment yang dikenakan. Diambil dua treatment yang
digunakan oleh pasien penderita jantung koroner yaitu ring dan bypass. Pendekatan
yang digunakan adalah pendekatan Bayesian (Bayesian approach) untuk mencari
distribusi posterior parameter. Updating data menggunakan metode Markov Chain
Monte Carlo (MCMC) dengan algoritma Gibbs Sampling. Software winBUGS 1.4
membantu dalam mengestimasi nilai setiap parameter yaitu koefisien regresi
.
Parameter yang diestimasi dari model Cox-Regression digunakan untuk menghitung
probabilitas bertahan hidup pasien penderita jantung koroner.
Kata Kunci : Survival Analysis, model Cox-Regression, Bayesian, Markov Chain
Monte Carlo (MCMC)
1
PENDAHULUAN
Kemajuan ilmu pengetahuan dan teknologi yang kian pesat menuntut berbagai
aspek untuk menemukan inovasi guna mempermudah kehidupan manusia. Inovasi
teknologi yang serba canggih membawa dampak pada perubahan pola hidup
masyarakat yang cenderung serba instan. Tidak dapat dipungkiri pola hidup tersebut
membawa dampak negatif. Diantaranya muncul berbagai jenis penyakit yang
berbahaya dan mematikan, salah satunya adalah penyakit jantung koroner [1].
Menurut World Health Organization (WHO) atau Badan Kesehatan Dunia, penyakit
jantung koroner merupakan penyakit dengan urutan pertama penyebab kematian dan
tersebar di seluruh dunia. Pada tahun 2012 tercatat 7,2 juta orang di seluruh dunia
meninggal setiap tahunnya akibat penyakit ini. Banyaknya orang yang meninggal
akibat ini diperkirakan akan terus meningkat hingga 23,3 juta di tahun 2030 [2].
Karena penyakit ini sangat berbahaya maka seseorang yang terkena penyakit ini akan
melakukan investasi sebagai bentuk antisipasi apabila sewaktu-waktu penyakit ini
kambuh dan harus menjalani perawatan atau operasi. Perusahaan asuransi perlu untuk
menentukan peluang waktu hidup seseorang yang akan melakukan asuransi. Peluang
hidupnya biasa direpresentasikan dengan membuat tabel mortalitas.
Angka kematian yang tinggi akibat penyakit jantung koroner menimbulkan
perkembangan inovasi di bidang aktuaria, engineering dan biostatistik yaitu
munculnya survival analysis yang digunakan untuk memodelkan data survival [3].
Survival analysis bertujuan menduga probabilitas kelangsungan hidup, kekambuhan,
kematian, dan peristiwa-peristiwa lainnya sampai pada periode waktu tertentu serta
mejelaskan pengaruh variabel independent terhadap waktu survive [4]. Teknik
analisis yang biasa digunakan antara lain parametric, semi-parametric dan nonparametric [5]. Salah satu teknik analisis non-parametric sederhana yang digunakan
untuk memodelkan data survival adalah model Cox-regression. Sedangkan untuk
permodelan data dikenal ada dua pendekatan yaitu pendekatan klasik (classical
approach) dan pendekatan Bayesian (Bayesian approach) [6]. Pendekatan klasik
2
memandang parameter bernilai tetap, sedangkan pada pendekatan bayesian parameter
dipandang sebagai variabel random yang memiliki distribusi (distribusi Prior).
Keunggulan pendekatan Bayesian diantaranya mampu menyelesaikan masalah yang
tidak dapat diselesaikan secara analitis dan mampu menawarkan kemungkinan yang
kaya dengan interferensia serta mengeksplor perbedaan-perbedaan interpretasi data
terhadap kriteria kinerja prior [7]. Estimasi parameter model menggunakan estimasi
Bayesian dengan metode Markov-Chain Monte-Carlo (MCMC) berdasarkan
algoritma Gibbs Sampling. Salah satu kontribusi yang dapat bermanfaat bagi
perusahaan asuransi kejiwaan untuk penyakit kritis seperti asuransi operasi dalam
membuat kalkulasi asuransi (insurance calculations) yang akan digunakan untuk
membuat perhitungan asuransi sehubungan dengan orang-orang yang dipilih untuk
cakupan asuransi.
Berdasarkan uraian di atas, pada paper ini dibahas terlebih dahulu cara
mengestimasi parameter menggunakan pendekatan klasik dengan menggunakan
model regresi Cox-Proporsional Hazard pada kasus ketahanan hidup pasien
penderita jantung koroner, kemudian dilanjutkan dengan menggunakan pendekatan
Bayesian survival analysis menggunakan Cox-regression. Tujuan dari penelitian ini
untuk memperoleh model ketahanan hidup pasien penderita jantung koroner dengan
Bayesian survival analysis menggunakan Cox-regression. Dalam proses estimasi
diasumsikan bahwa tidak ada kegagalan yang dapat terjadi secara bersamaan. Hal
tersebut berarti terdapat asumsi bahwa satu pasien hanya dapat mengalami satu kali
kegagalan dan satu pasien hanya dikenakan satu treatment saja. Alat bantu
perhitungan menggunakan paket program winBUGS 1.4 yang telah memuat
algoritma BUGS (Bayesian Interface Using Gibbs Sampling).
3
DASAR TEORI
Fungsi Survival
Fungsi survival S (t ) merupakan probabilitas dari seseorang untuk bertahan
hidup setelah waktu yang ditetapkan sebut t . Fungsi survival merupakan merupakan
komplemen dari variabel random fungsi distribusi kumulatif F (t ) maka ditulis
S (t )
P (T
t ) 1 F (t ) [8]. Fungsi distribusi kumulatif dari variabel random T
dengan fungsi kepadatan probabilitas (probability density function) f (t ) , diperoleh
dengan cara mengintegralkan fungsi kepadatan probabilitas sehingga diperoleh
t
F (t )
P (T
f (t )dt dengan T adalah variabel random yang mencerminkan
t)
0
failure time atau waktu bertahan hidup sampai munculnya kejadian tertetu. Kejadian
yang dimaksud adalah kematian [9].
Fungsi Hazard
Fungsi Hazard
0
(t ) menunjukkan laju kegagalan individu untuk mampu
bertahan hidup setelah melewati waktu yang ditetapkan, t . Didefinisikan sebagai
berikut :
0
(t )
lim
dt
0
P (t
T
t dt | T
dt
t)
lim
dt
0
P (t
T t dt )
P (T t )
F ' (t )
S (t )
(1)
dengan T asumsikan kontinu sehingga memiliki fungsi kepadatan probabilitas dan
kejadian berlangsung untuk rentang waktu [t , t dt ) [10]. Untuk fungsi Hazard
kumulatif yaitu
t
0 (t )
0
(u )du
0
Proses Intensitas dan model regresi Cox
Data survival yang ada perlu dilakukan proses menghitung jumlah kegagalan
yang terjadi sampai waktu t . Proses tersebut dinamakan proses intensitas. Proses
4
(2)
intensitas I i (t ) , merepresentasikan hubungan probabilitas subjek i , i 1, 2, ..., n
pada interval [t , t
dt ) . Dirumuskan :
I i (t )dt
E (dN (t ) 1 | Ft )
(3)
N i (t ) menunjukkan kenaikan dari N i untuk interval [t , t
dt ) , Ft menunjukkan
data yang ada sebelum waktu t . Jika nilai i masuk di interval waktu maka diambil
nilai dN i (t ) 1 dan sebaliknya jika tidak maka diambil nilai dNi (t )
Jika nilai dt
0.
0 untuk D {N i (t ), Yi (t ), zi (t )} , probabilitas pada proses
intensitas berubah menjadi instantaneous hazard untuk waktu t dan subjek i
ditunjukkan pada persamaan di bawah ini
I i (t )
Yi (t ) 0 (t ) exp( ' zi )
(4)
dengan D mencerminkan data, Yi (t ) adalah indikator risiko yang ditunjukkan dari
status hidup pasien terdiri dari 0 atau 1 dan zi (t ) adalah vektor covariate. Model
Cox-Regression ditunjukkan dari
individu ke- i . Parameter
0
(t ) exp( ' zi ) yang menunjukan skor risiko untuk
menunjukkan koefisien regresi.
Fungsi eksponensial menjamin I i (t ) bernilai positif. Probabilitas fungsi
survival dirumuskan sebagai berikut :
t
S (t , z)
exp((
0
(u )du ) exp( z ) )
(5)
0
t
Parameter
dan nilai
0 (t )
0
(u )du yang akan diestimasi dengan estimasi non-
0
parametric yang akan digunakan untuk mengestimasi model survival [11].
Distribusi Prior
Distribusi prior mencerminkan kepercayaan subyektif parameter sebelum sampel
diambil. Penentuan distribusi prior dapat ditentukan berdasarkan ruang parameternya.
5
Penentuan
d
0
prior
(t ) ~ Gamma (cd
dengan
*
0
mengambil
(t ), c ) . d
hazard yang belum diketahui dan
c
*
0
Ni (t )
konjugat
sehingga
(t ) menunjukann perkiraan prior dari fungsi
menujukkan derajat konfidensi [11].
Fungsi Likelihood
Fungsi likelihood yang biasa digunakan adalah :
L( D | ,
0
(t )))
Li ( D | ,
0
(6)
(t ))
n
L( D | ,
I i (t ) dNi (t ) exp
0 (t )
i 1
t 0
t 0
I i (t ) dt
(7)
Mengganti nilai I i (t ) dengan persamaan (4) diperoleh persamaan likelihood sebagai
berikut:
n
L( D | ,
0 (t ))
(Yi (t ) exp( ' zi )d
i 1
(t )) dN (t ) exp
i
0
t 0
t 0
(Yi (t ) exp( ' zi )d
0
(t ) dt
(8)
dengan
d
0
(t )
mencerminkan
kenaikan
dari
fungsi
hazard,
dN i (t ) ~ Poisson( I i (t ))dt merupakan kenaikan yang sangat kecil dari N i (t ) dan
0
(t ) menunjukkan baseline hazard function terintegrasi selama interval [t , t dt )
[5].
Distribusi Posterior
Dalam estimasi Bayes, setelah informasi tentang sampel dan prior dapat
ditentukan maka distribusi posteriornya dicari dengan mengalikan priornya dengan
informasi sampel yang diperoleh dari likelihoodnya [7]. Dituliskan sebagai berikut:
P( ,
0
(t ) | D )
L( D | ,
Akan difokuskan dalam mengestimasi parameter
0
(t ) P ( ) P (
dan
0
0
(t )) .
(9)
(t ) . Karena model cukup
kompleks distribusi posterior susah untuk dicari secara langsung maka perlu adanya
suatu pendekatan menggunakan metode simulasi dengan MCMC (Markov Chain
Monte Carlo). Pada proses MCMC dipilih menggunakan algoritma Gibbs Sampling.
6
Kemudahan yang diperoleh dari penggunaan metode MCMC pada analisis
Bayesian antara lain metode MCMC dapat menyederhanakan bentuk integral yang
kompleks dengan dimensi besar menjadi bentuk integral yang sederhana dengan satu
dimensi. MCMC dapat mengestimasi densitas data dengan cara membangkitkan suatu
rantai Markov yang berurutan sebanyak N yang cukup besar sampai diperoleh
konvergen [12]. Salah satu keunggulan MCMC terletak pada performa yang tidak
terlalu sensitif pada penggunaan nilai awal.
Proses penyusunan algoritma Gibbs Sampling perlu ditentukan nilai awal dari
parameter yang akan diestimasi yaitu
penyusunan
( P ( | D,
0
algoritma
(t )), P (
0
Gibbs
0
~ Normal (0,
Sampling
2
) dan
mengikuti
0
prosedur
(t ) . Manual
penentuan
(t ) | D, )) dengan langkah pada persamaan (10) dan (11) yaitu
P ( | D,
0
(t ))
P ( )P (D | ,
0
(t ))
(10)
dan
P(
0
(t ) | D, )
P(
0
(t )) .
(11)
Langkah pada persamaan (10) dan (11) diulang sebanyak B yang cukup besar, dengan
B merupakan banyaknya update pada penyusunan rantai Markov hingga diperoleh
deret rantai Markov yang konvergen.
Gibbs Sampling termasuk ke dalam dua kategori algoritma utama
dalam MCMC selain algoritma Metropolis. Gibbs Sampling adalah teknik
membangkitkan variabel acak dari distribusi marginal secara tidak langsung tanpa
harus menghitung densitasnya.
7
METODE PENELITIAN
Profil data
Data yang digunakan adalah data waktu bertahan hidup, status hidup pasien dan
treatment yang digunakan pasien penderita jantung koroner [4]. Data ditunjukkan
pada Tabel 1. Pasien sebanyak 40 pasien dan pasien yang mengalami kegagalan
(meninggal) saat menjalani treatment sebanyak 8 pasien.
Langkah-langkah penelitian
Pengolahan data dengan menggunakan software winBUGS 1.4. Software
winBUGS 1.4 adalah paket program yang dirancang khusus untuk memfasilitasi
permodelan data Bayesian menggunakan implementasi MCMC yang bekerja dalam
sistem operasi windows. Pengolahan data survival dilakukan dengan tahapan dan
spesifikasi model meliputi pengecekan terhadap syntax model, loading data,
compiling model, inisialisasi, menentukan iterasi MCMC sebanyak 10.000 kali guna
membangkitkan Rantai-Markov. Penyusunan parameter
dan node Ring serta node
Bypass. Updating data parameter sebanyak 10.000. Dalam ploting masing-masing
node dan parameter beta nilai Markov dilakukan burn in sebanyak 5000 data, dan
diambil bangkitan rantai dari data ke 5001 sampai dengan 10.000.
Tabel 1. Data waktu bertahan hidup pasien penderita jantung koroner
No
1
2
3
4
5
6
7
8
9
10
11
12
Waktu
(bulan)
26
26
38
51
52
56
57
61
62
62
66
71
Status
Treatment
No
0
0
0
0
0
0
0
1
0
0
0
1
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
21
22
23
24
25
26
27
28
29
30
31
32
8
Waktu
(bulan)
32
33
42
42
56
56
60
65
78
87
87
93
Status
Treatment
0
0
0
0
0
0
1
0
0
0
0
0
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
13
14
15
16
17
18
19
20
71
75
83
106
123
128
156
183
0
0
0
0
0
0
0
0
Ring
Ring
Ring
Ring
Ring
Ring
Ring
Ring
33
34
35
36
37
38
39
40
102
116
116
146
161
173
178
182
0
0
1
1
0
1
1
1
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
Bypass
ANALISIS HASIL
Proses analisis dilakukan pada data survival yang terdiri dari n 40 dan
T
8 , dengan n menyatakan total pasien dan T menunjukkan pasien yang mengalami
kegagalan dalam proses treatment. Digunakan dan diselidiki terlebih dahulu dengan
pendektan klasik yaitu Regresi Cox-Proporsional Hazard dengan load packages
survival yang ada pada software R i386 3.0.1. Waktu hidup dan status sebagai
variabel yang dependent terhadap treatment. Hal tersebut berarti treatment sebagai
variabel independent dan probabilitas survival tergantung pada jenis treatment yang
digunakan. Diperoleh gambaran hasil yang dinyatakan pada Tabel 2.
Tabel 2. Hasil estimasi node Ring dengan metode klasik non-parametrik
Node
Waktu
Survival
Ring [1]
Ring [2]
61
71
0.923
0.821
Standard
Batas
Batas
Error
minimum
Maksimum
0.0739
0.1169
0.798
0.621
1
1
Tabel 3. Hasil estimasi node Bypass dengan metode klasik non- parametric
Batas
Node
Waktu
Survival
Standard
Error
minimum
Batas
Maksimum
Bypass[1]
Bypass[2]
Bypass[3]
Bypass[4]
60
116
146
173
0.929
0.796
0.637
0.424
0.0688
0.1362
0.1793
0.2105
0.8030
0.5691
0.3667
0.1606
1
1
1
1
9
Bypass[5]
Bypass[6]
178
182
0.212
0.000
0.1833
-
0.0391
-
1
-
Tabel 4. Hasil estimasi parameter Beta dengan metode klasik
Node
Survival
Estimasi
Titik
Batas
minimum
Batas
Maksimum
Beta
0.408
-0.6851
0.0778
0.9053
Tabel 4. menunjukkan nilai estimasi titik yang sekaligus menunjukkan nilai
koefisien regresi yakni sebesar -0.6851. Tingkat signifikansi alfa sebesar 0.5%.
Estimasi interval diambil dengan mengambil exponensial dari minus lower.95 dan
minus upper.95. Batas bawah dan batas atas diperoleh (0.0778, 0.9053) dengan
probabilitas 0.408 yang sudah signifikan karena nilai probabilitasnya lebih besar dari
0.05. Dengan estimasi non parametrik gambaran nilai probabilitas pasien bertahan
hidup untuk masing-masing treatment yang dikenakan terdapat pada Tabel 2 dan
Tabel 3. Ditunjukkan bahwa nilai probabilitas tertinggi ada dalam kelompok bypass
dengan nilai probabilitas sebesar 0.929
hanya selisih cukup kecil yaitu 0.005
signifikan dengan pasien dengan ring yang memiliki probabilitas tertinggi 0.923.
Gambaran grafik
estimasi mean dari fungsi survival ditunjukan
pada
Gambar 1. Pada Gambar 1. Sumbu horizontal menunjukkan waktu bertahan hidup
pasien penderita jantung koroner dalam satuan bulan , sedangkan sumbu vertical
menunjukkan presentase subjek yang masih bertahan hidup. Garis putus-putus pada
Gambar 1. menunjukkan garis survival untuk treatment Ring dan Bypass. Grafik
memiliki kecenderungan mengalami penurunan secara bertahap, tidak dapat
dipungkiri probabilitas pasien untuk bertahan hidup juga semakin kecil. Pada Gambar
1. Terlihat bahwa probabilitas bertahan hidup penderita dengan treatment ring jauh
lebih besar karena penurunan probabilitas tidak sesignifikan jika dengan
menggunakan bypass
.
10
0.6
0.4
Survival Probability
0.8
1.0
Gambar 1. Estimasi mean fungsi survival untuk treatment Ring dan Bypass
Bypass
0.0
0.2
Ring
0
50
100
150
survival Time in Months
Hasil nilai estimasi dan karakteristik untuk masing-masing parameter
ditunjukkan pada Tabel 5, Tabel 6, dan Tabel 7.
Tabel 5. Hasil estimasi Bayesian node Ring
Node
Mean
Standard
Deviasi
Ring[1]
Ring[2]
Ring[3]
Ring[4]
Ring[5]
Ring[6]
Ring[7]
Ring[8]
0.9771
0.9536
0.9262
0.8781
0.8119
0.7185
0.613
0.4868
0.02706
0.04169
0.05832
0.09146
0.1333
0.182
0.2202
0.2417
MC error
( 10 4 )
3.18
5.01
7.47
12.58
19.61
26.98
33.35
37.97
11
Batas
minimum
2,5%
0.9025
0.841
0.7752
0.6403
0.4802
0.2892
0.1471
0.0564
Median
0.9865
0.9659
0.941
0.9009
0.8425
0.7567
0.6429
0.4902
Batas
maksimum
97,5%
0.9996
0.9972
0.9931
0.988
0.9797
0.967
0.9479
0.9169
Tabel 6. Hasil estimasi Bayesian node Bypass
Node
Mean
Standard
Deviasi
MC error
Bypass[1]
Bypass[2]
Bypass[3]
Bypass[4]
Bypass[5]
Bypass[6]
Bypass[7]
Bypass[8]
0.9532
0.9067
0.855
0.7701
0.6615
0.5194
0.3739
0.2289
0.04703
0.06644
0.08318
0.1131
0.1402
0.1651
0.1697
0.1565
4.48
6.53
8.23
10.3
12.73
14.42
14.65
12.8
( 10 4 )
Batas
minimum
2,5%
0.826
0.7398
0.6548
0.5051
0.357
0.189
0.07959
0.01491
Median
0.9679
0.9224
0.8702
0.7862
0.6743
0.5257
0.366
0.2018
Batas
maksimum
97,5%
0.9988
0.9887
0.9701
0.9398
0.8932
0.8192
0.7175
0.5872
Tabel 7. Hasil estimasi Bayesian parameter Beta
Node
Beta
Mean
-0.8789
Standard
Deviasi
0.9409
MC
error
Median
( 10 )
Batas
Minimum
2,5%
Batas
Maksimum
97,5%
0.01502
-2.919
-0.8126
0.7644
4
Mean dan Median dalam Tabel 5 dan Tabel 6 menunjukkan nilai estimasi
titik. Rata-rata dari parameter dalam Tabel 5 dan Tabel 6 merepresentasikan estimasi
nilai rata-rata posterior untuk pasien yang menggunakan treatment ring dan bypass
yang sekaligus mencerminkan peluang pasien untuk bertahan hidup jika
menggunakan treatment tersebut. Nilai mean yang tertinggi untuk pasien dengan
treatment ring adalah 0.9771 sedangkan dengan bypass 0.953 menunjukkan peluang
bertahan hidup seseorang bertahan dengan menggunakan treatment ring akan
menghasilkan nilai peluang bertahan hidup lebih besar dibandingkan dengan
menggunakan bypass yakni sebesar 0.9771. Nilai error dalam penyusunan MCMC
dengan algoritma Gibbs Sampling ditunjukkan dari MC error , diperoleh nilai error
yang kecil karena mendekati 0. Estimator interval untuk parameter ditunjukkan dari
interval konfidensi yakni batas minimum dan maksimum dengan pengambilan nilai
tingkat sifnifikansi
5 %. Estimasi parameter menunjukkan bahwa semua
12
parameter terletak dalam batas interval konfidensi pada posisi antara 2,50% dan
97,50% dan nilainya signifikan yang tidak melewati nilai nol. Adanya interval
konfidensi tersebut menjamin pencakupan dari parameter yang diselidiki. Nilai ratarata posterior yaitu standar error sekaligus menunjukkan koefisien regresi,
diperoleh ditunjukkan pada Tabel 7 sebesar -0.8789.
Gambar 2. Plot time series untuk MCMC Bayesian dan densitas kernel Ring[1], Bypass[1],
dan beta
Densitas Kerne l-Ring[1]
40
0
20
Ring1
0.85
0.70
Ring1
1.00
MCMC-Ring[1]
0
1000
2000
3000
4000
5000
0.70
Index
0.80
N = 5000
1.00
Bandw idth = 0.00302
Densitas Kerne l-Bypa ss[1]
0
1000
2000
3000
4000
0 5 10
Bypass1
0.8
0.6
Bypass1
1.0
MCMC-Bypa ss[1]
0.90
5000
0.6
Index
0.7
N = 5000
0.9
1.0
Bandw idth = 0.006248
Densitas Kerne l-Beta[1]
0.2
Beta
0.0
-4
Beta
0.4
0 2
MCMC-Beta
0.8
0
1000
2000
3000
4000
5000
-6
Index
-4
N = 5000
-2
0
2
Bandw idth = 0.1484
Plot time series untuk MCMC Bayesian dan densitas kernel ditujukkan dalam
Gambar 2. Rantai Markov yang terbentuk ditunjukkan dari garis hitam untuk
MCMC-Ring[1], MCMC-Bypass[1] dan MCMC-Beta. Plot dari time series
menunjukkan gambaran rantai Markov yang dibangkitkan. Updating rantai Markov
sebanyak 10.000 iterasi. Plot Gambar 2. menunjukkan nilai MCMC selalu positif,
hasil plot nampak rapat dan dapat merespon keseluruhan variabel berarti didapati
13
model telah konvergen.
Nilai estimasi densitas posterior dapat dilihat dari plot
dnsitas kernel. Estimasi densitas kernel memberikan plot yang bagus karena
dihasilkan densitas yang cenderung halus. Plot dari parameter beta menunjukkan
bahwa distribusi gambar yang dihasilkan berdistribusi normal. Gambaran MCMC
mengindikasikan bahwa nilai yang ditunjukkan berasal dari sebaran posterior yang
dibentuk oleh rantai Markov.
Gambar 3. Gambaran running quantiles dan autokorelasi
Ring[1]
Bypass[1]
1.0
Bypass[1]
1.0
0.95
0.9
0.85
0.8
0.95
0.9
2500
5000
7500
401
2500
iteration
7500
401
10
20
30
5000
7500
1.0
Se rie s Be ta [5001:10000]
ACF
0.6
0.8
1.0
0.8
0.2
0.0
0.0
0.2
0.4
ACF
0.6
0.8
0.6
0.4
0.2
0.0
0
2500
iteration
Se rie s Bypa ss1[5001:10000]
1.0
Se rie s Ring1[5001:10000]
ACF
5000
iteration
0.4
401
1.0
0.95
0.9
0.85
0.8
0
10
Lag
20
Lag
30
0
10
20
30
Lag
Gambar 3. menunjukkan plot dari running quantiles yang merepresentasikan
gambaran mengenai nilai dari gambaran kinerja dari sampel yang bagus karena
ditunjukkan dari posisi plot garis berada di tengah dari batas atas dan bawah. Pada
gambaran running quantiles sumbu horizontal menunjukkan bangkitan rantai
Markov, sedangkan sumbu vertikal menunjukkan nilai estimasi titik nya. Nilai
autokorelasi untuk tiap node dan parameter ditunjukkan pula pada Gambar 3. Nilai
autokorelasi menunjukkan bahwa data yang dibangkitkan memenuhi sifar rantai
14
Markov. Untuk menggambar nilai autokorelasi digunakan fungsi acf pada R i386
3.0.1.
Berdasarkan analisis yang dilakukan diperoleh estimasi parameter beta dari
model Cox-Regresion untuk pasien penderita jantung koroner dengan
Bayesian
menggunakan dua treatment yakni ring dan bypass sebesar -0.8789
sehingga model Cox-Regression dari fungsi survival
S (t ; z)
estimasi
0
(t ) exp( 0.8789 zi ) ) dan
exp( 1.824764737) exp(-0.8789z ) .
Kesimpulan
Dalam paper ini diperoleh parameter dari model Cox-Regression untuk data
ketahanan hidup pasien penderita jantung koroner dengan Bayesian survival analysis.
Penelitian ini dapat dikembangkan untuk analisis survival model Weibul dengan
metode Bayesian.
DAFTAR PUSTAKA
[1] Departemen Kesehatan Republik Indonesia.2007.Profil Kesehatan Indonesia
2005. Jakarta
[2] World Health Organization. 2014. The top 10 causes of death. Swiss: WHO .
diakses
pada
Senin
15
September
2014
pukul
9.41.
http://www.who.int/mediacentre/factsheets/fs310/en/
[3] Reskianti,Kiki, Nuriti Sunusi dan Nasrah Sirajang.2014.Estimasi Bayesian pada
Analisis Data Ketahanan Hidup Berdistribusi Eksponensial melalui Pendekatan
SELF. Studi Kasus: Analisis Ketahanan Hidup Flourophores .Jurusan
Matematika,
Fakultas
Matematika
dan
Ilmu
Pengetahuan
Alam.UNHAS:Makassar.
[4] Hendrajaya, Yani, Adi Setiawan dan Hanna Arini Parhusip.2008. Penerapan
Analisis Survival untuk Menaksir Waktu Bertahan Hidup bagi Penderita
Penyakit Jantung. Program Studi Matematika. Fakultas Sains dan Matematika.
UKSW : Salatiga.
15
[5] Perra, Silvia.2013. Objective Bayesian Variable Selection for Censored Data .
Universitas Cagliari: Italia.
[6] Subanar,Prof.,Ph.D.2013.Statistika Matematika .Graha Ilmu: Yogyakarta
[7] Candra Siska, Ade. 2011. Inferensi Statistik Distribusi Binomial Dengan
Metode Bayes Menggunakan Prior Konjugat. Universitas Diponegoro:
Semarang.
http://eprints.undip.ac.id/29153/1/ade_candra.pdf
[8] Rahayu, Ninuk, Adi Setiawan, Tundjung Mahatma.2013. Analisis Regresi Cox
Proporsional Hazards pada Ketahanan Hidup Pasien Diabetes Mellitus. Program
Studi Matematika. Fakultas Sains dan Matematika. UKSW : Salatiga.
[9] Hidayah, Eny. 1994. Analisis Ketahanan Hidup dengan Metode Gehan MantelHaenszel dan Tarone-Ware untuk 2 Sampel Sampai K Sampel. Universitas
Diponegoro : Semarang.
[10] Mustafa, Ayman dan Anis Ben Ghorbal.2011. Using WinBUGS to Cox Model
with Changing from the Ba seline Hazard Function. Fakultas Matematika.
Universitas Islam Al-Imam Muhammad Ibn Saud : Saudi Arabia.
[11] Andrew E Long. 1999. Leuk: survival analysis using Cox regression. Diakses
pada
Selasa
16
September
2014
pukul
20.12
.
http://users.aims.ac.za/~mackay/BUGS/Manual05/Examples1/node29.html
[12] Hidayah,Entin. Model Disagregasi Data Hujan Temporal dengan Pendekatan
Bayesian sebagai Input Permodelan Banjir .ITS:Surabaya.
[13] London,Dick FSA. 1997.Survival Model and Their Estimation. ACTEX
Publication : USA.
.[14] Klein, J.P dan Moeschberger, M.L.1997. Survival Analysis : Techniques for
Censored and Truncated Data . New York. Springer-Verlag New York Inc.
16