Model Regresi Cox dengan Hazard Tak Proporsional dan Aplikasinya pada Waktu Ketahanan Pengguna Narkoba

MODEL REGRESI COX DENGAN HAZARD TAK PROPORSIONAL
DAN APLIKASINYA PADA WAKTU KETAHANAN
PENGGUNA NARKOBA

NUR LASMINI

DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI
Dengan ini saya menyatakan bahwa skripsi berjudul Model Regresi Cox
dengan Hazard Tak Proporsional dan Aplikasinya pada Waktu Ketahanan
Pengguna Narkoba adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi
mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Desember 2013
Nur Lasmini
NIM G54090075

ABSTRAK
NUR LASMINI. Model Regresi Cox dengan Hazard Tak Proporsional dan
Aplikasinya pada Waktu Ketahanan Pengguna Narkoba. Dibimbing oleh I
WAYAN MANGKU dan HADI SUMARNO.
Model Cox proportional hazard merupakan regresi semiparametrik dalam
analisis ketahanan untuk mengetahui kovariat yang berpengaruh nyata terhadap
waktu ketahanan sebagai peubah respons. Model tersebut mengasumsikan bahwa
hazard ratio bernilai konstan. Dalam beberapa kasus, asumsi tersebut tidak
terpenuhi. Salah satunya kasus durasi waktu sampai individu kembali
menggunakan narkoba. Pelanggaran terhadap asumsi disebabkan kovariat yang
nilainya bergantung terhadap waktu. Maka dari itu, digunakan model Cox
extended. Untuk mengevaluasi model, digunakan Akaike’s Information Criterion
(AIC). Berdasarkan kriteria tersebut, model terbaik adalah model yang memiliki
nilai AIC terkecil. Kovariat yang berpengaruh nyata terhadap waktu ketahanan

menggunakan model Cox proportional hazard adalah peubah Age, Ivhx3,
Ndrugtx, Race, Site, dan Los, dengan nilai AIC sebesar 4809.405. Sedangkan jika
menggunakan model Cox extended, peubah Ivhx3 tidak berpengaruh nyata dan
Los merupakan peubah yang bergantung terhadap waktu dengan nilai AIC sebesar
4565.573. Oleh karena itu model Cox extended lebih baik daripada model Cox
proportional hazard.
Kata kunci: Akaike’s Information Criterion (AIC), hazard ratio, model Cox
extended, model Cox proportional hazard.

ABSTRACT
NUR LASMINI. Cox Regression Model with Non-Proportional Hazard and
It’s Application on Survival Time’s Drug User . Supervised by I WAYAN
MANGKU and HADI SUMARNO.
Cox proportional hazard model is a semiparametric model of survival
analysis for studying covariates which have effect on survival time as a dependent
variable. This model assumes that hazard ratio is constant. In some cases, this
assumption is not hold. One of them is in the case of survival time until someone
return to consume drug. Violation of this assumption is caused by the time
dependent variables on covariates. Due to this reason, Cox extended model is used.
To evaluate the model, Akaike’s Information Criterion (AIC) is used. Based on

this criterion, the best model is the one which has the smallest value of AIC.
Covariates which have effects on survival time when Cox proportional hazard
model is used are Age, Ivhx3, Ndrugtx, Race, Site, and Los variables with AIC’s
value is 4809.405. When Cox extended model is used, Ivhx3 variable is not
significant and Los variable is time dependent variable, and the AIC’s value of
this model is 4565.573. Therefore Cox extended model is better than Cox
proportional hazard model.
Keywords: Akaike’s Information Criterion (AIC), Cox extended model, Cox
proportional hazard model, hazard ratio.

MODEL REGRESI COX DENGAN HAZARD TAK PROPORSIONAL
DAN APLIKASINYA PADA WAKTU KETAHANAN
PENGGUNA NARKOBA

NUR LASMINI

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Sains
pada

Departemen Matematika

DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013

Judul Skripsi: Model Regresi Cox dengan Hazard Tak Proporsional dan
Aplikasinya pada Waktu Ketahanan Pengguna Narkoba
Nama
: Nur Lasmini
NIM
: G54090075

Disetujui oleh

Prof Dr Ir I Wayan Mangku, MSc
Pembimbing I


Dr Ir Hadi Sumarno, MS
Pembimbing II

Diketahui oleh

Dr Toni Bakhtiar, MSc
Ketua Departemen

Tanggal Lulus:

PRAKATA
Alhamdulillaahirobbil’aalamiinn, puji dan syukur penulis panjatkan
kehadirat
Alloh SWT atas segala karunia-Nya sehingga penulis dapat
menyelesaikan karya ilmiah yang berjudul Model Regresi Cox dengan Hazard
Tak Proporsional dan Aplikasinya pada Waktu Ketahanan Pengguna Narkoba.
Terima kasih banyak penulis ucapkan kepada Bapak Prof Dr Ir I Wayan
Mangku, MSc dan Bapak Dr Ir Hadi Sumarno, MS selaku dosen pembimbing
yang telah memberikan bimbingan serta motivasi dalam menyelesaikan tugas
akhir ini dan mohon maaf jika selama ini penulis banyak melakukan kesalahan,

serta Ibu Dr Ir Endar Hasafah Nugrahani, MS selaku dosen penguji yang telah
memberikan masukan dalam perbaikan tugas akhir.
Penulis juga mengucapkan terima kasih banyak kepada Bapak, Mamah,
mang Ndy, serta keluarga tercinta atas segala do’a, pengorbanan, dan kepercayaan
terhadap penulis. Semoga Alloh SWT membalas dengan segala keberkahan hidup.
Ungkapan terima kasih juga disampaikan kepada Ustadz Ece Hidayat, Ustadz
Abdurrahman, Ustad Dudi Supandi, dan keluarga besar PPM Al Ihya Dramaga
atas segala pelajaran hidup. Di samping itu, penghargaan penulis sampaikan
kepada seluruh Dosen, Staf Departemen Matematika IPB, Yayasan Karya
Salemba Empat dan teman-teman Matematika IPB atas segala ilmu, bantuan dan
dukungannya.
Semoga karya ilmiah ini bermanfaat dalam kebaikan.

Bogor, Desember 2013
Nur Lasmini

DAFTAR ISI
DAFTAR TABEL

viii


DAFTAR GAMBAR

viii

PENDAHULUAN
Latar Belakang

1
1

Tujuan
TINJAUAN PUSTAKA
Analisis Ketahanan

1
2
2

Fungsi Ketahanan


2

Metode Kaplan-Meier (Product Limit)

4

HASIL DAN PEMBAHASAN
Model Cox Proportional Hazard

4
4

Pendugaan Koefisien Kovariat (Parameter)

5

Pengujian Keberartian Koefisien Kovariat (Parameter)

7


Hazard Ratio

7

Menaksir Asumsi Hazard Proporsional
Model Cox Extended

8
10

Pendugaan Koefisien Kovariat (Parameter)

12

Pengujian Keberartian Koefisien Kovariat (Parameter)

12

Hazard Ratio


12

Akaike's Information Criterion (AIC)
APLIKASI PADA WAKTU KETAHANAN PENGGUNA NARKOBA
Model Cox Proportional Hazard
Interpretasi Hazard Ratio

13
14
14
15

Menaksir Asumsi Hazard Proporsional

15

Model Cox Extended

16


Interpretasi Hazard Ratio
SIMPULAN DAN SARAN
Simpulan
Saran

18
18
18
19

DAFTAR PUSTAKA

19

RIWAYAT HIDUP

20

DAFTAR TABEL
1 Hazard ratio
2 Penduga parameter, uji Wald, nilai-p, dan hazard ratio
3 Korelasi dan nilai-p peubah penjelas
4 Nilai AIC model
5 Penduga parameter, uji Wald, nilai-p, dan hazard ratio

11
14
15
17
17

DAFTAR GAMBAR
1 Plot antara peubah Time dan Log-minus-Log ̂ peubah Treat
2 Plot antara peubah Time dan ̂ peubah Treat

16
16

PENDAHULUAN
Latar Belakang
Dalam kehidupan sehari-hari terdapat banyak masalah yang responsnya
berupa waktu ketahanan (survival time) atau sering juga disebut waktu kesintasan.
Misalnya waktu yang diperlukan oleh pasien untuk sembuh dari penyakitnya,
waktu sampai timbulnya reaksi atas suatu perlakuan, dan waktu yang diperlukan
oleh mahasiswa untuk memperoleh pekerjaan pertama setelah lulus. Waktu
ketahanan juga dapat berupa suatu hal negatif yaitu waktu kegagalan (failure),
misalnya durasi waktu rusaknya alat elektronik atau durasi waktu pasien penyakit
tertentu dapat bertahan hidup. Lee (1992) menyatakan bahwa waktu ketahanan
didefinisikan sebagai waktu sampai terjadinya suatu peristiwa. Data pengamatan
waktu ketahanan disebut data ketahanan. Umumnya data ketahanan tidak lengkap,
artinya waktu ketahanan tidak diketahui secara tepat karena terbatasnya waktu
penelitian dan lain-lain. Hal inilah yang menyebabkan distribusi dari waktu
ketahanan menjadi tidak normal melainkan condong ke kanan (positively skewed)
sehingga diperlukan suatu metode yang memfasilitasi ketidaknormalan data
ketahanan yaitu analisis ketahanan (survival analysis).
Waktu ketahanan sering dipengaruhi oleh beberapa faktor sehingga menjadi
daya tarik untuk mengetahui hubungan peubah-peubah penjelas yang disebut
kovariat terhadap waktu ketahanan sebagai peubah respons. Dalam
memodelkannya tidak dapat digunakan regresi klasik karena data tidak menyebar
normal sehingga digunakan regresi Cox proportional hazard, sekalipun distribusi
dari waktu ketahanan tidak dapat diketahui. Dalam beberapa kasus, asumsi
proporsional pada Cox proportional hazard, yaitu hazard ratio (risiko mengalami
peristiwa) kovariat bernilai konstan dari waktu ke waktu atau hazard individu
proporsional terhadap hazard individu lain, tidak terpenuhi. Pada kasus ini
digunakan perluasan model Cox yang memperhatikan pelanggaran terhadap
asumsi pada Cox proportional hazard yaitu Cox stratified dan Cox extended.
Ketidakproporsionalan tersebut disebabkan terdapatnya kovariat yang nilainya
bergantung terhadap waktu (time dependent variable). Sari (2010) telah
menggunakan model Cox extended dengan fungsi terhadap waktu ketahanan
berupa fungsi linier dalam memodelkan loyalitas pengguna kartu gsm prabayar.
Pada karya ilmiah ini penulis mencoba untuk mengkaji model Cox proportional
hazard dan Cox extended dengan fungsi terhadap waktu ketahanan berupa one
step function, fungsi linier, dan fungsi logaritma dalam memodelkan kasus durasi
waktu sampai individu kembali menggunakan narkoba, UMARU Impact Study
dalam http://www.ats.ucla.edu/stat/sas/examples/asa/uis.sas7bdat (UCLA IDRE
c2013) kemudian membandingkan semua model yang dianalisis untuk
memperoleh model terbaik berdasarkan nilai Akaike’s Information Criterion.
Tujuan
Tujuan penulisan karya ilmiah ini adalah:
1 mengkaji model Cox proportional hazard dan Cox extended,
2 mengaplikasikan dan membandingkan model Cox proportional hazard dan
Cox extended dengan fungsi terhadap waktu ketahanan berupa one step

2
function, fungsi linier, dan fungsi logaritma pada kasus durasi waktu sampai
individu kembali menggunakan narkoba (UMARU Impact Study), dan
3 menentukan model terbaik pada kasus di atas berdasarkan nilai Akaike’s
Information Criterion (AIC).

TINJAUAN PUSTAKA
Analisis Ketahanan
Analisis ketahanan (survival analysis) merupakan serangkaian proses
statistika untuk menganalisis data berupa respons yang diamati adalah waktu
sampai terjadinya suatu peristiwa atau durasi. Waktu bisa berarti tahun, bulan,
minggu, atau hari dimulainya pengamatan sampai terjadinya suatu peristiwa atau
usia individu ketika terjadinya peristiwa. Peristiwa tersebut bisa merupakan
berkembangnya suatu penyakit, respons terhadap suatu pengobatan, kambuh/
keadaan sakit kembali setelah sembuh, juga kematian atau sesuatu lain yang
menarik dari suatu individu (Kleinbaum dan Klein 2012). Ada beberapa hal yang
harus diperhatikan dalam menentukan waktu ketahanan yaitu waktu awal (time
origin) harus didefinisikan dengan jelas, tidak ambigu begitupun dengan skala
pengukuran dari waktu ketahanan dan pengertian peristiwa yang dimaksud.
Salah satu karakteristik dari data ketahanan adalah sangat memungkinkan
bahwa beberapa individu tidak bisa diamati sampai terjadinya peristiwa yang
dikenal sebagai data tersensor. Kleinbaum dan Klein (2012) menyebutkan bahwa
terdapat tiga alasan yang menyebabkan terjadinya sensor, yaitu:
1 objek tidak mengalami peristiwa sampai penelitian berakhir,
2 objek hilang/ tidak mengontak lagi (lost to follow-up) ketika masa penelitian,
3 objek dikeluarkan dari penelitian karena kematian (jika kematian bukan
peristiwa yang diamati) atau karena alasan lainnya.
Sensor terdiri dari sensor kanan, sensor kiri, dan sensor interval. Pada sensor
kanan, waktu ketahanan individu lebih lama daripada waktu sensor sedangkan
sensor kiri, peristiwa yang diamati sudah terjadi sebelum individu tersebut diteliti,
artinya waktu ketahanan individu yang sebenarnya kurang dari atau sama dengan
waktu ketahanan individu saat diteliti dan pada sensor interval, peristiwa terjadi
pada suatu interval karena biasanya pengamatan dilakukan secara periodik.
Fungsi Ketahanan
Misalkan merupakan peubah acak nonnegatif yang menyatakan waktu
ketahanan individu dalam suatu populasi, juga misalkan bahwa adalah kontinu.
Distribusi waktu ketahanan dijelaskan dalam tiga fungsi berikut, yaitu fungsi
ketahanan, fungsi kepekatan peluang, dan fungsi hazard. Jika salah satu fungsi
diketahui maka kedua fungsi lainnya dapat diturunkan.
1. Fungsi Ketahanan
Fungsi ketahanan adalah peluang individu bertahan sampai waktu
(mengalami kejadian setelah waktu ) yang dilambangkan:

3

(1)
Fungsi
merupakan fungsi tak naik dengan nilai
dan
.
Fungsi
juga biasa disebut cumulative survival rate. Selain itu terdapat kurva
ketahanan yang digunakan untuk menentukan median atau persentil lainnya dari
waktu ketahanan, juga untuk membandingkan distribusi ketahanan dari dua
kelompok atau lebih. Dalam menduga
untuk data tersensor dan distribusi
data tidak diketahui digunakan metode nonparametrik yaitu metode Kaplan-Meier.
2. Fungsi Kepekatan Peluang
Fungsi kepekatan peluang didefinisikan sebagai limit dari peluang individu
mengalami kejadian dalam interval sampai
.
{individu mengalami kejadian dalam selang
}
(2)

Karena
diperoleh:

maka dengan menurunkan kedua ruas terhadap

(3)

3. Fungsi Hazard
Fungsi hazard merupakan peluang individu mengalami kejadian dalam
selang waktu yang singkat yaitu sampai
jika diketahui individu telah
bertahan sampai waktu t .
{individu pada mengalami kejadian dalam selang
}

(4)

Kurva fungsi hazard bisa naik, turun, konstan atau kurva lainnya yang lebih
rumit. Jika persamaan (1) dan (3) disubstitusikan ke persamaan (4) maka
diperoleh
h(t ) 

f (t )  S (t )
d

  ln S (t ).
S (t )
S (t )
dt

Kemudian persamaan (5) diintegralkan dari 0 sampai t dengan S (0)  1 yaitu


ln

(5)

4
ln
exp[
Berdasarkan persamaan (5) maka

exp[

(Lee 1992).

]
]

(6)

(7)

Metode Kaplan-Meier (Product Limit)
Metode Kaplan-Meier merupakan salah satu metode nonparametrik untuk
menduga fungsi ketahanan dari sekumpulan data yang mengandung data tersensor.
Metode ini dikembangkan oleh Kaplan dan Meier. Misalkan terdapat individu
dengan waktu ketahanan
. Susun waktu ketahanan dengan urutan
yang meningkat seperti
, maka
̂



dengan bilangan bulat positif yang memenuhi
tak tersensor (Lee 1992).

(8)
dan

pengamatan yang

HASIL DAN PEMBAHASAN
Model Cox Proportional Hazard
Model Cox proportional hazard diperkenalkan oleh seorang statistikawan
Inggris, David Cox. Model tersebut merupakan regresi semiparametrik dalam
analisis ketahanan untuk mengetahui peubah penjelas/ kovariat yang berpengaruh
secara signifikan terhadap waktu ketahanan, dengan asumsi bahwa hazard
individu terhadap individu lainnya bernilai konstan dari waktu ke waktu. Untuk
membangun model Cox proportional hazard, misalkan risiko kematian individu
bergantung pada nilai
dari kovariat
ke- pada saat yaitu
. Kovariat itu sendiri terbagi ke dalam dua macam, yaitu variat dan
faktor. Variat merupakan peubah yang bernilai numerik/ kontinu seperti umur
sedangkan faktor ialah peubah yang mempunyai level/ tipe seperti jenis kelamin
(Collet 2003). Himpunan nilai kovariat direpresentasikan dalam vektor dengan
yang disebut fungsi baseline hazard, merupakan
dan
fungsi hazard untuk individu dengan nilai kovariat adalah 0. Fungsi hazard
untuk individu ke- adalah
(9)
merupakan fungsi dari vektor kovariat untuk individu ke- . Fungsi
dengan
dapat pula diinterpretasikan sebagai fungsi hazard untuk individu dengan
kovariat relatif terhadap fungsi hazard individu dengan kovariat
. Karena
menyatakan hazard relatif maka tidak mungkin bernilai negatif sehingga
Peubah adalah kombinasi linier dari kovariat
bisa ditulis

yaitu
.Vektor
adalah koefisien

5
dari kovariat
dalam model, sehingga bentuk umum dari model Cox
proportional hazard adalah:
(10)
(
).
Model Cox proportional hazard dapat dipandang sebagai model linier
logaritma dari hazard ratio yaitu:

log

(11)

Besaran exp
mengandung kovariat yang bebas
terhadap waktu, artinya bahwa nilai peubah tersebut tidak berubah dari waktu ke
waktu (selama penelitian) serta
adalah koefisien kovariat yang
merepresentasikan pengaruh dari masing-masing kovariat secara langsung
terhadap log hazard. Hazard yang lebih besar secara langsung berkaitan dengan
waktu ketahanan yang lebih singkat (khususnya jika kejadian berupa kematian)
(Collet 2003).
Pendugaan Koefisien Kovariat (Parameter)
Dalam menduga parameter
Cox menggunakan prosedur
maximum likelihood estimation (penduga kemungkinan maksimum) dengan
hanya mempertimbangkan peluang individu yang mengalami kejadian saja yang
disebut partial likelihood (Kleinbaum dan Klein 2012). Pendugaan
menggunakan partial likelihood yaitu memaksimumkan fungsi partial
likelihood. Fungsi partial likelihood merupakan fungsi peluang bersama dari data
ketahanan tak tersensor berupa fungsi dari parameter yang tidak diketahui nilainya.
Collet (1994) dalam Sari (2010) menyatakan bahwa pendugaan parameter dapat
dibuktikan dengan mengambil kasus individu bertahan hidup sehingga kejadian
individu dengan
individu yang
berupa kematian. Misalkan terdapat
mengalami kematian maka (
individu tersensor. Asumsikan bahwa hanya
terdapat satu individu yang meninggal pada waktu kematian tertentu (tidak
terdapat ties). Misalkan pula
merupakan waktu
ketahanan terurut tak tersensor. Peluang kematian individu ke- pada saat
dengan syarat
satu-satunya waktu kematian dari
dan
kovariat untuk individu yang meninggal pada saat
adalah
dinotasikan:
P(individu dengan kovariat
meninggal saat
| kematian tunggal saat
)
(individu dengan kovariat
meninggal saat
.
(12)
(kematian tunggal saat
Pembilang merupakan risiko kematian individu ke- pada saat
, dinotasikan
, sedangkan penyebut merupakan jumlah risiko kematian saat
untuk
semua individu yang mempunyai risiko kematian saat
atau penjumlahan
dalam
, dengan
merupakan himpunan individu yang
berisiko mengalami kematian saat
yaitu individu-individu yang hidup dan tak
tersensor sesaat sebelum
sehingga
disebut risk set. Misalkan A adalah
kejadian individu ke- dengan kovariat
meninggal saat
dan B adalah
kejadian kematian tunggal saat
. Persamaan (12) menjadi

6
.



(13)

Dengan mensubstitusikan persamaan (10) ke persamaan (13) maka diperoleh


.



(14)

Dengan demikian fungsi likelihood dari peluang bersyarat di atas adalah


(15)



dengan
merupakan vektor kovariat untuk individu yang meninggal saat
.
untuk
Besaran ∑
merupakan penjumlahan nilai
setiap individu anggota
. Perkalian pada fungsi likelihood hanya untuk
individu yang tak tersensor. Individu yang tersensor tidak termasuk dalam
pembilang tetapi terdapat pada penyebut yaitu penjumlahan
untuk
setiap anggota
.
Misalkan data terdiri dari
pengamatan waktu ketahanan yaitu
dan adalah indikator kejadian dengan nilai
individu ke
tersensor kanan
{
lainnya
Maka persamaan (15) dapat dinyatakan sebagai
∏{

}



(16)

dan log dari persamaan (16) adalah
(∏ {

∑(



Penduga parameter
yaitu solusi dari





{

} )



} )







(17)

dapat diperoleh dengan memaksimumkan fungsi log

{




}

,

(18)

Solusi persamaan tersebut sulit dicari secara analitik tetapi lebih mudah
diselesaikan dengan menggunakan metode numerik.

7
Persamaan (16) tidak dapat digunakan jika terdapat ties yaitu waktu
ketahanan bernilai sama untuk beberapa individu kecuali jika ties tersebut terjadi
antar waktu ketahanan yang tersensor dengan satu atau lebih waktu ketahanan
tersensor. Terdapat alternatif untuk data ketahanan yang mengandung ties, yaitu
Breslow’s approximation yang baik digunakan jika data ties relatif sedikit; Efron,
dan exact method jika data ties relatif banyak (Allison 2010). Penulis
menggunakan exact method untuk menduga parameter dalam model kasus
UMARU Impact Study dengan persamaan berikut:

(19)



dengan
menyatakan himpunan individu yang mengalami peristiwa saat ,
perkalian
, dan himpunan semua |
| yang dipilih dari
.
Pengujian Keberartian Koefisien Kovariat (Parameter)
Pengujian keberartian koefisien kovariat bertujuan untuk mengetahui ada
atau tidaknya pengaruh dari suatu kovariat terhadap peubah respons. Pengujian
keberartian koefisien tersebut terdiri dari dua tahap yaitu pengujian secara
serentak (simultan) menggunakan uji nisbah kemungkinan (likelihood ratio test)
dan pengujian secara parsial menggunakan uji Wald.
1. Uji Nisbah Kemungkinan
Hipotesis yang diuji adalah
lawan
minimal
ada satu yang tidak sama dengan nol. Statistik uji yang digunakan adalah
]. Besaran
[
adalah kemungkinan pada model dasar
dan
adalah kemungkinan pada model lengkap. Jika nilai
hitung lebih
besar dari
tabel dengan derajat bebas sebesar dan taraf nyata 0.05 atau nilai-p
< 0.05 maka tolak
yang berarti minimal ada satu peubah penjelas yang
memberikan pengaruh nyata terhadap peubah respons (Kleinbaum dan Klein
2012).
2. Uji Wald
Jika
ditolak pada uji nisbah kemungkinan maka dilanjutkan dengan uji
Wald untuk mengetahui kovariat apa saja yang berpengaruh terhadap peubah
respons, dengan hipotesis
lawan
serta statistik ujinya
adalah

̂

̂

dengan

̂ adalah galat baku penduga parameter. Tolak

jika nilai
lebih besar dari
tabel dengan derajat bebas sebesar 1 dan taraf
nyata 0.05 atau nilai-p < 0.05 yang berarti kovariat yang diuji berpengaruh nyata
terhadap peubah respons (Collet 2003).

Hazard Ratio
Hazard ratio merupakan hazard relatif dari individu ke- dengan kovariat
mengalami peristiwa dibandingkan individu ke- dengan
kovariat
yang konstan atau bebas terhadap waktu
(Kleinbaum dan Klein 2012). Hazard ratio juga menunjukkan adanya
peningkatan atau penurunan risiko individu yang dikenai perlakuan tertentu (Lee
1992). Misalkan terdapat dua individu dengan karakteristik tersebut maka dari

8
model umum Cox proportional hazard diperoleh formula untuk menduga hazard
ratio, yaitu:

(

̂

)

(

)

(20)
(
)
(
)
Untuk kovariat yang bersifat kategorik dengan variabel dummy bernilai 1
dan 0 maka hazard ratio dapat diinterpretasikan sebagai ratio dari penduga
hazard untuk individu yang bernilai 1 terhadap penduga hazard untuk individu
yang bernilai 0. Sedangkan untuk kovariat yang bersifat kuantitatif, lebih
bermakna jika hazard ratio dikurangi 1 lalu dikalikan dengan 100% yang
menyatakan perubahan persentase hazard penduga untuk penambahan 1 unit
peubah tersebut (Allison 2010 ).
Menaksir Asumsi Hazard Proporsional
Terdapat tiga metode yang dapat digunakan untuk menaksir asumsi hazard
proporsional yaitu metode grafis (untuk kovariat yang bersifat kategorik),
goodness of fit (GOF), dan time dependent variable (model Cox extended).
1. Metode Grafis
Salah satu metode grafis yang sering digunakan adalah membandingkan
̂ atau log-minus-log survival curve antar kategori dalam suatu
kurva –
faktor. Jika antar kurva sejajar maka asumsi proporsional untuk faktor tersebut
terpenuhi. Kuantitas ̂ adalah dugaan peluang individu bertahan sampai waktu
tertentu. Nilai ̂ dapat diperoleh dari penduga Kaplan-Meier (tidak didasarkan
pada model Cox proportional hazard) atau penduga yang didasarkan pada model
Cox proportional hazard dengan mengasumsikan kovariat memenuhi asumsi
proporsional kecuali faktor yang akan diperiksa keproporsionalannya, dengan
formula:
̂

(21)
̂

]
bernilai negatif.
diantara 0 sampai 1 sehingga ̂
Nilai ̂
̂

̂

]
̂

̂

̂
bernilai negatif, maka
karena
sebelum dilogaritmakan, sehingga


̂

(

̂

̂

(∑ ̂

)

(22)

harus dikalikan dengan
(∑ ̂

∑ ̂

))
(23)

9
Misalkan dua individu dengan kovariat
, sehingga
[

dan

Jika

[

̂

̂

[

̂

]

̂

]

dan
∑ ̂

̂

] dikurangi [

∑̂

∑̂

[

̂

̂
∑̂

̂

∑̂

(24)

(25)

]] maka diperoleh

∑̂

(26)

Persamaan (26) menunjukkan bahwa jika model Cox proportional hazard
digunakan untuk memodelkan waktu ketahanan kemudian memplot kurva
̂ untuk dua individu pada grafik yang sama maka kedua kurva

tersebut akan sejajar yaitu jarak (vertikal) antara kedua kurva adalah konstan.
Itulah yang menjadi alasan metode grafis dapat digunakan untuk memeriksa
asumsi keproporsionalan suatu faktor. Namun metode ini memiliki beberapa
kekurangan di antaranya dalam hal pengelompokan peubah kontinu (variat). Jika
terdapat banyak data yang dikelompokan maka dikhawatirkan data untuk masingmasing kelompok menjadi sedikit sehingga sulit untuk menentukan perbedaan
antar kurva, dan kategori yang berbeda juga dapat menyebabkan perbedaan kurva.
Selain itu cukup subjektif dalam memutuskan apakah kurva tersebut sejajar atau
tidak sehingga disarankan untuk tidak menggunakan metode ini sebagai satusatunya cara yang digunakan untuk memeriksa asumsi keproporsionalan faktor
(Kleinbaum dan Klein 2012).
2. Goodness of Fit (GOF)
Metode penaksiran GOF menggunakan uji statistik dalam memeriksa
asumsi proporsional suatu peubah sehingga lebih objektif dibandingkan dengan
metode grafis. GOF memiliki beberapa macam uji statistik, salah satunya
Schoenfeld residuals. Schoenfeld residuals merupakan sekumpulan nilai untuk
masing-masing individu pada setiap kovariat dalam model Cox proportional
hazard. Schoenfeld residuals dari kovariat ke- , untuk individu ke- adalah
(27)
{
̂ }

dengan ̂





̂

̂

,

menyatakan status individu yaitu bernilai 0 jika individu tersensor dan 1
selainnya,
merupakan nilai dari peubah penjelas ke- ,
untuk
individu ke- , dan ̂ menyatakan rataan terboboti dari peubah penjelas keuntuk individu dalam
, serta
adalah himpunan individu yang berisiko
mengalami peristiwa pada saat .

10
Ide yang mendasari adalah jika asumsi proporsional terpenuhi untuk suatu
kovariat maka Schoenfeld residuals untuk kovariat tersebut tidak akan berkorelasi
dengan peringkat waktu ketahanan. Berikut langkah-langkah pengujian asumsi
proporsional menggunakan Schoenfeld residuals:
1 membangun model Cox proportional hazard dan Schoenfeld residuals untuk
masing-masing individu pada setiap kovariat,
2 membuat peubah yang menyatakan peringkat dari waktu ketahanan,
3 menguji korelasi antara peubah pada langkah ke-2 dengan Schoenfeld
residuals, dengan hipotesis
. Tolak
jika nilai-p < 0.05 yang berarti
asumsi proporsional tidak terpenuhi.
Kleinbaum dan Klein (2012) menyatakan bahwa ukuran yang digunakan
untuk mengevaluasi asumsi proporsional adalah nilai-p. Nilai-p tidak signifikan
yaitu nilai-p > 0.1 yang menyatakan asumsi proporsional terpenuhi sedangkan
nilai-p yang kecil (nilai-p < 0.05) menyatakan bahwa kovariat yang diuji tidak
memenuhi asumsi proporsional.
3. Model Cox extended (dijelaskan pada subbab berikutnya).
Model Cox Extended
Model Cox extended merupakan perluasan dari model Cox proportional
hazard yaitu mengandung kovariat yang bergantung terhadap waktu (time
dependent) atau perkalian dari kovariat tersebut dengan fungsi terhadap waktu.
Peubah time dependent didefinisikan sebagai peubah yang nilainya berubah dari
waktu ke waktu. Model Cox extended termasuk salah satu pendekatan untuk
memeriksa asumsi proporsional dari suatu kovariat selain pendekatan grafis dan
goodness of fit test. Selain untuk memeriksa asumsi proporsional dari suatu
kovariat, model Cox extended juga dapat sekaligus memodelkan peubah time
dependent dan menduga seberapa besar pengaruhnya terhadap waktu ketahanan.
Bentuk umum model Cox Extended:





(28)

) yang
Model Cox extended terdiri dari fungsi baseline hazard (
dikalikan dengan fungsi eksponensial. Fungsi eksponensial terbagi ke dalam dua
bagian yaitu kovariat yang bebas terhadap waktu (
) dan kovariat
) dengan
yang bergantung terhadap waktu (
: vektor koefisien penduga pengaruh dari kovariat time independent
: vektor koefisien penduga pengaruh dari kovariat time dependent yang
berlaku untuk setiap
: banyaknya kovariat yang memenuhi asumsi proporsional
: banyaknya kovariat yang tidak memenuhi asumsi proporsional
Asumsi dari model ini adalah pengaruh peubah time dependent
terhadap peluang bertahan pada saat hanya bergantung dari nilai peubah tersebut
pada waktu yang sama, tidak pada sebelumnya atau sesudahnya. Meskipun nilai
dari peubah
berubah dari waktu ke waktu, model Cox extended hanya

11
menyediakan satu koefisien untuk setiap peubah time dependent pada model
tersebut yang berarti koefisien berlaku untuk setiap dari
selama masa
penelitian (Kleinbaum dan Klein 2012). Untuk memeriksa asumsi proporsional
dari kovariat, model Cox extended menjadi:
(

)





(29)

dengan
merupakan fungsi terhadap waktu dan penting sekali untuk
Berikut kemungkinan fungsi
menentukan bentuk yang tepat dari
menurut Kleinbaum dan Klein (2012):
merupakan bentuk yang paling sederhana sehingga menghasilkan
i.
model Cox proportinal hazard.
. Jika hasil pengujian signifikan maka model Cox extended lebih
ii.
baik daripada Cox proportional hazard sehingga hazard ratio merupakan fungsi
terhadap waktu.
iii.
heavyside function. Ketika fungsi ini digunakan maka diperoleh hazard
iv.
ratio yang konstan untuk interval waktu yang berbeda.
Misalkan C merupakan suatu faktor dengan nilai 1 dan 0, maka hazard ratio
adalah seperti yang tersaji pada Tabel 1.
untuk keempat persamaan
Tabel 1 Hazard ratio
Fungsi

Interval waktu

Hazard ratio

̂

one step function

{

̂
̂

̂
̂
̂

̂
̂

Selain itu dapat juga digunakan heavyside function lebih dari satu langkah dan
dapat dilihat bahwa hazard ratio konstan untuk interval waktu yang berbeda.
Persamaan (29) menjadi
)
)
(
)
(
[ (
(
)
(30)
)]
(
dan
{

{

(31)
merupakan step function. Hazard ratio untuk persamaan (30) adalah
̂
̂
(Ata dan Sö zer
2007).

12
Pendugaan Koefisien Kovariat (Parameter)
Seperti halnya pendugaan parameter model Cox proportional hazard,
pendugaan parameter model Cox extended juga menggunakan maximum partial
likelihood estimation. Berikut persamaan log partial likelihood model Cox
extended yang diperluas dari persamaan (17)




(32)

Pengujian Keberartian Koefisien Kovariat (Parameter)
Pengujian keberartian digunakan untuk mengetahui kovariat bebas atau
bergantung terhadap waktu, yang terdiri dari dua tahap seperti pengujian
parameter model Cox proportional hazard.
1. Uji Nisbah Kemungkinan
Hipotesis yang diuji adalah
lawan
minimal
ada satu yang tidak sama dengan nol. Statistik uji yang digunakan yaitu
[
model adalah kemungkinan pada model
model
ext.Cox model ]
Cox proportional hazard dan ext.Cox model adalah kemungkinan pada model Cox
extended. Jika nilai
hitung lebih besar dari
tabel dengan derajat bebas dan
taraf nyata 0.05 atau nilai-p < 0.05 maka tolak
yang berarti minimal ada satu
peubah penjelas bergantung terhadap waktu dan memberikan pengaruh nyata
terhadap peubah respons.
2. Uji Wald
Jika
ditolak pada uji nisbah kemungkinan maka dilanjutkan dengan uji
Wald. Hipotesis yang diuji adalah
lawan
serta statistik
̂

ujinya adalah

̂

, dengan

̂ adalah galat baku penduga parameter.

Tolak
jika nilai
lebih besar dari
tabel dengan derajat bebas sebesar 1 dan
taraf nyata 0.05 atau nilai-p < 0.05 yang berarti kovariat yang diuji bergantung
terhadap waktu dan berpengaruh nyata terhadap peubah respons (Kleinbaum dan
Klein 2012).
Hazard Ratio
Hazard ratio pada Cox extended sama seperti hazard ratio pada Cox
proportional hazard namun spesifik pada waktu tertentu. Berikut formula hazard
ratio Cox extended dari individu dengan kovariat
terhadap individu dengan
kovariat
.
̂(

̂

̂(

dengan
(

)

(

)

∑ ̂[

]
).

∑ ̂[
) dan

]

(33)

13
Akaike’s Information Criterion (AIC)
AIC merupakan salah satu ukuran untuk pemilihan model regresi terbaik
yang diperkenalkan oleh Hirotugu Akaike pada tahun 1973. Metode tersebut
didasarkan pada maximum likelihood estimation (Fathurahman 2009), dengan
persamaan
̂
AIC
(34)
̂
dengan merupakan fungsi likelihood, jumlah parameter , dan konstanta
yang ditentukan. Nilai yang sering digunakan yaitu antara 2 dan 6. Menurut
metode AIC, model regresi terbaik adalah model yang mempunyai nilai AIC
terkecil (Collet 2003).

APLIKASI PADA WAKTU KETAHANAN PENGGUNA
NARKOBA
Data yang digunakan adalah UMARU Impact Study (UIS) oleh Drs. Jane
McCusker, Carol Bigelow, dan Anne Stoddard. UIS merupakan proyek penelitian
kolaboratif selama 5 tahun dari 1989 sampai 1994 yang terdiri dari percobaan
acak dua macam pengobatan terhadap pemakai narkoba secara bersamaan. Tujuan
dari penelitian tersebut adalah untuk membandingkan program pengobatan
terhadap pemakai narkoba dengan jangka waktu yang berbeda, yaitu program
dengan durasi waktu pengobatan selama 3 sampai 6 bulan dan program dengan
durasi waktu pengobatan selama 6 sampai 12 bulan. Berikut peubah-peubah yang
diukur selama penelitian:
1. ID
: nomor identitas (1-628)
2. Age
: usia saat pendaftaran keikutsertaan program (dalam tahun)
3. Becktota : beck depression score (0-54)
4. Hercoc
: heroin atau kokain yang digunakan selama 3 bulan
sebelum
pendaftaran (1 = heroin dan kokain, 2 = heroin, 3 = kokain, 4 =
bukan heroin maupun kokain)
5. Ivhx
: riwayat penggunaan narkoba melalui jarum suntik ke pembuluh
darah (intravenous) (1 = tidak pernah, 2 = sebelumnya pernah
menggunakan, 3 = baru-baru ini)
6. Ndrugtx : banyaknya pengobatan yang pernah dilakukan sebelumnya (0-40)
7. Race
: ras individu (0 = putih, 1 = selainnya)
8. Treat
: program pengobatan (0 = jangka pendek, 1 = jangka panjang)
9. Site
: tempat pengobatan (0 = A, 1 = B)
10. Los
:lamanya pengobatan (dalam hari) terhitung semenjak
terdaftar sebagai peserta program pengobatan
11. Time
: waktu saat kembali menggunakan narkoba (dalam hari) terhitung
semenjak terdaftar sebagai peserta program pengobatan
12. Censor : status kembali atau tidaknya menjadi pengguna narkoba (1 =
kembali menjadi pengguna narkoba, 0 = selainnya)
(UmassAmherst c2004).

14
1
2
3
4
5

Berikut tahapan analisis terhadap data menggunakan software statistika:
memodelkan data menggunakan model Cox proportional hazard,
memeriksa asumsi proporsional pada masing-masing peubah menggunakan
korelasi Schoenfeld residual,
memplot peubah yang tidak memenuhi asumsi proporsional,
memodelkan data menggunakan model Cox extended, dan
membandingkan nilai AIC dari semua model yang dianalisis.
Model Cox Proportional Hazard
Model Cox proportional hazard untuk data yang digunakan adalah:

dengan

Age,
Becktota,
(Hercoc = 2),
(Hercoc = 3),
(Hercoc = 4),
(Ivhx = 2),
(Ivhx = 3),
Ndrugtx,
Race,
Treat,
Site, dan
Los.
merupakan penduga koefisien
peubah Age,
penduga koefisien peubah Becktota,
penduga koefisien
peubah Hercoc = 2 dan seterusnya sampai
penduga peubah Los. Pendugaan
model Cox proportional hazard menggunakan software statistika menghasilkan
nilai AIC sebesar 4809.405. Nilai uji nisbah kemungkinan sebesar 193.3425 >
21.026 (
tabel dengan derajat bebas 12) serta nilai-p < 0.0001, yang
menunjukkan bahwa minimal ada satu peubah penjelas yang berpengaruh
terhadap peubah respons pada taraf nyata 0.05. Untuk mengetahui peubah
penjelas apa saja yang berpengaruh nyata digunakan uji Wald seperti yang tertera
pada Tabel 2.

Tabel 2 Penduga parameter, uji Wald, nilai-p, dan hazard ratio
Peubah
Penduga
Standard
Uji Wald
Nilai-p
Hazard
penjelas
parameter
error
ratio
Age
-0.02092
0.00824
6.4402
0.0112* 0.979
Becktota
0.00531
0.00492
1.1612
0.2812
1.005
Hercoc2
0.15164
0.15136
1.0037
0.3164
1.164
Hercoc3
-0.01436
0.16871
0.0072
0.9321
0.986
Hercoc4
-0.00182
0.16573
0.0001
0.9912
0.998
Ivhx2
0.18829
0.13877
1.8411
0.1748
1.207
Ivhx3
0.39864
0.14822
7.2337
0.0072* 1.490
Ndrugtx
0.02629
0.00859
9.3663
0.0022* 1.027
Race
-0.30635
0.11610
6.9624
0.0083* 0.736
Treat
0.13821
0.09693
2.0331
0.1539
1.148
Site
0.44381
0.11122
15.9243 5.991 ( tabel dengan derjat bebas 2), sehingga minimal ada satu
peubah penjelas yang nilainya bergantung terhadap waktu. Sedangkan jika
didefinisikan
log ,

dan

{

model Cox extended menjadi:
).
(
Nilai AIC yang diperoleh sebesar 4565.573. Nilai uji nisbah kemungkinan sebesar
441.175 > 5.991, sehingga minimal ada satu peubah penjelas yang nilainya
bergantung terhadap waktu. Nilai AIC model ini lebih kecil dari kedua model
sebelumnya sehingga berdasarkan kriteria AIC, model ini lebih baik. Berikut nilai
AIC untuk semua model yang dianalisis.
Tabel 4 Nilai AIC model
No
1

Jenis model
Cox proportional hazard
Cox extended

2
3

{

{

Nilai AIC
4809.405
4657.199

dan
dan

log

4565.573

Selanjutnya digunakan uji Wald untuk mengetahui peubah yang berpengaruh
nyata terhadap peubah respons dan peubah yang bergantung terhadap waktu
seperti yang tertera pada Tabel 5.
Tabel 5 Penduga parameter, uji Wald, nilai-p, dan hazard ratio
Peubah
Penduga
Standard
Uji Wald
Nilai-p
Hazard
penjelas
parameter
error
ratio
Age
-0.02424
0.00837
8.3978
0.0038*
0.976
Becktota
0.00565
0.00492
1.3177
0.2510
1.006
Hercoc2
0.13351
0.15200
0.7715
0.3798
1.143
Hercoc3
-0.13304
0.16908
0.6191
0.4314
0.875
Hercoc4
-0.06258
0.16453
0.1447
0.7037
0.939
Ivhx2
0.14141
0.13813
1.0481
0.3059
1.152
Ivhx3
0.28884
0.14749
3.8351
0.0502
1.335
Ndrugtx
0.03364
0.00871
14.9279
0.0001*
1.034
Race
-0.25615
0.11689
4.8019
0.0284*
0.774
Treat
0.03323
0.17760
0.0350
0.8516
1.034
-0.08033
0.21070
0.1453
0.7030
0.923
Treat*
Site
0.24198
0.11724
4.2600
0.0390*
1.274
Los
-0.09814
0.00644
231.9747

Dokumen yang terkait

Analisis Survival Dengan Model Regresi Cox Terhadap Laju Kesembuhan Penderita DBD di Rumah Sakit Muhammadiyah Medan

44 232 103

Perbandingan model COX proportional hazard dan model parametrik berdasarkan analisis residual : studi kasus pada data kanker paru-paru yang diperoleh dari contoh data pada Sotware S-Plus 2000 dan simulasi untuk distribusi eksponensial dan Weibull

6 33 90

Model cox proportion hazard pada kejadian bersama.

1 2 115

ANALISIS FUNGSI TAHAN HIDUP DENGAN MENGGUNAKAN PERLUASAN MODEL REGRESI COX PADA KASUS FUNGSI KEGAGALAN TAK PROPORSIONAL - Diponegoro University | Institutional Repository (UNDIP-IR)

0 0 2

ANALISIS FUNGSI TAHAN HIDUP DENGAN MENGGUNAKAN PERLUASAN MODEL REGRESI COX PADA KASUS FUNGSI KEGAGALAN TAK PROPORSIONAL - Diponegoro University | Institutional Repository (UNDIP-IR)

0 0 2

ANALISIS FUNGSI TAHAN HIDUP DENGAN MENGGUNAKAN PERLUASAN MODEL REGRESI COX PADA KASUS FUNGSI KEGAGALAN TAK PROPORSIONAL - Diponegoro University | Institutional Repository (UNDIP-IR)

0 0 8

ANALISIS FUNGSI TAHAN HIDUP DENGAN MENGGUNAKAN PERLUASAN MODEL REGRESI COX PADA KASUS FUNGSI KEGAGALAN TAK PROPORSIONAL - Diponegoro University | Institutional Repository (UNDIP-IR)

0 0 4

MODEL REGRESI COX STRATIFIED PADA DATA KETAHANAN - Diponegoro University | Institutional Repository (UNDIP-IR)

2 3 17

ANALISIS SURVIVAL DENGAN MODEL REGRESI COX PROPORTIONAL HAZARD TERHADAP KESEMBUHAN TUBERKULOSIS DI RS PKU MUHAMMADIYAH GAMPING

0 0 9

ANALISIS REGRESI COX PROPORSIONAL DENGAN HAZARD DASAR WEIBULL PADA DATA TERSENSOR TIPE II SKRIPSI

2 6 135