, σ
μ = nilai estimasi dari μ dan σ . Pada model Weibull, fungsi survival adalah :
exp
si i
r si
i
e r
S t
S −
= =
ε
. 2.25
Untuk model eksponensial, fungsi survival sama seperti pada model Weibull dengan skala parameter
σ ditentukan 1. Jika model yang digunakan sesuai dengan data, maka residual Cox-
Snell akan berdistribusi eksponensial dengan mean satu. Dengan demikian,
maka residual Cox-Snell dapat digunakan untuk mengecek keberhasilan model dengan memeriksa plot dari
Ci
r dengan hazard kumulatif dari
Ci
r . Jika model
yang digunakan sesuai, maka plot akan menjadi garis lurus melewati titik asal serta melandai.
2.5.2 Residual Martingale
Mi
r Residual Martingale didefinisikan sebagai:
Ci i
Mi
r r
− =
δ ,
2.26 dengan
⎩ ⎨
⎧ =
tersensor data
untuk tersensor
tidak data
untuk
i
1 δ
n i
,...., 2
, 1
= dan
Ci
r adalah residual Cox-Snell.
Range residual Martingale antara ∞
− dan satu, dan negatif pada data yang tersensor. Residual Martingale dapat menjadi gambaran mengenai
perbedaan antara hasil pengamatan
i
δ dengan angka prediksi pada kejadian-
kejadian
Ci
r . Ketika perbedaan antara hasil pengamatan dengan angka
prediksi untuk subjek ke-i cukup besar, itu menunjukan bahwa subjek ke-i tidak akan cocok dengan model dan mengakibatkan suatu nilai yang besar
pada
Mi
r . Karena range dari
Ci
r adalah 0,
∞ , dan
i
δ hanya bernilai 0 atau 1, itu menerangkan bahwa residual Martingale bernilai
1 ,
∞ −
dan kesimetrisan dari distribusi residual martingale mendekati nol.
Sifat-sifat residual Martingale adalah: 1
=
Mi
r E
. 2 Cov
, =
Mj Mi
r r
pada sampel besar.
2.5.3 Residual Deviance
Di
r Residual deviance adalah modifikasi dari residual Martingale. Residual
deviance didefinisiskan sebagai berikut :
{ }
[ ]
2 1
log 2
sgn
Mi i
i Mi
Mi Di
r r
r r
− +
− =
δ δ
, 2.27
dengan sgn
Mi
r adalah tanda dari residual Martingale dan
i
δ adalah variabel indicator.
Residual Martingale dikenal sebagai suatu usaha untuk mendapatkan residual Martingale yang simetris mendekati nol dengan menyusutkan residual
Martingale kedalam range
, −∞
terhadap nol dan memperluasnya kedalam range 0, 1 terhadap
∞ +
.
2.5.4 Residual Baru
Menurut Nardi dan Schemper, prediksi survival model cox pada subjek i = 1,2,…,n dikatakan sempurna jika
5 ,
=
i i
t S
dan terprediksi benar jika
m i
i
t t
≈ , dengan
i
t adalah pengamatan failuire time dan
m i
t sebuah estimasi
median survival time [5]. Untuk mengukur residual dapat dilakukan dengan
salah satu cara berikut:
a Menghitung perbedaan antara
i
t dan
m i
t . Tetapi ini tidak dapat dilakukan
pada kasus pengamatan yang tersensor karena pengamatan survival time
i
t tidak dapat dihitung.
b Bandingkan
i i
t S
dengan 0,5.
Oleh karena itu, hitung pusat residual pada median survival time
m i
t ,
apakah pada
m i
t subjek ke-i akan gagal atau tidak. Jika survival melebihi
m i
t dapat dianggap sebagai variabel biner dan juga berdistribusi binomial
dengan parameter
, 1
i i
t S
. Dengan transformasi logit atau probit, dapat didefinisikan dua tipe residual yaitu, residual log-odds dan residual normal-
deviate.
Residual log-odds dan residual normal-deviate mempunyai sifat yang serupa dengan sifat-sifat residual pada umumnya, seperti :
a Residual akan menjadi nol untuk prediksi yang sempurna, jika
i i
t S
=0,5 maka
i i
t L
dan
i i
t N
bernilai nol. b
Permulaan dari prediksi sempurna akan menunjukkan residual menjadi lebih besar pada nilai mutlak. Ini benar untuk
i i
t L
dan
i i
t N
yang mendekati
i i
t L
, ∞ ketika
1 ≈
i i
t S
dan ∞
− ketika
≈
i i
t S
.
1 Residual Log-odds
i
L Residual log-odds didefinisikan sebagai :
1 log
i i
i i
i i
t S
t S
t L
− =
………………… 2.28
Anggap fungsi survival t
S diketahui benar,
i
L diperkirakan
berdistribusi logistik dengan mean nol dan varians 3
2
π .
Bukti: Jika T peubah acak kontinu, maka
1 T
S t
F −
= akan berdistribusi
uniform pada interval 0, 1
Jika dimisalkan U
T F
= ,
maka
⎩ ⎨
⎧ =
lainnya u
u f
, 1
, 1
menjadi pdf dari U. Jika dimisalkan
V T
S =
, maka
U V
− = 1
.
Jika dimisalkan }
1 {
= u
A ruang sampel dari U, dan
} 1
{ =
u B
ruang sampel V, maka diperoleh fungsi distribusi V, yaitu :
1 1
U v
P v
U P
v V
P v
G ≤
− =
≤ −
= ≤
= 1
, 1
1 1
1 =
− −
= −
≤ −
= v
v v
F v
U P
U
dan didapat :
⎪ ⎩
⎪ ⎨
⎧ ≥
≤ =
1 ,
1 1
, ,
v v
v v
v G
,
sehingga diketahui bahwa T
S V
= adalah berdistribusi uniform pada 0,
1. Untuk mendapatkan distribusi dari
i
L , digunakan cara yang sama
seperti sebelumnya, yaitu: Jika dimisalkan
} 1
{ =
i
S A
ruang sampel
i
S , dan
} {
∞ −∞
=
i
L B
ruang sampel
1 log
i i
i i
i i
t S
t S
t L
− =
, maka diperoleh
fungsi distribusi
i
L , yaitu :
, 1
1 1
1 1
1 1
+ =
= ⎟
⎠ ⎞
⎜ ⎝
⎛ +
=
− +
−
∫
−
l e
l S
e ds
e G
l
∞ ∞
− L
⎟ ⎠
⎞ ⎜
⎝ ⎛
+ ≤
= ⎟⎟
⎠ ⎞
⎜⎜ ⎝
⎛ +
≤ =
⎟⎟ ⎠
⎞ ⎜⎜
⎝ ⎛
≤ ⎟
⎠ ⎞
⎜ ⎝
⎛ −
= ≤
=
−
1 1
1 1
1 log
1
l l
l
e S
P e
e S
P S
S P
L P
l F
, 2.29
jika diketahui bahwa pdf dari
i
L adalah:
l l
e e
dl dF
l f
− −
+ =
= 1
1 ,
∞ ∞
− L
Bentuk umum pdf dari distribusi logistik ,
β μ
adalah:
, ,
, 1
1 ,
|
2
∞ ∞
− ∞
∞ −
⎥ ⎥
⎦ ⎤
⎢ ⎢
⎣ ⎡
+ =
⎟⎟ ⎠
⎞ ⎜⎜
⎝ ⎛ −
− ⎟⎟
⎠ ⎞
⎜⎜ ⎝
⎛ − −
β μ
β β
μ
β μ
β μ
x e
e x
f
x x
2.30
dengan mean μ
= ]
[ X E
dan varians
3 ]
[
2 2
β π
= X
Var .
Jadi, diketahui bahwa
i
L berdistribusi logistik dengan mean nol dan
variansi 3
2
π .
Pada kasus tersensor, salah satu
i i
t S
dapat diganti dengan nilai
median atau mean. Jika digunakan median
2
c i
i
t S
maka
i
L mempunyai
bentuk :
2 log
c i
i c
i i
m i
t S
t S
l −
= .
2.31
Jika digunakan mean, maka
i
L berbentuk :
e i
e i
e i
l l
l c
i e
i
e e
e l
l +
+ −
= 1
log 1
. 2.32
Bentuk mean didapatkan dengan penjelasan sebagai berikut:
c i
x y
y l
c i
i i
l F
dy e
e y
l l
L x
L P
c i
∫
∞ −
− −
∞ −
+ =
≤ ≤
2 ,
1 |
, maka
∫
∞ −
− −
⎪⎭ ⎪
⎬ ⎫
⎪⎩ ⎪
⎨ ⎧
+ −
+ =
+ =
≤ =
c i
c i
c i
c i
l l
l l
c i
c i
x x
c i
c i
i i
c i
e e
e l
l F
dx e
e x
l F
l L
L E
l 1
log 1
1 1
1 |
2
c i
c i
c i
l l
l c
i
e e
e l
+ +
− =
1 log
1 .
2 Residual Normal-deviate
i
N Residual normal-deviate didefinisikan sebagai :
⎭ ⎬
⎫ ⎩
⎨ ⎧
Φ =
− 1
i i
i
t S
N ,
2.33 dengan
Φ adalah standar distribusi normal kumulatif. Anggap fungsi survival
T S
benar,
i
N diperkirakan sebuah standar
distribusi normal.
Bukti : Jika dimisalkan
} 1
{ =
s A
ruang sampel T
S , }
{ ∞
−∞ =
N B
ruang sampel N, maka diperoleh fungsi distribusi dari N adalah:
1
n s
P n
N P
n G
≤ Φ
= ≤
=
−
∫
Φ
Φ =
= Φ
≤ =
1
n
n ds
n s
P
. 2.34
Pada kasus tersensor, salah satu
i i
t S
dapat digantikan dengan pengandaian nilai median atau mean.
Jika digunakan pengandaian median 2
i i
t S
, maka
i
N berbentuk:
2
2 1
2 1
e
n c
i i
e i
e t
S n
−
− =
π .
2.35
Bentuk di atas didapatkan dengan penjelasan sebagai berikut :
∫ ∫
∞ −
∞ −
− ∞
−
≤ =
≤ ≤
= ≤
≤
x x
c i
i y
n c
i i
i c
i i
i
n N
P dy
e y
l dx
n N
x N
f n
N x
N P
c i
2 ,
2
2 1
| |
π
∫
∞ −
− ∞
−
Φ =
x y
n c
i
dy e
y l
n
c i
2 ,
2
2 1
1 π
Misalkan
c i
n x
c i
i c
i i
i n
N N
n x
l e
n N
f n
N N
f x
f
c i
c i
i i
Φ =
≤ ≤
=
∞ −
− ≤
1 2
1 ,
, 2
|
2
π ;
maka,
∫ ∫
∞ ∞
− ∞
− −
≤
Φ =
= ≤
=
c i
c i
i i
n x
c i
n N
N c
i i
i c
i
dx e
n x
dx x
xf n
N N
E n
2 |
2
2 1
| π
2 2
2
2 1
2 1
c i
c i
n c
i i
n c
i
e t
S e
n
− −
− =
Φ −
= π
π
BAB III METODOLOGI
3.1 Pengumpulan Data
Dalam skripsi ini digunakan satu set data, yaitu data mengenai penderita kanker paru-paru yang diambil dari contoh data pada software S-plus 2000. Data
tersebut dapat dilihat pada lampiran 1.
3.2 Pengolahan Data
Pengolahan data pada skripsi ini menggunakan software S-Plus 2000. Adapun tahapan pengolahan datanya adalah seperti pada gambar 3.1 dan tahapan
simulasinya dapat dilihat pada gambar 3.2.
Gambar 3.1 Tahapan Pengolahan Data
Cox- PH Eksponensial
Weibull Model
Evaluasi Model Plot
Histogram
Model terbaik Data