Residual Martingale Residual Deviance Residual Baru

, σ μ = nilai estimasi dari μ dan σ . Pada model Weibull, fungsi survival adalah : exp si i r si i e r S t S − = = ε . 2.25 Untuk model eksponensial, fungsi survival sama seperti pada model Weibull dengan skala parameter σ ditentukan 1. Jika model yang digunakan sesuai dengan data, maka residual Cox- Snell akan berdistribusi eksponensial dengan mean satu. Dengan demikian, maka residual Cox-Snell dapat digunakan untuk mengecek keberhasilan model dengan memeriksa plot dari Ci r dengan hazard kumulatif dari Ci r . Jika model yang digunakan sesuai, maka plot akan menjadi garis lurus melewati titik asal serta melandai.

2.5.2 Residual Martingale

Mi r Residual Martingale didefinisikan sebagai: Ci i Mi r r − = δ , 2.26 dengan ⎩ ⎨ ⎧ = tersensor data untuk tersensor tidak data untuk i 1 δ n i ,...., 2 , 1 = dan Ci r adalah residual Cox-Snell. Range residual Martingale antara ∞ − dan satu, dan negatif pada data yang tersensor. Residual Martingale dapat menjadi gambaran mengenai perbedaan antara hasil pengamatan i δ dengan angka prediksi pada kejadian- kejadian Ci r . Ketika perbedaan antara hasil pengamatan dengan angka prediksi untuk subjek ke-i cukup besar, itu menunjukan bahwa subjek ke-i tidak akan cocok dengan model dan mengakibatkan suatu nilai yang besar pada Mi r . Karena range dari Ci r adalah 0, ∞ , dan i δ hanya bernilai 0 atau 1, itu menerangkan bahwa residual Martingale bernilai 1 , ∞ − dan kesimetrisan dari distribusi residual martingale mendekati nol. Sifat-sifat residual Martingale adalah: 1 = Mi r E . 2 Cov , = Mj Mi r r pada sampel besar.

2.5.3 Residual Deviance

Di r Residual deviance adalah modifikasi dari residual Martingale. Residual deviance didefinisiskan sebagai berikut : { } [ ] 2 1 log 2 sgn Mi i i Mi Mi Di r r r r − + − = δ δ , 2.27 dengan sgn Mi r adalah tanda dari residual Martingale dan i δ adalah variabel indicator. Residual Martingale dikenal sebagai suatu usaha untuk mendapatkan residual Martingale yang simetris mendekati nol dengan menyusutkan residual Martingale kedalam range , −∞ terhadap nol dan memperluasnya kedalam range 0, 1 terhadap ∞ + .

2.5.4 Residual Baru

Menurut Nardi dan Schemper, prediksi survival model cox pada subjek i = 1,2,…,n dikatakan sempurna jika 5 , = i i t S dan terprediksi benar jika m i i t t ≈ , dengan i t adalah pengamatan failuire time dan m i t sebuah estimasi median survival time [5]. Untuk mengukur residual dapat dilakukan dengan salah satu cara berikut: a Menghitung perbedaan antara i t dan m i t . Tetapi ini tidak dapat dilakukan pada kasus pengamatan yang tersensor karena pengamatan survival time i t tidak dapat dihitung. b Bandingkan i i t S dengan 0,5. Oleh karena itu, hitung pusat residual pada median survival time m i t , apakah pada m i t subjek ke-i akan gagal atau tidak. Jika survival melebihi m i t dapat dianggap sebagai variabel biner dan juga berdistribusi binomial dengan parameter , 1 i i t S . Dengan transformasi logit atau probit, dapat didefinisikan dua tipe residual yaitu, residual log-odds dan residual normal- deviate. Residual log-odds dan residual normal-deviate mempunyai sifat yang serupa dengan sifat-sifat residual pada umumnya, seperti : a Residual akan menjadi nol untuk prediksi yang sempurna, jika i i t S =0,5 maka i i t L dan i i t N bernilai nol. b Permulaan dari prediksi sempurna akan menunjukkan residual menjadi lebih besar pada nilai mutlak. Ini benar untuk i i t L dan i i t N yang mendekati i i t L , ∞ ketika 1 ≈ i i t S dan ∞ − ketika ≈ i i t S . 1 Residual Log-odds i L Residual log-odds didefinisikan sebagai : 1 log i i i i i i t S t S t L − = ………………… 2.28 Anggap fungsi survival t S diketahui benar, i L diperkirakan berdistribusi logistik dengan mean nol dan varians 3 2 π . Bukti: Jika T peubah acak kontinu, maka 1 T S t F − = akan berdistribusi uniform pada interval 0, 1 Jika dimisalkan U T F = , maka ⎩ ⎨ ⎧ = lainnya u u f , 1 , 1 menjadi pdf dari U. Jika dimisalkan V T S = , maka U V − = 1 . Jika dimisalkan } 1 { = u A ruang sampel dari U, dan } 1 { = u B ruang sampel V, maka diperoleh fungsi distribusi V, yaitu : 1 1 U v P v U P v V P v G ≤ − = ≤ − = ≤ = 1 , 1 1 1 1 = − − = − ≤ − = v v v F v U P U dan didapat : ⎪ ⎩ ⎪ ⎨ ⎧ ≥ ≤ = 1 , 1 1 , , v v v v v G , sehingga diketahui bahwa T S V = adalah berdistribusi uniform pada 0, 1. Untuk mendapatkan distribusi dari i L , digunakan cara yang sama seperti sebelumnya, yaitu: Jika dimisalkan } 1 { = i S A ruang sampel i S , dan } { ∞ −∞ = i L B ruang sampel 1 log i i i i i i t S t S t L − = , maka diperoleh fungsi distribusi i L , yaitu : , 1 1 1 1 1 1 1 + = = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + = − + − ∫ − l e l S e ds e G l ∞ ∞ − L ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + ≤ = ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ + ≤ = ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ≤ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = ≤ = − 1 1 1 1 1 log 1 l l l e S P e e S P S S P L P l F , 2.29 jika diketahui bahwa pdf dari i L adalah: l l e e dl dF l f − − + = = 1 1 , ∞ ∞ − L Bentuk umum pdf dari distribusi logistik , β μ adalah: , , , 1 1 , | 2 ∞ ∞ − ∞ ∞ − ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ + = ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − − β μ β β μ β μ β μ x e e x f x x 2.30 dengan mean μ = ] [ X E dan varians 3 ] [ 2 2 β π = X Var . Jadi, diketahui bahwa i L berdistribusi logistik dengan mean nol dan variansi 3 2 π . Pada kasus tersensor, salah satu i i t S dapat diganti dengan nilai median atau mean. Jika digunakan median 2 c i i t S maka i L mempunyai bentuk : 2 log c i i c i i m i t S t S l − = . 2.31 Jika digunakan mean, maka i L berbentuk : e i e i e i l l l c i e i e e e l l + + − = 1 log 1 . 2.32 Bentuk mean didapatkan dengan penjelasan sebagai berikut: c i x y y l c i i i l F dy e e y l l L x L P c i ∫ ∞ − − − ∞ − + = ≤ ≤ 2 , 1 | , maka ∫ ∞ − − − ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ + − + = + = ≤ = c i c i c i c i l l l l c i c i x x c i c i i i c i e e e l l F dx e e x l F l L L E l 1 log 1 1 1 1 | 2 c i c i c i l l l c i e e e l + + − = 1 log 1 . 2 Residual Normal-deviate i N Residual normal-deviate didefinisikan sebagai : ⎭ ⎬ ⎫ ⎩ ⎨ ⎧ Φ = − 1 i i i t S N , 2.33 dengan Φ adalah standar distribusi normal kumulatif. Anggap fungsi survival T S benar, i N diperkirakan sebuah standar distribusi normal. Bukti : Jika dimisalkan } 1 { = s A ruang sampel T S , } { ∞ −∞ = N B ruang sampel N, maka diperoleh fungsi distribusi dari N adalah: 1 n s P n N P n G ≤ Φ = ≤ = − ∫ Φ Φ = = Φ ≤ = 1 n n ds n s P . 2.34 Pada kasus tersensor, salah satu i i t S dapat digantikan dengan pengandaian nilai median atau mean. Jika digunakan pengandaian median 2 i i t S , maka i N berbentuk: 2 2 1 2 1 e n c i i e i e t S n − − = π . 2.35 Bentuk di atas didapatkan dengan penjelasan sebagai berikut : ∫ ∫ ∞ − ∞ − − ∞ − ≤ = ≤ ≤ = ≤ ≤ x x c i i y n c i i i c i i i n N P dy e y l dx n N x N f n N x N P c i 2 , 2 2 1 | | π ∫ ∞ − − ∞ − Φ = x y n c i dy e y l n c i 2 , 2 2 1 1 π Misalkan c i n x c i i c i i i n N N n x l e n N f n N N f x f c i c i i i Φ = ≤ ≤ = ∞ − − ≤ 1 2 1 , , 2 | 2 π ; maka, ∫ ∫ ∞ ∞ − ∞ − − ≤ Φ = = ≤ = c i c i i i n x c i n N N c i i i c i dx e n x dx x xf n N N E n 2 | 2 2 1 | π 2 2 2 2 1 2 1 c i c i n c i i n c i e t S e n − − − = Φ − = π π

BAB III METODOLOGI

3.1 Pengumpulan Data

Dalam skripsi ini digunakan satu set data, yaitu data mengenai penderita kanker paru-paru yang diambil dari contoh data pada software S-plus 2000. Data tersebut dapat dilihat pada lampiran 1.

3.2 Pengolahan Data

Pengolahan data pada skripsi ini menggunakan software S-Plus 2000. Adapun tahapan pengolahan datanya adalah seperti pada gambar 3.1 dan tahapan simulasinya dapat dilihat pada gambar 3.2. Gambar 3.1 Tahapan Pengolahan Data Cox- PH Eksponensial Weibull Model Evaluasi Model Plot Histogram Model terbaik Data