BAB 7 MODEL SURVIVAL DATAR DIDUGA DARI DATA SAMPEL YANG TIDAK LENGKAP

BAB 7
MODEL SURVIVAL DATAR DIDUGA
DARI DATA SAMPEL YANG TIDAK LENGKAP
PROSEDUR MAXIMUM LIKELIHOOD

7.1 PENGANTAR
Pada bab ini kita memandang maximum likelihood estimation (MLE) sebagai suatu
alternatif bagi penduga aktuaria dan penduga momen lainnya yang dikembangkan pada bab
6. Dianggap bahwa pembaca memiliki dasar pengenalan dengan MLE dari mata kuliah
pendugaan statistik pada umumnya. Disini kita akan menerapkan teori MLE secara khusus
untuk menduga qx diatas interval dasar (x,x+1], Mengingat kedua lingkungan pengurangantunggal dan pengurangan-ganda. Seperti pada bab 6, kita akan melihat bahwa lingkungan
pengurangan-tunggal merupakan salah satu cara yang lebih mudah untuk menduga qx.
Dalam pendekatan momen pada bab 6 kita menyamakan jumlah kematian yang
diharapkan dalam (x,x+1] dengan jumlah sebenarnya yang diamati. Ini berarti bahwa kita
hanya memerlukan jumlah kematian yang diamati dalam (x,x+1], yang mana kita sebut dx.
dan bukan lokasi/daerah umur dari kematian tersebut di dalam (x,x+1]. Ingat kembali bahwa
kita menggunakan umur yang spesifik dimana seseorang memulai pengamatan dan
dijadwalkan untuk mengakhiri pengamatan, atau diamati untuk pengambilan, tetapi kita tidak
pernah menggunakan umur kematian yang akurat dari grup dx untuk menduga qx.
Pada MLE, umur kematian yang akurat adalah informasi yang dapat di gabungkan
menjadi prosedur pendugaan jika umur kematian yang akurat tersebut ada. Dengan demikian,

kita membedakan dua subdivisi (cabang) MLE yang penting: keadaan dimana umur kematian
yang akurat yang digunakan akan ditunjukkan sebagai keadaan data lengkap; keadaan
dimana hanya jumlah kematian pada interval (x,x+1] yang digunakan akan ditunjukkan
sebagai keadaan data parsial. Catat bahwa pendugaan momen yang sangat alami
memerlukan data parsial kematian saja, sedangkan pendugaan maximum likelihood dapat
berdasarkan data parsial atau data lengkap.
Dengan demikian kita akan menemukan bahwa sebuah masalah MLE akan dimulai
dengan pengenalan dari data yang tersedia, termasuk pertanyaan apakah kita memiliki data

lengkap atau data parsial dalam kematian. Informasi ini akan membimbing kita pada fungsi
likelihood. Kemudian kita akan perlu menyederhanakan pendugaan tertentu, seperti
pendugaan distribusi kematian, yang bertujuan untuk menyelesaikan persamaan likelihood
untuk q^ x .
Konsep dari umur yang keluar yang direncanakan, x+si, untuk orang ke-i yang
berhubungan dengan interval pendugaan (x,x+1] tidak akan mengambil peranan besar pada
bab ini.
Pendugaan maximum likelihood dari interval peluang kematian dibahas pada banyak
buku teks analisis survival dan pendugaan model survival. Terutama karya dari Broffitt [14]
adalah salah satu karya yang bagus, dan bagian dari bab ini berdasarkan pada karya tersebut.


7.2 LINGKUNGAN PENGURANGAN-TUNGGAL, KASUS KHUSUS A
Kita berharap memulai kasus ini sebagai sebuah cara untuk memperoleh pengenalan dengan
pendekatan maximum likelihood dalam keadaan yang mungkin paling mudah. Kemudian kita
dapat menghadapi keadaan yang lebih kompleks mengetahui bahwa teori dasar dengan
nyaman dipahami.
7.2.1 Data Parsial
Seperti yang didefinisikan pada bagian 6.2.2, situasi ini dengan mudah menyatakan bahwa,
dari sejumlah nx yang hidup tepat berusia x, sejumlah dx dari mereka mati dalam (x,x+1], dan
sejumlah nx-dx bertahan hidup sampai umur x+1. Kita menyadari ini sebagai model/bentuk
binomial, jadi likelihood sekedar merupakan peluang binomial dari perolehan hasil sampel
yang sebenarnya diperoleh. Yaitu

L ( q x|nx d x ) =

nx !
d
n −d
( q x ) ( 1−q x ) (7.1)
d x ! ( nx −d x ) !
x


x

x

Salah satu dari sifat dasar MLE adalah setiap pengali konstan dapat diabaikan, dan
akan tetap menghasilkan penduga qx yang sama. Ketika hal ini telah selesai dilakukan,
likelihood bukan lagi peluang dari sampel per se, tetapi lebih merupakan proporsional

(berbanding lurus) dengan sampel per se. Dengan demikian banyak penulis lebih memilih
untuk menulis
L ( q x|nx d x ) ∝(q x )d .(1−q x )n −d ,(7.2)
x

Dimana



x


x

dibaca “proporsional (berbanding lurus) terhadap.” Kita ingin mengambil

sudut pandang bahwa sama layaknya menyebut sisi kanan dari (7.2) adalah likelihood itu
sendiri. Seperti menyebutnya sesuatu dimana likelihood tersebut proporsional. Dengan
demikian kita dapat menulisnya secara lebih sederhana
dx

nx −d x

L ( q x|nx d x ) =(q x ) .(1−q x )
L ( q x|nx d x )

Notasi

,(7.3)

mengingatkan kita bahwa likelihood merupakan fungsi dari q x


yang tidak diketahui, dan nx dan dx merupakan nilai yang telah diberikan, yakni nilai-nilai
yang diamati dalam sampel sebagai dasar dari pendugaan qx kita. Ketika tidak ada keraguan
terhadap nilai yang tidak diketahui dan nilai yang diberikan, kita akan dengan mudah
menggunakan L dibandingkan

L ( q x|nx d x ) . Pada akhirnya, untuk kemudahan kita, kita

akan sering menekan subskrip x. Dengan demikian kita akan menulis likelihood untuk kasus
khusus A dengan keadaan data parsial sebagai berikut
d

n−d

L=q .(1−q)

(7.4)

Gagasannya sekarang adalah untuk menemukan nilai q, yang disebut
memaksimalkan persamaan (7.4). Secara umum, jika
semua q lainnya, maka q^


q^

ada, dengan

q^ , yang

L( q^ ) ≥ L( q) untuk

merupakan maximum likelihood estimator (MLE) dari q.

Untuk menemukan q^

dengan teknik kalkulus dari keadaan

dL
=0
dq

akan


memerlukan sebuah aplikasi dari aturan hasil kali untuk mendiferensialkan (7.4). Meskipun
ini bukanlah kasus yang sulit, kita akan melihat fungsi likelihood dapat menjadi jauh lebih
kompleks, dan beberapa aplikasi dari aturan hasil kali mungkin diperlukan. Untuk
menghindari ini, kita menggunakan log natural L sebelum mendiferensialkan. Maka, kita
menyelesaikan persamaan

d
ln L=0
dq

untuk

q^ . Nilai yang sama dari

q^

akan

dihasilkan dari penyelesaian persamaan ini sama seperti dari penyelesaian


dL
=0 , karena
dq

log natural merupakan transformasi monoton satu-ke-satu.
Dengan demikian kita mendefinisikan log-likelihood, ℓ, menjadi ln L, pemberlakuan,
dalam kasus ini
l=ln L=d ∙ ln q+ ( n−d ) ∙ ln ( 1−q ) (7.5)
Kemudian
d l d n−d
= −
=0 (7.6)
dq q 1−q
Merupakan persamaan likelihood yang dengan mudah menghasilkan

q^ x =

dx
(7.7)

nx

yang mana sama seperti penduga (6.7). Telah dicatat pada bagian 6.2.2 menjadi MLE.
CONTOH 7.1 Tunjukkan bahwa

q^ x

yang sama akan dihasilkan untuk kasus khusus A data

parsial bahkan jika transformasi log tidak digunakan.
PENYELESAIAN Kita akan mendiferensialkan (7.4) untuk memperoleh
dL d
=q [−( n−d ) ( 1−q )n−d−1 ] +(1−q)n−d [ d q d−1 ]=0,
dq
Maka

d ∙q d−1 (1−q)n−d =( n−d ) q d (1−q)n−d −1 . atau

d ( 1−q )=( n−d ) q , yang mana sama


seperti (7.6)
CONTOH 7.2 Tunjukkan bahwa

q^ x

yang didefinisikan oleh penduga (7.7)

memaksimalkan, bukannya meminimalkan. (7.5).
PENYELESAIAN

Karena

d , ( n−d ) , q2 dan(1−q)2

d l d n−d
= −
,
dq q 1−q

maka


d2 l −d
n−d
= 2−
.
2
dq
q
(1−q)2

Karena

semuanya bernilai positif, maka turunan kedua nya bernilai

negatif. Jadi q^ x memaksimalkan ln L.

7.2.2 Data Lengkap
Sekarang kita mengandaikan bahwa kita memiliki umur kematian yang akurat untuk masingmasing sejumlah dx yang mati dalam interval. Karena umur ini berbeda untuk masing-masing
kematian, kita memandangnya secara tersendiri, dan menggunakan hasil kali dari masingmasing kontribusi kematian dalam fungsi likelihood.
Likelihood untuk kematian ke-i diberikan oleh probability density function (PDF)
untuk kematian pada umur yang khusus, ditentukan hidup pada umur x. Yakni, untuk
kematian pada umur xi,

Li=f ( x i|X > x ) =

f (x i ) S( x i )∙ λ(x i )
=
(7.8)
S( x )
S (x)

Merupakan kontribusi terhadap L dari kematian ke-i. Jika kita misalkan s i=x i−x