Survival Analysis LANDASAN TEORI

10 di mana:   = koefisien penduga parameter  SE  = standard error penduga parameter  . B. Uji peubah ganda Pengujian peubah ganda berkebalikkan dengan uji peubah tunggal, dalam pengujian peubah ganda dilakukan pengajuan kontribusi peubah secara bersama- sama. Uji statistik yang digunakan adalah likelihood ratio LR dengan menggunakan log likelihood statistik. LR dikenal juga dengan nama uji Chi- Square 2  didefinisikan sebagai berikut [5]: 2 2 2 m r m lnL lnL       2 m r m lnL lnL     . 2.13 dengan: m L = log likelihood statistik dengan m variabel m r L  = log likelihood statistik dengan m variabel dan disisihkan sebanyak r variabel.

2.3. Survival Analysis

2.3.1. Definisi Survival Analysis Survival analysis adalah suatu metode yang berhubungan dengan waktu, mulai dari time origin atau start point sampai dengan terjadinya suatu kejadian khusus atau end point. Dengan kata lain, survival analysis memerlukan data yang merupakan waktu survival dari suatu individu. Dalam bidang asuransi jiwa data ini diperoleh dari suatu pengamatan terhadap sekelompok atau beberapa kelompok individu dan dalam hal ini adalah tertanggung pengguna jasa asuransi jiwa, yang diamati dan dicatat waktu terjadinya kegagalan event dari setiap 11 individu. Kegagalan yang dimaksudkan antara lain adalah ketika tertanggung meninggal atau mengajukan klaim dikarenakan tertanggung terkena suatu musibah, seperti sakit, kecelakaan atau terkena bencana alam, sehingga pihak perusahaan asuransi harus menanggung biaya klaim yang diajukan itu. Maka waktu survival yang dicatat antara lain sebagai berikut [4]: a. Selisih waktu mulai dilakukannya pengamatan sampai terjadinya pengajuan klaim, dengan kata lain tertanggung meninggal event dan data tersebut termasuk data tidak tersensor, b. Jika waktu pengajuan klaim tidak diketahui tertanggung survive, maka memakai selisih waktu mulai dilakukannya pengamatan sampai waktu terakhir penelitian dan data tersebut termasuk data tersensor censored data. Data tersensor merupakan data yang mendapatkan penyensoran karena sebab-sebab tertentu. Umumnya terdapat tiga alasan mengapa terjadi penyensoran, yaitu: 1. Seseorang yang tidak terjadi event meninggal sampai end point, 2. Seseorang yang informasinya tidak dapat diketahui kelanjutannya selama masa penelitian, 3. Seseorang yang meninggal yang kematiannya karena alasan tertentu, karena narkoba, bunuh diri atau yang lainnya yang disengaja [5]. Data tersensor terbagi menjadi dua jenis, yaitu data tersensor kanan dan kiri. Data tersensor kanan merupakan tipe data umum dalam survival analysis. Penyensoran dilakukan ketika diketahui bahwa survival time melebihi suatu nilai tertentu atau akhir masa penelitian, dengan kata lain sampai akhir masa penelitian 12 tertanggung tidak mengalami event. Dalam penelitian ini data termasuk data tersensor kanan, penyensoran pada data tersensor kanan dilakukan karena tertanggung diketahui sampai batas waktu penelitian tidak mengalami event. Gambar 2.1. Contoh data sensor kanan Sedangkan yang dinamakan data tersensor kiri adalah data yang mengalami penyensoran saat waktu kejadian kurang dari suatu nilai tertentu. Contohnya adalah penelitian balita yang mampu berjalan pada usia satu tahun, maka data tersensornya adalah balita yang mampu berjalan sebelum usia satu tahun [3]. 2.3.2. Cox Proportional Hazard Model Ada beberapa teori yang pernah membahas tentang survival analysis yaitu di antaranya adalah Kaplan-meier dan Cox. Pada mulanya permodelan dari teori ini digunakan pada cabang ilmu kedokteran, di mana mereka menganalisis kematian atau harapan hidup seseorang, namun permodelan ini semakin berkembang dan digunakan dalam bidang-bidang lain. Setiap pengamatan dalam analisis ketahanan hidup dapat dituliskan , , i i i t w X , dengan 1, 2,3,..., i n  dimana n adalah banyaknya pengamatan 13 0, i t  ~ adalah waktu seorang individu dapat bertahan dari penyakit hingga kejadian, sedangkan w i bernilai 1 apabila individu tersebut mengalami event meninggal sehingga mengajukan klaim pada waktu i t dan bernilai apabila individu tersebut tersensor pada i t , i X merupakan variabel dari individu ke-i dimana 1 2 [ ... ] i ip X X X X  dengan ip X berupa variabel dummy yang memiliki nilai 0 atau 1. Fungsi hazard yang bergantung pada variabel dapat ditulis sebagai berikut [5]: 1 , .exp . p i i i h t X h t X     2.14 dengan: , h t X = resiko kematian individu pada waktu t dengan karakteristik X h t = fungsi hazard baku i  = parameter variabel i X Jika variabel 1 2 ... p X X X     , maka fungsi hazard tersebut merupakan fungsi baseline hazard atau hazard baku yang hanya bergantung pada waktu, sehingga diperoleh [5]: , .exp0 h t X h t  h t  Membandingkan persamaan hazard 2.14 dengan variabel sama dan kategori berbeda yang bebas terhadap waktu t, maka diperoleh hazard ratio. Hazard ratio didefinisikan sebagai hazard untuk satu individu dibagi dengan hazard untuk satu individu lain [5]: 14  1 1 exp , , exp p i i i p i i i h t X h t X HR h t X h t X         1 exp p i i i i X X      2.15 2.3.3. Estimasi Fungsi Survival Fungsi survival yang bergantung pada variabel adalah sebagai berikut [5]: 1 exp . , p i i i X S t X S t     2.16 dengan: , S t X = kemungkinan survive individu pada waktu t dengan karakteristik X S t = fungsi survival i  = parameter variabel i X Umumnya estimasi fungsi survival menggunakan estimasi Kaplan-Meier yang disebut Product-Limit Estimator. Estimasi ini didefinisikan untuk semua nilai t pada data adalah sebagai berikut [6]:  1 1 , , . { i i i t t i d Y i t t t t S t             2.17 dengan: t i = waktu terjadi event d i = jumlah kematian pada waktu t i Y i = jumlah tertanggung yang beresiko terjadi event pada waktu t i . Estimasi kumulatif hazard menggunakan estimasi Nelson-Aalen didefinisikan sebagai berikut [6]:  1 , , . { i i i i t t i d Y t t t t H t      2.18 15

2.4. Cluster