PENDEKATAN REGRESI COX PROPORSIONAL HAZARD DALAM PENENTUAN FAKTOR – FAKTOR YANG BERPENGARUH TERHADAP LAMA STUDI MAHASISWA S-1 MATEMATIKA DI UNIVERSITAS AIRLANGGA Repository - UNAIR REPOSITORY
PENDEKATAN REGRESI COX PROPORSIONAL HAZARD DALAM PENENTUAN FAKTOR – FAKTOR YANG BERPENGARUH TERHADAP LAMA STUDI MAHASISWA S-1 MATEMATIKA DI UNIVERSITAS AIRLANGGA SKRIPSI ARDI WAHYU AS’ARI PROGRAM STUDI S-1 MATEMATIKA DEPARTEMEN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS AIRLANGGA 2012
ADLN Perpustakaan Universitas Airlangga
PENDEKATAN REGRESI COX PROPORSIONAL HAZARD DALAM PENENTUAN FAKTOR – FAKTOR YANG BERPENGARUH TERHADAP LAMA STUDI MAHASISWA S-1 MATEMATIKA DI UNIVERSITAS AIRLANGGA SKRIPSI
Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Sains Bidang Matematika
Pada Fakultas Sains dan Teknologi Universitas Airlangga
Disetujui oleh : Pembimbing I, Drs. Eko Tjahjono, M.Si.
NIP 19600706 198601 1 001 Pembimbing II,
Drs. H. Sediono, M.Si NIP. 19610712 198701 1 001
ADLN Perpustakaan Universitas Airlangga
LEMBAR PENGESAHAN NASKAH SKRIPSI
Judul : Pendekatan Regresi Cox Proporsional Hazard dalam Penentuan Faktor
- – Faktor yang Berpengaruh terhadap Lama Studi Mahasiswa S-1 Matematika di Universitas Airlangga Penyusun :
Ardi Wahyu As’ari NIM : 080810352 Tanggal Ujian : 30 Agustus 2012
Disetujui oleh: Pembimbing I, Drs. Eko Tjahjono, M.Si.
NIP 19600706 198601 1 001 Pembimbing II,
Drs. H. Sediono, M.Si NIP. 19610712 198701 1 001
Mengetahui, Ketua Departemen Matematika
Fakultas Sains dan Teknologi Universitas Airlangga
Dr. Miswanto, M.Si NIP 19680204 199303 1 002
ADLN Perpustakaan Universitas Airlangga
ADLN Perpustakaan Universitas Airlangga
PEDOMAN PENGGUNAAN SKRIPSI
Skripsi ini tidak dipublikasikan, namun tersedia di perpustakaan dalam lingkungan Universitas Airlangga, diperkenankan untuk dipakai sebagai referensi kepustakaan, tetapi pengutipan harus seijin penulis dan harus menyebutkan sumbernya sesuai kebiasaan ilmiah.
Dokumen skripsi ini merupakan hak milik Universitas Airlangga
ADLN Perpustakaan Universitas Airlangga
KATA PENGANTAR Assalamu’alaikum warahmatullahi wabarakatuh.Alhamdulillah, segala puji syukur hanya layak untuk Allah SWT, atas segala nikmat, rahmat, taufiq, serta hidayah-Nya yang tiada terkira besarnya, sehingga penyusun dapat menyelesaikan skripsi dengan judul
”Pendekatan Regresi Cox Proporsional Hazard dalam Penentuan Faktor
- – Faktor yang Berpengaruh terhadap Lama Studi Mahasiswa S-1 Matematika di Universitas Airlangga ”.
Dalam penyusunan skripsi ini, penyusun memperoleh banyak bantuan dari berbagai pihak, karena itu penyusun mengucapkan terima kasih yang sebesar- besarnya kepada : 1. kedua orang tua tercinta yang selalu memberikan do’a restu dan kasih sayangnya yang tak berujung kepada penyusun,
2. Drs. Eko Tjahjono,M.Si. dan Drs. Sediono,M.Si. selaku Dosen Pembimbing penyusun yang selalu dengan sabar memberikan arahan dan masukan,
3. Ahmadin, S.Si, M.Si. selaku Dosen Wali, Toha Saifudin S.Si, M.Si. yang telah membantu penyusun dalam mengarahkan dan menyelesaikan proposal awal, serta segenap Dosen Matematika yang telah memberikan banyak ilmu, 4. sahabat-sahabat dekat penyusun yang selalu mengiringi, menemani dan memotivasi : Hikma, Titin, Putri, Desi, teman-teman MU 123, teman-teman
Math ’08, dan temen – teman seperjuangan C.I.S yang sama-sama merantau di Surabaya, 5. serta rekan – rekan lain yang tidak dapat disebutkan satu persatu.
Akhir kata, semoga skripsi ini bermanfaat untuk pembaca. Wassalamu’alaikum warahmatullahi wabarakatuh.
Surabaya, Agustus 2012 Ardi Wahyu A.
ADLN Perpustakaan Universitas Airlangga
Ardi Wahyu As’ari, 2012, Pendekatan Regresi Cox Proporsional Hazard dalam Penentuan Faktor
- – Faktor yang Berpengaruh terhadap Lama Studi Mahasiswa S-
1 Matematika di Universitas Airlangga. Skripsi ini dibawah bimbingan Drs. Eko Tjahjono,M.Si. dan Drs. Sediono,M.Si., Departemen Matematika, Fakultas Sains dan Teknologi, Universitas Airlangga, Surabaya.
ABSTRAK
Pada dasarnya setiap perguruan tinggi berusaha semaksimal mungkin meningkatkan kelulusan para mahasiswanya karena tingkat keberhasilan mahasiswa dapat mempengaruhi kualitas dari suatu perguruan tinggi. Oleh karena itu diperlukan analisis faktor-faktor yang mempengaruhi lama studi pada mahasiswa S-1 Matematika Universitas Airlangga.
Metode analisis survival yaitu suatu metode statistika yang mempelajari lamanya suatu peristiwa atau kejadian yang terjadi atau biasa dikenal dengan nama failure event. Model regresi Cox merupakan model yang sangat terkenal pada analisis survival untuk menjelaskan hubungan antara kegagalan individu pada suatu waktu dengan variabel penjelas dalam adanya penyensoran. Survival yang dimaksud dalam penelitian ini adalah kemampuan mahasiswa untuk menyelesaikan studinya.
Hasil penelitian menunjukkan bahwa faktor yang berpengaruh signifikan terhadap lama studi mahasiswa adalah faktor IPK. Model regresi Cox yang diperoleh dalam kasus ini adalah :
( ) ( ) ( ( ) ( )) dengan dan . Dari hasil model yang diperoleh, dapat diketahui bahwa semakin tinggi
IPK maka seorang mahasiswa akan semakin cepat lulus. Oleh karena itu semakin tinggi IPK maka akan semakin besar peluang mahasiswa menyelesaikan studi
Kata Kunci : Lama Studi Mahasiswa, Survival, Regresi Cox
ADLN Perpustakaan Universitas Airlangga
Ardi Wahyu As’ari, 2012, Proporsional Hazard Cox Regression Approach in Determining Factors Affecting S-1 Mathematic Student s’ Duration of Study in Airlangga University. This skripsi was supervised by Drs. Eko Tjahjono,M.Si. and Drs. Sediono,M.Si., Department of Mathematics, Faculty of Science and Technology, Airlangga University, Surabaya.
ABSTRACT
Basically every university struggles to increase graduation rate of its students because the success rate of students can affect the quality of a university. Because of it, analysis of the factors that affect the duration of study in S-1 Mathematic students of Airlangga University is required.
A method of survival analysis is a statistical method used to learn the duration of an event or commonly known as failure event. Cox regression model is a very popular model in survival analysis to describe the relationship between the failures of an individual at a time with the explanatory variables with censoring data. Survival meant in this research is the ability of students to complete their studies.
Research results show that significant factors influence a student's study duration is the GPA factor. The Cox regression models obtained in this case are: ( ) ( ) ( ( ) ( )) where and . From the obtained model results, it is showed that if the student
’s GPA is higher then the graduation of the student is earlier. Therefore, if the student’s GPA is higher then the probability of the student to complete the study is larger.
Keywords :
Student’s Time Duration, Survival, Cox Regression
DAFTAR ISI
LEMBAR JUDUL ................................................................................................ i LEMBAR PERNYATAAN ................................................................................. ii
ADLN Perpustakaan Universitas Airlangga
ADLN Perpustakaan Universitas Airlangga
ADLN Perpustakaan Universitas Airlangga
LAMPIRAN
ADLN Perpustakaan Universitas Airlangga
DAFTAR TABEL Nomor Judul Halaman3.1 Tabel Lama Mahasiswa Menyelesaikan Studi
25
3.2 Tabel Kaplan-Meier dari Lama Mahasiswa Menyelesaikan Studi
26
4.1 Tabel Ringkasan Data Mahasiswa Matematika Angkatan 2006
33
4.2 Tabel Distribusi Data Mahasiswa Matematika Angkatan 2006 terhadap Variabel Penjelas atau Faktor Dugaan
33
4.3 Tabel Distribusi Data Mahasiswa Matematika Angkatan 2006 untuk Faktor IPK
34
4.4 Tabel Distribusi Data Mahasiswa Matematika Angkatan 2006 untuk Faktor Asal Daerah
35
4.5 Tabel Distribusi Data Mahasiswa Matematika Angkatan 2006 untuk Faktor Jenis Kelamin
36
4.6 Tabel Distribusi Data Mahasiswa Matematika Angkatan 2006 untuk Faktor Jenis Kelamin
37
4.7 Tabel Distribusi Data Mahasiswa Matematika Angkatan 2006 untuk Faktor Jalur Masuk
38
4.8 Tabel Distribusi Data Mahasiswa Matematika Angkatan 2006 untuk Faktor Penghasilan Orang Tua
39
4.9 Tabel Distribusi Data Mahasiswa Matematika Angkatan 2006 untuk Faktor Rata-Rata NUN SMA
40
- 4.10 Tabel Kaplan Meier dari Lama Mahasiswa Menyelesaikan Studi untuk Faktor IPK
42 4.11 - Tabel Kaplan Meier dari Lama Mahasiswa
Menyelesaikan Studi untuk Faktor Daerah Asal Mahasiswa
43
ADLN Perpustakaan Universitas Airlangga
- 4.12 Tabel Kaplan Meier dari Lama Mahasiswa Menyelesaikan Studi untuk Faktor Jenis Kelamin Mahasiswa
44
- 4.13 Tabel Kaplan Meier dari Lama Mahasiswa Menyelesaikan Studi untuk Faktor Status Asal SMA
45
4.14 Tabel - Kaplan Meier dari Lama Mahasiswa Menyelesaikan Studi untuk Faktor Jalur Masuk
46
- 4.15 Tabel Kaplan Meier dari Lama Mahasiswa Menyelesaikan Studi untuk Faktor Penghasilan Orang Tua
47
- 4.16 Tabel Kaplan Meier dari Lama Mahasiswa Menyelesaikan Studi untuk Faktor Rata-Rata NUN SMA
49
4.17 Tabel Estimasi Awal Parameter
55
4.18 Tabel Estimasi Parameter
57 yang Signifikan
4.19 Tabel Estimasi Hazard Dasar dan Survival
58
4.20 Dugaan Peluang Mahasiswa yang Melakukan Studi
59 ( ) pada Berbagai Waktu
4.21 Dugaan Peluang Mahasiswa yang Lulus ( ) pada
Berbagai Waktu
59
ADLN Perpustakaan Universitas Airlangga
DAFTAR GAMBAR Nomor Judul Halaman2.1 Kurva Fungsi Survival
7
2.2 Kurva Fungsi Hazard
8
2.4 Plot
15 [ [ ̂( )]] terhadap t yang sejajar
4.1 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa menyelesaikan studi (t) untuk faktor IPK
50
4.2 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa menyelesaikan studi (t) untuk faktor Daerah Asal
51
4.3 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa menyelesaikan studi (t) untuk faktor Jenis Kelamin
51
4.4 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa menyelesaikan studi (t) untuk faktor Status SMA
52
4.5 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa menyelesaikan studi (t) untuk faktor Jalur Masuk
52
4.6 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa menyelesaikan studi (t) untuk faktor Penghasilan Orang
Tua
53
4.7 Plot [ [ ̂( )]] terhadap waktu lama mahasiswa menyelesaikan studi (t) untuk faktor Rata-Rata NUN SMA
53
4.8 Grafik Peluang Mahasiswa yang Melakukan Studi ( ) yang Dipengaruhi IPK pada Berbagai Waktu (t)
60
4.9 Grafik Peluang Mahasiswa yang Lulus ( ) yang
Dipengaruhi IPK pada Berbagai Waktu (t)
60
ADLN Perpustakaan Universitas Airlangga
DAFTAR LAMPIRAN Nomor Judul Lampiran1 Data Lama Mahasiswa Matematika Universitas Airlangga Tahun 2006 dalam Menyelesaikan Studi
2 Hasil Pengolahan SPSS untuk Model Regresi Cox Proporsional
Hazard
3 Algoritma Estimasi Beta untuk Model Regresi Cox pada SPSS
ADLN Perpustakaan Universitas Airlangga
BAB I PENDAHULUAN
1.1 Latar Belakang
Pada dasarnya setiap perguruan tinggi berusaha semaksimal mungkin meningkatkan kelulusan para mahasiswanya, baik secara kuantitas maupun kualitas. Secara kuantitas diharapkan jumlah mahasiswa yang lulus sama dengan yang terdaftar. Sedangkan secara kualitas diharapkan para mahasiswa dapat lulus dengan IPK yang maksimal dan tepat waktu.
Universitas Airlangga merupakan salah satu perguruan tinggi negeri favorit di Indonesia yang mempunyai visi menjadi World Class University. Untuk menuju keinginan tersebut, dibutuhkan kerja keras dan kesungguhan seluruh civitas akademik baik dari pihak mahasiswa, dosen maupun karyawan demi tercapainya visi tersebut. Tingginya tingkat keberhasilan mahasiswa dan rendahnya tingkat kegagalan mahasiswa dapat mencerminkan kualitas dari suatu perguruan tinggi.
Salah satu prodi yang berada di dalam naungan Univesitas Airlangga adalah S-1 Matematika. Seorang mahasiswa S-1 dikatakan lulus tepat waktu jika masa studinya tidak melebihi delapan semester. Pada studi pendahuluan yang dilakukan berdasarkan data mahasiswa S-1 Matematika angkatan 2006 yang diperoleh dari Sub Bagian Akademik dan Kemahasiswaan, Fakultas Sains dan Teknologi Universitas Airlangaa memberikan informasi bahwa mahasiswa yang
1
ADLN Perpustakaan Universitas Airlangga
menyelesaikan studi melebihi delapan semester sebesar 43,9 % dari mahasiswa keseluruhan.
Dalam statistika dikenal metode analisis survival yaitu suatu metode statistika yang mempelajari lamanya suatu peristiwa atau kejadian yang terjadi atau biasa dikenal dengan nama failure event. Kejadian dalam kasus ini merupakan lama studi mahasiswa S-1 Matematika. Dalam analisis survival atau dikenal dengan istilah waktu ketahanan hidup (survival time) atau T merupakan waktu dari awal perlakuan sampai terjadinya respon pertama kali yang ingin diamati.
Respon yang dimaksud adalah waktu yang diperlukan sampai suatu peristiwa atau kejadian yang diharapkan terjadi atau mungkin saja belum ditemukan pada saat pengumpulan data berakhir sehingga waktu survival-nya tidak dapat diamati. Pada kondisi demikian, pengamatan tersebut dapat dinyatakan sebagai pengamatan tersensor (Collet, 1994). Sedangkan metode regresi survival adalah metode regresi yang digunakan untuk melihat faktor-faktor yang menyebabkan terjadinya suatu peristiwa atau kejadian (biasa dikenal dengan nama
time dependent covariate) dengan variabel responnya adalah waktu ketahanan
hidup. Salah satu metode regresi survival yang sering digunakan adalah regresi
Cox proporsional hazard (Collet,1994). Survival yang dimaksud dalam penelitian
ini adalah kemampuan mahasiswa untuk menyelesaikan studinya Model Cox proporsional hazard merupakan model yang sangat terkenal pada analisis survival. Menurut Kleinbaum dan Klein (2005) hal yang menyebabkan model ini terkenal dan digunakan secara luas adalah :
ADLN Perpustakaan Universitas Airlangga
1. Model Cox proporsional hazard merupakan model semiparametrik.
2. Dapat mengestimasi hazard rasio tanpa diketahui ( ) atau fungsi hazard dasarnya.
3. Dapat mengestimasi ( ) ( ) dan fungsi survival walaupun ( ) tidak spesifik.
4. Merupakan model robust sehingga hasil dari model Cox hampir sama dengan model parametrik.
5. Model yang aman dipilih ketika berada dalam keraguan untuk menentukan model parametriknya, sehingga tidak ada ketakutan tentang pilihan model parametrik yang salah.
Penelitian sebelumnya mengenai analisis faktor-faktor yang mempengaruhi keberhasilan studi mahasiswa program sarjana ekstensi manajemen agribisnis IPB menunjukkan bahwa mahasiswa perempuan memiliki
IPK lebih tinggi dan masa studi lebih singkat (Syafrudin, 2006). Sartika (2009) melakukan penelitian tentang analisis faktor-faktor yang berpengaruruh terhadap keberhasilan mahasiswa Politeknik di Politeknik Negeri Bandung dan menunjukkan faktor nilai IPK, jenis kelamin, program studi yang diambil, dan nilai mata kuliah tertentu berpengaruh terhadap lama studi mahasiswa. Selain itu faktor lain usia, asal daerah mahasiswa, penghasilan orang tua, dan jalur masuk juga dianggap berpengaruh oleh Khoirunnisak (2010).
Faktor
- – faktor yang diduga yang mempengaruhi daya tahan dalam penelitian ini, yaitu : jenis kelamin, asal daerah mahasiswa, asal sekolah, NUN (Nilai Ujian Nasional) SMA, jalur masuk, IPK (Indeks Prestasi Kumulatif)
ADLN Perpustakaan Universitas Airlangga
terakhir, dan penghasilan orang tua. Pemilihan faktor
- – faktor tersebut dilakukan berdasarkan pertimbangan ketersediaan data karena mahasiswa yang diteliti saat ini sudah dinyatakan lulus.
Pada penelitian ini penyusun mencoba mengidentifikasi faktor-faktor yang mempengaruhi lama studi mahasiswa S1 Matematika Universitas Airlangga dengan regresi Cox proporsional hazard dengan demikian akan diperoleh analisis survival tentang kasus tersebut.
1.2 Rumusan Masalah
Berdasarkan uraian latar belakang di atas, maka diperoleh rumusan masalah sebagai berikut :
1. Faktor - faktor apa yang mempengaruhi lama studi mahasiswa S1 Matematika
Universitas Airlangga berdasarkan model regresi Cox proporsional hazard ?
2. Bagaimana model hubungan dari faktor-faktor yang mempengaruhi lama studi mahasiswa S1 Matematika Universitas Airlangga ?
1.3 Tujuan
Sesuai rumusan masalah yang telah diperoleh, maka tujuan yang ingin dicapai adalah untuk :
ADLN Perpustakaan Universitas Airlangga
1. Mengetahui faktor
- – faktor yang mempengaruhi lama studi mahasiswa S-1 Matematika Universitas Airlangga berdasarkan model regresi Cox proporsional hazard,
2. Mengetahui model hubungan dari faktor-faktor yang mempengaruhi lama studi mahasiswa S-1 Matematika Universitas Airlangga.
1.4 Manfaat
Diharapkan penelitian ini memberikan informasi mengenai lama studi mahasiswa S-1 Matematika Universitas Airlangga serta faktor-faktor yang mempengaruhi lama studi mahasiswa S-1 Matematika Universitas Airlangga.
1.5 Batasan Masalah
Batasan masalah dalam penelitian ini adalah penelitian hanya dilakukan pada mahasiswa S-1 Matematika Univesitas Airlangga tahun angkatan 2006.
Lama menyelesaikan studi dalam penelitian ini didefinisikan sebagai lama seorang mahasiswa menyelesaikan studi (dalam semester) dan berakhir pada saat dinyatakan lulus (yudisium). Data diambil berdasarkan kelengkapan hasil rekap yang dilaksanakan pada Sub Bagian Akademik dan Kemahasiswaan Fakultas Sains dan Teknologi Universitas Airlangga untuk tahun angkatan 2006.
ADLN Perpustakaan Universitas Airlangga
BAB II TINJAUAN PUSTAKA
2.1 Analisis Survival
Menurut Kleinbaum dan Klein (2005), analisis survival merupakan sekumpulan prosedur dalam statistika untuk menganalisis data yaitu waktu tahan hidup sampai mengalami kejadian atau event. Waktu dapat dinyatakan dalam tahun, bulan, minggu, atau hari dari awal suatu individu sampai mengalami suatu kejadian, dengan kata lain waktu dapat menyatakan usia dari suatu individu ketika mengalami sebuah kejadian.
Pada umumnya kejadian dikenal sebagai kegagalan atau failure misalnya kematian, muncul penyakit, atau beberapa penelitian yang mempunyai dampak negatif. Namun waktu survival juga dapat dinyatakan waktu untuk kembali bekerja setelah melakukan operasi atau kembali sehat, yang dalam kasus ini kegagalan mengakibatkan kejadian positif.
Pendapat yang sama juga diungkapkan oleh Collet (1994) bahwa kejadian tidak selalu berujung pada kematian, bisa juga mengenai sembuhnya pasien dari penyakit, berkurangnya gejala penyakit, atau kambuhnya pasien dari kondisi tertentu.
2.2 Fungsi Survival dan Fungsi Hazard
menyatakan variabel random dari waktu tahan uji hidup. Karena menyatakan waktu, maka nilai yang mungkin adalah bilangan non negarif,
6
ADLN Perpustakaan Universitas Airlangga
sehingga harus lebih besar atau sama dengan nol. Sedangkan menyatakan nilai tertentu dari variabel random besar.
Fungsi survival ( ) merupakan probabilitas dari seseorang mampu bertahan lebih lama dari beberapa waktu tertentu
, sehingga ( ) menyatakan probabilitas variabel random melewati waktu tertentu . Secara teori range merupakan bilangan dari nol sampai tak hingga. Fungsi survival dapat digambarkan sebagai kurva kontinu dan memiliki karakteristik sebagai berikut : 1. tidak meningkat, kurva cenderung turun ketika meningkat, 2. untuk
, ( ) adalah awal dari penelitian, karena tidak ada objek yang mengalami kejadian, probabilitas waktu survival 0 adalah 1, 3. untuk
( ) secara teori, jika periode penelitian meningkat maka tidak ada satu pun yang bertahan, sehingga kurva survival mendekati nol.
Gambar 2.1 Kurva Fungsi SurvivalFungsi hazard menyatakan kemampuan atau potential sesaat per unit waktu untuk suatu kejadian yang dialami, yaitu waktu suatu individu telah
ADLN Perpustakaan Universitas Airlangga
bertahan hidup sampai waktu . Berbeda dengan fungsi survival yang fokus pada keberhasilan, fungsi hazard fokus pada kegagalan ketika kejadian berlangsung.
Sehingga dalam beberapa pemikiran, fungsi hazard dapat dianggap memberikan informasi yang berlawanan dengan fungsi survival.
Kurva fungsi hazard juga memiliki karakteristik, yaitu : 1. selalu non negatif, yaitu sama dengan atau lebih besar dari nol, 2. tidak memiliki batas atas.
Gambar 2.2 Kurva Fungsi HazardSelain itu tujuan fungsi hazard dapat digunakan untuk : 1. memberikan gambaran tentang failure rate, 2. mengidentifikasi bentuk model yang spesifik, 3. membuat model matematik untuk analisis survival biasa.
(Kleinbaum dan Klein,2005) Misalkan melambangkan waktu survival dari waktu awal sampai terjadinya peristiwa yang merupakan variabel acak yang memiliki karakteristik fungsi survival dan fungsi hazard, Fungsi survival
( ) didefinisikan sebagai
ADLN Perpustakaan Universitas Airlangga
probabilitas suatu individu dapat bertahan sampai waktu yang lebih besar atau sama dengan waktu. Apabila diketahui fungsi distribusi kumulatif , yaitu :
( ) ( ) ∫ ( ) maka diperoleh fungsi survival sebagai berikut : ( ) ( ) ∫ ( )
∫ ( ) ( ),
Fungsi survival dapat digunakan untuk menyatakan probabilitas suatu individu mampu bertahan dari waktu mula-mula sampai waktu (Collet, 1994).
Fungsi hazard ( ) didefinisikan sebagai kemampuan peluang kegagalan sesaat suatu individu pada waktu
. Misalkan probabilitas variabel random berada antara dengan syarat dan lebih besar atau sama dengan , maka dapat ditulis sebagai berikut :
( | ) Sehingga fungsi hazard adalah
( | )
- ( ) , ( )
{ } ( )
( ) ( )
- , ( )
Atau dapat juga ditulis sebagai berikut :
ADLN Perpustakaan Universitas Airlangga
( ) ( ) ( ) - ,
( )
( )
( )
( )
karena ( ) ( ) ( ) ( ) sehingga diperoleh
( )
( ) ( )
( )
( ) ( )
- ( )
( )
(2.1) ( ) , ( )- dengan
( ) ∫ ( ) ( ) disebut fungsi hazard kumulatif. Dari persamaan (2.1), fungsi hazard kumulatif dapat diperoleh dari fungsi survival sehingga
(2.2) ( ) ( ( ))
(Collet, 1994)
2.3 Tipe Penyensoran
Untuk mendapatkan data uji hidup biasanya dilakukan eksperimen. Dalam melakukan eksperimen ada beberapa metode yang dilakukan sehingga data yang dihasilkan juga berbeda dari satu metode ke metode lain. Yang membedakan analisis uji hidup dengan bidang-bidang yang lain pada statistika adalah penyensoran. Tipe penyensoran dalam analisis uji hidup adalah sebagai berikut :
ADLN Perpustakaan Universitas Airlangga
2.1.1 Sampel Lengkap
Pada uji sampel lengkap, eksperimen akan dihentikan jika semua benda atau individu yang telah diuji mati atau gagal. Langkah seperti ini mempunyai suatu keuntungan yaitu dihasilkannya observasi terurut dari semua benda atau individu yang diuji.
(Lawless,2003)
2.1.2 Sampel Tersensor Tipe I
Dalam sampel tersensor tipe I, eksperimen akan dihentikan jika telah dicapai waktu tertentu (waktu penyensoran). Misalkan adalah sampel
random dari distribusi tahan hidup dengan fungsi kepadatan peluang
( ), fungsi
survival
yaitu dengan ( ) dan waktu tersensor untuk semua . Suatu komponen dikatakan terobservasi jika dan tersensor jika . Selanjutnya data sampel uji hidup dicatat sebagai
( ) dan : {
(Lawless, 2003)
2.1.3 Sampel Tersensor Tipe II
Pada pengujian sampel tersensor tipe II, eksperimen akan dihentikan setelah kematian ke- dari komponen yang dioperasikan tercapai. Misalkan adalah sampel random dari distribusi tahan hidup dengan fungsi kepadatan peluang
( ) dan fungsi survival ( ). Eksperimen dikatakan telah selesai jika kegagalan ke- telah dicapai ( ).
(Lawless, 2003)
ADLN Perpustakaan Universitas Airlangga
2.4 Estimasi Kaplan-Meier
Cara yang digunakan untuk menggambarkan survival dari sampel acak yaitu menggambarkan grafik fungsi survival atau fungsi distribusi empiris dengan cara estimasi Kaplan-Meier. Selain itu juga memberikan estimasi distribusi secara nonparametrik.
Diberikan ( ) yang menyatakan sampel random tersensor, dengan merupakan data terobservasi dan merupakan data tersensor.
Misalkan terdapat , yang
( ) dengan waktu yang berbeda menyatakan banyaknya data yang terobesvasi. Kemungkian terjadinya satu atau lebih event yang terobservasi dinotasikan sebagai
∑ ( ) atau menyatakan banyaknya event terobservasi pada saat . Estimasi dari ̂( ) dapat didefinisikan sebagai berikut :
̂( ) ∏ dengan ∑ ( ) merupakan banyaknya individu yang beresiko pada saat dengan kata lain banyaknya individu yang belum mengalami kejadian atau
event dan tidak tersensor sebelum pada saat .
(Lawless, 1982)
2.5 Model Regresi Cox Proporsional Hazard
Fungsi survival dan fungsi hazard merupakan analisis yang digunakan untuk melihat perbedaan antara dua kelompok atau lebih. Namun bila ada variabel-variabel bebas yang ingin dikontrol atau bila menggunakan beberapa
ADLN Perpustakaan Universitas Airlangga
variabel penjelas untuk menjelaskan hubungan antara waktu survival, maka regresi Cox proporsional hazard lah yang digunakan. Jadi regresi Cox proporsional hazard merupakan model yang menggambarkan hubungan antara waktu survival sebagai variabel dependen dengan satu set variabel independen.
Variabel independen ini bisa kontinu ataupun kategorik.
Cox proporsional hazard merupakan model semiparametrik. Regresi Cox
proporsional hazard ini digunakan bila respon yang diobservasi adalah data waktu
survival (Kleinbaum dan Klein, 2005). Pada mulanya pemodelan ini digunakan
pada cabang statistika khususnya biostatistika yaitu digunakan untuk menganalisis kematian atau harapan hidup seseorang. Namun seiring perkembangan zaman pemodelan ini banyak dimanfaatkan diberbagai bidang. Diantaranya bidang akademik, kedokteran, sosial, science, teknik, pertanian dan sebagainya.
Model regresi Cox proposional hazard (Kleinbaum dan Klein, 2005) ditulis dalam bentuk sebagai berikut : (2.3)
( ) ( ) ( ) dengan :
( ) merupakan variabel prediktor atau penjelas, jumlah dari variabel penjelas ( ) fungsi hazard dasar.
Dalam memilih model yang sesuai dari regresi Cox proposional hazard diperlukan untuk mengestimasi , koefisien dari variabel penjelas X. Fungsi
hazard dasar mungkin juga perlu diestimasi. Namun dua komponen model
tersebut dapat diestimasi secara terpisah (Collet, 1994). Oleh karena itu, dapat
ADLN Perpustakaan Universitas Airlangga
diestimasi terlebih dahulu. Ketika menentukan nilai ̂ ditemukan solusi yang implisit sehingga diselesaikan secara numerik dengan metode Newton-Raphson.
Kemudian nilai ̂ yang diperoleh digunakan untuk mengestimasi fungsi hazard dasar.
Menurut Kleinbaum dan Klein (2005) dari model Cox proposional hazard, dapat mengestimasi rasio hazard (
̂ ) yang membandingkan dua variabel X yang
- * dinyatakan X dan X dengan bentuk umum sebagai berikut :
̂ ,∑ ̂ ( - ) dengan ( ) ( ). Selain itu dari model Cox proposional hazard juga diperoleh persamaan untuk penyesuaian kurva survival (adjusted survival curves) yang merupakan model Cox fungsi survival yang didefinisikan sebagai berikut :
(2.4) ( ) ( ) ( ) dengan :
( ) merupakan variabel prediktor atau penjelas, jumlah dari variabel penjelas ( ) fungsi survival dasar.
(Kleinbaum dan Klein, 2005)
ADLN Perpustakaan Universitas Airlangga
2.6 Asumsi Model Cox Proporsional Hazard
Model Cox proporsional hazard mengasumsikan bahwa perbandingan rasio hazard dua prediktor tertentu selalu konstan dari waktu ke waktu. Jadi
hazard dari suatu individu, proporsional atau sebanding dengan hazard dari individu lain dengan perbandingannya konstan atau tidak tergantung pada waktu.
Asumsi proporsional hazard terpenuhi jika grarik hazard tidak memotong dua atau lebih kategori prediktor. Namun jika fungsi hazard memotong, asumsi proporsional hazard mungkin tidak terpenuhi. Oleh karena itu, untuk memeriksa perpotongan hazard digunakan pendekatan lain untuk mengevaluasi kelayakan asumsi proporsional hazard. Pemeriksaan asumsi proportional hazard dapat dilakukan dengan melihat plot
- – , ̂( )- atau juga dikenal dengan log-log plot terhadap waktu survival ( ) untuk setiap variabel penjelas.
Dalam hal ini fungsi survival ̂( ) merupakan hasil estimasi metode
Kaplan Meier. Apabila plot antar kategori dalam satu variabel penjelas terlihat sejajar atau tidak bersilangan maka asumsi proportional hazard terpenuhi dan variabel penjelas yang bersifat kategori dapat dimasukkan model.
Gambar 2.3 Plot[ [ ̂( )]] terhadap t yang sejajar (Kleinbaum dan Klein, 2005).
ADLN Perpustakaan Universitas Airlangga
2.7 Fungsi Likelihood
Misalkan adalah variabel random yang identik dan independen dari suatu distribusi dengan fungsi kepadatan peluang (fkp) ( ) untuk dan adalah ruang parameter. Fkp bersama antara adalah
( ) ( ) ( ). Jika fkp bersama tersebut dinyatakan sebagai fungsi terhadap maka dinamakan fungsi likelihood yang dinyatakan dengan atau ditulis :
( ) ( ) ( ) ) (
(Hogg dan Craig, 1978)
2.8 Cox Likelihood
Collet (1994) menunjukkan fungsi likelihood yang sesuai untuk model proporsional hazard dengan kejadian diberikan berikut:
( ) ( )
(2.5) ( ) ∏
∑ ( ) ( ( ))
dengan merupakan vektor kovariat untuk individu yang terobservasi pada
( ) ( )
kategori waktu dan
( ) ( ( ) ) merupakan himpunan dari waktu pengamatan
yang mengalami kegagalan. Penjumlahan dalam persamaan fungsi likelihood ini merupakan jumlahan dari nilai ( ) pada setiap individu yang terobservasi pada waktu .
( )
Kemudian jika data terdiri dari waktu survival, yang dinotasikan dengan dan merupakan status sensoring, maka fungsi Cox likelihood dapat dinyatakan sebagai berikut :
ADLN Perpustakaan Universitas Airlangga
( )(2.6) ( ) ∏ { }
∑ ( ) ( )
dengan ( ) merupakan himpunan dari waktu yang mengalami kegagalan pada waktu .
2.9 Maksimum Likelihood Estimator (MLE)
Jika statistik ̂ ( ) memaksimumkan fungsi likelihood
( ) dinamakan
) maka statistik ̂ ( maksimum likelihood estimator (MLE) dari .
(Hogg and Craig, 1978)
2.10 Estimasi Fungsi Hazard Dasar dan Fungsi Survival Dasar
Misalkan komponen linear dari model proporsional hazard yang terdapat variabel penjelas X sebanyak p dan telah diperoleh estimasi koefisien variabel , sehingga dapat mengestimasi fungsi hazard dasar. ̂ ̂ ̂
Jika terdapat r waktu kegagalan yang berbeda sehingga diperoleh penyusunan orde waktu , dan terdapat banyaknya kegagalan
( ) ( ) ( ) dan banyaknya individu yang belum mengalami kegagalan pada waktu .
( )
Estimasi fungsi hazard pada waktu diberikan berikut :
( )
(2.7) ( ) ̂
̂
( )
dengan merupakan solusi dari persamaan yang diberikan berikut : ̂
( )
( ) ̂ ( )
∑ ( )
( )
(2.9) Estimasi fungsi survival dasar dari model regresi Cox proporsional hazard dengan hazard dasar yang telah diestimasi dapat diperoleh dengan persamaan berikut :
̂( )
. Fungsi likelihood
Diberikan sampel random dari populasi yang mempunyai pdf ( ) ( ) Ω , dengan Ω =
2.13 Uji Rasio Likelihood
(Collet, 1994)
̂ ( ) (2.10)
∑
∫ ̂ ( ) sehingga dapat diestimasi fungsi kumulatif hazard sebagai berikut :
̂ ( ) ∏ ̂ (2.8)
∑
Dengan mengintegralkan kedua ruas dari persamaan (2.3), maka diperoleh: ∫ ̂( )
2.12 Estimasi Fungsi Kumulatif Hazard
̂ ( ) ̂ ( ) ∑ ̂ (Collet, 1994)
Dari persamaan (2.2) diperoleh ( ) ( ( )), maka fungsi kumulatif hazard dasar dapat diestimasi berikut :
2.11 Estimasi Fungsi Kumulatif Hazard Dasar
(Collet, 1994)
ADLN Perpustakaan Universitas Airlangga
ADLN Perpustakaan Universitas Airlangga
dibawah adalah dan fungsi likelihood dibawah ( ) ∏ ( ) adalah , maka untuk menguji hipotesis
( ) ∏ ( )
( ̂ )
versus digunakan statistik uji dengan
( ̂
( ̂ ) ( ) dan ( ̂ ) ( ) Daerah kritis untuk uji hipotesis tersebut adalah tolak jika untuk . ( Hogg and Craig,
2004) Menurut Arbia (2006), statistik uji berdistribusi
( )
dengan ditolak adalah banyaknya parameter. Untuk tingkat signifikansi , jika .
( )
2.14 Metode Backward
Metode backward merupakan salah satu metode untuk mendapatkan model terbaik yang dapat menggambarkan hubungan antara waktu survival dengan beberapa variabel penjelas. Berikut ini merupakan langkah yang dilakukan untuk menyeleksi variabel berdasarkan variabel mana yang seharusnya masuk dalam model maupun dihilangkan dalam model menurut Le(1997) adalah sebagai berikut:
1. Membuat model regresi untuk setiap variabel penjelas secara bersama-sama
2. Memilih salah satu variabel penjelas, yang berdasarkan kriteria pemilihan merupakan varabel yang paling akhir untuk dimasukkan dalam model
ADLN Perpustakaan Universitas Airlangga
3. Melakukan pengujian pada variabel yang terpilih pada langkah II, sehingga dapat diketahui apakah variabel tersebut harus dihilangkan dari model atau tidak 4. Mengulangi langkah II dan III untuk setiap variabel yang ada dalam model.
Jika tidak ada kriteria yang cocok lagi berdasarkan langkah III, maka tidak ada lagi variabel yang dihilangkan dari model dan proses telah selesai.
2.15 Metode Newton – Raphson
( )
Misalkan terdapat bentuk implisit dari dengan maka iterasi Newton-Raphson adalah sebagai berikut (Lawless, 2003) :
(2.11) ( ) (
) Dengan
) maka (
( ) ( ) ( )
dan ( ) ( )
( )
- ( ) *
Keterangan : : vektor parameter regresor berukuran pada iterasi ke .
.
( ) matrik Jacobian pada saat ( ) Vektor dari fungsi turunan pertama log L.
Adapun langkah-langkah dalam metode Newton-Raphson adalah sebagai berikut : 1.
Menentukan nilai awal estimator untuk ( ) 2.
Menentukan ).
( ) (
ADLN Perpustakaan Universitas Airlangga
3. Menghitung estimator berikutnya menggunakan (2.11).
4. Mengulangi iterasi sampai diperoleh nilai max | | dengan adalah konstanta positif yang ditentukan.
2.16 SPSS
Analisis yang dijalankan di SPSS menggunakan prosedur yang sesuai pada dataset SPSS. Sebagian besar pengguna memilih prosedur dengan menunjuk dan mengklik mouse melalui serangkaian dari menu dan kotak dialog. Kode atau perintah syntax yang digunakan untuk analisis survival sebagai berikut : Estimasi fungsi survival dan membandingkan tiap tingkatan
Untuk mendapatkan estimator survival dengan Kaplan-Meier, pilih Analyze
→ Survival → Kaplan-Meier. Pilih variabel waktu survival (SURVT) dari
daftar variabel dan memasukkannya ke dalam Time box, kemudian pilih STATUS variabel dan masukkan ke dalam Status box. Lalu akan dilihat sebuah tanda tanya dalam tanda kurung setelah variabel status yang menunjukkan bahwa nilai event yang akan dimasukkan. Klik tombol Define
Event dan masukkan nilai 1 dalam kotak karena STATUS variabel berkode 1
untuk terobesrvasi dan 0 untuk tersensor. Kemudian masukkan variabel faktor. Kemudian klik tanda Save. Klik Next dan kemudian OK untuk melihat output. Memeriksa asumsi proporsional hazard menggunakan kurva log-log survival
Kaplan-Meier
ADLN Perpustakaan Universitas Airlangga
Untuk menghitung log-log survival dapat dihitung dengan memilih Transform → Compute dan mendefinisikan variabel baru dalam dialog-box.
Kemudian untuk kurva log-log survival Kaplan-Meier dapat dijalankan dengan memilih
Graphs → Scatter dan kemudian mengklik Simple dan
kemudian klik Define di kotak dialog scatterplot. Pilih LLS untuk sumbu Y, SURVT untuk sumbu X, dan varibel faktor di Set Marker by Box.
Menjalankan model Cox proporsional hazard Sebuah model Cox proporsional hazard dapat dijalankan dengan memilih
Analyze → Survival→ Cox Regression. Pilih variabel waktu survival
(SURVT) dari daftar variabel dan memasukkannya ke dalam kotak Time, kemudian pilih STATUS variabel dan masukkan ke dalam kotak Status.
Kemudian akan dilihat sebuah tanda tanya dalam tanda kurung setelah Status variabel menunjukkan bahwa nilai event perlu dimasukkan. Klik tombol
Define Event dan masukkan nilai 1 dalam kotak karena STATUS variabel
diberi kode 1 untuk terobservasi dan 0 untuk tersensor. Klik Next dan pilih daftar variabel faktor dan memasukkan ke dalam kotak kovariat. Klik OK untuk melihat output.
(Kleinbaum dan Klein, 2005)
ADLN Perpustakaan Universitas Airlangga
BAB III METODE PENELITIAN
3.1 Sumber Data