ANALISIS REGRESI COX PROPORSIONAL DENGAN HAZARD DASAR WEIBULL PADA DATA TERSENSOR TIPE II SKRIPSI

ANALISIS REGRESI COX PROPORSIONAL DENGAN HAZARD DASAR WEIBULL PADA DATA TERSENSOR TIPE II SKRIPSI

  ANALISIS REGRESI COX PROPORSIONAL DENGAN HAZARD DASAR WEIBULL PADA DATA TERSENSOR TIPE II SKRIPSI Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Sains Bidang Matematika Pada Fakultas Sains Dan Teknologi Universitas Airlangga Disetujui oleh Pembimbing 1 Pembimbing II Toha Saifudin,S.Si,M.Si Drs. Suliyanto, M.Si NIP. 19750106 199903 1 002 NIP. 19650907 199102 1 001

  ii

  LEMBAR PENGESAHAN NASKAH SKRIPSI

Judul : Analisis Regresi Cox Proporsional dengan Hazard

Dasar Weibull pada Data Tersensor Tipe II

  Penyusun : Jatu Herlina Amurwani Nomor Induk : 080810555 Tanggal Ujian : 18 Juni 2012 Disetujui oleh : Pembimbing 1 Pembimbing II Toha Saifudin,S.Si,M.Si Drs. Suliyanto, M.Si NIP. 19750106 199903 1 002 NIP. 19650907 199102 1 001 Mengetahui : Ketua Program Studi S-1 Matematika Departemen Matematika Fakultas Sains dan Teknologi Universitas Airlangga Dr. Miswanto NIP. 19680204 199303 1 002

  iii

PEDOMAN PENGGUNAAN SKRIPSI

  Skripsi ini tidak dipublikasikan, namun tersedia di perpustakaan dalam lingkungan Universitas Airlangga, diperkenankan untuk dipakai sebagai referensi kepustakaan, tetapi pengutipan harus seizin penyusun dan harus menyebutkan sumbernya sesuai kebiasaan ilmiah. Dokumen skripsi ini merupakan milik Universitas Airlangga. iv

  KATA PENGANTAR Assalamu’alaikum warahmatullahi wabarakatuh.

  Alhamdulillahirobbil alamin, berkat rahmat Allah yang telah memberikan petunjuk dan bimbingan-Nya yang tiada tara, sehingga penulis dapat menyelesaikan skripsi dengan judul ”Analisis Regresi Cox Proporsional dengan

  Hazard Dasar Weibull pada Data Tersensor Tipe II ”.

  Dalam penyusunannya, penulis memperoleh banyak bantuan dari berbagai pihak, karena itu penulis mengucapkan terima kasih yang sebesar-besarnya kepada :

  1. Dr. Miswanto, M.Si., selaku Ketua Prodi S-1 Matematika serta dosen penguji yang telah memberikan arahan dan bimbingan kepada penulis.

  2. Toha Saifudin, S.Si, M.Si selaku dosen pembimbing I yang telah memberikan banyak arahan, masukan, perhatian, semangat, rasa sabar yang begitu besar dan pengetahuan yang tidak ternilai harganya.

  3. Suliyanto, M.Si. selaku dosen pembimbing II yang telah memberikan banyak arahan, masukan, waktu, tenaga dan pikiran.

  4. Ir. Elly Ana, M.Si., selaku dosen penguji yang telah memberikan banyak saran untuk kesempurnaan skripsi ini.

  5. Dra. Utami Dyah P, M.Si selaku dosen wali selama menjadi mahasiswa Fakultas Sains dan Teknologi Universitas Airlangga yang telah banyak memberikan arahan dan saran demi kesuksesan menjadi mahasiswa Matematika. Serta seluruh dosen Matematika Universitas Airlangga, terima kasih untuk segala ilmu yang diberikan.

  6. Untuk Kedua Orang Tuaku tercinta dan ketiga adikku yang telah memberikan dukungan, semangat, kerpercayaan serta cinta dan kasih sayang yang begitu besar. Semoga saya selalu bisa membanggakan kalian.

  7. Untuk Varian Luthfan yang telah setia menjadi seorang teman, sahabat, pemberi motivasi serta semangat yang tak pernah henti. Terima kasih atas segala perhatian dan nasehat-nasehatnya selama ini.

  8. Arek-arek GP++ : Ragil, Rika, Dilphi, Mita, Wewe, Dinda, Lia, Tika, Vita, dan Michelle, terima kasih atas semua dukungan, canda tawa dan kenangan manis selama ini, semuanya tidak akan pernah terlupakan sampai kapanpun.

  Love you All .

  9. Anak-anak kos dodol penghuni koz Ungu : Lely “Mon” terima kasih telah menjadi temen kamar yang menyenangkan dan selalu memberi dukungan, v

  Arindha & Lia “Temen Seperjuangan” Semangat kawan ayo wisuda bareng, Beta “Bebeb” Jangan kebanyakan nonton drama korea sedih ya. Untuk Efinda & Daris, Mega & D’Nita, Terima kasih atas dukungan, kebersamaan dan canda tawa selama ini.

  10. Rekan-rekan mahasiswa Matematika Universitas Airlangga 2008, terima kasih atas kebersamaan selama ini.

  11. Serta pihak-pihak lain yang tidak dapat disebutkan satu persatu, terima kasih atas segala bantuan dalam penyelesaian skripsi ini.

  Penulis menyadari bahwa skripsi ini masih banyak terdapat kekurangan- kekurangan. Oleh karena itu, penulis mengharapkan kritik dan saran yang membangun agar skripsi ini dapat lebih baik lagi.

  Surabaya, Juni 2012 Penyusun

  Jatu Herlina Amurwani vi Jatu Herlina Amurwani. 2012. Analisis Regresi Cox Proporsional dengan

  Hazard Dasar Weibull pada Data Tersensor Tipe II. Skripsi ini dibawah

  bimbingan Toha Saifudin S.Si, M.Si dan Drs. Suliyanto, M.Si. Departemen Matematika. Fakultas Sains dan Teknologi Universitas Airlangga.

  ABSTRAK

  Model regresi Cox proporsional merupakan model yang menggambarkan hubungan antara waktu survival sebagai variabel dependen dengan satu set variabel independen yang bisa kontinue ataupun kategorik. Secara umum bentuk model regresi Cox Proporsional dengan hazard dasar weibull adalah :

  ( ) ( ) dengan merupakan vektor dari variabel independen, merupakan vektor merupakan hazard dasar dari distribusi dari koefisien regresi, dan

  Weibull. Tujuan tulisan ini adalah mendapatkan estimator parameter regresi Cox dengan hazard dasar weibull pada data tersensor tipe II. Metode yang digunakan untuk mengestimasi parameter model adalah Maximum Likelihood. Estimator parameter regresi Cox dengan hazard dasar weibull pada data tersensor tipe II masih dalam bentuk implisit, sehingga diperlukan metode numerik untuk menyelesaikannya. Model selanjutnya diterapkan pada studi kasus pasien penderita Cardiovascular Diseases. Persamaan model regresi Cox proporsional dengan hazard dasar weibull pada data tersensor tipe II, hasil penerapan pada pasien penderita Cardiovascular Diseases adalah sebagai berikut :

  ̂ ( ) ( )( ) ( ) adalah Logaritm of Urinary dengan adalah Sistolic Blood Pressure dan

  Albumin and Creatin

  . Nilai residual Cox-snell dari model tersebut berdistribusi eksponensial, sehingga dapat dikatakan model yang didapat sesuai atau tepat. Berdasarkan persamaan tersebut, diketahui bahwa resiko kematian pasien akan bertambah sebesar untuk setiap kenaikan SBP sebesar 10 satuan. Sedangkan untuk variabel LACR, resiko kematian pasien akan bertambah sebesar 0,256563 untuk setiap kenaikan LACR sebesar 2 satuan.

  Kata Kunci : Model Regresi Cox Proporsional dengan Hazard Dasar Weibull,

  Regresi Cox, Proporsional Hazard, Data Tersensor Tipe II,

  Maximum Likelihood Estimator

  (MLE) vii Jatu Herlina Amurwani. 2012. Analisis Regresi Cox Proporsional dengan

  Hazard Dasar Weibull pada Data Tersensor Tipe II. This skripsi in under the

  guidance by Toha Saifudin S.Si, M.Si and Drs. Suliyanto, M.Si. Mathematics departement of Scince and Technology Faculty. Airlangga University.

  ABSTRACT

  Cox proportional regression model is a model that describes the relationship between survival times as the dependent variable with a set of independent variables, which can be continuous or categorical. In general, the form of Cox proportional regression model with the baseline hazard Weibull is

  ( ) ( ) where is a vector of independent variables, is vector of regression . are the baseline hazard of the Weibull distribution The coefficients, and purpose of this paper is to obtain estimators Cox regression parameter with Weibull as the baseline hazard for type II censored. The method used to estimate the model is the Maximum Likelihood Estimator. The model was applied to case studies of patients with Cardiovascular Diseases. The equation of Cox : proportional hazard in patients with Cardiovascular Diseases are as follows

  ̂ ( ) ( )( ) ( ) is Logaritm of Urinary Albumin and where is Sistolic Blood Pressure and Creatine. Cox-Snell residual value of this model is distributed exponentially, so that it can be said that the model fit or just gained. Based on the results, it is known that the risk of dying patients would increase by 0.751572 for each increase in SBP of 10 units. While for the variable LACR, the risk of dying patients would increase by 0.256563 for each increase by 2 units LACR.

  Keyword : Cox Proportional Regression Model with Baseline Hazard Weibull,

  Cox Regression, Proportional Hazard, Type II censored data, Maximum Likelihood Estimator (MLE) viii

  ix

  BAB II TINJAUAN PUSTAKA ......................................................................... 6

  2.6 Model Regresi Dalam Analisis Data Uji Hidup .............................. 14

  2.5 Distribusi Weibull ........................................................................... 13

  2.4 Fungsi Survival dan Fungsi Hazard .................................................. 9

  2.3 Tipe Penyensoran .............................................................................. 8

  2.2 Analisis Data Uji Hidup .................................................................... 7

  2.1 Analisis Regresi ................................................................................. 6

  1.5 Batasan Masalah ................................................................................ 5

  DAFTAR ISI

  1.4 Manfaat .............................................................................................. 5

  1.3 Tujuan ................................................................................................ 4

  1.2 Rumusan Masalah ............................................................................. 4

  1.1 Latar Belakang Permasalahan ........................................................... 1

  BAB I PENDAHULUAN ................................................................................... 1

  Halaman LEMBAR JUDUL ............................................................................................... i LEMBAR PERNYATAAN ................................................................................ ii LEMBAR PENGESAHAN ............................................................................... iii LEMBAR PEDOMAN PENGGUNAAN SKRIPSI .......................................... iv KATA PENGANTAR ........................................................................................ v ABSTRAK ........................................................................................................ vii DAFTAR ISI ...................................................................................................... ix DAFTAR GAMBAR ........................................................................................ xii DAFTAR TABEL ............................................................................................ xiii DAFTAR LAMPIRAN ............................................................................. xiv

  2.7 Model Regresi Cox Proporsional Hazard ........................................ 15

  2.8 Fungsi Likelihood ........................................................................... 17

  2.9 Maximum Likelihood Estimator ..................................................... 18

  2.10 Estimasi Fungsi Survival ............................................................... 18

  2.11 Residual Cox – Snell ..................................................................... 19

  2.12 Metode Newton Rapshon .............................................................. 21

  2.13 Titik Maksimum ............................................................................ 22

  2.14 Matrik Definit Negatif ................................................................... 23

  2.15 S-Plus ............................................................................................ 23

  2.16 Cardiovascular Diseases ................................................................ 25

  2.17 Interpretasi Model Proporsional Hazard ....................................... 30

  BAB III METODE PENELITIAN .............................................................. 32 BAB IV PEMBAHASAN ................................................................................. 34

  4.1 Model Regresi Cox dengan Hazard Dasar Weibull ........................ 34

  4.1.1 Menentukan Fungsi Hazard Dasar Weibull ......................... 35

  4.1.2 Mendapatkan Model Regresi Cox dengan Hazard Dasar Weibull ........................................................................ 35

  4.1.3 Menetukan Fungsi Survival dan PDF yang berhubungan dengan Hazard Dasar Weibull ............................................... 35

  4.2 Estimasi Parameter dalam Model Regresi Cox ............ 36

  4.2.1 Menentukan Fungsi Likelihood dari Model Regresi Cox dengan Hazard Dasar Weibull............................................... 36

  4.2.2 Menentukan Fungsi Log-Likelihood ..................................... 37

  4.2.3 Menentukan Turunan Pertama Fungsi Log Likelihood Terhadap Parameter ............................................. 38

  4.2.4 Mendapatkan Estimator Parameter ...................... 39

  4.2.5 Menentukan Turunan Kedua Fungsi Log Likelihood ........... 40

  4.3 Estimasi Residual Cox – Snell ...................................................... 45

  4.4 Algoritma untuk Mendapatkan Estimator .................... 46 x

  4.5 Algoritma untuk Estimasi Residual Cox – Snell ............................ 49

  4.6 Program Estimasi Parameter Model Regresi Cox dengan Hazard Dasar Weibull........................................................ 49

  4.7 Penerapan Pada Kasus Data Uji Hidup .......................................... 50

  4.7.1 Uji Kesesuaian Distribusi Weibull pada data waktu Tahan Hidup pasien Cardiovascular Disease ................................. 50

  4.7.2 Asumsi Hazard Proporsional ................................................. 51

  4.7.3 Estimasi Parameter ............................................. 65

  4.7.4 Model Regresi Cox Proporsional untuk Data CVD .............. 67

  4.7.5 Uji Residual Cox – Snell ....................................................... 68

  4.7.6 Resiko Kematian Pasien Cardiovascular Disease ................ 69

  BAB V KESIMPULAN .................................................................................... 71 DAFTAR PUSTAKA ....................................................................................... 73 LAMPIRAN xi

  xii DAFTAR GAMBAR

  Nomor Judul Gambar Halaman

  2.1 Kurva Fungsi Survival ........................................................................ 10

  2.2 Kurva Distribusi Kumulatif Weibull .................................................. 13

  4.1 Plot Asumsi Hazard Proporsional Variabel DG ................................. 52

  4.2 Plot Asumsi Hazard Proporsional Variabel AGE ............................... 54

  4.3 Plot Asumsi Hazard Proporsional Variabel SEX ................................ 55

  4.4 Plot Asumsi Hazard Proporsional Variabel SMOKE ......................... 56

  4.5 Plot Asumsi Hazard Proporsional Variabel BMI ................................ 58

  4.6 Plot Asumsi Hazard Proporsional Variabel SBP ................................ 59

  4.7 Plot Asumsi Hazard Proporsional Variabel LACR ............................ 60

  4.8 Plot Asumsi Hazard Proporsional Variabel LTG ............................... 62

  4.9 Plot Asumsi Hazard Proporsional Variabel HTN ............................... 63

  4.10 Plot Asumsi Hazard Proporsional Variabel DM ................................. 64

  DAFTAR TABEL

  Nomor Judul Tabel Halaman

  4.1 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel Jenis penyakit (DG) ................................................................. 52

  4.2 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel Usia (AGE) .............................................................................. 53

  4.3 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel Jenis kelamin (SEX) ................................................................ 54

  4.4 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel intensitas merokok (SMOKE) ................................................. 56

  4.5 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel indeks masa tubuh (BMI) ........................................................ 57

  4.6 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel tekanan darah sistole (SBP)..................................................... 58

  4.7 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel Algoritma Albumin dan kreatin (LACR) ................................ 60

  4.8 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel Algoritma Trigliserin (LTG) ................................................... 61

  4.9 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel status hipertensi (HTN) ........................................................... 62

  4.10 Nilai-nilai penduga Kaplan Meier dari fungsi Survival variabel status diabetes (DM)................................................................ 64 Dari Data Tahan Hidup Pasien

  4.11 Nilai Estimator Awal Penderita Penyakit Kardiovaskuler. ...................................................... 66

  4.12 Nilai Estimator Parameter ̂ Dari Data Tahan Hidup Pasien Penderita Penyakit Kardiovaskuler ....................................................... 66

  4.13 Nilai Residual Pada Data Tahan Hidup Pasien Penderita Penyakit Kardiovaskuler ...................................................................................... 68 xiii

DAFTAR LAMPIRAN

  Nomor Judul Lampiran 1. Data Pasien Penderita Cardiovascular Disease (CVD).

  2. Uji Kesesuaian Distribusi Weibull pada Kasus Data Tahan Hidup Pasien Penderita Cardiovascular Disease (CVD).

  3. Program Untuk Menentukan Estimator Parameter Model Regresi Cox Proporsional Hazard.

  a. Subprogram Untuk Mendapatkan Turunan Pertama.

  b. Subprogram Untuk Mendapatkan Matrik Jacobian.

  c. Subprogram Untuk Mendapatkan Estimator Parameter.

  .

  4. Program Untuk Mendapatkan Nilai Residual Cox – Snell.

  Output

  5. Program Untuk Menentukan Parameter Model Regresi Cox Proporsional dengan Hazard Dasar Weibull.

  a. Nilai estimator parameter regresi Cox

  b. Nilai Eigen matriks Hessian

  c. Uji residual Cox Snell xiv

BAB I PENDAHULUAN

1.1 Latar belakang

  Statistika merupakan suatu alat yang memegang peranan penting dalam pengambilan keputusan. Banyak sekali peranan ilmu statistika dalam pengambilan keputusan, salah satunya adalah di dunia medis atau kesehatan.

  Analisis data uji hidup merupakan salah satu teknik statistika yang banyak digunakan dalam bidang kesehatan. Di dunia kesehatan, sulit sekali untuk mengetahui lamanya tahan hidup seorang pasien dalam pengobatan suatu penyakit, apalagi untuk menentukan waktu kesembuhan atau kambuhnya suatu penyakit. Namun, hal yang bisa kita lakukan adalah mengetahui sifat karakteristik dari penyakit tersebut, antara lain : menganalisis peluang ketahanan, resiko kematian, memodelkan sifat karakteristik penyakit, menentukan estimasi interval kepercayaan dan mengambil kesimpulan yang berhubungan dengan penyakit tersebut.

  Dalam kehidupan nyata khususnya di dunia kesehatan, banyak sekali situasi yang melibatkan populasi heterogen, sehingga penting untuk mempertimbangkan hubungan waktu tahan hidup seseorang dengan faktor lain. Satu-satunya jalan untuk menguji hubungan dari variabel bebas yang sesuai dengan waktu tahan hidup seseorang adalah dengan menggunakan model regresi, dengan ketergantungan waktu tahan hidup pada variabel yang sesuai dengan tegas dikenali. Dalam analisis data uji hidup terdapat dua model regresi yang sering

  1 digunakan yaitu : model proporsional hazard untuk T dan model lokasi skala untuk log T.

  Model tersebut selanjutnya diperluas pada situasi dimana resiko kematian pada waktu tertentu tergantung pada nilai dari variabel bebas . Himpunan nilai variabel bebas dari model proporsi hazard dapat

  . Model regresi Cox dinyatakan dengan vektor , yaitu = proporsional hazard untuk pengamatan ke- dari individu dapat dituliskan sebagai berikut :

  Model regresi Cox merupakan model hazard proporsional dasar yaitu rasio

  hazard

  nya sama sepanjang waktu atau rasio hazardnya independen dengan waktu

  (Fahrmer dan Tutz,1994). Model ini dikemukakan oleh Cox dan lebih dikenal

  dengan regresi Cox, dimana merupakan vektor dari variabel bebas, dan merupakan koefisien regresi yang membentuk vektor , sedangkan merupakan fungsi hazard untuk individu dengan semua nilai variabel bebasnya yang memuat vektor x sama dengan nol, dinamakan hazard dasar (baseline

  hazard function ) (Collet, 1994).

  Fungsi hazard untuk setiap individu adalah yang diasumsikan berdistribusi Weibull dengan λ adalah parameter skala dan γ adalah parameter bentuk, maka Model Cox dapat dituliskan sebagai berikut (Collet, 1994) :

  Distribusi weibull yang digunakan sebagai hazard dasar merupakan salah satu distribusi yang banyak digunakan untuk menganalisis data uji hidup.

  Distribusi weibull memiliki berbagai kelebihan yang tidak dimiliki oleh distribusi lain seperti : memiliki 2 parameter yaitu parameter bentuk dan parameter skala, parameter bentuk yang dimiliki oleh distribusi weibull menjadikan distribusi ini lebih fleksibel atau bisa menyerupai distribusi lain.

  Model regresi Cox proporsional hazard merupakan regresi survival, dengan respon merupakan data waktu survival sampai suatu titik kejadian yang ditentukan. Karakteristik utama model regresi Cox ini adalah mengakomodasikan adanya data sensor. Di dalam analisis data uji hidup dikenal beberapa tipe penyensoran, diantaranya adalah sampel tersensor tipe II. Sampel tersensor tipe II ini memiliki kelebihan yaitu lebih efisien waktu, karena percobaan akan dihentikan ketika sudah mencapai kegagalan yang diinginkan, dengan ketentuan .

  Karakteristik analisis survival yang mengakomodasi adanya sensoring inilah yang membuat estimasi parameter pemodelan data survival dengan fungsi

  likelihood

  semakin komplek (Fox,2002). Pada kasus dimana satu atau lebih data tersensor tipe II, maka fungsi likelihood-nya dapat ditulis sebagai berikut | }

  {∏ dengan menyatakan data waktu survival, menyatakan banyak data survival, dan menyatakan banyak kematian / kegagalan pertama yang diinginkan untuk diuji. Berdasarkan uraian diatas, penulis tertarik untuk mengambil judul “Analisis Regresi Cox Proporsional dengan Hazard Dasar Weibull pada Data Tersensor Tipe II” dan selanjutnya menerapkan hasilnya pada data riil.

  1.2 Rumusan Masalah

  Berdasarkan latar belakang yang telah diuraikan, dapat dirumuskan permasalahan :

  1 Bagaimana bentuk model regresi Cox proporsional dengan hazard dasar weibull ?

  2 Bagaimana memperoleh estimator parameter model regresi Cox dengan hazard dasar Weibull pada data tersensor tipe II ?

  3 Bagaimana menerapkan model regresi Cox melalui studi kasus pada data riil ?

  1.3 Tujuan

  Berdasarkan rumusan masalah diatas, tujuan yang ingin dicapai adalah untuk :

  1 Mendapatkan bentuk model regresi Cox proporsional dengan hazard dasar weibull

  2 Mendapatkan estimator parameter model regresi Cox dengan hazard dasar Weibull pada data tersensor tipe II

  3 Menerapkan model regresi Cox terhadap data riil.

  1.4 Manfaat

  Manfaat dari penulisan skripsi ini adalah sebagai berikut :

  1 Memperluas wawasan tentang metode analisis regresi yang biasa digunakan untuk menganalisa data survival

  2 Dapat memodelkan regresi data survival secara umum dan metode

  Cox secara khusus.

  3 Mampu menerapkan dan mengaplikasikan model regresi tersebut ke dalam data riil.

  1.5 Batasan masalah

  Mengacu pada rumusan masalah yang telah disebutkan, maka ruang lingkup dalam penulisan skripsi ini dibatasi pada estimasi titik parameter regresi dengan metode maksimum likelihood pada data tersensor tipe II.

BAB II TINJAUAN PUSTAKA

2.1 Analisis Regresi

   Sir Francis Galton (1822-1911), seorang antropolog dan ahli meteorologi

  terkenal dari Inggris yang memperkenalkan istilah regresi dalam pidato di depan

  Section H of the British Association

  di Aberdem, 1885, yang dimuat dalam majalah Nature, dan juga dalam sebuah makalah “Regression Towards Mediocrity

  in Hereditary Stature

  ”, yang dimuat dalam journal of the Antropolgical Institute, 1985.

  (Drapper dan Smith,1992)

  Analisis regresi merupakan salah satu teknik yang ada dalam statistika, secara umum ada beberapa definisi yang menjelaskan tentang analisis regresi yaitu :

  Definisi 2.1

  Analisis regresi merupakan teknik statistik untuk menyelidiki dan membuat model hubungan diantara variabel-variabel.

  (Montgomery dan Peck,1992) Definisi 2.2

  Tujuan dari analisis regresi yaitu untuk mendapatkan model terbaik yang menggambarkan hubungan antara variabel respon (variabel tak

  6 bebas/variabel dependen) dan variabel prediktor (variabel bebas/variabel independen) .

  (Hosmer dan Lemeshow, 1989) Definisi 2.3

  Variabel prediktor ialah variabel yang nilainya dapat ditentukan atau yang nilainya dapat diamati namun tidak dapat dikendalikan. Variabel respon ialah variabel yang nilainya dipengaruhi oleh perubahan-perubahan variabel-variabel prediktor.

  (Drapper dan Smith,1992)

  Di dalam kehidupan nyata banyak sekali teknik statistika yang dapat digunakan untuk menganalisis masalah. Salah satu teknik analisis statistika yang digunakan untuk menganalisis data yang berhubungan dengan waktu tahan hidup adalah analisis data uji hidup.

2.2 Analisis Data Uji Hidup

  Analisis data uji hidup (Survival analysis) adalah suatu metode untuk menganalisis data yang berhubungan dengan waktu, mulai dari time origin atau

  start-point

  sampai dengan terjadinya suatu kejadian khusus atau end point. Di dalam riset medis, time origin sering digunakan sebagai awal perekrutan suatu individu dalam suatu studi yang bersifat percobaan sedangkan end-point merupakan kematian suatu individu atau pasien, sehingga data yang dihasilkan secara harfiah dinamakan waktu survival.

  (Collet,1994) Untuk mendapatkan data uji hidup biasanya dilakukan eksperimen. Dalam melakukan eksperimen ada beberapa metode yang dilakukan sehingga data yang dihasilkan juga berbeda dari satu metode ke metode lain. Yang membedakan analisis uji hidup dengan bidang-bidang yang lain pada statistika adalah penyensoran.

2.3 Tipe Penyensoran

  Di dalam analisis data uji hidup terdapat beberapa tipe penyensoran yaitu sampel lengkap, sampel tersensor tipe I, dan sampel tersensor tipe II. Penjelasan lengkapnya adalah sebagai berikut :

  2.3.1 Sampel Lengkap

  Pada uji sampel lengkap, eksperimen akan dihentikan jika semua benda atau individu yang telah diuji mati atau gagal. Langkah seperti ini mempunyai suatu keuntungan yaitu dihasilkannya observasi terurut dari semua benda atau individu yang diuji.

  (Lawless,1982)

  2.3.2 Sampel Tersensor Tipe I

  Dalam sampel tersensor tipe I, eksperimen akan dihentikan jika telah adalah sampel dicapai waktu tertentu (waktu penyensoran). Misalkan

  random

  dari distribusi tahan hidup dengan fungsi kepadatan peluang , fungsi

  survival dan waktu tersensor untuk semua yaitu dengan .

  . Suatu komponen dikatakan terobservasi jika dan tersensor jika Selanjutnya data sampel uji hidup dicatat sebagai dan :

  { adalah nilai sensor pada pengamatan ke-i dimana

  (Lawless, 1982)

2.3.3 Sampel Tersensor Tipe II

  Pada pengujian sampel tersensor tipe II, eksperimen akan dihentikan setelah kematian ke- dari komponen yang dioperasikan tercapai. Misalkan adalah sampel random dari distribusi tahan hidup dengan fungsi kepadatan peluang dan fungsi survival . Eksperimen dikatakan telah selesai jika kegagalan ke- telah dicapai ( .

  (Lawless, 1982)

  Dalam analisis data survival ada dua macam fungsi yang dapat memberikan informasi tentang data survival, yaitu fungsi survival dan fungsi

  hazard .

2.4 Fungsi Survival dan Fungsi Hazard

  Fungsi survival merupakan dasar dari analisis survival, karena meliputi probabilitas survival dari waktu yang berbeda-beda yang memberikan informasi penting tentang data survival. Dalam analisis data uji hidup fungsi survival dapat didefinisikan :

  Definisi 2.4

  Fungsi survival disefinisikan sebagai probabilitas waktu yang bertahan lebih besar atau sama dengan waktu. Jika diketahui fungsi distribusi kumulatif , yaitu : ∫ , (2.1) maka bisa diperoleh fungsi survival sebagai berikut :

  ∫ ∫

  (2.2)

  (Kleinbaum dan Klein, 2005)

  Secara teori, fungsi survival dapat digambarkan dengan kurva mulus dan memiliki karakteristik sebagai berikut:

  1. Tidak meningkat, kurva cenderung turun ketika meningkat.

  2. Untuk , adalah awal dari penelitian, karena tidak ada objek yang mengalami peristiwa, probabilitas waktu survival 0 adalah 1.

  3. Untuk secara teori, jika periode penelitian meningkat sampai tak berhingga maka tidak ada satu pun yang bertahan, sehingga kurva survival mendekati nol.

Gambar 2.1 Kurva Fungsi Survival Berbeda dengan fungsi survival yang fokus pada tidak terjadinya peristiwa, fungsi hazard fokus pada terjadinya peristiwa. Oleh karena itu, fungsi

  hazard

  dapat dipandang sebagai pemberi informasi yang berlawanan dengan fungsi survival.

  (Kleinbaum dan Klein, 2005)

  Kurva fungsi hazard juga memiliki karakteristik, yaitu: 1. Selalu non negatif, yaitu sama atau lebih besar dari nol.

  2. Tidak memiliki batas atas. Selain itu fungsi hazard juga digunakan untuk alasan : 1. Memberikan gambaran tentang failur rate.

  2. Mengidentifikasi bentuk model yang spesifik.

  3. Membuat model matematik untuk analisis survival biasa.

  Misalkan melambangkan waktu survival dari waktu awal sampai terjadinya peristiwa yang merupakan variabel acak yang memiliki karakteristik fungsi survival dan fungsi hazard, maka fungsi hazard didefinisikan :

  Definisi 2.5

  Fungsi hazard didefinisikan sebagai tingkat kematian sesaat suatu individu pada waktu .

  (Kleinbaum dan Klein, 2005)

  , dengan syarat Misal, probabilitas variabel random berada antara dan lebih besar atau sama dengan , ditulis sebagai berikut :

  | Maka fungsi hazard yang didapat adalah |

  { } { }

  { } atau dapat juga ditulis sebagai berikut : { }

  (2.3) karena sehingga diperoleh { } { }

  { } (2.4)

  • ∫ disebut fungsi hazard kumulatif dengan ∫ (Collet, 1994).

  Di dalam analisis data uji hidup terdapat beberapa distribusi yang dapat digunakan sebagai asumsi, salah satunya adalah distribusi Weibull.

2.5 Distribusi Weibull

  Fungsi kepadatan peluang (fkp) dari distribusi Weibull dua parameter, diformulasikan sebagai : , ( ) - (2.5) dengan :

   (Lawless, 2003)

  Jika maka fungsi kepadatan peluang (fkp) dari waktu survival yang berdistribusi weibull dengan dua parameter adalah (2.6) dengan :

  Berdasarkan fkp dalam persamaan (2.6), diperoleh fungsi distribusi kumulatif weibull adalah sebagai berikut :

Gambar 2.2 Kurva Fungsi Distribusi Kumulatif Weibull Sehingga persamaan (2.2) fungsi survivalnya dapat dituliskan sebagai berikut : maka diperoleh fungsi hazard weibull : (2.7)

  (Collet, 1994)

  Dalam kehidupan nyata khususnya di dunia medis, banyak situasi yang melibatkan populasi heterogen, sehingga penting untuk mempertimbangkan hubungan waktu tahan hidup dengan faktor lain. Satu-satunya jalan untuk menguji hubungan dari variabel bebas yang sesuai dengan waktu tahan hidup yaitu menggunakan model regresi, dimana ketergantungan waktu tahan hidup pada variabel yang sesuai dengan tegas dikenali.

2.6 Model Regresi dalam Analisi Data Uji Hidup

  Dalam analisis data uji hidup terdapat dua model regresi yang sering digunakan untuk menganalisis data survival yaitu :

2.6.1 Model Proporsional Hazard untuk T

  Model proporsional hazard merupakan model yang mengasumsikan bahwa perbedaan antar individu dalam sekelompok data yang hendak dianalisis mempunyai fungsi hazard yang proporsional satu sama lain. Hal ini berarti bahwa

  ⁄ merupakan fungsi hazard dari dua individu dengan vektor rasio regresi tidak tergantung pada Dengan kata lain fungsi hazard untuk , dengan diketahui, dapat ditulis dengan :

  (2.8) dengan merupakan fungsi hazard dasar (baseline hazard functio) dan merupakan fungsi yang menyatakan pengaruh terhadap hazard.

  (Lawless, 1982) 2.6.2 Model Lokasi Skala untuk Log T.

  Bagian terpenting kedua dari model regresi dalam analisis data uji hidup adalah log waktu tahan hidup , diberikan , mempunyai suatu distribusi dengan parameter lokasi dan parameter skala tetap dapat ditulis sebagai berikut :

  (2.9) , dimana dan galat model mempunyai distribusi yang independen terhadap .

  Biasanya memiliki distribusi normal standart.

  (Lawless, 1982)

  Kedua model diatas merupakan model yang digunakan untuk menganalisis data survival secara umum, namun bila ada variabel-variabel bebas yang ingin dikontrol atau bila menggunakan beberapa variabel penjelas untuk menjelaskan hubungan antara waktu survival, maka regresi Cox lah yang digunakan.

2.6 Model Regresi Cox Proporsional Hazard

  Regresi Cox proporsional hazard digunakan bila respon yang diobservasi adalah data waktu survival (Kleinbaum dan Klein, 2005). Pada mulanya pemodelan ini digunakan pada cabang statistika khususnya biostatistika yaitu digunakan untuk menganalisis kematian atau harapan hidup seseorang. Namun seiring perkembangan zaman pemodelan ini banyak dimanfaatkan diberbagai bidang. Diantaranya bidang akademik, kedokteran, sosial, science, teknik, pertanian dan sebagainya.

  Ketika menyelidiki suatu kasus dibidang kedokteran contohnya kasus pasien penderita penyakit tertentu, dibutuhkan hubungan waktu survival pasien dengan karakteristik-karakteristik klinis lainnya yang didapat dari data medis pasien.

  Formula model Cox merupakan perkalian dari dua besaran yaitu fungsi

  baseline hazard

  yaitu dan bentuk eksponensial untuk penjumlahan linier dari penjumlahan dari variabel independen (Kleinbaum dan Klein, 2005).

  Model regresi Cox ini berlaku pada situasi dimana resiko kematian pada waktu tertentu tergantung pada nilai-nilai dari variabel bebas Himpunan nilai variabel bebas dari model proporsional hazard

  )’. Model proporsional dapat dinyatakan dengan x, sehingga

  hazard

  untuk pengamatan ke- dari individu secara umum :

  (2.10)

  dan dengan merupakan vektor dari variabel bebas, merupakan vektor dari koefisien regresi. Sedangkan merupakan fungsi

  hazard

  untuk individu yang mana semua nilai variabel bebasnya memmuat vektor x sama dengan nol, dinamakan hazard dasar (baseline hazard function).

  (Collet, 1994) Metode estimasi yang digunakan dalam skripsi ini adalah metode estimasi

  maximum likelihood

  . Ketika menggunakan metode ini, hal yang harus diketahui adalah tentang fungsi likelihood.

2.8 Fungsi Likelihood Definisi 2.6

  adalah variabel random yang identik dan Misalkan independen dari suatu distribusi dengan fungsi kepadatan peluang (fkp) untuk dan adalah ruang parameter. Fkp bersama antara adalah . Jika fkp bersama tersebut dinyatakan sebagai fungsi terhadap maka dinamakan fungsi

  likelihood

  (L) yang dinyatakan sebagai :

  (Hogg dan Craig, 1978) Definisi 2.7

  Pada kasus dimana terdapat satu atau lebih data survival yang tersensor tipe II, maka fungsi likelihood-nya dapat dituliskan sebagai : |

  ∏ dengan menyatakan data waktu survival, menyatakan jumlah kematian / kerusakan yang diinginkan dalam pengujian dan menyatakan banyaknya data yang sedang diuji.

  (Collet, 1994) Setelah mendapatkan fungsi likelihood, langkah selanjutnya dalam estimasi parameter menggunakan MLE adalah mendapatkan nilai maksimum

  likelihood .

  2.9 Maksimum Likelihood Estimator (MLE) Definisi 2.8

  memaksimumkan fungsi likelihood Jika statistik ̂ dinamakan maka statistik ̂

  maksimum likelihood estimator (MLE) dari .

  (Hogg and Craig, 1978) Karena fungsi survival merupakan dasar dari analisis data tahan hidup.

  Maka ketika menggunakan model regresi Cox proporsional dengan hazard dasar Weibull sebagai asumsi, maka hal yang harus dilakukan adalah mengestimasi fungsi survival.

  2.10 Estimasi Fungsi Survival

  Estimasi fungsi survival dasar dari model regresi Cox dengan hazard dasar weibull dapat diperoleh dengan persamaan berikut :

  ̂

  (2.12) ̂ ̂

  Estimasi fungsi hazard dasar kumulatif dari model regresi Cox dengan

  hazard

  dasar weibull dapat diperoleh dengan persamaan sebagai berikut :

  ̂ ̂

  (2.13) ̂ ̂ ̂ ̂ Dari estimasi fungsi survival dasar dan fungsi hazard dasar kumulatif diatas maka dapat diperoleh estimasi fungsi survival pengamatan ke- dan fungsi

  hazard

  kumulatif pengamatan ke- , yaitu : (2.14)

  ̂ ̂ ̂ , dan

  ̂

  (2.15) ̂ [ ̂ ]

  (Collet, 1994)

  Setelah fungsi survival didapat, maka model secara langsung juga akan didapatkan. Untuk menguji kesesuaian model dilakukan pengujian terhadap residual dari setiap pengamatan menggunakan residual Cox Snell.

2.11 Residual Cox – Snell

  Setelah suatu model didapat, perlu dilakukan pemeriksaan terhadap kesesuaian dari model tersebut. Banyak prosedur pemeriksaan model yang digunakan, salah satunya residual Cox snell. Residual Cox snell untuk individu ke- dengan diberikan berikut :

  (2.16) ̂ ( ̂ )

  , dengan ̂ merupakan estimasi fungsi hazard dasar kumulatif pada waktu fungsi tersebut dapat diselesaikan menggunakan persamaan (2.13). dari persamaan (2.14) residual Cox snell merupakan nilai dari ̂ ̂ dimana ̂ merupakan nilai estimasi dari fungsi dan ̂

  hazard

  Model kumulatif dan fungsi survival untuk individu ke- pada waktu dikatakan layak jika nilai residual Cox-Snell berdistribusi eksponensial.

  (Collet, 1994) Teorema 2.1 :

  Jika T merupakan variabel random dari waktu survival setiap pengamatan dan merupakan fungsi survival, maka varabel random berdistribusi eksponensial (Collet, 1994).

  Bukti teorema 2.1 :

  { } Fungsi densitas probabilitas dari variabel random diberikan sebagai berikut :

  } | {

  |

  } {

  { } Terbukti bahwa variabel random berdistribusi eksponensial.

  Ketika mengestimasi parameter, terdapat kemungkinan bahwa estimasi tersebut tidak diperoleh secara langsung seperti adanya fungsi implisit, oleh karena itu diperlukan suatu metode numerik untuk mendapatkan nilai estimator. Salah satu metode yang digunakan untuk mendapatkan nilai estimator adalah metode Newton Raphson.

2.12 Metode Newton – Raphson

  Misalkan terdapat bentuk implisit dari dengan maka iterasi Newton Raphson adalah sebagai berikut :

  (2.17) dengan ( ) maka ( ) dan

  [ ] dengan : adalah vektor berukuran pada iterasi ke .

  .

  matrik jacobian pada saat Vektor dari fungsi turunan pertama log L. Adapun langkah-langkah dalam metode Newton Raphson adalah sebagai berikut :

  1. Menentukan nilai awal estimator untuk

  2. Menentukan .

  3. Menghitung estimator berikutnya menggunakan (2.17).

  4. Mengulangi iterasi sampai diperoleh nilai max | | dengan adalah konstanta positif yang ditentukan.

  (Lee dan Wang, 2003)

  Nilai estimator parameter yang di dapatkan merupakan nilai yang dapat memaksimumkan fungsi likelihood, untuk memperoleh hal itu banyak ketentuan yang harus dipenuhi salah satunya mengenai titik maksimum. Selain itu, ketika menggunakan metode numerik, ketentuan yang harus dipenuhi adalah mendapatkan nilai eigen matrik hessian.

2.13 Titik Maksimum

  Jika fungsi mempunyai titik maksimum di maka

  (Bacon, 1985)

  Matrik hessian adalah matrik simetri A yang berisi persilangan turunan parsial dari dengan Syarat untuk maksimum dari fungsi adalah jika matrik hessian merupakan matrik definit negatif.

  (Jong dan Heller, 2008)

  Ketentuan tentang matrik definit negatif adalah sebagaimana teorema dibawah ini :

  2.14 Matrik Definite Negatif Teorema 2.2

  Sebuah matrik simetri A disebut definit negatif jika dan hanya jika semua nilai eigen dari matrik A bernilai negatif.

  Bukti Teorema 2.2 ( Lihat hal 709) (Anton dan Rorres, 2005)