1.2 Rumusan Masalah
Karena masih banyak mahasiswa S-1 Manajemen Fakultas Ekonomi USU stambuk 2008 yang masih belum menyelesaikan studinya padahal sudah sampai
batas akhir masa studi, masalah utama yang akan diteliti ialah berapa probabilitas survival studi mahasiswa menggunakan regresi Cox Proportional Hazard
berdasarkan faktor jalur masuk, Indeks Prestasi Kumulatif IPK, dan asal sekolah SMA, status sekolah dan penghasilan orang tua yang mempengaruhi survival
tersebut.
1.3 Pembatasan Masalah
Masalah yang diteliti dibatasi pada pembentukan model cox proportional hazard dan estimasi fungsi survival menggunakan metode Kaplan-Meier. Sedangkan data
yang digunakan untuk penelitian ini adalah data sekunder yaitu mahasiswa S-1 Manajemen Fakultas Ekonomi Universitas Sumatera Utara tahun angkatan 2008,
yang berjumlah 235 mahasiswa. Namun karena alasan kelengkapan, data yang bisa diteliti hanya 229 mahasiswa. Dalam hal ini data hanya sebagai bahan untuk
perhitungan dan tidak memperhatikan bagaimana pengaruh dan fenomena yang terjadi pada data yang digunakan.
1.4 Tujuan penelitian
Mendapatkan nilai probabilitas survival dari data sekunder studi mahasiswa S1 Manajemen Fakultas Ekonomi Universitas Sumatera Utara tahun angkatan 2008,
dan faktor-faktor apa saja yang mempengaruhi survival tersebut dan menentukan model cox proportional hazard.
1.5 Kontribusi Penelitian
Penelitian tugas akhir ini diharapkan dapat bermanfaat sebagai informasi mengenai penerapan statistika khususnya aplikasi model regresi cox proportional
hazard pada analisis survival. Dapat mengetahui faktor apa saja yang mempengaruhi lama studi mahasiswa S-1 Manajemen Fakultas Ekonomi
Universitas Sumatera Utara serta menambah referensi bagi pembaca dalam penelitian sejenis di masa yang akan datang.
BAB 2 LANDASAN TEORI
Pada bab ini akan dipaparkan teori-teori yang menjadi dasar dan landasan dalam
penelitian sehingga membantu mempermudah pembahasan bab selanjutnya dan pembahasan utama dalam penelitian ini. Teori tersebut meliputi analisis survival
data tersensor, fungsi survival dan fungsi hazard, estimasi Kaplan-Meier, model cox proportional hazard.
2.1 Analisis Survival
Armitage dan Berry 1987 mengatakan bahwa analisis survival merupakan analisis yang melibatkan uji statistik untuk menganalisis data yang variabelnya
berkaitan dengan waktu atau lamanya waktu sampai terjadinya peristiwa tertentu. Menurut Klein baum dan Klein 2005 analisis survival adalah kumpulan dari
prosedur statistik untuk menganalisis data dimana outcome variabelnya adalah waktu hingga terjadi peristiwa muncul. Waktu survival dapat didefinisikan
sebagai waktu dari awal observasi hingga terjadinya peristiwa, dapat berupa hari, bulan, maupun tahun.
Menurut Le 2003 dalam menentukan waktu survival, T, terdapat tiga elemen dasar yang diperlukan yaitu:
1. Waktu awal time origin. 2. Peristiwa akhirwaktu akhir failure event.
3. Skala waktu sebagai satuan pengukuran waktu.
T lama waktu
Waktu awal waktu akhir
T adalah lama dari waktu awal time origin harus didefinisikan dengan jelas, yaitu waktu awal melakukan studi. Begitu juga waktu akhir harus
didefinisikan secara jelas yaitu kegagalan dalam menyelasaikan studi skala waktu Le, 2003.
Analisis survival memiliki beberapa tujuan Kleinbaum dan Klein, 2005: 1. Mengestimasi dan mengiterpretasikan fungsi survival dan fungsi
hazard. 2. Membandingkan fungsi survival dan fungsi hazard.
3. Mengestimasi hubungan antara variabel penjelas dengan waktu survival.
2.1.1 Data Tersensor
Perbedaan antara analisis survival dengan analisis statistika lainnya adalah terjadinya suatu peristiwa yang lama waktu terjadinya terhadap objek adalah
bervariasi. Selain itu adanya data tersensor pada analisis survival. Menurut Machin et. al 2006 data dikatakan tersensor jika pengamatan waktu survival
hanya sebagian, tidak sampai failure event. Penyebab terjadinya data tersensor antara lain Le, 2003:
1. Loss to follow up, terjadi bila objek yang kita alami hilang dalam pengamatan.
2. Drop out, terjadi bila perlakuan dihentikan karena alasan tertentu. 3. Termination of study, terjadi bila masa penelitian berakhir sementara
objek yang diobservasi belum mencapai failure event.
Sedangkan menurut Kleinbaum dan Klein 2005 ada 3 alasan umum terjadinya penyensoran, yaitu:
1. Objek belum mengalami peristiwa sebelum masa penelitian berakhir. 2. Objek hilang selama masa follow-up ketika masa penelitian
3. Objek ditarik dari penelitian karena kegagalan atau disebabkan alas an lain.
Situasi ini diilustrasikan dengan grafik di bawah ini. Grafik menggambarkan beberapa orang atau objek yang diikuti X menyatakan orang atau objek yang
mendapatkan peritiwa.
Gambar 2.1 Grafik Data Tersensor
Dalam bukunya Crowder et. al 1991 mengatakan bahwa ada tiga jenis penyensoran, yaitu:
1. Left-censored, pengamatan dikatakan left-cencored jika objek yang diobservasi mengalami peristiwa di bawah waktu yang telah ditetapkan atau
ketika masa observasi belum selesai. 2. Right-censored, pengamatan dikatakan right-cencored jika objek masih hidup
atau masih beroperasi ketika masa observasi telah selesai. 3. Interval-censored, ketika objek mengalami peristiwa diantara interval waktu
tertentu maka pengamatan dikatakan interval-censored.
dikeluarkan
hilang
X X
Penelitian berakhir
Penelitian berakhir
X
Menurut Lee dan Wang 2003 ada 3 tipe penyensoran data, yaitu: 1. Tipe I, jika objek-objek diobservasi selama waktu tertentu, namun ada
beberapa objek yang mengalami peristiwa setelah periode atau masa observasi selesai, dan sebagian lagi mengalami peristiwa diluar dari yang
ditetapkan. 2. Tipe II, masa obsevasi selesai setelah sejumlah objek yang diobservasi
diharapkan mengalami peristiwa yang ditetapkan, sedang objek yang tidak mengalami peristiwa disensor.
3. Tipe III, jika waktu awal dan waktu berhentinya observasi dari objek berbeda-beda. Sensor tipe III ini sering disebut sebagai random-censored.
2.1.2. Fungsi Survival dan Fungsi Hazard
Pada analisis survival ada 2 hal yang mendasar yaitu fungsi survival dan fungsi hazard. Fungsi survival merupakan fungsi dasar dari analisis ini, karena meliputi
probabilitas survival dari waktu yang berbeda-beda yang memberikan informasi penting tentang data survival. Secara teori, fungsi survival dapat digambarkan
dengan kurva mulus dan memilki karakteristik sebagai berikut Kleinbaum dan Klein, 2005:
1. Tidak meningkat, kurva cenderung menurun ketika t meningkat. 2. Untuk t = 0, St = S0 = 1 adalah awal dari penelitian, karena tidak ada
objek yang mengalami peristiwa, probabilitas dari suatu survival 0 adalah 1. 3. Untuk t =
∞, St = S∞ = 0 secara teori, jika periode penelitian meningkat tanpa limit maka tidak ada satu pun yang bertahan sehingga kurva survival
mendekati nol.
Gambar 2.2 Kurva Fungsi Survival
Berbeda dengan fungsi survival yang fokus pada tidak terjadinya peristiwa, fungsi hazard fokus pada terjadinya peristiwa. Oleh karena itu fungsi
hazard dapat dipandang senagai pemberi informasi yang berlawanan dengan fungsi survival. Sama halnya dengan kurva fungsi survival, kurva fungsi hazard
juga memiliki karakteristik, yaitu Kleinbaum dan Klein 2005: 1. Selalu nonnegatif, yaitu sama atau lebih besar dari nol
2. Tidak memiliki batas atas
Selain itu fungsi hazard juga digunakan untuk alasan: 1. Member gambaran tentang keadaan failure rate.
2. Mengidentifikasi bentuk model yang spesifik 3. Membuat model matematik untuk analisis survival biasa
Gambar 2.3 Kurva Fungsi Hazard
Misalkan T melambangkan waktu survival dari waktu awal sampai terjadinya peristiwa yang merupakan variable acak yang memiliki karakteristik fungsi
survival dan fungsi hazard. Jika fungsi survival dinotasikan dengan ��,
didefinisikan sebagai probabilitas suatu objek yang bertahan lebih dari � waktu,
maka Le, 2003:
�� = ��� �, � ≥ 0 2.1
�� dikenal juga sebagai rata-rata survival, dan fungsi hazard merupakan laju failure atau kegagalan sesaat dengan asumsi objek telah bertahan sampai waktu
ke-t, yang didefinisikan sebagai berikut : ℎ� =
�� ��
2.2 dengan ft adalah fungsi kepadatan probabilitas T. Sekarang misalkan
�� = Pr
� ≤ � = ∫ ����
�
, � ≥ 0 adalah fungsi distribusi kumulatif dari T, maka
fungsi survival menjadi Korosteleva,2003: �� = ��� � = ∫ ��
∞ �
�� = 1 − ��, � ≥ 0 2.3
Dan fungsi hazard kumulatif ��, didefinisikan sebagai:
t
�� = ∫ ℎ���� ≥ 0
�
2.4
2.2 Kaplan-Meier
Telah diketahui bahwa salah satu tujuan dari analisis survival ialah mengestimasi dan menginterpretasi fungsi survival dan fungsi hazard. Banyak metode yang
digunakan untuk mengestimasi fungsi survival, diantaranya Nelson-Aalen estimator, metode life-table actuarial, metode Kaplan-Meier, AFT, bayessian
counting process dan lain-lain. Namun dalam penelitian ini metode yang digunakan adalah metode Kaplan-Meier. Penelitian ini ialah penelitian statstik
nonparametric dengan data tersensor, sehingga penggunaan metode Kaplan- Meier adalah yang paling baik.
Sebenarnya metode life-table sama dengan Kaplan-Meier, namun pada life-table objek di klasifikasikan berdasarkan karakteristik tertentu yang
masing-masing karakteristik disusun dengan interval dengan menganggap peluang terjadinya efek selama masa interval adalah konstan, sehingga data yang
diperoleh akan lebih umum. Sedangkan pada metode Kaplan-Meier objek dianalisis sesuai dengan waktu aslinya masing-masing. Hal ini mengakibatkan
proporsi survival yang pasti karena menggunakan waktu survival secara tepat sehingga diperoleh data yang lebih akurat. Selain itu Kaplan-Meier merupakan
metode yang digunakan ketika tidak ada model yang layak untuk data survival. Selama hampir 4 dekade metode estimasi Kaplan- Meier merupakan salah satu
dari kunci metode statistika untuk analisis data survival tersensor, estimasi Kaplan-Meier dikenal juga dengan estimasi product limit.
Misalkan sebanyak k waktu survival diamati, yang diatur dalam urutan meningkat yaitu
�
1
�
2
⋯ �
�
, andaikan waktu survival diamati secara jelas pada sampel berukuran n dari sebuah populasi yang homogen dengan fungsi
survival ��� ≤ �
�
, maka pengestimasi dari fungsi survival �� ialah Le,
2003:
�̂ t = , t
≥ 0 �
�
= ����� ���� �������� ����� masih bertahan pada �
�
1 ≤ � ≤ �
�
�
= menyatakan jumlah objek yang lulus pada �
�
2.3 Uji Log Rank