REGRESI LOG-LOGISTIK UNTUK DATA TAHAN HIDUP TERSENSOR TIPE I.
perpustakaan.uns.ac.id
digilib.uns.ac.id
REGRESI LOG-LOGISTIK UNTUK DATA TAHAN HIDUP TERSENSOR
TIPE I
oleh
NANDA HIDAYATI
M0108098
SKRIPSI
ditulis dan diajukan untuk memenuhi sebagian persyaratan
memperoleh gelar Sarjana Sains Matematika
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET
SURAKARTA
2013
commit to user
i
perpustakaan.uns.ac.id
digilib.uns.ac.id
commit to user
ii
perpustakaan.uns.ac.id
digilib.uns.ac.id
ABSTRAK
Nanda Hidayati, 2013. REGRESI LOG-LOGISTIK UNTUK DATA
TAHAN HIDUP TERSENSOR TIPE I. Fakultas Matematika dan Ilmu
Pengetahuan Alam, Universitas Sebelas Maret.
Analisis regresi merupakan analisis yang digunakan untuk mengetahui
hubungan antara variabel dependen dan variabel independen. Variabel dependen
pada model regresi log-logistik merupakan waktu tahan hidup berdistribusi loglogistik. Data yang digunakan dalam penelitian ini adalah data tahan hidup
tersensor tipe I. Penelitian ini bertujuan untuk mengkaji ulang model regresi loglogistik untuk data tahan hidup tersensor tipe I dan mengestimasi parameternya
dengan menggunakan metode maksimum likelihood dengan bantuan metode
Newton-Raphson.
Model regresi log-logistik untuk data tahan hidup dapat dinyatakan dengan
accelerated failure time (AFT) dimana merupakan waktu tahan hidup yang
ditransforrmasikan dengan
= log dan persamaan regresinya dinyatakan
dengan = +
+⋯+
+
. Proportional odds digunakan jika
variabel independennya merupakan variabel kategorik, dan log odds ratio-nya
dinyatakan dengan log
=∑
( − ). Estimasi parameter dari model
regresi log-logistik untuk data tahan hidup tersensor tipe I menggunakan metode
maksimum likelihood. Dalam memaksimumkan fungsi likelihood diperoleh sistem
persamaan nonlinear yang harus diselesaikan, untuk itu digunakanlah metode
Newton-Raphson.
Kata kunci: Regresi log-logistik, data tersensor tipe I, metode maksimum
likelihood.
commit to user
iii
perpustakaan.uns.ac.id
digilib.uns.ac.id
ABSTRACT
Nanda Hidayati, 2013. LOG-LOGISTIC REGRESSION FOR TYPE I
CENSORED SURVIVAL DATA. Faculty of Mathematics and Natural Sciences,
Sebelas Maret University.
Regression analysis is an analysis used to determine the relationship
between the dependent variable and the independent variables. The dependent
variable of log-logistic regression model is a survival time that log-logistic
distribution influenced by some of independent variables. The data used in this
study were type I censored survival data. The purposes of this research are to
review the log-logistic regression models for type I censored survival data and to
estimate the parameter by using maximum likelihood method with NewtonRaphson method.
Log-logistic regression models for survival data can be expressed by
accelerated failure time (AFT) that is a survival time transformed by + log
and the regression equation expressed by = +
+ ⋯+
+ . if the
independent variable is a categorical variable, than the proportional odds is used,
( − ). The
and the log odds ratio is expressed by log
=∑
parameter estimation of the log-logistic regression models for type I censored
survival data is use the maximum likelihood method. In maximizing the likelihood
function is obtained a nonlinear equation system that must be solved, so NewtonRaphson method is used.
Keywords: Log-logistic regression, type I censored data, maximum likelihood.
commit to user
iv
perpustakaan.uns.ac.id
digilib.uns.ac.id
MOTO
Berusaha dan berdoa.
commit to user
v
perpustakaan.uns.ac.id
digilib.uns.ac.id
PERSEMBAHAN
Karya ini ku persembahkan untuk
Ibu, Bapak dan Kak Bila,
untuk setiap do’a, senyum, dan nasihatmu adalah semangat untukku.
commit to user
vi
perpustakaan.uns.ac.id
digilib.uns.ac.id
KATA PENGANTAR
Puji syukur kepada Allah SWT. yang senantiasa memberikan rahmat dan
hidayah-Nya, sehingga penulis dapat menyelesaikan skripsi ini. Penyusunan
skripsi ini tidak lepas dari bantuan beberapa pihak, oleh karena itu penulis ingin
mengucapkan terimakasih kepada
1. Ibu Dra. Etik Zukhronah, M.Si, Pembimbing I yang telah memberikan
motivasi, bimbingan, dan saran dalam penyusunan skripsi ini,
2. Bapak Drs. Pangadi, M.Si, Pembimbing II yang telah memberikan
saran dalam penyusunan skripsi ini,
3. semua pihak yang membantu dalam penulisan skripsi ini.
Semoga skripsi ini dapat bermanfaat bagi semua pihak.
Surakarta,
Juli 2013
Penulis
commit to user
vii
perpustakaan.uns.ac.id
digilib.uns.ac.id
DAFTAR ISI
Halaman
HALAMAN JUDUL…………………………………………………….........
i
HALAMAN PENGESAHAN………………………………………………...
ii
ABSTRAK…………………………………………………………………….
iii
ABSTRACT………………………………………………………………….....
iv
MOTO………………………………………………………………………….
v
PERSEMBAHAN……………………………………………………………..
vi
KATA PENGANTAR………………………………………………………....
vii
DAFTAR ISI…………………………………………………………………..
viii
DAFTAR GAMBAR………………………………………………………….
x
DAFTAR TABEL……………………………………………………………..
xi
BAB I
BAB II
PENDAHULUAN
1.1 Latar Belakang Masalah……………………………………....
1
1.2 Perumusan Masalah…………………………………………...
3
1.3 Tujuan Penelitian……………………………………………...
3
1.4 Manfaat Penelitian…………………………………………….
3
LANDASAN TEORI
2.1 Tinjauan Pustaka………………………………………………
4
2.1.1
Konsep Dasar Statistik………………………………...
4
2.1.2
Konsep Dasar Analisis Tahan Hidup………………….
5
2.1.3
Tipe Penyensoran……………………………………...
7
2.1.4
Distribusi Logistik……………………………………..
8
2.1.5
Distribusi Log-Logistik..…………...………………….
9
2.1.6
Model Regresi Tahan Hidup…………………………..
12
2.1.7
Transformasi Variabel Random……………………….
12
2.1.8
Metode Maksimum Likelihood………………………..
13
2.1.9
Metode Newton-Raphson……………………………..
14
2.1.10 Uji Kesesuaian Model…………………………………
15
2.1.11 Uji Signifikansi Parameter …………………………….
16
commit to user
viii
perpustakaan.uns.ac.id
digilib.uns.ac.id
2.2 Kerangka Pemikiran…………………………………………...
BAB III METODE PENELITIAN
16
18
BAB IV HASIL DAN PEMBAHASAN
4.1 Distribusi Log-logistik untuk Data Tahan Hidup……………..
19
4.2 Model Regresi Log-logistik untuk Data Tahan Hidup………..
21
4.2.1 Accelerated Failure Time (AFT)………………………..
24
4.2.2 Proportional Odds………………………………………
25
4.3 Estimasi Parameter Regresi Log-logistik untuk Data Tahan
BAB V
Hidup Tersensor Tipe I………………………………………..
27
4.4 Penerapan ……............………………………………………..
34
PENUTUP
5.1 Kesimpulan ……………………………………………………
41
5.2 Saran …………………………………………………………
42
DAFTAR PUSTAKA
43
commit to user
ix
perpustakaan.uns.ac.id
digilib.uns.ac.id
DAFTAR GAMBAR
Halaman
Gambar 2.1.
Fungsi kepadatan probabilitas (fkp) terhadap waktu ( )
dari distribusi log-logistik dengan nilai
Gambar 2.2.
2,
= 1,
=
= 4 dan = 8…………………………………..........
10
Fungsi distribusi kumulatif (FDK) terhadap waktu ( ) dari
distribusi log-logistik dengan nilai
Gambar 4.1.
= ,
2,
= ,
= 1,
=
= 4 dan = 8………………………………………...
Probabilitas data waktu tahan hidup……………………….
commit to user
x
11
36
perpustakaan.uns.ac.id
digilib.uns.ac.id
DAFTAR TABEL
Halaman
Tabel 4.1.
Lima data penderita kanker paru-paru……....…………...…
34
Tabel 4.2.
Pengkodean variabel dummy….……………………………
35
Tabel 4.3.
Nilai estimasi parameter model regresi log-logistik………..
38
Tabel 4.4.
Hasil uji Wald model regresi log-logistik terhadap variabel
independen PS, tipe tumor adeno, tipe tumor small, dan
tipe tumor squamous.…….……………................................
Tabel 4.5.
Nilai estimasi parameter model regresi log-logistik untuk
variabel yang berpengaruh………………………………….
Tabel 4.6.
38
39
Hasil uji Wald model regresi log-logistik terhadap variabel
independen yang berpengaruh PS, tipe tumor adeno, tipe
tumor small ……………………………………..................
Tabel 4.7.
39
Hasil perhitungan odds ratio model regresi log-logistik
untuk variabel tipe tumor adeno dan tipe tumor small….....
commit to user
xi
40
digilib.uns.ac.id
REGRESI LOG-LOGISTIK UNTUK DATA TAHAN HIDUP TERSENSOR
TIPE I
oleh
NANDA HIDAYATI
M0108098
SKRIPSI
ditulis dan diajukan untuk memenuhi sebagian persyaratan
memperoleh gelar Sarjana Sains Matematika
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET
SURAKARTA
2013
commit to user
i
perpustakaan.uns.ac.id
digilib.uns.ac.id
commit to user
ii
perpustakaan.uns.ac.id
digilib.uns.ac.id
ABSTRAK
Nanda Hidayati, 2013. REGRESI LOG-LOGISTIK UNTUK DATA
TAHAN HIDUP TERSENSOR TIPE I. Fakultas Matematika dan Ilmu
Pengetahuan Alam, Universitas Sebelas Maret.
Analisis regresi merupakan analisis yang digunakan untuk mengetahui
hubungan antara variabel dependen dan variabel independen. Variabel dependen
pada model regresi log-logistik merupakan waktu tahan hidup berdistribusi loglogistik. Data yang digunakan dalam penelitian ini adalah data tahan hidup
tersensor tipe I. Penelitian ini bertujuan untuk mengkaji ulang model regresi loglogistik untuk data tahan hidup tersensor tipe I dan mengestimasi parameternya
dengan menggunakan metode maksimum likelihood dengan bantuan metode
Newton-Raphson.
Model regresi log-logistik untuk data tahan hidup dapat dinyatakan dengan
accelerated failure time (AFT) dimana merupakan waktu tahan hidup yang
ditransforrmasikan dengan
= log dan persamaan regresinya dinyatakan
dengan = +
+⋯+
+
. Proportional odds digunakan jika
variabel independennya merupakan variabel kategorik, dan log odds ratio-nya
dinyatakan dengan log
=∑
( − ). Estimasi parameter dari model
regresi log-logistik untuk data tahan hidup tersensor tipe I menggunakan metode
maksimum likelihood. Dalam memaksimumkan fungsi likelihood diperoleh sistem
persamaan nonlinear yang harus diselesaikan, untuk itu digunakanlah metode
Newton-Raphson.
Kata kunci: Regresi log-logistik, data tersensor tipe I, metode maksimum
likelihood.
commit to user
iii
perpustakaan.uns.ac.id
digilib.uns.ac.id
ABSTRACT
Nanda Hidayati, 2013. LOG-LOGISTIC REGRESSION FOR TYPE I
CENSORED SURVIVAL DATA. Faculty of Mathematics and Natural Sciences,
Sebelas Maret University.
Regression analysis is an analysis used to determine the relationship
between the dependent variable and the independent variables. The dependent
variable of log-logistic regression model is a survival time that log-logistic
distribution influenced by some of independent variables. The data used in this
study were type I censored survival data. The purposes of this research are to
review the log-logistic regression models for type I censored survival data and to
estimate the parameter by using maximum likelihood method with NewtonRaphson method.
Log-logistic regression models for survival data can be expressed by
accelerated failure time (AFT) that is a survival time transformed by + log
and the regression equation expressed by = +
+ ⋯+
+ . if the
independent variable is a categorical variable, than the proportional odds is used,
( − ). The
and the log odds ratio is expressed by log
=∑
parameter estimation of the log-logistic regression models for type I censored
survival data is use the maximum likelihood method. In maximizing the likelihood
function is obtained a nonlinear equation system that must be solved, so NewtonRaphson method is used.
Keywords: Log-logistic regression, type I censored data, maximum likelihood.
commit to user
iv
perpustakaan.uns.ac.id
digilib.uns.ac.id
MOTO
Berusaha dan berdoa.
commit to user
v
perpustakaan.uns.ac.id
digilib.uns.ac.id
PERSEMBAHAN
Karya ini ku persembahkan untuk
Ibu, Bapak dan Kak Bila,
untuk setiap do’a, senyum, dan nasihatmu adalah semangat untukku.
commit to user
vi
perpustakaan.uns.ac.id
digilib.uns.ac.id
KATA PENGANTAR
Puji syukur kepada Allah SWT. yang senantiasa memberikan rahmat dan
hidayah-Nya, sehingga penulis dapat menyelesaikan skripsi ini. Penyusunan
skripsi ini tidak lepas dari bantuan beberapa pihak, oleh karena itu penulis ingin
mengucapkan terimakasih kepada
1. Ibu Dra. Etik Zukhronah, M.Si, Pembimbing I yang telah memberikan
motivasi, bimbingan, dan saran dalam penyusunan skripsi ini,
2. Bapak Drs. Pangadi, M.Si, Pembimbing II yang telah memberikan
saran dalam penyusunan skripsi ini,
3. semua pihak yang membantu dalam penulisan skripsi ini.
Semoga skripsi ini dapat bermanfaat bagi semua pihak.
Surakarta,
Juli 2013
Penulis
commit to user
vii
perpustakaan.uns.ac.id
digilib.uns.ac.id
DAFTAR ISI
Halaman
HALAMAN JUDUL…………………………………………………….........
i
HALAMAN PENGESAHAN………………………………………………...
ii
ABSTRAK…………………………………………………………………….
iii
ABSTRACT………………………………………………………………….....
iv
MOTO………………………………………………………………………….
v
PERSEMBAHAN……………………………………………………………..
vi
KATA PENGANTAR………………………………………………………....
vii
DAFTAR ISI…………………………………………………………………..
viii
DAFTAR GAMBAR………………………………………………………….
x
DAFTAR TABEL……………………………………………………………..
xi
BAB I
BAB II
PENDAHULUAN
1.1 Latar Belakang Masalah……………………………………....
1
1.2 Perumusan Masalah…………………………………………...
3
1.3 Tujuan Penelitian……………………………………………...
3
1.4 Manfaat Penelitian…………………………………………….
3
LANDASAN TEORI
2.1 Tinjauan Pustaka………………………………………………
4
2.1.1
Konsep Dasar Statistik………………………………...
4
2.1.2
Konsep Dasar Analisis Tahan Hidup………………….
5
2.1.3
Tipe Penyensoran……………………………………...
7
2.1.4
Distribusi Logistik……………………………………..
8
2.1.5
Distribusi Log-Logistik..…………...………………….
9
2.1.6
Model Regresi Tahan Hidup…………………………..
12
2.1.7
Transformasi Variabel Random……………………….
12
2.1.8
Metode Maksimum Likelihood………………………..
13
2.1.9
Metode Newton-Raphson……………………………..
14
2.1.10 Uji Kesesuaian Model…………………………………
15
2.1.11 Uji Signifikansi Parameter …………………………….
16
commit to user
viii
perpustakaan.uns.ac.id
digilib.uns.ac.id
2.2 Kerangka Pemikiran…………………………………………...
BAB III METODE PENELITIAN
16
18
BAB IV HASIL DAN PEMBAHASAN
4.1 Distribusi Log-logistik untuk Data Tahan Hidup……………..
19
4.2 Model Regresi Log-logistik untuk Data Tahan Hidup………..
21
4.2.1 Accelerated Failure Time (AFT)………………………..
24
4.2.2 Proportional Odds………………………………………
25
4.3 Estimasi Parameter Regresi Log-logistik untuk Data Tahan
BAB V
Hidup Tersensor Tipe I………………………………………..
27
4.4 Penerapan ……............………………………………………..
34
PENUTUP
5.1 Kesimpulan ……………………………………………………
41
5.2 Saran …………………………………………………………
42
DAFTAR PUSTAKA
43
commit to user
ix
perpustakaan.uns.ac.id
digilib.uns.ac.id
DAFTAR GAMBAR
Halaman
Gambar 2.1.
Fungsi kepadatan probabilitas (fkp) terhadap waktu ( )
dari distribusi log-logistik dengan nilai
Gambar 2.2.
2,
= 1,
=
= 4 dan = 8…………………………………..........
10
Fungsi distribusi kumulatif (FDK) terhadap waktu ( ) dari
distribusi log-logistik dengan nilai
Gambar 4.1.
= ,
2,
= ,
= 1,
=
= 4 dan = 8………………………………………...
Probabilitas data waktu tahan hidup……………………….
commit to user
x
11
36
perpustakaan.uns.ac.id
digilib.uns.ac.id
DAFTAR TABEL
Halaman
Tabel 4.1.
Lima data penderita kanker paru-paru……....…………...…
34
Tabel 4.2.
Pengkodean variabel dummy….……………………………
35
Tabel 4.3.
Nilai estimasi parameter model regresi log-logistik………..
38
Tabel 4.4.
Hasil uji Wald model regresi log-logistik terhadap variabel
independen PS, tipe tumor adeno, tipe tumor small, dan
tipe tumor squamous.…….……………................................
Tabel 4.5.
Nilai estimasi parameter model regresi log-logistik untuk
variabel yang berpengaruh………………………………….
Tabel 4.6.
38
39
Hasil uji Wald model regresi log-logistik terhadap variabel
independen yang berpengaruh PS, tipe tumor adeno, tipe
tumor small ……………………………………..................
Tabel 4.7.
39
Hasil perhitungan odds ratio model regresi log-logistik
untuk variabel tipe tumor adeno dan tipe tumor small….....
commit to user
xi
40