UJI PENDEKATAN NORMAL OSIUS-ROJEK PADA DIAGNOSTIK MODEL REGRESI LOGISTIK

UJI PENDEKATAN NORMAL OSIUS-ROJEK PADA

DIAGNOSTIK MODEL REGRESI LOGISTIK

Oleh ANTO WICAKSONO NIM. M 0105023

SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika

JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UJI PENDEKATAN NORMAL OSIUS-ROJEK PADA DIAGNOSTIK MODEL REGRESI LOGISTIK

yang disusun oleh ANTO WICAKSONO NIM. M0105023 dibimbing oleh

Pembimbing I

Dra. Respatiwulan, M.Si. NIP. 19680611 199302 2 001

Pembimbing II

Sri Kuntari, M.Si. NIP. 19730225 199903 2 001

telah dipertahankan di depan Dewan Penguji pada hari Selasa, tanggal 4 Agustus 2009 dan dinyatakan telah memenuhi syarat.

Anggota Tim Penguji Tanda Tangan

1. Irwan Susanto, S.Si, DEA NIP. 19710511 199512 1 001 2. Drs. Muslich, M.Si NIP. 19521118 197903 1 001 3. Dra. Yuliana Susanti, M.Si

Disahkan oleh Fakultas Matematika dan Ilmu Pengetahuan Alam Dekan

Ketua Jurusan Matematika

Anto Wicaksono, 2009. UJI PENDEKATAN NORMAL OSIUS-ROJEK PADA DIAGNOSTIK MODEL REGRESI LOGISTIK. Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Sebelas Maret.

Model regresi logistik digunakan untuk menunjukkan pola hubungan antara variabel respon yang bersifat kualitatif dan variabel prediktor. Pada model regresi logistik digunakan uji diagnostik model untuk mengevaluasi apakah model sesuai dengan data.

Metode penelitian yang digunakan dalam skripsi ini adalah studi literatur. Tujuan skripsi yaitu menentukan statistik uji pendekatan normal Osius-Rojek dan menerapkan dalam contoh. Estimasi parameter model regresi logistik dilakukan dengan metode maksimum likelihood. Uji signifikansi parameter yang digunakan pada model adalah uji rasio likelihood dan uji chi-kuadrat Wald.

Hasil pembahasan didapatkan statistik uji pendekatan normal Osius-Rojek berdistribusi normal standar untuk ukuran sampel besar. Hasil penerapan uji diagnostik pada contoh mengenai pengaruh dan pengalaman seseorang terhadap status penggunaan mammography (Hosmer and Lemeshow, 1989) didapatkan bahwa model regresi logistik sesuai dengan data.

Kata Kunci: Model regresi logistik, maksimum likelihood, uji pendekatan normal Osius-Rojek.

Anto Wicaksono, 2009. THE DIAGNOSTIC OF LOGISTIC REGRESSION

MODEL WITH OSIUS-ROJEK NORMAL APPROXIMATION TEST.

Mathematics and Natural Science Faculty, Sebelas Maret University.

Logistic regression model is used to explain the relationship between of qualitative response variables and variables predictor. In the logistic regression model, the test diagnostic is used to evaluate whether the model is apropriate to the data.

The research method is literature study. The objective are to determine the statistic test of Osius-Rojek normal approximation test and to apply in an example. The parameter estimation use the maximum likelihood method. The parameter significance test are done by likelihood ratio test and Wald chi-square test.

The result of discussion are the distribution of a statistics test for Osius-

Rojek normal approximation test is normal standard for large sample. The application of the test results on the influence and experience of someone of the status of the use of mammography (Hosmer and Lemeshow, 1989) found that the logistic regression model is apropriate to the data.

Keywords: Logistic regression model, maximum likelihood, Osius-Rojek normal

approximation test.

Sesungguhnya bersama kesulitan ada kemudahan. Maka apabila engkau telah selesai (dari sesuatu urusan), tetaplah bekerja keras (untuk urusan yang lain), dan hanya kepada Tuhan-mulah engkau berharap. ( Terjemahan Qs Al Insyrah, 6-8).

Karya sederhana ini kupersembahkan untuk.

Bapak dan Ibu tercinta, begitu besar pengorbanan dan kasih sayangmu terhadap diriku serta senantiasa berdoa kepada Allah SWT untuk kebaikan anak-anaknya semua itu tak kan terbayarkan sampai kapanpun.

Kakakku Okta, adikku Sari dan Dimas terima kasih untuk motivasi dan dukungannya.

Keluarga besar yang selalu memberi semangat dan mendukung setiap langkahku.

Sahabat-sahabatku yang telah memberi dukungan dan memotivasi untuk segera menyelesaikan tugas akhir ini.

Puji syukur penulis panjatkan kepada Allah SWT yang telah melimpahkan rahmat dan hidayah-Nya sehingga penulis berhasil menyelesaikan skripsi yang berjudul uji pendekatan normal Osius-Rojek pada diagnostik model regresi logistik. Sholawat dan salam semoga senantiasa tercurahkan kepada Nabi Muhammad SAW sebagai pembawa risalah islam.

Pada kesempatan ini penulis mengucapkan terima kasih kepada

1. Dra. Respatiwulan, M.Si sebagai pembimbing I dan Sri Kuntari, M.Si sebagai pembimbing II yang telah banyak memberikan ide, bimbingan, arahan dan kesabaran bagi penulis dalam menyelesaikan skripsi ini.

2. Budi yang telah memberikan masukan dalam penulisan skripsi ini.

3. Semua pihak yang telah membantu kelancaran penulisan skripsi ini.

Penulis berharap semoga saran dan kritik yang membangun untuk perbaikan skripsi ini dan semoga karya sederhana ini dapat bermanfaat bagi semua pembaca.

Surakarta, Agustus 2009 Penulis

4.2.1 Sikap wanita terhadap status penggunaan mammography.............................20

4.2.2. Estimasi Parameter 5 Variabel Prediktor.........................................................21

4.2.3 Uji Rasio Likelihood 5 Variabel Prediktor......................................................21

4.2.4 Estimasi parameter 3 Variabel Prediktor.........................................................22

4.2.5 Uji rasio likelihood 3 Variabel Prediktor.........................................................23

4.2.6. Hasil perhitungan nilai ˆ j π, j v , dan j c ............................................................23

4.2.7 Anova …….......................................................................................................23

4.2.8 Odds Ratio.......................................................................................................24

PENDAHULUAN

1. Latar Belakang Masalah

Pada bidang ilmu kesehatan, banyak peneliti ingin mempelajari hubungan antara 2 variabel atau lebih. Misalnya, hubungan antara tekanan darah dan umur, konsentrasi obat dan kecepatan detak jantung (Daniel,1995). Oleh karena itu diperlukan metode untuk menunjukkan hubungan antara variabel-variabel tersebut. Menurut Soejoeti (1986) metode yang digunakan untuk menunjukkan hubungan antar

2 variabel atau lebih adalah model regresi. Model regresi memiliki variabel prediktor dan variabel respon. Variabel prediktor dan variabel respon dapat bertipe data kuantitatif atau kualitatif. Menurut Hosmer dan Lemeshow (1989) model regresi yang sesuai bila variabel respon bersifat kualitatif adalah model regresi logistik. Model regresi logistik dengan nilai variabel respon terdiri dari 2 kategori disebut model regresi logistik biner sedangkan model regresi logistik dengan nilai variabel respon lebih dari 2 kategori disebut model regresi logistik polytomous.

Model regresi logistik memuat parameter yang harus diestimasi. Menurut Neter et al (1996) estimasi parameter model regresi logistik didapatkan melalui metode maksimum likelihood. Hasil estimasi parameter perlu uji signifikansi terhadap model. Menurut Hosmer dan Lemeshow (1989) uji signifikansi parameter yang digunakan pada model regresi logistik adalah uji rasio likelihood dan uji chi- kuadrat Wald.

Setelah estimasi dan uji signifikansi parameter model, perlu dilakukan uji diagnostik model untuk mengevaluasi apakah model regresi logistik sesuai dengan data (Hosmer and Lemeshow, 1989). Menurut Liu (2007) salah satu uji diagnostik Setelah estimasi dan uji signifikansi parameter model, perlu dilakukan uji diagnostik model untuk mengevaluasi apakah model regresi logistik sesuai dengan data (Hosmer and Lemeshow, 1989). Menurut Liu (2007) salah satu uji diagnostik

2. Rumusan Masalah

Masalah yang dibahas dalam skripsi adalah

1. Bagaimana menentukan statistik uji pendekatan normal Osius-Rojek pada model regresi logistik.

2. Bagaimana menerapkan uji pendekatan normal Osius-Rojek pada pengaruh

dan pengalaman seseorang terhadap status penggunaan mammography.

3. Batasan Masalah

Penulisan skripsi dibatasi pada kasus model regresi logistik biner dan metode yang digunakan untuk mengestimasi parameter model adalah metode maksimum likelihood.

4. Tujuan Penulisan

Tujuan dari penulisan skripsi ini adalah

1. Menentukan statistik uji pendekatan normal Osius-Rojek pada model regresi logistik.

2. Menerapkan uji pendekatan normal Osius-Rojek pada pengaruh dan

Manfaat yang diperoleh dari penulisan skripsi adalah memperluas wawasan mengenai uji diagnostik model melalui uji pendekatan Osius-Rojek sebagai suatu metode untuk mengevaluasi apakah model sesuai dengan data.

LANDASAN TEORI

2.1 Tinjauan Pustaka

Pada tinjauan pustaka diberikan hal-hal yang mendasari penulisan skripsi ini, yaitu berupa konsep dan teori yang berkaitan dengan diagnostik model regresi logistik. Teori yang berkaitan meliputi probabilitas variabel random, distribusi sampling, distribusi Bernoulli dan binomial, model regresi linear, regresi linear terbobot, model regresi logistik biner, estimasi maksimum likelihood, uji chi-kuadrat Pearson, interpretasi model regresi logistik.

2.1.1 Probabilitas Variabel Random

Berikut ini definisi-definisi yang berkaitan dengan variabel random menurut Bain dan Engelhardt (1992).

Definisi 2.1.1

Suatu variabel random X adalah suatu fungsi bernilai real R dengan domain ruang sampel S, untuk setiap

Z S  dan suatu bilangan real x atau x \ , sedemikian

sehingga X Z x .

Berikut ini diberikan definisi mengenai variabel random diskrit dan variabel random kontinu.

Definisi 2.1.2

Variabel random X dikatakan variabel random diskrit jika himpunan semua nilai yang mungkin dari variabel random X adalah himpunan yang terhitung yaitu

1 ! , 2 , , xx n x atau

1 ! , 2 xx , dan fungsi () fx disebut fungsi probabilitas diskrit.

Definisi 2.1.3

Variabel random X dikatakan variabel random kontinu jika terdapat fungsi densitas probabilitas () fx sehingga fungsi distribusi kumulatif dapat dinyatakan sebagai

= f t dt ¨ .

Definisi 2.1.4. Diberikan X suatu variabel random kontinu dengan fungsi densitas probabilitas fx . Harga harapan dari X dinyatakan dengan

() EX . xf x dx

Selanjutnya diberikan definisi tentang fungsi pembangkit momen yang diambil dari Bain dan Engelhardt (1992).

Definisi 2.1.5. Diberikan X suatu variabel random, fungsi pembangkit momen (fpm) dinyatakan dengan

tX X M X t Ee

Harga harapan dari X atau EX didapatkan melalui momen pertama dari fpm yaitu

M X t dan variansi X dinyatakan dengan

2 2 Var 1 0 0 . X X X M t M t

2.1.2 Distribusi Sampling

Distribusi sampling adalah distribusi dari suatu statistik. Berikut ini diberikan teorema-teorema yang berkaitan dengan distribusi sampling menurut Bain dan Engelhardt (1992).

Teorema 2.1.1. Jika ! 1 , , X n X adalah variabel random dari suatu distribusi dengan Teorema 2.1.1. Jika ! 1 , , X n X adalah variabel random dari suatu distribusi dengan

( ~ ) d n Z n Z N ¶¶l untuk n ld .

Teorema 2.1.2. Jika

( ~ ) Z 0,1 N maka

Teorema 2.1.3. Jika

1 ! , , X n X merupakan variabel random sampel dari ( PV ) 2 N ,

Teorema 2.1.4. Jika

1 ! , , X n X adalah sampel random dari ( ) V 0, N 0, maka X dan

X i X dengan

1, ! i , n = adalah independen, serta X dan 2 S adalah independen dengan

Teorema 2.1.5. Jika

F () ~ X ~ v maka

= t , () EX = v , Var () 2 X = v

Teorema 2.1.6 . Jika

F () ~ v Y v v maka

¶¶l

untuk v ld

2.1.3 Distribusi Bernoulli dan Binomial

Menurut Bain dan Engelhardt (1992), variabel random yang menyatakan 2 kemungkinan kejadian yaitu sukses atau gagal disebut variabel Bernoulli dan dinyatakan dengan

1 , jika kejadian sukses

0 , jika kejadian gagal

Xe

Jika a adalah probabilitas sukses dan b adalah probabilitas gagal maka fungsi Jika a adalah probabilitas sukses dan b adalah probabilitas gagal maka fungsi

, 0,1, x , nx

dengan x adalah banyaknya peristiwa sukses, n adalah banyaknya percobaan yang dilakukan. Variabel random X dengan distribusi binomial memiliki EX na dan

var X . nab

2.1.4 Model Regresi Linear

Menurut Neter et al. (1996) model regresi yang memiliki satu variabel prediktor X disebut model regresi linear sederhana dan dimodelkan sebagai

1, 2, i , i Y i X i E n E H ! (2.1) dengan i Y : variabel respon percobaan ke-i,

X i : variabel prediktor percobaan ke-i,

0 , EE , merupakan parameter regresi,

H merupakan galat random dan

Model regresi yang memiliki lebih dari satu variabel prediktor disebut model regresi linear ganda. Jika 1 , 2 , , XX p ! X adalah variabel prediktor dengan n

pengamatan dan Y adalah variabel respon maka model regresi linear ganda dapat dinyatakan sebagai

dan untuk pengamatan ke-i dapat dituliskan

1, 2, i , i i p ip Y i X X X i E n E E E H " !

Model regresi linear dengan variansi galat tidak konstan dapat diestimasi menggunakan metode kuadrat terkecil terbobot. Menurut Neter dan Wasserman (1996) metode kuadrat bobot terkecil untuk satu variabel prediktor dinyatakan dengan

wY

EE X E E

dengan i w adalah pembobot. Estimasi parameter regresi didapatkan dengan meminimumkan

0 , S , EE yaitu menurunkan

0 , S , EE terhadap masing-masing parameter regresi dan

sehingga didapatkan persamaan

Estimasi parameter regresi didapatkan dengan menyelesaikan persamaan (2.3) yang merupakan persamaan normal untuk

0 , S , EE yaitu

ii

n ii

ii

wY

wX

wX

wY

wXY

wX

wX

Menurut Hosmer dan Lemeshow (1989) model regresi logistik adalah model yang menyatakan pola hubungan antara variabel prediktor dan variabel respon yang bersifat kualitatif. Model regresi logistik sederhana yaitu model regresi logistik yang

memiliki satu variabel prediktor X sedangkan model regresi logistik yang memiliki lebih dari satu variabel prediktor X disebut model regresi logistik ganda. Misalkan nilai variabel

y 1 menyatakan adanya suatu karakteristik dengan probabilitas x S dan

y 0 menyatakan tidak adanya suatu karakteristik dengan probabilitas 1 S x sehingga

Ey 1| X S S adalah harga harapan dari

y 1 untuk setiap harga x dan

Ey 1 X S S dan nilai

(x S (x terletak pada interval [0,1]. Misalkan terdapat p

variabel prediktor sehingga model regresi logistik dapat dinyatakan sebagai harga harapan dari Y untuk setiap harga x yang diberikan, dinyatakan sebagai

EYX

E EE E E

EE E E S E

dengan h E menyatakan parameter-parameter regresi ke-h, h X adalah pengamatan variabel prediktor ke-h untuk

1, 2 h , p !

Pada model regresi logistik dilakukan transformasi untuk melinearkan variabel prediktor terhadap fungsi respon. Transformasi yang digunakan pada model

(2.4) adalah transformasi logit yang dinyatakan dengan gx . Tranformasi logit didapatkan melalui perbandingan dari

S x terhadap 1 S x yaitu

EE S E

(2.5) logaritma dari persamaan (2.5) adalah (2.5) logaritma dari persamaan (2.5) adalah

Apabila variabel prediktor bersifat kualitatif, menurut Draper and Smith (1998) variabel rancangan diperlukan untuk menunjukkan nilai dari variabel prediktor dalam model. Jika sebuah variabel berskala kualitatif mempunyai k kategori, maka dibutuhkan

k 1 variabel rancangan (Hosmer and Lemeshow, 1989). Misalkan variabel prediktor ke-h = x h berskala kualitatif dengan k kategori, digunakan

k 1 variabel rancangan dalam model. Jika variabel-variabel rancangan tersebut dinyatakan dengan x h (u) dan koefisien-koefisiennya dinyatakan dengan ȕ hu , dengan

u=1,2,..., k-1 maka bentuk logit untuk model dengan p variabel prediktor adalah

2.1.7 Estimasi Maksimum Likelihood

Menurut Hosmer dan Lemeshow (1989) estimasi parameter yang digunakan dalam model regresi logistik adalah metode maksimum likelihood. Berikut ini diberikan definisi yang diacu dari Bain dan Engelhardt (1992).

Definisi 2.1.6 Fungsi densitas probabilitas bersama dari n variabel random

1 , 2 , , XX n ! X yang mempunyai nilai di 1 , 2 , , xx n x ! dinotasikan

1 , 2 , , ; fxx n x T !

1 , 2 , , XX n ! X adalah sampel random dari

fx ; T , maka

; n L n fx fx fx T T T T !

Definisi 2.1.7 Misalkan

1 , 2 , , ; , L n fxx x T TT ! : adalah fungsi densitas probabilitas bersama dari 1 , 2 , , XX n ! X . Nilai ˆ T : pada L T maksimum disebut estimasi maksimum likelihood dari T yang memenuhi

1 2 1 ˆ , ˆ , , ; max , , , ; n fxx n x fxx x T T T : ª º ¬ ! ¼ ! .

Setiap variabel respon i Y untuk model regresi logistik adalah variabel random berdistribusi Bernoulli dengan probabilitas sukses

x S x dan i X adalah variabel prediktor yang bersesuaian dengan i Y dengan

1, 2, i , n ! . Menurut Hosmer dan

Lameshow (1989), fungsi likelihood distribusi Bernoulli untuk n sampel independen adalah

(2.6) Menurut Bain dan Engelhart (1992) memaksimumkan fungsi likelihood sama

dengan memaksimumkan fungsi log-likelihood. Fungsi log-likelihood dinyatakan

dengan ln L E sehingga persamaan (2.6) menjadi

{ ln ( ) 1 ln(1

estimasi maksimum likelihood didapatkan dengan mencari nilai ˆ

E yang E yang

umum turunan pertama dari E A terhadap masing-masing parameter adalah

hi

dengan 0,1, 2, h , p ! dan 0 i x i . Misal untuk menentukan rumus 0 ˆ E sebagai

estimasi parameter 0 E dan 0 i x i sehingga

Pada persamaan (2.8) nilai ^

akan samadengan 0 jika i y i x S . Pandang kembali persamaan (2.4) sehingga i

y i x S menjadi

Estimasi parameter 0 E didapatkan dengan menyelesaikan persamaan (2.9) yaitu

ln

ln ˆ

Estimasi dari 0 E ternyata bergantung pada harga ˆ h E , padahal harga ˆ h E belum diperoleh dan akan ditentukan kemudian. Hal ini menunjukkan bahwa turunan

pertama fungsi likelihood tidak memberikan penyelesaian estimasi parameter regresi.

Menurut Agresti (1984) estimasi parameter 0 , , E p ! E dari fungsi likelihood yang Menurut Agresti (1984) estimasi parameter 0 , , E p ! E dari fungsi likelihood yang

2.1.8 Uji Signifikansi Parameter

Uji signifikansi parameter digunakan untuk mengevaluasi apakah variabel prediktor berpengaruh terhadap variabel respon. Statistik uji yang digunakan untuk menilai signifikansi parameter model regresi logistik didasarkan pada uji rasio likelihood (Hosmer and Lemeshow ,1989).

Menurut Hosmer dan Lemeshow (1989) statistik uji rasio likelihood G didefinisikan sebagai

0 2 G 2 L L dengan

L 0 adalah fungsi log-likelihood dari model tanpa variabel prediktor, sedangkan 1 L adalah fungsi log-likelihood dari model dengan p variabel prediktor. Uji signifikansi parameter dilakukan dengan membandingkan statistik uji G dengan

(,) p F D untuk tingkat signifikansi

D dan derajat bebas p (jumlah variabel prediktor). Jika

(,) G p F ! F maka 0 H ditolak pada signfikansi

D . Uji hipotesis 0 H menyatakan bahwa tidak ada variabel prediktor yang berpengaruh terhadap respon dan 1 H

menyatakan bahwa terdapat paling tidak satu variabel prediktor yang berpengaruh terhadap respon.

Jika 0 H ditolak maka dilakukan uji lanjut untuk mengevaluasi pengaruh

masing-masing variabel prediktor terhadap variabel respon. Menurut Agresti (1984) uji signifikansi setiap variabel prediktor dalam model dapat dilakukan menggunakan uji chi-kuadrat Wald. Menurut Hosmer dan Lemeshow (1989) statisik uji chi-kuadrat Wald didefinisikan sebagai

1, 2, h H h h E p ! (variabel prediktor ke- h tidak berpengaruh terhadap variabel respon)

h H h E z (variabel prediktor ke-h berpengaruh terhadap variabel respon) Jika

W 1, D ! F maka 0 H ditolak yang berarti variabel prediktor ke-h berpengaruh terhadap variabel respon.

2.1.9 Uji Chi-kuadrat Pearson

Pada analisis model regresi logistik digunakan uji diagnostik model untuk mengevaluasi kesesuaian model dengan data. Menurut Liu (2007) salah satu uji diagnostik model regresi logistik adalah uji chi-kuadrat Pearson yang didasarkan pada pola kovariat. Pola kovariat adalah kelompok nilai untuk kovariat yang sama. Menurut Liu (2007) pola kovariat dibagi menjadi 2 tipe pola yaitu tipe pola pertama dan tipe pola kedua. Tipe pola pertama menunjukkan bahwa jumlah pola kovariat J

sama dengan ukuran sampel J n sedangkan tipe pola kedua menunjukkan bahwa jumlah pola kovariat J lebih kecil dari ukuran sampel J n . Menurut Hosmer dan Lemeshow (1989) statistik uji chi kuadrat Pearson

didefinisikan sebagai

dengan j y adalah jumlah kejadian sukses pada pola kovariat ke-j, j m adalah jumlah subyek pada pola kovariat ke-j, ˆ j S adalah estimasi probabilitas sukses untuk pola kovariat ke-j, dan j v adalah variansi jumlah kejadian sukses untuk pola kovariat ke-j. Menurut Liu (2007) statistik uji chi-kuadrat Pearson berdistribusi chi-kuadrat dengan dengan j y adalah jumlah kejadian sukses pada pola kovariat ke-j, j m adalah jumlah subyek pada pola kovariat ke-j, ˆ j S adalah estimasi probabilitas sukses untuk pola kovariat ke-j, dan j v adalah variansi jumlah kejadian sukses untuk pola kovariat ke-j. Menurut Liu (2007) statistik uji chi-kuadrat Pearson berdistribusi chi-kuadrat dengan

2.1.10 Interpretasi Parameter Model

Interpretasi model dalam model regresi logistik menggunakan rasio odds (Hosmer dan Lemeshow, 1989). Odds adalah rasio probabilitas kejadian sukses terhadap probabilitas kejadian gagal. Misalkan variabel prediktor X dikategorikan 0 dan 1 sehingga odds dari variabel respon dengan kategori

x 1 dinyatakan dengan 1 /1

S 1 S . Odds dari variabel respon dengan kategori x 0 dinyatakan dengan 0 /1

S 0 S . Menurut Hosmer dan Lemeshow (1989) rasio odds merupakan perbandingan

nilai odds untuk kategori

x 1 terhadap odds untuk kategori

x 0 dan didefinisikan sebagai

Variabel prediktor X untuk kategori 1 akan memberikan nilai \ kali dibanding variabel prediktor X pada kategori 0 dalam menghasilkan kejadian sukses Y . Apabila variabel prediktor X bertipe data kuantitatif, interpretasi untuk setiap perubahan c unit dalam X adalah

exp

exp

exp

Model regresi logistik digunakan ketika variabel respon bersifat kualitatif. Model regresi logistik didapatkan melalui estimasi parameter menggunakan metode maksimum likelihood. Kemudian diuji signifikansi parameter dengan menggunakan uji rasio likelihood dan uji chi-kuadrat Wald. Setelah estimasi dan uji signifikansi parameter model, perlu dilakukan uji diagnostik model untuk mengevaluasi apakah model regresi logistik sesuai dengan data.

Pada sampel besar uji diagnostik yang digunakan pada model adalah uji pendekatan normal Osius-Rojek Statistik uji pendekatan normal Osius-Rojek merupakan pengembangan statistik uji chi-kuadrat Pearson. Statistik uji pendekatan normal Osius-Rojek didapatkan dengan menghitung harga harapan dari statistik uji chi-kuadrat Pearson dan mengestimasi variansi galat model melalui regresi linier terbobot. Hasil perhitungan statistik uji digunakan untuk mengevaluasi apakah model sesuai dengan data. Apabila model sesuai dengan data, maka model dapat diinterpretasikan.

METODE PENELITIAN

Metode yang digunakan dalam penulisan skripsi ini adalah studi literatur yaitu melakukan studi ulang mengenai uji diagnostik model regresi logistik melalui uji pendekatan normal Osius-Rojek.

Langkah-langkah yang ditempuh untuk menguji diagnostik model regresi logistik dengan uji pendekatan normal Osius-Rojek sebagai berikut

1. Menentukan statistik uji pendekatan normal Osius-Rojek pada model regresi logistik.

2. Menerapkan model regresi logistik pada data penelitian Zapka dan Spotts dari Divisi Kesehatan Universitas Massachusetts (Hosmer dan Lemeshow, 1989).

3. Estimasi parameter model menggunakan metode maksimum likelihood.

4. Uji signifikansi parameter menggunakan uji rasio likelihood dan chi-kuadrat Wald.

5. Uji diagnostik model menggunakan uji pendekatan normal Osius-Rojek.

6. Memberikan interpretasi model.

PEMBAHASAN

Uji diagnostik model digunakan untuk mengetahui kesesuaian model dengan data. Menurut Hosmer dan Lemeshow (1989) salah satu uji diagnostik model regresi logistik adalah uji chi kuadrat Pearson. Pada kasus tipe pola pertama yaitu jumlah

pola kovariat J sama dengan ukuran sampel J n , statistik uji chi-kuadrat Pearson

tidak berdistribusi chi-kuadrat sehingga statistik uji chi-kuadrat Pearson tidak dapat digunakan sebagai uji kecocokan model (Liu, 2007). Oleh karena itu digunakan uji

pendekatan normal Osius-Rojek yang dapat diaplikasikan pada kasus J n dan J n

(Liu, 2007). Statistik uji pendekatan normal Osius-Rojek merupakan pengembangan dari statistik uji chi-kuadrat Pearson untuk ukuran sampel besar (Liu, 2007).

4.1 Prosedur Uji Pendekatan Normal Osius-Rojek

Uji pendekatan normal Osius-Rojek merupakan uji diagnostik model yang didasarkan pada pola kovariat. Tahapan uji pendekatan normal Osius-Rojek adalah

menghitung nilai j j j , , 3 2 , 1 , ˆ , " S dengan ˆ j S merupakan estimasi probabilitas pola

kovariat ke-j. Kemudian dihitung variansi jumlah sukses untuk setiap pola kovariat sebesar

(1 ˆ j ) j j v j m S S untuk 1, 2, 3, , j J " dengan j m adalah banyak sampel pada pola kovariat ke-j.

Model regresi logistik menghasilkan variansi galat yang tidak konstan (Neter and Wasserman, 1974). Pada kondisi variansi galat tidak konstan digunakan metode kuadrat terkecil terbobot untuk mendapatkan estimasi variansi galat. Menurut Hosmer dan Lemeshow (1989) tahapan prosedur uji pendekatan normal Osius-Rojek selanjutnya adalah melakukan regresi linier terbobot untuk variabel respon j c Model regresi logistik menghasilkan variansi galat yang tidak konstan (Neter and Wasserman, 1974). Pada kondisi variansi galat tidak konstan digunakan metode kuadrat terkecil terbobot untuk mendapatkan estimasi variansi galat. Menurut Hosmer dan Lemeshow (1989) tahapan prosedur uji pendekatan normal Osius-Rojek selanjutnya adalah melakukan regresi linier terbobot untuk variabel respon j c

j ˆ m j S lebih dari 1 untuk setiap pola kovariat ke-j maka diberikan faktor koreksi untuk variansi galat

sebesar

Menurut Hosmer dan Lemeshow (1989) statistik uji pendekatan normal Osius-Rojek didefinisikan sebagai

A JKG

Liu (2007) menyebutkan bahwa statistik uji z berdistribusi normal standar atau ~ z 0,1 N untuk ukuran sampel besar. Harga harapan dari statistik uji chi-kuadrat

Pearson didapatkan melalui momen pertama dari fungsi pembangkit momen statistik

uji 2 X yaitu

(4.1.1) Pada persamaan (4.1.1) dicari momen ke-1 dan dievaluasi pada

t 0 = sehingga didapatkan

Estimasi variansi dari statistik uji chi-kuadrat pearson didapatkan dari nilai JKG hasil regresi linear terbobot . Menurut Liu (2007) faktor koreksi A sama dengan

0 atau

A 0 bila jumlah pola kovariat J sama dengan jumlah ukuran sampel J n . Hasil perhitungan statistik uji pendekatan normal Osius-Rojek digunakan A 0 bila jumlah pola kovariat J sama dengan jumlah ukuran sampel J n . Hasil perhitungan statistik uji pendekatan normal Osius-Rojek digunakan

4.2 Contoh

Data yang digunakan untuk menerapkan uji pendekatan normal Osius-Rojek adalah data penelitian Zapka dan Spotts dari Divisi Kesehatan Universitas Massachusetts (Hosmer dan Lemeshow, 1989). Data penelitian digunakan untuk menjelaskan pengaruh pendapat dan pengalaman seseorang terhadap status penggunaan mammography. Nilai variabel prediktor dan variabel respon diberikan pada Tabel 4.2.1.

Tabel 4.2.1 Sikap Wanita Terhadap Status Penggunaan Mammography Pertanyaan Jawaban Pernah melakukan percobaan mammography? Variabel Respon Y

0 : Tidak pernah,

1 : Pernah

Tidak membutuhkan mammography kecuali

punya gejala? SYMPT () 1 X

1 : Sangat Setuju, 3 : Tidak Setuju

2 : Setuju, 4 : Sangat Tidak Setuju

Merasakan manfaat mammography? PB 2 X Skor persepsi 5 – 20 Riwayat kanker payudara? HIST 3 X 0 : Tidak, 1 : Ya Periksa payudara sendiri? BSE 4 X 0 : Tidak, 1 : Ya

Mungkinkah mammography temukan kanker

baru ? DETC () 5 X

1 : Tidak Mungkin

2 : Mungkin, 3 : Sangat Mungkin

Nilai variabel PB

X 2 pada Tabel 4.2.1 menunjukkan semakin tinggi nilai skor persepsi semakin menurunkan pendapat orang terhadap manfaat penggunaan

mammography. Hasil estimasi parameter model dengan bantuan program SPSS version 16 ditunjukkan pada Tabel 4.2.2 sehingga didapatkan estimasi model regresi logistik

ˆ gx

Tabel 4.2.2. Estimasi Parameter 5 Variabel Prediktor Variabel Db

Estimasi Parameter

SE Wald p-value Konstan 1 3.050 0.572 28.426 0.000

SYMPT(1) >@ 11 X 1 -1,704 0.474 12.939 0.000 SYMPT(2) >@ 12 X 1 -1.869 0.401 21.703 0.000 SYMPT(3) >@ 13 X 1 -0.450 0.257 3.060 0.080 PB >@ 2 X 1 -0.185 0.061 9.175 0.002 HIST >@ 3 X 1 -1.225 0.391 9.838 0.002 BSE >@ 4 X 1 -1.164 0.403 8.337 0.004

DETC(1) >@ 51 X 1 0.168 0.652 0.067 0.796 DETC(2) >@ 52 X 1 -0.556 0.281 3.913 0.048

Kemudian dilakukan uji signifikansi parameter dengan menggunakan uji rasio likelihood. Pada Tabel 4.2.3 yang selengkapnya dapat dilihat pada Lampiran 2 didapatkan nilai uji rasio likelihood.

Tabel 4.2.3 Uji Rasio Likelihood 5 Variabel Prediktor

Model

-2 Log Likelihood

1 2 3 4 , 5 , , XX , XX X 465.001

Tabel 4.2.3 menunjukkan nilai

98.517 (0.05,8) G 15.51 F ! maka 0 H ditolak,

berarti terdapat pengaruh sekurang-kurangnya satu variabel prediktor terhadap berarti terdapat pengaruh sekurang-kurangnya satu variabel prediktor terhadap

menunjukkan bahwa 0 H ditolak jika statistik uji chi-kuadrat Wald > X 2 (1;0.05) = 3,84 pada tingkat signifikansi

D 0.05 .

Pada Tabel 4.2.2 didapat nilai statistik uji chi-kuadrat Wald dari seluruh variabel prediktor dan konstanta yang lebih besar dari 2 0.05,1 F 3.84 kecuali variabel

X 13 dan X 51 yang memiliki nilai statistik uji chi-kuadrat Wald lebih kecil dari

F 3.84 . Hasil uji signifikansi parameter didapatkan bahwa variabel SYMPT(3) [X 13 ] dan DETC(1) [X 51 ] tidak berpengaruh signifikan terhadap model regresi logistik

sehingga variabel SYMPT dan DETC (Hosmer dan Lemeshow, 1989). Selanjutnya estimasi parameter model regresi logistik untuk 3 variabel prediktor yaitu PB [X 2 ], HIST [X 3 ], BSE [X 4 ] dilakukan melalui estimasi parameter

dengan bantuan program SPSS version 16. Hasil estimasi parameter ditunjukkan pada Tabel 4.2.4 sehingga diperoleh estimasi model regresi logistik

gx

gx

dengan fungsi logit sebagai berkut

2 3 ˆ 4 2.816 0.265X 1.103X gx 1.179X Tabel 4.2.4 Estimasi Parameter 3 Variabel Prediktor

Variabel db

Estimasi Parameter

SE Wald KONSTAN 1

HIST [X 3 ]

1 -1.103 0.357 9.554

Model

-2 Log Likelihood

G db

Konstanta 563.518 53.975 3

Variabel X 2 ,X 3 ,X 4 509.543

Tabel 4.2.5 menunjukkan nilai

98.517 (0.05,3) 7.81 F ! G maka 0 H ditolak,

berarti terdapat pengaruh sekurang-kurangnya satu variabel prediktor terhadap variabel respon atau terdapat pengaruh sikap wanita terhadap status penggunaan mammography. Selanjutnya dilakukan uji signifikansi parameter satu-satu dengan menggunakan uji chi-kuadrat Wald. Pada Tabel 4.2.4 didapatkan nilai statistik uji chi-kuadrat Wald dari seluruh variabel prediktor dan konstanta yang lebih besar dari

F 3.84 sehingga 0 H ditolak, berarti masing-masing variabel prediktor sikap wanita secara signifikan berpengaruh terhadap status penggunaan mammography.

Tabel 4.2.4 dan Tabel 4.2.5 selengkapnya dapat dilihat pada Lampiran 2. Setelah didapatkan model regresi logistik yang signifikan dalam parameternya dilakukan uji diagnostik model melalui uji pendekatan normal Osius-Rojek untuk mengevaluasi apakah model sesuai dengan data. Prosedur uji pendekatan normal Osius-Rojek yaitu menghitung nilai ˆ j S, j v , dan j c yang disajikan pada Tabel 4.2.6.

Tabel 4.2.6. Hasil perhitungan nilai ˆ j S, j v , dan j c

28 6 0.773 1.053 -0.519 6 29 12 0.816 1.801 -0.351 9

Tabel 4.2.7. Anova Tabel 4.2.7. Anova

dan nilai

2 =2 29-9.251 =39.497.

Nilai statistik uji pendekatan normal

Osius-rojek adalah

¼ Hasil perhitungan nilai z adalah

1.96 /2 0.242 z 1.96 z D D yang berarti 0 H diterima sehingga model regresi logistik sesuai dengan data. Setelah diketahui bahwa parameter regresi logistik memiliki pengaruh yang signifikan terhadap estimasi model regresi logistik dan model sesuai dengan data, selanjutnya dilakukan interpretasi model regresi logistik dengan menggunakan odds

ratio. Pada Tabel 4.2.8 ditunjukkan nilai odds ratio untuk model regresi logistik biner yang mengandung 3 variabel prediktor. Tabel 4.2.8 selengkapnya dapat dilihat pada lampiran 2.

Tabel 4.2.8 Odds Ratio Variabel

Odds

Ratio PB 2 X 0.767 HIST 3 X 0.332

BSE 4 X 0.307 BSE 4 X 0.307

PENUTUP

5.1. Kesimpulan

Berdasarkan hasil pembahasan, diperoleh kesimpulan sebagai berikut :

1. Uji pendekatan Osius-Rojek merupakan uji diagnostik model regresi logistik untuk uku ran sampel besar. Statistik uji pendekatan Osius-Rojek adalah

A JKG

2. Pada pengaruh dan pengalaman seseorang terhadap status penggunaan mammography didapatkan estimasi model regresi logistik yang sesuai adalah

gx

gx

dengan

2 3 ˆ 4 2.816 0.265 1.103 gx 1.179 X X X .

Hasil perhitungan nilai z adalah

1.96 /2 0.242 z 1.96 z D D yang berarti 0 H diterima sehingga model regresi logistik sesuai dengan data.

3. Berdasarkan nilai odds ratio disimpulkan setiap kenaikan 1 skor persepsi manfaat penggunaan mammography menunjukkan penurunan penggunaan mammography sebesar 0.767 kali. Proporsi wanita yang mempunyai riwayat kanker payudara pernah memeriksakan payudaranya dengan mammography sebanyak 0.332 kali lebih besar dibandingkan wanita yang tidak mempunyai riwayat kanker payudara. Proporsi wanita yang dapat memeriksa payudara sendiri ternyata pernah memeriksakan payudaranya dengan mammography sebanyak 0.307 kali lebih besar dibandingkan wanita yang tidak dapat memeriksa payudara sendiri.

Saran yang dapat penulis sampaikan adalah peggunaan uji pendekatan normal Osius-Rojek pada penulisan skripsi ini dibatasi pada kasus model regresi logistik biner. Hal ini dimungkinkan untuk membahas uji pendekatan normal Osius-Rojek pada kasus model regresi logistik polytomous.