Model Regresi Logistik Staff Site Universitas Negeri Yogyakarta

2. Model Regresi Logistik

Model regresi logistik digunakan untuk mencari hubungan antara variabel respon yang bersifat kategorik dengan variabel prediktor yang bersifat kontinu atau kategorik. Nilai dari variabel respon Y yang bersifat biner atau dikotomus dibedakan atas dua kategori, misalnya Y = 0 dan Y = 1. Misalkan terdapat p variabel X’ = X 1 , X 2 , …, X P yang berpasangan dengan variabel respon Y. Peluang Y = 1 dinotasikan dengan πx. Fungsi regresi logistik πx adalah: ] exp[ 1 ] exp[ gx gx x + = π , 1 dengan gx = β + β 1 x 1 + β 2 x 2 + … + β p x p Hosmer dan Lemeshow, 1989. Fungsi regresi di atas berbentuk curvilinear sehingga untuk membuatnya menjadi fungsi linear dilakukan transformasi logit sebagai berikut Agresti, 1990: gx x x x Logit = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − = ] [ π π π 1 log 2 Pada model regresi linear diasumsikan bahwa suatu amatan dari variabel respon dinyatakan sebagai y = EY⏐x + ε, dengan EY⏐x = β + β 1 x 1 + β 2 x 2 + … + β p x p merupakan mean populasi dan ε adalah error yang merupakan komponen acak yang menunjukkan penyimpangan amatan dari rataannya. Error ε diasumsikan mengikuti distribusi normal dengan mean sama dengan nol dan variansi konstan. Pada model regresi logistik variabel respon dinyatakan sebagai y = πx + ε. Nilai ε mempunyai salah satu dari dua kemungkinan yaitu: , 3 ⎩ ⎨ ⎧ = = − = y jika - 1 y jika 1 x x π π ε sehingga distribusi error model regresi logistik akan mempunyai rataan sama dengan nol dan variansi {πx.1 ‐ πx} Hosmer dan Lemeshow, 1989. SEMNAS Matematika dan Pend. Matematika 2007 718 Prosedur penaksiran parameter dilakukan dengan metode maximum likelihood , yang secara lengkap dapat dilihat pada Hosmer dan Lemeshow 1989 dan Agresti 1990. Uji signifikansi parameter dilakukan dua tahap, yaitu uji serentak dilanjutkan dengan uji parsial. Uji serentak digunakan untuk mengetahui peran seluruh variabel prediktor dalam model secara serentak, dengan hipotesis: H : β 1 = β 2 = ... = β p = 0 H 1 : minimal ada satu β j yang tidak sama dengan nol, j = 1, 2, ..., p Statistik uji yang digunakan adalah uji G Likelihood Ratio Test: [ ] [ ] ⎭ ⎬ ⎫ ⎩ ⎨ ⎧ − + − − − + = ∑ n n n n n n y y G i i i i ln ln ln ˆ 1 ln 1 ˆ ln 2 1 1 π π , 4 dengan: n = banyak observasi yang bernilai Y = 1 n 1 = banyak observasi yang bernilai Y = 0 n = n + n 1 Hipotesis H ditolak jika P G atau p‐value α. Statistik uji G mengikuti distribusi chi‐square dengan derajat bebas ν banyaknya parameter dalam model. 2 , υ α χ Jika uji serentak menunjukkan adanya parameter yang signifikan maka dilanjutkan dengan uji parsial, yang merupakan pengujian β i secara individual. Hasil pengujian akan menunjukkan apakah suatu variabel prediktor layak untuk masuk dalam model atau tidak. Hipotesis yang digunakan: H : β j = 0 H 1 : β j ≠ 0, j = 1, 2, ..., p. Statistik uji yang digunakan adalah uji Wald: j j SE W β β ˆ ˆ = 5 Matematika 719 dengan adalah penduga maximum likelihood dan SE adalah standard error untuk . Hipotesis H j βˆ j βˆ j βˆ ditolak jika P⏐W⏐ Z atau p‐value α nilai yang ditetapkan peneliti. Statistik uji W merupakan variabel random yang mengikuti distribusi normal standar.

3. Model Neural Networks NN untuk Klasifikasi Data