Regresi dengan Respon Biner

Regresi dengan Respon
Biner
Eni Sumarminingsih

Arti Fungsi Respon
Pandang model regresi linier
sederhana berikut:

Dengan nilai Yi yang mungkin adalah
0 dan 1.

Karena

Karena Yi adalah peubah biner maka Yi
memiliki sebaran Bernouli dengan
sebaran peluang

Berdasar definisi nilai harapan peubah
acak

Rata – rata respon adalah peluang

saat nilai predictor adalah

Permasalahan yang muncul bila
peubah respon adalah biner
1. Galat tidak menyebar normal
Bila peubah respon adalah biner, maka
galat juga hanya mempunyai dua
kemungkinan nilai,
• Saat
, maka
• Saat
, maka

2. Ragam galat tidak konstan

ragam galat tergantung pada nilai

3. Batasan pada Fungsi Respon
Fungsi respon yang linier tidak
memenuhi batasan ini

harus ditransformasi
sedemikian hingga nilainya berkisar
antara nilai 0 dan 1

Atau dapat ditulis juga

Model Regresi Logistik

Atau

Atau bentuk logit

Pendugaan Parameter
Dengan nilai Y yang bersifat biner, kita
dapat menggunakan Bernoulli sebagai
sebaran variabel Y sehingga fungsi
likelihood akan berbentuk

Nilai maksimum dari fungsi
kemungkinan dapat dicari dengan

melogaritmakan kedua ruas.
Maksimum dari fungsi �(��) disebut
sebagai log likelihood.

Karena βj yang akan diduga bersifat
nonlinier, maka penyelesaian
persamaan dapat menggunakan
metode iterasi Gauss Newton atau
Metode Marquardt.

Pengujian Terhadap Pendugaan
Parameter
•a.  Pengujianpendugaan parameter
() secaraparsial.
Untukmemeriksaperanankoefisienregr
esidarimasingmasingvariabelprediktorsecaraindividu
dalammodel.
Hipotesis yang digunakanadalah :

Statistik uji yang digunakan adalah

statistik uji Wald yang dapat ditulis:

Untuk sampel besar statistik uji Wald
mengikuti sebaran normal (Z)

•b.  Pengujianpendugaanparameter
()
secarasimultan
Untukmemeriksapengaruhkoefisienreg
residarivariabelprediktorsecarabersam
a-sama. Hipotesisnyaadalah:

Uji
•  yang
digunakanadalahujinisbahkemungkinan(Likelihood
Ratio Test) yaitu:

dengan:
L0= nilai log likelihood model
regresilogistiktanpavariabelprediktor

Lp = nilai log likelihood model
regresilogistikdenganvariabelprediktor
Likelihood ratio test berdistribusi

Interpretasi untuk variabel
independen polikotomus
Misalkan peubah bebas memiliki
kategori lebih dari 2.
Contoh:
Penelitian dilakukan untuk meneliti
adakah pengaruh ras (White, Black,
Hispanic, Other) terhadap terjadinya
CHD (Coronary Hearth Disease)

Data dari penelitian adalah sebagai
berikut:

Karena Variabel bebas memiliki
kategori lebih dari 2 maka kita
gunakan design variabel seperti pada

tabel berikut:

Hasil estimasi adalah sebagai berikut:

Sehingga didapatkan

Interpretasi untuk variabel
Independen Kontinu
• Asumsikan
 
logit= g(x) adalah linier.
• Persamaanlogitadalah
• 1merupakanperubahan log odds
(logit)
untuksetiappeningkatansebesar 1
satuan x
• 1 =g(x+1) – g(x) = untuk setiapnilai
x.

•  Secaraumumjika x berubahsebesar c

satuanmakalogitakanberubahsebesar
c1,
• Didapatkandari
= c1
• Sehingga OR(c)=OR(x+c,x) =
exp(c1)

:
•Contoh
 

padapenelitianpengaruhusiaterhadapterjadiny
a CHD didapatkanmodel
Odd Ratio dugauntukkenaikanusia 10
tahunadalah
Artinyasetiapkenaikanusiasebesar 10
tahunmakaresikoterjadinya CHD
meningkatsebesar 3.03 kali

Multivariable Model

Suatu
•  
penelitiandilakukanuntukmengetahuipengaruhus
ia (AGE), jeniskelamindan level cathecolamin
(CAT) terhadapterjadinya CHD. Model yang
digunakanadalah
Dimana X1 = usia
X2 = jeniskelamin (0 = perempuan, 1=laki – laki)
X3 = level cathecolamin ( 0= rendah, 1=tinggi)

•Odd
  ratio untukvariabel 0-1
adalahdenganasumsivariabel yang lain
tetap.
Sedangkanuntukvariabelkontinu, Odd
ratio didapatkandari
Secaraumumrumusuntuk Odd Ratio
adalah

Model Multivariabel dengan

interaksi

Goodness of fit
Misalkan
model kitaterdiridari p peubahbebas
•  
J adalahbanyaknyanilaipengamatanx yang berbeda.
Jikabeberapasubjekmemilikinilaix yang samamaka J