Regresi dengan Respon Biner
Regresi dengan Respon
Biner
Eni Sumarminingsih
Arti Fungsi Respon
Pandang model regresi linier
sederhana berikut:
Dengan nilai Yi yang mungkin adalah
0 dan 1.
Karena
Karena Yi adalah peubah biner maka Yi
memiliki sebaran Bernouli dengan
sebaran peluang
Berdasar definisi nilai harapan peubah
acak
Rata – rata respon adalah peluang
saat nilai predictor adalah
Permasalahan yang muncul bila
peubah respon adalah biner
1. Galat tidak menyebar normal
Bila peubah respon adalah biner, maka
galat juga hanya mempunyai dua
kemungkinan nilai,
• Saat
, maka
• Saat
, maka
2. Ragam galat tidak konstan
ragam galat tergantung pada nilai
3. Batasan pada Fungsi Respon
Fungsi respon yang linier tidak
memenuhi batasan ini
harus ditransformasi
sedemikian hingga nilainya berkisar
antara nilai 0 dan 1
Atau dapat ditulis juga
Model Regresi Logistik
Atau
Atau bentuk logit
Pendugaan Parameter
Dengan nilai Y yang bersifat biner, kita
dapat menggunakan Bernoulli sebagai
sebaran variabel Y sehingga fungsi
likelihood akan berbentuk
Nilai maksimum dari fungsi
kemungkinan dapat dicari dengan
melogaritmakan kedua ruas.
Maksimum dari fungsi �(��) disebut
sebagai log likelihood.
Karena βj yang akan diduga bersifat
nonlinier, maka penyelesaian
persamaan dapat menggunakan
metode iterasi Gauss Newton atau
Metode Marquardt.
Pengujian Terhadap Pendugaan
Parameter
•a. Pengujianpendugaan parameter
() secaraparsial.
Untukmemeriksaperanankoefisienregr
esidarimasingmasingvariabelprediktorsecaraindividu
dalammodel.
Hipotesis yang digunakanadalah :
Statistik uji yang digunakan adalah
statistik uji Wald yang dapat ditulis:
Untuk sampel besar statistik uji Wald
mengikuti sebaran normal (Z)
•b. Pengujianpendugaanparameter
()
secarasimultan
Untukmemeriksapengaruhkoefisienreg
residarivariabelprediktorsecarabersam
a-sama. Hipotesisnyaadalah:
Uji
• yang
digunakanadalahujinisbahkemungkinan(Likelihood
Ratio Test) yaitu:
dengan:
L0= nilai log likelihood model
regresilogistiktanpavariabelprediktor
Lp = nilai log likelihood model
regresilogistikdenganvariabelprediktor
Likelihood ratio test berdistribusi
Interpretasi untuk variabel
independen polikotomus
Misalkan peubah bebas memiliki
kategori lebih dari 2.
Contoh:
Penelitian dilakukan untuk meneliti
adakah pengaruh ras (White, Black,
Hispanic, Other) terhadap terjadinya
CHD (Coronary Hearth Disease)
Data dari penelitian adalah sebagai
berikut:
Karena Variabel bebas memiliki
kategori lebih dari 2 maka kita
gunakan design variabel seperti pada
tabel berikut:
Hasil estimasi adalah sebagai berikut:
Sehingga didapatkan
Interpretasi untuk variabel
Independen Kontinu
• Asumsikan
logit= g(x) adalah linier.
• Persamaanlogitadalah
• 1merupakanperubahan log odds
(logit)
untuksetiappeningkatansebesar 1
satuan x
• 1 =g(x+1) – g(x) = untuk setiapnilai
x.
• Secaraumumjika x berubahsebesar c
satuanmakalogitakanberubahsebesar
c1,
• Didapatkandari
= c1
• Sehingga OR(c)=OR(x+c,x) =
exp(c1)
:
•Contoh
padapenelitianpengaruhusiaterhadapterjadiny
a CHD didapatkanmodel
Odd Ratio dugauntukkenaikanusia 10
tahunadalah
Artinyasetiapkenaikanusiasebesar 10
tahunmakaresikoterjadinya CHD
meningkatsebesar 3.03 kali
Multivariable Model
Suatu
•
penelitiandilakukanuntukmengetahuipengaruhus
ia (AGE), jeniskelamindan level cathecolamin
(CAT) terhadapterjadinya CHD. Model yang
digunakanadalah
Dimana X1 = usia
X2 = jeniskelamin (0 = perempuan, 1=laki – laki)
X3 = level cathecolamin ( 0= rendah, 1=tinggi)
•Odd
ratio untukvariabel 0-1
adalahdenganasumsivariabel yang lain
tetap.
Sedangkanuntukvariabelkontinu, Odd
ratio didapatkandari
Secaraumumrumusuntuk Odd Ratio
adalah
Model Multivariabel dengan
interaksi
Goodness of fit
Misalkan
model kitaterdiridari p peubahbebas
•
J adalahbanyaknyanilaipengamatanx yang berbeda.
Jikabeberapasubjekmemilikinilaix yang samamaka J
Biner
Eni Sumarminingsih
Arti Fungsi Respon
Pandang model regresi linier
sederhana berikut:
Dengan nilai Yi yang mungkin adalah
0 dan 1.
Karena
Karena Yi adalah peubah biner maka Yi
memiliki sebaran Bernouli dengan
sebaran peluang
Berdasar definisi nilai harapan peubah
acak
Rata – rata respon adalah peluang
saat nilai predictor adalah
Permasalahan yang muncul bila
peubah respon adalah biner
1. Galat tidak menyebar normal
Bila peubah respon adalah biner, maka
galat juga hanya mempunyai dua
kemungkinan nilai,
• Saat
, maka
• Saat
, maka
2. Ragam galat tidak konstan
ragam galat tergantung pada nilai
3. Batasan pada Fungsi Respon
Fungsi respon yang linier tidak
memenuhi batasan ini
harus ditransformasi
sedemikian hingga nilainya berkisar
antara nilai 0 dan 1
Atau dapat ditulis juga
Model Regresi Logistik
Atau
Atau bentuk logit
Pendugaan Parameter
Dengan nilai Y yang bersifat biner, kita
dapat menggunakan Bernoulli sebagai
sebaran variabel Y sehingga fungsi
likelihood akan berbentuk
Nilai maksimum dari fungsi
kemungkinan dapat dicari dengan
melogaritmakan kedua ruas.
Maksimum dari fungsi �(��) disebut
sebagai log likelihood.
Karena βj yang akan diduga bersifat
nonlinier, maka penyelesaian
persamaan dapat menggunakan
metode iterasi Gauss Newton atau
Metode Marquardt.
Pengujian Terhadap Pendugaan
Parameter
•a. Pengujianpendugaan parameter
() secaraparsial.
Untukmemeriksaperanankoefisienregr
esidarimasingmasingvariabelprediktorsecaraindividu
dalammodel.
Hipotesis yang digunakanadalah :
Statistik uji yang digunakan adalah
statistik uji Wald yang dapat ditulis:
Untuk sampel besar statistik uji Wald
mengikuti sebaran normal (Z)
•b. Pengujianpendugaanparameter
()
secarasimultan
Untukmemeriksapengaruhkoefisienreg
residarivariabelprediktorsecarabersam
a-sama. Hipotesisnyaadalah:
Uji
• yang
digunakanadalahujinisbahkemungkinan(Likelihood
Ratio Test) yaitu:
dengan:
L0= nilai log likelihood model
regresilogistiktanpavariabelprediktor
Lp = nilai log likelihood model
regresilogistikdenganvariabelprediktor
Likelihood ratio test berdistribusi
Interpretasi untuk variabel
independen polikotomus
Misalkan peubah bebas memiliki
kategori lebih dari 2.
Contoh:
Penelitian dilakukan untuk meneliti
adakah pengaruh ras (White, Black,
Hispanic, Other) terhadap terjadinya
CHD (Coronary Hearth Disease)
Data dari penelitian adalah sebagai
berikut:
Karena Variabel bebas memiliki
kategori lebih dari 2 maka kita
gunakan design variabel seperti pada
tabel berikut:
Hasil estimasi adalah sebagai berikut:
Sehingga didapatkan
Interpretasi untuk variabel
Independen Kontinu
• Asumsikan
logit= g(x) adalah linier.
• Persamaanlogitadalah
• 1merupakanperubahan log odds
(logit)
untuksetiappeningkatansebesar 1
satuan x
• 1 =g(x+1) – g(x) = untuk setiapnilai
x.
• Secaraumumjika x berubahsebesar c
satuanmakalogitakanberubahsebesar
c1,
• Didapatkandari
= c1
• Sehingga OR(c)=OR(x+c,x) =
exp(c1)
:
•Contoh
padapenelitianpengaruhusiaterhadapterjadiny
a CHD didapatkanmodel
Odd Ratio dugauntukkenaikanusia 10
tahunadalah
Artinyasetiapkenaikanusiasebesar 10
tahunmakaresikoterjadinya CHD
meningkatsebesar 3.03 kali
Multivariable Model
Suatu
•
penelitiandilakukanuntukmengetahuipengaruhus
ia (AGE), jeniskelamindan level cathecolamin
(CAT) terhadapterjadinya CHD. Model yang
digunakanadalah
Dimana X1 = usia
X2 = jeniskelamin (0 = perempuan, 1=laki – laki)
X3 = level cathecolamin ( 0= rendah, 1=tinggi)
•Odd
ratio untukvariabel 0-1
adalahdenganasumsivariabel yang lain
tetap.
Sedangkanuntukvariabelkontinu, Odd
ratio didapatkandari
Secaraumumrumusuntuk Odd Ratio
adalah
Model Multivariabel dengan
interaksi
Goodness of fit
Misalkan
model kitaterdiridari p peubahbebas
•
J adalahbanyaknyanilaipengamatanx yang berbeda.
Jikabeberapasubjekmemilikinilaix yang samamaka J