Overdispersi dan Underdispersi
OVERDISPERSI DAN
UNDERDISPERSI
Dispersi adalah ketidaksesuaian antara
ragam pengamatan dengan ragam dari
model binomial yang diduga
Dalam regresi logistik, diasumsikan
bahwa peubah respon (Yi ) berdistribusi
binomial dengan ragam pengamatan
ni i 1 i) sama
Var(Y
dengan ragam harapan
i
Overdispersi adalah ragam pengamatan lebih besar
dari ragam harapan
Underdispersi adalah ragam pengamatan lebih
kecil dari ragam harapan
beberapa hal yang menjadi penyebab terjadinya
overdispersi dan underdispersi adalah:
1.
Menghilangkan kovariat yang penting.
2.
Kesalahan dalam penentuan link function.
3.
Adanya korelasi antar pengamatan.
4.
Kompleksitas pengamatan yang tidak dipahami
secara baik.
Parameter dispersi disimbolkan dengan
, dan pemodelan dispersi dirumuskan
melalui model berikut (Williams, 1982):
Var Yi ni i 1 i 1 ni 1
Jika bernilai 0 maka tidak terjadi
dispersi dan respon mengikuti sebaran
binomial
Selain itu maka terjadi overdispersi atau
underdispersi
Pemeriksaan terjadinya overdispersi dan
underdispersi dapat dideteksi dengan
menggunakan nilai statistik 2 Pearson
Statistik 2 Pearson merupakan fungsi
dari sisaan, yaitu jumlah kuadrat dari
m
selisih nilai pengamatan
dengan
nilai
2
2
Pearson r y ,
dugaan
i 1
dengan
yi ni i
r yi ,i
ni i 1 ni i
i
i
overdispersi terjadi jika:
2 Pearson
1
db
Sedangkan underdispersi terjadi apabila:
2 Pearson
1
db
dengan db = m-k, dimana m adalah
banyaknya pengamatan dan k adalah
banyaknya parameter yang diduga
William Method
Parameter
estimate of denoted by is
obtained by equating 2 statistic of the
model to its approximate expected
value, written as :
and
Where
wi is the weight and vi is diagonal element of the
variance-covariance matrix of the linear predictor,
The value of 2 statistic depends on , so iteration
process is needed to find optimum value.
This procedure was firstly introduced by William
(1982), and then called William method
The algorithm of William method is
described as follow:
Assumed = 0 , calculate parameter
estimate of logistic regression model, ,
using maximum likelihood method.
Calculate the 2 statistics of fitted
model.
2. Compared 2 statistics to distribution. If
2 statistic is too large, conclude that
> 0 and calculated initial estimates of
using following formula :
1.
3.
initial weight re
Using
statistic.
calculate the value of and
2
4.
If 2 statistic closes to its number of degree of freedom, k − p,
estimated value of is sufficient. If not, re-estimate using
following expression:
If 2 statistic remain large, return to step 3 until optimum value
of estimated obtained. Once has been estimated by ,
could be used as weights in fitting new
model
UNDERDISPERSI
Dispersi adalah ketidaksesuaian antara
ragam pengamatan dengan ragam dari
model binomial yang diduga
Dalam regresi logistik, diasumsikan
bahwa peubah respon (Yi ) berdistribusi
binomial dengan ragam pengamatan
ni i 1 i) sama
Var(Y
dengan ragam harapan
i
Overdispersi adalah ragam pengamatan lebih besar
dari ragam harapan
Underdispersi adalah ragam pengamatan lebih
kecil dari ragam harapan
beberapa hal yang menjadi penyebab terjadinya
overdispersi dan underdispersi adalah:
1.
Menghilangkan kovariat yang penting.
2.
Kesalahan dalam penentuan link function.
3.
Adanya korelasi antar pengamatan.
4.
Kompleksitas pengamatan yang tidak dipahami
secara baik.
Parameter dispersi disimbolkan dengan
, dan pemodelan dispersi dirumuskan
melalui model berikut (Williams, 1982):
Var Yi ni i 1 i 1 ni 1
Jika bernilai 0 maka tidak terjadi
dispersi dan respon mengikuti sebaran
binomial
Selain itu maka terjadi overdispersi atau
underdispersi
Pemeriksaan terjadinya overdispersi dan
underdispersi dapat dideteksi dengan
menggunakan nilai statistik 2 Pearson
Statistik 2 Pearson merupakan fungsi
dari sisaan, yaitu jumlah kuadrat dari
m
selisih nilai pengamatan
dengan
nilai
2
2
Pearson r y ,
dugaan
i 1
dengan
yi ni i
r yi ,i
ni i 1 ni i
i
i
overdispersi terjadi jika:
2 Pearson
1
db
Sedangkan underdispersi terjadi apabila:
2 Pearson
1
db
dengan db = m-k, dimana m adalah
banyaknya pengamatan dan k adalah
banyaknya parameter yang diduga
William Method
Parameter
estimate of denoted by is
obtained by equating 2 statistic of the
model to its approximate expected
value, written as :
and
Where
wi is the weight and vi is diagonal element of the
variance-covariance matrix of the linear predictor,
The value of 2 statistic depends on , so iteration
process is needed to find optimum value.
This procedure was firstly introduced by William
(1982), and then called William method
The algorithm of William method is
described as follow:
Assumed = 0 , calculate parameter
estimate of logistic regression model, ,
using maximum likelihood method.
Calculate the 2 statistics of fitted
model.
2. Compared 2 statistics to distribution. If
2 statistic is too large, conclude that
> 0 and calculated initial estimates of
using following formula :
1.
3.
initial weight re
Using
statistic.
calculate the value of and
2
4.
If 2 statistic closes to its number of degree of freedom, k − p,
estimated value of is sufficient. If not, re-estimate using
following expression:
If 2 statistic remain large, return to step 3 until optimum value
of estimated obtained. Once has been estimated by ,
could be used as weights in fitting new
model