Overdispersi dan Underdispersi

OVERDISPERSI DAN
UNDERDISPERSI





Dispersi adalah ketidaksesuaian antara
ragam pengamatan dengan ragam dari
model binomial yang diduga
Dalam regresi logistik, diasumsikan
bahwa peubah respon (Yi ) berdistribusi
binomial dengan ragam pengamatan
 ni i 1 i) sama
Var(Y
dengan ragam harapan
i 








Overdispersi adalah ragam pengamatan lebih besar
dari ragam harapan
Underdispersi adalah ragam pengamatan lebih
kecil dari ragam harapan
beberapa hal yang menjadi penyebab terjadinya
overdispersi dan underdispersi adalah:
1.
Menghilangkan kovariat yang penting.
2.
Kesalahan dalam penentuan link function.
3.
Adanya korelasi antar pengamatan.
4.
Kompleksitas pengamatan yang tidak dipahami
secara baik.








Parameter dispersi disimbolkan dengan 
, dan pemodelan dispersi dirumuskan
melalui model berikut (Williams, 1982):
Var Yi  ni  i 1   i 1   ni  1
Jika  bernilai 0 maka tidak terjadi
dispersi dan respon mengikuti sebaran
binomial
Selain itu maka terjadi overdispersi atau
underdispersi





Pemeriksaan terjadinya overdispersi dan

underdispersi dapat dideteksi dengan
menggunakan nilai statistik 2 Pearson
Statistik 2 Pearson merupakan fungsi
dari sisaan, yaitu jumlah kuadrat dari
m
selisih nilai pengamatan
dengan
nilai
2
2
 Pearson   r y ,  
dugaan
i 1

dengan

yi  ni i 
r  yi ,i  



ni i 1  ni i 
i



i



overdispersi terjadi jika:
 2 Pearson
1
db



Sedangkan underdispersi terjadi apabila:
 2 Pearson
1
db




dengan db = m-k, dimana m adalah
banyaknya pengamatan dan k adalah
banyaknya parameter yang diduga

William Method


 
Parameter
estimate of  denoted by is
obtained by equating 2 statistic of the
model to its approximate expected
value, written as :

and

  

Where
wi is the weight and vi is diagonal element of the
variance-covariance matrix of the linear predictor,





The value of 2 statistic depends on , so iteration
process is needed to find optimum value.
This procedure was firstly introduced by William
(1982), and then called William method

The algorithm of William method is
described as follow:
  Assumed  = 0 , calculate parameter
estimate of logistic regression model, ,
using maximum likelihood method.
Calculate the 2 statistics of fitted
model.

2. Compared 2 statistics to distribution. If
2 statistic is too large, conclude that 
> 0 and calculated initial estimates of 
using following formula :

1.

3.


initial weight re
 Using
 statistic.

calculate the value of and

2

4.




If 2 statistic closes to its number of degree of freedom, k − p,
estimated value of is sufficient. If not, re-estimate  using
following expression:

If 2 statistic remain large, return to step 3 until optimum value
of estimated  obtained. Once  has been estimated by ,
could be used as weights in fitting new

model