9
2.3 Overdispersion
Pada model regresi Poisson terdapat asumsi yang harus dipenuhi. Salah satunya adalah asumsi kesamaan antara rataan dan variansi dari
variabel dependent, yang disebut juga equidispersion. Namun, dalam analisis data cacah seringkali dijumpai data yang variansinya lebih besar dari
rataannya overdispersion. Jika pada data cacah terjadi overdispersion namun tetap digunakan
regresi Poisson, akan berpengaruh pada nilai standard error yang menjadi turun atau underestimate, sehingga kesimpulannya menjadi tidak valid [4].
Fenomena overdispersion dapat dituliskan:
Overdispersion dapat diindikasikan dengan nilai deviance dan pearson chi-squares yang dibagi dengan derajat bebasnya. Jika kedua nilai
tersebut lebih dari 1, maka dikatakan terjadi overdispersion pada data [6]. Terdapat dua cara yang dapat digunakan untuk mendeteksi
overdispersion, yaitu: 1. Deviance
= ;
= 2
∑ −
− 2.10
Dimana
=
− dengan merupakan banyaknya parameter termasuk konstanta, merupakan banyaknya pengamatan dan
adalah nilai Deviance [4].
10 2. Pearson Chi-Squares
= ;
=
∑ 2.11
Dimana
=
− dengan merupakan banyaknya parameter termasuk konstanta,
merupakan banyaknya pengamatan dan adalah Pearson Chi-Squares [5].
Jika dan
bernilai lebih dari 1 maka terjadi overdispersion pada data. 2.4 Regresi Binomial Negatif
Model Regresi Binomial Negatif merupakan suatu model regresi yang digunakan untuk menganalisis hubungan antara sebuah variabel dependent
yang berupa data cacah dengan satu atau lebih variabel independent. Regresi Binomial Negatif dapat digunakan baik dalam keadaan equidispersion
ataupun overdispersion [5]. Jika ingin diketahui hubungan antara variabel dependent dan buah
variabel independent
, , …,
. Diberikan sampel sebesar pengamatan yaitu
, , …,
, ; = 1, 2, …, dan = 1, 2, …,
. Pengamatan ke- dari variabel
, , …,
adalah
, , …,
. Pengamatan ke- dari variabel adalah .
11 Jika menyebar Poisson dengan parameter
dan terdapat variabel random
berdistribusi gamma dengan parameter dan rataan 1. Maka fungsi peluang bersama Poisson Gamma adalah:
; =
Γ
=
∫ misal
= +
maka
=
. Sehingga
=
Diperoleh,
=
∫
=
∫
=
Γ
+
= =
Jika inverse dari adalah dan
=
. Sehingga fungsi kepadatan peluang Binomial Negatif menjadi:
; , =
2.12 Rataan dan variansi dari Binomial Negatif adalah
=
dan
= 1 +
. Dengan merupakan parameter dispersi.
12 Jika
= 0
, maka rataan dan variansinya akan sama,
=
. Jika , maka variansinya akan melebihi rataannya,
[5]. Jika diasumsikan bahwa
| =
=
. Dengan adalah vektor yang berukuran x1 yang menjelaskan variabel independent
dan adalah vektor berukuran x1 merupakan parameter regresi. Maka
model log likelihood untuk regresi Binomial Negatif dapat dituliskan sebagai: ℓ
; , =
1 +
−
1 1 +
+
Γ
+ 1
− Γ
+ 1
− Γ 2.13
dimana
=
ℓ
; , = 1 +
−
1 1 +
+
Γ
+
− Γ
+ 1
− Γ 2.14
Dengan demikian, penaksir maximum likelihood dapat diselesaikan dengan memaksimumkan model
ℓ
; ,
, yaitu:
ℓ
; ,
=
∑
= 0, = 1, 2, …,
2.15
ℓ
; ,
=
− ∑
, , = 1, 2, …,
2.16 dan
ℓ ; ,
=
∑
1 + +
+ +
−
= 0
2.17
13
ℓ ; ,
=
∑ −
+ 2 1 + +
+
−
2.18 Fungsi digamma merupakan turunan pertama dari fungsi log-gamma
Γ .
Fungsi trigamma merupakan turunan kedua dari
Γ [4].
2.5 Regresi Generalized Poisson