Overdispersion Aplikasi regresi binomial negatif dan generalized poisson dalam mengatasi overdispersion pada regresi poisson (studi kasus data kemiskinan provinsi di Indonesia tahun 2009)

9

2.3 Overdispersion

Pada model regresi Poisson terdapat asumsi yang harus dipenuhi. Salah satunya adalah asumsi kesamaan antara rataan dan variansi dari variabel dependent, yang disebut juga equidispersion. Namun, dalam analisis data cacah seringkali dijumpai data yang variansinya lebih besar dari rataannya overdispersion. Jika pada data cacah terjadi overdispersion namun tetap digunakan regresi Poisson, akan berpengaruh pada nilai standard error yang menjadi turun atau underestimate, sehingga kesimpulannya menjadi tidak valid [4]. Fenomena overdispersion dapat dituliskan: Overdispersion dapat diindikasikan dengan nilai deviance dan pearson chi-squares yang dibagi dengan derajat bebasnya. Jika kedua nilai tersebut lebih dari 1, maka dikatakan terjadi overdispersion pada data [6]. Terdapat dua cara yang dapat digunakan untuk mendeteksi overdispersion, yaitu: 1. Deviance = ; = 2 ∑ − − 2.10 Dimana = − dengan merupakan banyaknya parameter termasuk konstanta, merupakan banyaknya pengamatan dan adalah nilai Deviance [4]. 10 2. Pearson Chi-Squares = ; = ∑ 2.11 Dimana = − dengan merupakan banyaknya parameter termasuk konstanta, merupakan banyaknya pengamatan dan adalah Pearson Chi-Squares [5]. Jika dan bernilai lebih dari 1 maka terjadi overdispersion pada data. 2.4 Regresi Binomial Negatif Model Regresi Binomial Negatif merupakan suatu model regresi yang digunakan untuk menganalisis hubungan antara sebuah variabel dependent yang berupa data cacah dengan satu atau lebih variabel independent. Regresi Binomial Negatif dapat digunakan baik dalam keadaan equidispersion ataupun overdispersion [5]. Jika ingin diketahui hubungan antara variabel dependent dan buah variabel independent , , …, . Diberikan sampel sebesar pengamatan yaitu , , …, , ; = 1, 2, …, dan = 1, 2, …, . Pengamatan ke- dari variabel , , …, adalah , , …, . Pengamatan ke- dari variabel adalah . 11 Jika menyebar Poisson dengan parameter dan terdapat variabel random berdistribusi gamma dengan parameter dan rataan 1. Maka fungsi peluang bersama Poisson Gamma adalah: ; = Γ = ∫ misal = + maka = . Sehingga = Diperoleh, = ∫ = ∫ = Γ + = = Jika inverse dari adalah dan = . Sehingga fungsi kepadatan peluang Binomial Negatif menjadi: ; , = 2.12 Rataan dan variansi dari Binomial Negatif adalah = dan = 1 + . Dengan merupakan parameter dispersi. 12 Jika = 0 , maka rataan dan variansinya akan sama, = . Jika , maka variansinya akan melebihi rataannya, [5]. Jika diasumsikan bahwa | = = . Dengan adalah vektor yang berukuran x1 yang menjelaskan variabel independent dan adalah vektor berukuran x1 merupakan parameter regresi. Maka model log likelihood untuk regresi Binomial Negatif dapat dituliskan sebagai: ℓ ; , = 1 + − 1 1 + + Γ + 1 − Γ + 1 − Γ 2.13 dimana = ℓ ; , = 1 + − 1 1 + + Γ + − Γ + 1 − Γ 2.14 Dengan demikian, penaksir maximum likelihood dapat diselesaikan dengan memaksimumkan model ℓ ; , , yaitu: ℓ ; , = ∑ = 0, = 1, 2, …, 2.15 ℓ ; , = − ∑ , , = 1, 2, …, 2.16 dan ℓ ; , = ∑ 1 + + + + − = 0 2.17 13 ℓ ; , = ∑ − + 2 1 + + + − 2.18 Fungsi digamma merupakan turunan pertama dari fungsi log-gamma Γ . Fungsi trigamma merupakan turunan kedua dari Γ [4].

2.5 Regresi Generalized Poisson