83 akan mempengaruhi hasil analisis, dan dapat menyebabkan kesimpulan yang salah
arah. Selain memperhitungkan inflasi-nol, kita juga perlu mempertimbangkan over-dispersi, yaitu nilai ragam yang lebih besar dari yang diharapkan asumsi
sebaran. Ini adalah fenomena yang biasa terjadi pada model Poisson, dan jika diabaikan, dapat menyebabkan pendugaan galat baku yang terlalu rendah
underestimate akibatnya inferensi parameter model menjadi menyesatkan Hinde Demetrio 1998. Inflasi-nol dan overdispersi dapat terjadi secara
bersamaan dalam satu set data.
5.3 Penanganan Zero-inflation pada Model Aditif
Pada model regresi dengan peubah respon yang memuat nilai nol berlebih, pendekatan paling sederhana adalah regresi kuadrat terkecil dengan
mentransformasi respon. Namun transformasi dengan transformasi logaritma atau akar kuadrat tidak berguna bila banyak pengamatan bernilai nol, karena nol tidak
akan berubah oleh transformasi akar dan bernilai tak hingga pada transformasi logaritma.
Transformasi lain mungkin saja dipikirkan oleh sebagian praktisi untuk menangani data cacahan dengan masalah nol yang berlebih. Transformasi yang
sangat mungkin digunakan adalah transformasi dengan menambahkan konstanta yang cukup kecil pada data. Strategi transformasi dengan menggeser nilai tengah
ini efektif pada sebaran Normal karena diyakini tidak memberikan dampak pada pendugaan parameter maupun interpretasi. Namun secara teori, hal tersebut tidak
berlaku pada sebaran Poisson. Hal ini disebabkan oleh kekhasan sebaran Poisson yang memiliki nilai tengah yang sama dengan ragamnya. Tidak seperti pada
sebaran Normal, menggeser rataan dapat dilakukan tanpa mengubah bentuk sebarannya, pada sebaran Poisson menggeser rataan sebaran Poisson tidak bisa
terjadi tanpa ada perubahan pada ragam yang menentukan bentuk sebaran. Artinya strategi menggeser rataan dilakukan untuk menghindari nilai nol,
namun tetap memerlukan langkah berikutnya untuk kesesuaian data dengan sebaran akan yang digunakan, sebaran Poisson atau pun yang lain. Terlebih lagi,
bila ingin menggunakan sebaran normal, maka asumsi dasar seperti galat yang
menyebar normal dengan ragam konstan, belum tentu dapat terpenuhi oleh transformasi ini.
Pendekatan model linear terampat dengan fungsi hubung logaritma dan fungsi ragam tertentu dapat menangani masalah overdispersi. Namun demikian,
secara keseluruhan pendugaan model pun masih buruk bila terdapat banyak pengamatan dengan nilai nol. Banyaknya nilai nol ini pun menjadi sah secara
teoritik oleh adanya overdispersi. Ridout et al. 1998 mendiskusikan beberapa pendekatan untuk
memodelkan data cacahan dengan inflasi-nol dalam kaitannya dengan distribusi Poisson. Inflasi-nol pada data cacahan dapat dihasilkan oleh campuran distribusi
Poisson. Campuran yang paling umum digunakan adalah distribusi binomial negatif. Overdispersi pada data cacahan juga dapat dihasilkan oleh campuran dari
sebaran Poisson, yang bisa jadi berbeda dari campuran sebaran Poisson pada inflasi-nol. Binomial negatif sering juga disebut model over-dispersi.
Pendekatan lain untuk pemodelan data cacahan dengan inflasi-nol adalah mengklasifikasi pengamatan nilai nol menjadi dua kelompok yang
berbeda. Sebuah sebaran yang mengklasifikasikan pangamatan nol dengan cara ini telah disebut sebagai sebaran nol termodifikasi zero-modified distribution,
sebaran dengan tambahan nol distribution with added zero, sebaran inflasi-nol zero-inflated distribution atau distribusi campuran mixture distribution. Dalam
sebaran-sebaran tersebut, nol diklasifikasikan menjadi dua kelompok: satu kelompok, yang bersama dengan jumlah positif dimodelkan dengan distribusi
diskrit seperti Poisson atau distribusi binomial negatif, terjadi dengan probabilitas 1 -
ω, dan kelompok lain, yang mewakili yang ekstra nol, terjadi dengan probabilitas ω. Dietz BoEhning 2000 mendiskusikan pendugaan parameter
pada sebaran nol-termodifikasi Poisson Poisson Zero-modified distribution dan
untuk ilustrasi mereka menganalisis jumlah yang tercatat dalam studi epidemiologi kesehatan gigi.
Pendekatan ini disebut model dua-komponen. Dalam pendekatan ini antara lain, Hurdel model Mullahy 1986, two-part model Heilbron 1994 atau
conditional model Welsh et al. 2000. Model pertama, memodelkan adatidak
adanya nol atau tak-nol dengan model logistik, dan kemudian secara bersyarat,