Zero-inflation dan Konsekuensinya MODEL AMMI DATA CACAHAN DENGAN MASALAH NILAI NOL
menyebar normal dengan ragam konstan, belum tentu dapat terpenuhi oleh transformasi ini.
Pendekatan model linear terampat dengan fungsi hubung logaritma dan fungsi ragam tertentu dapat menangani masalah overdispersi. Namun demikian,
secara keseluruhan pendugaan model pun masih buruk bila terdapat banyak pengamatan dengan nilai nol. Banyaknya nilai nol ini pun menjadi sah secara
teoritik oleh adanya overdispersi. Ridout et al. 1998 mendiskusikan beberapa pendekatan untuk
memodelkan data cacahan dengan inflasi-nol dalam kaitannya dengan distribusi Poisson. Inflasi-nol pada data cacahan dapat dihasilkan oleh campuran distribusi
Poisson. Campuran yang paling umum digunakan adalah distribusi binomial negatif. Overdispersi pada data cacahan juga dapat dihasilkan oleh campuran dari
sebaran Poisson, yang bisa jadi berbeda dari campuran sebaran Poisson pada inflasi-nol. Binomial negatif sering juga disebut model over-dispersi.
Pendekatan lain untuk pemodelan data cacahan dengan inflasi-nol adalah mengklasifikasi pengamatan nilai nol menjadi dua kelompok yang
berbeda. Sebuah sebaran yang mengklasifikasikan pangamatan nol dengan cara ini telah disebut sebagai sebaran nol termodifikasi zero-modified distribution,
sebaran dengan tambahan nol distribution with added zero, sebaran inflasi-nol zero-inflated distribution atau distribusi campuran mixture distribution. Dalam
sebaran-sebaran tersebut, nol diklasifikasikan menjadi dua kelompok: satu kelompok, yang bersama dengan jumlah positif dimodelkan dengan distribusi
diskrit seperti Poisson atau distribusi binomial negatif, terjadi dengan probabilitas 1 -
ω, dan kelompok lain, yang mewakili yang ekstra nol, terjadi dengan probabilitas ω. Dietz BoEhning 2000 mendiskusikan pendugaan parameter
pada sebaran nol-termodifikasi Poisson Poisson Zero-modified distribution dan
untuk ilustrasi mereka menganalisis jumlah yang tercatat dalam studi epidemiologi kesehatan gigi.
Pendekatan ini disebut model dua-komponen. Dalam pendekatan ini antara lain, Hurdel model Mullahy 1986, two-part model Heilbron 1994 atau
conditional model Welsh et al. 2000. Model pertama, memodelkan adatidak
adanya nol atau tak-nol dengan model logistik, dan kemudian secara bersyarat,
85 memodelkan cacahan tak-nol dengan sebaran diskrit terpancung tanpa nol Zero-
truncated , seperti Poisson terpancung atau binomial negatif terpancung. Dalam
model ini, kelas nol seluruhnya dimodelkan dalam komponen biner, nol atau tak- nol. Pendekatan ini memiliki keuntungan karena parameterisasinya ortogonal,
yaitu, secara keseluruhan log-likelihoodnya merupakan jumlah dari log-likelihood masing-masing komponen. Hal ini membuatnya mudah dalam pengepasan model
dan interpretasi. Namun hal ini relevan hanya jika perhatian utama bukan pada pengamatan nol tetapi pada cacahan positif. Aplikasi dari pendekatan pemodelan
dua komponen telah dibahas pada Welsh et al. 2000.