Pengantar MODEL AMMI DATA CACAHAN DENGAN MASALAH NILAI NOL

83 akan mempengaruhi hasil analisis, dan dapat menyebabkan kesimpulan yang salah arah. Selain memperhitungkan inflasi-nol, kita juga perlu mempertimbangkan over-dispersi, yaitu nilai ragam yang lebih besar dari yang diharapkan asumsi sebaran. Ini adalah fenomena yang biasa terjadi pada model Poisson, dan jika diabaikan, dapat menyebabkan pendugaan galat baku yang terlalu rendah underestimate akibatnya inferensi parameter model menjadi menyesatkan Hinde Demetrio 1998. Inflasi-nol dan overdispersi dapat terjadi secara bersamaan dalam satu set data.

5.3 Penanganan Zero-inflation pada Model Aditif

Pada model regresi dengan peubah respon yang memuat nilai nol berlebih, pendekatan paling sederhana adalah regresi kuadrat terkecil dengan mentransformasi respon. Namun transformasi dengan transformasi logaritma atau akar kuadrat tidak berguna bila banyak pengamatan bernilai nol, karena nol tidak akan berubah oleh transformasi akar dan bernilai tak hingga pada transformasi logaritma. Transformasi lain mungkin saja dipikirkan oleh sebagian praktisi untuk menangani data cacahan dengan masalah nol yang berlebih. Transformasi yang sangat mungkin digunakan adalah transformasi dengan menambahkan konstanta yang cukup kecil pada data. Strategi transformasi dengan menggeser nilai tengah ini efektif pada sebaran Normal karena diyakini tidak memberikan dampak pada pendugaan parameter maupun interpretasi. Namun secara teori, hal tersebut tidak berlaku pada sebaran Poisson. Hal ini disebabkan oleh kekhasan sebaran Poisson yang memiliki nilai tengah yang sama dengan ragamnya. Tidak seperti pada sebaran Normal, menggeser rataan dapat dilakukan tanpa mengubah bentuk sebarannya, pada sebaran Poisson menggeser rataan sebaran Poisson tidak bisa terjadi tanpa ada perubahan pada ragam yang menentukan bentuk sebaran. Artinya strategi menggeser rataan dilakukan untuk menghindari nilai nol, namun tetap memerlukan langkah berikutnya untuk kesesuaian data dengan sebaran akan yang digunakan, sebaran Poisson atau pun yang lain. Terlebih lagi, bila ingin menggunakan sebaran normal, maka asumsi dasar seperti galat yang menyebar normal dengan ragam konstan, belum tentu dapat terpenuhi oleh transformasi ini. Pendekatan model linear terampat dengan fungsi hubung logaritma dan fungsi ragam tertentu dapat menangani masalah overdispersi. Namun demikian, secara keseluruhan pendugaan model pun masih buruk bila terdapat banyak pengamatan dengan nilai nol. Banyaknya nilai nol ini pun menjadi sah secara teoritik oleh adanya overdispersi. Ridout et al. 1998 mendiskusikan beberapa pendekatan untuk memodelkan data cacahan dengan inflasi-nol dalam kaitannya dengan distribusi Poisson. Inflasi-nol pada data cacahan dapat dihasilkan oleh campuran distribusi Poisson. Campuran yang paling umum digunakan adalah distribusi binomial negatif. Overdispersi pada data cacahan juga dapat dihasilkan oleh campuran dari sebaran Poisson, yang bisa jadi berbeda dari campuran sebaran Poisson pada inflasi-nol. Binomial negatif sering juga disebut model over-dispersi. Pendekatan lain untuk pemodelan data cacahan dengan inflasi-nol adalah mengklasifikasi pengamatan nilai nol menjadi dua kelompok yang berbeda. Sebuah sebaran yang mengklasifikasikan pangamatan nol dengan cara ini telah disebut sebagai sebaran nol termodifikasi zero-modified distribution, sebaran dengan tambahan nol distribution with added zero, sebaran inflasi-nol zero-inflated distribution atau distribusi campuran mixture distribution. Dalam sebaran-sebaran tersebut, nol diklasifikasikan menjadi dua kelompok: satu kelompok, yang bersama dengan jumlah positif dimodelkan dengan distribusi diskrit seperti Poisson atau distribusi binomial negatif, terjadi dengan probabilitas 1 - ω, dan kelompok lain, yang mewakili yang ekstra nol, terjadi dengan probabilitas ω. Dietz BoEhning 2000 mendiskusikan pendugaan parameter pada sebaran nol-termodifikasi Poisson Poisson Zero-modified distribution dan untuk ilustrasi mereka menganalisis jumlah yang tercatat dalam studi epidemiologi kesehatan gigi. Pendekatan ini disebut model dua-komponen. Dalam pendekatan ini antara lain, Hurdel model Mullahy 1986, two-part model Heilbron 1994 atau conditional model Welsh et al. 2000. Model pertama, memodelkan adatidak adanya nol atau tak-nol dengan model logistik, dan kemudian secara bersyarat,