mampu memberikan informasi sebagaimana model AMMI, dengan keluasan distribusi pada peubah respon.
81
BAB V. MODEL AMMI DATA CACAHAN DENGAN MASALAH NILAI NOL
5.1 Pengantar
Data cacahan counting data banyak dijumpai dalam berbagai bidang ilmiah termasuk sosial, medis, industri, biologi dan ekologi. Model regresi Poisson
merupakan kerangka kerja standar yang digunakan untuk menganalisis data cacahan. Meskipun pada prakteknya data cacahan sering kali mengalami
penyimpangan dari sebaran Poisson. Penyimpangan ini terjadi justru oleh kekhasan sebaran Poisson yang memiliki nilai rataan yang sama dengan nilai
ragamnya. Selengkapnya tentang sebaran Poisson dapat dilihat pada Lampran 7. Poisson juga sering dianggap sebagai Binomial dengan peluang rataan yang
rendah. Pada kenyataannya seringkali data cacahan kita tidak memiliki kesamaan antara rataan dan ragam pada angka-angka cacahan yang cukup besar,
penyimpangan ini dikenal sebagai fenomena overdispersi. Sementara itu, pada nilai rataan Poisson yang rendah akan diikuti rendahnya nilai ragam, dalam hal ini
data cacahan menghadapi masalah nilai nol. Banyaknya frekuensi pengamatan cacahan yang benilai nol excess zero bukanlah hal biasa dalam data cacahan.
Sebaran Poisson biasanya tidak cocok untuk menggambarkan data dengan fenomena ini, karena begitu banyak cacahan dengan nilai nol. Fenonema
banyaknya nilai nol yang mengganggu ini dikenal dengan nama inflasi-zero zero- inflation
. Untuk menyajikan kesimpulan yang valid dari data cacahan dengan zero-inflation
ini diperlukan model yang tepat. Kondisi data hasil penelitian seperti tersebut di atas sering dijumpai dalam
praktik, misalnya dalam menghitung serangan hama atau penyakit pada tanaman. Tanaman yang tidak memiliki tanda terserang, dapat terjadi karena dua hal, bisa
jadi karena tahan terhadap penyakit, atau hanya karena tidak ada spora penyakit tidak terjadi endemi atau tidak ada serangan hama disana. Ini adalah perbedaan
antara nol struktural dan nol sampling yaitu yang terjadi menurut proses acak. Teladan lain mungkin dialami oleh studi keberadaan satwa langka, seringkali
sebagian besar data pengamatannya adalah nol Welsh et al. 2000. Atau pada studi kriminologi, Kaminski dan Thomas 2009, pada studi kecelakaan lalu lintas
oleh Lord et al. 2005 serta pada biometrika dan pemuliaan oleh BoÈhning 1998 dan Motta et al. 2007.
5.2 Zero-inflation dan Konsekuensinya
Secara umum zero-inflation inflasi-nol berarti terdapat pengamatan bernilai nol yang lebih banyak dari seharusnya pada basis data tak-nol. Terminologi ini
berlaku untuk data kontinu dan diskrit. Johnson et al. 1992 memberikan ringkasan beberapa sebaran termodifikasi oleh nol zero-modified distribution
termasuk di dalamnya zero-inflated Poisson, zero- modified binomial, zero-inflated
geometric , dan logarithmic-with-zeros distributions. Tentu saja hal ini juga
memungkinkan terjadi sebaliknya yaitu, banyaknya pengamatan nilai nol yang kurang dari yang diharapkan, disebut deflasi-nol Zero-
deflation tapi ini tidak lazim.
Dalam konteks data cacahan, inflasi-nol muncul ketika terdapat proporsi yang lebih besar pada cacahan bernilai nol, dibandingkan dengan sebaran yang
standar Poisson atau binomial negatif pada nilai tengah yang sama. Pada penelitian populasi hewan langka misalnya, angka nol dapat terjadi ketika
kondisi habitat sesuai untuk keberadaan hewan tetapi tidak ada hewan yang diamati, dianggap nol kebetulan, atau dapat pula terjadi ketika memang keberada-
an hewan langka terssebut tidak dimungkinkan oleh kondisi habitat. Dalam hal ini dianggap nol yang sesungguhnya atau necessary zero McCullagh Nelder
1989. Fenomena lain adalah dalam studi ketahanan hama penyakit pada
tanaman. Tanaman yang tidak memiliki tanda terserang dapat terjadi karena dua hal, karena ia tahan terhadap penyakit, atau hanya karena tidak ada spora penyakit
tidak terjadi endemi atau tidak ada serangan hama. Dalam situasi yang pertama, nilai dugaan adalah valid sehingga nilai nol harus masuk ke dalam
model. Namun, dalam situasi yang kedua, tampaknya tidak masuk akal untuk menghitung nilai dugaan untuk pengamatan nol tersebut, sehingga cacahan nol itu
harus dikeluarkan dari data sebelum pemodelan McCullagh Nelder 1989. Mengabaikan inflasi-nol, terutama ketika proporsinya cukup besar dalam
data, berarti mengabaikan tidak terpenuhinya asumsi dasar. Sedikitbanyak hal ini
83 akan mempengaruhi hasil analisis, dan dapat menyebabkan kesimpulan yang salah
arah. Selain memperhitungkan inflasi-nol, kita juga perlu mempertimbangkan over-dispersi, yaitu nilai ragam yang lebih besar dari yang diharapkan asumsi
sebaran. Ini adalah fenomena yang biasa terjadi pada model Poisson, dan jika diabaikan, dapat menyebabkan pendugaan galat baku yang terlalu rendah
underestimate akibatnya inferensi parameter model menjadi menyesatkan Hinde Demetrio 1998. Inflasi-nol dan overdispersi dapat terjadi secara
bersamaan dalam satu set data.
5.3 Penanganan Zero-inflation pada Model Aditif
Pada model regresi dengan peubah respon yang memuat nilai nol berlebih, pendekatan paling sederhana adalah regresi kuadrat terkecil dengan
mentransformasi respon. Namun transformasi dengan transformasi logaritma atau akar kuadrat tidak berguna bila banyak pengamatan bernilai nol, karena nol tidak
akan berubah oleh transformasi akar dan bernilai tak hingga pada transformasi logaritma.
Transformasi lain mungkin saja dipikirkan oleh sebagian praktisi untuk menangani data cacahan dengan masalah nol yang berlebih. Transformasi yang
sangat mungkin digunakan adalah transformasi dengan menambahkan konstanta yang cukup kecil pada data. Strategi transformasi dengan menggeser nilai tengah
ini efektif pada sebaran Normal karena diyakini tidak memberikan dampak pada pendugaan parameter maupun interpretasi. Namun secara teori, hal tersebut tidak
berlaku pada sebaran Poisson. Hal ini disebabkan oleh kekhasan sebaran Poisson yang memiliki nilai tengah yang sama dengan ragamnya. Tidak seperti pada
sebaran Normal, menggeser rataan dapat dilakukan tanpa mengubah bentuk sebarannya, pada sebaran Poisson menggeser rataan sebaran Poisson tidak bisa
terjadi tanpa ada perubahan pada ragam yang menentukan bentuk sebaran. Artinya strategi menggeser rataan dilakukan untuk menghindari nilai nol,
namun tetap memerlukan langkah berikutnya untuk kesesuaian data dengan sebaran akan yang digunakan, sebaran Poisson atau pun yang lain. Terlebih lagi,
bila ingin menggunakan sebaran normal, maka asumsi dasar seperti galat yang