Pendahuluan Analisis Hurdle Poisson Untuk Pemodelan Data Count (Studi Kasus : Konsumsi Rokok Kalimantan Tengah Tahun 2012).

1 ANALISIS HURDLE POISSON UNTUK PEMODELAN DATA COUNT Studi Kasus : Konsumsi Rokok Kalimantan Tengah Tahun 2012 Afi Nurani 1 , Sutawanir Darwis 2 , Sudartianto 3 1 Mahasiswa Program Magister Statistika Terapan, Universitas Padjadjaran, Bandung 23 Pengajar Jurusan Statistika, Universitas Padjadjaran, Bandung 1 phiex07gmail.com, 2 std.darwisgmail.com , 3 sudartianto354yahoo.com Abstrak Indonesia menjadi negara ketiga dengan jumlah perokok tertinggi di dunia setelah Cina dan India. Kebiasaan merokok pada masyarakat Indonesia secara umum merupakan masalah kesehatan karena konsumsi tembakau yang masih cenderung tinggi. Jumlah batang rokok sekitar 10 batang per hari merupakan angka rata-rata yang cukup tinggi untuk memberikan dampak negatif terhadap kesehatan dan ekonomi Buku Fakta Tentang Tembakau, 2012. Konsumsi rokok dalam batang per hari merupakan salah satu kasus data cacahan count dengan banyak nilai 0 excess zero. Model Hurdle Poisson merupakan salah satu metode yang dapat digunakan untuk memodelkan data cacahan dengan excess zero. Model Hurdle Poisson merupakan model dengan menggunakan dua bagian pendekatan two part model yaitu model logit untuk observasi bernilai 0 dan Truncated Poisson untuk observasi bernilai positif. Hasil pemodelan dengan Hurdle Poisson memberikan perbaikan terhadap model Regresi Poisson. Faktor-faktor yang berpengaruh terhadap keputusan individu mengkonsumsi rokok pada bagian logit adalah pendidikan, jenis kelamin, status perkawinan, pekerjaan, umur, dan pendapatan perkapita sebulan, sedangkan pada bagian Truncated Poisson variabel prediktor yang berpengaruh adalah pendidikan, jenis kelamin, status perkawinan, umur, dan pendapatan perkapita sebulan. Kata kunci : Data Cacahan, Excess Zero, Regresi Poisson, Hurdle Poisson, Logit, Truncated Poisson, Konsumsi Rokok

1. Pendahuluan

Indonesia merupakan negara keempat dengan konsumsi rokok terbesar di dunia setelah China, USA, dan Rusia. Jumlah batang rokok yang dikonsumsi di Indonesia cenderung meningkat dari 182 milyar batang pada tahun 2001 menjadi 260,8 milyar batang pada tahun 2009. Angka prevalensi rokok pada tahun 2010 pun cukup tinggi yaitu 34,7 persen Buku Fakta Tentang Tembakau, 2012. Saat ini, Indonesia menjadi negara ketiga dengan jumlah perokok tertinggi di dunia setelah Cina dan India . Kebiasaan merokok pada masyarakat Indonesia secara umum merupakan masalah kesehatan karena konsumsi tembakau yang masih cenderung tinggi. Jumlah batang rokok 2 sekitar 10 batang per hari merupakan angka rata-rata yang cukup tinggi untuk memberikan dampak negatif terhadap kesehatan dan ekonomi Buku Fakta Tentang Tembakau, 2012. Menurut WHO, konsumsi rokok membunuh satu orang setiap 10 detik. Dampak negatif segi kesehatan adalah timbulnya penyakit yang diakibatkan mengkonsumsi rokok. Sedangkan segi ekonomi adalah besarnya pengeluaran untuk konsumsi rokok dan besarnya biaya untuk berobat penyakit akibat rokok serta hilangnya waktu dan berkurangnya produktifitas kerja. Kebiasaan merokok tidak hanya berdampak pada perokok itu sendiri akan tetapi juga bagi perokok pasif, terutama pada kelompok rentan seperti usia balita, anak sekolah, dan populasi perempuan meskipun ada sebagian dari perempuan juga merokok. Konsumsi rokok dalam batang per hari merupakan salah satu kasus data cacahan dengan banyak nilai 0 excess zero. Banyaknya nilai 0 ini dimungkinkan terjadi karena individu tidak mengkonsumsi atau hanya kadang-kadang mengkonsumsi potensial mengkonsumsi. Pengamatan pada variabel respon berbentuk diskrit tetapi bukan biner dapat dikatakan sebagai data cacahan yang menyangkut banyaknya kejadian dalam distribusi Poisson. Distribusi Poisson memiliki asumsi kesetaraan rata-rata dengan varians yang disebut dengan equidispersion. Salah satu metode yang dapat digunakan dalam menganalisa data cacahan adalah metode regresi Poisson Agresti, 2002. Namun metode regresi Poisson akan menjadi tidak sesuai jika banyak data bernilai nol yang mengakibatkan terjadinya overdispersi Ridout, Demetrio, dan Hindie, 1998. Beberapa metode yang bisa digunakan untuk memodelkan variabel respon dengan excess zero diantaranya Zero Inflated Poisson dan Hurdle Poisson. Pemodelan dengan Zero Inflated Poisson merupakan model mixture dengan memodelkan observasi bernilai 0 dengan proses biner dan model independen Poisson untuk observasi bernilai positif. Model Hurdle Poisson diasumsikan sebagai dua proses independen fungsi dari variabel respon yaitu model biner untuk observasi bernilai nol dan Truncated Poisson untuk observasi bernilai positif. Kedua model ini sama-sama menggunakan metode maksimum likelihood untuk mendapatkan estimasi parameter yang digunakan. Model Hurdle Poisson merupakan model yang bisa dimaksimumkan secara terpisah sehingga lebih mudah dalam penggunaaan dan interpretasinya Cantoni dan Zedini, 2010. Model Hurdle Poisson adalah model untuk data cacahan count dengan menggunakan dua bagian pendekatan two part model. Bagian pertama adalah model untuk data biner bernilai nol atau positif. Data bernilai positif lebih dari nol adalah bagian kedua dengan Truncated model Kassahun, 2014. Metode Hurdle ini bisa menyajikan pemodelan untuk menentukan keputusan partisipasi partitipation decision dan keputusan level konsumsi level consumption decision dalam dua proses stokastik yang terpisah.

2. Tinjauan Pustaka