Regresi Poisson Hurdle Poisson Uji Kelayakan Model

2 sekitar 10 batang per hari merupakan angka rata-rata yang cukup tinggi untuk memberikan dampak negatif terhadap kesehatan dan ekonomi Buku Fakta Tentang Tembakau, 2012. Menurut WHO, konsumsi rokok membunuh satu orang setiap 10 detik. Dampak negatif segi kesehatan adalah timbulnya penyakit yang diakibatkan mengkonsumsi rokok. Sedangkan segi ekonomi adalah besarnya pengeluaran untuk konsumsi rokok dan besarnya biaya untuk berobat penyakit akibat rokok serta hilangnya waktu dan berkurangnya produktifitas kerja. Kebiasaan merokok tidak hanya berdampak pada perokok itu sendiri akan tetapi juga bagi perokok pasif, terutama pada kelompok rentan seperti usia balita, anak sekolah, dan populasi perempuan meskipun ada sebagian dari perempuan juga merokok. Konsumsi rokok dalam batang per hari merupakan salah satu kasus data cacahan dengan banyak nilai 0 excess zero. Banyaknya nilai 0 ini dimungkinkan terjadi karena individu tidak mengkonsumsi atau hanya kadang-kadang mengkonsumsi potensial mengkonsumsi. Pengamatan pada variabel respon berbentuk diskrit tetapi bukan biner dapat dikatakan sebagai data cacahan yang menyangkut banyaknya kejadian dalam distribusi Poisson. Distribusi Poisson memiliki asumsi kesetaraan rata-rata dengan varians yang disebut dengan equidispersion. Salah satu metode yang dapat digunakan dalam menganalisa data cacahan adalah metode regresi Poisson Agresti, 2002. Namun metode regresi Poisson akan menjadi tidak sesuai jika banyak data bernilai nol yang mengakibatkan terjadinya overdispersi Ridout, Demetrio, dan Hindie, 1998. Beberapa metode yang bisa digunakan untuk memodelkan variabel respon dengan excess zero diantaranya Zero Inflated Poisson dan Hurdle Poisson. Pemodelan dengan Zero Inflated Poisson merupakan model mixture dengan memodelkan observasi bernilai 0 dengan proses biner dan model independen Poisson untuk observasi bernilai positif. Model Hurdle Poisson diasumsikan sebagai dua proses independen fungsi dari variabel respon yaitu model biner untuk observasi bernilai nol dan Truncated Poisson untuk observasi bernilai positif. Kedua model ini sama-sama menggunakan metode maksimum likelihood untuk mendapatkan estimasi parameter yang digunakan. Model Hurdle Poisson merupakan model yang bisa dimaksimumkan secara terpisah sehingga lebih mudah dalam penggunaaan dan interpretasinya Cantoni dan Zedini, 2010. Model Hurdle Poisson adalah model untuk data cacahan count dengan menggunakan dua bagian pendekatan two part model. Bagian pertama adalah model untuk data biner bernilai nol atau positif. Data bernilai positif lebih dari nol adalah bagian kedua dengan Truncated model Kassahun, 2014. Metode Hurdle ini bisa menyajikan pemodelan untuk menentukan keputusan partisipasi partitipation decision dan keputusan level konsumsi level consumption decision dalam dua proses stokastik yang terpisah.

2. Tinjauan Pustaka

2.1. Regresi Poisson

Model Regresi Poisson dengan fungsi hubung link function untuk fitting model Agresti, 2002: log � = � = 2.1 Sehingga biasa disebut model Loglinear dengan bentuk persamaan sebagai berikut: � = exp + 1 1 + 2 2 + ⋯ + 2.2 3 Model regresi Poisson memiliki nilai rata-rata dan varians sama, begitu juga dengan dengan nilai � = = � .

2.2. Hurdle Poisson

Misalkan adalah variabel respon dengan data cacahan untuk i=1,2,...,n. � � dan � � adalah vektor kovariat dari variabel prediktor. adalah parameter koefisien regresi dari model logit dan adalah parameter koefisien regresi dari model Truncated Poisson. Fungsi hubung untuk pemodelan variabel respon bernilai 0 menggunakan fungsi hubung untuk binomial yaitu logit link: logit � 1 −� = ′ 2.3 Fungsi hubung untuk pemodelan variabel respon bernilai positif menggunakan fungsi hubung log : log � = ′ 2.4 Model peluang Hurdle Poisson yang terbentuk dari kombinasi logit untuk observasi bernilai 0 dan Truncated Poisson untuk observasi bernilai positif adalah Cantoni dan Zedini, 2010: � = = 1 1+exp ⁡ ′ , = 0 exp ′ 1+exp ′ [exp ′ ] exp exp ⁡ ′ −1 , 2.5 Metode penaksiran yang digunakan dalam metode Hurdle Poisson ini adalah maximum likelihood estimation MLE dengan menggunakan algoritma Fisher Scoring. Fungsi likelihood dari model Hurdle Poisson diatas adalah : � , = 1 1+exp ′ exp ′ 1+exp ′ [exp ′ ] exp exp ⁡ ′ −1 2.6

2.3. Uji Kelayakan Model

Pengujian kelayakan model dapat dilakukan dengan menggunakan uji Likelihood Ratio LR Test Long dan Freese, 2001. Hipotesis yang akan diuji adalah sebagai berikut: H : = 1 = 2 = ⋯ = = ⋯ = 0 p adalah banyaknya variabel prediktor H 1 : Paling sedikit ada satu ≠ 0 j = 1,2,..,p Likelihood Ratio LR Test dapat dituliskan dalam bentuk: 2 = −2 ln �Ω �Ω 2.7 dimana merupakan himpunan parameter di bawah populasi model penuh dan Ω model parameter dibawah H himpunan parameter jika H benar. Kriteria pengujian adalah tolak H jika 2 � , 2 dengan  adalah tingkat signifikansi dan db adalah derajat bebas dengan nilai sama dengan perbedaan dimensi parameter Ω dan Ω. 4 Pemilihan model terbaik dapat menggunakan Statistik Vuong dengan membandingkan model Hurdle Poisson dengan Poisson. Hipotesis yang digunakan sebagai berikut: H : = 0 tidak ada perbaikan yang diberikan Hurdle Poisson terhadap Poisson H 1 : 0 ada perbaikan yang diberikan Hurdle Poisson terhadap Poisson Statistik Voung dapat dirumuskan sebagai berikut Vuong, 1989: = � , 2.8 dengan : = 1 � � � � � � � =1 dan = 1 � � � � � � − 2 � =1 . Dimana � � dan � � adalah prediksi peluang dari pada nilai untuk masing-masing model Hurdle Poisson dan Poisson. Kriteria pengujian untuk statistik Vuong mengikuti distribusi normal standar untuk sampel besar, yaitu tolak H jika , dimana merupakan titik kritis dengan tingkat siginifikansi . 2.4. Uji Parameter Model Pengujian parameter parsial untuk masing-masing bagian logit dan Truncated Poisson digunakan untuk menguji masing-masing parameter dengan hipotesis sebagai berikut: 1. Hipotesis untuk bagian logit H : = 0 H 1 : ≠ 0 = 1,2, . . , p adalah banyaknya variabel prediktor. 2. Hipotesis untuk bagian Truncated Poisson H : = 0 H 1 : ≠ 0 = 1,2, . . , p adalah banyaknya variabel prediktor. Statistik uji yang digunakan adalah statistik uji Wald Agresti, 2002 : 1. Untuk bagian logit = � 2.9 2. Untuk bagian Truncated Poisson = � 2.10 5 Kriteria pengujian tolak H jika 2 atau p-value , dengan adalah tingkat signifikansi dan SE adalah standard error. Sampel besar mengikuti sebaran normal, maka kriteria pengujian dibandingkan dengan tabel normal Z.

2.5. Telaah Kritis