2 sekitar 10 batang per hari merupakan angka rata-rata yang cukup tinggi untuk memberikan
dampak negatif terhadap kesehatan dan ekonomi Buku Fakta Tentang Tembakau, 2012. Menurut WHO, konsumsi rokok membunuh satu orang setiap 10 detik.
Dampak negatif segi kesehatan adalah timbulnya penyakit yang diakibatkan mengkonsumsi rokok. Sedangkan segi ekonomi adalah besarnya pengeluaran untuk konsumsi
rokok dan besarnya biaya untuk berobat penyakit akibat rokok serta hilangnya waktu dan berkurangnya produktifitas kerja. Kebiasaan merokok tidak hanya berdampak pada perokok
itu sendiri akan tetapi juga bagi perokok pasif, terutama pada kelompok rentan seperti usia balita, anak sekolah, dan populasi perempuan meskipun ada sebagian dari perempuan juga
merokok.
Konsumsi rokok dalam batang per hari merupakan salah satu kasus data cacahan dengan banyak nilai 0 excess zero. Banyaknya nilai 0 ini dimungkinkan terjadi karena
individu tidak mengkonsumsi atau hanya kadang-kadang mengkonsumsi potensial mengkonsumsi. Pengamatan pada variabel respon berbentuk diskrit tetapi bukan biner dapat
dikatakan sebagai data cacahan yang menyangkut banyaknya kejadian dalam distribusi Poisson. Distribusi Poisson memiliki asumsi kesetaraan rata-rata dengan varians yang disebut
dengan equidispersion. Salah satu metode yang dapat digunakan dalam menganalisa data cacahan adalah metode regresi Poisson Agresti, 2002. Namun metode regresi Poisson akan
menjadi tidak sesuai jika banyak data bernilai nol yang mengakibatkan terjadinya overdispersi Ridout, Demetrio, dan Hindie, 1998.
Beberapa metode yang bisa digunakan untuk memodelkan variabel respon dengan excess zero diantaranya Zero Inflated Poisson dan Hurdle Poisson. Pemodelan dengan Zero
Inflated Poisson merupakan model mixture dengan memodelkan observasi bernilai 0 dengan proses biner dan model independen Poisson untuk observasi bernilai positif. Model Hurdle
Poisson diasumsikan sebagai dua proses independen fungsi dari variabel respon yaitu model biner untuk observasi bernilai nol dan Truncated Poisson untuk observasi bernilai positif.
Kedua model ini sama-sama menggunakan metode maksimum likelihood untuk mendapatkan estimasi parameter yang digunakan.
Model Hurdle Poisson merupakan model yang bisa dimaksimumkan secara terpisah sehingga lebih mudah dalam penggunaaan dan interpretasinya Cantoni dan Zedini, 2010.
Model Hurdle Poisson adalah model untuk data cacahan count dengan menggunakan dua bagian pendekatan two part model. Bagian pertama adalah model untuk data biner bernilai
nol atau positif. Data bernilai positif lebih dari nol adalah bagian kedua dengan Truncated model Kassahun, 2014. Metode Hurdle ini bisa menyajikan pemodelan untuk menentukan
keputusan partisipasi partitipation decision dan keputusan level konsumsi level consumption decision dalam dua proses stokastik yang terpisah.
2. Tinjauan Pustaka
2.1. Regresi Poisson
Model Regresi Poisson dengan fungsi hubung link function untuk fitting model Agresti, 2002:
log � = � =
2.1 Sehingga biasa disebut model Loglinear dengan bentuk persamaan sebagai berikut:
� = exp +
1 1
+
2 2
+ ⋯ +
2.2
3 Model regresi Poisson memiliki nilai rata-rata dan varians sama, begitu juga dengan dengan
nilai � = = � .
2.2. Hurdle Poisson
Misalkan adalah variabel respon dengan data cacahan untuk i=1,2,...,n.
�
�
dan
�
�
adalah vektor kovariat dari variabel prediktor. adalah parameter koefisien regresi dari
model logit dan adalah parameter koefisien regresi dari model Truncated Poisson. Fungsi hubung untuk pemodelan variabel respon bernilai 0 menggunakan fungsi hubung untuk
binomial yaitu logit link:
logit
� 1
−�
=
′
2.3 Fungsi hubung untuk pemodelan variabel respon bernilai positif menggunakan fungsi hubung
log : log
� =
′
2.4 Model peluang Hurdle Poisson yang terbentuk dari kombinasi logit untuk observasi
bernilai 0 dan Truncated Poisson untuk observasi bernilai positif adalah Cantoni dan Zedini, 2010:
� = =
1 1+exp
′
, = 0
exp
′
1+exp
′
[exp
′
] exp exp
′
−1
, 2.5
Metode penaksiran yang digunakan dalam metode Hurdle Poisson ini adalah maximum likelihood estimation MLE dengan menggunakan algoritma Fisher Scoring. Fungsi
likelihood dari model Hurdle Poisson diatas adalah :
� , =
1 1+exp
′
exp
′
1+exp
′
[exp
′
] exp exp
′
−1
2.6
2.3. Uji Kelayakan Model
Pengujian kelayakan model dapat dilakukan dengan menggunakan uji Likelihood Ratio LR Test Long dan Freese, 2001. Hipotesis yang akan diuji adalah sebagai berikut:
H :
=
1
=
2
= ⋯ =
= ⋯ = 0 p adalah banyaknya variabel prediktor
H
1
: Paling sedikit ada satu ≠ 0 j = 1,2,..,p
Likelihood Ratio LR Test dapat dituliskan dalam bentuk:
2
= −2 ln
�Ω �Ω
2.7 dimana merupakan himpunan parameter di bawah populasi model penuh dan
Ω model
parameter dibawah H himpunan parameter jika H
benar. Kriteria pengujian adalah tolak H
jika
2
�
, 2
dengan adalah tingkat signifikansi dan db adalah derajat bebas dengan
nilai sama dengan perbedaan dimensi parameter Ω
dan Ω.
4 Pemilihan model terbaik dapat menggunakan Statistik Vuong dengan membandingkan
model Hurdle Poisson dengan Poisson. Hipotesis yang digunakan sebagai berikut: H
: = 0 tidak ada perbaikan yang diberikan Hurdle Poisson terhadap Poisson
H
1
: 0 ada perbaikan yang diberikan Hurdle Poisson terhadap Poisson
Statistik Voung dapat dirumuskan sebagai berikut Vuong, 1989:
= �
, 2.8 dengan :
= 1
� � �
�
�
� �
=1
dan =
1 � �
�
�
�
�
−
2 �
=1
.
Dimana �
�
dan �
�
adalah prediksi peluang dari pada nilai untuk masing-masing model Hurdle Poisson dan Poisson. Kriteria pengujian untuk statistik
Vuong mengikuti distribusi normal standar untuk sampel besar, yaitu tolak H jika
, dimana
merupakan titik kritis dengan tingkat siginifikansi . 2.4.
Uji Parameter Model
Pengujian parameter parsial untuk masing-masing bagian logit dan Truncated Poisson digunakan untuk menguji masing-masing parameter dengan hipotesis sebagai berikut:
1. Hipotesis untuk bagian logit H
: = 0
H
1
: ≠ 0 = 1,2, . . ,
p adalah banyaknya variabel prediktor. 2. Hipotesis untuk bagian Truncated Poisson
H :
= 0 H
1
: ≠ 0 = 1,2, . . ,
p adalah banyaknya variabel prediktor. Statistik uji yang digunakan adalah statistik uji Wald Agresti, 2002 :
1. Untuk bagian logit
= �
2.9 2. Untuk bagian Truncated Poisson
= �
2.10
5 Kriteria pengujian tolak H
jika
2
atau p-value , dengan adalah tingkat
signifikansi dan SE adalah standard error. Sampel besar mengikuti sebaran normal, maka kriteria pengujian dibandingkan dengan tabel normal Z.
2.5. Telaah Kritis