Regresi Binomial Negatif Sebagai Model Alternatif untuk Menghindari Masalah Overdisperssion pada Regresi Poisson

REGRESI BINOMIAL NEGATIF SEBAGAI MODEL ALTERNATIF
UNTUK MENGHINDARI MASALAH OVERDISPERSSION PADA
REGRESI POISSON
(Studi Kasus : Penderita Demam Berdarah Dengue (DBD) Kota Bogor Tahun 2008)

NOVIRA SARTIKA

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2012

RINGKASAN
NOVIRA SARTIKA. Regresi Binomial Negatif Sebagai Model Alternatif untuk Menghindari
Masalah Overdisperssion pada Regresi Poisson. Dibimbing oleh Dr. Ir. I Made Sumertajaya, M.S
dan Pika Silvianti, S.Si, M.Si
Kasus Demam Berdarah Dengue (DBD) merupakan salah satu masalah kesehatan
masyarakat yang utama di Indonesia khususnya Kota Bogor. Penyakit DBD disebabkan oleh virus
Dengue dari genus Flavivirus famili Flaviviridae yang ditularkan melalui nyamuk Aedes aegypti
dan Aedes albopictus. Penelitian ini bertujuan untuk mengetahui faktor-faktor yang berpengaruh
terhadap jumlah penderita DBD Kota Bogor tahun 2008 dengan peubah respon yaitu jumlah

penderita DBD di desa/kelurahan yang ada di Kota Bogor. Analisis statistika yang digunakan
adalah regresi Poisson. Namun pada penerapannya terjadi pelanggaran asumsi yang disebut
Overdisperssion. Pendekatan model yang dilakukan adalah menggunakan regresi Binomial
Negatif. Model regresi Binomial Negatif merupakan model alternatif untuk menghindari masalah
overdisperssion pada regresi Poisson. Berdasarkan model regresi Binomial Negatif diketahui
faktor-faktor yang mempengaruhi jumlah penderita DBD adalah jumlah penduduk dan jumlah
curah hujan per hari dengan nilai AIC sebesar 489.23 dan R2DEV,BN sebesar 59.43%.
Kata kunci : Demam Berdarah Dengue (DBD), regresi Poisson, overdisperssion, regresi Binomial
Negatif

REGRESI BINOMIAL NEGATIF SEBAGAI MODEL ALTERNATIF
UNTUK MENGHINDARI MASALAH OVERDISPERSSION PADA
REGRESI POISSON
(Studi Kasus : Penderita Demam Berdarah Dengue (DBD) Kota Bogor Tahun 2008)

Oleh :
NOVIRA SARTIKA

Skripsi
sebagai salah satu syarat untuk memperoleh gelar

Sarjana Statistika pada
Departemen Statistika

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2012

Judul

: Regresi Binomial Negatif Sebagai Model Alternatif untuk Menghindari
Masalah Overdisperssion pada Regresi Poisson
: Novira Sartika
: G14070064

Nama
NIM

Disetujui


Pembimbing I

Pembimbing II

Dr. Ir. I Made Sumertajaya, M.S
NIP : 196807021994021001

Pika Silvianti, S.Si, M.Si

Diketahui

Ketua Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Dr. Ir. Hari Wijayanto, M.Si
NIP : 196504211990021001

Tanggal Lulus :


PRAKATA
Puji syukur kehadirat Allah SWT atas segala berkah dan rahmat-Nya sehingga penulis dapat
menyelesaikan karya ilmiah ini. Karya ilmiah ini berjudul ”Regresi Binomial Negatif Sebagai
Model Alternatif untuk Menghindari Masalah Overdisperssion pada Regresi Poisson”. Karya
ilmiah ini penulis susun sebagai salah satu syarat untuk mendapatkan gelar Sarjana Statistika pada
Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian
Bogor.
Penulisan karya ilmiah ini dapat diselesaikan oleh penulis tidak lepas dari dukungan,
bimbingan dan bantuan dari banyak pihak yang sangat berarti bagi penulis. Oleh karena itu, dalam
kesempatan ini penulis menyampaikan ucapan terima kasih kepada:
1. Bapak Dr. Ir. Hari Wijayanto, M.Si selaku Ketua Departemen Statistika FMIPA IPB.
2. Bapak Dr. Ir. I Made Sumertajaya, M.S dan Ibu Pika Silvianti, S.Si, M.Si selaku dosen
pembimbing yang telah memberikan bimbingan, masukan, dan arahan selama penulisan karya
ilmiah ini.
3. Dra. Itasia Dina S. M.Si selaku dosen penguji luar yang telah memberikan beberapa masukan
dan arahan kepada penulis.
4. Seluruh Dosen dan Staf Pengajar Departemen Statistika yang telah memberikan ilmu dan
wawasan selama penulis menuntut ilmu di Departemen Statistika serta seluruh staf
Departemen Statistika yang telah banyak membantu penulis.
5. Kedua orang tua dan keluarga yang telah memberikan doa, kasih sayang serta dorongan baik

moril maupun materil.
6. Teman-teman seperjuangan IPB khususnya statistika 44 yang telah bersama-sama dalam
segala suka maupun duka.
Semoga karya ilmiah ini dapat memberikan manfaat bagi semua pembaca.Amin.

Bogor, Februari 2012

Novira Sartika

RIWAYAT HIDUP
Penulis dilahirkan di Sungai Apit, Siak, Riau pada tanggal 22 Nopember 1989 dari pasangan
berbahagia Bapak Badu Karim dan Ibu Siti Fatimah. Penulis merupakan anak keenam dari delapan
bersaudara. Tahun 2001 penulis lulus dari SD 022 Muhammadiyah Sungai Apit Siak, kemudian
melanjutkan studi di SMP Negeri 1 Sungai Apit Siak hingga tahun 2004. Selanjutnya, penulis
menyelesaikan pendidikannya di SMA Negeri 1 Sungai Apit Siak dan lulus pada tahun 2007. Pada
tahun yang sama penulis lulus seleksi masuk Institut Pertanian Bogor melalui jalur Beasiswa
Utusan Daerah (BUD). Setelah satu tahun menjalani perkuliahan di Tingkat Persiapan Bersama
(TPB), pada tahun 2007 penulis diterima sebagai mahasiswa Departemen Statistika, FMIPA IPB
dengan mayor Statistika.
Selama mengikuti perkuliahan, penulis berkesempatan menjadi Asisten Dosen Mata Kuliah

Rancangan Percobaan dan Metode Statistika pada tahun ajaran 2010/2011. Selain itu, Pada tahun
2009 penulis bergabung dengan lembaga bimbingan belajar “MAFIA CLUBS” sebagai tenaga
pengajar dan bendahara. Penulis juga aktif dalam organisasi kemahasiswaan diantaranya
Himpunan Profesi Gamma Sigma Beta (Himpro GSB) dan Ikatan Keluarga Pelajar dan Mahasiswa
Riau (IKPMR) Bogor, serta kegiatan kepanitiaan seperti Lomba Jajak Pendapat Statistika (LJPS),
Welcome Ceremony of Statistics (WCS), Statistics Gathering (SG), The 5th Statistika Ria (SR),
dan lain-lain. Pada bulan Juli - Agustus 2011 Penulis melaksanakan kegiatan praktik lapang di
Direktorat Sumberdaya Manusia (SDM) Institut Pertanian Bogor.

DAFTAR ISI
Halaman
DAFTAR TABEL ..................................................................................................................... viii
DAFTAR GAMBAR ................................................................................................................ viii
DAFTAR LAMPIRAN ............................................................................................................. viii
PENDAHULUAN .....................................................................................................................

1

Latar Belakang .....................................................................................................................
Tujuan ..................................................................................................................................


1
1

TINJAUAN PUSTAKA ............................................................................................................

1

Demam Berdarah Dengue (DBD) .........................................................................................
Sebaran Binomial ...................................................................................................................
Sebaran Poisson .....................................................................................................................
Sebaran Binomial Negatif ......................................................................................................
Generalized Linear Model (GLM) .........................................................................................
Regresi Poisson .....................................................................................................................
Overdisperssion pada Data Cacahan .....................................................................................
Regresi Binomial Negatif ......................................................................................................
Ukuran Kebaikan Model Regresi Binomial Negatif ..............................................................
Akaike Information Criteria (AIC) ...............................................................................
Koefisien Determinasi (R2) ...........................................................................................


1
1
2
2
3
3
4
4
4
4
5

METODOLOGI ........................................................................................................................

5

Data .....................................................................................................................................
Metode .................................................................................................................................

5

5

HASIL DAN PEMBAHASAN .................................................................................................

5

Deskripsi Data .......................................................................................................................
Model Regresi Poisson ..........................................................................................................
Model Regresi Binomial Negatif ...........................................................................................
Implikasi Overdisperssion pada Regresi Poisson ..................................................................

5
6
6
7

SIMPULAN DAN SARAN ........................................................................................................

8


DAFTAR PUSTAKA ...............................................................................................................

8

LAMPIRAN ..............................................................................................................................

9

DAFTAR TABEL
Halaman
1

2

Nilai dugaan parameter model regresi Poisson ......................................................................... 6
Nilai dugaan parameter model regresi Binomial Negatif .......................................................... 7

DAFTAR GAMBAR
Halaman
1

2

Sepuluh desa/kelurahan dengan jumlah penderita DBD tertinggi ............................................. 5
Plot antara sisaan dan nilai dugaan dari model regresi Binomial Negatif ................................. 7

DAFTAR LAMPIRAN
Halaman
1
2
3
4

Nilai korelasi antar peubah ...................................................................................................... 10
Nilai AIC dan R2DEV,BN dari model regresi Binomial Negatif dengan berbagai
kombinasi peubah penjelas ...................................................................................................... 10
Algoritma untuk pendugaan parameter regres Poisson menggunakan R 2.14.0 ...................... 11
Algoritma untuk pendugaan parameter regresi Binomial Negatif menggunakan R 2.14.0 ...... 11

1

PENDAHULUAN
Latar Belakang
Penyakit Demam Berdarah Dengue
(DBD) sering terjadi di daerah tropis dan
subtropis yang muncul pada musim hujan.
Jumlah kasus DBD cenderung meningkat,
baik dalam jumlah maupun luas wilayah yang
terjangkit. Kasus DBD dapat ditekan jika
faktor-faktor yang mempengaruhi jumlah
penderita DBD sudah diketahui. Hubungan
antara faktor-faktor tersebut dengan jumlah
penderita DBD dapat diketahui dengan
menggunakan analisis regresi. Analisis regresi
yang cocok digunakan adalah regresi Poisson.
Analisis regresi Poisson digunakan karena
jumlah penderita DBD merupakan data
cacahan dan peluang kejadiannya kecil.
Regresi Poisson merupakan analisis
statistika yang mengasumsikan nilai ragam
dari peubah respon Y sama dengan nilai
tengahnya. Namun dalam penerapannya
sering dijumpai ragam dan nilai tengahnya
tidak sama. Misalnya ragam lebih besar dari
nilai tengahnya. Kasus seperti ini disebut
Overdisperssion.
Jika
terjadi
kasus
overdisperssion, regresi Poisson menjadi tidak
valid sehingga diperlukan model alternatif
yang tidak tergantung pada asumsi ragam
sama dengan nilai tengahnya. Model alternatif
yang sering digunakan diantaranya adalah
regresi Binomial Negatif, regresi QuassiLikelihood, regresi Generalized Poisson,
regresi Zero Inflated Poisson (ZIP), regresi
Quassi-Poisson, dan lain sebagainya. Dalam
penelitian ini model alternatif yang akan
dicobakan adalah regresi Binomial Negatif.
Tujuan
Tujuan penelitian ini adalah memodelkan
kasus DBD untuk mengetahui faktor-faktor
yang berpengaruh terhadap jumlah penderita
DBD Kota Bogor menggunakan regresi
Poisson dan regresi Binomial Negatif.
TINJAUAN PUSTAKA
Demam Berdarah Dengue (DBD)
Demam Berdarah Dengue (DBD) adalah
penyakit yang disebabkan oleh virus Dengue
dari genus Flavivirus, famili Flaviviridae
melalui gigitan nyamuk Aedes aegypti dan
Aedes albopictus. Adapun nyamuk Aedes
aegypti memiliki kemampuan terbang
mencapai radius 100-200 meter. Oleh karena
itu, jika di suatu lingkungan terkena kasus
DBD, maka masyarakat yang berada pada
radius tersebut harus waspada.

Virus ini muncul akibat pengaruh musim
atau alam serta perilaku manusia. Penyakit
DBD pertama kali di Indonesia ditemukan di
Surabaya (Jawa Timur) pada tahun 1968 dan
menyebar ke berbagai daerah. Pada tahun
1980 telah diketahui bahwa seluruh provinsi
di Indonesia telah terjangkit penyakit DBD,
kecuali Timor-Timur. Peningkatan jumlah
kasus dan wilayah yang terjangkit disebabkan
oleh semakin baiknya sarana transportasi
penduduk,
adanya
pemukiman
baru,
kurangnya kesadaran manusia terhadap
pembersihan sarang nyamuk, terdapatnya
vektor nyamuk hampir di seluruh pelosok
tanah air dan adanya sel tipe virus yang
bersikulasi sepanjang tahun. Penyakit ini juga
dapat diderita oleh orang yang sebagian besar
tinggal di lingkungan lembab dan pinggiran
kumuh (Kristina et al. 2004, diacu dalam
Tobing TMDNL 2011).
Nyamuk Aedes aegypti lebih menyukai
tempat yang gelap, berbau, dan lembab.
Tempat perindukan yang sering dipilih oleh
Aedes aegypti adalah kawasan yang padat
dengan sanitasi yang kurang memadai,
terutama digenangan air dalam rumah, seperti
pot, vas bunga, bak mandi atau tempat
penyimpanan air lainnya seperti tempayan,
drum, atau ember plastik.
Sebaran Binomial
Suatu percobaan sering kali terdiri atas
ulangan-ulangan
dan
masing-masing
mempunyai dua kemungkinan hasil yaitu
berhasil atau gagal. Jika ulangan-ulangan
tersebut bersifat saling bebas dan peluang
keberhasilan setiap ulangan tetap sama yaitu
sebesar 0.5 maka percobaan ini dinamakan
percobaan Binomial.
Percobaan Binomial memiliki ciri-ciri
sebagai berikut :
1. Percobaan terdiri atas n ulangan.
2. Dalam setiap ulangan, hasilnya dapat
digolongkan sebagai berhasil atau gagal.
3. Peluang berhasil yang dilambangkan
dengan p untuk setiap ulangan adalah sama
dan tidak berubah-ubah.
4. Ulangan-ulangan itu bersifat bebas satu
sama lainnya.
Sebaran peluang bagi peubah acak ini
disebut sebaran Binomial. Sebaran Binomial
bergantung pada banyaknya ulangan dan
peluang keberhasilan pada suatu ulangan.
Sehingga sebaran Binomial memiliki fungsi
peluang sebagai berikut (Walpole 1974) :
( )

; x = 0, 1, 2,…, n

2

dengan nilai tengah, E(X)=np dan ragamnya,
V(X)= npq.
Keterangan :
x = Banyaknya keberhasilan dalam n
ulangan
p = Peluang keberhasilan
q = Peluang kegagalan; q=1-p
n = Banyaknya
ulangan
bebas
yang
dilakukan.
Sebaran Poisson
Percobaan yang menghasilkan nilai-nilai
bagi suatu peubah acak X, yaitu banyaknya
hasil percobaan yang terjadi selama suatu
selang waktu tertentu atau di suatu daerah
tertentu sering disebut percobaan Poisson.
Percobaan Poisson memiliki ciri-ciri
sebagai berikut :
1. Banyaknya hasil percobaan yang terjadi
dalam suatu selang waktu atau suatu daerah
tertentu tidak bergantung pada banyaknya
hasil percobaan yang terjadi pada selang
waktu atau daerah lain yang terpisah.
2. Peluang terjadinya satu hasil percobaan
selama suatu selang waktu yang singkat
sekali atau dalam suatu daerah yang kecil,
sebanding dengan panjang selang waktu
tersebut atau besarnya daerah tersebut dan
tidak bergantung pada banyaknya hasil
percobaan yang terjadi di luar selang waktu
atau daerah tersebut.
3. Peluang bahwa lebih dari satu hasil
percobaan akan terjadi dalam selang waktu
yang singkat tersebut atau dalam daerah
yang kecil tersebut dapat diabaikan.
Sebaran peluang bagi peubah acak ini
disebut sebaran Poisson. Sebaran Poison
hanya bergantung pada rata-rata banyaknya
hasil percobaan yang terjadi selama selang
waktu atau daerah yang diberikan. Sehingga
sebaran Poisson memiliki fungsi peluang
sebagai berikut (Walpole 1974) :

dengan nilai tengah dan ragamnya sama,
E(X)=V(X)=µ.
Keterangan :
x = Banyaknya hasil percobaan yang terjadi
selama suatu selang waktu atau daerah
tertentu
µ = Rata-rata banyaknya hasil percobaan
yang terjadi selama selang waktu atau
dalam daerah yang diberikan
e = 2.71828…
Sebaran Poisson dan Binomial memiliki
bentuk histogram yang bentuknya hampir
sama bila n besar dan p kecil (dekat dengan

nol). Oleh karena itu, bila kedua kondisi itu
dipenuhi, sebaran Poisson dengan µ=np dapat
digunakan untuk menghampiri peluang
Binomial.
Sebaran Binomial Negatif
Sebaran Binomial Negatif merupakan
sebaran peubah acak yang mirip dengan
sebaran Binomial, kecuali bahwa ulangan
diulang terus sampai terjadi sejumlah
keberhasilan tertentu. Jadi, jika pada sebaran
Binomial ingin ditentukan x keberhasilan
dalam n ulangan, dengan n telah ditetapkan
terlebih dahulu, namun pada sebaran Binomial
Negatif ingin diketahui peluang keberhasilan
ke-k terjadi pada ulangan ke-x.
Sebaran Binomial Negatif memiliki ciriciri yang sama dengan sebaran Binomial.
Sebaran peluangnya disebut sebaran Binomial
Negatif. Karena nilai peluang dalam sebaran
tersebut
bergantung
pada
banyaknya
keberhasilan yang diinginkan dan peluang
keberhasilan pada suatu ulangan, maka fungsi
peluang bagi sebaran Binomial Negatif adalah
sebagai berikut (Walpole 1974) :
(

)

dengan nilai tengah,

dan ragamnya,

.
Keterangan :
x = Banyaknya ulangan yang dilakukan
sampai diperoleh r keberhasilan
k = Banyaknya keberhasilan
p = Peluang keberhasilan
q = Peluang kegagalan; q=1-p.
Sebaran Binomial Negatif merupakan
sebaran campuran Poisson-Gamma. Misalkan
bahwa peubah acak Y~Poisson (λ) dan
diasumsikan λ~Gamma (α,β). Sebaran
Gamma (α,β) memiliki nilai tengah αβ dan
ragam αβ2. Fungsi peluang bersama bagi Y
dan λ dapat ditulis sebagai berikut :
|

Akan tetapi, karena λ tidak diamati maka λ
harus
dipisahkan
melalui
sebaran
marginalnya, yaitu :




|


3

Integral di atas diselesaikan menggunakan
bantuan fungsi Gamma yaitu :


∫ [(

) ]

[(

) ]

dengan demikian sebaran marginal dapat
ditulis sebagai berikut :

keluarga
eksponensial
dan
modelnya
merupakan fungsi dari nilai harapannya.
Agresti (2002) menyatakan ada tiga
komponen dalam GLM yaitu :
1. Random component (komponen acak) yang
ditunjukkan dengan peubah respon Y dan
peluang distribusinya.
2. Systematic
component
(komponen
sistematik) yang ditunjukkan dengan
peubah penjelas yang digunakan.
3. Link
function
(fungsi
penghubung)
ditunjukkan dengan fungsi nilai harapannya
sama dengan komponen sistematiknya.
Regresi Poisson
Regresi Poisson merupakan salah satu
model regresi dengan peubah respon Y yang
menyebar mengikuti sebaran Poisson. Fungsi
peluang sebaran Poisson dapat ditulis sebagai
berikut :

untuk y=0, 1, 2, 3,…
sehingga diperoleh nilai tengah dan ragamnya
sebagai berikut :
|
| ]

| ]

Misalkan
merupakan contoh
acak dari sebaran Poisson dengan rata-rata .
Fungsi peluang dinyatakan sebagai berikut:

Model regresi Binomial Negatif yang
dibangun memiliki sebaran Binomial Negatif
dengan parameter µ dan k, dimana
dan
, sehingga nilai tengah dan
ragamnya menjadi,
dan
. Ragam ini merupakan fungsi
kuadratik yang mengakomodasi parameter
overdisperssion (k > 0). Sehingga sebaran Y
menjadi:
(

) (

)

Jika k→0 maka sebaran ini mendekati
sebaran Poisson (µ). Binomial Negatif mampu
mengakomodasi overdisperssion (k > 0) tetapi
tidak underdisperssion (k < 1) pada model
Poisson. Secara umum didefenisikan bahwa
peubah respon merupakan peubah acak yang
menyebar menurut sebaran Binomial Negatif
dengan parameter µ dan k sebagai berikut :

Regresi Poisson termasuk salah satu dari
Generalized Linear Model (GLM) karena
peubah respon memiliki sebaran dalam
keluarga eksponensial yaitu sebaran Poisson.
Regresi Poisson mengasumsikan bahwa
peubah respon yang menyebar Poisson, tidak
ada multikolinearitas antar peubah penjelas,
dan memiliki ragam yang sama dengan nilai
tengahnya. Asumsi multikolinearitas dalam
penelitian ini dilihat dari nilai korelasi antar
peubah penjelas. Jika nilai korelasinya lemah
(rE(Y). Dugaan
dispersi dapat diukur melalui rasio antara
Deviance dengan derajat bebasnya. Rasio ini
selanjutnya disebut rasio dispersi. Jika rasio

dispersi yang dihasilkan lebih besar dari satu
maka model tersebut dikatakan mengalami
overdisperssion.
Deviance
model
regresi
Poisson
memiliki
persamaan
sebagai
berikut
(Kleinbaum et al. 1988) :
[

( | ̂)
]
| ̂

∑[

(

̂

̂ )]

dengan
( | ̂ ) adalah logaritma natural
dari model kemungkinan tanpa melibatkan
| ̂ adalah
semua peubah penjelas dan
logaritma natural dari model yang melibatkan
semua peubah penjelas.
Regresi Binomial Negatif
Misalkan yi adalah nilai dari peubah
respon untuk pengamatan ke-i dan xi adalah
vektor dari nilai peubah penjelas untuk
pengamatan ke-i dengan i=1,2,..,n. Model
regresi Binomial Negatif mengasumsikan
bahwa peubah respon ke-i mengikuti sebaran
Binomial Negatif. Model regresi Binomial
Negatif berganda dapat dituliskan sebagai
berikut:

Pendugaan
parameter
koefisien
Regresi Binomial Negatif dapat diduga
menggunakan
Penduga
Kemungkinan
Maksimum (Maximum Likelihood Estimator)
melalui iterasi dengan metode Fisher Scoring
untuk
memaksimumkan
fungsi
loglikelihoodnya. Hal ini dilakukan karena
penurunan rumus yang tidak bisa dilakukan
secara matematis karena cukup sulit sehingga
dilakukan melalui metode iterasi. Metode
Fisher Scoring dalam penelitian ini dilakukan
menggunakan perangkat lunak R 2.14.0.
Ukuran Kebaikan Model Regresi Binomial
Negatif
Pemilihan model regresi yang terbaik
perlu dilakukan untuk memperoleh hasil
analisis regresi yang optimal. Beberapa
ukuran kebaikan model yang digunakan pada
regresi Binomial Negatif
adalah Akaike
Information Criteria (AIC) dan Koefisien
Determinasi (R2).
Akaike Information Criteria (AIC)
Perhitungan
perbaikan
model
kemungkinan maksimum yang sering
digunakan adalah Akaike Information Criteria
(AIC). Akaike mendefenisikan perhitungan
AIC sebagai berikut :
| ̂

5

| ̂ adalah logaritma natural
dengan
dari model yang melibatkan semua peubah
penjelas dan p adalah banyak parameter. AIC
merupakan kriteria yang mempertimbangkan
banyak parameter. Nilai AIC yang semakin
kecil menunjukkan model yang semakin baik.
Koefisien Determinasi (R2)
Ukuran proporsi keragaman peubah
respon yang dapat diterangkan oleh peubah
penjelas disebut Koefisien Determinasi (R2).
Koefisien deterrminasi (R2) dalam analisis
regresi linear didasarkan pada pemakaian
jumlah kuadrat dengan metode kuadrat
terkecil.
Penggunaan
R2
dapat
menggambarkan keeratan hubungan regresi
antara peubah respon Y dengan peubah
penjelas X. Nilai R2 yang semakin besar
(0≤R2≤1) menunjukkan semakin tepat dugaan
dari model regresi. Menurut Cameron dan
Windmeijer (1995), ukuran R2 pada regresi
Binomial Negatif yang didasarkan pada sisaan
deviance (deviance residual) sebagai berikut :




{

{

( )
̂
̅

(

̂
̅

)}

}

Keterangan :
yi = Nilai amatan ke-i dari peubah respon
̂ = Nilai dugaan untuk amatan ke-i
̅ = Rata-rata peubah respon y
θ = parameter ekstra yang diduga bersamaan
dengan parameter β
METODOLOGI
Data
Data yang digunakan dalam penelitian ini
adalah data sekunder yang diperoleh dari
Dinas Kesehatan (Dinkes) dan Badan
Perencanaan Pembangunan Daerah (Bappeda)
Kota Bogor tahun 2008. Adapun peubah
respon dalam penelitian ini adalah jumlah
penderita DBD di Kota Bogor. Sedangkan
peubah penjelas yang digunakan adalah
sebagai berikut :
1. Jumlah penduduk (X1)
2. Pertambahan
penduduk
karena
perpindahan penduduk (X2)
3. Jumlah KK prasejahtera (X3)
4. Jumlah KK sejahtera I (X4)
5. Jumlah bangunan tidak permanen (X5)
6. Jumlah KK di bantaran sungai (X6)
7. Jumlah KK di pemukiman kumuh (X7)
8. Jumlah madrasah (X8)
9. Jumlah curah hujan per hari (X9)

Metode
Tahapan yang dilakukan dalam penelitian
ini adalah :
1. Melakukan eksplorasi data awal
Analisis statistika deskriptif digunakan
untuk mengetahui karakteristik penduduk
Kota Bogor.
2. Menentukan model regresi Poisson dengan
menggunakan semua peubah penjelas.
3. Menganalisis adanya overdisperssion pada
model regresi Poisson. Hal ini dapat dilihat
dari rasio dispersi yang lebih besar dari
satu.
4. Menentukan model regresi Binomial
Negatif dengan menggunakan semua
peubah penjelas.
5. Melakukan pendugaan parameter regresi
Binomial
Negatif
dengan
penduga
kemungkinan maksimum.
6. Pemilihan model regresi Binomial Negatif
terbaik dari kombinasi peubah penjelas
yang signifikan dan yang tidak signifikan
terhadap
peningkatan
jumlah
DBD
berdasarkan nilai AIC yang kecil dan nilai
R2DEV,BN yang besar.
7. Menarik kesimpulan dari hasil analisis yang
diperoleh.
HASIL DAN PEMBAHASAN
Deskripsi Data
Kota Bogor dibagi menjadi
enam
kecamatan yaitu kecamatan Bogor Barat,
Bogor Selatan, Bogor Tengah, Bogor Timur,
Bogor Utara, dan Tanah Sareal dengan
masing-masing jumlah desa/kelurahan 16, 16,
11, 6, 8, dan 11. Persentase rata-rata jumlah
penderita DBD di Kota Bogor adalah sebesar
1.47 %.
Desa/Kelurahan
Bantarjati
Tegal Gundil
Baranangsiang
Kedung Badak
Kebon Pedes
Babakan
Tanahbaru
Sindang Barang
Kedung Waringin
Semplak

91
71
63
49
49
48
38
37
37
34

Jumlah Penderita DBD
Gambar 1

Sepuluh desa/kelurahan dengan
jumlah penderita DBD tertinggi.

6

Berdasarkan Gambar 1 terlihat bahwa
sepuluh desa/kelurahan dengan jumlah
penderita DBD paling banyak. Desa/kelurahan
dengan jumlah penderita DBD tertinggi
tersebar di desa/kelurahan Bantarjati yaitu
sebanyak 91 jiwa dan tertinggi kedua tersebar
di desa/kelurahan Tegal Gundil sebanyak 71
jiwa dan diikuti oleh desa/kelurahan lainnya.
Penelitian ini menggunakan sembilan
faktor sebagai peubah penjelas yang
diperkirakan mempengaruhi jumlah penderita
DBD. Berdasarkan Lampiran 1 dapat dilihat
bahwa peubah respon memiliki korelasi yang
signifikan dengan dua peubah penjelas yaitu
jumlah penduduk dan jumlah curah hujan per
hari serta memiliki hubungan yang linear.
Selain itu, antar peubah penjelas terdapat
korelasi yang lemah karena nilai korelasi
semua peubah penjelasnya di bawah 0.5
(r|Z|)
5.67e-10**
< 2e-16**
0.168503
0.888312
5.32e-05**
0.124507
0.244547
0.000866**
0.079339
< 2e-16**

Deviace: 322.25; derajat bebas: 54; Rasio dispersi:
5.97. Huruf P menunjukkan parameter dan tanda
“**” menunjukkan peubah penjelas
yang
signifikan pada taraf nyata 5%.

Model regresi Poisson untuk semua
peubah penjelas dapat ditulis sebagai berikut :
ln (µ i)= β0 + β1X1 + β2X2 + β3X3 + β4X4 + β5X5
+ β6X6 + β7X7 + β8X8 + β9X9
µ i = exp(β0 + β1X1 + β2X2 + β3X3 + β4X4 + β5X5
+ β6X6 + β7X7 + β8X8 + β9X9)
µ i= exp(–4.26 + 0.0000647X1 + 0.000491X2
– 0.0000228X3 – 0.000358X4
– 0.0000899X5 – 0.00026X6 – 0.00115X7
+ 0.0157X8 + 0.00156X9)

Berdasarkan Tabel 1 terlihat bahwa dari
dari sembilan peubah penjelas hanya empat
peubah yang berpengaruh nyata terhadap
respon pada taraf nyata 5% yaitu jumlah
penduduk (X1), jumlah KK sejahtera I (X4),
jumlah KK di pemukiman kumuh (X7), dan
jumlah curah hujan per hari (X9).
Model tersebut menunjukkan bahwa
setiap penambahan satu orang di suatu
desa/kelurahan akan menyebabkan nilai
harapan jumlah penderita DBD meningkat
sebesar exp(0.0000647)=1.000064702 kali
dengan asumsi peubah lain dianggap tetap.
Artinya, setiap penambahan 10000 penduduk
akan meningkatkan nilai harapan jumlah
penderita DBD sebanyak
10000.64702
≈10001 orang dengan asumsi peubah lain
dianggap tetap. Setiap penambahan satu KK
sejahtera I akan menyebabkan nilai harapan
jumlah penderita DBD menurun sebesar
exp(-0.000358)=0.999642064 kali dengan
asumsi peubah lain dianggap tetap. Artinya,
setiap penambahan 10000 KK sejahtera I akan
menurunkan nilai harapan jumlah penderita
DBD sebanyak 9996.42064≈9997 orang
dengan asumsi peubah lain dianggap tetap.
Selanjutnya berlaku untuk peubah penjelas
lainnya yang signifikan terhadap peubah
respon.
Berdasarkan Tabel 1 menunjukkan bahwa
nilai rasio dispersi antara Deviance dan
derajat bebasnya sebesar 5.97. Nilai ini
berarti bahwa model regresi Poisson
mengalami overdisperssion. Sehingga hasil
yang diperoleh merupakan hasil semu.
Kondisi ini menyebabkan faktor-faktor yang
mempengaruhi jumlah penderita DBD tidak
dapat dipastikan berdasarkan model regresi
Poisson. Pendekatan model yang dilakukan
adalah menggunakan regresi Binomial Negatif
sebagai model alternatif untuk menghindari
masalah overdisperssion pada regresi Poisson.
Model Regresi Binomial Negatif
Hasil pendugaan parameter untuk model
regresi Binomial Negatif dapat dilihat pada
Tabel 2. Hasil ini diperoleh menggunakan
perangkat lunak R 2.14.0 dan algoritmanya
secara lengkap dapat dilihat pada Lampiran 4.
Berdasarkan Tabel 2 terlihat bahwa dari
sembilan peubah penjelas hanya dua peubah
yang berpengaruh nyata terhadap respon pada
taraf nyata 5%. Kedua peubah tersebut adalah
jumlah penduduk (X1) dan jumlah curah hujan
per hari (X9).

7

Tabel 2 Nilai dugaan parameter model regresi
Binomial Negatif
P
β0
β1
β2
β3
β4
β5
β6
β7
β8
β9

Nilai Dugaan
-3.9900000
0.0000698
0.0003920
-0.0003750
-0.0002550
-0.0001650
-0.0002060
-0.0009960
0.0033600
0.0015000

Galat Baku
1.5200000
0.0000137
0.0009510
0.0004170
0.0002160
0.0001690
0.0005990
0.0006680
0.0221000
0.0003740

Nilai Z
-2.622
5.091
0.412
-0.900
-1.179
-0.976
-0.344
-1.490
0.152
4.002

Pr(>|Z|)
0.00874 **
3.57e-07 **
0.68061
0.36801
0.23837
0.32930
0.73049
0.13630
0.87884
6.28e-05 **

Deviace : 70.539; AIC : 489.23; R2DEV,BN : 59.43%;
Theta : 4.018. Huruf P menunjukkan parameter dan
tanda “**” menunjukkan peubah penjelas yang
signifikan pada taraf nyata 5%.

Model regresi Binomial Negatif untuk
semua peubah penjelas dapat ditulis sebagai
berikut :

3

ln (µ i)= β0 + β1X1 + β2X2 + β3X3 + β4X4 + β5X5
+ β6X6 + β7X7 + β8X8 + β9X9

signifikan dengan yang tidak signifikan
berdasarkan nilai AIC yang kecil dan R2DEV,BN
yang besar. Hasil yang diperoleh dapat dilihat
pada Lampiran 2. Berdasarkan hasil yang
diperoleh, model dengan dua peubah penjelas
yang signifikan terhadap peubah penjelas
yaitu jumlah penduduk (X1) dan jumlah curah
hujan per hari (X9) yang terdapat pada Tabel 2
lebih baik digunakan daripada menggunakan
kombinasinya dikarenakan nilai AIC yang
kecil dan R2DEV,BN yang lebih besar. Selain itu,
model dengan dua peubah penjelas lebih
efektif dan efisien.
Plot antara sisaan dan nilai dugaan dari
model regresi Binomial Negatif pada Gambar
2 terlihat bahwa pola cenderung menyebar di
sekitar garis nol dan memiliki ragam tidak
homogen. Hal ini dapat dilihat dari sisaan
yang membentuk pola seperti segitiga.

1
0

residuals

-1

Model tersebut menunjukkan bahwa
setiap penambahan satu orang di suatu
desa/kelurahan akan menyebabkan nilai
harapan jumlah penderita DBD meningkat
sebesar
exp(0.0000698)=1.000064682 kali
dengan asumsi peubah lain dianggap tetap.
Artinya, setiap penambahan 10000 penduduk
akan meningkatkan nilai harapan jumlah
penderita DBD sebanyak
10000.64682
≈10001 orang dengan asumsi peubah lain
dianggap tetap. Setiap kenaikan curah hujan 1
mm/hari/Ha akan menyebabkan nilai harapan
jumlah penderita DBD meningkat sebesar
exp(0.0015)=1.00156335 kali dengan asumsi
peubah lain dianggap tetap. Artinya, setiap
kenaikan
10000
mm/hari/Ha
akan
meningkatkan nilai harapan jumlah penderita
DBD sebanyak 10015.6335≈10016 orang
dengan asumsi peubah lain dianggap tetap.
Sedangkan jika penambahan satu orang di
suatu desa/kelurahan dan jumlah curah hujan
meningkat 1 mm/hari/Ha secara bersamaan ke
dalam model regresi Binomial Negatif akan
menyebabkan nilai harapan jumlah penderita
DBD
meningkat
sebesar
exp(0.0000698+0.0015)=1.001571033
kali
dengan asumsi peubah lain dianggap tetap.
Pemilihan model regresi Binomial
Negatif
terbaik
dilakukan
dengan
mengkombinasikan peubah penjelas yang

-2

µ i= exp(–3.99 + 0.0000698X1 + 0.000392X2
– 0.000375X3 – 0.000255X4
– 0.000165X5 – 0.000206X6 – 0.000996X7
+ 0.00336X8 + 0.0015X9)

2

µ i = exp(β0 + β1X1 + β2X2 + β3X3 + β4X4 + β5X5
+ β6X6 + β7X7 + β8X8 + β9X9)

10

20

30

40

50

60

fitted.values

Gambar 2 Plot antara sisaan dan nilai dugaan
dari model regresi Binomial
Negatif.
Peningkatan jumlah penduduk akan
meningkatkan mobilitas penduduk, perubahan
kepadatan, dan distribusi penduduk. Selain
itu, faktor perubahan iklim khususnya
perubahan curah hujan akan berefek terhadap
ekosistem daratan dan lautan serta
berpengaruh terhadap kesehatan manusia
terutama terhadap perkembangbiakan vektor
penyakit seperti nyamuk Aedes Aegypti,
malaria, dan lain-lain.
Implikasi Overdisperssion pada Regresi
Poisson
Overdisperssion merupakan pelanggaran
asumsi yang terjadi pada regresi Poisson
dimana ragam lebih besar dari nilai
tengahnya.
Implikasi
dari
kejadian
overdisperssion pada regresi Poisson dalam
penelitian ini adalah :
1. Faktor-faktor yang mempengaruhi jumlah
penderita DBD tidak dapat dipastikan

8

berdasarkan model regresi Poisson karena
hasil yang diperoleh dari model regresi
Poisson merupakan hasil semu.
2. Model regresi Poisson yang terbentuk akan
menghasilkan penduga parameter yang
berbias.
3. Nilai penduga bagi galat baku yang lebih
kecil (underestimate) yang selanjutnya
dapat
mengakibatkan
kesalahan
(misleading)
pada
inferensia
bagi
parameternya. Hal ini dapat dilihat dari
galat baku yang dihasilkan oleh regresi
Poisson pada Tabel 1 lebih kecil
dibandingkan galat baku pada Tabel 2 dari
regresi Binomial Negatif. Sehingga
menyebabkan empat peubah penjelas yang
signifikan pada regresi Poisson ternyata
hanya dua peubah saja yang signifikan pada
regresi Binomial Negatif.
SIMPULAN DAN SARAN
Simpulan
Penggunaan model regresi Poisson pada
kasus DBD di Kota Bogor menunjukkan
adanya pelanggaran asumsi yaitu terjadinya
overdisperssion. Hal ini dilihat dari rasio
dispersinya yang lebih besar dari satu.
Berdasarkan model regresi Binomial Negatif
diketahui faktor-faktor yang mempengaruhi
jumlah penderita DBD Kota bogor adalah
faktor jumlah penduduk dan faktor jumlah
curah hujan per hari.
Saran
Penelitian
selanjutnya
disarankan
menggunakan pendekatan model regresi
lainnya sebagai model alternatif untuk
menghindari masalah overdisperssion pada
regresi Poisson diantaranya regresi QuassiLikelihood, regresi Generalized Poisson,
regresi Zero Inflated Poisson (ZIP), regresi
Quassi-Poisson, dan lain sebagainya serta
melakukan survei secara langsung ke desadesa yang terkena DBD.
DAFTAR PUSTAKA
Agresti A. 2002.Categorical Data Analysis.
John Wiley & Son, Inc.
Cameron AC, Trivedi PK. 1998. Regression
Analysis of Count Data. New York:
Cambridge University.
Cameron AC, Windmeijer FAG. 1995. Rsquared Measures for Count Data
Regression Model with Apllications to
Health Care Utilization. Journal Of
Business And Economics Statistics
(1995).

Fleiss JL, Levin B, Paik MC. 2003. Statistical
Methods for Rates and Proportion. Ed
ke-3. USA: colombia university.
Heinzl H, Mittlbӧck M. 2003. PseudoRsquared Measures for Poisson Regression
Models with Over- or Underdispersion.
Computational & Data Analysis 44
(2003). 253-271.
Jackman S. 2007. Models for Counts Political
Science.
http://jackman.stanford.edu/classes/350C/
Poisson.pdf [15 November 2011]
Kleinbaum DG, Kupper LL, Muller KE. 1988.
Apllied Regression Analysis and Other
Multivariable Methods. Boston: PWSKENT Publishing Company.
Kristina, Isminah, Wulandari L. 2004. Kajian
Masalah Kesehatan. [terhubung berkala].
http://www.litbang.depkes.go.id/maskes/0
52004/demamberdarah1 [30
Januari
2012].
Lee J, Wong DWS. 2001. Statistic for Spatial
Data. New York: John Wiley & Sons,
Inc.
Long JS. 1997. Regression Models for
Categorical and Limited Dependent
Variables. Number 7 in Advance
Quantitive Techniques in The Social
Sciences. Sage Publications. Thousand
Oaks, California.
McCullagh P, Nelder JA. 1989. Generalized
Linear Models. London:Chapman & Hall.
Rohimah Siti R. 2011. Model Spasial
Otoregresif Poisson Untuk Mendeteksi
Faktor-Faktor
Yang
Berpengaruh
Terhadap Jumlah Penderita Gizi Buruk
Di Provinsi Jawa Timur [tesis]. Bogor:
Program Pascasarjana, Institut Pertanian
Bogor.
Tobing Theresia MDNL. 2011. Pemodelan
Kasus Demam Berdarah (DBD) Di Jawa
Timur Dengan Model Poisson Dan
Binomial Negatif [tesis]. Bogor: Program
Pascasarjana, Institut Pertanian Bogor.
Walpole R.E. 1974. Introduction To Statistics.
Ed ke-2. New York: MacMillan
Publishing Co., Inc.

LAMPIRAN

10

Lampiran 1 Nilai korelasi antar peubah
Y
X1
X2
X3
X4
X5
X6
X1
0.649**
p-value
0.000
X2
-0.011
-0.057
p-value
0.932
0.653
X3
0.122
0.297** -0.214
p-value
0.338
0.017
0.089
X4
-0.038
0.291** 0.031
0.165
p-value
0.764
0.020
0.806
0.192
X5
0.081
0.258** -0.091
0.051
0.278**
p-value
0.523
0.040
0.477
0.690
0.026
X6
0.071
0.089
0.072
0.177
0.222
-0.088
p-value
0.575
0.485
0.573
0.161
0.078
0.489
X7
-0.125
-0.074
-0.022
-0.048 -0.013
-0.058 0.060
p-value
0.325
0.560
0.863
0.708
0.921
0.650
0.639
X8
0.190
0.336** -0.326** 0.177
0.112
0.082
-0.059
p-value
0.132
0.007
0.008
0.161
0.376
0.517
0.644
X9
0.415** 0.238
0.036
-0.022 0.000
0.138
0.256**
p-value
0.001
0.058
0.777
0.861
0.998
0.278
0.041
Tanda “**” menunjukkan peubah yang saling berkorelasi dan signifikan pada taraf 5%.

Lampiran 2

X7

X8

-0.145
0.254
0.213
0.091

-0.138
0.277

Nilai AIC dan R2DEV,NB dari model regresi Binomial Negatif dengan berbagai
kombinasi peubah penjelas

Jumlah Peubah Penjelas

3 Peubah

4 Peubah

5 Peubah

6 Peubah

Kombinasi Peubah

AIC

R2DEV,NB (%)

X 1, X 9, X 2

483.56

52.24

X 1, X 9, X 3

482.82

53.49

X 1, X 9, X 4

481.35

55.45

X 1, X 9, X 5

482.47

53.46

X 1, X 9, X 6

483.67

52.09

X 1, X 9, X 7

481.78

53.89

X 1, X 9, X 8

483.84

51.96

X1, X9, X4, X2

482.89

55.81

X1, X9, X4, X3

482.53

56.37

X1, X9, X4, X5

482.69

56.31

X1, X9, X4, X6

483.29

55.37

X1, X9, X4, X7

481.35

57.33

X1, X9, X4, X8

483.35

55.44

X1, X9, X4, X7, X2

482.98

57.59

X1, X9, X4, X7, X3

482.53

58.23

X1, X9, X4, X7, X5

482.56

58.38

X1, X9, X4, X7, X6

483.28

57.25

X1, X9, X4, X7, X8

483.35

57.33

X1, X9, X4, X7, X3, X2

484.34

58.35

X1, X9, X4, X7, X3, X5

483.5

59.48

X1, X9, X4, X7, X3, X6

484.51

58.17

X 1, X 9 X 4, X 7, X 3, X 8

484.53

58.23

11

Lampiran 2 (lanjutan)
Jumlah Peubah
7 Peubah

8 Peubah
9 Peubah

Kombinasi Peubah
X1, X9, X4, X7, X3, X5, X2
X1, X9, X4, X7, X3, X5, X6
X1, X9, X4, X7, X3, X5, X8
X1, X9, X4, X7, X3, X5, X2, X6
X1, X9, X4, X7, X3, X5, X2, X8
X1, X9, X4, X7, X3, X5, X2, X6, X8

AIC
485.37
485.39
485.5
487.25
487.34
489.23

R2DEV,NB (%)
59.54
59.39
59.48
59.45
59.51
59.45

Lampiran 3 Algoritma untuk pendugaan parameter regresi Poisson menggunakan R 2.14.0
poisson