TUGAS AKHIR – SS 145561 FAKTOR-FAKTOR YANG MEMPENGARUHI JUMLAH PENDERITA TUBERKULOSIS DI KABUPATEN PROBOLINGGO TAHUN 2014 MENGGUNAKAN PENDEKATAN GENERALIZED
TUGAS AKHIR – SS 145561 FAKTOR-FAKTOR YANG MEMPENGARUHI JUMLAH PENDERITA TUBERKULOSIS DI KABUPATEN PROBOLINGGO TAHUN 2014
MENGGUNAKAN PENDEKATAN GENERALIZED
IKE MEILANIA NRP 1313 030 091 Dosen Pembimbing Ir. Mut iah Salamah Chamid, M. Kes PROGRAM STUDI DIPLOMA III JURUSAN STATISTIKA
Fakult as Mat emat ika dan Ilmu Penget ahuan Alam
Inst it ut Teknologi Sepuluh Nopember Surabaya 2016TUGAS AKHIR – SS 145561 FAKTOR-FAKTOR YANG MEMPENGARUHI JUMLAH PENDERITA TUBERKULOSIS DI KABUPATEN PROBOLINGGO TAHUN 2014
MENGGUNAKAN PENDEKATAN GENERALIZED
POISSON REGRESSION(GPR)
IKE MEILANIA NRP 1313 030 091 Dosen Pembimbing Ir. Mutiah Salamah Chamid, M.Kes PROGRAM STUDI DIPLOMA III JURUSAN STATISTIKA Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Teknologi Sepuluh Nopember Surabaya 2016
FINAL PROJECT – SS 145561 THE NUMBER OF TUBERCULOSIS CASES
FACTORS IN PROBOLINGGO DISTRICT IN 2014
USING GENERALIZED POISSON REGRESSION (GPR) METHODIKE MEILANIA NRP 1313 030 091 Supervisor Ir. Mutiah Salamah Chamid, M.Kes DIPLOMA III STUDY PROGRAM DEPARTMENT OF STATISTICS Faculty of Mathematics and Natural Science Institut Teknologi Sepuluh Nopember Surabaya 2016
FAKTOR-FAKTOR YANG MEMPENGARUHI JUMLAH
PENDERITA TUBERKULOSIS DI KABUPATEN
PROBOLINGGO TAHUN 2014 MENGGUNAKAN
PENDEKATAN GENERALIZED POISSON REGRESSION
(GPR)
Nama Mahasiswa : Ike Meilania NRP : 1313 030 091 Program Studi : Diploma III Jurusan : Statistika FMIPA ITS Dosen Pembimbing : Ir. Mutiah Salamah Chamid, M.Kes
Abstrak
Tuberkolusis (TB) adalah suatu penyakit menular yangdisebabkan bakteri Mycobacterium Tuberkulosis yang dapat
menyerang organ tubuh, terutama paru-paru. Jumlah penderita
tuberkulosis di Kabupaten Probolinggo tahun 2014 sebesar
1.278 penderita. Oleh karena itu, perlu diketahui faktor-faktor
yang mempengaruhi penyakit tuberkulosis. Data jumlah
penderita tuberkulosis merupakan data count yang mempunyai
varians lebih besar dibandingkan dengan rata-ratanya
(overdispersi). Untuk menangani masalah overdispersi dapat
dilakukan pemodelan dengan Generalized Poisson Regression
(GPR). Berdasarkan analisis yang telah dilakukan, diketahui
penderita tuberkulosis paling banyak terdapat di Kecamatan
Kraksaan dan yang paling rendah terdapat di Kecamatan
Sumber. Faktor-faktor yang mempengaruhi jumlah penderita
tuberkulosis di Kabupaten Probolinggo adalah persentase rumah
tangga ber-PHBS (X ), persentase penduduk yang memiliki akses
1 sanitasi layak (X 2 ), persentase rumah sehat (X 3 ), persentase penduduk miskin (X 6 ), dan kepadatan penduduk (X 7 ).
Kata Kunci : AIC, Generalized Poisson Regression, Tuberkulosis
vii viii
Halaman ini sengaja dikosongkan
THE NUMBER OF TUBERCULOSIS CASES FACTORS IN
PROBOLINGGO DISTRICT IN 2014 USING
GENERALIZED POISSON REGRESSION (GPR)
METHOD
Student Name : Ike Meilania NRP : 1313 030 091 Programe : Diploma III Department : Statistics FMIPA ITS Academic Supervisor : Ir. Mutiah Salamah Chamid, M.Kes
Abstract
Tubercolusis (TB) is an infectious disease caused by
mycobacterium tuberculosis which can strike organ, especially
the lungs. The number of tuberculosis cases in Probolinggo
District in 2014 reach 1.278 patients. Therefore, it is important to
know the factors that affect tuberculosis. The number of
tuberculosis patients data is having greater variances than ist
average (overdispersi). Overdispersi can be handled by
modelling the data using Generalized Poisson Regression (GPR)
method. Analysis result conclude that tuberculosis patients are
mostly found in Subdistrict Kraksaan and hardly found in
Subdistrict Sumber. The factors that affecting the number of
tuberculosis patients in Probolinggo are the the percentage of
clean and healthy households behaviour living (X 1 ), thepercentage of proper sanitation access (X ), the percentage of
2 healthy house (X 3 ), percentage of poor people (X 6 ), and population density (X 7 ).Keyword: AIC, Generalized Poisson Regression, Tuberculosis
Halaman ini sengaja dikosongkan
KATA PENGANTAR
Puji syukur kehadirat Allah SWT, yang telah me- limpahkan rahmat dan hidayah-Nya, sehingga penulis dapat menyelesaikan laporan Tugas Akhir yang berjudul
“FAKTOR-
FAKTOR YANG MEMPENGARUHI JUMLAH
PENDERITA TUBERKULOSIS DI KABUPATEN
PROBOLINGGO TAHUN 2014 MENGGUNAKAN
PENDEKATAN GENERALIZED POISSON REGRESSION
(GPR)”. Dalam penyusunan laporan ini, penulis banyak men-
dapat pengarahan, bimbingan dan saran yang bermanfaat dari berbagai pihak. Maka dari itu penulis dalam kesempatan ini mengucapkan banyak terima kasih kepada :
1. Ibu Ir. Mutiah Salamah, M.Kes selaku dosen pembimbing yang mendukung dan memberikan masukan serta bimbingan selama penyusunan laporan Tugas Akhir ini.
2. Bapak Dr. Bambang Widjanarko Otok, M.Si dan Ibu Dra.
Destri Susilaningrum M.Si selaku dosen penguji yang telah memberikan banyak masukan dan bantuan dalam penyelesian Tugas Akhir ini.
3. Bapak Dr. Suhartono selaku Ketua Jurusan Statistika Institut Teknologi Sepuluh Nopember Surabaya.
4. Bapak Dr. Wahyu Wibowo S.Si, M.Si selaku Ketua Program Studi Diploma III Jurusan Statistika Institut Teknologi Sepuluh Nopember Surabaya.
5. Ibu Dr. Santi Puteri Rahayu, S.Si, M.Si selaku dosen wali yang selama perkuliahan sangat membantu penulis.
6. Ibu Dra. Sri Mumpuni Retnaningsih, MT selaku Ketua Program Studi Diploma III Jurusan Statistika Institut Teknologi Sepuluh Nopember Surabaya Tahun 2015/2016.
7. Dinas Kesehatan Kabupaten Probolinggo yang telah membantu penulis sebagai sumber data dalam Tugas Akhir ini.
8. Seluruh Ibu-Bapak dosen Jurusan Statistika atas segala ilmu yang diberikan dan kesabaran yang dilimpahkan.
Serta seluruh staf dan karyawan Jurusan Statistika atas kerja keras dan bantuannya selama ini.
9. Orang tua yang mendukung baik secara moril maupun finansial. Terima kasih banyak atas motivasi dan semangatnya selama ini.
10. Kakak dan adik-adik ku tercinta yang selalu memberikan semangat dan motivasi.
11. Kepada teman-teman Angkatan 2013 Jurusan Statistika
ITS khususnya prodi Diploma III yang telah memberikan dukungannya kepada penulis.
12. Pihak-pihak yang sudah banyak membantu dalam proses pengerjaan laporan Tugas Akhir ini, yang tidak dapat disebutkan satu persatu. Penulis menyadari bahwa laporan ini masih jauh dari sempurna, maka dengan segala kerendahan hati kepada semua pihak untuk memberikan kritik dan saran demi adanya perbaikan atas isi dari laporan ini ke depannya. Besar harapan penulis agar informasi sekecil apapun dalam Tugas Akhir ini akan dapat menambah wawasan pengetahuan dan bermanfaat bagi semua pihak.
Surabaya, Juni 2016 Penulis
DAFTAR ISI
HALAMAN JUDUL................................................................ iPAGE TITLE .......................................................................... iii
LEMBAR PENGESAHAN ..................................................... v
ABSTRAK ................................................................................ vii
ABSTRACT ............................................................................. ix
KATA PENGANTAR ............................................................. xi
DAFTAR ISI ............................................................................ xiii
DAFTAR GAMBAR .............................................................. xv
DAFTAR TABEL .................................................................. ..xvii
DAFTAR LAMPIRAN ........................................................... xix
BAB I PENDAHULUAN2.3.3 Overdispersi pada Regresi Poisson ..................... 12
3.3 Langkah Analisis .......................................................... 20
3.2 Variabel Penelitian ....................................................... 19
3.1 Sumber Data ................................................................. 19
BAB III METODOLOGI PENELITIAN
2.5 Tuberkulosis ................................................................. 14
2.4.3 AIC ...................................................................... 14
2.4.2 Pengujian Parameter GPR ................................... 13
2.4.1 Penaksiran Parameter GPR ................................. 13
2.4 Generalized Poisson Regression (GPR) ....................... 12
2.3.2 Pengujian Parameter Model Regresi Poisson ...... 11
1.1 Latar Belakang .............................................................. 1
2.3.1 Penaksiran Parameter Model Regresi Poisson .... 9
2.3 Regresi Poisson ............................................................ 7
2.2 Multikolinieritas ........................................................... 6
2.1 Statistika Deskriptif ...................................................... 5
BAB II TINJAUAN PUSTAKA
1.5 Batasan Masalah ........................................................... 4
1.4 Manfaat ......................................................................... 4
1.3 Tujuan Penelitian .......................................................... 4
1.2 Rumusan Masalah ........................................................ 3
3.4 Diagram Alir ................................................................. 21
BAB IV ANALISIS DAN PEMBAHASAN
4.1 Karakteristik Penderita Tuberkulosis di Kabupaten Probolinggo Tahun 2014 .............................................. 23
4.2 Pemodelan Jumlah Penderita Tuberkulosis di Kabupaten Probolinggo ................................................ 32
4.2.1 Pemeriksaan Multikolinieritas ............................. 32
4.2.2 Pemodelan Jumlah Penderita Tuberkulosis di Kabupaten Probolinggo Menggunakan Analisis Regresi Poisson .................................................. 33
4.2.3 Pemodelan Jumlah Penderita Tuberkulosis di Kabupaten Probolinggo Menggunakan Analisis
Generalized Poisson Regression (GPR) ............ 35
BAB V KESIMPULAN DAN SARAN
5.1 Kesimpulan ................................................................... 39
5.2 Saran ............................................................................. 39
DAFTAR PUSTAKA .............................................................. 41
LAMPIRAN ............................................................................. 45
DAFTAR GAMBAR
Gambar 3.1 Diagram Alir ....................................................... 21Gambar 4.1 Jumlah Penderita Tuberkulosis di KabupatenProbolinggo ........................................................ 25
Gambar 4.2 Persebaran Jumlah Penderita Tuberkulosis diKabupaten Probolinggo ...................................... 26
Gambar 4.3 Persebaran Persentase Penduduk Ber-PHBS ...... 27Gambar 4.4 Persebaran Persentase Keluarga denganKepemilikan Sarana Sanitasi Layak .................. 27
Gambar 4.5 Persebaran Persentase Rumah Sehat ................... 28Gambar 4.6 Persebaran Persentase Penderita HIV ................. 29Gambar 4.7 Persebaran Persentase Tenaga Medis ................. 30Gambar 4.8 Persebaran Persentase Penduduk Miskin ............ 31Gambar 4.9 Persebaran Kepadatan Penduduk ........................ 32
Halaman ini sengaja dikosongkan
DAFTAR TABEL
Tabel 3.1 Variabel Penelitian .................................................. 19Tabel 4.1 Karakteristik Penderita Tuberkulosis ...................... 23Tabel 4.2 Nilai VIF dari Variabel Prediktor ............................ 33Tabel 4.3 Estimasi Parameter Model Regresi Poisson ............ 33Tabel 4.4 Nilai Deviance danPersons’s Chi-Square Model
Regresi Poisson ....................................................... 35
Tabel 4.5 Model GPR dari Kombinasi Variabel Prediktor ...... 36Tabel 4.6 Estimasi Parameter Model GPR .............................. 36
Halaman ini sengaja dikosongkan
DAFTAR LAMPIRAN
Lampiran 1. Data Jumlah Penderita Tuberkulosis danFaktor-Faktor yang Mempengaruhinya .............. 45
Lampiran 2. Statistika Deskriptif ........................................... 46
Lampiran 3. Korelasi Antar Variabel Prediktor ..................... 47
Lampiran 4. Nilai VIF dari Tujuh Variabel Prediktor ............ 48
Lampiran 5. Macro SAS Regresi Poisson .............................. 49
Lampiran 6. Output SAS Regresi Poisson .............................. 50
Lampiran 7. Macro SAS Mendapatkan Nilai Devians danPearson Chi-Square Regresi Poisson ............. 51 Lampiran 8. Output SAS Nilai Devians dan Pearson Chi-
Square Regresi Poisson ................................... 52 Lampiran 9. Macro SAS untuk GPR (Y dengan X 7 ) ............ 53
Lampiran 10. Output SAS untuk GPR (Y dengan X ) ......... 54
7 Lampiran 11. Macro SAS untuk GPR (Y dengan X 1 X ) ....... 55 7 Lampiran 12. Output SAS untuk GPR (Y dengan X 1 X 7 ) ...... 56Lampiran 13. Macro SAS untuk GPR (Y dengan X 1 X 3 X ) .. 57 7 Lampiran 14. Output SAS untuk GPR (Y dengan X 1 X 3 X 7 ) . 58 Lampiran 15. Macro SAS untuk GPR (Y dengan X 1 X 2 X 3 X 7 )
............................................................................ 59
Lampiran 16. Output SAS untuk GPR (Y dengan X 1 X 2 X 3 X 7 )
............................................................................ 60
Lampiran 17. Macro SAS untuk GPR (Y dengan X 1 X 2 X 3 X 6 X 7 ) .................................................................... 61 Lampiran 18. Output SAS untuk GPR (Y dengan X 1 X 2 X 3 X 6 X ) .................................................................... 62 7 Lampiran 19. Macro SAS untuk GPR (Y dengan X 1 X 2 X 3 X 4 X 6 X 7 ) ................................................................... 63
Lampiran 20. Output SAS untuk GPR (Y dengan X 1 X 2 X 3 X 4 X 6 X 7 ) .............................................................. 64 Lampiran 21. Macro SAS untuk GPR (Y dengan X 1 X 2 X 3 X 4 X 5 X 6 X ) ......................................................... 65 7 Lampiran 22. Output SAS untuk GPR (Y dengan X 1 X 2 X 3 X 4 X 5 X 6 X 7 ) ........................................................... 66
Halaman ini sengaja dikosongkan
BAB I PENDAHULUAN
1.1 Latar Belakang
Tuberkolusis (TB) adalah suatu penyakit menular yang disebabkan bakteri Mycobacterium Tuberculosis yang dapat menyerang organ, terutama paru-paru. Penyakit TB bila tidak diobati atau pengobatannya tidak tuntas dapat menimbulkan komplikasi berbahaya hingga kematian (Pusdatin, 2015). Penularan utama TB adalah melalui percik renik dahak yang mengandung kuman TB (Mycobacterium tuberculosis) saat pasien TB batuk, berbicara, menyanyi maupun bersin dan kemudian tersebar di udara. Kuman TB pada umumnya hanya ditularkan melalui udara, bukan melalui kontak permukaan (Kemenkes RI, 2014).
Beberapa penelitian sebelumnya mengenai faktor yang mempengaruhi kasus tuberkulosis, diantaranya oleh Suharyo (2013) tentang determinasi penyakit tuberkulosis di daerah pedesaan menunjukkan bahwa faktor-faktor yang berpengaruh terhadap penderita tuberkulosis adalah pendidikan, usia, sosial ekonomi dan tempat tinggal. Pada penelitian Rida (2014) mengenai pemodelan faktor-faktor yang mempengaruhi jumlah kasus penyakit tuberkulosis di Jawa Timur dengan pendekatan
generalized poisson regression dan geographically weighted
poisson regression. Didapatkan hasil bahwa terjadi kasus over
dispersi , sehingga untuk mengatasinya digunakan metode GPR.
Pemodelan menggunakan GPR diperoleh hasil bahwa variabel persentase penduduk usia produktif dan persentase tempat umum dan pengelolaan makanan (TUPM) sehat berpengaruh signifikan terhadap jumlah kasus penyakit tuberkulosis di Jawa Timur. Sementara pemodelan menggunakan GWPR, diperoleh tujuh kelompok wilayah berdasarkan variabel yang berpengaruh signifikan sama. Variabel yang berpengaruh signifikan adalah variabel persentase penduduk usia produktif, persentase tenaga kesehatan terdidik tuberkulosis, dan persentase TUPM sehat.
Provinsi Jawa Timur adalah salah satu provinsi dengan jumlah kasus TB yang besar. Pada tahun 2011 jumlah kasus TB BTA positif sebanyak 21.477 kasus (Dinkes Jatim, 2012). Bakteri tahan asam (BTA) adalah Mycobacterium tuberculosis yang merupakan bakteri berbentuk batang lurus agak bengkok, tidak membentuk spora dan termasuk bakteri aerob yang mempunyai sifat khusus yaitu tahan terhadap asam pada proses pewarnaan (asam sulfat dan asam sitrat 3%). Sedangkan pada tahun 2012, jumlah kasus TB BTA positif sebanyak 25.618 kasus (Dinkes Jatim, 2013). Hal ini terlihat bahwa kasus TB di Jawa Timur dari tahun 2011 ke 2012 meningkat. Jawa timur memiliki 38 Kabupaten/Kota dengan 5 Kabupaten/Kota sebagai daerah bermasalah kesehatan adalah Probolinggo, Bangkalan, Pamekasan, Sumenep, Sampang dan Kota Probolinggo. Kabupaten Probolinggo menempati peringkat pertama sebagai daerah bermasalah kesehatan (Pusdatin,2014). Salah satu penyakit yang banyak diderita warga Kabupaten Probolinggo adalah tuberkulosis (Dinkes Probolinggo, 2013). Berdasarkan data yang didapat dari Dinas Kesehatan Probolinggo, sepanjang tahun 2014, tercatat ada 1.328 kasus tuberkulosis. Angka meningkat dibanding tahun 2013 yang mencatat 1.273 kasus dalam setahun (Shierly, 2015). Terdapat 24 kecamatan yang ada di Probolinggo, di setiap kecamatan ditemukan warga yang menderita penyakit tuberkulosis. Pada tahun 2014 kecamatan yang paling banyak penderita tuberkulosis adalah kecamatan Banyuanyar dengan jumlah penduduk miskin sebanyak 30.591 (BPS Probolinggo, 2015).
Faktor utama yang meningkatkan jumlah kasus tuberkulosis di Kabupaten Probolinggo adalah pola hidup yang tidak sehat seperti menyepelekan kebersihan rumah. Jika rumah dalam keadaan tidak bersih maka menyebabkan penumpukan debu, sehingga akan dijadikan sebagai media yang baik bagi berkembangbiaknya kuman Mycobacterium tuberculosis. Faktor lain yang mempengaruhi tuberkulosis adalah rendahnya pengetahuan pasien dan keluarga tentang penyakit tuberkulosis. Berdasarkan suatu studi yang dilakukan di Puskesmas Sukawati I, terjadi peningkatan kasus tuberkulosis yang cukup tinggi pada tahun 2011 sebanyak 10 orang, meningkat 24 orang pada tahun 2012 dan meningkat lagi 34 orang pada tahun 2013. Peningkatan ini terkait dengan tindakan pencegahan penularan termasuk minum obat secara teratur. Dari 10 orang responden, didapatkan 40% disebabkan faktor pengetahuan dan sikap seperti belum dapat mengungkapkan masalah kesehatannya dan melakukan penularan dengan benar. 30% disebabkan oleh faktor pendukung (lingkungan fisik, prasarana dan transportasi). Serta 30% disebabkan oleh faktor pendorong (sikap dan perilaku petugas kesehatan) seperti masih banyaknya pasien yang tergantung pada petugas kesehatan (Depkes RI, 2008).
Jumlah penderita tuberkulosis merupakan data count yang mengikuti distribusi poisson sehingga untuk mengetahui faktor- faktor yang mempengaruhinya dilakukan pemodelan jumlah penderita penyakit tuberkulosis menggunakan analisis regresi poisson. Dalam analisis regresi poisson asumsi mean sama dengan varians (equisdispersion). Akan tetapi dalam banyak kasus, asumsi tersebut jarang ditemui, sehingga untuk menangani overdispersi dilakukan pemodelan dengan pendekatan
Generalized Poisson Regression (GPR). Berdasarkan
meningkatnya penderita tuberkulosis di Kabupaten Probolinggo, maka dalam penelitian ini dilakukan analisis Generalized Poisson
Regression (GPR) yang digunakan untuk mengetahui faktor-
faktor yang mempengaruhi jumlah penderita penyakit tuberkulosis di Kabupaten Probolinggo tahun 2014.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah dipaparkan, permasalahan yang akan dibahas dalam penelitian ini adalah karakteristik Kabupaten Probolinggo jika ditinjau dari penderita tuberkulosis dan faktor apa saja yang berpengaruh terhadap jumlah penderita tuberkulosis di Kabupaten Probolinggo tahun
2014 menggunakan pendekatan Generalized Poisson Regression (GPR).
1.3 Tujuan Penelitian
Berdasarkan rumusan masalah yang dibuat, tujuan yang ingin dicapai dalam penelitian ini adalah mengetahui karakteristik Kabupaten Probolinggo jika ditinjau dari penderita tuberkulosis dan faktor yang berpengaruh terhadap jumlah penderita tuberkulosis di Kabupaten Probolinggo tahun 2014 menggunakan pendekatan Generalized Poisson Regression (GPR).
1.4 Manfaat
Manfaat dari penelitian ini adalah memberikan informasi kepada Dinas Kesehatan Kabupaten Probolinggo mengenai karakteristik Kabupaten Probolinggo jika ditinjau dari penderita tuberkulosis serta faktor yang berpengaruh terhadap jumlah penderita tuberkulosis di Kabupaten Probolinggo tahun 2014.
1.5 Batasan Masalah
Batasan masalah yang digunakan dalam penelitian ini adalah jumlah kasus tuberkulosis di Kabupaten Probolinggo tahun 2014 dengan unit penelitian 24 kecamatan.
BAB II TINJAUAN PUSTAKA
2.1 Statistika Deskriptif
Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data (Walpole, 1995). Statistika deskriptif yang digunakan dalam peneli tian ini adalah rata-rata ,varians, maksimum dan minimum.
Mean atau rata-rata adalah jumlah nilai pada data dibagi
dengan banyaknya data tersebut. Ukuran ini mudah dihitung dengan memanfaatkan semua data yang dimiliki. Jika ada sekelompok data maka untuk menyebut ukuran numerik sebagai wakil dari data sering dipakai rata-rata hitung (Walpole, 1995). Rumus yang digunakan untuk menghitung mean data adalah sebagai berikut: n
X
i i 1(2.1)
X
n
keterangan: X i = data ke-i n = banyaknya data
Standar deviasi adalah simpangan sebuah pengamatan dari rata-ratanya. Nilai simpangan tersebut diperoleh dari akar penjumlahan selisih nilai pengamatan dengan nilai rata-rata yang dikuadratkan, dibagi dengan jumlah pengamatan dikurangi 1 (Walpole, 1995).
n
2 X
X
( )
i
i
1
(2.2)
S
n
1 keterangan:.
S = Standar Deviasi
X = Nilai Tengah i X = Rata-rata
n = Banyak data
Nilai maksimum adalah nilai yang menunjukkan angka ataupun data terbesar dari sekelompok data yang diamati sedangkan nilai minimum adalah nilai yang menunjukkan angka ataupun data terkecil dari sekelompok data yang diamati (Walpole, 1995).
Salah satu bentuk penyajian statistika deskriptif adalah menggunakan peta tematik. Peta tematik merupakan peta yang memberikan informasi mengenai tema tertentu, baik data kualitatif maupun data kuantitatif. Pembagian kelompok sebanyak n wilayah menjadi h kelompok sesuai tema menggunakan metode natural breaks. Metode natural breaks menghasilkan variasi minimum untuk wilayah yang berada pada satu kelompok tema. Berikut adalah algoritma dari metode
natural breaks (EHDP, 2014).
1. Bagi daerah menjadi sebanyak h kelompok dari n wilayah.
Banyak wilayah anggota setiap kelompok minimal 1 dan maksimal adalah n-(q-1).
2. Hitung rata-rata data setiap kelompok. Hasil rata-rata dilambangkan dengan x q q ,
1 ,... h
3.Hitung jumlahan standar deviasi kuadrat dari setiap kelompok kombinasi wilayah.
4. Pembagian kelompok dengan jumlahan standar deviasi kuadrat terkecil adalah pembagian wilayah yang optimum.
2.2 Multikolinieritas
Multikolinearitas adalah kondisi dimana terdapat hubungan linier atau korelasi yang tinggi antar masing-masing variabel prediktor dalam model regresi (Draper and Smith, 1992). Pendeteksian adanya kasus multikolinieritas dilakukan dengan menggunakan kriteria sebagai berikut.
1. Koefisien korelasi (r ) antar variabel prediktor. xy Apabila nilai koefisien korelasi antar variabel prediktor lebih besar dari 0,95 maka mengindikasikan adanya kasus multikolinieritas (Hocking, 1996).
n n n
n x y x y
i i i i
i 1 i 1 j 1 r 2 2 (2.3)
n n n n
2 2 n x x n y y
i i i i i 1 i
1 j
1 j 1
dengan r : koefisien korelasi n : jumlah data 2.
VIF (Variance Inflation Factor) Jika nilai VIF lebih besar dari 10, maka hal ini menunjukan bahwa terjadi multikolinieritas antar variabel prediktor. Nilai VIF dinyatakan sebagai berikut.
1 VIF j
2 1 , 2 ,..., p (2.4) 2 1 R j
R j merupakan nilai koefisien determinasi antara variabel respon dengan variabel prediktor (Hocking, 1996)
2.3 Regresi Poisson
Regresi Poisson merupakan model regresi non-linier yang digunakan untuk data count dimana variabel respon mengikuti distribusi Poisson (Agresti, 2002). Distribusi Poisson adalah distribusi probabilitas acak yang menyatakan banyaknya hasil percobaan yang terjadi selama suatu selang waktu tertentu atau daerah tertentu (Walpole, 1995). Fungsi peluang dari distribusi poisson dapat dinyatakan sebagai berikut.
y e f y , , y ,
1 , 2 ,... (2.5) y !
dengan µ merupakan rata rata variabel random y di mana nilai rata-rata dan varians dari y mempunyai nilai lebih dari nol.
Menurut Agresti (2002) yang menunjukkan bahwa regresi poisson merupakan GLM yang menyatakan bahwa dalam GLM terdapat 3 komponen yaitu komponen random, komponen sistematik, dan link function. Komponen random dari GLM terdiri
dari variabel respon Y dengan pengamatan y ..., y . Fungsi
1 , N peluang densitas dapat dinyatakan sebagai berikut. f y ; a b y exp y Q (2.6)
i i i i i i
Nilai parameter θ i bisa bervariasi, untuk i=1,….,N, tergantung dari nilai variabel prediktor.
Komponen sistematik yaitu vektor yang terdiri dari
,...., menghubungkan dengan variabel X atau variabel 1 N
prediktor. X menyatakan nilai dari variabel prediktor ke j ij (j=1,2,…p) untuk pengamatan ke i. p (2.7)
i j ij X , i 1 ,..., N j 1 Komponen yang ketiga yaitu link function yang
menghubungkan antara komponen random dan sistematik. Jika
E ( Y ), i 1,..., N . Model menghubungkan µ ke dengan i i i i
g . Dimana g menghubungkan E Y ke variabel prediktor
i i i melalui rumus sebagai berikut. p(2.8)
g x , i 1,..., N
i j ij
j 1 Link function yang digunakan dalam regresi poisson adalah
ln , sehingga ln( ) = . Model regresi poisson dapat dinyatakan
i i sebagai berikut. p ln x , i 1,.., N (2.9)
i j ij
j
1
dimana p
(2.10)
exp x i j ij
j 1
i n j p
dengan 1, 2, ..., , 1 , 2, ..., , dan adalah j parameter regresi.
2.3.1 Penaksiran Parameter Model Regresi Poisson
Penaksiran parameter regresi Poisson dilakukan dengan metode Maximum Likelihood Estimation (MLE) dengan taksiran maksimum likelihood dari model regresi Poisson. Langkah yang dilakukan untuk mendapatkan nilai taksiran adalah menurunkan T fungsi likelihood dari regresi Poisson dimana exp( x ) . i i β
Menurut Cameron & Trivedi (1998) fungsi likelihood untuk regresi Poisson Fungsi likelihoodnya adalah sebagai berikut. n y i
exp i i
L
β i 1 y ! i y T i (2.11)
T n β β
exp exp x exp x
i
i
L β
i 1 y ! i n
n T T
exp x exp y
exp x β β i i
i
i 1 i 1
L β n y i
i 1 Fungsi ln likelihood dari persamaan 2.11 dapat dinyatakan sebagai berikut. n n T T
y exp exp x exp x β
β i i
i i 1
i 1
L ln β ln n y i
i 1 n n n T T
(2.12)
ln L exp y ln y !
β x β x β
i i i i
1
1
1
i i i
Parameter model regresi Poisson yang ditaksir dengan
ˆ
MLE dinyatakan dengan , dapat diperoleh dengan mencari
k
turunan pertama fungsi ln likelihood dan dilanjutkan dengan T mencari turunan kedua terhadap β sebagai berikut. n n
ln L β T exp y (2.13) x x x T i i i i
β
β i 1 i 1 Persamaan 2.13 belum menghasilkan solusi yang tepat sehingga perlu diselesaikan menggunakan numerik yaitu dengan iterasi Newton-Raphson. Algoritma untuk optimalisasi metode Newton-Raphson adalah sebagai berikut.
1. yang
Menentukan nilai taksiran awal parameter ˆ β (0) biasanya diperoleh dengan metode Ordinary Least Square (OLS) sebagai berikut.
T T
1
ˆ
X X X y (2.14) β 2.
Membentuk vektor gradient g sebagai berikut.
T β β β
ln L ln L ln L g , , ..., (2.15) β m px 1
β β
1 β k 3.Membentuk matriks Hessian H. 2 2 2
ln L ln L ln L
β β β 2
β β 1 β β k β
2
2 ln L ln L β β
2 (2.16) H β
m β β k 1 x ( k 1 ) β 1 k 1
2 ln L
β 2
β k
4. ke dalam elemen-elemen vektor g Memasukkan nilai βˆ
dan matriks H, sehingga diperoleh vektor dan matriks
g ˆ β
ˆ H( )
β (0) .
1 ˆ ˆ m g m 5.
H
Melakukan iterasi pada persamaan β m 1 β m
mulai dari m=0, dengan nilai adalah kumpulan penaksir
βˆ
m
parameter yang konvergen pada iterasi ke-m.
6. Lanjutkan iterasi hingga m = m+1 dan akan berhenti pada keadaan konvergen yaitu pada saat ≤ ε, ε adalah ( m 1 ) ( m )
bilangan yang sangat kecil (Cameron dan trivedi, 1998).
2.3.2 Pengujian Parameter Model Regresi Poisson
Pengujian parameter model regresi Poisson dilakukan dengan menggunakan metode Maximum Likelihood Ratio Test (MLRT) dengan hipotesis yang digunakan sebagai berikut.
H : β 1 = β 2 = β 3 = ….= β P = 0 H 1 : minimal ada satu β j ≠0, j=1,2,…p
Nilai statistik uji ditentukan dari dua buah fungsi likelihood yang berhubungan dengan model regresi yang diperoleh. Fungsi likelihood tersebut adalah yaitu nilai maksimum likelihood
L ˆ
untuk model lengkap dengan melibatkan variabel independen dan
ˆ
L yaitu nilai maksimum likelihood untuk model sederhana
tanpa melibatkan variabel independen. Statistik uji dengan menghitung nilai Likelihood ratio dapat dinyatakan sebagai berikut.
ˆ
L
ˆ ˆ (2.17) ˆ
D 2 ln 2 ln 2 ln L L
β
ˆ
L
D merupakan devians dari model regresi Poisson yangβˆ
merupakan statistik uji likelihood ratio pendekatan dari distribusi 2
dengan derajat bebas k, sehingga didapatkan daerah kritis
2tolak H jika D > k . Jika keputusan yang didapat adalah
βˆ ( ; )
tolak H maka pengujian akan dilanjutkan dengan uji secara parsial dengan hipotesis sebagai berikut.
H : = 0 β j
H 1 : β j ≠ 0, j=1,2,…p statistik uji yang digunakan pada pengujian parsial ini adalah sebagai berikut.
ˆ
j
(2.18)
T
ˆ
se
j
Hipotesis nol akan ditolak dengan daerah kritis jika T T hit 2 (Cameron & Trivedi 1998).
2.3.3 Over dispersi pada Regresi Poisson
Kasus over dispersi adalah nilai varians data lebih besar daripada nilai mean sedangkan under dispersi artinya nilai varians data lebih kecil daripada nilai mean. Over dispersi terjadi karena adanya sumber keragaman yang tidak teramati. Over dispersi dapat pula terjadi karena adanya pengamatan yang hilang pada peubah penjelas, adanya pencilan pada data, perlunya interaksi dalam model, atau peubah penjelas perlu ditransformasi., Implikasi dari tidak terpenuhinya equi-dispersi adalah model regresi poisson kurang sesuai lagi untuk memodelkan data. Selain itu, model yang terbentuk dikhawatirkan akan menghasilkan estimasi yang mengandung bias yang selanjutnya dapat mengakibatkan terjadinya kesalahan (misleading) pada inferensia bagi parameternya.
Uji mengetahui kasus over dispersi atau tidak, dilakukan pengujian dengan hipotesis. H : θ = 0 H 1 : θ ≠ 0 atau H : Tidak terjadi kasus over dispersi H : Terjadi kasus over dispersi 1 Tolak H jika P value dari estimasi θ yang dihasilkan kurang dari α. Taksiran dispersi diukur dengan nilai devians atau
Person’s Chi-
Square yang dibagi dengan derajat bebas. Data over disperse jika
taksiran lebih besar dari 1 dan under disperse jika taksiran disperse kurang dari 1 (Cameron & Trivedi 1998).
2.4 Generalized Poisson Regression (GPR)
Model Generalized Poisson Regression merupakan suatu model yang sesuai untuk jenis data count, dimana pada analisis regresi poisson di temukan adanya ketidaksamaan antara nilai
mean dan varians dari variabel respon atau terjadi over/under
dispersi sehingga dilakukan analisis Generalized Poisson