Pemodelan terhadap Faktor-Faktor Yang Mempengaruhi Jumlah Penduduk Miskin Di Jawa Timur menggunakan Generalized Poisson Regression - ITS Repository

  TUGAS AKHIR – SS 145561

PEMODELAN TERHADAP FAKTOR-FAKTOR

YANG MEMPENGARUHI JUMLAH PENDUDUK

MISKIN DI JAWA TIMUR MENGGUNAKAN

  Vriesia Endira Marita NRP 1314 030 063 Dosen Pembimbing : Ir. Mutiah Salamah Chamid, M. Kes.

  Departemen Statistika Bisnis Fakultas Vokasi Institut Teknologi Sepuluh Nopember Surabaya 2017

  1

  TUGAS AKHIR – SS 145561

PEMODELAN TERHADAP FAKTOR-FAKTOR

YANG MEMPENGARUHI JUMLAH PENDUDUK

MISKIN DI JAWA TIMUR MENGGUNAKAN

  Vriesia Endira Marita NRP 1314 030 063 Dosen Pembimbing : Ir. Mutiah Salamah Chamid, M. Kes.

  Departemen Statistika Bisnis Fakultas Vokasi Institut Teknologi Sepuluh Nopember Surabaya 2017

  FINAL PROJECT – SS 145561

MODELLING OF FACTORS AFFECTING THE

POOR PEOPLE IN EAST IN EAST JAVA USING

GENERALIZED POISSON REGRESSION Vriesia Endira Marita NRP 1314 030 063 Supervisor : Ir. Mutiah Salamah Chamid, M. Kes.

  Department of Statistics Business Fakulty of Vocational Institut Teknologi Sepuluh Nopember Surabaya 2017

  

PEMODELAN TERHADAP FAKTOR-FAKTOR

YANG MEMPENGARUHI JUMLAH PENDUDUK

MISKIN DI JAWA TIMUR MENGGUNAKAN

GENERALIZED POISSON REGRESSION

  Nama Mahasiswa : Vriesia Endira Marita NRP : 1314 030 063 Program Studi : Diploma III Departemen : Statistika Bisnis FV ITS Dosen Pembimbing : Ir. Mutiah Salamah, M. Kes

ABSTRAK

  Penduduk yang memiliki rata-rata pengeluaran per kapita per bulan dibawah Garis Kemiskinan dikategorikan sebagai penduduk miskin. Jumlah penduduk miskin di Jawa Timur tahun 2015 memiliki angka yang cukup tinggi atau diatas rata-rata nasional, jumlah ini meningkat dari tahun 2014. Jumlah penduduk miskin tertinggi di Jawa Timur adalah 292.900 penduduk yang terjadi di Kabupaten Malang dan jumlah terendah terjadi di Kota Blitar dengan jumlah penduduk miskin sebesar 1.000 penduduk. Hal ini diduga karena terdapat faktor-faktor yang mempengaruhi jumlah penduduk miskin di Jawa Timur tahun 2015, sehingga perlu dilakukan pemodelan terhadap faktor-faktor yang mempengaruhi jumlah penduduk miskin di Jawa Timur menggunakan metode Generalized Poisson Regression. Hasil analisis menunjukkan bahwa Model dari Generalized Poisson

  

Regression dipilih menjadi model terbaik. Variabel yang

  berpengaruh signifikan dalam model adalah tingkat pengangguran terbuka, laju pertumbuhan penduduk, persentase penduduk usia 15 tahun ke atas yang bekerja di sektor formal, dan angka melek huruf penduduk usia 15-55 tahun.

  

Kata Kunci : Generalized Poisson Regression, Jumlah Penduduk

  Miskin, Overdispersion, Regresi Poisson

  

THE MODELING OF FACTORS AFFECTING THE

NUMBER OF POOR POPULATION IN EAST JAVA

USING GENERALIZED POISSON REGRESSION

Student Name : Vriesia Endira Marita NRP : 1314 030 063 Programe : Diploma III Department : Statistika Bisnis FV ITS Supervisor : Ir. Mutiah Salamah, M. Kes

  

ABSTRACT

Residents who have an average expenditure per capita per

month below the poverty line is categorized as poor. The number

of poor people in East Java in 2015 had a high rate or above the

national average, the number is increasing from year of 2014.

  

The highest number of poor people in East Java is 292.900

inhabitants that happened in Malang Region and the lowest

number of poverty occurred in the city of Blitar, 1.000

inhabitants. This is presumably because there are factors that

affect the number of poor people in East Java in 2015, so it is

necessary to do the modeling of the factors that affect the number

of poor people in East Java using the Generalized Poisson

Regression. The analysis showed that the model of Generalized

Poisson Regression was chosen to be the best model. The

variables were significant in the model is the open unemployment

rate, population growth rate, the percentage of population aged

15 years and over who work in the formal sector, and the literacy

rate of population aged 15-55 years.

  

Keywords : Generalized Poisson Regression, Poverty Number,

Overdispersion, Poisson regression

KATA PENGANTAR

  Puji syukur kehadirat Allah SWT yang senantiasa memberikan rahmat, hidayah, serta karunia-Nya sehingga penulis dapat menyelesaikan Tugas Akhir dengan judul “Pemodelan

  

Terhadap Faktor-Faktor yang Mempengaruhi Jumlah

Penduduk Miskin Di Jawa Timur

  ”. Dalam penyelesaian Tugas Akhir ini, penulis mendapat bantuan dan dukungan dari berbagai pihak, oleh sebab itu dengan hormat penulis ingin mengucapkan terima kasih kepada :

  1. Ir. Mutiah Salamah Chamid, M. Kes sebagai dosen pembimbing yang telah meluangkan waktunya untuk memberikan bimbingan, kritik, dan saran kepada penulis hingga selesainya Tugas Akhir ini.

  2. Dra. Destri Susilaningrum, M. Si sebagai validator serta dosen penguji dan Iis Dewi Ratih, S. Si., M. Si sebagai dosen penguji yang telah memberikan kritik dan saran demi kesempurnaan Tugas Akhir ini.

  3. Dr. Wahyu Wibowo, S. Si., M. Si sebagai kepala Departemen Statistika Bisnis yang telah memberikan fasilitas untuk penyelesaian Tugas Akhir ini.

  4. Ir. Sri Pingit Wulandari, M. Si sebagai dosen wali yang telah memberikan dukungan dan motivasi kepada penulis.

  5. Seluruh dosen dan karyawan Departemen Statistika Bisnis ITS atas kerja sama dan bantuannya selama ini.

  6. Badan Pusat Statistik Provinsi Jawa Timur atas izin dan ketersediaan data yang diperlukan dalam penyusunan Tugas Akhir ini.

  7. Orang tua, adik, dan keluarga besar karena telah memberikan segala doa dan kasih sayang selama ini.

  8. Mahasiswa Departemen Statistika Bisnis angkatan 2014 yang telah memberikan dukungan dan semangatnya.

  9. Fungsionaris HIMADATA-ITS kepengurusan 2015/2016 dan 2016/2017 yang telah memberikan bantuan dan dukungannya.

  10. Pihak-pihak lain yang sudah membantu dalam prosen penyusunan Tugas Akhir ini yang tidak dapat disebutkan satu persatu. Dalam penulisan ini, penulis menyadari banyak kekurangan dalam penyusunan Tugas Akhir ini, oleh karena itu sangat diharapkan kritik dan saran yang membangun. Penulis mengharapkan Tugas Akhir ini dapat memberikan manfaat bagi pembaca.

  Surabaya, Juli 2017 Penulis

  DAFTAR ISI

  2.1.1 Penaksiran Model Regresi Poisson ...................... 7

  3.2 Variabel Penelitian dan Definisi Operasional Variabel .................................................................... 19

  3.1 Sumber Data ............................................................ 19

  BAB III METODOLOGI PENELITIAN

  2.5 Kemiskinan .............................................................. 16

  2.4.3 Pemilihan Model Terbaik ..................................... 16

  Poisson (GP) ....................................................... 15

  2.4.2 Pengujian Parameter Model Regresi Generalized

  (GP) .................................. 13

  Generalized Poisson

  2.4.1 Penaksiran Parameter Model Regresi

  2.4 Model Regresi Generalized Poisson (GP) ............... 12

  2.3 Overdispersion ......................................................... 11

  2.1.2 Pengujian Parameter Model Regresi Poisson....... 9

  2.1 Regresi Poisson ........................................................ 5

  Halaman

  BAB II TINJAUAN PUSTAKA

  1.5 Batasan Masalah ...................................................... 4

  1.4 Manfaat .................................................................... 4

  1.3 Tujuan ...................................................................... 3

  1.2 Rumusan Masalah .................................................... 3

  1.1 Latar Belakang ......................................................... 1

  BAB I PENDAHULUAN

  

DAFTAR LAMPIRAN ......................................................... xv

  .................................................................. xiv

  

DAFTAR GAMBAR ............................................................. xiii

DAFTAR TABEL

  .......................................................................... xi

  

ABSTRACT ............................................................................ viii

KATA PENGANTAR ........................................................... ix DAFTAR ISI

  .............................................................................. vii

  HALAMAN JUDUL .............................................................. i LEMBAR PENGESAHAN ................................................... v ABSTRAK

  3.3 Metode Analisis dan Langkah Analisis ................... 21

  BAB IV ANALISIS DAN PEMBAHASAN

  4.2.2 Pendeteksian Multikolinieritas pada Kasus Jumlah Penduduk Miskin di Jawa Timur............ 35

  ............................................................ 45

  DAFTAR PUSTAKA

  5.2 Saran ........................................................................ 43

  5.1 Kesimpulan .............................................................. 43

  BAB V KESIMPULAN DAN SARAN

  4.4 Pemilihan Model Terbaik terhadap Kasus Jumlah Penduduk Miskin di Jawa Timur ............................. 41

  4.3 Pemodelan Generalized Poisson Regression pada Kasus Jumlah Penduduk Miskin di Jawa Timur ...... 39

  4.2.3 Pemodelan Regresi Poisson pada Kasus Jumlah Penduduk Miskin di Jawa Timur ........................ 36

  4.2.1 Uji Distribusi Poisson pada Data Jumlah Penduduk Miskin di Jawa Timur ........................ 35

  4.1 Karakteristik Data Kasus Jumlah Penduduk Miskin di Jawa Timur Tahun 2015 ...................................... 25

  4.2 Analisis Regresi Poisson pada Kasus Jumlah Penduduk Miskin di Jawa Timur ............................. 34

  4.1.7 Angka Harapan Hidup di Jawa Timur Tahun 2015 .................................................................... 33

  4.1.6 Angka Melek Huruf Penduduk Usia 15-55 Tahun di Jawa Timur Tahun 2015 ...................... 32

  4.1.5 Persentase Penduduk Usia 15 Tahun Ke Atas yang Bekerja di Sektor Formal di Jawa Timur Tahun 2015 ......................................................... 31

  4.1.4 Persentase Pengeluaran Per Kapita untuk Non Makanan di Jawa Timur Tahun 2015 ................. 30

  4.1.3 Laju Pertumbuhan Penduduk di Jawa Timur Tahun 2015 ......................................................... 29

  4.1.2 Tingkat Pengangguran Terbuka di Jawa Timur Tahun 2015 ......................................................... 28

  4.1.1 Jumlah Penduduk Miskin di Jawa Timur ............. 27

  LAMPIRAN BIODATA PENULIS

  

DAFTAR GAMBAR

  Halaman

Gambar 4.1 Persebaran Jumlah Penduduk Miskin ................ 27Gambar 4.1 Persebaran Tingkat Pengangguran Terbuka ..... 28 Gambar 4.2

  Persebaran Laju Pertumbuhan Penduduk ......... 29

Gambar 4.3 Persebaran Persentase Pengeluaran per Kapita

  untuk Non Makanan ......................................... 30

  Gambar 4.4

  Persebaran Persentase Penduduk Usia 15 Tahun ke Atas yang Bekerja di Sektor Formal 32

  Gambar 4.5

  Persebaran Angka Melek Huruf Penduduk Usia 15-55 Tahun ............................................. 33

Gambar 4.6 Persebaran Angka Harapan Hidup ................... 34

  

DAFTAR TABEL

  Halaman

Tabel 3.1 Variabel Penelitian ................................................ 19Tabel 4.1 Karakteristik Data Jumlah Penduduk Miskin ........ 25 Tabel 4.2

  Uji Kolmogorov Smirnov pada Jumlah Penduduk Miskin.................................................................... 35

Tabel 4.3 Koefisien Korelasi antar Variabel Prediktor ......... 36 Tabel 4.4

  Nilai VIF pada Variabel Prediktor .......................... 36

Tabel 4.5 Regresi Poisson....................................................... 37 Tabel 4.6

  Estimasi Parameter Regresi Poisson ....................... 38

Tabel 4.7 Generalized Poisson Regression ........................... 39Tabel 4.8 Estimasi Parameter Generalized Poisson Regression .............................................................

  40 Tabel 4.9 Pemilihan Model Terbaik ....................................... 42

  

DAFTAR LAMPIRAN

  X

  X

  Y dengan

  1 , X 2 , X 3 , X 4 , X 5 .......................................... 63 Lampiran 19 Generalized Poisson Regression

  X

  1 , X 2 , X 4 , X 5 ................................................. 62 Lampiran 18 Generalized Poisson Regression Y dengan

  X

  1 , X 2 , X 4 ....................................................... 61 Lampiran 17 Generalized Poisson Regression Y dengan

  X

  Y dengan

  1 , X 3 ............................................................. 60 Lampiran 16 Generalized Poisson Regression

  X

  1 ................................................................... 59 Lampiran 15 Generalized Poisson Regression Y dengan

  X

  5 , X 6 ............................................................. 58 Lampiran 14 Generalized Poisson Regression Y dengan

  1 , X 2 , X 3 , X 4 ,

  Halaman

  57 Lampiran 13 Regresi Poisson Y dengan X

  5

  1 , X 2 , X 3 , X 5 ..... 56 Lampiran 12 Regresi Poisson Y dengan X 1 , X 2 , X 3 , X 4 , X

  Regresi Poisson Y dengan X

  1 , X 3 , X 5 ............ 55 Lampiran 11

  Regresi Poisson Y dengan X

  Lampiran 10

  Lampiran 8 Regresi Poisson Y dengan X 3 ........................ 53 Lampiran 9 Regresi Poisson Y dengan X 3 , X 5 .................. 54

  Nilai VIF ........................................................ 53

  

Lampiran 6 Korelasi Pearson ............................................ 52

Lampiran 7

  Uji Distribusi Poisson .................................... 52

  

Lampiran 3 Karakteristik Data .......................................... 50

Lampiran 4 Perhitungan Selang Rata-Rata ....................... 50

Lampiran 5

  Faktor yang Mempengaruhi di Jawa Timur ... 48

  

Lampiran 1 Surat Pernyataan Sumber Data ...................... 47

Lampiran 2 Data Jumlah Penduduk Miskin dan Faktor-

  1 , X 2 , X 3 , X 4 , X 5 , X 6 .................................... 64

BAB I PENDAHULUAN

1.1 Latar Belakang

  Kemiskinan adalah ketidakmampuan memenuhi standar minimum kebutuhan dasar yang meliputi kebutuhan makan maupun non makan, membandingkan tingkat konsumsi penduduk dengan Garis Kemiskinan (GK) atau jumlah rupiah untuk konsumsi orang perbulan. Garis Kemiskinan (GK) merupakan penjumlahan dari Garis Kemiskinan Makanan (GKM) dan Garis Kemiskinan Non Makanan (GKNM). Penduduk yang memiliki rata-rata pengeluaran per kapita per bulan dibawah Garis Kemiskinan dikategorikan sebagai penduduk miskin (BPS, 2016).

  Provinsi Jawa Timur merupakan salah satu provinsi di Pulau Jawa yang memiliki angka kemiskinan cukup tinggi yaitu 12,34 persen pada tahun 2015 atau diatas rata-rata nasional yang sebesar 11,13 persen. Berdasarkan Berita Resmi Statistik No.

  64/09/35/Th. XIII, 15 September 2015, jumlah penduduk miskin di Jawa Timur pada bulan Maret 2015 dibandingkan September 2014 naik sebesar 0,06 poin persen dari 12,28 persen pada September 2014 menjadi 12,34 persen pada Maret 2015. Pada periode September 2014-Maret 2015, garis kemiskinan meningkat sebesar 5,25 persen atau Rp.15.226 per kapita per bulan, yaitu dari Rp. 289.945 per kapita per bulan pada September 2014 menjadi Rp.305.171 per kapita per bulan pada Maret 2015. Pada bulan Maret 2015, kontribusi garis kemiskinan makanan terhadap garis kemiskinan sebesar 73,28 persen.

  Beberapa penelitian telah dilakukan untuk mengkaji faktor- faktor yang mempengaruhi jumlah penduduk miskin antara lain Pintowati (2012) dengan penelitiannya yang berjudul “Pemodelan Kemiskinan di Provinsi Jawa Timur dengan Pendekatan

  Mu ltivariate Adaptive Regression Splines Esemble” menemukan

  bahwa persentase pengeluaran per kapita untuk non makanan, persentase penduduk usia 15 tahun ke atas yang bekerja di sektor non pertanian, persentase penduduk usia 15 tahun ke atas yang

  2 bekerja di sektor formal, angka melek huruf penduduk usia

  15-55 tahun, dan rata-rata lama sekolah berpengaruh signifikan terhadap persentase penduduk miskin di Jawa Timur. Sedangkan Akbar (2013) dengan penelitiannya yang berjudul “Pengaruh Jumlah Penduduk, Tingkat Pengangguran, dan Tingkat Pendidikan terhadap Kemiskinan (Studi Kasus di Provinsi Jawa Timur)” dan menggunakan metode regresi linier berganda mengungkapkan bahwa tingkat jumlah penduduk, tingkat pengangguran, dan tingkat pendidikan, mempunyai pengaruh secara simultan, tetapi hanya tingkat pengangguran yang berpengaruh secara langsung atau secara singnifikan positif terhadap kemiskinan di Jawa Timur terbukti kebenarannya karena keempat variabel tersebut mampu menjelaskan variabel dependen. Sehingga penelitian ini mengambil faktor-faktor yang diduga mempengaruhi jumlah penduduk miskin di Jawa Timur yaitu tingkat pengangguran terbuka, laju pertumbuhan penduduk, persentase pengeluaran per kapita untuk non makanan, persentase penduduk usia 15 tahun ke atas yang bekerja di sektor formal, angka melek huruf penduduk usia 15-55 tahun, dan angka harapan hidup.

  Jumlah penduduk miskin di Jawa Timur adalah data count, sehingga regresi yang tepat digunakan untuk menganalisis adalah regresi poisson. Regresi poisson merupakan salah satu regresi yang digunakan untuk memodelkan antara variabel respon dan variabel prediktor dengan mengasumsikan variabel respon berdistribusi poisson (Myers, 1990). Asumsi yang harus dipenuhi analisis regresi poisson yaitu tidak terjadi multikolinieritas antar variabel bebas, data berdistribusi poisson, dan nilai varians sama dengan mean. Namun dalam penerapannya sering dijumpai

  

varians dan mean tidak sama, misalnya varians lebih besar dari

mean . Kasus seperti ini disebut overdispersion. Jika terjadi kasus

overdispersion , regresi poisson menjadi tidak valid, sehingga

  perlu metode untuk mengatasi overdispersion pada regresi poisson. Model regresi Generalized Poisson (GP) merupakan suatu model yang sesuai untuk data count dimana terjadi

  3 pelanggaran asumsi mean sampel sama dengan varians sampel pada distribusi poisson, atau dengan kata lain jika terjadi

  

over/under dispersion . Sehingga selain dalam GP terdapat 

sebagai parameter dispersi (Famoye dkk, 2004).

  Penelitian sebelumnya yang menggunakan Generalized

  

Poisson Regression (GPR) untuk mengatasi overdispersion pada

  regresi poisson terhadap kasus kemiskinan adalah Fadhillah (2011) dengan judul “Aplikasi Regresi Binomial Negatif dan

  

Generalized Poisson dalam Mengatasi Overdispersion pada

  Regresi Poisson (Studi Kasus Data Kemiskinan Provinsi di Indonesia Tahun 2009) menghasilkan kesimpulan bahwa model regresi Generalized Poisson Regression lebih baik digunakan dibandingkan model regresi poisson dan binomial negatif untuk kasus jumlah penduduk miskin di Indonesia tahun 2009. Kasus jumlah penduduk miskin di Jawa Timur tahun 2015 dalam penelitian ini diduga mengalami overdispersion sehingga digunakan metode Generalized Poisson Regression (GPR) untuk pemodelan terhadap faktor-faktor yang mempengaruhi jumlah penduduk miskin di Jawa Timur.

  1.2 Rumusan Masalah

  Berdasarkan latar belakang bahwa jumlah penduduk miskin di Jawa Timur tahun 2015 memiliki angka yang cukup tinggi atau diatas rata-rata nasional, jumlah ini meningkat dari tahun 2014. Hal ini diduga karena terdapat faktor-faktor yang mempengaruhi jumlah penduduk miskin di Jawa Timur tahun 2015, oleh karena itu pada penelitian ini dilakukan pemodelan terhadap faktor- faktor yang mempengaruhi jumlah penduduk miskin di Jawa Timur.

  1.3 Tujuan

  Tujuan dari penelitian ini adalah menentukan model faktor- faktor yang mempengaruhi jumlah penduduk miskin di Jawa Timur.

  4

  1.4 Manfaat

  Manfaat yang dapat diambil dari penelitian ini adalah dapat digunakan sebagai media informasi mengenai faktor-faktor yang mempengaruhi jumlah penduduk miskin sehingga pemerintah dapat mengendalikan jumlah penduduk miskin di Jawa Timur, serta dapat dijadikan sebagai acuan untuk penelitian selanjutnya mengenai faktor-faktor yang mempengaruhi jumlah penduduk miskin di Jawa Timur.

  1.5 Batasan Masalah

  Batasan dalam penelitian ini menggunakan data kasus jumlah penduduk miskin, yang berasal dari 38 Kabupaten/Kota di Jawa Timur tahun 2015.

BAB II TINJAUAN PUSTAKA

2.1 Regresi Poisson

  Regresi poisson merupakan model regresi non linier yang sering digunakan untuk menganalisis suatu data count. Regresi poisson adalah salah satu regresi yang digunakan untuk memodelkan antara variabel respon dan variabel prediktor dengan mengasumsikan variabel Y berdistribusi poisson (Myers, 1990).

  Distribusi poisson merupakan distribusi yang menyatakan banyaknya sukses yang terjadi dalam suatu selang waktu atau daerah tertentu (Walpole, 1995). Uji Kolmogorov Smirnov dilakukan untuk mengetahui suatu data berdistribusi poisson atau tidak, dengan hipotesis sebagai berikut. H : Data mengikuti distribusi poisson H

  1 : Data tidak mengikuti distribusi poisson

  Statistik uji :

    D Sup S ( y ) F ( y ) (2.1) n n y

  Dimana :

  S n ( y ) : suatu fungsi peluang kumulatif data sampel F ( y )

  : suatu fungsi distribusi kumulatif poisson

  

D : jarak tegak maksimum antara fungsi distribusi empiris

n

  dengan fungsi distribusi poisson

   H ditolak jika nilai statistik uji D D (Daniel , 1989). n

  Jika variabel random diskrit Y merupakan distribusi poisson dengan parameter  maka fungsi peluang dari distribusi poisson itu sendiri dapat dinyatakan sebagai berikut.

   y

e

  

  

f ( y ,  )  ; y  ,

  1 , 2 ,... (2.2)

  

y

  ! dengan merupakan rata-rata variabel respon yang berdistribusi

  

  poisson dimana nilai rata-rata dan varians dari Y mempunyai nilai lebih dari 0.

  6 Regresi poisson juga memiliki asumsi bahwa tidak ada multikolinieritas antar variabel prediktor. Multikolinieritas merupakan adanya korelasi yang tinggi diantara variabel-variabel bebas dalam model. Variabel X

  1 , X 2 p dikatakan bersifat

  , …, X saling bebas jika matriks korelasi antar variabel membentuk matriks identitas. Dalam model regresi, adanya korelasi antar variabel prediktor menyebabkan taksiran parameter regresi yang dihasilkan akan memiliki error yang sangat besar.

  Pendeteksian kasus multikolinieritas dapat dilihat melalui beberapa cara yaitu sebagai berikut.

  1. Jika koefisien korelasi pearson ( r ) antar variabel x x i , j prediktor lebih dari 0,95 maka terdapat korelasi antar variabel tersebut. Rumus koefisien korelasi pearson adalah sebagai berikut. n

  

 

 ( x x ) ( x x ) i i j j

  1 r  , ij (2.3) x , x i j n n

  

2

  2

( xx ) ( xx )

  i i j j

  1 i

  1

  2. Nilai VIF (Varians Inflation Factor) lebih besar dari 10 menunjukkan adanya multikolinieritas antar variabel prediktor. Nilai VIF dinyatakan sebagai berikut.

  

1

VIF  (2.4) j

  2

R

  1 j

2 R adalah koefisien determinasi antara

  X

  dengan dengan

  j j

  variabel prediktor lainnya (Hocking, 1996). Jika terjadi kasus multikolinieritas, salah satu metode untuk mengatasinya adalah Principal Component Analysis (PCA).

  Prosedur PCA pada dasarnya adalah bertujuan untuk menyederhanakan variabel yang diamati dengan cara menyusutkan (mereduksi) dimensinya. Hal ini dilakukan dengan cara menghilangkan korelasi diantara variabel bebas melalui transformasi variabel bebas asal ke variabel baru yang tidak

  7 berkorelasi sama sekali atau yang biasa disebut dengan principal component (Turk, 1991).

  Persamaan model regresi poisson dapat ditulis sebagai berikut.

   T

   exp(

i i β

X )

    exp(    x   x  ...   x )

  

i i p ip

i

  1

  1

  2

  2      x   x    x (2.5) ln(  ) ... i 1 i

  

1

2 i 2 p ip

  dengan  merupakan rata-rata jumlah kejadian yang terjadi i dalam interval waktu tertentu.

2.1.1 Penaksiran Parameter Model Regresi Poisson

  Metode MLE merupakan salah satu metode penaksiran parameter yang dapat digunakan untuk menaksir parameter suatu model yang diketahui distribusinya. Bentuk umum fungsi likelihood untuk regresi poisson adalah sebagai berikut.

n

    

  

L ( y , ) f ( y , )

i i

  

1

   y e   ( x ,  ) 

   n   ( x ,  ) i

i

   iL y  

  ( , )  i  

1 y !

i

    n   x

( i , )

n

   ii 1 y

  e   ( x ,  ) i i

  1  

  L y   (2.6) ( , ) n y !

   i i

  1 Langkah selanjutnya adalah melakukan turunan parsial

  fungsi ln-likelihood pada persamaan (2.6) terhadap parameter yang akan diestimasi. Fungsi ln-likelihood pada persamaan (2.6) adalah sebagai berikut. n n n

     ln L ( ) y ln  ( x ,  )  ( x ,  ) ln  ( y ! ) (2.7) β i i i i    i

  1 i 1 i

  1   

  8 T

  X Jika  ( x ,  )  exp( ) maka persamaan (2.7) akan menjadi i i β persamaan (2.8). n n n T T    ln L ( ) y ln exp(

  X ) exp( X ) ln( y ! )

βi i βi βi

i   1 in T T 1 i

  1 

X

X  ln L ( ) y ( ) exp( ) ln( y ! ) (2.8)

  1 

  βi i β i β i i   

  dinyatakan dengan  yang merupakan penyelesaian dari k turunan pertama fungsi logaritma natural dari Likelihood. T Selanjutnya persaman (2.8) diturunkan terhadap

  β menjadi turunan kedua.

  L  ln ( )

  

β

T  

  β n n L

   ln ( ) T β

   y xx x (2.9) T ii   exp( ) i i i i β

  

1

  1 β

  Akan tetapi, penyelesaian dengan cara tersebut sering kali tidak mendapatkan hasil yang eksplisit sehingga alternatif yang bisa digunakan untuk mendapatkan penyelesaian dari MLE adalah dengan metode iterasi numerik yaitu Newton-Raphson. Algoritma metode Newton-Raphson dapat dituliskan sebagai berikut.

  

  1. Menentukan nilai taksiran awal parameter  . Penentuan

  ( )

  nilai awal ini biasanya diperoleh dengan metode Ordinary Least Square (OLS), yaitu.

   T

1 T

   (

  X X )

  X Y β ( )

  dengan

  

1

T   1 x x

  1 xx   11 k

   k

  12

  

2

yy y . . . y

  1 2 n         1 xx

  X dan   n(k1)

  1 n kn  

  9

  5. Mulai dari 

   ) ( ) var(

  1

β

H

  β E

  4. Memasukkan nilai

  ) (   kedalam elemen-elemen vektor g

  dan matriks H hingga diperoleh vektor 

      

   ) ( β g dan matriks

     

     ) (

  β H .

  m

     

  dilakukan iterasi pada persamaan:

    

  

   

     

      

  

) ( ) (

1 ) ( )

  1 ( m m m m β

g

β

  H β β

  Nilai

  ) (mβ merupakan sekumpulan penaksir parameter yang konvergen pada iterasi ke-m.

  6. Jika belum didapatkan penaksir parameter yang konvergen, maka dilanjutkan kembali langkah 5 hingga iterasi ke m = (m+1).

  Pengujian signifikansi parameter dalam model regresi poisson bertujuan untuk mengetahui parameter tersebut telah

   

  dengan

  2. Membentuk vektor gradien g. ) ( ) ( ln

  

  ,..., ) ( ln

  , ) ( ln

  ) (

  1 1 ) ) 1 ( ( T m k k m

  L L L  

    

     

    

    

   

   

   

  β β β β g 3. Membentuk matriks Hessian H.

  

                   

      m k k k k k m

  L simetris L L L L L

       

          

           

           

      

  

  

   

 

   2 2 1 2 2 1

2

2 1

2

2 2 1 1 ln ln ln ln ln ln

  β β β β β β β H   

2.1.2 Pengujian Parameter Model Regresi Poisson

  10 menunjukkan hubungan yang tepat atau tidak antara variabel prediktor dengan variabel respon dan mengetahui parameter tersebut berpengaruh signifikan atau tidak terhadap model. Pengujian parameter pada statistika inferensia memegang peranan penting karena digunakan untuk penarikan kesimpulan.

  Untuk menguji kelayakan model regresi poisson, terlebih dahulu ditentukan dua buah fungsi likelihood yang berhubungan dengan model regresi yang diperoleh. Fungsi-fungsi likelihood

  L ˆ

  yang dimaksud adalah yaitu nilai likelihood untuk model

   

  lengkap dengan melibatkan variabel prediktor dan L ˆ , yaitu

   

  nilai likelihood untuk model sederhana tanpa melibatkan variabel prediktor. Salah satu metode yang digunakan untuk menentukan statistik uji dalm pengujian parameter model regresi Poisson adalah dengan metode Maximum Likelihood Ratio Test (MLRT).

  

Likelihood ratio regresi Poisson dinotasikan dengan persamaan

sebagai berikut.

   L (  )

    (2.10) 

   L ( )

  dengan hipotesis sebagai berikut: H :         k

  1

  2 H 1 : paling tidak ada satu   , j = 1,2,...,k j

  Menurut Agresti (2002) statistik uji yang digunakan pada metode ini adalah sebagai berikut.

  D   2 ln  (2.11) ˆβ

   

  Jika nilai  pada persamaan (2.10) disubstitusikan pada persamaan (2.11) maka statistik uji untuk kelayakan model regresi poisson adalah sebagai berikut.

     

L  ˆ

  

 

  (2.12)

  ˆ   ˆ D β  

2  ln  

2 ln L    ˆ  ln L

       

 

ˆ

  

L

   

 

 

  11 Keputusan:

  2 ˆ 

  Tolak H , jika D  , dengan k adalah banyaknya

    β k hitung , 

  variabel bebas. Parameter model regresi poisson yang telah dihasilkan dari estimasi parameter belum tentu mempunyai pengaruh yang signifikan terhadap model. Untuk itu perlu dilakukan pengujian terhadap parameter model regresi Poisson secara parsial. Pengujian parameter secara parsial menggunakan uji statistik wald. Nilai wald dibandingkan dengan distribusi chi-

  

square pada tingkat signifikan  dan derajat bebas 1, atau

  alternatif lain dibandingkan dengan distribusi normal. Berikut ini adalah hipotesis yang digunakan. H :  

  j

   H

  1 :  j

  Statistik uji:

  

ˆ

j

  (2.13)

   Z

  ˆ

SE

    j

  ˆ

  SE

    adalah standar error atau tingkat kesalahan dari j parameter  . j

  Keputusan yang akan diambil adalah tolak H jika

  

ZZ dimana  adalah tingkat signifikansi yang

hit

  

  2 digunakan.

2.2 Overdispersion

  Khoshgoftaar, Gao & Szabo (2004) mengatakan bahwa metode regresi poisson mempunyai equi-dispersion, yaitu kondisi dimana nilai mean dan varians dari variabel respon bernilai sama. Namun, ada kalanya terjadi fenomena over/under dispersion dalam data yang dimodelkan dengan distribusi poisson yaitu

  

varians lebih besar atau lebih kecil daripada mean. Taksiran

  dispersi diukur dengan varians atau

  Pearson’s Chi-Square yang

  12 dibagi derajat bebas. Data dikatakan mengalami overdispersion jika taksiran dispersi kurang dari 1.

  Penggunaan model yang baku seperti Poisson Regression (PR) pada data yang mengalami (khususnya) overdispersion akan membawa konsekuensi pada nilai penduga bagi kesalahan baku yang lebih kecil (underestimate) yang selanjutnya dapat mengakibatkan kesalahan (misleading) pada inferensia bagi parameter modelnya (Astuti & Yanagawa, 2002). Oleh karena itu diperlukan metode regresi lain yang cocok untuk menyelesaikan fenomena adanya over/under dispersion pada data variabel respon.

  Untuk menyelidiki kasus overdispersion atau tidak, dilakukan pengujian dengan hipotesis.

   H :  (tidak terjadi kasus overdispersion)

   H

  1 :  (terjadi kasus overdispersion) 

  Dengan menggunakan taraf signifikan maka H ditolak

    jika P-value dari estimasi yang dihasilkan kurang dari .

  Taksiran dispersi diukur dengan nilai devians atau

  Pearson’s Chi-

Square yang dibagi derajat bebas. Data over dispersi jika taksiran

  dispersi lebih besar 1 dan under dispersi jika taksiran dispersi kurang dari 1.

2.3 Model Regresi Generalized Poisson (GP)

  Model regresi Generalized Poisson (GP) merupakan suatu model yang sesuai untuk data count dimana terjadi pelanggaran asumsi mean sampel sama dengan varians sampel pada distribusi poisson, atau dengan kata lain jika terjadi over/under dispersion. Sehingga selain  dalam GP terdapat  sebagai parameter dispersi.

  Model regresi GP mirip dengan model regresi poisson yaitu merupakan suatu model GLM, akan tetapi pada model regresi GP mengasumsikan bahwa komponen randomnya berdistribusi

  

Generalized Poisson . Misal, y i = 0,1,2,... merupakan variabel

  respon. Distribusi GP diberikan Famoye, dkk (2004) sebagai berikut.

  13

  y y i

  1 i    1   y

        i i 1   yi i

   

  (2.14)

   f   ,  , y  exp i i

     

y

1  ! i i 1   

   i  

  Dimana y , i

1 Mean dan varians model GP adalah sebagai berikut:

  2 E y x  dan V y x  1 

        

i i i i i i i

   Jika  maka model regresi GP akan menjadi regresi

   poisson biasa. Jika  , maka model regresi GP merepresentasikan data count yang overdispersion, dan jika

  

 maka merepresentasikan data count yang underdispersion.

Model regresi Generalized Poisson mempunyai bentuk yang sama dengan model regresi poisson. T

  l n X x x x

  (  )         ...   i i β i i k ik T

  

1

  1

  2

  2

   exp(