Pemodelan terhadap Faktor-Faktor Yang Mempengaruhi Jumlah Penduduk Miskin Di Jawa Timur menggunakan Generalized Poisson Regression - ITS Repository
TUGAS AKHIR – SS 145561
PEMODELAN TERHADAP FAKTOR-FAKTOR
YANG MEMPENGARUHI JUMLAH PENDUDUK
MISKIN DI JAWA TIMUR MENGGUNAKAN
Vriesia Endira Marita NRP 1314 030 063 Dosen Pembimbing : Ir. Mutiah Salamah Chamid, M. Kes.
Departemen Statistika Bisnis Fakultas Vokasi Institut Teknologi Sepuluh Nopember Surabaya 2017
1
TUGAS AKHIR – SS 145561
PEMODELAN TERHADAP FAKTOR-FAKTOR
YANG MEMPENGARUHI JUMLAH PENDUDUK
MISKIN DI JAWA TIMUR MENGGUNAKAN
Vriesia Endira Marita NRP 1314 030 063 Dosen Pembimbing : Ir. Mutiah Salamah Chamid, M. Kes.
Departemen Statistika Bisnis Fakultas Vokasi Institut Teknologi Sepuluh Nopember Surabaya 2017
FINAL PROJECT – SS 145561
MODELLING OF FACTORS AFFECTING THE
POOR PEOPLE IN EAST IN EAST JAVA USING
GENERALIZED POISSON REGRESSION Vriesia Endira Marita NRP 1314 030 063 Supervisor : Ir. Mutiah Salamah Chamid, M. Kes.Department of Statistics Business Fakulty of Vocational Institut Teknologi Sepuluh Nopember Surabaya 2017
PEMODELAN TERHADAP FAKTOR-FAKTOR
YANG MEMPENGARUHI JUMLAH PENDUDUK
MISKIN DI JAWA TIMUR MENGGUNAKAN
GENERALIZED POISSON REGRESSION
Nama Mahasiswa : Vriesia Endira Marita NRP : 1314 030 063 Program Studi : Diploma III Departemen : Statistika Bisnis FV ITS Dosen Pembimbing : Ir. Mutiah Salamah, M. Kes
ABSTRAK
Penduduk yang memiliki rata-rata pengeluaran per kapita per bulan dibawah Garis Kemiskinan dikategorikan sebagai penduduk miskin. Jumlah penduduk miskin di Jawa Timur tahun 2015 memiliki angka yang cukup tinggi atau diatas rata-rata nasional, jumlah ini meningkat dari tahun 2014. Jumlah penduduk miskin tertinggi di Jawa Timur adalah 292.900 penduduk yang terjadi di Kabupaten Malang dan jumlah terendah terjadi di Kota Blitar dengan jumlah penduduk miskin sebesar 1.000 penduduk. Hal ini diduga karena terdapat faktor-faktor yang mempengaruhi jumlah penduduk miskin di Jawa Timur tahun 2015, sehingga perlu dilakukan pemodelan terhadap faktor-faktor yang mempengaruhi jumlah penduduk miskin di Jawa Timur menggunakan metode Generalized Poisson Regression. Hasil analisis menunjukkan bahwa Model dari Generalized Poisson
Regression dipilih menjadi model terbaik. Variabel yang
berpengaruh signifikan dalam model adalah tingkat pengangguran terbuka, laju pertumbuhan penduduk, persentase penduduk usia 15 tahun ke atas yang bekerja di sektor formal, dan angka melek huruf penduduk usia 15-55 tahun.
Kata Kunci : Generalized Poisson Regression, Jumlah Penduduk
Miskin, Overdispersion, Regresi Poisson
THE MODELING OF FACTORS AFFECTING THE
NUMBER OF POOR POPULATION IN EAST JAVA
USING GENERALIZED POISSON REGRESSION
Student Name : Vriesia Endira Marita NRP : 1314 030 063 Programe : Diploma III Department : Statistika Bisnis FV ITS Supervisor : Ir. Mutiah Salamah, M. Kes
ABSTRACT
Residents who have an average expenditure per capita permonth below the poverty line is categorized as poor. The number
of poor people in East Java in 2015 had a high rate or above the
national average, the number is increasing from year of 2014.
The highest number of poor people in East Java is 292.900
inhabitants that happened in Malang Region and the lowest
number of poverty occurred in the city of Blitar, 1.000
inhabitants. This is presumably because there are factors that
affect the number of poor people in East Java in 2015, so it is
necessary to do the modeling of the factors that affect the number
of poor people in East Java using the Generalized Poisson
Regression. The analysis showed that the model of Generalized
Poisson Regression was chosen to be the best model. The
variables were significant in the model is the open unemployment
rate, population growth rate, the percentage of population aged
15 years and over who work in the formal sector, and the literacy
rate of population aged 15-55 years.
Keywords : Generalized Poisson Regression, Poverty Number,
Overdispersion, Poisson regressionKATA PENGANTAR
Puji syukur kehadirat Allah SWT yang senantiasa memberikan rahmat, hidayah, serta karunia-Nya sehingga penulis dapat menyelesaikan Tugas Akhir dengan judul “Pemodelan
Terhadap Faktor-Faktor yang Mempengaruhi Jumlah
Penduduk Miskin Di Jawa Timur”. Dalam penyelesaian Tugas Akhir ini, penulis mendapat bantuan dan dukungan dari berbagai pihak, oleh sebab itu dengan hormat penulis ingin mengucapkan terima kasih kepada :
1. Ir. Mutiah Salamah Chamid, M. Kes sebagai dosen pembimbing yang telah meluangkan waktunya untuk memberikan bimbingan, kritik, dan saran kepada penulis hingga selesainya Tugas Akhir ini.
2. Dra. Destri Susilaningrum, M. Si sebagai validator serta dosen penguji dan Iis Dewi Ratih, S. Si., M. Si sebagai dosen penguji yang telah memberikan kritik dan saran demi kesempurnaan Tugas Akhir ini.
3. Dr. Wahyu Wibowo, S. Si., M. Si sebagai kepala Departemen Statistika Bisnis yang telah memberikan fasilitas untuk penyelesaian Tugas Akhir ini.
4. Ir. Sri Pingit Wulandari, M. Si sebagai dosen wali yang telah memberikan dukungan dan motivasi kepada penulis.
5. Seluruh dosen dan karyawan Departemen Statistika Bisnis ITS atas kerja sama dan bantuannya selama ini.
6. Badan Pusat Statistik Provinsi Jawa Timur atas izin dan ketersediaan data yang diperlukan dalam penyusunan Tugas Akhir ini.
7. Orang tua, adik, dan keluarga besar karena telah memberikan segala doa dan kasih sayang selama ini.
8. Mahasiswa Departemen Statistika Bisnis angkatan 2014 yang telah memberikan dukungan dan semangatnya.
9. Fungsionaris HIMADATA-ITS kepengurusan 2015/2016 dan 2016/2017 yang telah memberikan bantuan dan dukungannya.
10. Pihak-pihak lain yang sudah membantu dalam prosen penyusunan Tugas Akhir ini yang tidak dapat disebutkan satu persatu. Dalam penulisan ini, penulis menyadari banyak kekurangan dalam penyusunan Tugas Akhir ini, oleh karena itu sangat diharapkan kritik dan saran yang membangun. Penulis mengharapkan Tugas Akhir ini dapat memberikan manfaat bagi pembaca.
Surabaya, Juli 2017 Penulis
DAFTAR ISI
2.1.1 Penaksiran Model Regresi Poisson ...................... 7
3.2 Variabel Penelitian dan Definisi Operasional Variabel .................................................................... 19
3.1 Sumber Data ............................................................ 19
BAB III METODOLOGI PENELITIAN
2.5 Kemiskinan .............................................................. 16
2.4.3 Pemilihan Model Terbaik ..................................... 16
Poisson (GP) ....................................................... 15
2.4.2 Pengujian Parameter Model Regresi Generalized
(GP) .................................. 13
Generalized Poisson
2.4.1 Penaksiran Parameter Model Regresi
2.4 Model Regresi Generalized Poisson (GP) ............... 12
2.3 Overdispersion ......................................................... 11
2.1.2 Pengujian Parameter Model Regresi Poisson....... 9
2.1 Regresi Poisson ........................................................ 5
Halaman
BAB II TINJAUAN PUSTAKA
1.5 Batasan Masalah ...................................................... 4
1.4 Manfaat .................................................................... 4
1.3 Tujuan ...................................................................... 3
1.2 Rumusan Masalah .................................................... 3
1.1 Latar Belakang ......................................................... 1
BAB I PENDAHULUAN
DAFTAR LAMPIRAN ......................................................... xv
.................................................................. xiv
DAFTAR GAMBAR ............................................................. xiii
DAFTAR TABEL.......................................................................... xi
ABSTRACT ............................................................................ viii
KATA PENGANTAR ........................................................... ix DAFTAR ISI.............................................................................. vii
HALAMAN JUDUL .............................................................. i LEMBAR PENGESAHAN ................................................... v ABSTRAK
3.3 Metode Analisis dan Langkah Analisis ................... 21
BAB IV ANALISIS DAN PEMBAHASAN
4.2.2 Pendeteksian Multikolinieritas pada Kasus Jumlah Penduduk Miskin di Jawa Timur............ 35
............................................................ 45
DAFTAR PUSTAKA
5.2 Saran ........................................................................ 43
5.1 Kesimpulan .............................................................. 43
BAB V KESIMPULAN DAN SARAN
4.4 Pemilihan Model Terbaik terhadap Kasus Jumlah Penduduk Miskin di Jawa Timur ............................. 41
4.3 Pemodelan Generalized Poisson Regression pada Kasus Jumlah Penduduk Miskin di Jawa Timur ...... 39
4.2.3 Pemodelan Regresi Poisson pada Kasus Jumlah Penduduk Miskin di Jawa Timur ........................ 36
4.2.1 Uji Distribusi Poisson pada Data Jumlah Penduduk Miskin di Jawa Timur ........................ 35
4.1 Karakteristik Data Kasus Jumlah Penduduk Miskin di Jawa Timur Tahun 2015 ...................................... 25
4.2 Analisis Regresi Poisson pada Kasus Jumlah Penduduk Miskin di Jawa Timur ............................. 34
4.1.7 Angka Harapan Hidup di Jawa Timur Tahun 2015 .................................................................... 33
4.1.6 Angka Melek Huruf Penduduk Usia 15-55 Tahun di Jawa Timur Tahun 2015 ...................... 32
4.1.5 Persentase Penduduk Usia 15 Tahun Ke Atas yang Bekerja di Sektor Formal di Jawa Timur Tahun 2015 ......................................................... 31
4.1.4 Persentase Pengeluaran Per Kapita untuk Non Makanan di Jawa Timur Tahun 2015 ................. 30
4.1.3 Laju Pertumbuhan Penduduk di Jawa Timur Tahun 2015 ......................................................... 29
4.1.2 Tingkat Pengangguran Terbuka di Jawa Timur Tahun 2015 ......................................................... 28
4.1.1 Jumlah Penduduk Miskin di Jawa Timur ............. 27
LAMPIRAN BIODATA PENULIS
DAFTAR GAMBAR
Halaman
Gambar 4.1 Persebaran Jumlah Penduduk Miskin ................ 27Gambar 4.1 Persebaran Tingkat Pengangguran Terbuka ..... 28 Gambar 4.2Persebaran Laju Pertumbuhan Penduduk ......... 29
Gambar 4.3 Persebaran Persentase Pengeluaran per Kapitauntuk Non Makanan ......................................... 30
Gambar 4.4
Persebaran Persentase Penduduk Usia 15 Tahun ke Atas yang Bekerja di Sektor Formal 32
Gambar 4.5
Persebaran Angka Melek Huruf Penduduk Usia 15-55 Tahun ............................................. 33
Gambar 4.6 Persebaran Angka Harapan Hidup ................... 34
DAFTAR TABEL
Halaman
Tabel 3.1 Variabel Penelitian ................................................ 19Tabel 4.1 Karakteristik Data Jumlah Penduduk Miskin ........ 25 Tabel 4.2Uji Kolmogorov Smirnov pada Jumlah Penduduk Miskin.................................................................... 35
Tabel 4.3 Koefisien Korelasi antar Variabel Prediktor ......... 36 Tabel 4.4Nilai VIF pada Variabel Prediktor .......................... 36
Tabel 4.5 Regresi Poisson....................................................... 37 Tabel 4.6Estimasi Parameter Regresi Poisson ....................... 38
Tabel 4.7 Generalized Poisson Regression ........................... 39Tabel 4.8 Estimasi Parameter Generalized Poisson Regression .............................................................40 Tabel 4.9 Pemilihan Model Terbaik ....................................... 42
DAFTAR LAMPIRAN
X
X
Y dengan
1 , X 2 , X 3 , X 4 , X 5 .......................................... 63 Lampiran 19 Generalized Poisson Regression
X
1 , X 2 , X 4 , X 5 ................................................. 62 Lampiran 18 Generalized Poisson Regression Y dengan
X
1 , X 2 , X 4 ....................................................... 61 Lampiran 17 Generalized Poisson Regression Y dengan
X
Y dengan
1 , X 3 ............................................................. 60 Lampiran 16 Generalized Poisson Regression
X
1 ................................................................... 59 Lampiran 15 Generalized Poisson Regression Y dengan
X
5 , X 6 ............................................................. 58 Lampiran 14 Generalized Poisson Regression Y dengan
1 , X 2 , X 3 , X 4 ,
Halaman
57 Lampiran 13 Regresi Poisson Y dengan X
5
1 , X 2 , X 3 , X 5 ..... 56 Lampiran 12 Regresi Poisson Y dengan X 1 , X 2 , X 3 , X 4 , X
Regresi Poisson Y dengan X
1 , X 3 , X 5 ............ 55 Lampiran 11
Regresi Poisson Y dengan X
Lampiran 10
Lampiran 8 Regresi Poisson Y dengan X 3 ........................ 53 Lampiran 9 Regresi Poisson Y dengan X 3 , X 5 .................. 54
Nilai VIF ........................................................ 53
Lampiran 6 Korelasi Pearson ............................................ 52
Lampiran 7Uji Distribusi Poisson .................................... 52
Lampiran 3 Karakteristik Data .......................................... 50
Lampiran 4 Perhitungan Selang Rata-Rata ....................... 50
Lampiran 5Faktor yang Mempengaruhi di Jawa Timur ... 48
Lampiran 1 Surat Pernyataan Sumber Data ...................... 47
Lampiran 2 Data Jumlah Penduduk Miskin dan Faktor-1 , X 2 , X 3 , X 4 , X 5 , X 6 .................................... 64
BAB I PENDAHULUAN
1.1 Latar Belakang
Kemiskinan adalah ketidakmampuan memenuhi standar minimum kebutuhan dasar yang meliputi kebutuhan makan maupun non makan, membandingkan tingkat konsumsi penduduk dengan Garis Kemiskinan (GK) atau jumlah rupiah untuk konsumsi orang perbulan. Garis Kemiskinan (GK) merupakan penjumlahan dari Garis Kemiskinan Makanan (GKM) dan Garis Kemiskinan Non Makanan (GKNM). Penduduk yang memiliki rata-rata pengeluaran per kapita per bulan dibawah Garis Kemiskinan dikategorikan sebagai penduduk miskin (BPS, 2016).
Provinsi Jawa Timur merupakan salah satu provinsi di Pulau Jawa yang memiliki angka kemiskinan cukup tinggi yaitu 12,34 persen pada tahun 2015 atau diatas rata-rata nasional yang sebesar 11,13 persen. Berdasarkan Berita Resmi Statistik No.
64/09/35/Th. XIII, 15 September 2015, jumlah penduduk miskin di Jawa Timur pada bulan Maret 2015 dibandingkan September 2014 naik sebesar 0,06 poin persen dari 12,28 persen pada September 2014 menjadi 12,34 persen pada Maret 2015. Pada periode September 2014-Maret 2015, garis kemiskinan meningkat sebesar 5,25 persen atau Rp.15.226 per kapita per bulan, yaitu dari Rp. 289.945 per kapita per bulan pada September 2014 menjadi Rp.305.171 per kapita per bulan pada Maret 2015. Pada bulan Maret 2015, kontribusi garis kemiskinan makanan terhadap garis kemiskinan sebesar 73,28 persen.
Beberapa penelitian telah dilakukan untuk mengkaji faktor- faktor yang mempengaruhi jumlah penduduk miskin antara lain Pintowati (2012) dengan penelitiannya yang berjudul “Pemodelan Kemiskinan di Provinsi Jawa Timur dengan Pendekatan
Mu ltivariate Adaptive Regression Splines Esemble” menemukan
bahwa persentase pengeluaran per kapita untuk non makanan, persentase penduduk usia 15 tahun ke atas yang bekerja di sektor non pertanian, persentase penduduk usia 15 tahun ke atas yang
2 bekerja di sektor formal, angka melek huruf penduduk usia
15-55 tahun, dan rata-rata lama sekolah berpengaruh signifikan terhadap persentase penduduk miskin di Jawa Timur. Sedangkan Akbar (2013) dengan penelitiannya yang berjudul “Pengaruh Jumlah Penduduk, Tingkat Pengangguran, dan Tingkat Pendidikan terhadap Kemiskinan (Studi Kasus di Provinsi Jawa Timur)” dan menggunakan metode regresi linier berganda mengungkapkan bahwa tingkat jumlah penduduk, tingkat pengangguran, dan tingkat pendidikan, mempunyai pengaruh secara simultan, tetapi hanya tingkat pengangguran yang berpengaruh secara langsung atau secara singnifikan positif terhadap kemiskinan di Jawa Timur terbukti kebenarannya karena keempat variabel tersebut mampu menjelaskan variabel dependen. Sehingga penelitian ini mengambil faktor-faktor yang diduga mempengaruhi jumlah penduduk miskin di Jawa Timur yaitu tingkat pengangguran terbuka, laju pertumbuhan penduduk, persentase pengeluaran per kapita untuk non makanan, persentase penduduk usia 15 tahun ke atas yang bekerja di sektor formal, angka melek huruf penduduk usia 15-55 tahun, dan angka harapan hidup.
Jumlah penduduk miskin di Jawa Timur adalah data count, sehingga regresi yang tepat digunakan untuk menganalisis adalah regresi poisson. Regresi poisson merupakan salah satu regresi yang digunakan untuk memodelkan antara variabel respon dan variabel prediktor dengan mengasumsikan variabel respon berdistribusi poisson (Myers, 1990). Asumsi yang harus dipenuhi analisis regresi poisson yaitu tidak terjadi multikolinieritas antar variabel bebas, data berdistribusi poisson, dan nilai varians sama dengan mean. Namun dalam penerapannya sering dijumpai
varians dan mean tidak sama, misalnya varians lebih besar dari
mean . Kasus seperti ini disebut overdispersion. Jika terjadi kasus
overdispersion , regresi poisson menjadi tidak valid, sehingga
perlu metode untuk mengatasi overdispersion pada regresi poisson. Model regresi Generalized Poisson (GP) merupakan suatu model yang sesuai untuk data count dimana terjadi
3 pelanggaran asumsi mean sampel sama dengan varians sampel pada distribusi poisson, atau dengan kata lain jika terjadi
over/under dispersion . Sehingga selain dalam GP terdapat
sebagai parameter dispersi (Famoye dkk, 2004).Penelitian sebelumnya yang menggunakan Generalized
Poisson Regression (GPR) untuk mengatasi overdispersion pada
regresi poisson terhadap kasus kemiskinan adalah Fadhillah (2011) dengan judul “Aplikasi Regresi Binomial Negatif dan
Generalized Poisson dalam Mengatasi Overdispersion pada
Regresi Poisson (Studi Kasus Data Kemiskinan Provinsi di Indonesia Tahun 2009) menghasilkan kesimpulan bahwa model regresi Generalized Poisson Regression lebih baik digunakan dibandingkan model regresi poisson dan binomial negatif untuk kasus jumlah penduduk miskin di Indonesia tahun 2009. Kasus jumlah penduduk miskin di Jawa Timur tahun 2015 dalam penelitian ini diduga mengalami overdispersion sehingga digunakan metode Generalized Poisson Regression (GPR) untuk pemodelan terhadap faktor-faktor yang mempengaruhi jumlah penduduk miskin di Jawa Timur.
1.2 Rumusan Masalah
Berdasarkan latar belakang bahwa jumlah penduduk miskin di Jawa Timur tahun 2015 memiliki angka yang cukup tinggi atau diatas rata-rata nasional, jumlah ini meningkat dari tahun 2014. Hal ini diduga karena terdapat faktor-faktor yang mempengaruhi jumlah penduduk miskin di Jawa Timur tahun 2015, oleh karena itu pada penelitian ini dilakukan pemodelan terhadap faktor- faktor yang mempengaruhi jumlah penduduk miskin di Jawa Timur.
1.3 Tujuan
Tujuan dari penelitian ini adalah menentukan model faktor- faktor yang mempengaruhi jumlah penduduk miskin di Jawa Timur.
4
1.4 Manfaat
Manfaat yang dapat diambil dari penelitian ini adalah dapat digunakan sebagai media informasi mengenai faktor-faktor yang mempengaruhi jumlah penduduk miskin sehingga pemerintah dapat mengendalikan jumlah penduduk miskin di Jawa Timur, serta dapat dijadikan sebagai acuan untuk penelitian selanjutnya mengenai faktor-faktor yang mempengaruhi jumlah penduduk miskin di Jawa Timur.
1.5 Batasan Masalah
Batasan dalam penelitian ini menggunakan data kasus jumlah penduduk miskin, yang berasal dari 38 Kabupaten/Kota di Jawa Timur tahun 2015.
BAB II TINJAUAN PUSTAKA
2.1 Regresi Poisson
Regresi poisson merupakan model regresi non linier yang sering digunakan untuk menganalisis suatu data count. Regresi poisson adalah salah satu regresi yang digunakan untuk memodelkan antara variabel respon dan variabel prediktor dengan mengasumsikan variabel Y berdistribusi poisson (Myers, 1990).
Distribusi poisson merupakan distribusi yang menyatakan banyaknya sukses yang terjadi dalam suatu selang waktu atau daerah tertentu (Walpole, 1995). Uji Kolmogorov Smirnov dilakukan untuk mengetahui suatu data berdistribusi poisson atau tidak, dengan hipotesis sebagai berikut. H : Data mengikuti distribusi poisson H
1 : Data tidak mengikuti distribusi poisson
Statistik uji :
D Sup S ( y ) F ( y ) (2.1) n n y
Dimana :
S n ( y ) : suatu fungsi peluang kumulatif data sampel F ( y )
: suatu fungsi distribusi kumulatif poisson
D : jarak tegak maksimum antara fungsi distribusi empiris
ndengan fungsi distribusi poisson
H ditolak jika nilai statistik uji D D (Daniel , 1989). n
Jika variabel random diskrit Y merupakan distribusi poisson dengan parameter maka fungsi peluang dari distribusi poisson itu sendiri dapat dinyatakan sebagai berikut.
y
e
f ( y , ) ; y ,
1 , 2 ,... (2.2)
y
! dengan merupakan rata-rata variabel respon yang berdistribusi
poisson dimana nilai rata-rata dan varians dari Y mempunyai nilai lebih dari 0.
6 Regresi poisson juga memiliki asumsi bahwa tidak ada multikolinieritas antar variabel prediktor. Multikolinieritas merupakan adanya korelasi yang tinggi diantara variabel-variabel bebas dalam model. Variabel X
1 , X 2 p dikatakan bersifat
, …, X saling bebas jika matriks korelasi antar variabel membentuk matriks identitas. Dalam model regresi, adanya korelasi antar variabel prediktor menyebabkan taksiran parameter regresi yang dihasilkan akan memiliki error yang sangat besar.
Pendeteksian kasus multikolinieritas dapat dilihat melalui beberapa cara yaitu sebagai berikut.
1. Jika koefisien korelasi pearson ( r ) antar variabel x x i , j prediktor lebih dari 0,95 maka terdapat korelasi antar variabel tersebut. Rumus koefisien korelasi pearson adalah sebagai berikut. n
( x x ) ( x x ) i i j j1 r , i j (2.3) x , x i j n n
2
2
( x x ) ( x x )
i i j j1 i
1
2. Nilai VIF (Varians Inflation Factor) lebih besar dari 10 menunjukkan adanya multikolinieritas antar variabel prediktor. Nilai VIF dinyatakan sebagai berikut.
1
VIF (2.4) j2
R
1 j
2 R adalah koefisien determinasi antara
X
dengan dengan
j j
variabel prediktor lainnya (Hocking, 1996). Jika terjadi kasus multikolinieritas, salah satu metode untuk mengatasinya adalah Principal Component Analysis (PCA).
Prosedur PCA pada dasarnya adalah bertujuan untuk menyederhanakan variabel yang diamati dengan cara menyusutkan (mereduksi) dimensinya. Hal ini dilakukan dengan cara menghilangkan korelasi diantara variabel bebas melalui transformasi variabel bebas asal ke variabel baru yang tidak
7 berkorelasi sama sekali atau yang biasa disebut dengan principal component (Turk, 1991).
Persamaan model regresi poisson dapat ditulis sebagai berikut.
T
exp(
i i β
X ) exp( x x ... x )
i i p ip
i1
1
2
2 x x x (2.5) ln( ) ... i 1 i
1
2 i 2 p ipdengan merupakan rata-rata jumlah kejadian yang terjadi i dalam interval waktu tertentu.
2.1.1 Penaksiran Parameter Model Regresi Poisson
Metode MLE merupakan salah satu metode penaksiran parameter yang dapat digunakan untuk menaksir parameter suatu model yang diketahui distribusinya. Bentuk umum fungsi likelihood untuk regresi poisson adalah sebagai berikut.
n
L ( y , ) f ( y , )
i i
1
y e ( x , )
n ( x , ) i
i
i L y
( , ) i
1 y !
i n x
( i , )
n i i 1 y
e ( x , ) i i
1
L y (2.6) ( , ) n y !
i i
1 Langkah selanjutnya adalah melakukan turunan parsial
fungsi ln-likelihood pada persamaan (2.6) terhadap parameter yang akan diestimasi. Fungsi ln-likelihood pada persamaan (2.6) adalah sebagai berikut. n n n
ln L ( ) y ln ( x , ) ( x , ) ln ( y ! ) (2.7) β i i i i i
1 i 1 i
1
8 T
X Jika ( x , ) exp( ) maka persamaan (2.7) akan menjadi i i β persamaan (2.8). n n n T T ln L ( ) y ln exp(
X ) exp( X ) ln( y ! )
β i i β i β i
i 1 i n T T 1 i 1
X
X ln L ( ) y ( ) exp( ) ln( y ! ) (2.8)1
β i i β i β i i
dinyatakan dengan yang merupakan penyelesaian dari k turunan pertama fungsi logaritma natural dari Likelihood. T Selanjutnya persaman (2.8) diturunkan terhadap
β menjadi turunan kedua.
L ln ( )
β
T β n n L
ln ( ) T β
y x x x (2.9) T i i exp( ) i i i i β
1
1 β
Akan tetapi, penyelesaian dengan cara tersebut sering kali tidak mendapatkan hasil yang eksplisit sehingga alternatif yang bisa digunakan untuk mendapatkan penyelesaian dari MLE adalah dengan metode iterasi numerik yaitu Newton-Raphson. Algoritma metode Newton-Raphson dapat dituliskan sebagai berikut.
1. Menentukan nilai taksiran awal parameter . Penentuan
( )
nilai awal ini biasanya diperoleh dengan metode Ordinary Least Square (OLS), yaitu.
T
1 T
(
X X )
X Y β ( )
dengan
1
T 1 x x1 x x 11 k
k
12
2
y y y . . . y1 2 n 1 x x
X dan n (k 1)
1 n kn
9
5. Mulai dari
) ( ) var(
1
β
Hβ E
4. Memasukkan nilai
) ( kedalam elemen-elemen vektor g
dan matriks H hingga diperoleh vektor
) ( β g dan matriks
) (
β H .
m
dilakukan iterasi pada persamaan:
) ( ) (
1 ) ( )1 ( m m m m β
g
βH β β
Nilai
) (m β merupakan sekumpulan penaksir parameter yang konvergen pada iterasi ke-m.
6. Jika belum didapatkan penaksir parameter yang konvergen, maka dilanjutkan kembali langkah 5 hingga iterasi ke m = (m+1).
Pengujian signifikansi parameter dalam model regresi poisson bertujuan untuk mengetahui parameter tersebut telah
dengan
2. Membentuk vektor gradien g. ) ( ) ( ln
,..., ) ( ln
, ) ( ln
) (
1 1 ) ) 1 ( ( T m k k m
L L L
β β β β g 3. Membentuk matriks Hessian H.
m k k k k k m
L simetris L L L L L
2 2 1 2 2 1
2
2 12
2 2 1 1 ln ln ln ln ln lnβ β β β β β β H
2.1.2 Pengujian Parameter Model Regresi Poisson
10 menunjukkan hubungan yang tepat atau tidak antara variabel prediktor dengan variabel respon dan mengetahui parameter tersebut berpengaruh signifikan atau tidak terhadap model. Pengujian parameter pada statistika inferensia memegang peranan penting karena digunakan untuk penarikan kesimpulan.
Untuk menguji kelayakan model regresi poisson, terlebih dahulu ditentukan dua buah fungsi likelihood yang berhubungan dengan model regresi yang diperoleh. Fungsi-fungsi likelihood
L ˆ
yang dimaksud adalah yaitu nilai likelihood untuk model
lengkap dengan melibatkan variabel prediktor dan L ˆ , yaitu
nilai likelihood untuk model sederhana tanpa melibatkan variabel prediktor. Salah satu metode yang digunakan untuk menentukan statistik uji dalm pengujian parameter model regresi Poisson adalah dengan metode Maximum Likelihood Ratio Test (MLRT).
Likelihood ratio regresi Poisson dinotasikan dengan persamaan
sebagai berikut. L ( )
(2.10)
L ( )
dengan hipotesis sebagai berikut: H : k
1
2 H 1 : paling tidak ada satu , j = 1,2,...,k j
Menurut Agresti (2002) statistik uji yang digunakan pada metode ini adalah sebagai berikut.
D 2 ln (2.11) ˆβ
Jika nilai pada persamaan (2.10) disubstitusikan pada persamaan (2.11) maka statistik uji untuk kelayakan model regresi poisson adalah sebagai berikut.
L ˆ
(2.12)
ˆ ˆ D β
2 ln
2 ln L ˆ ln L
ˆ
L
11 Keputusan:
2 ˆ
Tolak H , jika D , dengan k adalah banyaknya
β k hitung ,
variabel bebas. Parameter model regresi poisson yang telah dihasilkan dari estimasi parameter belum tentu mempunyai pengaruh yang signifikan terhadap model. Untuk itu perlu dilakukan pengujian terhadap parameter model regresi Poisson secara parsial. Pengujian parameter secara parsial menggunakan uji statistik wald. Nilai wald dibandingkan dengan distribusi chi-
square pada tingkat signifikan dan derajat bebas 1, atau
alternatif lain dibandingkan dengan distribusi normal. Berikut ini adalah hipotesis yang digunakan. H :
j
H
1 : j
Statistik uji:
ˆ
j(2.13)
Z
ˆ
SE
j
ˆ
SE
adalah standar error atau tingkat kesalahan dari j parameter . j
Keputusan yang akan diambil adalah tolak H jika
Z Z dimana adalah tingkat signifikansi yang
hit
2 digunakan.
2.2 Overdispersion
Khoshgoftaar, Gao & Szabo (2004) mengatakan bahwa metode regresi poisson mempunyai equi-dispersion, yaitu kondisi dimana nilai mean dan varians dari variabel respon bernilai sama. Namun, ada kalanya terjadi fenomena over/under dispersion dalam data yang dimodelkan dengan distribusi poisson yaitu
varians lebih besar atau lebih kecil daripada mean. Taksiran
dispersi diukur dengan varians atau
Pearson’s Chi-Square yang
12 dibagi derajat bebas. Data dikatakan mengalami overdispersion jika taksiran dispersi kurang dari 1.
Penggunaan model yang baku seperti Poisson Regression (PR) pada data yang mengalami (khususnya) overdispersion akan membawa konsekuensi pada nilai penduga bagi kesalahan baku yang lebih kecil (underestimate) yang selanjutnya dapat mengakibatkan kesalahan (misleading) pada inferensia bagi parameter modelnya (Astuti & Yanagawa, 2002). Oleh karena itu diperlukan metode regresi lain yang cocok untuk menyelesaikan fenomena adanya over/under dispersion pada data variabel respon.
Untuk menyelidiki kasus overdispersion atau tidak, dilakukan pengujian dengan hipotesis.
H : (tidak terjadi kasus overdispersion)
H
1 : (terjadi kasus overdispersion)
Dengan menggunakan taraf signifikan maka H ditolak
jika P-value dari estimasi yang dihasilkan kurang dari .
Taksiran dispersi diukur dengan nilai devians atau
Pearson’s Chi-
Square yang dibagi derajat bebas. Data over dispersi jika taksiran
dispersi lebih besar 1 dan under dispersi jika taksiran dispersi kurang dari 1.
2.3 Model Regresi Generalized Poisson (GP)
Model regresi Generalized Poisson (GP) merupakan suatu model yang sesuai untuk data count dimana terjadi pelanggaran asumsi mean sampel sama dengan varians sampel pada distribusi poisson, atau dengan kata lain jika terjadi over/under dispersion. Sehingga selain dalam GP terdapat sebagai parameter dispersi.
Model regresi GP mirip dengan model regresi poisson yaitu merupakan suatu model GLM, akan tetapi pada model regresi GP mengasumsikan bahwa komponen randomnya berdistribusi
Generalized Poisson . Misal, y i = 0,1,2,... merupakan variabel
respon. Distribusi GP diberikan Famoye, dkk (2004) sebagai berikut.
13
y y i
1 i 1 y
i i 1 y i i
(2.14)
f , , y exp i i
y
1 ! i i 1 i
Dimana y , i
1 Mean dan varians model GP adalah sebagai berikut:
2 E y x dan V y x 1
i i i i i i i
Jika maka model regresi GP akan menjadi regresi
poisson biasa. Jika , maka model regresi GP merepresentasikan data count yang overdispersion, dan jika
maka merepresentasikan data count yang underdispersion.
Model regresi Generalized Poisson mempunyai bentuk yang sama dengan model regresi poisson. Tl n X x x x
( ) ... i i β i i k ik T
1
1
2
2
exp(