Pemodelan Data Panel Kemiskinan Di Provinsi Nusa Tenggara Timur Menggunakan Gee Dan Glmm.

PEMODELAN DATA PANEL KEMISKINAN
DI PROVINSI NUSA TENGGARA TIMUR
MENGGUNAKAN GEE DAN GLMM

DIMAS ANGGARA

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa tesis berjudul Pemodelan Data Panel
Kemiskinan di Provinsi Nusa Tenggara Timur Menggunakan GEE dan GLMM
adalah benar karya saya dengan arahan dari komisi pembimbing dan belum
diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber
informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam
Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.
Bogor, Agustus 2015
Dimas Anggara
G152130344

RINGKASAN
DIMAS ANGGARA. Pemodelan Data Panel Kemiskinan di Provinsi Nusa
Tenggara Timur Menggunakan GEE dan GLMM. Dibimbing oleh INDAHWATI
dan ANANG KURNIA.
Tingkat kemiskinan dapat diamati sebagai data panel. Data panel merupakan
gabungan antara data cross section dan data time series, dimana unit cross section
yang sama diamati pada waktu yang berbeda-beda. Data panel dapat diartikan data
yang memperhatikan subyek dan waktu amatan. Pada penelitian terhadap beberapa
unit observasi dengan waktu yang bersamaan biasanya kurang memberikan
informasi yang lebih. Akan tetapi ketika data yang diamati dengan selang waktu
tertentu berulang kali, maka antar waktu akan memiliki data yang berkorelasi atau
saling tak bebas. Sama halnya dengan tingkat kemiskinan yang diamati dari tahun
ke tahun, maka antar data kemiskinan juga saling berkorelasi.
Penduduk miskin dapat dinyatakan dalam peubah acak biner Z, dimana
kejadian penduduk dalam kondisi miskin dinyatakan dengan nilai Zi = 1 dan

kejadian penduduk tidak dalam kondisi miskin dengan nilai Zi = 0. Jika Yi =
∑�=� � adalah peubah acak yang menyatakan jumlah penduduk miskin pada
wilayah ke-i, maka sebaran peubah acak Yi mengikuti sebaran Binomial (ni, pi).
Sebaran data bagi Yi ~ Binomial (ni, pi) berimplikasi juga kepada ragam yang tidak
homogen yang merupakan fungsi dari nilai harapannya Var (Yi) = ni pi (1 – pi). Oleh
karena itu untuk memodelkan jumlah penduduk miskin, model linier klasik dengan
asumsi normalitas dan homoskedastisitas tidak dapat terpenuhi.
Pemodelan yang dapat digunakan untuk mengatasi ketaknormalan sebaran
peubah respon dapat digunakan Generalized Linear Model (GLM). GLM
merupakan metode pada model regresi untuk data univariate yang dianggap
memiliki sebaran keluarga eksponensial. Generalized Estimating Equations (GEE)
dan Generalized Linear Mixed Models (GLMM) adalah pengembangan dari GLM
yang merupakan suatu metode pendugaan parameter untuk data yang peubah
responnya terjadi autokorelasi karena data diamati dari waktu ke waktu.
Berdasarkan data Badan Pusat Statistik tentang persentase dan jumlah
penduduk miskin Indonesia pada tahun 2014 dapat disimpulkan bahwa Provinsi
Nusa Tenggara Timur merupakan Provinsi yang memiliki persentase jumlah
penduduk miskin terbesar ketiga setelah Provinsi Papua dan Provinsi Papua Barat.
Tujuan dari penelitian ini adalah memodelkan data panel kemiskinan di
Provinsi Nusa Tenggara Timur dengan menggunakan GEE dengan GLMM dan

membandingkan hasil pemodelan GEE dan GLMM. Dari hasil penelitian dapat
disimpulkan model GLMM dengan pengaruh tetap wilayah dan pengaruh acak
waktu adalah model terbaik dengan nilai Mean Square Error (MSE) mendekati
nilai nol.
Kata kunci: data panel, generalized estimating equations, generalized linear
mixed models, kemiskinan

SUMMARY
DIMAS ANGGARA. To Modeling Poverty Panel Data in East Nusa Tenggara
Province Using GEE and GLMM. Supervised by INDAHWATI and ANANG
KURNIA.
The poverty rate can be observed as a panel data. Panel data is a combination
of cross section data and time series data, where the unit of the same cross section
is observed at different times. Panel data can be analyzed with regard the subject
and time of observation. In studies of several observation units at the same time are
usually less provide more information. But when the data observed with certain
intervals repeatedly, then over time will have data that correlates or not mutually
independent. Similarly, the poverty rate is observed from year to year and among
the poverty rate data is also correlated.
The poor people variables can be expressed in binary random variable Z,

where the incidence of the people in poor condition expressed by the value of Zi =
1 and the incidence of the people is not in poor condition with a value of Zi = 0. If

Yi = ∑ =� � is a random variable that states the number of poor in the region. Then
the distribution of random variables Yi follows the Binomial distribution (ni, pi).
This implies variance is not homogenous because it is a function of the expected
value Var (Yi) = ni pi (1 – pi). Therefore, to model the number of poor people, the
classical linear model with the assumptions of normality and homoscedastisity can
not be fulfilled.
If the response variable does not follow the normal distribution then modeling
can use the Generalized Linear Models (GLM). When the observed response
variable is the time series of observations may occur autocorrelation. Generalized
Estimating Equations (GEE) and Generalized Linear Mixed Models (GLMM) is
the development of GLM to observation data with autocorrelation.
Based on data from the Statistics of Indonesia on the percentage and number
of poor people in Indonesia in 2014. It can be concluded that the East Nusa
Tenggara Province is the third poorest after Papua and West Papua Province.
The objectives of this research is to model poverty panel data in East Nusa
Tenggara province by using GEE and GLMM and to compare the results. The
results of this study concluded that GLMM models with fixed effect (area) and

random effect (time) is the best model because Mean Square Error (MSE) of this
model is near to zero.
Keywords: generalized estimating equations, generalized linear mixed models,
panel data, poverty,

© Hak Cipta Milik IPB, Tahun 2015
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau
menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apa pun tanpa izin IPB

PEMODELAN DATA PANEL KEMISKINAN
DI PROVINSI NUSA TENGGARA TIMUR
MENGGUNAKAN GEE DAN GLMM

DIMAS ANGGARA


Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains
pada
Program Studi Statistika Terapan

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015

Penguji Luar Komisi pada Ujian Tesis : Prof.Dr.Ir. Khairil Anwar Notodiputro MS

Judul Tesis : Pemodelan Data Panel Kemiskinan di Provinsi Nusa Tenggara
Timur Menggunakan GEE dan GLMM
Nama
: Dimas Anggara
NIM
: G152130344


Disetujui oleh
Komisi Pembimbing

Dr Ir Indahwati MSi
Ketua

Dr Anang Kurnia MSi
Anggota

Diketahui oleh

Ketua Program Studi
Statistika Terapan

Dekan Sekolah Pascasarjana

Dr Ir Indahwati Msi

Dr Ir Dahrul Syah MSc Agr


Tanggal Ujian: 28 Agustus 2015

Tanggal Lulus :

PRAKATA
Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa atas segala
karunia-Nya sehingga penulis dapat menyelesaikan tesis yang berjudul Pemodelan
Data Panel Kemiskinan di Provinsi Nusa Tenggara Timur Menggunakan GEE dan
GLMM. Keberhasilan penulisan tesis ini tidak lepas dari bantuan, bimbingan, dan
petunjuk dari berbagai pihak.
Terima kasih penulis ucapkan kepada Ibu Dr. Ir. Indahwati M.Si dan Bapak
Dr. Anang Kurnia M.Si selaku pembimbing yang telah banyak memberi bimbingan,
arahan serta saran. Penulis juga mengucapkan terima kasih kepada Pimpinan Badan
Pusat Statistik (BPS) atas kesempatan yang diberikan kepada penulis untuk
menempuh jenjang Magister Statistika Terapan. Ungkapan terima kasih terkhusus
penulis sampaikan kepada ayah, ibu serta seluruh keluarga atas doa, dukungan dan
kasih sayangnya. Terima kasih pula kepada seluruh staf program studi Statistika
Terapan dan teman-teman statistika (S2 dan S3) atas bantuan dan kebersamaannya.
Terima kasih tak lupa penulis sampaikan kepada semua pihak yang tidak dapat
penulis sebutkan satu per satu yang telah membantu dalam penyusunan tesis ini.

Semoga karya ilmiah ini bermanfaat.

Bogor, September 2015
Dimas Anggara

DAFTAR ISI
DAFTAR TABEL
DAFTAR GAMBAR
DAFTAR LAMPIRAN

v
v
vi

1. PENDAHULUAN

1

Latar Belakang
Perumusan Masalah

Tujuan Penelitian
Manfaat Penelitian
2. TINJAUAN PUSTAKA
Penelitian Sebelumnya Tentang Kemiskinan
Model Linier Terampat (Generalized Linear Models /GLM)
Generalized Estimating Equations (GEE)
Model Linier Campuran Terampat (Generalized Linear Mixed
Models/GLMM)
Uji Kebaikan Suai
3. METODE
Sumber Data
Tahapan-tahapan Analisis
4. HASIL DAN PEMBAHASAN
Eksplorasi Data Tingkat Kemiskinan di Provinsi Nusa Tenggara
Timur
Korelasi Antar Peubah Bebas
Analisis Komponen Utama
Pemodelan yang Memperhatikan Pengaruh Wilayah
Pemodelan yang Memperhatikan Pengaruh Waktu dan Wilayah
Perbandingan Antar Model

Interpretasi Model Terbaik

1
2
3
3
3
3
4
4
5
6
7
7
8
10
10
11
12
12
13
13
15

5. SIMPULAN DAN SARAN

17

DAFTAR PUSTAKA
LAMPIRAN
RIWAYAT HIDUP

17
19
32

DAFTAR TABEL
1
2

3
4
5
6
7

Struktur umum dari working correlation matrix
Tabel klasifikasi 2 x 2 yang menjelaskan hubungan antara nilai
prediksi dan observasi sesuai dengan nilai cut off yang telah
ditentukan
Korelasi pearson antar peubah X1, X2, X3, X4, X5, X6, dan X7
Akar ciri pada Analisis Komponen Utama (AKU) dengan
menggunakan matrik korelasi
Ukuran kebaikan suai masing-masing model
Hubungan peubah asal dengan komponen utama
Ringkasan analisis komponen utama

5

7
11
12
15
16
16

DAFTAR GAMBAR
1
2
3
4
5
6

Persentase penduduk miskin di Indonesia tahun 2014
Komponen penyusunan model GLMM
Tahapan-tahapan analisis data
Tingkat kemiskinan per kabupaten/kota di Provinsi Nusa Tenggara
Timur tahun 2002 – 2013
Skema peta Provinsi Nusa Tenggara Timur per kabupaten/kota
berdasarkan tingkat kemiskinan pada tahun 2013
Perbandingan model yang memperhatikan pengaruh wilayah (Model
1) dan model yang memperhatikan pengaruh wilayah dan waktu
(Model 2 dan Model 3)

2
6
9
10
11
14

DAFTAR LAMPIRAN
1
2

3
4
5
6
7
8
9
10
11
12
13

Pendugaan parameter untuk Model 1 (GLM + Wilayah sebagai
pengaruh tetap
Perbandingan Pendugaan parameter untuk Model 2 (GEE waktu
AR(1) + wilayah sebagai pengaruh tetap) dengan Model 3 (GLMM
waktu sebagai pengaruh acak + wilayah sebagai pengaruh tetap)
Matrik working correlation pada Model 2 dengan menggunakan
struktur autoregresi lag 1 tahun
Hasil pendugaan parameter kovarian dan hasil pendugaan parameter
Model 3 yaitu waktu sebagai pengaruh acak
Data jumlah penduduk miskin (ribu jiwa) di Provinsi Nusa Tenggara
Timur per Kabupaten tahun 2004 – 2013
Angka Melek Huruf (AMH) di Provinsi Nusa Tenggara Timur per
Kabupaten/Kota tahun 2004 – 2013
Rata-rata lama sekolah (Tahun) di Provinsi NTT per Kabupaten/Kota
tahun 2004 - 2013
Angka Harapan Hidup (Tahun) di Provinsi Nusa Tenggara Timur per
Kabupaten/Kota tahun 2004 - 2013
Rata-rata pendapatan perkapita (juta rupiah) di Provinsi Nusa
Tenggara Timur per Kabupaten/Kota tahun 2004 - 2013
Pertumbuhan Ekonomi (persen) di Provinsi Nusa Tenggara Timur per
Kabupaten/Kota tahun 2004 - 2013
Jumlah Pengangguran Terbuka (jiwa) di Provinsi Nusa Tenggara
Timur per Kabupaten/Kota tahun 2004 - 2013
Pengeluaran per kapita (ribu rupiah ) di Provinsi Nusa Tenggara
Timur per Kabupaten/Kota tahun 2004 - 2013
Jumlah Penduduk (ribu jiwa) di Provinsi Nusa Tenggara Timur per
Kabupaten/Kota tahun 2004 - 2013

19
20

21
22
23
24
25
26
27
28
29
30
31

1

1 PENDAHULUAN
Latar Belakang
Kemiskinan adalah kondisi kehidupan yang serba kekurangan yang dialami
seseorang yang pengeluaran per kapitanya selama sebulan tidak cukup untuk
memenuhi kebutuhan standar hidup minimum. Kebutuhan standar hidup minimum
digambarkan dengan Garis Kemiskinan (GK), yaitu batas minimum pengeluaran
per kapita per bulan untuk memenuhi kebutuhan minimum makanan dan bukan
makanan (BPS 2003). Batas kecukupan minimum makanan mengacu pada Widya
Karya Nasional Pangan dan Gizi pada tahun 1978, yaitu besarnya rupiah yang
dikeluarkan untuk makanan yang memenuhi kebutuhan minimum energi 2100
kilokalori per kapita per hari, sedangkan kebutuhan minimum bukan makanan
mencakup pengeluaran untuk perumahan, penerangan, bahan bakar, pakaian,
pendidikan, kesehatan, transportasi, barang-barang tahan lama serta barang dan jasa
esensial lainnya. Jumlah orang miskin dapat dilihat melalui jumlah orang yang
berada di bawah atau sama dengan garis kemiskinan (BPS 2003).
Tingkat kemiskinan dapat diamati sebagai data panel. Data panel merupakan
gabungan antara data cross section dan data time series, dimana unit cross section
yang sama diamati pada waktu yang berbeda-beda. Data panel dapat diartikan data
yang memperhatikan subyek dan waktu amatan. Pada penelitian terhadap beberapa
unit observasi dengan waktu yang bersamaan biasanya kurang memberikan
informasi yang lebih. Menurut Gujarati (2003) penggunaan data panel memiliki
banyak keuntungan, yaitu lebih informatif dan lebih efisien dalam pendugaan
parameternya. Akan tetapi ketika data yang diamati dengan selang waktu tertentu
berulang kali, maka antar waktu akan memiliki data yang berkorelasi atau saling
tak bebas. Sama halnya dengan tingkat kemiskinan yang diamati dari tahun ke
tahun, maka antar data kemiskinan juga saling berkorelasi.
Tingkat kemiskinan suatu wilayah diukur dengan melihat jumlah penduduk
miskin dibandingkan dengan jumlah penduduk total di suatu wilayah. Jumlah
penduduk miskin merupakan kumulatif dari individu/orang miskin. Penduduk
miskin dapat dinyatakan dalam peubah acak biner Z, dimana kejadian penduduk
dalam kondisi miskin dinyatakan dengan nilai Zi = 1 dan kejadian penduduk tidak
dalam kondisi miskin dengan nilai Zi = 0. Apabila peluang terjadinya kejadian
penduduk dalam kondisi miskin dinyatakan sebesar pi maka sebarannya akan
mengikuti sebaran Bernoulli (pi). Dimana nilai peluang pi untuk penduduk miskin
berbeda-beda tergantung pada karakteristik penduduk tersebut. Jika Yi =
∑�=� � adalah peubah acak yang menyatakan jumlah penduduk miskin pada
wilayah ke-i. Maka sebaran peubah acak Yi mengikuti sebaran Binomial (ni, pi)
Metode analisis statistik sangat bergantung pada skala pengukuran dari peubah
respon dan peubah penjelasnya. Oleh karena itu untuk memodelkan jumlah
penduduk miskin, model linier klasik dengan asumsi normalitas dan
homoskedastisitas tidak dapat dipenuhi. Sebaran data bagi Yi ~ Binomial (ni, pi)
berimplikasi juga kepada ragam yang tidak homogen yang merupakan fungsi dari
nilai harapannya Var (Yi) = ni pi (1 – pi).
Pendekatan yang dapat digunakan untuk mengatasi ketaknormalan sebaran
peubah respon adalah Generalized Linear Model (GLM). GLM merupakan metode

2

pada model regresi untuk data univariate yang dianggap memiliki sebaran keluarga
eksponensial (McCullagh dan Nelder 1989). Generalized Estimating Equations
(GEE) adalah pengembangan dari GLM yang merupakan suatu metode pendugaan
parameter untuk data yang peubah responnya terjadi autokorelasi karena data
diamati dari waktu ke waktu. Generalized Linear Mixed Models (GLMM)
merupakan pengembangan dari GLM yang dapat digunakan untuk mengatasi
sebaran data peubah respon yang tidak menyebar normal dan data yang memiliki
autokorelasi.

Tingkat Kemiskinan (%)

30
25
20

19.60%

15
10
5
Papua Barat
Papua
Maluku Utara
Maluku
Sulawesi Tenggara
Sulawesi Barat
Sulawesi Selatan
Sulawesi Tengah
Gorontalo
Sulawesi Utara
Kalimantan Timur
Kalimantan Selatan
Kalimantan Tengah
Kalimantan Barat
Nusa Tenggara Timur
Nusa Tenggara Barat
Bali
Jawa Timur
DI Yogyakarta
Jawa Tengah
Banten
Jawa Barat
DKI Jakarta
Lampung
Bengkulu
Bangka Belitung
Sumatera Selatan
Jambi
Kepulauan Riau
Riau
Sumatera Barat
Sumatera Utara
Aceh

0

Provinsi di Indonensia

Gambar 1. Persentase penduduk miskin di Indonesia tahun 2014
Berdasarkan data Badan Pusat Statistik tentang persentase dan jumlah
penduduk miskin Indonesia pada tahun 2014 seperti disajikan pada Gambar 1, dapat
disimpulkan bahwa Provinsi Nusa Tenggara Timur merupakan Provinsi yang
memiliki persentase jumlah penduduk miskin terbesar ketiga setelah Provinsi Papua
dan Provinsi Papua Barat yaitu sebesar 19,60 persen. Hal ini yang melatarbelakangi
penelitian mengenai Pemodelan Data Panel Kemiskinan di Provinsi Nusa Tenggara
Timur (NTT) menggunakan GEE dan GLMM.
Perumusan Masalah
Berdasarkan latar belakang di atas, masalah yang akan dibahas dalam
penelitian ini antara lain faktor-faktor apa saja yang mempengaruhi kemiskinan di
Provinsi Nusa Tenggara Timur dengan menggunakan pendekatan GEE dan GLMM
yang memperhatikan pengaruh wilayah maupun yang memperhatikan pengaruh
waktu dan wilayah, serta membandingkan kedua pendekatan tersebut, model
manakah yang terbaik.

3

Tujuan Penelitian
Tujuan dari penelitian ini antara lain.
1. Membentuk model data kemiskinan di Provinsi NTT dengan memperhatikan
pengaruh wilayah maupun yang memperhatikan pengaruh waktu dan wilayah.
2. Membandingkan pemodelan menggunakan GEE dan GLMM pada kasus data
kemiskinan di Provinsi NTT untuk melihat model mana yang paling baik untuk
kasus tersebut.
3. Mengetahui faktor-faktor yang mempengaruhi tingkat kemiskinan di Provinsi
NTT.
Manfaat Penelitian
Penelitian ini berguna untuk mengetahui faktor-faktor apa saja yang
mempengaruhi tingkat kemiskinan dan juga memprediksi tingkat kemiskinan di
waktu yang akan datang, sehingga pengambil kebijakan di Provinsi Nusa Tenggara
Timur bisa mengupayakan penurunan tingkat kemiskinan dengan lebih cepat dan
efektif.

2 TINJAUAN PUSTAKA
Penelitian Sebelumnya Tentang Kemiskinan
Penyebab kemiskinan berlandaskan pada teori lingkaran kemiskinan/
vicious circle of poverty (Nurkse 1953). Yang dimaksud lingkaran kemiskinan
adalah suatu rangkaian kekuatan yang saling mempengaruhi satu sama lain
sehingga menimbulkan suatu kondisi di mana sebuah negara akan tetap miskin dan
akan mengalami banyak kesulitan untuk mencapai tingkat pembangunan yang lebih
tinggi. Dari teori Nurkse maka dapat diketahui beberapa faktor yang menyebabkan
kemiskinan, antara lain tingkat pendapatan, tingkat pendidikan, dan besarnya
konsumsi. Peubah-peubah tersebut dapat berpengaruh langsung maupun tidak
langsung terhadap besarnya jumlah penduduk miskin di suatu daerah.
Penelitian tentang kemiskinan pernah dilakukan sebelumnya oleh
Anggraeni (2012) dengan menggunakan analisis spasial data panel untuk
mengetahui faktor-faktor yang mempengaruhi kemiskinan di provinsi Sumatera
Selatan. Dari hasil penelitian dengan analisis spasial data panel dapat diketahui
faktor yang signifikan mempengaruhi tingkat kemiskinan adalah angka melek huruf
dan tingkat pengangguran terbuka. Rusdi (2012) mengemukakan bahwa peubah
indeks pembangunan manusia, tingkat pengangguran dan produk domestik regional
bruto berpengaruh terhadap kemiskinan. Nuraeni (2009) melakukan penelitian
tentang teknik Pendugaan Wilayah Kecil/Small Area Estimation (SAE) untuk
mendapatkan ukuran kemiskinan dengan pendekatan Neural Network. Penelitian
ini mempunyai tujuan untuk mendapatkan ukuran kemiskinan sampai level
kecamatan. Karakteristik yang mempengaruhi status kemiskinan berdasarkan
penelitian tersebut antara lain karakteristik demografi, ekonomi, sosial dan
karakteistik wilayah.

4

Model Linier Terampat (Generalized Linear Models/GLM)
GLM merupakan pengembangan dari model linear klasik dimana peubah
acak Y, merupakan suatu komponen yang bebas dengan nilai tengah (µ i). Ada tiga
komponen utama dalam GLM (McCullagh dan Nelder 1989):
i) Komponen acak, yaitu komponen dari Yi yang bebas dan menyebar dengan
E(Yi) = µ i dan V(Yi) = σi2.
ii) Komponen sistematik, yaitu X1, X2, … , Xp yang menghasilkan penduga linear
, dimana η = Xβ.
iii) Fungsi penghubung = g(µ)
Dalam model linear klasik komponen (i) menyebar normal dan komponen
(iii) merupakan fungsi identitas. Sedangkan dalam GLM komponen (i) mungkin
berasal dari salah satu anggota keluarga sebaran eksponensial lainnya dan
komponen (iii) merupakan fungsi monoton lainnya (Mc Cullagh dan Nelder, 1989).
Dengan demikian GLM dapat dimodelkan dengan
g(E(Yi|x)) = g(µ) = � + �

+

+ ��



=�

sedangkan ragam Yi merupakan fungsi dari nilai tengah respons, var(Yi) =Φ � � .
Generalized Estimating Equation (GEE)

Zeger dan Liang (1986) memperkenalkan suatu pendekatan alternatif untuk
melakukan pendugaan parameter berbasis fungsi kemungkinan. Metode tersebut
dikenal dengan nama Generalized Estimating Equations (GEE). Uraian dari GEE
diperkenalkan Liang dan Zeger (1986) terutama untuk mengatasi masalah korelasi.
Pada dasarnya GEE juga menggunakan teori kuasi kemungkinan.
Pendekatan GEE pada model � � = � � + � � menggunakan quasi-score
likelihood untuk menduga parameter �. Persamaan quasi-score likelihood dapat
dituliskan sebagai berikut.
= ∑�= �

� =



� − [ �] =

� [ �]
⁄�� dan

=�



��

dengan




� adalah matriks diagonal dengan elemen var( � ), � adalah working
correlation matrix untuk , dan ∅ adalah konstanta (Dobson 2002). Ada berbagai
struktur dari working correlation matrix dalam pemodelan GEE. Tabel 1 adalah
beberapa struktur umum dari working correlation matrix.

5

Tabel 1 Struktur umum dari working correlation matrix
Struktur
Contoh
Keterangan

Bebas
Tidak ada korelasi diantara

amatan yang diulang
[
]


Bisa
dipertukarkan

Tidak
berstruktur

Autoregresi




[

[



��




�−

� �




��



[�

(Horton dan Lipsitz 1999)

�−




… �
… �
]



Korelasi antar pengamatan
yang diulang adalah sama

… ��
… ��
]








��−
��−


Korelasi
bervariasi
pada
masing-masing kelompok dari
amatan
Korelasi adalah fungsi dari
waktu diantara pengamatan.

]

Model Linier Terampat Campuran (Generalized Linear Mixed
Models/GLMM)
Apabila ke dalam model linear klasik kemudian ditambahkan suatu
komponen acak sebagai peubah penjelas sehingga modelnya menjadi:
= � + � + � atau |� ~ � � + �, ∑
dengan � ~ N(0, D),
� ~N(0,Σ),
X dan Z adalah matriks rancangan,
Σ dan D matriks peragam yang bergantung pada komponen ragam yang
tidak diketahui (Kachman 1998).
Model di atas dikenal dengan nama Linear Mixed Models (LMM). Walaupun
demikian ada beberapa batasan dalam LMM antara lain:
a) Ragam bukan merupakan fungsi dari nilai tengah respons
b) Respons dapat dimodelkan sebagai fungsi linear, dan
c) Pengaruh acak menyebar normal.
Seperti halnya pada LMM, di dalam GLMM juga mengandung pengaruh
tetap β, pengaruh acak � ~N(0, D), memiliki matriks rancangan X dan Z, memiliki
satu vektor observasi Y yang memiliki sebaran bersyarat oleh pengaruh acak
dengan nilai tengah µ dan peragam Σ. Selain itu, dalam GLMM juga memiliki
penduga linear η, fungsi penghubung dan atau inversnya. Nilai harapan bersyarat µ
bergantung pada penduga linear melalui invers fungsi penghubung h(.) dan matriks
peragam Σ bergantung pada µ melalui fungsi ragam (Kachman 1998). Komponen
penyusun model GLMM dapat dijelaskan seperti pada Gambar 2.

6

σ

Komponen Ragam
D

Pengaruh tetap



Invers fungsi
hubung

� Pengaruh Acak

�+ �

ℎ �



Fungsi hubung



Nilai tengah

Σ Galat

Pengamatan
y
Gambar 2. Komponen penyusun model GLMM
Dalam LMM, pengaruh tetap dan acak digabungkan membentuk suatu
penduga linear � = � + �. Vektor observasi Y diperoleh dengan menambahkan
suatu galat � ~N(0,Σ) sehingga
= � + � = � + � + � , dengan kata lain
peubah |� dapat dimodelkan sebagai |� ~ � �, ∑ . Sedangkan pada GLMM
digunakan pendekatan lain untuk memodelkan |�, yaitu |� ~ � � , ∑ yang
menyatakan bahwa sebaran bersyarat |� memiliki nilai tengah � dan peragam
Σ (Kachman 1998).
Uji Kebaikan Suai
Kebaikan suai model dievaluasi menggunakan SSE, RMSE dan Receiving
Operating Characteristic (ROC) Curve.
1. Sum Square Error (SSE)
SSE mengukur penyimpangan nilai peubah respon terhadap nilai dugaannya.
SSE juga sering disebut Sum Square of Residuals. SSE mempunyai formula
penghitungan sebagai berikut.
= ∑�= {
− ̂ },
sedangkan
adalah nilai data pengamatan dan ̂ adalah nilai prediksinya.
merupakan pembobot yang dipakai pada masing-masing data, biasanya nilai
=
. Nilai SSE yang mendekati 0 mengindikasikan bahwa model memiliki nilai
sisaan terkecil dan model layak dan akan berguna untuk peramalan.

7

2. Root Mean Squared Error
Statistik ini juga dikenal sebagai fit standard error. RMSE adalah penduga
simpangan baku dari komponen acak pada data dan didefinisikan sebagai berikut.
RMSE = s = (MSE)½
sedangkan MSE adalah mean square error atau residual mean square.
MSE=SSE/db, dimana db (derajat bebas) = n – k, n adalah banyaknya unit
observasi dan k adalah banyaknya parameter yang diduga. Sama halnya dengan
SSE, nilai MSE semakin mendekati 0 mengindikasikan model berguna untuk
prediksi.
3. Receiving Operating Characteristic (ROC) Curves
Ide dasar fitting model disini adalah menghitung semua nilai prediksi.
Kemudiain menentukan nilai cut off yang akan mengklasifikasikan semua nilai
prediksi menjadi dua bagian, nilai prediksi di atas cut off dan di bawah cut off.
Hubungan antara nilai prediksi dan observasi sesuai dengan cut off yang sudah
ditentukan dicantumkan pada Tabel 2.
Tabel 2 Tabel klasifikasi 2 x 2 yang menjelaskan hubungan antara nilai prediksi
dan observasi sesuai dengan cut off yang telah ditentukan
Observasi
Prediksi
Positif
Negatif
Positif
Negatif

Benar dan positif
(True Positive/TP)
Salah dan negatif
(False Negative/FN)

Salah dan positif
(False Positive/FP)
Benar dan Negatif
(True Negative/TN)

Dari tabel ini dapat dihitung Nilai Prediksi Positif (Positive Predicted
Value/PPV) dan Nilai Prediksi Negatif (Negative Predicted Value/NPV) yang
mewakili nilai sensitivity dan specificity. Formula penghitungan PPV dan NPV
sebagai berikut:
��
��
��� =
dan ��� =
��+��
��+��

Kurva ROC dibuat berdasarkan nilai sensitivity dan specificity, dan dihitung
luas dibawah kurva ROC atau yang dikenal sebagai area under the ROC curve
(AUC). Dengan demikian model yang baik untuk memprediksi akan memiliki nilai
sensitivity dan specificity yang besar, jadi semakin baik model maka nilai AUC juga
semakin mendekati satu.

3 METODE
Sumber Data
Peubah respon yang digunakan dalam penelitian ini adalah jumlah
penduduk miskin pada setiap kabupaten/kota di Provinsi Nusa Tenggara Timur dari
tahun 2004 sampai dengan tahun 2013. Peubah penjelas dalam penelitian ini adalah:

8

X1 :
X2 :
X3 :
X4 :
X5 :
X6 :

Angka Melek Huruf (persentase),
Rata-rata lama sekolah (tahun),
Angka Harapan Hidup (tahun),
Pendapatan perkapita atas dasar harga konstan (rupiah),
Pertumbuhan Ekonomi (persentase),
Tingkat Pengangguran (proporsi pengangguran terbuka terhadap jumlah
penduduk),
X7 : Pengeluaran per kapita (rupiah).
Peubah tersebut diambil berdasarkan penelitian Anggraeni (2012) untuk peubah
angka melek huruf dan tingkat pengangguran, Rusdi (2012) untuk peubah rata-rata
lama sekolah, pendapatan perkapita, angka harapan hidup, pengeluaran per kapita.
Semua data diperoleh dari publikasi Badan Pusat Statsitik, dan terjadi unbalanced
data.
Unbalanced data disebabkan karena adanya pemekaran kabupaten pada
deret waktu yang ditentukan sebagai waktu amatan. Beberapa kabupaten/kota dapat
ditelusuri periode waktu kebelakang lebih lama dari kabupaten/kota yang lainnya.
Kabupaten-kabupaten yang mengalami pemekaran antara lain.
a) Kabupaten Rote Ndao (pemekaran dari Kabupaten Kupang)
b) Kabupaten Manggarai Barat (pemekaran dari Kabupaten Manggarai)
c) Kabupaten Sumba Tengah dan Sumba Barat daya (pemekaran dari
Kabupaten Sumba Barat)
d) Kabupaten Nagekeyo (pemekaran dari Kabupaten Ngada)
e) Kabupaten Manggarai Timur (pemekaran dari Manggarai)
f) Kabupaten Sabu Raijua (pemekaran dari Kabupaten Kupang)
Tahapan Analisis Data
1. Eksplorasi data tingkat kemiskinan per kabupaten/kota di Provinsi Nusa
Tenggara Timur dari tahun 2004 – 2013.
2. Mengidentifikasi adanya multikolinearitas melalui korelasi antar peubah
bebas yang mempengaruhi tingkat kemiskinan dan mengatasi masalah
multikolinearitas.
3. Pemodelan dengan memperhatikan pengaruh wilayah.
 Model GLM dengan wilayah sebagai pengaruh tetap
��
=� +� � + +� � +�
+ +�
……… (1)
�n
−��

dimana � adalah proporsi penduduk miskin ke-i dan adalah peubah
boneka wilayah. Pendugaan parameter dilakukan dengan Penduga
Kemungkinan Maksimum atau Maximum Likelihood Estimation (MLE).
Pada model ini pemilihan kabupaten/kota (wilayah) telah ditetapkan
terlebih dahulu sebanyak 21 kabupaten/kota, sehingga kabupaten/kota
dianggap sebagai pengaruh tetap.
4. Pemodelan dengan memperhatikan pengaruh waktu dan wilayah
 Model GEE dengan wilayah sebagai pengaruh tetap

�n −�� = � + � � + + � � + �
+ +�
…….…. (2)


dengan adalah peubah boneka wilayah karena wilayah sebanyak 21
kabupaten/kota telah dipilih dan ditetapkan dalam penelitian sehingga di
dalam model dianggap sebagai pengaruh tetap. Pemodelan dengan GEE

9

menggunakan persamaan quasi-score likelihood untuk menduga
parameter dan melihat pengaruh waktu dengan memasukan working
correlation matrix dengan struktur AR(1).
 Model GLMM dengan waktu sebagai pengaruh acak dan wilayah sebagai
pengaruh tetap.
��
=� +� � + +� � +�
+ +�
+ � ..… (3)
�n
−��

dengan adalah peubah boneka wilayah sebagai pengaruh tetap dan �
adalah waktu sebagai pengaruh acak ke-t (t = 1,2, …,10). Pengaruh
wilayah ditentukan sebagai pengaruh tetap karena wilayah telah
ditetapkan terlebih dahulu sebanyak 21 kabupaten sedangkan waktu
dianggap sebagai pengaruh acak karena selain ingin diketahui keragaman
antar waktu pada masing-masing kabupaten/kota di Provinsi Nusa
Tenggara Timur.
5. Perbandingan antar model dengan melihat uji kebaikan suai dengan
menggunakan Sum Square Error (SSE), Mean Square Error (MSE) dan
Receiving Operating Characteristic (ROC) Curve.
6. Interpretasi Model
Tahapan-tahapan analisis data dapat ditampilkan secara ringkas pada Gambar 3.
Data Kemiskinan Prov. NTT

Pemeriksaan
Korelasi

Peubah dalam

- Terjadi autokorelasi
- Menyebar tak normal
- Unbalanced data

Eksplorasi

penelitian
Ya

AKU

Apakah terjadi
kolinearitas?

Pemodelan
Tidak

Memperhatikan pengaruh wilayah

Memperhatikan pengaruh waktu dan wilayah

Model 2
GEE+waktu AR(1) +
wilayah fixed

Model 1
GLM + wilayah fixed

Perbandingan
Model

Model terbaik

Interpretasi
Model

Gambar 3 Tahapan-tahapan analisis data

Model 3
GLMM + waktu random
+ wilayah fixed

10

4 HASIL DAN PEMBAHASAN
Eksplorasi Data Tingkat Kemiskinan di Provinsi Nusa Tenggara Timur
Gambar 4 menyajikan data tingkat kemiskinan dari BPS. Dari gambar
tersebut terlihat bahwa setiap kabupaten memiliki tingkat kemiskinan yang
berbeda-beda dan beragam. Tingkat kemiskinan pada setiap kabupaten/kota di
Provinsi NTT memiliki kecenderungan mengalami penurunan dari tahun ke tahun.
Tingkat kemiskinan yang tinggi terjadi pada Kabupaten Sumba Barat, Sabu Raijua,
Sumba Tengah dan Sumba Timur.
50.00

Tingkat Kemiskinan ( dalam %)

45.00

40.00
35.00
30.00
25.00
20.00
15.00
10.00
5.00
-

2002

2003

Sumba Barat
TTU
Flores Timur
Manggarai
Sumba Barat Daya
Kota Kupang

2004

2005

2006

Sumba Timur
Belu
Sikka
Rote Ndao
Nagekeo
NTT

2007

2008

2009

2010

Kupang
Alor
Ende
Manggarai Barat
Manggarai Timur *)

2011

2012

2013

TTS
Lembata
Ngada
Sumba Tengah
Sabu Raijua *)

Gambar 4 Tingkat kemiskinan per kabupaten/kota di Provinsi Nusa Tenggara
Timur tahun 2002 – 2013
Tahun 2005 dan 2006 terjadi peningkatan kemiskinan secara serentak
diseluruh kabupaten/kota di Provinsi NTT. Hal tersebut dapat disebabkan karena
adanya kenaikan harga bahan bakar minyak pada tahun 2005 dan 2006. Tahun 2008
juga terjadi kenaikan tingkat kemiskinan di beberapa kabupaten (Kota Kupang,
Kabupaten Ende dan Rote Ndao), hal ini dapat dikarenakan pengaruh krisis dunia
yang terjadi pada tahun 2008. Krisis ini hanya berimbas pada daerah yang
mempunyai hubungan langsung dengan luar negeri misal melalui sektor pariwisata.
Gambar 5 menyajikan penyebaran tingkat kemiskinan di Provinsi Nusa
Tenggara Timur berdasarkan pengelompokan tingkat kemiskinan kabupaten/kota.
Pengelompokan tingkat kemiskinan dalam Gambar 5 dibedakan menjadi tiga
kelompok. Kelompok pertama adalah wilayah kabupaten/kota dengan tingkat
kemiskinan lebih tinggi dari tingkat kemiskinan Provinsi NTT. Kelompok kedua
adalah wilayah kabupaten/kota dengan tingkat kemiskinan berada di antara tingkat
kemiskinan Provinsi NTT dan tingkat kemiskinan nasional. Kelompok ketiga
adalah wilayah kabupaten/kota dengan tingkat kemiskinan lebih rendah dari tingkat
kemiskinan nasional. Sebagai informasi tingkat kemiskinan di tingkat nasional
sebesar 11.37% dan tingkat kemiskinan di Provinsi NTT sebesar 20.24%.

11

Gambar 5

Skema peta Provinsi Nusa Tenggara Timur per kabupaten/kota
berdasarkan tingkat kemiskinan pada tahun 2013
Korelasi Antar Peubah Bebas

Ketika ingin dilihat ada tidaknya korelasi antar peubah bebas (angka melek
huruf, rata-rata lama sekolah, angka harapan hidup, pendapatan perkapita,
pertumbuhan ekonomi, tingkat pengangguran, dan pengeluaran riil perkapita) maka
dapat digunakan korelasi pearson. Tabel 3 menyajikan korelasi pearson antar
peubah bebas dalam penelitian. Dari Tabel 3 dapat disimpulkan bahwa diatara
beberapa peubah bebas terjadi korelasi yang nyata. Hal tersebut dapat menyebabkan
multikolinearitas pada saat pemodelan. Untuk menangani multikolinearitas dalam
penelitian ini digunakan analisis komponen utama. Analisis komponen utama
digunakan agar peubah baru yang dihasilkan tidak saling berkorelasi dan
merupakan kombinasi linear dari peubah bebasnya.
Tabel 3 Korelasi pearson antar peubah X1, X2, X3, X4, X5, X6, dan X7
Korelasi Pearson X1
X2
X3
X4
X5
X6
0.69*
X2
0.54*
0.66*
X3
0.42*
0.82*
0.53*
X4
0.08
0.39*
0.27*
0.43*
X5
0.19*
0.51*
0.35*
0.53*
0.26*
X6
0.31*
0.54*
0.24*
0.41*
0.02
0.06
X7

*) signifikan pada taraf nyata α =0.0η

12

Analisis Komponen Utama (AKU)
Ada berbagai cara untuk menangani masalah multikolinearitas, salah
satunya dengan menggunakan Analisis Komponen Utama (AKU). Tujuan utama
dari AKU adalah mereduksi dimensi data besar dan saling berkorelasi menjadi
dimensi yang lebih kecil dan saling bebas. Peubah baru ini merupakan kombinasi
linier dari peubah asal dan disebut dengan komponen utama. Karena peubah bebas
memiliki satuan yang berbeda-beda maka sebelumnya dibakukan menjadi peubah
Z dan digunakan matriks korelasi sebagai dasar dalam pembentukan Komponen
Utama.
Tabel 4 menyajikan hasil penghitungan akar ciri dari matrik korelasi peubah
bebas dalam penelitian. Akar ciri yang dihasilkan dari penghitungan tersebut
mewakili keragaman yang dapat dijelaskan peubah bebas. Dari Tabel 4 akan
digunakan tiga komponen utama yaitu didasarkan pada proporsi kumulatif
keragaman total yang nilainya di atas 0.70 (Jollife 2002), dengan demikian 0.78
atau 78 % informasi dari peubah bebas diwakili oleh tiga komponen utama.
Tabel 4 Akar ciri pada Analisis Komponen Utama (AKU) dengan menggunakan
matrik korelasi
Akar ciri
Proporsi
Proporsi kumulatif

PC1
3.53
0.51
0.51

PC2
1.14
0.16
0.67

PC3
0.80
0.12
0.78

PC4
0.72
0.10
0.89

PC5
0.43
0.06
0.95

PC6
0.29
0.04
0.99

PC7
0.09
0.01
1.00

Pemodelan yang Memperhatikan Pengaruh Wilayah
Berdasarkan Persamaan (1) diperoleh sebuah model yaitu Model 1 sebagai
berikut:
 Model 1: Model GLM dengan wilayah sebagai pengaruh tetap
Dari hasil pendugaan parameter dengan metode MLE diperoleh model sebagai
berikut.

�n −�� = − . − . � − . � − . � +


Dengan � = . , − . , . , − . , . , . , . , . , . , . ,
− . ,− . , . ,− . , . , . , . , . , . , .
yang merupakan penduga parameter peubah boneka untuk wilayah berturutturut sebagai berikut Alor, Belu, Ende, Flores Timur, Kota Kupang, Kupang,
Lembata, Manggarai, Manggarai Barat, Manggarai Timur, Nagekeo, Ngada,
Rote Ndao, Sikka, Sumba Barat, Sumba Barat Daya, Sumba Tengah, Sumba
Timur, TTS, dan TTU, dengan referensi wilayah adalah Kabupaten Sabu
Raijua.

13

Pemodelan yang Memperhatikan Pengaruh Waktu dan Wilayah
Berdasarkan Persamaan (2) dan (3) diperoleh dua buah model yaitu Model 2
dan Model 3 sebagai berikut:
 Model 2: Model GEE dengan pengaruh waktu didekati dengan menggunakan
struktur working correlation matrix AR(1) dan pengaruh wilayah sebagai
pengaruh tetap
��
=− . − . � − . � − . � +
�n
−��

dengan � = (0.36, -0.19, 0.29, -0.41, 0.08, 0.58, 0.58, 0.50, 0.18, 0.30, -0.25, 0.42, 0.55, -0.17, 0.93, 0.64, 0.80, 0.76, 0.73, 0.47) yang merupakan penduga
parameter peubah boneka untuk wilayah.

 Model 3: Model GLMM dengan pengaruh waktu sebagai pengaruh acak dan
pengaruh wilayah sebagai pengaruh tetap
�n

��

−��

=− .

− .



− .



− .



+

+



dimana
adalah peubah boneka wilayah (i=1,2, …,20) dan � adalah
pengaruh acak ke-t. � = (0.40, -0.16, 0.32, -0.38, 0.08, 0.58, 0.62, 0.52, 0.21,
0.35, -0.22, -0.30, 0.58, -0.14, 0.93, 0.66, 0.81, 0.79, 0.75, 0.50) yang
merupakan penduga parameter peubah boneka untuk wilayah. T = (-0.03, 0.01,
0.09, 0.05, 0.02, -0.04, -0.03, -0.05, -0.03, 0.02) merupakan penduga parameter
untuk pengaruh acak waktu ke-t dengan nilai penduga parameter ragam
peragam untuk pengaruh acak waktu �� =0.0032
Untuk perbandingan pendugaan parameter Model 2 dengan Model 3 dapat
dilihat pada Lampiran 2.

Perbandingan Antar Model
Keakuratan Model
Salah satu kegunaan model adalah untuk melakukan prediksi atau
peramalan, sehingga model yang baik adalah model yang mempunyai keakuratan
tinggi dalam memprediksi. Keakuratan dalam memprediksi dapat digambarkan
dengan menggunakan plot antara tingkat kemiskinan dengan nilai prediksinya.
Gambar 6 menyajikan plot antara tingkat kemiskinan dengan nilai prediksinya.
Dari Gambar 6 dapat dilihat perbandingan antara Model 1, Model 2 dan
Model 3, dimana model dengan sebaran plot lebih mendekati garis diagonal akan
menunjukan bahwa model terseebut mempunyai kemampuan prediksi lebih baik
dibandingkan model lainnya. Antara Model 1, Model 2 dan Model 3 agak sulit
ditentukan mana yang terbaik hanya melalui Gambar 6, karena gambar plot yang
dihasilkan kelihatan mirip. Sehingga perlu menggunakan alat lain untuk
membandingkan ketiga model ini.

14

Model 1
0.5

Poverty rate

0.4
0.3
0.2
0.1
0
0.1

0.2

0.3

predicted

Model 2

0.5

0.5

Model 3

0.5

Poverty rate

0.4

Poverty rate

0.4

0.3
0.2
0.1

0.4
0.3
0.2
0.1

0

0
0.1

Gambar 6.

0.2

0.3

predicted

0.4

0.5

0.1

0.2

0.3
Predicted

0.4

0.5

Perbandingan model yang memperhatikan pengaruh wilayah (Model
1) dan model yang memperhatikan pengaruh wilayah dan waktu
(Model 2 dan Model 3)

Perbandingan Model dengan Melihat Ukuran Kebaikan Suai
Penentuan model terbaik dilihat dari nilai RMSE paling kecil dan memiliki
nilai luas dibawah kurva ROC paling mendekati satu. Tabel 5 menyajikan
perbandingan antara Model 1, Model 2 dan Model 3 dengan ukuran kebaikan suai
dan luas di bawah kurva ROC. Dari Tabel 5 dapat kita bandingkan Model 1, Model
2 dan Model 3 memiliki nilai RMSE dan luas dibawah kurva ROC yang agak
bervariasi.
Model 1 merupakan pemodelan yang memperhatikan pengaruh wilayah
(kabupaten/kota) sebagai pengaruh tetap, kemampuan memprediksi dari model
dapat dikatakan cukup baik dilihat dari nilai MSE yang mendekati nilai nol. Model
2 dan Model 3 merupakan pemodelan yang memperhatikan pengaruh waktu dan
wilayah. Apabila dibandingkan nilai RMSE dan luas wilayah di bawah kurva ROC
dapat disimpulkan Model 3 adalah model yang lebih baik untuk memprediksi
karena nilai luas wilayah di bawah kurva ROC paling mendekati nilai satu.
Jadi Model 3 (GLMM dengan waktu sebagai pengaruh acak dan wilayah
sebagai pengaruh tetap) adalah model terbaik untuk pemodelan tingkat kemiskinan
di Provinsi Nusa Tenggara Timur dibandingkan Model 2 (model GEE dengan
struktur working correlation matrix Autoregresive dengan lag 1 dan wilayah
sebagai pengaruh tetap). Penambahan pengaruh waktu pada model lebih tepat
dianggap sebagai pengaruh acak dibandingkan pada model GEE yang
mengakomodir pengaruh waktu dalam struktur working correlation matrix (AR 1).

15

Tabel 5 Ukuran kebaikan suai masing-masing model
Model 1
Model 2
Model 3
GLM+
GEE+
GLMM Waktu
Wilayah
Wilayah
acak + Wilayah
fixed
fixed
Fixed
Chi Square
198.42
177.65
Chi square/df
1.20
1.07
IC
AIC=
QIC=
PseudoAIC=
1275.63
171.97
-43.47
SSE
0.14
0.14
0.12
MSE
0.00
0.00
0.00
RMSE
0.03
0.03
0.03
Luas ROC Curve
98.91%
98.89%
99.39%
Interpretasi Model Terbaik
Model terbaik adalah Model 3 yaitu model menggunakan GLMM dengan
wilayah sebagai pengaruh tetap (peubah boneka) dan waktu sebagai pengaruh acak.
Model 3 dapat dituliskan ulang sebagai berikut.
�� (


)=− .
−�

− .



− .



− .



+

+



dimana adalah pengaruh wilayah sebagai pengaruh tetap (i=1,2, …,20) dan �
adalah waktu sebagai pengaruh acak ke-t. Model 4 di atas dapat ditransformasi ke
peubah asal menjadi sebagai berikut.
�n (


)= . − . � − .
−�
− . � + + �

� − .

� − .

� + .

� + .



dimana � = (0.40, -0.16, 0.32, -0.38, 0.08, 0.58, 0.62, 0.52, 0.21, 0.35, -0.22, -0.30,
0.58, -0.14, 0.93, 0.66, 0.81, 0.79, 0.75, 0.50) yang merupakan penduga parameter
peubah boneka untuk wilayah dan Kabupaten Sabu Raijua dijadikan sebagai
wilayah referensi. T = (-0.03, 0.01, 0.09, 0.05, 0.02, -0.04, -0.03, -0.05, -0.03, 0.03)
merupakan penduga parameter untuk pengaruh acak waktu ke-t.
Tabel 6 menjelaskan hubungan antara peubah asli yang telah dibakukan
dengan peubah baru (komponen utama/principal component) yang dibentuk dengan
Analisis Komponen Utama (AKU) yang disebut dengan nilai loading. Nilai loading
yang dipilih adalah nilai loading di atas 0.5 (Hendro 2012) yang dianggap mampu
menjelaskan peubah bebas yang mempengaruhi kemiskinan. Peubah lain yang
memiliki nilai loading dibawah 0.5 dianggap kurang berpengaruh dalam
mempengaruhi kemiskinan. Dengan tiga komponen utama yang terbentuk telah
mewakili tujuh peubah bebas asli.

16

Tabel 6 Hubungan peubah asal dengan komponen utama
Peubah
PC1
PC2
PC3
z1
0.37
0.38
-0.44
z2
0.08
0.04
0.51
z3
0.40
0.04
-0.39
z4
0.46
-0.13
0.20
z5
0.25
0.39
-0.59
z6
0.31
-0.44
-0.21
z7
0.27
0.53
0.64
Tabel 7 menjelaskan secara lebih rinci peubah-peubah yang mempengaruhi
kemiskinan dan keragaman yang dapat dijelaskan oleh masing-masing komponen
utama. Komponen utama pertama dapat menjelaskan keragaman peubah asal
sebesar 50.5% dengan peubah yang dominan adalah rata-rata lama sekolah.
Selanjutnya komponen utama petama disini disebut sebagai peubah pendidikan.
Komponen utama kedua dapat menjelaskan keragaman peubah asal sebesar
16.3% dengan peubah yang dominan adalah pertumbuhan ekonomi dan
pengeluaran per kapita. Pada komponen utama kedua ada dua loading yang bernilai
di atas 0.5 namun berlainan tanda, sehingga pada komponen utama kedua ini dapat
diwakili oleh suatu peubah yang berkorelasi negatif dengan pertumbuhan ekonomi
dan berkorelasi positif dengan pengeluaran per kapita suatu kabupaten. Salah satu
peubah yang berkorelasi negatif dengan pertumbuhan ekonomi dan berkorelasi
positif dengan pengeluaran adalah inflasi. Ketika harga-harga barang mengalami
kenaikan maka secara tidak langsung dapat menghambat pertumbuhan ekonomi
dan di sisi lain ketika harga barang naik maka pengeluaran juga akan mengalami
kenaikan. Selanjutnya komponen utama kedua dalam penelitian ini disebut sebagai
peubah perekonomian.
Tabel 7 Ringkasan analisis komponen utama
Komponen
Utama
PC1: Pendidikan
PC2: Perekonomian
PC3: Konsumsi

Nama peubah
-Rata lama sekolah
-Pertumbuhan ekonomi
-Pengeluaran per kapita
-Pengeluaran per kapita

Keragaman
Nilai
yang dijelaskan
loading
komponen
utama
0.51
50.5%
-0.59
16.3%
0.53
0.64
11.5%

Komponen utama yang ketiga nilai keragamannya sebesar 11.5% dengan
peubah yang dominan adalah pengeluaran per kapita. Selanjutnya komponen utama
ketiga ini mewakili peubah konsumsi.
Selain digunakan untuk melihat faktor yang berpengaruh terhadap
kemiskinan di Provinsi Nusa Tenggara Timur, model yang telah didapat juga dapat
digunakan untuk melakukan prediksi untuk daerah yang mengalami pemekaran.
Suatu daerah sebelum mengalami pemekaran biasanya data mengikuti kabupaten
induknya, dan ketika daerah tersebut menjadi kabupaten tersendiri, maka dalam
melakukan perencanaan pembangunan dibutuhkan data untuk kabupaten tersebut.

17

Ketika data kabupaten induk tersedia dan bisa dipecah menjadi data untuk
kabupaten baru maka permasalahan tersedianya data dapat diatasi.
Namun yang sering terjadi adalah data kabupaten induk tersedia tetapi
cukup sukar untuk memecahnya menjadi data kabupaten baru. Model yang telah
didapat dalam penelitian ini dapat digunakan untuk menduga kekosongan data
tingkat kemiskinan untuk kabupaten yang mengalami pemekaran.

5 SIMPULAN DAN SARAN
Tingkat kemiskinan di Provinsi Nusa Tenggara Timur dapat dengan baik
dimodelkan menggunakan GLMM maupun GEE dengan memperhatikan waktu
dan wilayah terlihat dari nilai MSE yang mendekati 0. Model terbaik dari hasil
penelitian adalah model menggunakan GLMM yang memperhatikan waktu sebagai
pengaruh acak dan wilayah sebagai pengaruh tetap. Faktor-faktor yang dominan
mempengaruhi kemiskinan berdasarkan analisis komponen utama adalah faktor
Pendidikan, faktor Ekonomi dan faktor Konsumsi).
Dari model yang didapatkan dapat digunakan untuk menduga data
kabupaten baru mengalami pemekaran dan belum tersedia datanya. Sehingga
disarankan untuk penelitian selanjutnya dapat lebih fokus bagaimana cara menduga
data untuk kabupaten yang mengalami pemekaran dengan pemodelan GLMM.

DAFTAR PUSTAKA
Akaike H. 1973. Information theory and an extension of the maximum likelihood
principle. In BN Petrov and F Csaki (Eds.). Second international symposium
on information theory, 267-281. Budapest: Academiai Kiado.
Akaike H. 1987. Factor analysis and AIC. Psychometrika, 52, 317-332.
Anggraeni Y. 2012. Analisis Spasial Data Panel untuk Menentukan Faktor-faktor
yang Mempengaruhi Kemiskinan di Provinsi Sumatera Selatan [Skripsi].
Bogor: IPB.
Baltagi BH. 2005. Econometric Analysis of Panel Data. Chichester: John Wiley &
Sons.
Daryanto A, Hafizrianda Y. 2010. Model Kuantitatif untuk Perencanaan
Pembangunan Ekonomi Daerah: Konsep dan Aplikasi. Bogor: IPB Press.
[BPS] Badan Pusat Statistik. 2003-2013. Data dan Informasi Kemiskinan
Kabupaten/Kota. Jakarta: BPS
Tantular B. 2012. Pendekatan Model Multilevel untuk Data Repeated Measures
[Tesis]. Bandung : Universitas Padjajaran.
Chambers R. 1987. Pembangunan Desa Mulai dari Belakang. Jakarta: LP3ES.
Criswardani S. 2005. Memahami Kemiskinan Secara Multidimensional.
http://www.jmpk-online.net/Volume 8/Vol 08 No 03 2005.pdf
Gujarati DN. 2003. Basic Econometrics, Fourth Editions. New York: The McgrawHill Companies.
Henderson CR. 1984. Best Linear Unbiased Prediction of Performance and
Breeding Value. Ontorio: University of Guelph.

18

Hendro MG, Adji TB, Setiawan NA. 2012. Penggunaan Metodologi Analisis
Komponen Utama (PCA) untuk Mereduksi Faktor-faktor yang
Mempengaruhi Penyakit Jantung Koroner. Malang: Science, Engineering
and Technologi (SciETec).
Horton NJ, Lipsitz SR. 1999. Review of Software to Fit Generalized Estimating
Equation Regression Models. The American Statiscian, 53, 160-169.
Kachman SD. 1998. An Introduction to Generalized Linear Mixed Models.
Department of Biometry, Lincoln: University of Nebraska.
Karnaji. 2006. Komitemen dan Konsistensi Pemerintah dalam Mengatasi Masalah
Kemiskinan : Analisis Kasus di Jawa Timur.
http://journal.unair.ac.id/filerPDF/KomitmendanKonsistensiPemerintah.pdf
McCullagh P, Nelder JA. 1989. Generalized Linear Models, 2nd. New York:
Chapman and Hall.
McCulloch CE, Searle SR. 2001. Generalized, Linear and Mixed Models. New
York: John Wiley and Sons Inc.
Nasir M, Saichudin M, Maulizar. 2008. Analisis Faktor-Faktor yang
Mempengaruhi
Kemiskinan
Rumah
Tangga
di
Kabupaten
Purworejo.Jurnal Eksekutif. Vol. 5 No. 4, Agustus 2008. Jakarta: Lipi.
Nurkse R. 1953. Problems of Capital Formation in Underdeveloped Countries.
New York : Oxford University Press.
Rusdi AGN. 2014. Statistical Analysis For Non-normal and Correlated Outcome
in Panel Data [Skripsi]. IPB. Bogor.
Schwarz G. 1978. Estimating the dimension of a model. Annals of Statistics, 6, 461464.
Zeger SL, Liang KY .1986. Longitudinal Data Analisis for Discrete and Continuous
Outcomes. Biometrics 42, 121-130.
Zeger SL, Liang KY, Albert PS. 1988. Models for Longitudinal Data: A
Generalized Estimating Equations Approach. Biometrics 44, 1049-1060.

19

Lampiran 1 Pendugaan parameter untuk Model 1 (GLM + Wilayah sebagai
pengaruh tetap
Model 1
(GLM+wilayah fixed)
Parameter
Penduga
SE dugaan
0.1586
Intercept
-1.644
0.16
area
0.5146
Alor
-0.0698
0.1708
area
Belu
0.1688
area
0.428
Ende
-0.2558
0.1734
area
Flores Timur
area
0.2444
0.205
Kota Kupang
0.1629
0.6847
area
Kupang
area
0.1745
0.7316
Lembata
0.162
area
0.6387
Manggarai
0.3231
0.1669
area
Manggarai Barat
0.1662
0.4357
area
Manggarai Timur
area
-0.1143
0.2008
Nagekeo
-0.1622
0.1772
area
Ngada
0.1629
area
0.6795
Rote Ndao
-0.0264
0.1609
area
Sikka
0.193
1.0092
area
Sumba Barat
area
0.2202
0.7119
Sumba Barat Daya
0.2263
0.8716
area
Sumba Tengah
area
0.1813
0.8624
Sumba Timur
0.1712
area
0.8561
TTS
0.1682
area
0.6068
TTU
0
0
area
Sabu Raijua *)
pc1
0.0238
-0.1209
0.0188
-0.1474
pc2
0.0348
pc3
-0.0992
Keterangan:
Angka cetak tebal menunjukan nilai penduga parameter yang signifikan pada taraf
nyata 0.05
*) Kabupaten Sabu Raijua dijadikan referensi

20

Lampiran 2 Perbandin