Small area in Geoinformatics and its applications to detect poverty pockets in Jember

GEOINFORMATIKA PADA KASUS AREA KECIL DAN
PENERAPANNYA UNTUK MENDETEKSI KANTONGKANTONG KEMISKINAN DI JEMBER

TITIN SISWANTINING

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
2013

PERNYATAAN MENGENAI DISERTASI DAN SUMBER
INFORMASI SERTA PELIMPAHAN HAK CIPTA

Dengan ini saya menyatakan bahwa disertasi yang berjudul “Geoinformatika
pada Kasus Area Kecil dan Penerapannya untuk Mendeteksi Kantongkantong Kemiskinan di Jember” adalah benar karya saya dengan arahan
komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan
tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya penulis
lain telah dicantumkan di dalam teks dan Daftar Pustaka di bagian akhir disertasi
ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.


Bogor, 25 Juli 2013

Titin Siswantining
NIM : G161080021

RINGKASAN
TITIN SISWANTINING. Geoinformatika pada Kasus Area Kecil dan
Penerapannya untuk Mendeteksi Kantong-kantong Kemiskinan di Jember.
Dibimbing oleh ASEP SAEFUDDIN, KHAIRIL ANWAR NOTODIPUTRO,
NUNUNG NURYARTONO, dan I WAYAN MANGKU.
Statistik pindaian (scan statistic) merupakan metode dalam Geoinformatika yang
mempertimbangkan unsur spasial untuk mendeteksi daerah secara geografis yang
mempunyai potensi tinggi atau rendah, serta menguji parameter proporsi satu
daerah dibandingkan dengan proporsi daerah lain secara statistika. Statistik
pindaian dapat mendeteksi daerah yang ekstrim yang disebut hotspot. Hotspot
berarti sesuatu yang tidak biasa, anomali, penyimpangan, atau daerah dengan
kondisi kritis. Statistik pindaian digunakan untuk mendeteksi dan mengevaluasi
daerah yang disebut Kondisi Luar Biasa (KLB). Statistik pindaian memerlukan
informasi lengkap daerah yang akan dideteksi dengan data berukuran besar,
sedangkan survei yang dilakukan biasanya hanya menggunakan ukuran contoh

cukup kecil. Solusi yang dilakukan untuk menangani ukuran contoh kecil adalah
dengan menaikkan jumlah contoh, namun diperlukan biaya, waktu dan tenaga
yang besar. Di sisi lain, dalam statistika berkembang metode yang digunakan
untuk menangani data dengan ukuran contoh kecil yaitu Small Area Estimation
(SAE). Meskipun tidak untuk membandingkan antar daerah, keuntungan terbesar
SAE adalah dapat digunakan untuk menduga parameter daerah secara lengkap,
baik daerah tersurvei maupun tidak. Dengan data dugaan yang lengkap maka
statistik pindaian dapat digunakan untuk mendeteksi adanya hotspot atau KLB.
Berdasarkan perlunya nilai penduga yang lengkap, maka diperlukan aplikasi SAE
pada statistik pindaian. Kualitas dari hasil aplikasi SAE pada statistik pindaian
dipengaruhi oleh (i) besarnya ukuran contoh dari sisi hotspot, (ii) kualitas
pendugaan SAE dari model dengan sejumlah peubah tambahan dan metode
pendugaannya, sehingga perlu dikaji metode pendugaan SAE lebih detil. Kualitas
SAE dalam menangani kasus ukuran contoh kecil dan statistik pindaian, biasanya
diteliti secara terpisah. Hasil pendugaan yang diperoleh melalui survei disebut
sebagai penduga langsung (Direct Estimate, DE), namun biasanya akurasi dan
presisinya rendah. Dalam masalah RLK pada Geoinformatika terdapat proporsi
penduga langsung, yang berpotensi untuk digantikan oleh penduga melalui SAE.
Tujuan penelitian ini adalah menggantikan peran DE dengan penduga SAE pada
masalah Geoinformatika menggunakan ukuran contoh kecil dengan cara

mengaplikasikan model SAE ke dalam statistik pindaian, mengaplikasikan
Geoinformatika berbasis area kecil untuk mendeteksi kantong-kantong desa
miskin berdasarkan pada desa tersurvei dan pendugaan seluruh desa di Jember,
Jawa Timur. Penelitian ini merupakan aplikasi statistik pindaian berbasis SAE
yang dikaji dari sisi teori, simulasi dan sisi penerapan pada data riil. Kajian
simulasi dan kajian aplikasi pada data riil dievaluasi menggunakan sifat statistik.
Kemudian analisis dilanjutkan dengan mengevaluasi klasifikasi benar pada hasil
yang diperoleh. Klasifikasi benar melalui kajian simulasi pada area tersurvei
diperoleh 100% menggunakan metode Bayes dan non-Bayes SAE. Metode Bayes
yang digunakan adalah Hierarchical Bayes (HB) spasial dan non-spasial,
sedangkan metode non-Bayes yang digunakan adalah EBLUP dan SEBLUP.

Dengan menggunakan HB1 SAE dengan proporsi hotspot 0,95 mampu menduga
secara benar sebesar 80,97%, HB2 sebesar 75,62%, EBLUP sebesar 65,99%. Dari
sisi sifat penduga, kedua metode (HB dan EBLUP) mempunyai sifat stabil dalam
hasil, dan sifat takbias. Metode HB memberikan hasil klasifikasi yang lebih baik
dibanding dengan metode EBLUP, namun ada kelemahan metode HB yaitu harus
memilih sebaran prior dan pembobot spasial yang sesuai. Aplikasi pada data
kemiskinan menunjukkan bahwa berdasarkan peubah tak bebas konsumsi kalori,
statistik pindaian berbasis SAE mampu melakukan klasifikasi secara benar

menggunakan metode HB1 dan HB2 serta SEBLUP sebesar 100% pada 35 desa
hasil Susenas 2008. Statistik pindaian berbasis SAE menghasilkan klasifikasi
benar berdasarkan pengeluaran rumahtangga menggunakan HB2 sebesar 88,57%
dan sebesar 62,85% menggunakan EBLUP. Statistik pindaian berbasis SAE pada
seluruh desa di Kabupaten Jember berdasarkan konsumsi kalori menghasilkan
klasifikasi benar menggunakan HB2 sebesar 70,45%, menggunakan SEBLUP
sebesar 57,09%. Pendugaan proporsi desa termiskin berdasarkan pengeluaran
rumah tangga menggunakan HB1 menghasilkan klasifikasi benar sebesar 93,93%,
menggunakan EBLUP sebesar 97,95%. Banyaknya peubah tambahan ternyata
tidak mempengaruhi hasil analisis dalam SAE maupun dalam statistik pindaian.
Berdasarkan aplikasi pada pendeteksian desa miskin di Kabupaten Jember
diperoleh bahwa metode SAE menunjukkan hasil lebih baik dibandingkan dengan
tanpa metode SAE. Konsumsi kalori lebih stabil dibandingkan dengan
pengeluaran rumahtangga per bulan. Pendekatan spasial lebih baik dibandingkan
dengan meode Bayes SAE non spasial, namun metode penentuan bobotnya masih
perlu dikembangkan lebih lanjut. Hasil pendeteksian kantong kemiskinan
berdasarkan konsumsi kalori menggunakan HB2, dan SEBLUP di desa tersurvei
adalah Wringin telu, Ampel, Sidodadi, Garahan, Wringin Agung,
Pringgowirawan, Sumber Pinang, Suren, dan desa Sumber Sari. Hasil
pendeteksian kantong kemiskinan di desa tersurvei berdasarkan pengeluaran

rumahtangga per bulan menggunakan HB2 di Kabupaten Jember adalah Serut,
Jatiroto, Sukorejo, Sumberjambe, Gumukmas, Pringgowirawan, Sempolan,
Suren, Randu Agung. Desa Pringgowirawan dan desa Suren merupakan desa
termiskin berdasarkan konsumsi kalori dan pengeluaran rumahtangga di desa
tersurvei. Kantong-kantong kemiskinan di seluruh desa di Jember berdasarkan
konsumsi kalori menggunakan metode yaitu HB2, dan EBLUP adalah desa
Sumber Kejayan, Tegalrejo, Tegalwaru, Pakusari, Gambiran, Plalangan, Ajung,
Glagahwero, Sumberjeruk, Sumber Ketempah, Lembengan, Sumber anget, dan
desa Karang Paiton. Terdapat sepuluh desa termiskin berdasarkan konsumsi kalori
dan pengeluaran rumahtangga yaitu desa Sumber Kejayan, Tegalrejo, Tegalwaru,
Pakusari, Gambiran, Plalangan, Ajung, Glagahwero, Sumberjeruk, dan desa
Sumber Ketempah. Permasalahan tentang ukuran contoh kecil dalam
Geoinformatika tidak mengganggu sifat statistik dari penduga. Dengan adanya
aplikasi SAE dalam Geoinformatika ini maka tidak perlu melakukan penelitian
terhadap semua anggota populasi tetapi cukup dengan memanfaatkan informasi
yang sudah ada sehingga dari sisi biaya, waktu dan tenaga dalam melakukan
survei tentang KLB akan sangat berkurang.
Kata kunci: SAE, RLK, takbias, konsisten, ragam kecil, Geoinformatika,
konsumsi kalori, pengeluaran rumahtangga, peta geoinformatik.


SUMMARY
TITIN SISWANTINING. Small area in Geoinformatics and its applications to
detect poverty pockets in Jember. Supervised by ASEP SAEFUDDIN,
KHAIRIL ANWAR NOTODIPUTRO, NUNUNG NURYARTONO, and I
WAYAN MANGKU.
Scan statistic is a method in Geinformatics considering spatial unsure to detect
high or low potential area geographically and examine an area proportion
parameter compare with others proportion statistically. This method detects
extreme area (maximum or minimum) called hotspot. Hotspot means something
unusual, anomalies, or critical condition area. Scan statistic is used to detect and
evaluate area called Most Likely Cluster (MLC). It needs complete information
about detected area with large sample size, while survey usually uses small
sample size. One solution to overcome small sample size is by increasing sample
size, but it is cost, time, and energy consuming. On the other side, there is a
developing method in statistics to use survey data with small sample size, i.e.
Small Area Estimation (SAE). Although this method is not used to compare
among area, the biggest benefit from SAE is that it can be used to estimate area
parameter complete, both surveyed and un-surveyed area. With complete
estimation data, scan statistic can be used to detect hotspot or Most Likely Cluster
(MLC). Based on the need of complete estimator value, SAE application is

necessary in scan statistic. Quality of SAE application result in scan statistic
depends on (i) sample size of hotspot, (ii) SAE estimation quality of model with
some auxiliary variables and estimation methods, so SAE estimation methods
need to be examined. SAE quality in handling small sample size case and scan
statistic have been studied separately. This dissertation studies scan statistic in
small sample size case, as an application of SAE on scan statistic. Estimation
result gained through survey is called as Direct Estimate (DE), but usually with
low accuracy and precision. There is a direct estimation proportion in MLC
problem in Geoinformatics that can be replaced by estimation through SAE. This
study’s purposes are to replace DE role with SAE estimation in Geoinformatics
problem (in search for hotspot), to do cluster detection through scan statistic using
small sample size by using SAE model into scan statistic, and use small area
based Geoinformatics to detect poverty area pockets based on surveyed data and
estimation of all village in Jember, East Java. This study is an application of SAE
based scan statistic that is examined theoretically, by simulation, and by
application on real data. SAE application on scan statistic can handle problems in
detecting highly potential and statistically significant by using only small sample
size. Simulation and application examination on real data are evaluated using
statistic properties. Analysis continues with evaluation of correct classification on
result gained. 100% correct classification through simulation examination on

surveyed area is gained using Bayes and non-Bayes SAE. Bayes methods used in
this study are spatial Hierarchical Bayes (HB) and non-spatial method, while nonBayes methods used are EBLUP and SEBLUP. In un-surveyed area (large area),
MLC will be bigger. HB1 (spatial correlation weighted) with hotspot proportion
0.95 is capable to estimate 80.97% correctly, while HB2 (nearest neighbor) is
75.62%. On the other side, EBLUP is only capable to estimate 65.99% of correct

classification. From estimator property side, both methods (HB and EBLUP) have
stable on result and unbiased property. HB method gives better classification
result than EBLUP, shown in high correct classification result, but its weakness is
the need to choose prior variance and match spatial weight. Application on
poverty data shows that based on calorie consumption as dependent variable, SAE
based scan statistic can classify 100% correct using HB2 and SEBLUP on 35
villages of Susenas 2008 result. Based on household expenditure variable, SAE
based scan statistic produce 88.57% correct classification using HB2 and 62.85%
with EBLUP. Results of SAE based scan statistic in all villages in Jember district
on calorie consumption variable yield 70.45% correct classification with HB2 and
57.09% with SEBLUP. Estimation of the poorest village proportion based on
household expenditure using HB2 yields 93.93% and SEBLUP yields 97.95%.
Amount of auxiliary variables does not affect analysis result both on SAE and
scan statistic. Application on poor village detection in Jember district indicates

better result than without SAE method in detecting high potential of poverty level.
Calorie consumption is more stable than monthly household expenditure. Based
on calorie consumption with HB2 and SEBLUP method of 35 surveyed village,
poverty pockets are found in Wringin telu, Ampel, Sidodadi, Garahan, Wringin
Agung, Pringgowirawan, Sumber Pinang, Suren, and Sumber Sari village. On the
other hand, based on household expenditure, HB2 method yields poverty pockets
Sukorejo, Sumberjambe, Gumukmas, Pringgowirawan,
in Serut, Jatiroto,
Sempolan, Suren, and Randu Agung. Pringgowirawan and Suren village are the
two poorest village based on calorie consumption and household expenditure in
surveyed village. These two poorest villages can be said as poverty pocket in
order to be improvement target in minimizing poverty in Jember district. Poverty
pockets in all Jember’s villages based on calorie consumption using HB2 and
SEBLUP methods are Sumber Kejayan, Tegalrejo, Tegalwaru, Pakusari,
Gambiran, Plalangan, Ajung, Glagahwero, Sumberjeruk, Sumber Ketempah,
Lembengan, Sumber anget, and Karang Paiton village. This study finds 119
villages as poverty pockets in all villages of Jember district based on household
expenditure by HB2 and EBLUP method. From 13 villages’ poverty pockets from
calorie consumption and 119 villages from household expenditure in all villages
of Jember district, there are 10 poorest villages, such as Sumber Kejayan,

Tegalrejo, Tegalwaru, Pakusari, Gambiran, Plalangan, Ajung, Glagahwero,
Sumberjeruk, and Sumber Ketempah. Problem of small sample size in
Geoinformatics will not disturb statistic property of estimator. With SAE
application in Geoinformatics, there is no need to study all population members.
Available information is enough to study poverty pockets in order to save cost,
time, and energy in surveying MLC.
Keywords: SAE, LLR, unbiased, consistent, small variance, Geoinformatics,
calorie consumption, household expenditures, poverty mapping.

© Hak Cipta Milik IPB, Tahun 2013
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan
IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apa pun tanpa izin IPB

GEOINFORMATIKA PADA KASUS AREA KECIL

DAN PENERAPANNYA UNTUK MENDETEKSI
KANTONG-KANTONG KEMISKINAN DI JEMBER

Oleh:
TITIN SISWANTINING
G161080021/STK

Disertasi
sebagai salah satu syarat untuk memperoleh gelar Doktor
pada Program Studi Statistika

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
2013

Penguji Luar pada Ujian Tertutup : Dr. Ir. I Made Sumertajaya, MS.
Dr. Ir. Anang Kurnia, MS.

Penguji Luar pada Ujian Terbuka : Dr. Slamet Sutomo
Dr. Ir. Hari Wijayanto, MS.

.....iul Disertasi

..m1a Mahasiswa
. mor Pokok
_セ ....gram Studi

Geoinformatika pada
Penerapannya untuk
Kemiskinan di J ember
Titin Siswantining
G161080021
Statistika

Kasus
Area Kecil
dan
Mendeteksi Kantong-kantong

Disetujui:
Komisi Pembim

gセN⦅@
Nセ

ヲN@

utro. MS.

Dr. Ir. Asep Saefuddin, MSc.
Ketua

MSc.

Dr. Ir. I Wayan Mangku, MS.
Anggota

Diketahui
. . etua Program Studi Statistika

セ@
:Jr. Ir. Aji Hamim Wigena, MSc.

Tanggal Ujian : 25 Juli 2013

Tanggal Lulus :

1 2 セ u g@

20n

Judul Disertasi

Nama Mahasiswa
Nomor Pokok
Program Studi

: Geoinformatika pada Kasus Area Kecil dan
Penerapannya untuk
Mendeteksi Kantong-kantong
Kemiskinan di Jember
: Titin Siswantining
: G161080021
: Statistika

Disetujui:
Komisi Pembimbing

Prof. Dr. Ir. Asep Saefuddin, MSc.
Ketua

Prof. Dr. Ir. Khairil A. Notodiputro, MS.
Anggota

Dr. Ir.R. Nunung Nuryartono, MSc.
Anggota

Dr. Ir. I Wayan Mangku, MS.
Anggota

Diketahui
Ketua Program Studi Statistika

Dekan Sekolah Pascasarjana IPB

Dr. Ir. Aji Hamim Wigena, MSc.

Dr. Ir. Dahrul Syah, M.Agr.

Tanggal Ujian : 25 Juli 2013

Tanggal Lulus :

PRAKATA
Segala puji syukur penulis panjatkan ke hadirat Allah SWT, karena atas
karunia, rahmat dan hidayah Nya akhirnya disertasi ini dapat diselesaikan.
Disertasi ini berjudul “Geoinformatika Pada Kasus Contoh Kecil Untuk
Mendeteksi Kantong-kantong Kemiskinan di Jember”, merupakan salah satu syarat
untuk memperoleh gelar Doktor pada Program Studi Statistika di Institut Pertanian
Bogor.
Penulis menyadari bahwa selama kuliah dan sampai melaksanakan dan
menyelesaikan tulisan ini, penulis banyak sekali mendapat bantuan dari berbagai
pihak. Pada kesempatan ini, ucapan terima kasih yang sebesar-sebarnya penulis
sampaikan kepada Bapak Prof. Dr. Ir. Asep Saefuddin, MSc. sebagai Ketua
Komisi Pembimbing; Bapak Prof. Dr. Ir. Khairil Anwar Notodiputro, MS. atas
segala curahan waktu, bimbingan, arahan, saran, nasehat, kesabaran, pengertian,
ketelitian dan dorongan moral kepada penulis dari awal hingga selesainya disertasi
ini; Bapak Dr. Ir. R. Nunung Nuryartono, MSc., Bapak Dr. Ir. I Wayan Mangku,
MS. atas saran, arahan, kesabaran, pengertian dalam membimbing penulis sampai
selesainya disertasi ini.
Secara khusus penulis menyampaikan rasa terimakasih kepada:
1. Departemen Matematika, Fakultas MIPA, dan Universitas Indonesia yang
telah mengijinkan dan memberikan dorongan untuk melanjutkan studi S3.
2. Segenap keluarga terutama kepada suami dan anak-anak tercinta serta kakakkakak dan adik-adik yang telah memberikan semangat, keluasan, kesabaran,
keikhlasan, dan ketulusan hati, pengertian, nasihat, bantuan, dukungan,
dorongan, serta doa.
3. Teman-teman seperjuangan dalam payung Hibah Geoinformatika: Dr. Yekti
W, MSi., Etis Sunandi, SSi, MSi., Dariani Matualage, SSi, MSi., Ida Marijati,
SSi, MSi., Dian Kusumaningrum, SSi, MSi., Siti Rahmah Rahimah, SSi.,
MSi. dan sebagainya yang selalu siap diganggu setiap saat.
4. Dr. Anang Kurnia, MS. beserta keluarga, yang sabar dan tidak bosan untuk
direpoti.
5. Dr. Agnes Tuti Rumiati, MSc., dan Dr. Asfiah Mahdiani yang setia
menanyakan kemajuan disertasi. Drs. Bachtiar S. dan Drs. Januri yang selalu
tidak berhenti dalam membantu doa. Serta saudara muda sekaligus teman
senasib : Dr. Nusar Hajarisman, M.Si. sebagai tempat curhat.
6. Adi Wibowo, SSi, MSi., Rizki Reza, SSi, Luthfatul Amaliana, SSi, Michelino,
SSi., Emy M. SSi, Andion, Siti Fatimah, Dr. Dewi, RSS., MSi, Dr. Alfian,
M.Si., Dra. Rianti Setiadi, M.Si., Yuri, SSi., Bodro yang telah bersedia
membantu dengan sepenuh hati.
7. Serta berbagai pihak lain yang tidak dapat penulis sebutkan seluruhnya satu
per satu.
Dengan segala kerendahan hati dan kesadaran diri, kami menyadari bahwa
disertasi ini masih sangat jauh dari kesempurnaan. Oleh karenanya penulis sangat
berharap mendapatkan kritik dan saran yang membangun untuk perbaikan karya
ilmiah penulis selanjutnya. Harapan penulis semoga disertasi ini bermanfaat untuk
banyak pihak yang berkait. Aamiin YRA.
Bogor, 25 Juli 2013
Titin Siswantining

SUMMARY

TITIN SISWANTINING. Small area in Geoinformatics and its applications to detect poverty pockets
in Jember. Supervised by ASEP SAEFUDDIN, KHAIRIL ANWAR NOTODIPUTRO, NUNUNG
NURYARTONO, and I WAYAN MANGKU.
Scan statistic is a method in Geinformatics considering spatial unsure to detect high or low potential
area geographically and examine an area proportion parameter compare with others proportion
statistically. This method detects extreme area (maximum or minimum) called hotspot. Hotspot means
something unusual, anomalies, or critical condition area. Scan statistic is used to detect and evaluate
area called Most Likely Cluster (MLC). It needs complete information about detected area with large
sample size, while survey usually uses small sample size. One solution to overcome small sample size
is by increasing sample size, but it is cost, time, and energy consuming. On the other side, there is a
developing method in statistics to use survey data with small sample size, i.e. Small Area Estimation
(SAE). Although this method is not used to compare among area, the biggest benefit from SAE is that
it can be used to estimate area parameter complete, both surveyed and un-surveyed area. With
complete estimation data, scan statistic can be used to detect hotspot or Most Likely Cluster (MLC).
Based on the need of complete estimator value, SAE application is necessary in scan statistic. Quality
of SAE application result in scan statistic depends on (i) sample size of hotspot, (ii) SAE estimation
quality of model with some auxiliary variables and estimation methods, so SAE estimation methods
need to be examined. SAE quality in handling small sample size case and scan statistic have been
studied separately. This dissertation studies scan statistic in small sample size case, as an application
of SAE on scan statistic. Estimation result gained through survey is called as Direct Estimate (DE),
but usually with low accuracy and precision. There is a direct estimation proportion in MLC problem
in Geoinformatics that can be replaced by estimation through SAE. This study’s purposes are to
replace DE role with SAE estimation in Geoinformatics problem (in search for hotspot), to do cluster
detection through scan statistic using small sample size by using SAE model into scan statistic, and
use small area based Geoinformatics to detect poverty area pockets based on surveyed data and
estimation of all village in Jember, East Java. This study is an application of SAE based scan statistic
that is examined theoretically, by simulation, and by application on real data. SAE application on scan
statistic can handle problems in detecting highly potential and statistically significant by using only
small sample size. Simulation and application examination on real data are evaluated using statistic
properties. Analysis continues with evaluation of correct classification on result gained. 100% correct
classification through simulation examination on surveyed area is gained using Bayes and non-Bayes
SAE. Bayes methods used in this study are spatial Hierarchical Bayes (HB) and non-spatial method,
while non-Bayes methods used are EBLUP and SEBLUP. In un-surveyed area (large area), MLC will
be bigger. HB1 (spatial correlation weighted) with hotspot proportion 0.95 is capable to estimate
80.97% correctly, while HB2 (nearest neighbor) is 75.62%. On the other side, EBLUP is only capable
to estimate 65.99% of correct classification. From estimator property side, both methods (HB and
EBLUP) have stable on result and unbiased property. HB method gives better classification result
than EBLUP, shown in high correct classification result, but its weakness is the need to choose prior
variance and match spatial weight. Application on poverty data shows that based on calorie
consumption as dependent variable, SAE based scan statistic can classify 100% correct using HB2
and SEBLUP on 35 villages of Susenas 2008 result. Based on household expenditure variable, SAE
based scan statistic produce 88.57% correct classification using HB2 and 62.85% with EBLUP.
Results of SAE based scan statistic in all villages in Jember district on calorie consumption variable

yield 70.45% correct classification with HB2 and 57.09% with SEBLUP. Estimation of the poorest
village proportion based on household expenditure using HB2 yields 93.93% and SEBLUP yields
97.95%. Amount of auxiliary variables does not affect analysis result both on SAE and scan statistic.
Application on poor village detection in Jember district indicates better result than without SAE
method in detecting high potential of poverty level. Calorie consumption is more stable than monthly
household expenditure. Based on calorie consumption with HB2 and SEBLUP method of 35 surveyed
village, poverty pockets are found in Wringin telu, Ampel, Sidodadi, Garahan, Wringin Agung,
Pringgowirawan, Sumber Pinang, Suren, and Sumber Sari village. On the other hand, based on
household expenditure, HB2 method yields poverty pockets in Serut, Jatiroto,
Sukorejo,
Sumberjambe, Gumukmas, Pringgowirawan, Sempolan, Suren, and Randu Agung. Pringgowirawan
and Suren village are the two poorest village based on calorie consumption and household
expenditure in surveyed village. These two poorest villages can be said as poverty pocket in order to
be improvement target in minimizing poverty in Jember district. Poverty pockets in all Jember’s
villages based on calorie consumption using HB2 and SEBLUP methods are Sumber Kejayan,
Tegalrejo, Tegalwaru, Pakusari, Gambiran, Plalangan, Ajung, Glagahwero, Sumberjeruk, Sumber
Ketempah, Lembengan, Sumber anget, and Karang Paiton village. This study finds 119 villages as
poverty pockets in all villages of Jember district based on household expenditure by HB2 and EBLUP
method. From 13 villages’ poverty pockets from calorie consumption and 119 villages from
household expenditure in all villages of Jember district, there are 10 poorest villages, such as Sumber
Kejayan, Tegalrejo, Tegalwaru, Pakusari, Gambiran, Plalangan, Ajung, Glagahwero, Sumberjeruk,
and Sumber Ketempah. Problem of small sample size in Geoinformatics will not disturb statistic
property of estimator. With SAE application in Geoinformatics, there is no need to study all
population members. Available information is enough to study poverty pockets in order to save cost,
time, and energy in surveying MLC.
Keywords: SAE, LLR, unbiased, consistent, small variance, Geoinformatics, calorie consumption,
household expenditures, poverty mapping.

RINGKASAN

TITIN SISWANTINING. Geoinformatika pada Kasus Area Kecil dan Penerapannya untuk Mendeteksi
Kantong-kantong Kemiskinan di Jember. Dibimbing oleh ASEP SAEFUDDIN, KHAIRIL ANWAR
NOTODIPUTRO, NUNUNG NURYARTONO, dan I WAYAN MANGKU.

Statistik pindaian (scan statistic) merupakan metode dalam Geoinformatika yang
mempertimbangkan unsur spasial untuk mendeteksi daerah secara geografis yang mempunyai
potensi tinggi atau rendah serta menguji signifikansi penduga parameter proporsi satu daerah
dibandingkan dengan proporsi daerah lain secara statistika. Statistik pindaian mendeteksi daerah
yang ekstrim (maksimum atau minimum) yang disebut hotspot. Hotspot berarti sesuatu yang tidak
biasa, anomali, penyimpangan, atau daerah dengan kondisi kritis. Statistik pindaian digunakan
untuk mendeteksi dan mengevaluasi daerah yang disebut Kondisi Luar Biasa (KLB). Statistik pindaian
memerlukan informasi lengkap tentang daerah yang akan dideteksi dengan data berukuran besar,
sedangkan survei yang dilakukan biasanya hanya menggunakan ukuran contoh cukup kecil. Salah
satu solusi yang dilakukan untuk menangani ukuran contoh kecil adalah dengan cara menaikkan
jumlah ukuran contoh, namun diperlukan biaya, waktu dan tenaga yang besar. Di sisi lain, dalam
statistika berkembang suatu metode yang digunakan untuk menangani data survei dengan ukuran
contoh kecil, yang disebut sebagai Small Area Estimation (SAE).
Meskipun tidak untuk membandingkan antar daerah, keuntungan terbesar dari SAE adalah
dapat digunakan untuk menduga parameter daerah secara lengkap, baik daerah yang tersurvei
maupun tidak. Dengan data dugaan yang lengkap maka statistik pindaian dapat digunakan untuk
mendeteksi adanya hotspot atau Kondisi Luar Biasa (KLB).

Berdasarkan perlunya nilai penduga yang lengkap, maka diperlukan aplikasi SAE pada
statistik pindaian. Kualitas dari hasil aplikasi SAE pada statistik pindaian dipengaruhi oleh (i)
besarnya ukuran contoh dari sisi hotspot, (ii) kualitas pendugaan SAE dari model dengan
sejumlah peubah tambahan dan metode pendugaannya, sehingga metode pendugaan SAE
perlu dikaji. Kualitas SAE dalam menangani kasus ukuran contoh kecil telah banyak diteliti,
begitu pula halnya dengan statistik pindaian, yang masing-masing diteliti secara terpisah.
Disertasi ini mengkaji statistik pindaian pada kasus ukuran contoh kecil, yang merupakan
aplikasi dari SAE pada statistik pindaian.
Hasil pendugaan yang diperoleh melalui survei disebut sebagai penduga langsung
(Direct Estimate), namun biasanya akurasi dan presisinya rendah. SAE merupakan metode
untuk menyelesaikan permasalahan ukuran contoh kecil. Dalam masalah RLK pada
Geoinformatika terdapat proporsi penduga langsung, yang berpotensi untuk digantikan oleh
penduga melalui SAE.
Tujuan penelitian ini adalah menggantikan peran Direct Estimation (DE) dengan
penduga SAE pada masalah Geoinformatika (dalam mencari hotspot), untuk melakukan
pendeteksian klaster melalui statistik pindaian menggunakan ukuran contoh kecil dengan cara
mengaplikasikan model SAE ke dalam statistik pindaian, mengaplikasikan Geoinformatika
berbasis area kecil untuk mendeteksi kantong-kantong desa miskin berdasarkan pada desa
tersurvei dan pendugaan seluruh desa di Jember, Jawa Timur.

Penelitian ini merupakan aplikasi statistik pindaian berbasis SAE yang dikaji dari sisi teori,
simulasi dan sisi penerapan pada data riil. Aplikasi SAE pada statistik pindaian mampu menangani
permasalahan dalam mendeteksi potensi tinggi dan signifikan secara statistika, walaupun ukuran
contohnya kecil. Kajian simulasi dan kajian aplikasi pada data riil dievaluasi menggunakan sifat
statistik. Kemudian analisis dilanjutkan dengan mengevaluasi klasifikasi benar pada hasil yang
diperoleh. Klasifikasi benar melalui kajian simulasi pada area tersurvei diperoleh 100% klasifikasi
benar menggunakan metode Bayes dan non-Bayes SAE. Metode Bayes yang digunakan adalah
Hierarchical Bayes (HB) spasial dan non-spasial, sedangkan metode non-Bayes yang digunakan
adalah EBLUP dan SEBLUP. Untuk area yang tidak tersurvei (daerah yang lebih luas) maka RLK
bertambah besar. Dengan menggunakan HB1 (pembobot korelasi spasial) SAE dengan proporsi
hotspot 0,95 mampu menduga secara benar sebesar 80,97%, klasifikasi benar menggunakan HB2
(tetangga terdekat) sebesar 75,62%. Klasifikasi benar pada simulasi menggunakan metode EBLUP
sebesar 65,99%. Dari sisi sifat penduga, kedua metode (HB dan EBLUP) mempunyai sifat stabil dalam
hasil, dan sifat takbias. Metode HB memberikan hasil klasifikasi yang lebih baik dibandingkan dengan
metode EBLUP, terlihat dari hasil klasifikasi benar yang cukup tinggi, namun demikian ada
kelemahan metode HB yaitu harus memilih sebaran prior dan pembobot spasial yang sesuai.
Pendugaan parameter pada area yang tidak tersurvei, tidak dapat dilakukan menggunakan DE.
Aplikasi pada data kemiskinan menunjukkan bahwa berdasarkan peubah tak bebas konsumsi kalori,
statistik pindaian berbasis SAE mampu melakukan klasifikasi secara benar menggunakan metode
HB1 dan HB2 serta SEBLUP sebesar 100% pada 35 desa hasil Susenas 2008. Statistik pindaian
berbasis SAE menghasilkan klasifikasi benar berdasarkan pengeluaran rumahtangga menggunakan
HB2 sebesar 88,57% dan klasifikasi benar sebesar 62,85% menggunakan EBLUP. Statistik pindaian
berbasis SAE pada seluruh desa di Kabupaten Jember berdasarkan konsumsi kalori menghasilkan
klasifikasi benar menggunakan HB1 sebesar 46,96%, klasifikasi benar menggunakan HB2 sebesar
70,45%, klasifikasi benar menggunakan SEBLUP sebesar 57,09%. Pendugaan proporsi desa termiskin
berdasarkan pengeluaran rumah tangga menggunakan HB1 menghasilkan klasifikasi benar sebesar
93,93%, menggunakan EBLUP menghasilkan klasifikasi benar sebesar 97,95%. Banyaknya peubah
tambahan (sedikit atau banyak jumlahnya) tidak mempengaruhi hasil analisis dalam SAE maupun
dalam statistik pindaian.
Berdasarkan aplikasi pada pendeteksian desa miskin di Kabupaten Jember diperoleh bahwa
metode SAE menunjukkan hasil yang lebih baik dibandingkan dengan tanpa metode SAE dalam
mendeteksi daerah yang mempunyai potensi tinggi tingkat kemiskinannya. Konsumsi kalori lebih
stabil dibandingkan dengan pengeluaran rumahtangga per bulan, berarti konsumsi kalori dapat
digunakan sebagai penentu dalam masalah kemiskinan. SAE dengan pendekatan spasial lebih baik
bila dibandingkan dengan meode Bayes SAE non spasial, namun metode penentuan bobotnya masih
perlu dikembangkan lebih lanjut. Hasil pendeteksian kantong kemiskinan berdasarkan konsumsi
kalori menggunakan HB1, HB2, dan SEBLUP di tiga puluh lima desa tersurvei adalah Wringin telu,
Ampel, Sidodadi, Garahan, Wringin Agung, Pringgowirawan, Sumber Pinang, Suren, dan desa
Sumber Sari. Hasil pendeteksian kantong kemiskinan di desa tersurvei berdasarkan pengeluaran
rumahtangga per bulan menggunakan HB2 di Kabupaten Jember adalah Serut, Jatiroto, Sukorejo,
Sumberjambe, Gumukmas, Pringgowirawan, Sempolan, Suren, Randu Agung. Desa Pringgowirawan
dan desa Suren merupakan desa termiskin berdasarkan konsumsi kalori dan pengeluaran
rumahtangga di desa tersurvei. Desa termiskin ini merupakan kantong kemiskinan sehingga dapat
dijadikan target perbaikan dalam program mengentaskan kemiskinan di Kabupaten Jember.

Kantong-kantong kemiskinan di seluruh desa di Jember berdasarkan konsumsi kalori
menggunakan dua metode yaitu HB2, dan EBLUP adalah desa Sumber Kejayan, Tegalrejo, Tegalwaru,
Pakusari, Gambiran, Plalangan, Ajung, Glagahwero, Sumberjeruk, Sumber Ketempah, Lembengan,
Sumber anget, dan desa Karang Paiton. Ditemukan kantong-kantong kemiskinan seluruh desa di
Kabupaten Jember berdasarkan pengeluaran rumahtangga dengan menggunakan dua metode HB2,
dan EBLUP sebanyak seratus sembilan desa. Dari tiga belas desa yang merupakan kantong
kemiskinan berdasarkan konsumsi kalori dan seratus sembilan desa yang merupakan kantong
kemiskinan berdasarkan pengeluaran rumahtangga terdapat sepuluh desa termiskin berdasarkan
keduanya yaitu desa Sumber Kejayan, Tegalrejo, Tegalwaru, Pakusari, Gambiran, Plalangan, Ajung,
Glagahwero, Sumberjeruk, dan desa Sumber Ketempah. Sepuluh desa tersebut merupakan kantong
kemiskinan di seluruh desa di Jember.
Permasalahan tentang ukuran contoh kecil dalam Geoinformatika tidak mengganggu sifat
statistik dari penduga. Tingkat klasifikasi benar dalam pendugaan parameter pada statistik pindaian
masih mempunyai nilai tinggi. Dengan adanya aplikasi SAE dalam Geoinformatika ini maka tidak
perlu melakukan penelitian terhadap semua anggota populasi tetapi cukup dengan memanfaatkan
informasi yang sudah ada sehingga dari sisi biaya, waktu dan tenaga dalam melakukan survei
tentang KLB akan sangat berkurang.

xi

DAFTAR ISI
Halaman
DAFTAR TABEL

xiii

DAFTAR GAMBAR

xiv

DAFTAR LAMPIRAN

xv

1

PENDAHULUAN
Latar Belakang
Perumusan Masalah
Tujuan
Ruang Lingkup Penelitian
Kebaruan Penelitian (Novelti)
Sistematika Penulisan

1
1
4
5
5
6
6

2

TINJAUAN PUSTAKA
Perkembangan Penelitian Berbagai Metode SAE Spasial dan NonSpasial
Rasio Log Kemungkinan (RLK)
Statistik Pindaian
Penduga Area Kecil
EBLUP
Hierarchical Bayes (HB)
SEBLUP
Spatial Hierarchical Bayes (HB Spasial)
Pendugaan SAE untuk Area Lebih Luas

9
9

3

PENDUGAAN SAE PENGGANTI PERAN STATISTIK PADA
STATISTIK PINDAIAN
Pendahuluan
Metodologi
Pendekatan teoritis
Pendekatan simulasi
Hasil dan Pembahasan
Hasil pendekatan teoritis
Hasil pendekatan simulasi
Hasil simulasi statistik pindaian
Sintesis antara pendekatan teoritis dan pendekatan simulasi
Penutup

10
12
18
20
21
24
24
26
27
27
27
28
32
40
40
40
45
50
51

xii

4

PENDETEKSIAN KANTONG-KANTONG KEMISKINAN DI
KABUPATEN JEMBER
Pendahuluan
Metodologi
Sumber data
Metode analisis
Hasil dan Pembahasan
Kantong kemiskinan berdasarkan konsumsi kalori (P1)
Kantong kemiskinan berdasarkan pengeluaran rumah tangga (P2)
Peta Geoinformatik kantong kemiskinan berdasarkan konsumsi
kalori (P1)
Peta Geoinformatik kantong kemiskinan berdasarkan pengeluaran
rumah tangga (P2)
Perbandingan kantong kemiskinan berdasarkan konsumsi kalori
(P1) dan pengeluaran rumahtangga (P2)
Sintesis statistik pindaian berbasis SAE untuk menentukan KLB
kemiskinan di Jember
4.4 Penutup

53
53
55
55
56
56
56
60
65
69
73
75
76

5.

PEMBAHASAN UMUM
Kajian Teori
Kajian simulasi SAE
Simulasi tatistik pindaian
Aplikasi

79
79
79
80
81

6

KESIMPULAN DAN SARAN

84

DAFTAR PUSTAKA

85

DAFTAR LAMPIRAN

91

DAFTAR SINGKATAN DAN ISTILAH

129

RIWAYAT HIDUP

131

xiii

TAFTAR TABEL
Halaman
Tabel 3.1

Rangkuman hasil statistik pindaian menggunakan simulasi 35 area
tersurvei

45

Tabel 3.2

Rangkuman hasil simulasi statistik pindaian HB 35 area tersurvei

46

Tabel 3.3

Rangkuman hasil statistik pindaian simulasi SEBLUP 35 area
tersurvei

47

Tabel 3.4

Klasifikasi HB1 35 area tersurvei dengan hotspot 0,95

47

Tabel 3.5

Klasifikasi HB2 35 area tersurvei dengan hotspot 0,95

47

Tabel 3.6

Rangkuman simulasi statistik pindaian 35 dan 247 area

48

Tabel 3.7

Klasifikasi HB1 dari seluruh 247 area dengan hotspot awal 0,95

49

Tabel 3.8

Klasifikasi HB1 dari seluruh 247 area dengan hotspot awal 0,6

49

Tabel 3.9

Klasifikasi HB2 dari seluruh 247 area dengan hotspot awal 0,95

49

Tabel 3.10

Klasifikasi HB2 dari seluruh 247 area dengan hotspot awal 0,60

49

Tabel 3.11

Klasifikasi EBLUP dari seluruh 247 area dengan dengan hotspot
awal 0,95

50

Tabel 3.12

Klasifikasi EBLUP dari seluruh 247 area dengan dengan hotspot
awal 0,6

50

Tabel 3.13

Rangkuman hasil metode SAE dan Statistik Pindaian

52

Tabel 4.1

Metode yang digunakan untuk menduga banyaknya kasus
kemiskinan

57

Tabel 4.2

Rangkuman desa miskin berdasarkan konsumsi kalori (P1) 35 desa
tersurvei

57

Tabel 4.3

Klasifikasi desa miskin 35 desa tersurvei berdasarkan konsumsi
kalori (P1) menggunakan HB1-HB4, EBLUP dan SEBLUP

601

Tabel 4.4

Rangkuman statistik pindaian berdasarkan konsumsi kalori (P1)
seluruh 247 desa di Jember

60

Tabel 4.5

Klasifikasi desa miskin berdasarkan konsumsi kalori (P1)
menggunakan pendugaan sintetik untuk seluruh 247 desa melalui
HB1-HB4, EBLUP dan SEBLUP

61

Tabel 4.6

Rangkuman Satscan berdasarkan pengeluaran rumah tangga (P2) di
35 desa tersurvei

63

Tabel 4.7

Klasifikasi desa miskin berdasarkan 35 desa tersurvei berdasarkan
pengeluaran rumah tangga (P2) menggunakan HB2, dan EBLUP

64

xiv

Tabel 4.8

Hasil statistik pindaian berdasarkan pengeluaran rumah tangga (P1)

64

Tabel 4.9

Klasifikasi desa miskin berdasarkan pengeluaran rumah tangga (P2)
menggunakan pendugaan sintetik untuk 247 desa di Jember

65

Tabel 4.10

Rangkuman analisis aplikasi SAE Geoinformatika pada data
kemiskinan Kabupaten Jember

78

DAFTAR GAMBAR
Halaman
Gambar 1.1

Alur kerangka pemikiran disertasi

3

Gambar 1.2

Bagan tahapan kerja disertasi

7

Gambar 1.3

Bagan penulisan disertasi

8

Gambar 2.1

State of the art dan novelti dari disertasi

11

Gambar 3.1

Bagan disain simulasi

34

Gambar 3.2

Bagan pendugaan parameter menggunakan HB SAE dan EBLUP

38

pada Model Fay-Herriot.

Gambar 3.3

Bagan algoritma Gibbs untuk menduga p,

Gambar 3.4

Bagan pendugaan

Gambar 3.5

Mutlak bias metode HB1 dan HB2

41

Gambar 3.6

Mutlak bias metode EBLUP dan SEBLUP

42

Gambar 3.7

Rasio Ragam simulasi DE/ ragam simulasi HB 35 area tersurvei

42

Gambar 3.8

Rasio Ragam simulasi DE terhadap ragam simulasi EBLUP dan
SEBLUP 35 area tersurvei

43

Gambar 3.9

Rasio Ragam sim DE terhadap ragam HB1 dan HB2 simulasi 247
area

44

Gambar 4.1

Perbandingan rasio ragam DE terhadap ragam HB1 dan HB2
berdasarkan konsumsi kalori (P1) dari 35 desa tersrvei

57

Gambar 4.2

Rasio ragam DE terhadap ragam EBLUP dan SEBLUP berdasarkan
konsumsi kalori (P1) dari 35 desa tersurvei

57

Gambar 4.3

Rasio ragam DE/ragam HB1 dan HB2 berdasarkan pengeluaran
rumah tangga (P2) dari 35 desa tersurvei

61

Gambar 4.4

Rasio ragam DE/Ragam EBLUP dan SEBLUP berdasarkan
Pengeluaran rumah tangga (P2) dari 35 desa tersurvei

62

Gambar 4.5

Pemetaan tingkat kemiskinan 35 desa tersurvei berdasarkan
konsumsi kalori (P1) menggunakan DE

66

dan

pada HB SAE

pada simulasi EBLUP

39
39

xv

Gambar 4.6

Pemetaan tingkat kemiskinan 35 desa tersurvei berdasarkan
konsumsi kalori (P1) menggunakan HB1

66

Gambar 4.7

Pemetaan tingkat kemiskinan 35 desa tersurvei berdasarkan
konsumsi kalori (P1) menggunakan HB2

67

Gambar 4.8

Pemetaan tingkat kemiskinan 35 desa tersurvei berdasarkan
konsumsi kalori (P1) menggunakan SEBLUP

67

Gambar 4.9

Pemetaan tingkat kemiskinan seluruh 247 desa berdasarkan
konsumsi kalori (P1) menggunakan HB2.

68

Gambar 4.10 Pemetaan tingkat kemiskinan seluruh 247 desa berdasarkan
konsumsi kalori (P1) menggunakan EBLUP

69

Gambar 4.11 Pemetaan tingkat kemiskinan 35 desa tersurvei berdasarkan
pengeluaran rumah tangga (P2) menggunakan DE

70

Gambar 4.12 Pemetaan tingkat kemiskinan 35 desa tersurvei berdasarkan
pengeluaran rumah tangga (P2) menggunakan HB2

70

Gambar 4.13 Pemetaan tingkat kemiskinan 35 desa tersurvei berdasarkan
pengeluaran rumah tangga (P2) menggunakan EBLUP

71

Gambar 4.14 Pemetaan tingkat kemiskinan seluruh 247 desa berdasarkan
Pengeluaran rumah tangga (P2) menggunakan HB2

72

Gambar 4.15 Pemetaan tingkat kemiskinan seluruh 247 desa berdasarkan
pengeluaran rumah tangga (P2) menggunakan EBLUP

72

Gambar 4.16 Rangkuman kantong-kantong kemiskinan berdasarkan peubah tak
bebas konsumsi kalori (P1) dan pengeluaran rumahtangga (P2)
menggunankan HB2 dan EBLUP untuk 35 desa tersurvei

74

Gambar 4.17 Rangkuman kantong-kantong kemiskinan berdasarkan peubah tak
bebas konsumsi kalori (P1) dan pengeluaran rumahtangga (P2)
menggunankan HB2 dan EBLUP untuk seluruh 247 desa di Jember

75

DAFTAR LAMPIRAN
Halaman
Lampiran 1

Pembuktian sifat tak bias, ragam kecil, konsistensi dari peubah acak
binomial

Lampiran 2a Program simulasi HB2 dari 35 area tersurvei

92
94

Lampiran 2b Program simulasi SEBLUP

106

Lampiran 3

Tabel Parameter dan hasil pendugaan parameter melalui simulasi

111

Lampiran 4a Tabel Hasil simulasi HB dari seluruh 247 area di Jember dengan
statistik pindaian.

112

xvi

Lampiran 4b Tabel Hasil statistik pindaian simulasi EBLUP dari seluruh 247
area di Jember

112

Lampiran 5a Tabel Rangkuman hasil statistik pindaian simulasi area berjumlah
kecil (35 area/desa tersurvei) dan area berjumlah banyak (seluruh
247 area/desa di Jember)

113

Lampiran 5b Tabel Rangkuman perbandingan hasil statistik pindaian berbagai
metode

113

Lampiran 6a Tabel Rangkuman proporsi berdasarkan konsumsi kalori per hari
(P1)

114

Lampiran 6b Tabel Rangkuman proporsi pengeluaran tangga per kapita (P2)

115

Lampiran 7a Tabel Pemetaan KLB desa miskin di Kabupaten Jember
berdasarkan Susenas BPS

117

Lampiran 7b Tabel Rangkuman berdasarkan konsumsi kalori (P1) dan
pengeluaran rumahtanggaper kapita (P2)

118

Lampiran 8a Tabel Rangkuman hasil statistik pindaian dari 35 desa tersurvei dan 127
seluruh 247 desa di Kabupaten Jember berdasarkan konsumsi kalori
(P1)
Lampiran 8b Tabel Rangkuman hasil statistik pindaian 35 desa tersurvei dan
seluruh 247 desa di Kabupaten Jember berdasarkan pengeluaran
rumah tangga per kapita (P2)

127

Lampiran 9

128

Tabel verifikasi hasil prediksi SAE

1

1 PENDAHULUAN
Latar Belakang
Geoinformatika (disebut juga Geomatika) merupakan integrasi dari ilmu dan
teknologi untuk mengoleksi, mentransformasi, mengembangkan, dan
menjeneralisasi informasi dari basis data spasial dan data bukan spasial (Rai,
Sahoo & Ahmad 2009; Sahoo 2005). Beberapa bagian penting dalam
Geoinformatika yaitu Remote Sensing (RS), Geographical Information Sciences
(GISc), Global Positioning Systems (GPS), Relational Data Base Management
Systems (RDBMS), Geographical Information Systems (GIS) (Dietmar 2006).
Tujuan utama dari Geoinformatika adalah mendeteksi hotspot geospasial dan
hotspot spatio-temporal dalam penentuan potensi suatu lokasi secara cepat (Patil
2007). Hotspot dapat mengidentifikasi suatu wilayah yang nilai (frekuensi) nya
tinggi. Apabila wilayah yang berdekatan frekuensinya rendah, maka gambar
surface plotnya akan berupa puncak di antara lembah, begitu juga sebaliknya
(Patil & Meyer 2009). Hotspot berarti sesuatu yang tidak biasa, anomali,
penyimpangan, daerah kritis (Kulldorff & Nagarwala 1995; Patil & Taillie 2003).
Untuk mendeteksi adanya hotspot digunakan prinsip pengujian hipotesis.
Pengujian hipotesis dalam Geoinformatika didasarkan pada nisbah atau rasio dari
fungsi kemungkinan, sedangkan fungsi kemungkinan dalam hal ini didasarkan
pada contoh. Akurasi dan presisi dari contoh tergantung dari ukuran contoh. Rasio
dari fungsi kemungkinan merupakan rasio antara fungsi kemungkinan
berdasarkan data dibandingkan dengan fungsi kemungkinan apabila hipotesis nol
benar. Jika ukuran contoh kecil maka fungsi kemungkinan akan mempunyai nilai
yang kecil. Hasil rasio fungsi kemungkinan tersebut juga kecil, sehingga sulit
untuk mendeteksi perbedaan karena kecenderungan kesimpulannya menjadi tidak
nyata. Dalam keadaan demikian memungkinkan adanya ketidaktepatan dalam
menguji hipotesis disebabkan oleh ukuran contoh yang kecil. Oleh karenanya
peneliti akan sulit untuk mengatakan apakah hasil tersebut terjadi karena
kebetulan atau sesungguhnya (Kalla 2009). Patil & Meyers (2009) menyatakan
bahwa apabila ukuran contoh kecil maka pengujian hipotesis tidak memberikan
perbedaan proporsi antara daerah satu dengan lainnya. Rao (2003)
mengemukakan bahwa suatu domain dipandang sebagai “kecil” apabila contoh
domain-khusus tidak cukup kuat dalam mendukung penduga langsung (DE,
Direct Estimate), untuk memperoleh ketelitian yang sesuai. Domain dengan
ukuran contoh kecil meliputi “wilayah lokal”, “subdomain”, “subgrup kecil”,
“subprovinsi”, dan “domain minor”. Sedangkan suatu domain (wilayah) dikatakan
besar (atau mayor) jika contoh domain-khusus cukup besar untuk menghasilkan
DE dengan presisi yang sesuai. Suatu DE adalah penduga yang didasarkan hanya
pada domain-khusus data contoh.
Peneliti, pada praktiknya, jarang melakukan pengamatan terhadap seluruh
anggota populasi atau melakukan sensus pada penelitiannya, tetapi umumnya
melakukan survei. Kondisi ukuran contoh yang kecil tidak dapat memberikan
hasil dugaan yang akurat dan presisi. Oleh karenanya diperlukan suatu prosedur
statistika yang dapat mengkombinasikan data dari contoh kecil dan besar, dengan

2

mengambil keuntungan secara detil dalam survei contoh dan sensus. Metode
yang tepat untuk memberi solusi dalam hal ini adalah Small Area Estimation atau
disingkat SAE (Elbers et.al. 2002, Rao 2003, Parsons & Schenker 2008). Sebagai
contoh, Hentschel et al. (2000) mengusulkan untuk mengkombinasikan antara
data survey dengan data sensus. Vogt (2010) menyatakan bahwa untuk pertama
kalinya Jerman pada tahun 2011 akan melakukan sensus berdasarkan data
administrasi yang sudah ada dengan memanfaatkan pencatatan yang tersedia,
tidak menggunakan metode lama dengan cara mencacah setiap individu. Namun
tidak semua informasi dapat diperoleh melalui pencatatan administrasi, seperti
pendidikan, pelatihan, pekerjaan. Informasi tentang pendidikan, pelatihan,
pekerjaan tersebut dapat diperoleh melalui survei. Metode sensus seperti ini dapat
menghemat biaya karena sebagian informasi telah diperoleh melalui pencatatan
administrasi, dan sebagian melalui survei (Vogt 2010).
SAE merupakan pendekatan yang menggunakan data survei dan meminjam
kekuatan dari data yang mewakili karakteristik populasi (sebagai contoh data
administrasi) seperti pada data sensus. Metode ini menggunakan informasi
tambahan yang memungkinkan untuk menghubungkan data survei dengan data
administrasi agar dapat diperoleh pendugaan dalam wilayah kecil, sehingga
diperoleh pendugaan yang efisien (Gosh & Rao 1994). Metode ini membantu
memperbaiki informasi dan ukuran contoh menjadi lebih efektif. Misalnya,
peneliti dapat mengkombinasikan informasi wilayah serupa atau informasi
tambahan dari pencatatan administrasi (Jiang & Lahiri 2006). Statistik yang
digunakan untuk menduga parameter melalui data sampel di SAE disebut sebagai
DE.
SAE digunakan untuk menduga parameter, atau digunakan untuk
memprediksi, namun tidak digunakan untuk menguji klaster mana yang paling
signifikan secara statistika. Klaster suatu daerah yang lebih tinggi atau lebih
rendah dari daerah lain disebut sebagai most likely cluster (MLC) atau Kondisi
Luar Biasa (KLB). Salah satu cara untuk menentukan KLB adalah dengan
Statistik Pindaian, merupakan metode geoinformatika yang mempertimbangkan
unsur spasial untuk mendeteksi daerah secara geografis yang mempunyai potensi
tinggi atau rendah dan mengevaluasi signifikansi parameter satu daerah
dibandingkan dengan daerah lain secara statistika (Jung, Kulldorff & Klassen
2007). Pada penelitiannya, Jung et al. (2007) menggunakan statistik pindaian
untuk mendeteksi daerah KLB yang dilanda penyakit kanker prostat di Maryland.
Kulldorff scan statistic merupakan metode spatial scan statistic yang
digunakan untuk mendeteksi dan mengevaluasi signifikansi secara statistika dari
klaster spasial (spatial clusters). Sedangkan Spatial Satscan merupakan perangkat
lunak statistik pindaian spasial yang digunakan untuk mendeteksi adanya hotspot.
Tujuan dari statistik pindaian spasial adalah mengidentifikasi konsentrasi spasial
dari individu-individu dengan kondisi tertentu (Hsu et al. 2004; Andrade et al.
2004; Odoi et al. 2004; Sheehan et al. 2004; Heffernan et al. 2004; Washington et
al. 2004). Oleh karena itu, statistik pindaian spasial memerlukan informasi
lengkap tentang populasi agar klaster spasial pada suatu daerah dapat dideteksi.
SAE meskipun tidak untuk membandingkan antar daerah, keuntungan
terbesar dari SAE adalah menduga parameter daerah secara lengkap, baik daerah
yang tersurvei maupun yang tidak. Dengan data dugaan hasil analisis SAE yang
lengkap tersebut maka statistik pindaian diharapkan dapat digunakan untuk

3

mendeteksi hotspot atau Kondisi Luar Biasa (KLB). Peneliti biasanya
menggunakan penduga langsung yang mempunyai ukuran contoh kecil sebagai
input dalam statistik pindaian. Sedangkan statistik pindaian memerlukan
informasi lengkap yang tidak dapat diperoleh dari penduga langsung berbasis
survei. Oleh karena itu, pada disertasi ini digunakan hasil pendugaan SAE untuk
menggantikan DE. Diharapkan penduga parameter hasil pendugaan melalui SAE
dapat digunakan untuk menggantikan peran statistik DE untuk mengu