Spatial Empirical Best Linear Unbiased Prediction Methods for Small Areas to Estimate monthly Expenditure per capita (Case Study: The Province of East Java District Jember).
METODE PREDIKSI TAK BIAS LINIER TERBAIK EMPIRIS
SPASIAL PADA AREA KECIL UNTUK PENDUGAAN
PENGELUARAN PER KAPITA
(Studi Kasus : Kabupaten Jember Provinsi Jawa Timur)
DARIANI MATUALAGE
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2012
PERNYATAAN MENGENAI TESIS
DAN SUMBER INFORMASI
Dengan ini saya menyatakaan bahwa tesis Metode Prediksi Tak Bias Linier
Terbaik Empiris Spasial pada Area Kecil untuk Pendugaan Pengeluaran Per
Kapita (Studi Kasus: Kabupaten Jember Provinsi Jawa Timur) adalah karya saya
dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa
pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau
dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain
telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian
akhir tesis ini.
Bogor, Januari 2012
Dariani Matualage
NIM G151080031
ABSTRACT
DARIANI MATUALAGE. Spatial Empirical Best Linear Unbiased Prediction
Methods for Small Areas to Estimate monthly Expenditure per capita (Case
Study: The Province of East Java District Jember). Supervised by ASEP
SAEFUDDIN and AJI HAMIM WIGENA.
Poverty of an area can be measured by their per capita expenditure. Direct
estimation of expenditure per capita based on small area data may cause a large
variance of estimates. Spatial Empirical Best Linear Unbiased Prediction
(SEBLUP) is one of the small area estimation methods to solve the problems. The
method is developed from EBLUP allowing correlation among area. Susenas Data
was used to compare SEBLUP, direct estimation and EBLUP. The result showed
that the standard error of SEBLUP was smaller than those of direct estimation and
EBLUP
Keywords : SAE, SEBLUP, limit models, Susenas
RINGKASAN
DARIANI MATUALAGE. Metode Prediksi Tak Bias Linier Terbaik Empiris
Spasial pada Area Kecil untuk Pendugaan Pengeluaran Per Kapita Studi Kasus:
Kabupaten Jember Provinsi Jawa Timur. Dibimbing oleh ASEP SAEFUDDIN
dan AJI HAMIM WIGENA.
Kemiskinan suatu wilayah merupakan masalah besar yang dihadapi Bangsa
Indonesia. Berbagai upaya telah dilakukan oleh pemerintah untuk menanggulangi
masalah ini, misalnya dimulai dengan menduga wilayah-wilayah miskin hingga
tingkat administrasi desa sehingga diharapkan upaya pengentasan kemiskinan
akan lebih tepat sasaran. Indikator utama yang digunakan Badan Pusat Statistik
(BPS) dalam menentukan suatu wilayah tergolong miskin (tertinggal) atau tidak
adalah rata-rata pengeluaran per kapita wilayah tersebut.
Data pengeluaran per kapita suatu wilayah diduga dengan menggunakan
hasil Survei Sosial-Ekonomi Nasional (Susenas) yang dilakukan oleh BPS. Survei
ini dirancang untuk mengumpulkan data sosial kependudukan yang relatif sangat
luas, yaitu untuk memperoleh statistik nasional hingga pada tingkat
kabupaten/kota. Ketika hasil survei ini digunakan untuk melakukan pendugaan
pada tingkat yang lebih kecil (misalnya kecamatan atau desa), maka akan muncul
persoalan galat baku yang sangat besar. Selain itu, karena tidak setiap desa
menjadi contoh dalam Susenas, maka pendugaan itu tidak dapat dilakukan pada
desa yang tidak terpilih sebagai contoh.
Salah satu metode yang dikembangkan untuk menangani masalah tersebut
adalah metode pendugaan area kecil (small area estimation, SAE). Metode ini
mengandung informasi bukan hanya berasal dari wilayah (area) itu tetapi juga
memanfaatkan informasi tambahan baik berupa nilai parameter dari area kecil lain
yang memiliki karakteristik serupa dengan area kecil tersebut, atau nilai pada
waktu yang lalu, juga nilai dari peubah yang memiliki hubungan dengan peubah
yang sedang diamati (Rao 2003). Tujuan dari metode pendugaan ini adalah untuk
meningkatkan keefektifan ukuran contoh dan menurunkan keragaman dugaan
parameter. Asumsi dasar dalam mengembangkan model untuk SAE adalah bahwa
keragaman peubah yang diamati dapat diterangkan oleh hubungan keragaman
pada informasi tambahan sebagai pengaruh tetap. Asumsi lainnya adalah bahwa
keragaman khusus area kecil tidak dapat diterangkan oleh informasi tambahan
tersebut dan dapat dikategorikan sebagai pengaruh acak area kecil. Gabungan dari
dua asumsi tersebut membentuk model linier campuran (mixed linear models).
Salah satu sifat menarik dari model linier campuran adalah kemampuannya
dalam menduga kombinasi linier dari pengaruh tetap dan pengaruh acak.
Henderson (1953,1975) dalam papernya mengembangkan teknik penyelesaian
model pengaruh campuran, yaitu metode prediksi tak bias linier terbaik (best
linear unbiased prediction, BLUP). Metode ini kemudian dikaji lebih lanjut oleh
Harville (1977) dengan terlebih dahulu melakukan pendugaan komponen ragam
dengan metode kemungkinan maksimum (maximum likelihood) dan kemungkinan
maksimum terkendala (restricted maximum likelihood), sehingga disebut prediksi
tak bias linier terbaik empirik (empirical best linear unbiased prediction,
EBLUP).
Penggunaan metode EBLUP untuk menduga pengeluaran perkapita belum
memasukkan pengaruh spasial ke dalam model. Di lain pihak pembagian batas
desa berdasarkan pada kriteria administrasi dan tidak menutup adanya
kemungkinan pengaruh spasial terhadap pengeluaran per kapita desa. Hal ini
sesuai dengan hukum pertama tentang geografi yang dikemukakan oleh Tobler
(Tobler’s first law of geography) dalam Schabenberger dan Gotway (2005) yang
merupakan pilar kajian analisis data spasial, yaitu : everything is related to
everything else, but near things are more related than distant things”. Segala
sesuatu saling berhubungan satu dengan yang lainnya, tetapi sesuatu yang lebih
dekat akan lebih berpengaruh daripada sesuatu yang jauh. Untuk itu diperlukan
suatu pendekatan dengan memasukkan pengaruh spasial. Penduga EBLUP dengan
memperhatikan pengaruh acak area yang berkorelasi spasial dikenal dengan
istilah penduga prediksi tak bias linier terbaik empirik spasial (Spatial Empirical
Best Linear Unbiased Prediction, SEBLUP). Penduga SEBLUP telah digunakan
oleh Petrucci & Salvati (2004a, 2004b), Salvati (2004), Chandra, Salvati &
Chambers (2007) dan Pratesi & Salvati (2008) dengan memasukkan matriks
pembobot spasial tetangga terdekat (nearest neighbors) ke dalam model EBLUP.
Penggunaan matriks pembobot seperti ini tidak dapat dilakukan untuk desa-desa
di Kabupaten Jember yang terpilih sebagai contoh dalam Susenas, karena hanya 9
pasang desa yang saling berdekatan sehingga matriks tersebut hampir semua
(98.37%) berisi angka 0.
Ada berbagai bentuk matriks pembobot spasial yang telah digunakan
selama ini. Salah satu matriks pembobot yang digunakan oleh Fotheringham &
Rogerson (2009) adalah matriks pembobot spasial model limit (limit models) atau
disebut juga matriks pembobot batas ambang. Matriks pembobot spasial ini
mempunyai nilai jika jarak antar area lebih kecil atau sama dengan suatu batas
jarak yang telah ditentukan. Berdasarkan hasil penelitian Rahmawati (2010) yang
menyatakan bahwa jarak antar desa di Kabupaten Jember Provinsi Jawa Timur
masih memberikan pengaruh terhadap data pengeluaran per kapita desa jika jarak
antar desa tersebut kurang atau sama dengan 9.09 km. Jarak inilah yang
digunakan sebagai batas jarak untuk menyusun matriks pembobot spasial
berdasarkan model limit dan kemudian digunakan dalam model SEBLUP. Metode
ini kemudian digunakan untuk menduga pengeluaran perkapita desa di Kabupaten
Jember Provinsi Jawa Timur dan menghitung MSE dan RRMSE dengan
menggunakan data rata-rata pengeluaran perkapita desa yang diambil dari hasil
Susenas 2008 sebagai penduga langsung dan data persentase keluarga penerima
ASKESKIN dalam setahun terakhir sebagai peubah penyerta yang diambil dari
data Podes 2008.
Hasil analisis menunjukkan bahwa metode SEBLUP lebih baik
dibandingkan dengan metode pendugaan langsung maupun EBLUP, sedangkan
antara metode pendugaan langsung tidak jauh berbeda dengan metode EBLUP.
Hal ini terlihat dari nilai RRMSE untuk metode SEBLUP yang jauh lebih kecil
bila dibandingkan dengan metode pendugaan langsung maupun metode EBLUP.
© Hak Cipta milik IPB, tahun 2012
Hak Cipta dilindungi Undang-undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan
yang wajar bagi IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh Karya tulis
dalam bentuk apa pun tanpa izin IPB
METODE PREDIKSI TAK BIAS LINIER TERBAIK EMPIRIS
SPASIAL PADA AREA KECIL UNTUK PENDUGAAN
PENGELUARAN PER KAPITA
(Studi Kasus : Kabupaten Jember Provinsi Jawa Timur)
DARIANI MATUALAGE
Tesis
Sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Program Studi Statistika
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2012
Judul Tesis : Metode Prediksi Tak Bias Linier Terbaik Empiris Spasial pada
Area Kecil untuk Pendugaan Pengeluaran Perkapita (Studi Kasus :
Kabupaten Jember Provinsi Jawa Timur)
Nama
: Dariani Matualage
NRP
: G151080031
Disetujui
Komisi Pembimbing
Dr. Ir. Asep Saefuddin, M.Sc
Ketua
Dr. Ir. Aji Hamim Wigena, M.Sc
Anggota
Diketahui
Ketua Program Studi Statistika
Dekan Sekolah Pascasarjana
Dr.Ir. Erfiani, M.Si.
Dr. Ir. Dahrul Syah, M.Sc.Agr
Tanggal Ujian: 6 Desember 2011
Tanggal Lulus:
PRAKATA
Puji dan syukur Ke hadirat Tuhan Yang Maha Kuasa atas segala berkat dan
karunia-Nya sehingga karya ilmiah ini dapat diselesaikan. Judul karya ilmiah ini
adalah “Metode Prediksi Tak Bias Linier Terbaik Empiris Spasial pada Area
Kecil untuk Pendugaan Pengeluaran Per Kapita (Studi Kasus: Kabupaten Jember
Provinsi Jawa Timur)”. Penelitian yang dilakukan penulis merupakan bagian dari
payung Hibah Penelitian Pascasarjana Departemen Statistika, Institut Pertanian
Bogor yang didanai oleh Direktur Jenderal Pendidikan Tinggi, Departemen
Pendidikan Nasional.
Terima kasih penulis sampaikan kepada Bapak Dr. Ir. Asep Saefuddin,
M.Sc selaku ketua komisi pembimbing dan Bapak Dr. Ir. Aji Hamim Wigena,
M.Sc selaku anggota komisi pembimbing atas bimbingan, saran dan waktunya
yang telah diberikan kepada penulis. Disamping itu penulis juga mengucapkan
terima kasih kepada Dr. Ir. Anik Djuraidah, M.S selaku penguji luar komisi pada
ujian tesis, Dr. Anang Kurnia dan seluruh dosen dan staf Program Studi Statistika.
Ungkapan terima kasih juga disampaikan kepada segenap keluarga,
terutama kakak, ipar dan kemenakan-kemenakan tercinta teristimewa
kemenakanku Ester Ivana Nangin (alm) serta sahabat-sahabat atas doa, dukungan
dan kasih sayangnya kepada penulis. Terima kasih kepada teman-teman Statistika
dan Statistika Terapan angkatan 2008, 2009, 2010 baik S2 maupun S3 serta
teman-teman dari Universitas Negeri Papua atas bantuan dan kebersamaannya
selama ini. Semoga karya ilmiah ini dapat bermanfaat.
Bogor, Januari 2012
Dariani Matualage
RIWAYAT HIDUP
Penulis dilahirkan di Biak, Papua pada tanggal 18 April 1977 sebagai anak
keempat dari empat bersaudara, anak dari pasangan Max Matualage (alm) dan
E. B. Bermuli (alm).
Penulis menyelesaikan pendidikan SD hingga SLTA di Biak. Setelah
menyelesaikan pendidikan SLTA di SMAN 1 Biak pada tahun 1995, penulis
kemudian melanjutkan perkuliahan di Program Studi Statistika Jurusan
Matematika dan Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Hasanuddin Makassar dan lulus pada tahun 2001. Penulis bekerja
sebagai Staf Pengajar di Jurusan Matematika dan Statistika Fakultas Matematika
dan Ilmu Pengetahuan Alam Universitas Negeri Papua Manokwari sejak tahun
2005 hingga sekarang.
DAFTAR ISI
Halaman
DAFTAR TABEL ........................................................................................ xiii
DAFTAR GAMBAR ................................................................................... xiv
DAFTAR LAMPIRAN ................................................................................ xv
PENDAHULUAN
Latar Belakang ....................................................................................
Tujuan Penelitian .................................................................................
1
4
TINJAUAN PUSTAKA
Profil Kabupaten Jember .....................................................................
Pengeluaran Per kapita.........................................................................
Pendugaan Area Kecil .........................................................................
Prediksi Tak Bias Linear Terbaik Empiris ...........................................
Prediksi Tak Bias Linear Terbaik Empiris Spasial ……………………
5
5
6
8
10
METODOLOGI PENELITIAN
Data .................................................................................................... 15
Metode Penelitian ................................................................................ 16
HASIL DAN PEMBAHASAN
Pendugaan Pengeluaran Per Kapita ..…………………………………. 19
Pendugaan MSE dan RRMSE ............................................................. 22
Pengujian Model ……………………………………………………… 23
KESIMPULAN DAN SARAN
Kesimpulan ......................................................................................... 25
Saran ................................................................................................... 25
DAFTAR PUSTAKA .................................................................................. 27
LAMPIRAN ................................................................................................ 31
DAFTAR TABEL
Halaman
1
Nilai pendugaan untuk koefisien regresi dan ragam peubah acak
dengan metode EBLUP .......................................................................
2
20
Nilai pendugaan koefisien regresi, ragam dari galat peubah acak
area dan koefisien otoregresif spasial menggunakan metode
Spasial EBLUP .................................................................................... 21
3
Statistik deskriptif nilai dugaan pengeluaran per kapita
untuk masing-masing metode.............................................................. 22
DAFTAR GAMBAR
Halaman
1
Diagram kotak garis pengeluaran per kapita desa/kelurahan dengan
untuk masing-masing metode............................................................... 22
2
Perbandingan nilai RRMSE untuk masing-masing desa/kelurahan
dengan metode langsung, EBLUP ML, EBLUP REML, SEBLUP
ML dan SEBLUP REML ..................................................................... 23
3
Plot q-q untuk sisaan baku dari model pendugaan dengan metode
SEBLUP .............................................................................................. 24
DAFTAR LAMPIRAN
Halaman
1
Rumus yang digunakan untuk menduga
2
Rumus yang digunakan untuk menduga
dan
dengan
metode SEBLUP ................................................................................ 34
3
Jumlah rumah tangga di Kabupaten Jember dan jumlah rumah
tangga yang terpilih sebagai contoh dalam Susenas 2008 ..................... 36
4
Nilai pendugaan pengeluaran per kapita dan MSE untuk masingmasing metode..................................................................................... 37
5
Nilai pendugaan bagi RRMSE untuk masing-masing metode
pendugaan ........................................................................................... 39
dengan metode EBLUP .... 33
PENDAHULUAN
Latar Belakang
Kemiskinan merupakan masalah besar yang dihadapi Bangsa Indonesia.
Salah satu wilayah yang tergolong wilayah miskin adalah Kabupaten Jember
Provinsi Jawa Timur (Kusumaningrum 2010). Padahal kabupaten ini memiliki
potensi sektor pertanian yang cukup tinggi khususnya untuk tanaman padi dan
palawija (BPS 2009). Berbagai upaya telah dilakukan oleh pemerintah untuk
menanggulangi masalah ini, yang dimulai dengan memprediksi wilayah-wilayah
miskin hingga tingkat administrasi desa. Data kemiskinan ini diharapkan dapat
digunakan untuk mengentaskan kemiskinan. Indikator utama yang digunakan
Badan Pusat Statistik (BPS) dalam menentukan suatu wilayah tergolong miskin
(tertinggal) atau tidak adalah rata-rata pengeluaran per kapita wilayah tersebut.
Data mengenai rata-rata pengeluaran per kapita suatu wilayah diduga
dengan menggunakan data pengeluaran per kapita yang ada di wilayah tersebut
berdasarkan hasil Survei Sosial-Ekonomi Nasional (Susenas) yang dilakukan oleh
BPS. Survei ini dirancang untuk mengumpulkan data sosial kependudukan yang
relatif sangat luas, yaitu untuk memperoleh statistik nasional. Jika hasil survei ini
digunakan untuk melakukan pendugaan pada tingkat yang lebih kecil (misalnya
desa), maka akan muncul persoalan galat baku yang sangat besar. Selain itu, tidak
setiap desa menjadi contoh dalam Susenas, sehingga pendugaan itu tidak dapat
dilakukan pada desa yang tidak terpilih sebagai contoh.
Persoalan-persoalan ini kemudian diatasi dengan mengembangkan metode
pendugaan parameter yang dikenal dengan metode pendugaan area kecil (small
area estimation, SAE). Pada metode SAE, informasi yang digunakan bukan hanya
berasal dari wilayah (area) itu tetapi juga memanfaatkan informasi tambahan dari
area kecil lain yang memiliki karakteristik serupa dengan area kecil tersebut, atau
nilai pada waktu yang lalu, juga nilai dari peubah yang memiliki hubungan
dengan peubah yang sedang diamati (Rao 2003).
Ada dua asumsi dasar dalam mengembangkan model untuk SAE, yaitu
bahwa keragaman di dalam area kecil dapat diterangkan oleh hubungan
keragaman yang ada pada informasi tambahan sebagai pengaruh tetap. Asumsi
lainnya adalah bahwa keragaman khusus area kecil tidak dapat diterangkan oleh
informasi tambahan dan merupakan pengaruh acak area kecil. Gabungan dari dua
asumsi tersebut membentuk model linier campuran (mixed models).
Salah satu sifat menarik dari model linier campuran adalah kemampuannya
dalam menduga kombinasi linier dari pengaruh tetap dan pengaruh acak.
Henderson (1953,1975) mengembangkan teknik penyelesaian model linier
campuran, yaitu metode prediksi tak bias linier terbaik (best linear unbiased
prediction, BLUP). Metode ini kemudian dikaji lebih lanjut oleh Harville (1977)
dengan terlebih dahulu melakukan pendugaan komponen ragam dengan metode
kemungkinan maksimum (maximum likelihood) dan kemungkinan maksimum
terkendala (restricted maximum likelihood), sehingga disebut prediksi tak bias
linier terbaik empiris (empirical best linear unbiased prediction, EBLUP).
Penelitian dengan menggunakan metode EBLUP untuk data Susenas telah
banyak dilakukan, antara lain Kurnia (2009) menggunakan model SAE melalui
pendekatan EBLUP baku yang kemudian dilanjutkan dengan EBLUP untuk
model transformasi logaritma. Hasilnya adalah bahwa model lognormal
memberikan hasil yang lebih baik dibandingkan dengan pendugaan langsung
melalui metode penarikan contoh, walaupun bias relatifnya cukup besar. Pada
tahun yang sama, Sadik (2009) juga menggunakan model EBLUP dengan
pendekatan deret waktu pada data Susenas yang diambil setiap tahun. Hasilnya
adalah EBLUP deret waktu lebih baik dibandingkan dengan EBLUP tanpa
pendekatan deret waktu. Hal ini menunjukkan bahwa pengaruh acak area dan
waktu maupun pengaruh sintetik vektor kovariat (peubah penyerta) berfungsi
memperbaiki hasil pendugaan metode EBLUP yang hanya didasarkan pada data
survei satu tahun saja.
Kedua penelitian itu menggunakan model SAE dengan pendekatan EBLUP
tetapi belum memasukkan pengaruh spasial ke dalam model. Seperti diketahui
bahwa pembagian batas desa menunjuk pada kriteria administrasi. Oleh karena itu
pembagian ini tidak membatasi adanya pengaruh spasial terhadap pengeluaran per
kapita desa, atau dengan kata lain, pengeluaran per kapita desa dapat juga
dipengaruhi oleh pengeluaran per kapita desa yang berada dekat dengan desa
tersebut. Hal ini sesuai dengan hukum pertama tentang geografi yang
dikemukakan oleh Tobler (Tobler’s first law of geography) dalam Schabenberger
dan Gotway (2005) yang merupakan pilar kajian analisis data spasial, yaitu :
everything is related to everything else, but near things are more related than
distant things”. Segala sesuatu saling berhubungan satu dengan yang lainnya,
tetapi sesuatu yang lebih dekat akan lebih berpengaruh daripada sesuatu yang
jauh. Untuk itu diperlukan suatu pendekatan dengan memasukkan pengaruh
spasial. Penduga EBLUP dengan memperhatikan pengaruh acak area yang
berkorelasi spasial dikenal dengan istilah penduga SEBLUP (Spatial Empirical
Best Linear Unbiased Prediction).
Penduga SEBLUP telah digunakan oleh Petrucci & Salvati (2004a, 2004b),
Salvati (2004), Chandra, Salvati & Chambers (2007) dan Pratesi & Salvati (2008)
dengan memasukkan matriks pembobot spasial tetangga terdekat (nearest
neighbors) ke dalam model EBLUP. Penggunaan matriks pembobot seperti ini
tidak dapat dilakukan untuk desa-desa di Kabupaten Jember yang terpilih sebagai
contoh dalam Susenas, karena hanya 9 pasang desa yang saling berdekatan
sehingga matriks tersebut berisi angka 0 sebanyak 98.37%.
Ada berbagai bentuk matriks pembobot spasial yang telah digunakan
selama ini. Salah satu matriks pembobot yang digunakan oleh Fotheringham &
Rogerson (2009) adalah matriks pembobot spasial model limit (limit models) atau
disebut juga matriks pembobot batas ambang. Matriks pembobot spasial ini
mempunyai nilai jika jarak antar area lebih kecil atau sama dengan suatu batas
jarak yang telah ditentukan. Berdasarkan hasil penelitian Rahmawati (2010) yang
menyatakan bahwa jarak antar desa di Kabupaten Jember Provinsi Jawa Timur
masih memberikan pengaruh terhadap data pengeluaran per kapita desa jika jarak
antar desa tersebut kurang atau sama dengan 9.09 km. Jarak inilah yang akan
digunakan sebagai batas jarak untuk menyusun matriks pembobot spasial
berdasarkan pembobot batas ambang dan kemudian digunakan dalam model
SEBLUP.
Tujuan
Tujuan penelitian ini adalah:
1. Melakukan pendugaan rata-rata pengeluaran per kapita desa di Kabupaten
Jember dengan metode EBLUP dan SEBLUP
2. Membandingkan metode EBLUP dan metode SEBLUP
TINJAUAN PUSTAKA
Profil Kabupaten Jember
Berdasarkan data BPS (2009), Kabupaten Jember secara geografis terletak
pada 113030’ - 113045’ Bujur Timur dan 8 000’ - 8030’ Lintang Selatan. Wilayah
Kabupaten Jember di sebelah utara berbatasan dengan Kabupaten Bondowoso dan
Kabupaten Probolinggo, sebelah timur berbatasan dengan Kabupaten Banyuwangi
sedangkan sebelah barat berbatasan dengan Kabupaten Lumajang dan sebelah
selatan berbatasan dengan Samudra Hindia. Luas wilayah Kabupaten Jember 3
293.34 Km2 yang terbagi menjadi 31 kecamatan terdiri atas 28 kecamatan dengan
225 desa dan 3 kecamatan dengan 22 kelurahan dengan Jember sebagai ibukota
kabupaten. Khusus untuk Susenas 2008, desa-desa yang menjadi contoh sebagian
besar berada pada kecamatan yang berbeda, hanya sembilan kecamatan yang
memiliki lebih dari satu desa yang menjadi contoh dalam survei tersebut.
Kabupaten Jember memiliki potensi sektor pertanian yang cukup tinggi
khususnya untuk tanaman padi dan palawija. Pada tahun 2008, Jember memiliki
potensi luas panen tanaman padi 143 597 ha dengan produksi 813 995 ton, untuk
tanaman jagung berpotensi luas panen 67 869 ha dengan produksi sebesar 396 818
ton, serta tanaman kedelai berpotensi luas panen 12 186 ha dengan produksi 14
545 ton. Pendapatan Asli Daerah (PAD) yang cukup besar yaitu Rp1 366 522 000
000.00 dan menduduki urutan ketiga terbesar di Provinsi Jawa Timur setelah
Surabaya dan Sidorajo. Sedangkan Pendapatan Domestik Regional Bruto (PDRB)
Kabupaten Jember sebesar Rp9 864 000 000.00 (BPS 2009).
Pengeluaran Per kapita
Beberapa data yang diperoleh dari Susenas 2008 adalah data pengeluaran
rumah tangga per bulan dan data pengeluaran per kapita. BPS mendefinisikan
pengeluaran rumah tangga sebulan adalah semua biaya yang dikeluarkan rumah
tangga selama sebulan untuk memenuhi kebutuhan konsumsi untuk semua
anggota rumah tangga. Data pengeluaran per kapita diperoleh dari jumlah
pengeluaran rumah tangga sebulan dibagi dengan jumlah anggota rumah tangga
tersebut (BPS 2008). Berdasarkan asumsi bahwa penarikan contoh yang dilakukan
berdasarkan penarikan contoh acak sederhana, maka rata-rata pengeluaran per
kapita desa diperoleh dengan rumus :
dengan :
= rata-rata pengeluaran per kapita desa ke-i, dengan i = 1,2, . . . , m
= pengeluran per kapita rumah tangga ke – j di desa ke- i ,
dengan j = 1, 2, . . . ,n i
= jumlah rumah tangga di desa ke-i
m = jumlah desa
Pendugaan Area Kecil
Pelaksanaan survei dilakukan untuk melakukan pendugaan parameter
populasi. Pendekatan klasik untuk menduga parameter populasi didasarkan pada
aplikasi model disain penarikan contoh (design-based), dan penduga yang
dihasilkan dari pendekatan itu disebut penduga langsung (direct estimation). Data
hasil survei ini dapat digunakan untuk mendapatkan penduga yang terpercaya dari
total maupun rata-rata populasi suatu area atau domain dengan jumlah contoh
yang besar. Namun, ketika penduga langsung tersebut digunakan untuk suatu area
yang kecil, maka akan menimbulkan galat baku yang besar (Ghosh dan Rao
1994). Selain itu, pendugaan langsung tidak dapat dilakukan pada area yang tidak
terpilih sebagai contoh, karena tidak adanya data yang dapat digunakan untuk
melakukan pendugaan. Suatu area dikatakan kecil jika ukuran contoh dalam
domain tersebut tidak cukup memadai untuk mendukung ketelitian penduga
langsung (Rao 2003). Area kecil biasanya digunakan untuk mendefinisikan area
geografi yang kecil atau domain yang memiliki ukuran contoh sangat kecil.
Penanganan masalah galat baku dalam pendugaan area kecil dilakukan
dengan menambahkan informasi mengenai parameter yang sama pada area kecil
lain yang memiliki karakteristik serupa, atau nilai pada waktu yang lalu, atau nilai
dari peubah yang memiliki hubungan dengan peubah yang sedang diamati.
Pendugaan parameter dan inferensinya yang menggunakan informasi tambahan
tersebut dinamakan pendugaan tidak langsung (indirect estimation). Metode ini
secara statistik memiliki sifat meminjam kekuatan (borrowing strength) dari
informasi mengenai hubungan antara peubah yang diamati dengan informasi yang
ditambahkan, sehingga mengefektifkan jumlah contoh yang kecil. Pendugaan
tidak langsung berdasarkan pada model implisit atau model eksplisit yang
menyediakan suatu link yang menghubungkan area-area kecil melalui data
tambahan. Dalam papernya, Petrucci dan Salvati (2004a) menuliskan bahwa
penduga tak langsung ini terdiri dari dua tipe, yaitu penduga tak langsung yang
berdasarkan pada model implisit, antara lain penduga sintetik (synthetic estimator)
dan penduga komposit (composite estimator) serta penduga tak langsung yang
berdasarkan pada model eksplisit (berbasis model) yang menggabungkan
pengaruh acak antar area.
Asumsi dasar dalam pengembangan model untuk SAE adalah bahwa
keragaman di dalam area kecil peubah yang sedang diamati dapat diterangkan
oleh hubungan keragaman yang bersesuaian pada informasi tambahan yang
disebut sebagai pengaruh tetap. Asumsi lainnya adalah bahwa keragaman khusus
area kecil tidak dapat diterangkan oleh informasi tambahan dan merupakan
pengaruh acak area kecil. Gabungan dari dua asumsi tersebut membentuk model
linier campuran (mixed models). Pendugaan area kecil untuk model pengaruh
campuran pertama kali dikembangkan oleh Fay dan Herriot (1979), untuk
menduga pendapatan per kapita suatu area kecil berdasarkan data survei Biro
Sensus Amerika Serikat (U.S. Bureau of the Cencus). Model ini selanjutnya
dikenal dengan model Fay-Herriot yang merupakan model dasar bagi
pengembangan pemodelan area kecil, yaitu
adalah penduga langsung bagi area ke-i,
perhatian bagi area ke-i,
peubah penyerta,
area dengan
serta !"#
dan
, dimana
;
merupakan parameter yang menjadi
adalah koefisien regresi,
adalah galat contoh pada area ke-i.
saling bebas dengan
$ (i = 1, 2, …, m).
=
adalah
adalah pengaruh acak
= 0 dan !"#
Tipe model pendugaan area kecil terbagi menjadi dua, yaitu model tingkat
area (basic area level models) dan model tingkat unit (unit level area models)
(Ghosh dan Rao 1994). Model tingkat area digunakan jika data penyerta yang
bersesuaian dengan data peubah yang diamati tidak tersedia hingga tingkat unit
pengamatan, sedangkan model tingkat unit digunakan jika data penyerta yang
bersesuaian dengan data peubah yang diamati tersedia hingga tingkat unit contoh.
Prediksi Tak Bias Linier Terbaik Empiris
Model pengaruh campuran Fay-Herriot selanjutnya dijabarkan oleh Russo
et. al (2005) untuk tingkat area sebagai berikut:
1.
&
2.
%
, merupakan vektor data pendukung (peubah penyerta).
, untuk i = 1, 2, …, m.
merupakan parameter yang
menjadi perhatian dan diasumsikan memiliki hubungan dengan peubah
penyerta pada (1).
' !"#
3.
(
, penduga langsung untuk domain ke-i yang merupakan fungsi
4.
linier dari parameter yang menjadi perhatian dan galat contoh
&
5.
.
, untuk i = 1, 2, …, m merupakan gabungan dari (2)
dan (4) yang terdiri dari pengaruh acak dan pengaruh tetap sehingga menjadi
bentuk khusus dari model linier campuran dengan struktur peragam yang
diagonal.
Model nomor (5) tersebut merupakan model tingkat area, yaitu:
dengan
&
untuk i = 1, 2, …, m
(1)
adalah peubah penyerta tingkat area dan & adalah insiden matriks.
Model persamaan (1) merupakan kasus khusus dari model linier campuran
terampat dengan struktur koragam diagonal. Teknik penyelesaian model tersebut
&
untuk memperoleh BLUP bagi
telah dikembangkan oleh
Henderson (1953,1975), dengan asumsi ( diketahui. Penduga BLUP dari
)
berdasarkan persamaan (1) adalah:
dengan *
& -
&
*
)
*
+
,+*
)
dan ) adalah koefisien regresi yang diduga
dengan generalized least square (GLS), yaitu )
tengah galat (Mean square error,MSE) dari 1
34 1
)
2
5
. /0 .
2 adalah:
5
(2)
0
. /0
. Kuadrat
dengan 5
dan 5
5
sebagai berikut :
&
&
5
,+*
Metode
BLUP
*
0
6
-
yang
dikembangkan
& 70
Henderson
(1953,
1975)
mengasumsikan diketahuinya komponen ragam pengaruh acak dalam model linier
campuran, padahal dalam kenyataannya, komponen ragam ini tidak diketahui.
Oleh karena itu maka penduga ini harus terlebih dahulu diduga. Harville (1977)
dalam papernya menulis tentang pendugaan komponen ragam dengan
menggunakan metode kemungkinan maksimum (ML) dan metode kemungkinan
maksimum terkendala (REML). Pendugaan
baik dengan metode ML maupun
metode REML dilakukan dengan metode algoritma scoring (scoring algorithm).
Rumus-rumus yangdigunakan untuk menduga
dapat dilihat pada Lampiran 1.
Penduga EBLUP telah dibahas lebih lengkap oleh Ghosh and Rao (1994), Rao
8dengan penduganya 9 adalah sebagai berikut:
(1999), Datta dan Lahiri (2000) dan Rao (2003). Penduga EBLUP dengan
)
mengganti nilai
, + *9
*9
)
( 3)
Penduga EBLUP yang diperoleh dengan metode ML maupun REML adalah
penduga tak bias jika galat
dan
34 1 ) 2 : 5
berdistribusi normal dengan rata-rata 0 .
MSE dari EBLUP (Rao 2003) adalah :
dengan 5;
9 dengan rumus ;
&
< <
8 6>
= 9
&
0;
5
= 9 . = 9
B
70
? @A & -
5;
adalah ragam asimtot dari
<
&
9
?5; 9
C
0
Penghitungan 34 1 ) 2 dilakukan dengan menghitung penduganya. Rumus dari
penduga 34 1 ) 2adalah:
dimana DEF )
DEF )
9
5
adalah penduga bagi 34 1 ) 2. Pada model tingkat area, ada dua
pilihan DEF ) 8 8 yaitu :
dan
5
DEF
)
5
9
5
9
?5;G 9
dengan
DEF
5;G
)
5
9
6& <
<
-
5
9
&
5; 9
SPASIAL PADA AREA KECIL UNTUK PENDUGAAN
PENGELUARAN PER KAPITA
(Studi Kasus : Kabupaten Jember Provinsi Jawa Timur)
DARIANI MATUALAGE
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2012
PERNYATAAN MENGENAI TESIS
DAN SUMBER INFORMASI
Dengan ini saya menyatakaan bahwa tesis Metode Prediksi Tak Bias Linier
Terbaik Empiris Spasial pada Area Kecil untuk Pendugaan Pengeluaran Per
Kapita (Studi Kasus: Kabupaten Jember Provinsi Jawa Timur) adalah karya saya
dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa
pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau
dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain
telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian
akhir tesis ini.
Bogor, Januari 2012
Dariani Matualage
NIM G151080031
ABSTRACT
DARIANI MATUALAGE. Spatial Empirical Best Linear Unbiased Prediction
Methods for Small Areas to Estimate monthly Expenditure per capita (Case
Study: The Province of East Java District Jember). Supervised by ASEP
SAEFUDDIN and AJI HAMIM WIGENA.
Poverty of an area can be measured by their per capita expenditure. Direct
estimation of expenditure per capita based on small area data may cause a large
variance of estimates. Spatial Empirical Best Linear Unbiased Prediction
(SEBLUP) is one of the small area estimation methods to solve the problems. The
method is developed from EBLUP allowing correlation among area. Susenas Data
was used to compare SEBLUP, direct estimation and EBLUP. The result showed
that the standard error of SEBLUP was smaller than those of direct estimation and
EBLUP
Keywords : SAE, SEBLUP, limit models, Susenas
RINGKASAN
DARIANI MATUALAGE. Metode Prediksi Tak Bias Linier Terbaik Empiris
Spasial pada Area Kecil untuk Pendugaan Pengeluaran Per Kapita Studi Kasus:
Kabupaten Jember Provinsi Jawa Timur. Dibimbing oleh ASEP SAEFUDDIN
dan AJI HAMIM WIGENA.
Kemiskinan suatu wilayah merupakan masalah besar yang dihadapi Bangsa
Indonesia. Berbagai upaya telah dilakukan oleh pemerintah untuk menanggulangi
masalah ini, misalnya dimulai dengan menduga wilayah-wilayah miskin hingga
tingkat administrasi desa sehingga diharapkan upaya pengentasan kemiskinan
akan lebih tepat sasaran. Indikator utama yang digunakan Badan Pusat Statistik
(BPS) dalam menentukan suatu wilayah tergolong miskin (tertinggal) atau tidak
adalah rata-rata pengeluaran per kapita wilayah tersebut.
Data pengeluaran per kapita suatu wilayah diduga dengan menggunakan
hasil Survei Sosial-Ekonomi Nasional (Susenas) yang dilakukan oleh BPS. Survei
ini dirancang untuk mengumpulkan data sosial kependudukan yang relatif sangat
luas, yaitu untuk memperoleh statistik nasional hingga pada tingkat
kabupaten/kota. Ketika hasil survei ini digunakan untuk melakukan pendugaan
pada tingkat yang lebih kecil (misalnya kecamatan atau desa), maka akan muncul
persoalan galat baku yang sangat besar. Selain itu, karena tidak setiap desa
menjadi contoh dalam Susenas, maka pendugaan itu tidak dapat dilakukan pada
desa yang tidak terpilih sebagai contoh.
Salah satu metode yang dikembangkan untuk menangani masalah tersebut
adalah metode pendugaan area kecil (small area estimation, SAE). Metode ini
mengandung informasi bukan hanya berasal dari wilayah (area) itu tetapi juga
memanfaatkan informasi tambahan baik berupa nilai parameter dari area kecil lain
yang memiliki karakteristik serupa dengan area kecil tersebut, atau nilai pada
waktu yang lalu, juga nilai dari peubah yang memiliki hubungan dengan peubah
yang sedang diamati (Rao 2003). Tujuan dari metode pendugaan ini adalah untuk
meningkatkan keefektifan ukuran contoh dan menurunkan keragaman dugaan
parameter. Asumsi dasar dalam mengembangkan model untuk SAE adalah bahwa
keragaman peubah yang diamati dapat diterangkan oleh hubungan keragaman
pada informasi tambahan sebagai pengaruh tetap. Asumsi lainnya adalah bahwa
keragaman khusus area kecil tidak dapat diterangkan oleh informasi tambahan
tersebut dan dapat dikategorikan sebagai pengaruh acak area kecil. Gabungan dari
dua asumsi tersebut membentuk model linier campuran (mixed linear models).
Salah satu sifat menarik dari model linier campuran adalah kemampuannya
dalam menduga kombinasi linier dari pengaruh tetap dan pengaruh acak.
Henderson (1953,1975) dalam papernya mengembangkan teknik penyelesaian
model pengaruh campuran, yaitu metode prediksi tak bias linier terbaik (best
linear unbiased prediction, BLUP). Metode ini kemudian dikaji lebih lanjut oleh
Harville (1977) dengan terlebih dahulu melakukan pendugaan komponen ragam
dengan metode kemungkinan maksimum (maximum likelihood) dan kemungkinan
maksimum terkendala (restricted maximum likelihood), sehingga disebut prediksi
tak bias linier terbaik empirik (empirical best linear unbiased prediction,
EBLUP).
Penggunaan metode EBLUP untuk menduga pengeluaran perkapita belum
memasukkan pengaruh spasial ke dalam model. Di lain pihak pembagian batas
desa berdasarkan pada kriteria administrasi dan tidak menutup adanya
kemungkinan pengaruh spasial terhadap pengeluaran per kapita desa. Hal ini
sesuai dengan hukum pertama tentang geografi yang dikemukakan oleh Tobler
(Tobler’s first law of geography) dalam Schabenberger dan Gotway (2005) yang
merupakan pilar kajian analisis data spasial, yaitu : everything is related to
everything else, but near things are more related than distant things”. Segala
sesuatu saling berhubungan satu dengan yang lainnya, tetapi sesuatu yang lebih
dekat akan lebih berpengaruh daripada sesuatu yang jauh. Untuk itu diperlukan
suatu pendekatan dengan memasukkan pengaruh spasial. Penduga EBLUP dengan
memperhatikan pengaruh acak area yang berkorelasi spasial dikenal dengan
istilah penduga prediksi tak bias linier terbaik empirik spasial (Spatial Empirical
Best Linear Unbiased Prediction, SEBLUP). Penduga SEBLUP telah digunakan
oleh Petrucci & Salvati (2004a, 2004b), Salvati (2004), Chandra, Salvati &
Chambers (2007) dan Pratesi & Salvati (2008) dengan memasukkan matriks
pembobot spasial tetangga terdekat (nearest neighbors) ke dalam model EBLUP.
Penggunaan matriks pembobot seperti ini tidak dapat dilakukan untuk desa-desa
di Kabupaten Jember yang terpilih sebagai contoh dalam Susenas, karena hanya 9
pasang desa yang saling berdekatan sehingga matriks tersebut hampir semua
(98.37%) berisi angka 0.
Ada berbagai bentuk matriks pembobot spasial yang telah digunakan
selama ini. Salah satu matriks pembobot yang digunakan oleh Fotheringham &
Rogerson (2009) adalah matriks pembobot spasial model limit (limit models) atau
disebut juga matriks pembobot batas ambang. Matriks pembobot spasial ini
mempunyai nilai jika jarak antar area lebih kecil atau sama dengan suatu batas
jarak yang telah ditentukan. Berdasarkan hasil penelitian Rahmawati (2010) yang
menyatakan bahwa jarak antar desa di Kabupaten Jember Provinsi Jawa Timur
masih memberikan pengaruh terhadap data pengeluaran per kapita desa jika jarak
antar desa tersebut kurang atau sama dengan 9.09 km. Jarak inilah yang
digunakan sebagai batas jarak untuk menyusun matriks pembobot spasial
berdasarkan model limit dan kemudian digunakan dalam model SEBLUP. Metode
ini kemudian digunakan untuk menduga pengeluaran perkapita desa di Kabupaten
Jember Provinsi Jawa Timur dan menghitung MSE dan RRMSE dengan
menggunakan data rata-rata pengeluaran perkapita desa yang diambil dari hasil
Susenas 2008 sebagai penduga langsung dan data persentase keluarga penerima
ASKESKIN dalam setahun terakhir sebagai peubah penyerta yang diambil dari
data Podes 2008.
Hasil analisis menunjukkan bahwa metode SEBLUP lebih baik
dibandingkan dengan metode pendugaan langsung maupun EBLUP, sedangkan
antara metode pendugaan langsung tidak jauh berbeda dengan metode EBLUP.
Hal ini terlihat dari nilai RRMSE untuk metode SEBLUP yang jauh lebih kecil
bila dibandingkan dengan metode pendugaan langsung maupun metode EBLUP.
© Hak Cipta milik IPB, tahun 2012
Hak Cipta dilindungi Undang-undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan
yang wajar bagi IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh Karya tulis
dalam bentuk apa pun tanpa izin IPB
METODE PREDIKSI TAK BIAS LINIER TERBAIK EMPIRIS
SPASIAL PADA AREA KECIL UNTUK PENDUGAAN
PENGELUARAN PER KAPITA
(Studi Kasus : Kabupaten Jember Provinsi Jawa Timur)
DARIANI MATUALAGE
Tesis
Sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Program Studi Statistika
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2012
Judul Tesis : Metode Prediksi Tak Bias Linier Terbaik Empiris Spasial pada
Area Kecil untuk Pendugaan Pengeluaran Perkapita (Studi Kasus :
Kabupaten Jember Provinsi Jawa Timur)
Nama
: Dariani Matualage
NRP
: G151080031
Disetujui
Komisi Pembimbing
Dr. Ir. Asep Saefuddin, M.Sc
Ketua
Dr. Ir. Aji Hamim Wigena, M.Sc
Anggota
Diketahui
Ketua Program Studi Statistika
Dekan Sekolah Pascasarjana
Dr.Ir. Erfiani, M.Si.
Dr. Ir. Dahrul Syah, M.Sc.Agr
Tanggal Ujian: 6 Desember 2011
Tanggal Lulus:
PRAKATA
Puji dan syukur Ke hadirat Tuhan Yang Maha Kuasa atas segala berkat dan
karunia-Nya sehingga karya ilmiah ini dapat diselesaikan. Judul karya ilmiah ini
adalah “Metode Prediksi Tak Bias Linier Terbaik Empiris Spasial pada Area
Kecil untuk Pendugaan Pengeluaran Per Kapita (Studi Kasus: Kabupaten Jember
Provinsi Jawa Timur)”. Penelitian yang dilakukan penulis merupakan bagian dari
payung Hibah Penelitian Pascasarjana Departemen Statistika, Institut Pertanian
Bogor yang didanai oleh Direktur Jenderal Pendidikan Tinggi, Departemen
Pendidikan Nasional.
Terima kasih penulis sampaikan kepada Bapak Dr. Ir. Asep Saefuddin,
M.Sc selaku ketua komisi pembimbing dan Bapak Dr. Ir. Aji Hamim Wigena,
M.Sc selaku anggota komisi pembimbing atas bimbingan, saran dan waktunya
yang telah diberikan kepada penulis. Disamping itu penulis juga mengucapkan
terima kasih kepada Dr. Ir. Anik Djuraidah, M.S selaku penguji luar komisi pada
ujian tesis, Dr. Anang Kurnia dan seluruh dosen dan staf Program Studi Statistika.
Ungkapan terima kasih juga disampaikan kepada segenap keluarga,
terutama kakak, ipar dan kemenakan-kemenakan tercinta teristimewa
kemenakanku Ester Ivana Nangin (alm) serta sahabat-sahabat atas doa, dukungan
dan kasih sayangnya kepada penulis. Terima kasih kepada teman-teman Statistika
dan Statistika Terapan angkatan 2008, 2009, 2010 baik S2 maupun S3 serta
teman-teman dari Universitas Negeri Papua atas bantuan dan kebersamaannya
selama ini. Semoga karya ilmiah ini dapat bermanfaat.
Bogor, Januari 2012
Dariani Matualage
RIWAYAT HIDUP
Penulis dilahirkan di Biak, Papua pada tanggal 18 April 1977 sebagai anak
keempat dari empat bersaudara, anak dari pasangan Max Matualage (alm) dan
E. B. Bermuli (alm).
Penulis menyelesaikan pendidikan SD hingga SLTA di Biak. Setelah
menyelesaikan pendidikan SLTA di SMAN 1 Biak pada tahun 1995, penulis
kemudian melanjutkan perkuliahan di Program Studi Statistika Jurusan
Matematika dan Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Hasanuddin Makassar dan lulus pada tahun 2001. Penulis bekerja
sebagai Staf Pengajar di Jurusan Matematika dan Statistika Fakultas Matematika
dan Ilmu Pengetahuan Alam Universitas Negeri Papua Manokwari sejak tahun
2005 hingga sekarang.
DAFTAR ISI
Halaman
DAFTAR TABEL ........................................................................................ xiii
DAFTAR GAMBAR ................................................................................... xiv
DAFTAR LAMPIRAN ................................................................................ xv
PENDAHULUAN
Latar Belakang ....................................................................................
Tujuan Penelitian .................................................................................
1
4
TINJAUAN PUSTAKA
Profil Kabupaten Jember .....................................................................
Pengeluaran Per kapita.........................................................................
Pendugaan Area Kecil .........................................................................
Prediksi Tak Bias Linear Terbaik Empiris ...........................................
Prediksi Tak Bias Linear Terbaik Empiris Spasial ……………………
5
5
6
8
10
METODOLOGI PENELITIAN
Data .................................................................................................... 15
Metode Penelitian ................................................................................ 16
HASIL DAN PEMBAHASAN
Pendugaan Pengeluaran Per Kapita ..…………………………………. 19
Pendugaan MSE dan RRMSE ............................................................. 22
Pengujian Model ……………………………………………………… 23
KESIMPULAN DAN SARAN
Kesimpulan ......................................................................................... 25
Saran ................................................................................................... 25
DAFTAR PUSTAKA .................................................................................. 27
LAMPIRAN ................................................................................................ 31
DAFTAR TABEL
Halaman
1
Nilai pendugaan untuk koefisien regresi dan ragam peubah acak
dengan metode EBLUP .......................................................................
2
20
Nilai pendugaan koefisien regresi, ragam dari galat peubah acak
area dan koefisien otoregresif spasial menggunakan metode
Spasial EBLUP .................................................................................... 21
3
Statistik deskriptif nilai dugaan pengeluaran per kapita
untuk masing-masing metode.............................................................. 22
DAFTAR GAMBAR
Halaman
1
Diagram kotak garis pengeluaran per kapita desa/kelurahan dengan
untuk masing-masing metode............................................................... 22
2
Perbandingan nilai RRMSE untuk masing-masing desa/kelurahan
dengan metode langsung, EBLUP ML, EBLUP REML, SEBLUP
ML dan SEBLUP REML ..................................................................... 23
3
Plot q-q untuk sisaan baku dari model pendugaan dengan metode
SEBLUP .............................................................................................. 24
DAFTAR LAMPIRAN
Halaman
1
Rumus yang digunakan untuk menduga
2
Rumus yang digunakan untuk menduga
dan
dengan
metode SEBLUP ................................................................................ 34
3
Jumlah rumah tangga di Kabupaten Jember dan jumlah rumah
tangga yang terpilih sebagai contoh dalam Susenas 2008 ..................... 36
4
Nilai pendugaan pengeluaran per kapita dan MSE untuk masingmasing metode..................................................................................... 37
5
Nilai pendugaan bagi RRMSE untuk masing-masing metode
pendugaan ........................................................................................... 39
dengan metode EBLUP .... 33
PENDAHULUAN
Latar Belakang
Kemiskinan merupakan masalah besar yang dihadapi Bangsa Indonesia.
Salah satu wilayah yang tergolong wilayah miskin adalah Kabupaten Jember
Provinsi Jawa Timur (Kusumaningrum 2010). Padahal kabupaten ini memiliki
potensi sektor pertanian yang cukup tinggi khususnya untuk tanaman padi dan
palawija (BPS 2009). Berbagai upaya telah dilakukan oleh pemerintah untuk
menanggulangi masalah ini, yang dimulai dengan memprediksi wilayah-wilayah
miskin hingga tingkat administrasi desa. Data kemiskinan ini diharapkan dapat
digunakan untuk mengentaskan kemiskinan. Indikator utama yang digunakan
Badan Pusat Statistik (BPS) dalam menentukan suatu wilayah tergolong miskin
(tertinggal) atau tidak adalah rata-rata pengeluaran per kapita wilayah tersebut.
Data mengenai rata-rata pengeluaran per kapita suatu wilayah diduga
dengan menggunakan data pengeluaran per kapita yang ada di wilayah tersebut
berdasarkan hasil Survei Sosial-Ekonomi Nasional (Susenas) yang dilakukan oleh
BPS. Survei ini dirancang untuk mengumpulkan data sosial kependudukan yang
relatif sangat luas, yaitu untuk memperoleh statistik nasional. Jika hasil survei ini
digunakan untuk melakukan pendugaan pada tingkat yang lebih kecil (misalnya
desa), maka akan muncul persoalan galat baku yang sangat besar. Selain itu, tidak
setiap desa menjadi contoh dalam Susenas, sehingga pendugaan itu tidak dapat
dilakukan pada desa yang tidak terpilih sebagai contoh.
Persoalan-persoalan ini kemudian diatasi dengan mengembangkan metode
pendugaan parameter yang dikenal dengan metode pendugaan area kecil (small
area estimation, SAE). Pada metode SAE, informasi yang digunakan bukan hanya
berasal dari wilayah (area) itu tetapi juga memanfaatkan informasi tambahan dari
area kecil lain yang memiliki karakteristik serupa dengan area kecil tersebut, atau
nilai pada waktu yang lalu, juga nilai dari peubah yang memiliki hubungan
dengan peubah yang sedang diamati (Rao 2003).
Ada dua asumsi dasar dalam mengembangkan model untuk SAE, yaitu
bahwa keragaman di dalam area kecil dapat diterangkan oleh hubungan
keragaman yang ada pada informasi tambahan sebagai pengaruh tetap. Asumsi
lainnya adalah bahwa keragaman khusus area kecil tidak dapat diterangkan oleh
informasi tambahan dan merupakan pengaruh acak area kecil. Gabungan dari dua
asumsi tersebut membentuk model linier campuran (mixed models).
Salah satu sifat menarik dari model linier campuran adalah kemampuannya
dalam menduga kombinasi linier dari pengaruh tetap dan pengaruh acak.
Henderson (1953,1975) mengembangkan teknik penyelesaian model linier
campuran, yaitu metode prediksi tak bias linier terbaik (best linear unbiased
prediction, BLUP). Metode ini kemudian dikaji lebih lanjut oleh Harville (1977)
dengan terlebih dahulu melakukan pendugaan komponen ragam dengan metode
kemungkinan maksimum (maximum likelihood) dan kemungkinan maksimum
terkendala (restricted maximum likelihood), sehingga disebut prediksi tak bias
linier terbaik empiris (empirical best linear unbiased prediction, EBLUP).
Penelitian dengan menggunakan metode EBLUP untuk data Susenas telah
banyak dilakukan, antara lain Kurnia (2009) menggunakan model SAE melalui
pendekatan EBLUP baku yang kemudian dilanjutkan dengan EBLUP untuk
model transformasi logaritma. Hasilnya adalah bahwa model lognormal
memberikan hasil yang lebih baik dibandingkan dengan pendugaan langsung
melalui metode penarikan contoh, walaupun bias relatifnya cukup besar. Pada
tahun yang sama, Sadik (2009) juga menggunakan model EBLUP dengan
pendekatan deret waktu pada data Susenas yang diambil setiap tahun. Hasilnya
adalah EBLUP deret waktu lebih baik dibandingkan dengan EBLUP tanpa
pendekatan deret waktu. Hal ini menunjukkan bahwa pengaruh acak area dan
waktu maupun pengaruh sintetik vektor kovariat (peubah penyerta) berfungsi
memperbaiki hasil pendugaan metode EBLUP yang hanya didasarkan pada data
survei satu tahun saja.
Kedua penelitian itu menggunakan model SAE dengan pendekatan EBLUP
tetapi belum memasukkan pengaruh spasial ke dalam model. Seperti diketahui
bahwa pembagian batas desa menunjuk pada kriteria administrasi. Oleh karena itu
pembagian ini tidak membatasi adanya pengaruh spasial terhadap pengeluaran per
kapita desa, atau dengan kata lain, pengeluaran per kapita desa dapat juga
dipengaruhi oleh pengeluaran per kapita desa yang berada dekat dengan desa
tersebut. Hal ini sesuai dengan hukum pertama tentang geografi yang
dikemukakan oleh Tobler (Tobler’s first law of geography) dalam Schabenberger
dan Gotway (2005) yang merupakan pilar kajian analisis data spasial, yaitu :
everything is related to everything else, but near things are more related than
distant things”. Segala sesuatu saling berhubungan satu dengan yang lainnya,
tetapi sesuatu yang lebih dekat akan lebih berpengaruh daripada sesuatu yang
jauh. Untuk itu diperlukan suatu pendekatan dengan memasukkan pengaruh
spasial. Penduga EBLUP dengan memperhatikan pengaruh acak area yang
berkorelasi spasial dikenal dengan istilah penduga SEBLUP (Spatial Empirical
Best Linear Unbiased Prediction).
Penduga SEBLUP telah digunakan oleh Petrucci & Salvati (2004a, 2004b),
Salvati (2004), Chandra, Salvati & Chambers (2007) dan Pratesi & Salvati (2008)
dengan memasukkan matriks pembobot spasial tetangga terdekat (nearest
neighbors) ke dalam model EBLUP. Penggunaan matriks pembobot seperti ini
tidak dapat dilakukan untuk desa-desa di Kabupaten Jember yang terpilih sebagai
contoh dalam Susenas, karena hanya 9 pasang desa yang saling berdekatan
sehingga matriks tersebut berisi angka 0 sebanyak 98.37%.
Ada berbagai bentuk matriks pembobot spasial yang telah digunakan
selama ini. Salah satu matriks pembobot yang digunakan oleh Fotheringham &
Rogerson (2009) adalah matriks pembobot spasial model limit (limit models) atau
disebut juga matriks pembobot batas ambang. Matriks pembobot spasial ini
mempunyai nilai jika jarak antar area lebih kecil atau sama dengan suatu batas
jarak yang telah ditentukan. Berdasarkan hasil penelitian Rahmawati (2010) yang
menyatakan bahwa jarak antar desa di Kabupaten Jember Provinsi Jawa Timur
masih memberikan pengaruh terhadap data pengeluaran per kapita desa jika jarak
antar desa tersebut kurang atau sama dengan 9.09 km. Jarak inilah yang akan
digunakan sebagai batas jarak untuk menyusun matriks pembobot spasial
berdasarkan pembobot batas ambang dan kemudian digunakan dalam model
SEBLUP.
Tujuan
Tujuan penelitian ini adalah:
1. Melakukan pendugaan rata-rata pengeluaran per kapita desa di Kabupaten
Jember dengan metode EBLUP dan SEBLUP
2. Membandingkan metode EBLUP dan metode SEBLUP
TINJAUAN PUSTAKA
Profil Kabupaten Jember
Berdasarkan data BPS (2009), Kabupaten Jember secara geografis terletak
pada 113030’ - 113045’ Bujur Timur dan 8 000’ - 8030’ Lintang Selatan. Wilayah
Kabupaten Jember di sebelah utara berbatasan dengan Kabupaten Bondowoso dan
Kabupaten Probolinggo, sebelah timur berbatasan dengan Kabupaten Banyuwangi
sedangkan sebelah barat berbatasan dengan Kabupaten Lumajang dan sebelah
selatan berbatasan dengan Samudra Hindia. Luas wilayah Kabupaten Jember 3
293.34 Km2 yang terbagi menjadi 31 kecamatan terdiri atas 28 kecamatan dengan
225 desa dan 3 kecamatan dengan 22 kelurahan dengan Jember sebagai ibukota
kabupaten. Khusus untuk Susenas 2008, desa-desa yang menjadi contoh sebagian
besar berada pada kecamatan yang berbeda, hanya sembilan kecamatan yang
memiliki lebih dari satu desa yang menjadi contoh dalam survei tersebut.
Kabupaten Jember memiliki potensi sektor pertanian yang cukup tinggi
khususnya untuk tanaman padi dan palawija. Pada tahun 2008, Jember memiliki
potensi luas panen tanaman padi 143 597 ha dengan produksi 813 995 ton, untuk
tanaman jagung berpotensi luas panen 67 869 ha dengan produksi sebesar 396 818
ton, serta tanaman kedelai berpotensi luas panen 12 186 ha dengan produksi 14
545 ton. Pendapatan Asli Daerah (PAD) yang cukup besar yaitu Rp1 366 522 000
000.00 dan menduduki urutan ketiga terbesar di Provinsi Jawa Timur setelah
Surabaya dan Sidorajo. Sedangkan Pendapatan Domestik Regional Bruto (PDRB)
Kabupaten Jember sebesar Rp9 864 000 000.00 (BPS 2009).
Pengeluaran Per kapita
Beberapa data yang diperoleh dari Susenas 2008 adalah data pengeluaran
rumah tangga per bulan dan data pengeluaran per kapita. BPS mendefinisikan
pengeluaran rumah tangga sebulan adalah semua biaya yang dikeluarkan rumah
tangga selama sebulan untuk memenuhi kebutuhan konsumsi untuk semua
anggota rumah tangga. Data pengeluaran per kapita diperoleh dari jumlah
pengeluaran rumah tangga sebulan dibagi dengan jumlah anggota rumah tangga
tersebut (BPS 2008). Berdasarkan asumsi bahwa penarikan contoh yang dilakukan
berdasarkan penarikan contoh acak sederhana, maka rata-rata pengeluaran per
kapita desa diperoleh dengan rumus :
dengan :
= rata-rata pengeluaran per kapita desa ke-i, dengan i = 1,2, . . . , m
= pengeluran per kapita rumah tangga ke – j di desa ke- i ,
dengan j = 1, 2, . . . ,n i
= jumlah rumah tangga di desa ke-i
m = jumlah desa
Pendugaan Area Kecil
Pelaksanaan survei dilakukan untuk melakukan pendugaan parameter
populasi. Pendekatan klasik untuk menduga parameter populasi didasarkan pada
aplikasi model disain penarikan contoh (design-based), dan penduga yang
dihasilkan dari pendekatan itu disebut penduga langsung (direct estimation). Data
hasil survei ini dapat digunakan untuk mendapatkan penduga yang terpercaya dari
total maupun rata-rata populasi suatu area atau domain dengan jumlah contoh
yang besar. Namun, ketika penduga langsung tersebut digunakan untuk suatu area
yang kecil, maka akan menimbulkan galat baku yang besar (Ghosh dan Rao
1994). Selain itu, pendugaan langsung tidak dapat dilakukan pada area yang tidak
terpilih sebagai contoh, karena tidak adanya data yang dapat digunakan untuk
melakukan pendugaan. Suatu area dikatakan kecil jika ukuran contoh dalam
domain tersebut tidak cukup memadai untuk mendukung ketelitian penduga
langsung (Rao 2003). Area kecil biasanya digunakan untuk mendefinisikan area
geografi yang kecil atau domain yang memiliki ukuran contoh sangat kecil.
Penanganan masalah galat baku dalam pendugaan area kecil dilakukan
dengan menambahkan informasi mengenai parameter yang sama pada area kecil
lain yang memiliki karakteristik serupa, atau nilai pada waktu yang lalu, atau nilai
dari peubah yang memiliki hubungan dengan peubah yang sedang diamati.
Pendugaan parameter dan inferensinya yang menggunakan informasi tambahan
tersebut dinamakan pendugaan tidak langsung (indirect estimation). Metode ini
secara statistik memiliki sifat meminjam kekuatan (borrowing strength) dari
informasi mengenai hubungan antara peubah yang diamati dengan informasi yang
ditambahkan, sehingga mengefektifkan jumlah contoh yang kecil. Pendugaan
tidak langsung berdasarkan pada model implisit atau model eksplisit yang
menyediakan suatu link yang menghubungkan area-area kecil melalui data
tambahan. Dalam papernya, Petrucci dan Salvati (2004a) menuliskan bahwa
penduga tak langsung ini terdiri dari dua tipe, yaitu penduga tak langsung yang
berdasarkan pada model implisit, antara lain penduga sintetik (synthetic estimator)
dan penduga komposit (composite estimator) serta penduga tak langsung yang
berdasarkan pada model eksplisit (berbasis model) yang menggabungkan
pengaruh acak antar area.
Asumsi dasar dalam pengembangan model untuk SAE adalah bahwa
keragaman di dalam area kecil peubah yang sedang diamati dapat diterangkan
oleh hubungan keragaman yang bersesuaian pada informasi tambahan yang
disebut sebagai pengaruh tetap. Asumsi lainnya adalah bahwa keragaman khusus
area kecil tidak dapat diterangkan oleh informasi tambahan dan merupakan
pengaruh acak area kecil. Gabungan dari dua asumsi tersebut membentuk model
linier campuran (mixed models). Pendugaan area kecil untuk model pengaruh
campuran pertama kali dikembangkan oleh Fay dan Herriot (1979), untuk
menduga pendapatan per kapita suatu area kecil berdasarkan data survei Biro
Sensus Amerika Serikat (U.S. Bureau of the Cencus). Model ini selanjutnya
dikenal dengan model Fay-Herriot yang merupakan model dasar bagi
pengembangan pemodelan area kecil, yaitu
adalah penduga langsung bagi area ke-i,
perhatian bagi area ke-i,
peubah penyerta,
area dengan
serta !"#
dan
, dimana
;
merupakan parameter yang menjadi
adalah koefisien regresi,
adalah galat contoh pada area ke-i.
saling bebas dengan
$ (i = 1, 2, …, m).
=
adalah
adalah pengaruh acak
= 0 dan !"#
Tipe model pendugaan area kecil terbagi menjadi dua, yaitu model tingkat
area (basic area level models) dan model tingkat unit (unit level area models)
(Ghosh dan Rao 1994). Model tingkat area digunakan jika data penyerta yang
bersesuaian dengan data peubah yang diamati tidak tersedia hingga tingkat unit
pengamatan, sedangkan model tingkat unit digunakan jika data penyerta yang
bersesuaian dengan data peubah yang diamati tersedia hingga tingkat unit contoh.
Prediksi Tak Bias Linier Terbaik Empiris
Model pengaruh campuran Fay-Herriot selanjutnya dijabarkan oleh Russo
et. al (2005) untuk tingkat area sebagai berikut:
1.
&
2.
%
, merupakan vektor data pendukung (peubah penyerta).
, untuk i = 1, 2, …, m.
merupakan parameter yang
menjadi perhatian dan diasumsikan memiliki hubungan dengan peubah
penyerta pada (1).
' !"#
3.
(
, penduga langsung untuk domain ke-i yang merupakan fungsi
4.
linier dari parameter yang menjadi perhatian dan galat contoh
&
5.
.
, untuk i = 1, 2, …, m merupakan gabungan dari (2)
dan (4) yang terdiri dari pengaruh acak dan pengaruh tetap sehingga menjadi
bentuk khusus dari model linier campuran dengan struktur peragam yang
diagonal.
Model nomor (5) tersebut merupakan model tingkat area, yaitu:
dengan
&
untuk i = 1, 2, …, m
(1)
adalah peubah penyerta tingkat area dan & adalah insiden matriks.
Model persamaan (1) merupakan kasus khusus dari model linier campuran
terampat dengan struktur koragam diagonal. Teknik penyelesaian model tersebut
&
untuk memperoleh BLUP bagi
telah dikembangkan oleh
Henderson (1953,1975), dengan asumsi ( diketahui. Penduga BLUP dari
)
berdasarkan persamaan (1) adalah:
dengan *
& -
&
*
)
*
+
,+*
)
dan ) adalah koefisien regresi yang diduga
dengan generalized least square (GLS), yaitu )
tengah galat (Mean square error,MSE) dari 1
34 1
)
2
5
. /0 .
2 adalah:
5
(2)
0
. /0
. Kuadrat
dengan 5
dan 5
5
sebagai berikut :
&
&
5
,+*
Metode
BLUP
*
0
6
-
yang
dikembangkan
& 70
Henderson
(1953,
1975)
mengasumsikan diketahuinya komponen ragam pengaruh acak dalam model linier
campuran, padahal dalam kenyataannya, komponen ragam ini tidak diketahui.
Oleh karena itu maka penduga ini harus terlebih dahulu diduga. Harville (1977)
dalam papernya menulis tentang pendugaan komponen ragam dengan
menggunakan metode kemungkinan maksimum (ML) dan metode kemungkinan
maksimum terkendala (REML). Pendugaan
baik dengan metode ML maupun
metode REML dilakukan dengan metode algoritma scoring (scoring algorithm).
Rumus-rumus yangdigunakan untuk menduga
dapat dilihat pada Lampiran 1.
Penduga EBLUP telah dibahas lebih lengkap oleh Ghosh and Rao (1994), Rao
8dengan penduganya 9 adalah sebagai berikut:
(1999), Datta dan Lahiri (2000) dan Rao (2003). Penduga EBLUP dengan
)
mengganti nilai
, + *9
*9
)
( 3)
Penduga EBLUP yang diperoleh dengan metode ML maupun REML adalah
penduga tak bias jika galat
dan
34 1 ) 2 : 5
berdistribusi normal dengan rata-rata 0 .
MSE dari EBLUP (Rao 2003) adalah :
dengan 5;
9 dengan rumus ;
&
< <
8 6>
= 9
&
0;
5
= 9 . = 9
B
70
? @A & -
5;
adalah ragam asimtot dari
<
&
9
?5; 9
C
0
Penghitungan 34 1 ) 2 dilakukan dengan menghitung penduganya. Rumus dari
penduga 34 1 ) 2adalah:
dimana DEF )
DEF )
9
5
adalah penduga bagi 34 1 ) 2. Pada model tingkat area, ada dua
pilihan DEF ) 8 8 yaitu :
dan
5
DEF
)
5
9
5
9
?5;G 9
dengan
DEF
5;G
)
5
9
6& <
<
-
5
9
&
5; 9