Kajian Transformasi Logaritma Untuk Penduga Spatial Empirical Best Linear Unbiased Prediction Pada Pendugaan Area Kecil
KAJIAN TRANSFORMASI LOGARITMA UNTUK PENDUGA
SPATIAL EMPIRICAL BEST LINEAR UNBIASED
PREDICTION PADA PENDUGAAN AREA KECIL
HAZAN AZHARI ZAINUDDIN
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016
PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa tesis berjudul “Kajian Transformasi
Logaritma untuk Penduga Spatial Empirical Best Linear Unbiased Prediction pada
Pendugaan Area Kecil” adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi
manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, April 2016
Hazan Azhari Zainuddin
NIM G151130301
RINGKASAN
HAZAN AZHARI ZAINUDDIN. Kajian Transformasi Logaritma untuk
Penduga Spatial Empirical Best Linear Unbiased Prediction pada Pendugaan Area
Kecil. Dibimbing oleh KHAIRIL ANWAR NOTODIPUTRO dan KUSMAN
SADIK.
Berbagai survei umumnya dirancang untuk menduga parameter populasi
berskala nasional. Masalah akan timbul jika dari survei tersebut ingin diperoleh
informasi untuk area yang lebih kecil, misalnya pada level propinsi,level kabupaten
atau level kecematan. Ukuran contoh pada level area tersebut biasanya sangat kecil
sehingga statistik yang diperoleh akan memiliki ragam yang besar. Guna mengatasi
hal ini, dikembangkan sebuah metode pendugaan parameter yang dikenal metode
pendugaan area kecil (small area estimation, SAE). Salah satu metode dalam
pendugaan area kecil adalah Empirical Best Linear Unbiased Prediction (EBLUP).
Metode Empirical Best Linear Unbiased Prediction (EBLUP) telah banyak
digunakan untuk Small Area Estimation. Beberapa tahun kemudian pendekatan
EBLUP dikembangkan dengan memasukkan pengaruh spasial ke dalam model.
Penduga EBLUP dengan memperhatikan pengaruh acak area yang berkorelasi
spasial dikenal dengan istilah penduga Spatial Empirical Best Linear Unbiased
Prediction (SEBLUP). Penduga SEBLUP maupun EBLUP menggunakan model
campuran linier dalam pendugaannya. Model campuran linier memiliki asumsi
distribusi normal sehingga data (peubah yang menjadi perhatian) yang digunakan
pada penduga SEBLUP maupun EBLUP harus memilki distribusi normal. Pada
kenyataanya, data yang ditemukan dilapangan memiliki distribusi tidak normal
sehingga model yang digunakan untuk pendugaan akan memberikan hasil yang
kurang baik. Salah satu dari metode untuk menangani masalah tersebut adalah
dengan menggunakan transformasi logaritma pada peubah yang menjadi perhatian
agar distribusinya mendekati distribusi normal. Pada kenyataannya, ada juga data
yang memilki distribusi tidak normal sekaligus memilki pengaruh spasial sehingga
diperlukan metode pendugaan yang tepat untuk menangani masalah tersebut. Pada
penelitian ini, transformasi logaritma dilakukan pada metode SEBLUP. Penduga ini
diharapkan dapat menghasilkan penduga dengan presisi dan akurasi yang lebih
baik. Penduga transformasi logaritma SEBLUP juga diharapkan dapat mengatasi
data yang memilki distribusi tidak normal sekaligus memiliki pengaruh spasial.
Hasil dari kajian simulasi menunjukkan bahwa penduga transformasi
logaritma SEBLUP memiliki nilai rata-rata BR dan nilai rata-rata AKTGR yang
hampir sama jika dibandingkan dengan penduga transformasi logaritma EBLUP.
Hasil simulasi ini sejalan dengan hasil studi kasus rata-rata pengeluaran per kapita
tingkat kecamatan di kota atau kabupaten Bogor 2010. Sehingga dapat disimpulkan
bahwa penduga transformasi logaritma SEBLUP dan penduga transformasi
logaritma EBLUP sama baiknya. Kedua penduga tersebut memiliki performa yang
sama dalam melakukan pendugaan area kecil.
Kata kuci: EBLUP, SAE, SEBLUP
SUMMARY
HAZAN AZHARI ZAINUDDIN. A Study of Logarithmic Transformation
on Spatial Empirical Best Linear Unbiased Prediction Estimator in Small Area
Estimation. Supervised by KHAIRIL ANWAR NOTODIPUTRO and KUSMAN
SADIK.
Various surveys have been generally designed to estimate population
parameters in nationwide scale. Problems appear if any information for smaller
areas from the survey needs to be obtained, for example at the provincial level,
district level or sub district level. The sample size at the level of the area is usually
very small the estimates have a large variances. To overcome this problem, a
parameter estimation method called Small Area Estimation (SAE) has been
developed. One of the methods in small area estimation is Empirical Best Linear
Unbiased Prediction (EBLUP).
Empirical Best Linear Unbiased Prediction (EBLUP) method has been widely
used for small area estimation. A few years later the EBLUP approach has been
developed by incorporating spatial effect into the model. The estimator concerns
with the random effect of the area which was spatially correlated known as Spatial
Empirical Best Linear Unbiased Prediction (SEBLUP). EBLUP and SEBLUP
estimators are basically obtained from linear mixed models. Linear mixed models
have assume normal distribution assumption of the data. In fact, it is often that the
data are not normally distributed. One of the methods to deal with the problem is to
use a logarithm transformation on the variables of interest so that the distribution
approaches a normal distribution. In fact, it is also often that the data is not normally
distribut nor spatially independent. In this study, methods of logarithmic
transformation on SEBLUP were discussed.
The results of simulation studies showed that the logarithmic transformation
on SEBLUP estimator produced an average relative bias (RB) and the average
relative root mean square error (RRMSE) almost the same in each scenario of
simulations when compared to logarithmic transformation on EBLUP estimator.
The application of this method to estimate average per capita expenditure in the
sub-district of Bogor in 2010 showed similar results with the simulation results.
It can be concluded that the logarithmic transformation on SEBLUP estimator and
the logarithmic transformation on EBLUP estimator have the same performance in
small area estimation
Keywords: EBLUP, SAE, SEBLUP
© Hak Cipta Milik IPB, Tahun 2016
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau
menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apa pun tanpa izin IPB
KAJIAN TRANSFORMASI LOGARITMA UNTUK PENDUGA
SPATIAL EMPIRICAL BEST LINEAR UNBIASED
PREDICTION PADA PENDUGAAN AREA KECIL
HAZAN AZHARI ZAINUDDIN
Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Program Studi Statistika
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016
2
Penguji Luar Komisi pada Ujian Tesis : Dr. Anang Kurnia,S.Si, M.Si
Kajian Transformasi Logaritma untuk Penduga Spatial Empirical
Best Linear Unbiased Prediction pada Pendugaan Area Kecil
: Hazan Azhari Zainuddin
: G151130301
Judul Tesis :
Nama
NIM
Disetujui oleh
Komisi Pembimbing
Prof. Dr. Ir. Khairil Anwar Notodiputro, MS
Ketua
Dr. Ir. Kusman Sadik, MS
Anggota
Diketahui oleh
Ketua program Studi
Statistika
Dekan Sekolah Pascasarjana
Dr. Ir. Kusman Sadik, MS
Dr. Ir. Dahrul Syah, M.Sc.Agr
Tanggal Ujian : 21 Januari 2016
Tanggal Lulus :
4
PRAKATA
Puji dan syukur penulis ucapkan kehadirat Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah yang
berjudul “Kajian Transformasi Logaritma untuk Penduga Spatial Empirical Best
Linear Unbiased Prediction p ada Pendugaan Area Kecil.”. Keberhasilan penulisan
karya ilmiah ini tidak lepas dari bantuan, bimbingan, dan petunjuk dari berbagai
pihak.
Terima kasih penulis ucapkan kepada Bapak Prof. Dr. Ir. Khairil Anwar
Notodiputro, MS sebagai ketua komisi pembimbing dan Bapak Dr. Ir. Kusman
Sadik M,Si sebagai aggota komisi pembimbing yang telah memberikan bimbingan,
arahan serta saran kepada penulis. Ungkapan terima kasih terkhusus penulis
sampaikan kepada orang tua, serta seluruh keluarga atas do’a, dukungan dan
pengertiannya. Terima kasih pula kepada seluruh staf Jurusan Statistika, teman
teman statistika (S2 dan S3) atas bantuannya dan kebersamaannya. Terima kasih
tak lupa pula penulis sampaikan kepada semua pihak yang tidak dapat penulis
sebutkan satu per satu yang telah membantu dalam penyusunan karya ilmiah ini.
Penulis menyadari bahwa karya ilmiah ini masih banyak kekurangan, oleh
karena itu kritik, saran, dan masukan sangat penulis harapkan demi terlaksananya
penelitian yang absah dan benar. Semoga penelitian ini dapat segera terlaksana
sehingga dapat menghasilkan karya ilmiah yang bermanfaat.
Bogor, April 2016
Hazan Azhari Zainuddin
DAFTAR ISI
DAFTAR TABEL
DAFTAR GAMBAR
DAFTAR LAMPIRAN
1 PENDAHULUAN
Latar Belakang
Tujuan Penelitian
vi
vi
vi
1
1
2
2 TINJAUAN PUSTAKA
Pendugaan Area Kecil (Small Area Estimation)
Pendugaan Langsung (Direct Estimation)
Pendugaan Tidak Langsung (Indirect Estimation)
Empirical Best Linear Unbiased Predictor (EBLUP)
Spatial Empirical Best Linear Unbiased Predictor (SEBLUP)
Matriks Contiguity
Transformasi Logaritma EBLUP
Transformasi Logaritma SEBLUP
3
3
3
3
4
4
6
6
7
3 METODE PENELITIAN
Kajian Simulasi
Penerapan
8
8
10
4 HASIL DAN PEMBAHASAN
Kajian Simulasi
Penerapan
13
13
15
5 SIMPULAN DAN SARAN
Simpulan
Saran
20
20
20
DAFTAR PUSTAKA
LAMPIRAN
21
22
RIWAYAT HIDUP
27
6
DAFTAR TABEL
1
2
3
4
5
Kombinasi simulasi
Nilai rata-rata bias relatif (BR) (%)
Nilai rata- rata AKTG (%)
Hasil Uji Autokorelasi Spasial dengan Indeks Moran
Jumlah desa dengan sumber mata pencaharian utama sebagian
besar penduduk adalah pertanian
6 Dugaan Area Kecil untuk rata-rata Pengeluaran Per Kapita
Tingkat Kecamatan di Kabupaten dan
Kota Bogor (Ribu Rupiah) 2010
7 Dugaan area kecil untuk selang kepercayaan 95% rata-rata
Pengeluaran Per Kapita Tingkat Kecamatan di Kabupaten
dan Kota Bogor (Ribu Rupiah) 2010
10
13
14
16
16
17
18
DAFTAR GAMBAR
1 Ilustrasi matriks Contiguity tipe rook (a) , bishop (b), queen (c)
2 Peta simulasi
3 Diagram alir tahapan kajian simulasi
4 Diagram alir tahapan studi kasus
5 Normal quantile quantile plot (a) Y, pengeluaran per kapita
per bulan (Rupiah) dan (b) bentuk transformasi logaritma
peubah Y
6
8
11
12
15
DAFTAR LAMPIRAN
1 Keterangan komponen komponen pada penduga MSE SEBLUP
2 Peubah penyerta dari data PODES 2011
3 penduga RMSE untuk untuk rata-rata Pengeluaran Per Kapita
SUSENAS 2010 Tingkat Kecamatan di Kabupaten dan Kota Bogor
4 Matriks pembobot spasial contiguity queen pada peta Kabupaten
dan Kota Bogor
22
23
24
26
1
1 PENDAHULUAN
Latar Belakang
Berbagai survei umumnya dirancang untuk menduga parameter populasi
berskala nasional. Masalah akan timbul jika dari survei tersebut ingin diperoleh
informasi untuk area yang lebih kecil, misalnya pada level propinsi,level kabupaten
atau level kecamatan. Ukuran contoh pada level area tersebut biasanya sangat kecil
sehingga statistik yang diperoleh akan memiliki ragam yang besar. Guna mengatasi
hal ini, dikembangkan sebuah metode pendugaan parameter yang dikenal metode
pendugaan area kecil (small area estimation, SAE).
Statistik area kecil (small area statistics) saat ini telah menjadi perhatian
para statistisi dunia secara sangat serius. Telah banyak penelitian yang
dikembangkan baik untuk perbaikan teknik dan pengembangan metode maupun
aplikasi dalam berbagai kasus dan persoalan nyata yang dihadapi. Fay dan Herriot
merupakan peneliti pertama yang mengembangkan pendugaan area kecil berbasis
model. Model yang dikembangkannya kemudian menjadi rujukan dalam
pengembangan penelitian pendugaan area kecil lebih lanjut sampai dengan saat ini.
Ada dua asumsi dasar dalam mengembangkan model SAE, yaitu keragaman
di dalam sub populasi peubah respon dapat diterangkan seluruhnya oleh hubungan
keragaman yang bersesuaian pada informasi tambahan yang disebut pengaruh tetap
(fixed effect) dan asumsi keragaman spesifik sub populasi tidak dapat diterangkan
oleh informasi tambahan dan merupakan pengaruh acak sub populasi (random
effect). Gabungan dari kedua asumsi tersebut membentuk model pengaruh
campuran (mixed model). Salah satu sifat menarik dari model linier campuran
adalah kemampuannya dalam menduga kombinasi linear dari pengaruh tetap dan
pengaruh acak. Salah satu metode penyelesaian model linier campuran yang sering
digunakan adalah prediksi tak bias linier terbaik empiris (Empirical Best Linear
Unbiased Prediction, EBLUP). Dalam metode ini dilakukan pendugaan komponen
ragam terlebih dahulu dengan metode kemungkinan maksimum (maximum
likelihood) atau kemungkinan maksimum terkendala (restricted maximum
likelihood).
Pada perkembangannya pendekatan EBLUP dikembangkan dengan
memasukkan pengaruh spasial ke dalam model. Penduga EBLUP dengan
memperhatikan pengaruh acak area yang berkorelasi spasial dikenal dengan istilah
penduga SEBLUP (spatial empirical best linear unbiased prediction). Metode
SEBLUP dapat memperbaiki struktur ragam dari model pendugaan area kecil yang
memiliki korelasi spasial antar area. Model yang digunakan dalam metode SEBLUP
berbasis area karena pemodelan spasial yang dimasukkan ke dalam model SAE
adalah pemodelan tipe data spasial area. Penduga SEBLUP telah digunakan oleh
Petrucci & Salvati (2004), Chandra , Salvati & Chambers (2007) dan Pratesi &
Salvati (2007) dengan memasukkan matriks spasial pembobot spasial tetangga
terdekat (nearest neighbors) ke dalam metode SEBLUP.
2
Penduga SEBLUP maupun EBLUP menggunakan model campuran linier
dalam pendugaannya. Model campuran linier memiliki asumsi distribusi normal
sehingga data (peubah yang menjadi perhatian) yang digunakan pada penduga
SEBLUP maupun EBLUP harus memilki distribusi normal. Pada kenyataanya, data
yang ditemukan dilapangan memiliki distribusi tidak normal sehingga model yang
digunakan untuk pendugaan akan memberikan hasil yang kurang baik. Kurnia
(2009) menemukan beberapa metode pendugaan area kecil ketika datanya memilki
distribusi yang tidak normal. Salah satu dari metode tersebut menggunakan
transformasi logaritma pada peubah yang menjadi perhatian agar distribusinya
mendekati distribusi normal. Pada kenyataannya, ada juga data yang memilki
distribusi tidak normal sekaligus memilki pengaruh spasial sehingga diperlukan
metode pendugaan yang tepat untuk menangani masalah tersebut. Pada penelitian
ini, transformasi logaritma dilakukan pada metode SEBLUP. Penduga ini
diharapkan dapat menghasilkan penduga dengan presisi dan akurasi yang lebih
baik. Penduga transformasi logaritma SEBLUP juga diharapkan dapat mengatasi
data yang memilki distribusi tidak normal sekaligus memiliki pengaruh spasial.
Tesis ini ditulis dalam lima bab. Bab 1 menjelaskan tentang motivasi dan
tujuan dari penelitian ini. Bab 2 merupakan tinjauan atas literatur terkini yang
terkait erat dengan topik penelitian ini. Bab ini juga memperjelas posisi penelitian
ini di antara penelitian sejenis yang sudah pernah dilakukan. Bab 3 menjelaskan
data dan metodologi yang digunakan di dalam tesis ini. Selanjutnya hasil simulasi
beserta penerapan metode yang dikembangkan disajikan pada Bab 4. Tesis ini
ditutup dengan kesimpulan dan saran yang dicantumkan pada Bab 5.
Tujuan Penelitian
Tujuan dari penelitian ini adalah:
1. Mengembangkan metode pendugaan area kecil pada data yang memiliki
distribusi tidak normal dan memilki pengaruh spasial
2. Mencari pendugaan area kecil terbaik melalui simulasi
3
2 TINJAUAN PUSTAKA
Pendugaan Area Kecil (Small Area Estimation)
Menurut Rao (2003), suatu area dikatakan besar apabila ukuran contoh pada
area tersebut mampu menghasilkan presisi pendugaan yang baik dengan penduga
langsung. Sebaliknya, suatu area dikatakan “kecil” apabila ukuran contoh pada area
tersebut tidak cukup untuk menunjang penduga langsung agar mampu
menghasilkan presisi pendugaan yang baik. Pendekatan lain seringkali diperlukan
untuk mengatasi permasalahan tersebut, salah satunya adalah penduga tak
langsung. Penduga tak langsung “meminjam informasi” dengan menggunakan nilai
peubah dari contoh pada area lain yang terkait dengan area yang diamati.
Pendugaan Langsung (Direct Estimation)
Pelaksanaan survei ditujukan untuk menduga parameter populasi. Pendekatan
klasik untuk menduga parameter populasi didasarkan pada aplikasi model disain
penarikan contoh (design based) dan penduga yang dihasilkan dari pendekatan itu
disebut penduga langsung (direct estimation). Data hasil survei ini dapat digunakan
untuk mendapatkan penduga yang terpercaya dari total maupun rata-rata populasi
suatu area atau domain dengan jumlah contoh yang besar. Namun, jika penduga
langsung tersebut digunakan untuk suatu area yang kecil maka akan menimbulkan
galat baku yang besar (Gosh & Rao, 1994).
Pendugaan Tidak Langsung (Indirect estimation)
Pada pendugaan area kecil terdapat dua jenis model dasar yang digunakan,
yaitu model level area dan model level unit (Rao 2003).
a) Model level area
Model level area merupakan model yang didasarkan pada ketersediaan
data pendukung yang hanya ada untuk level area tertentu, misalkan
=
,
,…, �
dengan parameter yang akan diduga adalah � yang
diasumsikan mempunyai hubungan dengan
. Data pendukung tersebut
digunakan untuk membangun model � = � � +
, dengan i= 1,2,3,....,m
dan ~ � , � ,sebagai pengaruh acak yang menyebar normal. Kesimpulan
mengenai � dapat diketahui dengan mengasumsikan bahwa model penduga
langsung
telah tersedia, yaitu
= � + , dengan i= 1,2,3,...,m. dan
sampling error ~� , � dengan � diketahui. Selanjutnya kedua model
tersebut digabung sehingga diperoleh model gabungan : = � � +
+
dengan i=1,2,3,....,m. Model tersebut merupakan bentuk khusus dari model
linier campuran.
b) Model level unit
Model level unit merupakan suatu model dengan data pendukung yang
tersedia bersesuaian secara individu dengan data respon, misalnya
=
,
, … , � sehingga diperoleh suatu model regresi tersarang
=
�
�+ +
dengan i= 1,2,3,...,m. dan j=1,2,3,.... ,
~ � , � dan
~� , � .
4
Empirical Best Linear Unbiased Prediction (EBLUP)
Model berikut merupakan model tingkat area yaitu:
�̂ =
�
�+
+
untuk i= 1,2, ....., m.
(1)
dengan
adalah peubah penyerta tingkat area dan adalah matriks rancangan.
Teknik penyelesaian model tersebut untuk memperoleh BLUP bagi � = � � +
telah dikembangkan oleh Henderson (1953), dengan asumsi � diketahui.
Penduga BLUP dari � berdasarkan persamaan (1) adalah
�̂ ��
�̂ ��
�
�
=
=
̂+
�
�̂ +
�̂ −
̂
�
−
̂
�
(2)
−̂
̂.
�
(3)
̂ adalah koefisien regresi yang diduga dengan
dengan = � ⁄ � + � dan �
−
� − ̂
̂= � −
�. Metode BLUP
generalized least squares (GLS) yaitu, �
yang dikembangkan Henderson mengasumsikan diketahuinya komponen ragam
pengaruh acak dalam model campuran linier, padahal pada kenyataannya
komponen ragam ini tidak diketahui sebagai akibatnya, ragam pengaruh acaknya
harus diduga. Harville (1977) dalam makalahnya menulis tentang pendugaan
komponen ragam dengan menggunakan metode kemungkinan maksimum
(maximum likelihood, ML) dan metode kemungkinan maksimum terkendala
(restricted maximum likelihood, REML). Pendugaan � baik dengan metode ML
maupun REML dilakukan dengan alogaritma Fisher scoring. Penduga EBLUP
dengan mengganti nilai � dengan penduganya �̂� dari penduga EBLUP (2) adalah
sebagai berikut:
�̂
�� �
= ̂ �̂ +
Spatial Empirical Best Linear Unbiased Prediction (SEBLUP)
̂ = (�̂ , … , �̂ ) ,
Misalkan didefinisikan vektor �
=
,…,
dan
,
dan
matriks
= ( � , … , �� )
dan
Z=
diag
=
,…,
Berdasarkan definisi vektor dan matriks tersebut, maka persamaan (4)
,…,
dalam notasi matriks adalah :
�̂ = � +
+ .
(4)
Model pada persamaan (4) mengasumsikan bahwa terdapat pengaruh acak
area, namun pengaruh tersebut saling bebas antar area. Pada kenyataannya, sangat
beralasan untuk mengatakan bahwa ada korelasi antar area yang berdekatan.
Korelasi tersebut akan semakin berkurang seiring dengan jarak yang bertambah.
Hal ini sesuai dengan hukum pertama tentang geografi yang dikemukakan oleh
Tobler (Tobler’s first low of geography) dalam Schabenberger dan Gotway (2005)
yang merupakan pilar kajian analisis data spasial, yaitu “everything is related to
everything else, but near things are more related then distant things”. Segala
sesuatu saling berhubungan satu dengan yang lainnya, tetapi sesuatu yang lebih
dekat akan lebih berpengaruh daripada sesuatu yang jauh. Model SAE dengan
memasukkan korelasi spasial antar area pertama kali diperkenalkan oleh Cressie
(Cressie 1991), dengan mengasumsikan ketergantungan spasial mengikuti proses
5
Conditional Autoregressive (Autoregresif bersyarat, CAR). Model SAE ini
kemudian dikembangkan lagi oleh beberapa peneliti, diantaranya salvati (2004),
Candra, Salvati, dan Chambers (2007), Pratesi dan Salvati (2007), dengan
mengasumsikan bahwa ketergantungan spatial yang dimasukkan kedalam
komponen galat dari faktor acak mengikuti proses Simultaneous Autoregressive
(Simultan otoregresif, SAR). Model SAR sendiri pertama kali diperkenalkan oleh
Anselin (Anselin 1992) dimana vektor pengaruh acak area memenuhi :
= ρW + u
(5)
koefisien ρ dalam persamaan (5) adalah koefisien otoregresi spasial yang
menunjukkan kekuatan dari hubungan spasial antar pengaruh acak. Nilai ρ berkisar
antara -1 sampai 1. Nilai ρ > 0 menunjukkan bahwa suatu area dengan nilai
parameter yang tinggi cenderung dikelilingi oleh area lain dengan nilai parameter
yang tinggi pula dan sebuah area dengan nilai parameter yang rendah pula. Disisi
lain, ρ < 0 menunjukkan bahwa suatu area dengan nilai parameter yang tinggi
dikelilingi oleh area lain dengan nilai parameter yang rendah, atau sebaliknya
(Savitz dan Raudenbush 2009). W adalah matriks pembobot spasial,
adalah
pengaruh acak area dan u adalah vektor galat dari pengaruh acak area dengan ratarata sama dengan nol dan ragam � Im Persamaan (5) dapat ditulis kembali sebagai
berikut :
= ( I – ρW)-1 u
(6)
dengan I adalah matriks identitas berukuran m × m. Dari persamaan (6) terlihat
bahwa rata-rata adalah 0 dan matriks koragam (G) adalah sebagai berikut :
G = � [(I – ρW)(I - ρWT)]-1
(7)
persamaan (6) disubtitusikan ke persamaan (4) menghasilkan :
̂= � +
�
�– �
̂ dengan R = diag �
matriks koragam dari �
= � +
adalah:
�
�
=
� �
−
+
(8)
adalah :
+ � [ �− �
�− �
]−
.
(9)
Penduga Spasial BLUP untuk parameter � dengan � , � dan � diketahui
�̂ � � , � =
×{
�̂
− }
{� � − �
�− �
�+
]−
�− �
� � + � [ �− �
̂ ) (10)
̂− �
}− (�
−
� − ̂
� −
̂ =
� dan �Ti adalah vektor berukuran 1 × m
dimana �
, , … , , , … . dengan 1 menunjuk pada lokasi ke-i. Penduga Spasial BLUP
tersebut diperoleh dengan memasukkan matriks koragam pada persamaan (7) ke
dalam penduga BLUP. Spasial BLUP akan sama dengan BLUP jika � = 0.
Seperti halnya dengan penduga EBLUP, penduga SEBLUP �̂ �̂ , �̂
diperoleh dari Spasial BLUP dengan mengganti nilai � , � dengan penduganya.
Asumsi kenormalan dari pengaruh acak digunakan untuk menduga � dan � dengan
menggunakan prosedur baik ML maupun REML dengan fungsi log-likelihood
.(Candra, Salvati, Chambers 2007). Penduga tersebut dapat diperoleh secara iteratif
6
dengan menggunakan algoritma scoring. Hasil pendugaan tersebut kemudian
digunakan untuk melakukan penduga terhadap SEBLUP, dengan rumus penduga
EBLUP adalah :
− }
̂+
{�̂ � − �̂
� − �̂
�̂ � �̂ , �̂ = � �
� �
×{
+ �̂ [ � − �̂
� − �̂
]−
̂ ) (11)
}− (�̂ − �
penduga KTG untuk penduga SEBLUP adalah sebagai berikut:
(12)
KTG[�̂ � , �̂ , �̂ ] ≈ � �̂ , �̂ + � �̂ , �̂ + � �̂ , �̂
dengan � �̂ , �̂ , � �̂ , �̂ dan � �̂ , �̂ dapat dilihat pada Lampiran 1.
Matriks Contiguity
Matriks contiguity (kedekatan) merupakan matriks pembobot spasial yang
menunjukan hubungan spasial suatu lokasi dengan lokasi lainnya yang bertetangga.
Pemberian nilai 1 diberikan jika lokasi-i bertetangga langsung dengan lokasi-j,
sedangkan nilai 0 diberikan jika lokasi-i tidak bertetangga dengan lokasi-j. Ada
beberapa jenis matriks contiguity antara lain sebagai berikut, yaitu Rook Contiguity,
Bishop Contiguity dan Queen Contiguity (Dubin,2009).
Rook
Bishop
*
*
I
*
Queen
*
*
i
*
*
(a)
*
(b)
*
*
*
*
i
*
*
*
*
(c)
Gambar 1. Ilustrasi matriks Contiguity tipe rook (a) , bishop (b), queen (c).
Matriks contiguity tipe rook mendefinisikan suatu lokasi i bertetangga
dengan lokasi j jika lokasi i bersinggungan sisi dengan lokasi j (Gambar 1(a)).
Matriks contiguity tipe Bishop mendefinisikan suatu lokasi i bertetangga dengan
lokasi j jika lokasi i bersinggungan sudut dengan lokasi j (Gambar 1(b)). Matriks
contiguity tipe queen mendefinisikan suatu lokasi i bertetangga dengan lokasi j jika
lokasi i bersinggungan sisi atau bersinggungan sudut dengan lokasi j (Gambar 1(c)).
Pada bentuk peta yang sebenarnya terkadang kita menemukan kesulitan
dalam mengidentifikasi kedekatan suatu lokasi apakah bersinggungan secara sudut
saja atau bersinggungan secara sisi saja. Matriks contiguity tipe queen merupakan
matriks yang efektif jika diterapkan pada peta sebenarnya karena matriks tersebut
hanya melihat apakah suatu lokasi bersinggungan atau tidak. Dengan demikian,
penelitian ini menggunakan matriks contiguity tipe queen.
Transformasi Logaritma EBLUP
Didefinisikan suatu transformasi logaritma dalam model campuran linier
sebagai berikut:
�̂ � =
�+
+
(13)
7
dengan �̂ � =
∑
∈�
log
~ N(0, � ), pengaruh
, galat penarikan contoh
acak area
~ N(0, � ) tetapi jika terdapat pengaruh spasial maka
=
menyebar MVN(0,G). Kurnia (2009) memaparkan bahwa dengan
,…,
mengikuti teori EBLUP baku untuk model (13) , yaitu EBLUP untuk nilai tengah
dari log
, maka penduga bagi � dapat ditulis sebagai berikut
�̂
�� �∗
= ̂ �̂ � +
̂
�
−̂
(14)
̂ diperoleh berdasarkan metode kuadrat terkecil terboboti untuk parameter
dengan �
regresi � dari model campuran linier, dimana ̂ = �̂� ⁄ �̂� + �̂ .
Karena yang diinginkan adalah suatu penduga aktual untuk nilai tengah
pada setiap area ke-i, maka digunakan sifat sebaran lognormal untuk melakukan
transformasi-balik dari model (14). Lebih lanjut, diasumsikan bahwa
�̂ �� �∗ menyebar normal. Dengan demikian, peduga nilai aktual untuk nilai
tengah atau penduga transformasi logaritma EBLUP ( �̂ � �� � ) untuk area ke-i
adalah
�̂ �� �∗ + ̂ �� �∗
�̂ � �� � =
(15)
dengan ̂ (�̂ �� �∗ ) adalah penduga kuadrat tengah galat (KTG) dari �̂ �� �∗ .
Kemudian penduga KTG bagi penduga nilai tengah pada persamaan (15) dapat
didekati sebagai berikut:
̂ �����∗
�
̂ (�̂ � �� � ) = ̂ (�̂�����∗) ̂ (�̂�����∗) −
.
(16)
Transformasi Logaritma SEBLUP
Dalam penelitian ini, akan diterapakan model campuran linier ke dalam
metode SEBLUP yaitu SEBLUP untuk nilai tengah dari log
, maka penduga
bagi � dapat ditulis sebagai berikut:
�̂
�� �∗
̂+
{�̂ � − �̂
� − �̂
�
� − �̂
� �̂ + �̂ [ � − �̂
=
×{
̂ � : (�̂ � , �̂ � , �̂ � , … . . �̂ �
dengan, (�
dan �̂ � =
−
∑
}
]−
∈�
log
̂ ) (17)
̂� − �
}− (�
. sama halnya
dengan EBLUP, pada metode SEBLUP ini diinginkan juga penduga aktual untuk
nilai tengah atau penduga transformasi logaritma EBLUP ( �̂ � �� � ) pada setiap
area ke-i, sehingga dperoleh:
�̂ � �� � =
�̂ �� �∗ + ̂ �� �∗
(18)
dengan ̂ (�̂ �� �∗ ) adalah penduga MSE dari �̂ �� �∗ . Kemudian penduga MSE
bagi penduga nilai tengah pada persamaan (18) dapat didekati sebagai berikut:
̂ (�̂
�
�� �
)=
̂ ������∗ )
̂ (�
̂ ������∗ )
̂ (�
−
̂ ������∗
�
.
(19)
8
3 METODE PENELITIAN
Kajian Simulasi
Simulasi dilakukan untuk mengevaluasi kebaikan model yang
dikembangkan. Proses simulasi dilakukan dengan langkah langkah sebagai berikut
ini.
1. Membuat peta buatan berbentuk seperti berikut:
Gambar 2. Peta simulasi
2.
3.
4.
5.
Berdasarkan Gambar 2 maka jumlah area (m) dalam simulasi ini adalah 49
Menentukan ukuran contoh di tiap area kecil.
Carilah matriks pembobot spasial contiguity Queen (W) berdasarkan peta yang
telah dibuat.
Simulasi ini menggunakan satu peubah yang diperhatikan ( ) dan satu peubah
penyerta . Model yang digunakan untuk memperoleh nilai logaritma peubah
yang diperhatikan (log( )). untuk area kecil ke-i dan unit ke-j adalah sebagai
berikut:
� �( ) = +
+ +
, = , , … , 9,
= , ,…,
(20)
Dimana
adalah peubah penyerta, adalah pengaruh acak area, dan
adalah galat penarikan contoh.
a. Nilai
dibangkitkan dengan menyebar normal N(2,1). Nilai
yang
diperoleh digunakan untuk seluruh skenario pada proses simulasi.
b. Menetapkan � = ,
sehingga persamaan (20) menjadi :
log(
= +
+ +
, = , , … , 9, = , , … , .
(21)
c. Membangkitkan dengan cara:
1) Membangkitkan menyebar N(0, � ) dengan � = . .
Merupakan komponen error pada persamaan (6)
2) Menetapkan nilai � = .
3) Mencari nilai
dengan memasukkan nilai
dengan = , , … , 9
dan nilai � ke persamaan (6)
d. membangkitkan
menyebar normal N(0, 0.3).
e. Menentukan nilai log( ) dengan memasukkan nilai
,
dan
ke
persamaan (21)
f. Mencari nilai aktual
dengan
= log � , sehingga dapat dikatakan
dibangkitkan dengan sebaran log-normal
Melakukan aggregasi di tiap area dengan cara:
9
a. Menghitung nilai tengah peubah yang diperhatikan untuk contoh di tiap area
kecil sebagai penduga langsung
�̂ = ∑ =
, untuk = , , … , 9, ,
= , ,…,
b. Kemudian menghitung nilai tengah peubah penyerta contoh di tiap area
kecil
, untuk = , , … , 9, ,
= , ,…,
= ∑=
c. Menghitung nilai tengah peubah yang diperhatikan berskala logaritma
untuk contoh di tiap area kecil sebagai penduga langsung berskala logaritma
, untuk = , , … , 9, , = , , … ,
�̂ � = ∑ = log
6. Mencari nilai penduga EBLUP ( �̂ �� � dengan memasukkan �̂ ke persamaan
(2)
7. Mencari nilai penduga SEBLUP (�̂ �� � ) dengan memasukkan �̂ ke
persamaan (10)
8. Mencari nilai penduga transformasi logaritma EBLUP (�̂ � �� � ) dengan
memasukkan �̂ � ke persamaan (14). Setelah itu dilakukan transformasi balik
sesuai persamaan (15)
9. Mencari nilai penduga transformasi logaritma SEBLUP (�̂ � �� � ) dengan
memasukkan �̂ � ke persamaan (17). Setelah itu dilakukan transformasi balik
sesuai persamaan (18)
10. Mengulangi langkah (4) sampai langkah (9) kecuali langkah (4a) sebanyak B =
1000 sehingga dapat dihitung nilai bias relatif (BR) tiap area, akar kuadrat
tengah galat relatif (AKTGR), rata-rata bias relatif dan rata-rata akar kuadrat
tengah galat relatif dari hasil pendugaan parameter sebagai berikut:
�
�̂ − �
BR = ∑
×
%
�
�
=
AKTG
Rata- rata BR =
�
= √ ∑(�̂ − � )
�
=
∑ = BR
Rata- rata AKTG =
∑ = AKTG
Keterangan:
a. � adalah parameter pada area kecil ke-i
b. �̂ adalah penduga area kecil pada area kecil ke-i dan iterasi ke-l
c. B adalah banyaknya iterasi, dalam penelitian ini B=1000
d. Bias adalah selisih antara nilai harapan dari penduga dengan parameter.
Bias bertujuan untuk melihat seberapa jauh suatu penduga dengan
parameternya (akurasi). Nilai bias yang mendekati nol menunjukkan bahwa
penduga tersebut memilki akurasi yang baik. Dalam penelitian ini, biasnya
tidak dimutlakkan dengan tujuan untuk melihat apakah penduganya bias ke
bawah (underestimate) atau bias ke atas (overestimate).
10
e.
f.
g.
h.
Bias relatif (BR) adalah persentasi bias terhadap parameternya
BR adalah bias relatif pada area kecil ke i
Rata-rata bias relatif (BR) adalah rata-rata bias relatif dari seluruh area
Kuadrat tengah galat adalah nilai harapan dari kuadrat selisih antara
penduga dengan parameternya. Secara formulasi, kuadrat tengah galat
mengandung dua komponen, yakni ragam penduga dan bias. Ragam
penduga untuk mengukur presisi. Presisi yang dimaksudkan dalam hal ini
adalah ukuran sejauh mana pengulangan suatu pendugaan akan
memberikan hasil yang sama. Semakin kecil nilai dari kuadrat tengah galat
maka kombinasi antara ragam penduga dan bias semakin kecil. Ragam
penduga dan bias semakin kecil menunjukkan presisi dan akurasi dari suatu
penduga semakin baik.
i. AKTG adalah akar kuadrat tengah galat pada area ke i
j. Rata-rata akar kuadrat tengah galat (AKTG) adalah rata-rata akar kuadrat
tengah galat dari seluruh area
11. Membandingkan nilai rata-rata bias relatif BR dan rata-rata akar kuadrat
tengah galat (AKTG) antara penduga EBLUP, penduga transformasi logaritma
EBLUP, penduga transformasi logaritma SEBLUP.
12. Mengulangi langkah (4) sampai langkah (11) kecuali langkah (4a) dengan nilai
� = , , dan nilai �= 0.5, 0.25 sehingga banyaknya skenario dalam
simulasi ini adalah 12.
Autokorelasi
spasial (�)
Tabel 1 Kombinasi simulasi
�
0.5
1
2
0.75 Simulasi 1 Simulasi 2
Simulasi 3
0.5 Simulasi 5 Simulasi 6
Simulasi 7
0.25 Simulasi 9 Simulasi 10 Simulasi 11
3
Simulasi 4
Simulasi 8
Simulasi 12
Penerapan
Studi kasus pada penelitian ini menggunakan data SUSENAS tahun 2010
dan PODES tahun 2011 yang dikeluarkan oleh Badan Pusat Statistik (BPS). Peubah
yang diamati pada penelitian ini adalah rata-rata pengeluaran per kapita per bulan
untuk kecamatan di wilayah Kota dan Kabupaten Bogor. Data yang tersedia pada
SUSENAS tidak mendukung pendugaan langsung pada tingkat kecamatan. Hal ini
dikarenakan contoh pada tingkat kecamatan berukuran kecil. Model yang
dikembangkan pada penelitian ini digunakan sebagai alternatif untuk mengatasi
permasalahan tersebut. Pemodelan dilakukan dengan memanfaatkan informasi dari
peubah yang dipilih dari data PODES sebagai peubah penyerta.
Data PODES dan SUSENAS yang diperoleh akan dianalisis dengan
langkah-langkah sebagai berikut:
1. Melakukan eksplorasi data, yaitu dengan memeriksa distribusi data pada data
rata-rata pengeluaran per kapita per bulan untuk kecamatan di wilayah Kota dan
Kabupaten Bogor SUSENAS 2010 kemudian memeriksa pengaruh spasialnya
2. Mencari matriks pembobot spasial wilayah Kota dan Kabupaten Bogor dengan
menggunakan matriks contiguity queen
11
3. Memilih peubah peubah penyerta dari data PODES 2011
4. Menduga rata-rata pengeluaran per kapita per bulan setiap kecamatan di
wilayah Kota dan Kabupaten Bogor dengan pendugaan langsung dan teknikteknik pendugaan yang dilakukan pada kajian simulasi
5. Mengevaluasi hasil pendugaan dengan membandingkan penduga average root
mean square error (ARMSE)
m = 49 area
Menentukan ukuran
contoh di tiap area
Contiguity queen (W )
log(
�̂
�� �
�̂
�̂
) dan
�̂
�� �
�̂
� �� �
Mengulangi
sebanyak B = 1000
BR dan AKTG
Membandingkan
hasil penduga
Gambar 3 Diagram alir tahapan kajian simulasi
�̂
�
�� �
12
Memriksa distribusi
peubah y
Memriksa autokorelasi
spasial peubah y
Contiguity queen (W )
Memilih peubah
penyerta x
�
�̂
��
�
�̂
�� �
�̂
�� �
�̂
� �� �
Mengevaluasi penduga
dengan penduga AKTG
Gambar 4 Diagram alir tahapan studi kasus
�̂
�
�� �
13
4 HASIL DAN PEMBAHASAN
Kajian Simulasi
Kajian simulasi ini dilakukan dengan empat penduga yaitu : (1) EBLUP
dengan menggunakan �̂ (EBLUP), (2) SEBLUP dengan menggunakan �̂
(SEBLUP) , (3) transfromasi balik EBLUP dengan menggunakan �̂ (Transformasi
Logaritma EBLUP), (4) transformasi balik SEBLUP dengan menggunakan
�̂ (Transformasi Logaritma SEBLUP) dan adapun hasilnya sebagai berikut:
Tabel 2 Nilai rata-rata bias relatif (BR) (%)
N(0 , 0.5)
N(0 , 1)
N(0 , 2)
N(0 , 3)
N(0 , 0.5)
N(0 , 1)
N(0 , 2)
N(0 , 3)
N(0 , 0.5)
N(0 , 1)
N(0 , 2)
N(0 , 3)
EBLUP
SEBLUP
61.38
61.38
61.63
61.86
61.55
61.53
61.61
61.84
EBLUP
SEBLUP
61.38
61.43
61.37
61.58
61.49
61.54
61.47
61.53
EBLUP
SEBLUP
61.39
61.39
61.45
61.40
61.46
61.53
61.51
61.46
�=0,75
Transformasi
Logaritma
EBLUP
-15.26
-15.26
-15.26
-15.26
�=0.5
Transformasi
Logaritma
EBLUP
-15.24
-15.25
-15.26
-15.26
�=0.25
Transformasi
Logaritma
EBLUP
-15.23
-15.24
-15.25
-15.25
Transformasi
Logaritma
SEBLUP
-15.20
-15.22
-15.23
-15.23
Transformasi
Logaritma
SEBLUP
-15.21
-15.22
-15.23
-15.24
Transformasi
Logaritma
SEBLUP
-15.21
-15.23
-15.24
-15.24
Dari Tabel 2 dapat dilihat bahwa nilai rata-rata BR dengan �=0.75 dan
� = . pada penduga transformasi logaritma EBLUP dan transformasi logaritma
SEBLUP sekitar 15.2% dan untuk penduga EBLUP dan SEBLUP sekitar 61%.
Perbedaan yang cukup besar antara penduga yang ditransformasi dengan penduga
yang tanpa dilakukan transformasi dimana rata-rata BR pada penduga yang
ditransformasi jauh lebih kecil. Ketika � diganti dengan 1 ,2, dan 3 , maka akan
menghasilkan nilai rata-rata BR yang hampir sama dengan � = . . Kemudian,
ketika nilai autokorelasinya (� diganti dengan 0.5 atau 0,25, hasilnya juga akan
hampir sama dengan �=0.75 untuk nilai rata-rata BR . Meskipun nilai rata-rata BR
pada penduga yang dilakukan transformasi lebih kecil yakni sekitar 15.2 %, akan
tetapi nilai 15.2 % masih berbias. Masalah bias tersebut belum diketahui
penyebabnya oleh peneliti sampai saat ini. Untuk arah biasnya, penduga EBLUP
14
dan SEBLUP mengalami overestimate . Penduga transformasi logaritma EBLUP
dan penduga transformasi logaritma SEBLUP menghasilkan penduga yang
underestimate.
Tabel 3 Nilai rata- rata AKTG
N(0 , 0.5)
N(0 , 1)
N(0 , 2)
N(0 , 3)
N(0 , 0.5)
N(0 , 1)
N(0 , 2)
N(0 , 3)
N(0 , 0.5)
N(0 , 1)
N(0 , 2)
N(0 , 3)
EBLUP
SEBLUP
23.48
23.70
23.97
24.23
23.57
23.76
23.97
24.21
EBLUP
SEBLUP
23.41
23.60
23.81
23.96
23.48
23.65
23.80
23.92
EBLUP
SEBLUP
23.38
23.57
23.73
23.84
23.44
23.61
23.74
22.83
�=0.75
Transformasi
Logaritma
EBLUP
6.67
6.67
6.68
6.68
�=0.5
Transformasi
Logaritma
EBLUP
6.65
6.66
6.67
6.67
�=0.25
Transformasi
Logaritma
EBLUP
6.63
6.65
6.66
6.67
Transformasi
Logaritma
SEBLUP
6.61
6.63
6.65
6.65
Transformasi
Logaritma
SEBLUP
6.62
6.64
6.65
6.66
Transformasi
Logaritma
SEBLUP
6.62
6.64
6.66
6.66
Dari Tabel 3 dapat dilihat bahwa nilai rata- rata AKTG dengan �=0.75 dan
� = . pada penduga transformasi logaritma EBLUP dan transformasi logaritma
SEBLUP sekitar 6.6 dan untuk penduga EBLUP dan SEBLUP sekitar 23.
Perbedaan yang cukup besar antara penduga yang ditransformasi dengan penduga
yang tanpa dilakukan transformasi dimana rata- rata AKTG pada penduga yang
ditransformasi jauh lebih kecil. Hal ini mengindikasikan bahwa peubah yang
diperhatikan yang memiliki distribusi tidak normal akan lebih baik jika dilakukan
transformasi logaritma terlebih dahulu lalu. Langkah berikutnya adalah
memasukkan hasil transformasi ke metode pendugaan area kecil lalu dilakukan
transformasi balik. Dampak dari melakukan transformasi logaritma yaitu galat yang
dihasilkan lebih kecil jika dibandingkan dengan metode yang tanpa dilakukan
transformasi . Ketika � diganti dengan 1 ,2, dan 3 , maka akan menghasilkan nilai
rata- rata AKTG yang hampir sama dengan � = . .Kemudian, ketika nilai
autokorelasinya (� diganti dengan 0.5 atau 0.25 maka hasilnya juga akan hampir
sama dengan �=0.75 untuk nilai rata- rata AKTGR.
Pada Tabel 3 juga dapat dilihat bahwa nilai rata- rata AKTGR dengan �=0.75
dan � = . pada penduga transformasi logaritma SEBLUP yaitu, 6.61. Nilai
tersebut lebih kecil jika dibandingkan dengan penduga transformasi logaritma
EBLUP yang nilai rata- rata AKTG nya sebesar 6.67 . Hal yang serupa juga terjadi
15
ketika � sama dengan 1 ,2, atau 3 dan nilai autokorelasinya (� sama dengan 0.5
atau 0.25. Akan tetapi khusus untuk � = dan �=0.25 nilai rata-rata AKTG antara
penduga transformasi logaritma SEBLUP dan penduga transformasi logaritma
EBLUP hampir sama yakni 6.66 . Meskipun nilai rata-rata AKTG pada penduga
transformasi logaritma SEBLUP lebih kecil dibandingkan dengan penduga
transformasi logaritma EBLUP tetapi selisihnya sangat kecil. Oleh karena itu,
penduga transformasi logaritma SEBLUP dan penduga transformasi logaritma
EBLUP memiliki presisi dan akurasi yang hampir sama baiknya.
Penerapan
Metode yang telah dikembangkan ini diterapkan pada Survei Sosial
Ekonomi Nasional (SUSENAS) tahun 2010 dan Potensi Desa (PODES) tahun 2011
yang dikeluarkan oleh Badan Pusat Statistik (BPS). Peubah yang diamati pada
penelitian ini adalah rata-rata pengeluaran per kapita per bulan untuk kecamatan di
wilayah Kota dan Kabupaten Bogor.
(a)
(b)
Gambar 5 Normal quantile quantile plot (a) Y, pengeluaran per kapita per bulan
(Rupiah) dan (b) bentuk transformasi logaritma peubah Y
Peubah pengeluaran per kapita pada data SUSENAS 2010 digunakan
sebagai peubah yang diperhatikan (Y), yaitu rata-rata pengeluaran per kapita per
bulan. Data SUSENAS 2010 mencakup 44 tersurvei kecamatan dan 111
desa/kelurahan di Kota dan Kabupaten Bogor. Berdasarkan plot, secara visual dapat
terlihat pada Gambar 5(a) bahwa pada sebaran datanya banyak titik yang tidak
berada pada persekitaran garis. Hal ini dapat menjadi indikator bahwa asumsi
kenormalan belum terpenuhi. Setelah dilakukan transformasi logaritma pada
peubah Y maka asumsi kenormalan terpenuhi dan hal tersebut dapat dilihat pada
Gambar 5(b), sebaran data berada disekitar garis.
Selanjutnya pada peubah yang diperhatikan (Y) akan dilihat ketergantungan
spasialnya atau dengan kata lain, apakah terdapat autokorelasi spasial atau tidak.
Pengukuran autokorelasi spasial dapat dihitung menggunakan metode Moran’s
Index (Indeks Moran) yaitu:
16
�=
∑= ∑
(∑ = ∑
=
=
−̅ (
)∑ =
− ̅)
−̅
Untuk mengidentifikasi adanya autokorelasi spasial atau tidak, dilakukan uji
signifikansi indeks Moran.
Tabel 4 Hasil Uji Autokorelasi Spasial dengan Indeks Moran
∗
Peubah
=� �
Indeks Moran
0.28
0.44
3.51
5.05
�
Uji signifikansi indeks Moran didekati dengan distribusi normal baku sehingga
menghasilkan
� . Pada Tabel 4 dapat dilihat bahwa uji autokorelasi spasial
dengan menggunakan Indeks Moran terhadap peubah yang diperhatikan (Y)
menghasilkan nilai
� = . . Nilai
� = . > −� = .
sehingga
pada taraf 5% dapat dikatakan bahwa data tersebut memiliki autokorelasi spasial.
Kemudian untuk transformasi logaritma peubah yang diperhatikan (Y)
menghasilkan
� = . . Nilai
� = . > −� = .
sehingga pada
taraf 5% dapat dikatakan bahwa transformasi logaritma peubah yang diperhatikan
(Y) memiliki autokorelasi spasial.
Kemudian untuk pemilihan peubah penyerta pada penelitian ini, dipilih
beberapa peubah yang relevan (Lampiran 2). Peubah tersebut dianggap bisa
mempengaruhi transformasi logaritma dari rata-rata pengeluaran per kapita per
bulan (rupiah) (Log Y). Lalu dilakukan seleksi lagi dengan menggunakan regresi
stepwise pada peubah penyerta. Tujuannya untuk mencari model terbaik sehingga
bisa dijadikan model yang tepat untuk melakukan pendugaan area kecil. Peubah
penyerta yang terpilih adalah jumlah desa dengan sumber mata pencaharian utama
sebagian besar penduduk adalah pertanian (X1).
Tabel 5 Jumlah desa dengan sumber mata pencaharian utama sebagian besar
penduduk adalah pertanian (X1)
No.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
Kecamatan
Nanggung
Leuwiliang
Pamijahan
Cibungbulang
Ciampea
Dramaga
Ciomas
Tamansari
Cijeruk
Cigombong
Caringin
Ciawi
Cisarua
Megamendung
Sukaraja
Babakan Madang
Sukamakmur
Cariu
Tanjungsari
Jonggol
Cileungsi
Kelapa Nunggal
X1
10
7
15
11
5
7
1
3
8
7
8
5
4
7
6
4
10
9
10
12
5
6
No.
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
Kecamatan
Gunung Putri
Citeureup
Cibinong
Bojong Gede
Tajur Halang
Kemang
Ranca Bungur
Parung
Ciseeng
Gunung Sindur
Rumpin
Cigudeg
Sukajaya
Jasinga
Tenjo
Parung Panjang
Bogor Selatan
Bogor Timur
Bogor Utara
Bogor Tengah
Bogor Barat
Tanah Sereal
X1
0
3
0
0
1
6
5
2
10
7
10
11
9
12
7
3
3
0
0
0
2
0
17
Setelah melalui proses eksplorasi data, pendugaan area kecil dilakukan dengan
lima penduga yaitu : (1) Penduga Langsung, (2) EBLUP dengan menggunakan �̂
(EBLUP), (3) SEBLUP dengan menggunakan �̂ (SEBLUP) , (4) transfromasi balik
EBLUP dengan menggunakan �̂ (Transformasi Logaritma EBLUP), (5)
transformasi balik SEBLUP dengan menggunakan �̂ (Transformasi Logaritma
SEBLUP) dan adapun hasilnya sebagai berikut:
Tabel 6 Dugaan Area Kecil untuk rata-rata Pengeluaran Per Kapita Tingkat
Kecamatan di Kabupaten dan Kota Bogor (Ribu Rupiah) 2010
Penduga
NO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
KEC
Nanggung
Leuwiliang
Pamijahan
Cibungbulang
Ciampea
Dramaga
Ciomas
Tamansari
Cijeruk
Cigombong
Caringin
Ciawi
Cisarua
Megamendung
Sukaraja
Babakan madang
Sukamakmur
Cariu
Tanjungsari
Jonggol
Cileungsi
Kelapa nunggal
Gunung putri
Citeureup
Cibinong
Bojong gede
Tajur halang
Kemang
Ranca bungur
Parung
Ciseeng
Gunung sindur
Rumpin
Cigudeg
Sukajaya
Jasinga
Tenjo
Parung panjang
Bogor selatan
Bogor timur
Bogor utara
Bogor tengah
Bogor barat
Tanah sereal
Langsung
194.56
359.44
255.51
292.93
472.09
465.98
961.73
463.16
483.18
406.61
586.33
613.77
557.76
499.37
661.43
983.40
291.76
306.95
325.55
363.68
740.22
256.29
1607.44
519.88
764.40
715.99
943.12
730.15
293.12
579.79
391.18
574.27
394.96
363.28
315.04
442.95
311.82
248.64
633.36
961.36
746.92
773.64
568.22
556.25
EBLUP
194.64
361.22
255.56
293.31
475.68
465.60
940.88
464.11
481.36
406.66
581.98
613.04
558.16
486.11
658.96
759.63
291.77
307.28
325.07
363.71
736.70
256.81
1357.89
523.81
764.87
718.50
917.75
706.99
294.49
582.12
390.98
566.89
395.01
363.95
314.80
442.46
312.31
250.13
634.58
941.35
748.43
774.73
569.16
559.05
SEBLUP
194.64
361.00
255.54
293.28
475.39
465.51
939.24
464.20
481.39
406.98
582.18
614.31
558.27
487.24
658.99
758.46
291.78
307.32
325.10
363.73
737.20
256.93
1353.59
524.26
765.09
718.65
917.40
706.32
294.50
582.67
391.00
566.86
394.95
363.73
314.77
442.34
312.19
250.09
634.83
940.43
748.25
774.10
569.15
559.00
TL EBLUP
188.38
309.50
245.01
280.88
422.77
414.34
813.63
439.41
457.75
365.46
485.34
490.12
509.43
404.03
596.48
577.05
282.10
294.25
298.61
343.33
663.43
247.57
946.33
472.01
718.45
657.48
837.78
653.30
270.32
552.83
383.77
503.12
375.30
325.59
294.61
403.57
282.48
242.16
528.60
703.55
614.44
658.60
509.80
483.22
TL
SEBLUP
188.40
307.55
244.91
280.61
421.32
414.75
809.70
439.99
458.19
368.84
486.05
494.69
509.05
408.19
597.93
578.81
282.25
294.60
298.29
343.39
662.89
248.44
940.53
472.16
718.63
658.70
838.27
650.66
272.55
557.42
383.94
503.44
374.54
323.26
293.72
401.57
281.68
241.78
529.25
706.61
613.84
656.37
509.86
483.50
18
Dari Tabel 6 dapat dilihat bahwa seluruh penduga memperlihatkan
kecamatan Gunung Putri memiliki rata-rata pengeluaran per kapita tertinggi
dibandingkan dengan kecamatan yang lain. Sedangkan, kecamatan yang diduga
memilki rata-rata pengeluaran per kapita terendah adalah kecamatan Nanggung.
Hal tersebut dikarenakan oleh pengaruh jumlah desa dengan sumber mata
pencaharian utama sebagian besar penduduk adalah pertanian pada kecamatan
Nanggung cukup tinggi sedangkan pada kecamatan Gunung Putri jumlah desa
untuk peubah tersebut adalah nol.
Tabel 7 Dugaan area kecil untuk selang kepercayaan 95% rata-rata Pengeluaran Per
Kapita Tingkat Kecamatan di Kabupaten dan Kota Bogor (Ribu Rupiah)
2010
Selang kepercayaan 95%
No.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
Kec.
Nanggung
Leuwiliang
Pamijahan
Cibungbulang
Ciampea
Dramaga
Ciomas
Tamansari
Cijeruk
Cigombong
Caringin
Ciawi
Cisarua
Megamendung
Sukaraja
Babakan Madang
Sukamakmur
Cariu
Tanjungsari
Jonggol
Cileungsi
Kelapa Nunggal
Gunung Putri
Citeureup
Cibinong
Bojong Gede
Tajur Halang
Kemang
Ranca Bungur
Parung
Ciseeng
Gunung Sindur
Rumpin
Cigudeg
Sukajaya
Jasinga
Tenjo
Parung Panjang
Bogor Selatan
Bogor Timur
Bogor Utara
Bogor Tengah
Bogor Barat
Tanah Sereal
Langsung
BA
BB
203.23
185.90
404.92
313.95
266.39
244.63
309.65
276.21
524.47
419.70
511.52
420.43
1067.84
855.61
491.21
435.12
520.85
445.52
464.17
349.04
647.18
525.48
723.35
504.19
604.14
511.38
601.69
397.04
713.60
609.26
1333.55
633.24
305.19
278.33
335.91
277.98
365.96
285.14
387.78
339.58
789.39
691.06
277.81
234.77
1819.39 1395.48
568.11
471.64
800.56
728.23
771.08
660.91
1059.21
827.04
820.44
639.85
323.86
262.38
626.47
533.12
405.52
376.84
653.06
495.49
412.58
377.33
394.97
331.59
350.95
279.13
492.65
393.25
334.36
289.27
267.59
229.70
688.52
578.19
1080.98
841.74
800.46
693.37
837.86
709.42
592.52
543.92
590.27
522.24
EBLUP
BA
203.25
404.85
266.45
309.72
523.75
511.21
1056.46
490.94
520.69
463.87
646.32
718.09
603.27
599.50
712.48
1223.64
305.23
336.02
366.22
387.92
788.07
277.83
1741.48
567.14
799.47
768.69
1045.81
816.36
323.80
625.31
405.54
651.33
412.61
395.15
351.11
492.99
334.38
267.55
686.88
1065.73
798.11
834.35
592.22
589.56
BB
185.92
313.97
244.69
276.29
419.11
420.21
845.37
434.86
445.42
348.91
524.83
500.19
510.61
395.86
608.27
561.65
278.37
278.12
285.46
339.73
689.85
234.79
1326.53
470.78
727.19
658.68
815.14
636.47
262.35
532.06
376.86
494.23
377.37
331.80
279.33
393.70
289.30
229.66
576.70
828.12
691.17
706.17
543.64
521.57
SEBLUP
BA
BB
203.61
185.66
398.43
319.37
257.23
253.76
298.70
287.17
498.96
442.47
469.02
466.40
972.59
877.05
488.68
440.09
502.04
463.12
455.87
360.97
640.15
525.10
674.01
568.50
574.65
538.47
SPATIAL EMPIRICAL BEST LINEAR UNBIASED
PREDICTION PADA PENDUGAAN AREA KECIL
HAZAN AZHARI ZAINUDDIN
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016
PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa tesis berjudul “Kajian Transformasi
Logaritma untuk Penduga Spatial Empirical Best Linear Unbiased Prediction pada
Pendugaan Area Kecil” adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi
manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, April 2016
Hazan Azhari Zainuddin
NIM G151130301
RINGKASAN
HAZAN AZHARI ZAINUDDIN. Kajian Transformasi Logaritma untuk
Penduga Spatial Empirical Best Linear Unbiased Prediction pada Pendugaan Area
Kecil. Dibimbing oleh KHAIRIL ANWAR NOTODIPUTRO dan KUSMAN
SADIK.
Berbagai survei umumnya dirancang untuk menduga parameter populasi
berskala nasional. Masalah akan timbul jika dari survei tersebut ingin diperoleh
informasi untuk area yang lebih kecil, misalnya pada level propinsi,level kabupaten
atau level kecematan. Ukuran contoh pada level area tersebut biasanya sangat kecil
sehingga statistik yang diperoleh akan memiliki ragam yang besar. Guna mengatasi
hal ini, dikembangkan sebuah metode pendugaan parameter yang dikenal metode
pendugaan area kecil (small area estimation, SAE). Salah satu metode dalam
pendugaan area kecil adalah Empirical Best Linear Unbiased Prediction (EBLUP).
Metode Empirical Best Linear Unbiased Prediction (EBLUP) telah banyak
digunakan untuk Small Area Estimation. Beberapa tahun kemudian pendekatan
EBLUP dikembangkan dengan memasukkan pengaruh spasial ke dalam model.
Penduga EBLUP dengan memperhatikan pengaruh acak area yang berkorelasi
spasial dikenal dengan istilah penduga Spatial Empirical Best Linear Unbiased
Prediction (SEBLUP). Penduga SEBLUP maupun EBLUP menggunakan model
campuran linier dalam pendugaannya. Model campuran linier memiliki asumsi
distribusi normal sehingga data (peubah yang menjadi perhatian) yang digunakan
pada penduga SEBLUP maupun EBLUP harus memilki distribusi normal. Pada
kenyataanya, data yang ditemukan dilapangan memiliki distribusi tidak normal
sehingga model yang digunakan untuk pendugaan akan memberikan hasil yang
kurang baik. Salah satu dari metode untuk menangani masalah tersebut adalah
dengan menggunakan transformasi logaritma pada peubah yang menjadi perhatian
agar distribusinya mendekati distribusi normal. Pada kenyataannya, ada juga data
yang memilki distribusi tidak normal sekaligus memilki pengaruh spasial sehingga
diperlukan metode pendugaan yang tepat untuk menangani masalah tersebut. Pada
penelitian ini, transformasi logaritma dilakukan pada metode SEBLUP. Penduga ini
diharapkan dapat menghasilkan penduga dengan presisi dan akurasi yang lebih
baik. Penduga transformasi logaritma SEBLUP juga diharapkan dapat mengatasi
data yang memilki distribusi tidak normal sekaligus memiliki pengaruh spasial.
Hasil dari kajian simulasi menunjukkan bahwa penduga transformasi
logaritma SEBLUP memiliki nilai rata-rata BR dan nilai rata-rata AKTGR yang
hampir sama jika dibandingkan dengan penduga transformasi logaritma EBLUP.
Hasil simulasi ini sejalan dengan hasil studi kasus rata-rata pengeluaran per kapita
tingkat kecamatan di kota atau kabupaten Bogor 2010. Sehingga dapat disimpulkan
bahwa penduga transformasi logaritma SEBLUP dan penduga transformasi
logaritma EBLUP sama baiknya. Kedua penduga tersebut memiliki performa yang
sama dalam melakukan pendugaan area kecil.
Kata kuci: EBLUP, SAE, SEBLUP
SUMMARY
HAZAN AZHARI ZAINUDDIN. A Study of Logarithmic Transformation
on Spatial Empirical Best Linear Unbiased Prediction Estimator in Small Area
Estimation. Supervised by KHAIRIL ANWAR NOTODIPUTRO and KUSMAN
SADIK.
Various surveys have been generally designed to estimate population
parameters in nationwide scale. Problems appear if any information for smaller
areas from the survey needs to be obtained, for example at the provincial level,
district level or sub district level. The sample size at the level of the area is usually
very small the estimates have a large variances. To overcome this problem, a
parameter estimation method called Small Area Estimation (SAE) has been
developed. One of the methods in small area estimation is Empirical Best Linear
Unbiased Prediction (EBLUP).
Empirical Best Linear Unbiased Prediction (EBLUP) method has been widely
used for small area estimation. A few years later the EBLUP approach has been
developed by incorporating spatial effect into the model. The estimator concerns
with the random effect of the area which was spatially correlated known as Spatial
Empirical Best Linear Unbiased Prediction (SEBLUP). EBLUP and SEBLUP
estimators are basically obtained from linear mixed models. Linear mixed models
have assume normal distribution assumption of the data. In fact, it is often that the
data are not normally distributed. One of the methods to deal with the problem is to
use a logarithm transformation on the variables of interest so that the distribution
approaches a normal distribution. In fact, it is also often that the data is not normally
distribut nor spatially independent. In this study, methods of logarithmic
transformation on SEBLUP were discussed.
The results of simulation studies showed that the logarithmic transformation
on SEBLUP estimator produced an average relative bias (RB) and the average
relative root mean square error (RRMSE) almost the same in each scenario of
simulations when compared to logarithmic transformation on EBLUP estimator.
The application of this method to estimate average per capita expenditure in the
sub-district of Bogor in 2010 showed similar results with the simulation results.
It can be concluded that the logarithmic transformation on SEBLUP estimator and
the logarithmic transformation on EBLUP estimator have the same performance in
small area estimation
Keywords: EBLUP, SAE, SEBLUP
© Hak Cipta Milik IPB, Tahun 2016
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau
menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apa pun tanpa izin IPB
KAJIAN TRANSFORMASI LOGARITMA UNTUK PENDUGA
SPATIAL EMPIRICAL BEST LINEAR UNBIASED
PREDICTION PADA PENDUGAAN AREA KECIL
HAZAN AZHARI ZAINUDDIN
Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Program Studi Statistika
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016
2
Penguji Luar Komisi pada Ujian Tesis : Dr. Anang Kurnia,S.Si, M.Si
Kajian Transformasi Logaritma untuk Penduga Spatial Empirical
Best Linear Unbiased Prediction pada Pendugaan Area Kecil
: Hazan Azhari Zainuddin
: G151130301
Judul Tesis :
Nama
NIM
Disetujui oleh
Komisi Pembimbing
Prof. Dr. Ir. Khairil Anwar Notodiputro, MS
Ketua
Dr. Ir. Kusman Sadik, MS
Anggota
Diketahui oleh
Ketua program Studi
Statistika
Dekan Sekolah Pascasarjana
Dr. Ir. Kusman Sadik, MS
Dr. Ir. Dahrul Syah, M.Sc.Agr
Tanggal Ujian : 21 Januari 2016
Tanggal Lulus :
4
PRAKATA
Puji dan syukur penulis ucapkan kehadirat Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah yang
berjudul “Kajian Transformasi Logaritma untuk Penduga Spatial Empirical Best
Linear Unbiased Prediction p ada Pendugaan Area Kecil.”. Keberhasilan penulisan
karya ilmiah ini tidak lepas dari bantuan, bimbingan, dan petunjuk dari berbagai
pihak.
Terima kasih penulis ucapkan kepada Bapak Prof. Dr. Ir. Khairil Anwar
Notodiputro, MS sebagai ketua komisi pembimbing dan Bapak Dr. Ir. Kusman
Sadik M,Si sebagai aggota komisi pembimbing yang telah memberikan bimbingan,
arahan serta saran kepada penulis. Ungkapan terima kasih terkhusus penulis
sampaikan kepada orang tua, serta seluruh keluarga atas do’a, dukungan dan
pengertiannya. Terima kasih pula kepada seluruh staf Jurusan Statistika, teman
teman statistika (S2 dan S3) atas bantuannya dan kebersamaannya. Terima kasih
tak lupa pula penulis sampaikan kepada semua pihak yang tidak dapat penulis
sebutkan satu per satu yang telah membantu dalam penyusunan karya ilmiah ini.
Penulis menyadari bahwa karya ilmiah ini masih banyak kekurangan, oleh
karena itu kritik, saran, dan masukan sangat penulis harapkan demi terlaksananya
penelitian yang absah dan benar. Semoga penelitian ini dapat segera terlaksana
sehingga dapat menghasilkan karya ilmiah yang bermanfaat.
Bogor, April 2016
Hazan Azhari Zainuddin
DAFTAR ISI
DAFTAR TABEL
DAFTAR GAMBAR
DAFTAR LAMPIRAN
1 PENDAHULUAN
Latar Belakang
Tujuan Penelitian
vi
vi
vi
1
1
2
2 TINJAUAN PUSTAKA
Pendugaan Area Kecil (Small Area Estimation)
Pendugaan Langsung (Direct Estimation)
Pendugaan Tidak Langsung (Indirect Estimation)
Empirical Best Linear Unbiased Predictor (EBLUP)
Spatial Empirical Best Linear Unbiased Predictor (SEBLUP)
Matriks Contiguity
Transformasi Logaritma EBLUP
Transformasi Logaritma SEBLUP
3
3
3
3
4
4
6
6
7
3 METODE PENELITIAN
Kajian Simulasi
Penerapan
8
8
10
4 HASIL DAN PEMBAHASAN
Kajian Simulasi
Penerapan
13
13
15
5 SIMPULAN DAN SARAN
Simpulan
Saran
20
20
20
DAFTAR PUSTAKA
LAMPIRAN
21
22
RIWAYAT HIDUP
27
6
DAFTAR TABEL
1
2
3
4
5
Kombinasi simulasi
Nilai rata-rata bias relatif (BR) (%)
Nilai rata- rata AKTG (%)
Hasil Uji Autokorelasi Spasial dengan Indeks Moran
Jumlah desa dengan sumber mata pencaharian utama sebagian
besar penduduk adalah pertanian
6 Dugaan Area Kecil untuk rata-rata Pengeluaran Per Kapita
Tingkat Kecamatan di Kabupaten dan
Kota Bogor (Ribu Rupiah) 2010
7 Dugaan area kecil untuk selang kepercayaan 95% rata-rata
Pengeluaran Per Kapita Tingkat Kecamatan di Kabupaten
dan Kota Bogor (Ribu Rupiah) 2010
10
13
14
16
16
17
18
DAFTAR GAMBAR
1 Ilustrasi matriks Contiguity tipe rook (a) , bishop (b), queen (c)
2 Peta simulasi
3 Diagram alir tahapan kajian simulasi
4 Diagram alir tahapan studi kasus
5 Normal quantile quantile plot (a) Y, pengeluaran per kapita
per bulan (Rupiah) dan (b) bentuk transformasi logaritma
peubah Y
6
8
11
12
15
DAFTAR LAMPIRAN
1 Keterangan komponen komponen pada penduga MSE SEBLUP
2 Peubah penyerta dari data PODES 2011
3 penduga RMSE untuk untuk rata-rata Pengeluaran Per Kapita
SUSENAS 2010 Tingkat Kecamatan di Kabupaten dan Kota Bogor
4 Matriks pembobot spasial contiguity queen pada peta Kabupaten
dan Kota Bogor
22
23
24
26
1
1 PENDAHULUAN
Latar Belakang
Berbagai survei umumnya dirancang untuk menduga parameter populasi
berskala nasional. Masalah akan timbul jika dari survei tersebut ingin diperoleh
informasi untuk area yang lebih kecil, misalnya pada level propinsi,level kabupaten
atau level kecamatan. Ukuran contoh pada level area tersebut biasanya sangat kecil
sehingga statistik yang diperoleh akan memiliki ragam yang besar. Guna mengatasi
hal ini, dikembangkan sebuah metode pendugaan parameter yang dikenal metode
pendugaan area kecil (small area estimation, SAE).
Statistik area kecil (small area statistics) saat ini telah menjadi perhatian
para statistisi dunia secara sangat serius. Telah banyak penelitian yang
dikembangkan baik untuk perbaikan teknik dan pengembangan metode maupun
aplikasi dalam berbagai kasus dan persoalan nyata yang dihadapi. Fay dan Herriot
merupakan peneliti pertama yang mengembangkan pendugaan area kecil berbasis
model. Model yang dikembangkannya kemudian menjadi rujukan dalam
pengembangan penelitian pendugaan area kecil lebih lanjut sampai dengan saat ini.
Ada dua asumsi dasar dalam mengembangkan model SAE, yaitu keragaman
di dalam sub populasi peubah respon dapat diterangkan seluruhnya oleh hubungan
keragaman yang bersesuaian pada informasi tambahan yang disebut pengaruh tetap
(fixed effect) dan asumsi keragaman spesifik sub populasi tidak dapat diterangkan
oleh informasi tambahan dan merupakan pengaruh acak sub populasi (random
effect). Gabungan dari kedua asumsi tersebut membentuk model pengaruh
campuran (mixed model). Salah satu sifat menarik dari model linier campuran
adalah kemampuannya dalam menduga kombinasi linear dari pengaruh tetap dan
pengaruh acak. Salah satu metode penyelesaian model linier campuran yang sering
digunakan adalah prediksi tak bias linier terbaik empiris (Empirical Best Linear
Unbiased Prediction, EBLUP). Dalam metode ini dilakukan pendugaan komponen
ragam terlebih dahulu dengan metode kemungkinan maksimum (maximum
likelihood) atau kemungkinan maksimum terkendala (restricted maximum
likelihood).
Pada perkembangannya pendekatan EBLUP dikembangkan dengan
memasukkan pengaruh spasial ke dalam model. Penduga EBLUP dengan
memperhatikan pengaruh acak area yang berkorelasi spasial dikenal dengan istilah
penduga SEBLUP (spatial empirical best linear unbiased prediction). Metode
SEBLUP dapat memperbaiki struktur ragam dari model pendugaan area kecil yang
memiliki korelasi spasial antar area. Model yang digunakan dalam metode SEBLUP
berbasis area karena pemodelan spasial yang dimasukkan ke dalam model SAE
adalah pemodelan tipe data spasial area. Penduga SEBLUP telah digunakan oleh
Petrucci & Salvati (2004), Chandra , Salvati & Chambers (2007) dan Pratesi &
Salvati (2007) dengan memasukkan matriks spasial pembobot spasial tetangga
terdekat (nearest neighbors) ke dalam metode SEBLUP.
2
Penduga SEBLUP maupun EBLUP menggunakan model campuran linier
dalam pendugaannya. Model campuran linier memiliki asumsi distribusi normal
sehingga data (peubah yang menjadi perhatian) yang digunakan pada penduga
SEBLUP maupun EBLUP harus memilki distribusi normal. Pada kenyataanya, data
yang ditemukan dilapangan memiliki distribusi tidak normal sehingga model yang
digunakan untuk pendugaan akan memberikan hasil yang kurang baik. Kurnia
(2009) menemukan beberapa metode pendugaan area kecil ketika datanya memilki
distribusi yang tidak normal. Salah satu dari metode tersebut menggunakan
transformasi logaritma pada peubah yang menjadi perhatian agar distribusinya
mendekati distribusi normal. Pada kenyataannya, ada juga data yang memilki
distribusi tidak normal sekaligus memilki pengaruh spasial sehingga diperlukan
metode pendugaan yang tepat untuk menangani masalah tersebut. Pada penelitian
ini, transformasi logaritma dilakukan pada metode SEBLUP. Penduga ini
diharapkan dapat menghasilkan penduga dengan presisi dan akurasi yang lebih
baik. Penduga transformasi logaritma SEBLUP juga diharapkan dapat mengatasi
data yang memilki distribusi tidak normal sekaligus memiliki pengaruh spasial.
Tesis ini ditulis dalam lima bab. Bab 1 menjelaskan tentang motivasi dan
tujuan dari penelitian ini. Bab 2 merupakan tinjauan atas literatur terkini yang
terkait erat dengan topik penelitian ini. Bab ini juga memperjelas posisi penelitian
ini di antara penelitian sejenis yang sudah pernah dilakukan. Bab 3 menjelaskan
data dan metodologi yang digunakan di dalam tesis ini. Selanjutnya hasil simulasi
beserta penerapan metode yang dikembangkan disajikan pada Bab 4. Tesis ini
ditutup dengan kesimpulan dan saran yang dicantumkan pada Bab 5.
Tujuan Penelitian
Tujuan dari penelitian ini adalah:
1. Mengembangkan metode pendugaan area kecil pada data yang memiliki
distribusi tidak normal dan memilki pengaruh spasial
2. Mencari pendugaan area kecil terbaik melalui simulasi
3
2 TINJAUAN PUSTAKA
Pendugaan Area Kecil (Small Area Estimation)
Menurut Rao (2003), suatu area dikatakan besar apabila ukuran contoh pada
area tersebut mampu menghasilkan presisi pendugaan yang baik dengan penduga
langsung. Sebaliknya, suatu area dikatakan “kecil” apabila ukuran contoh pada area
tersebut tidak cukup untuk menunjang penduga langsung agar mampu
menghasilkan presisi pendugaan yang baik. Pendekatan lain seringkali diperlukan
untuk mengatasi permasalahan tersebut, salah satunya adalah penduga tak
langsung. Penduga tak langsung “meminjam informasi” dengan menggunakan nilai
peubah dari contoh pada area lain yang terkait dengan area yang diamati.
Pendugaan Langsung (Direct Estimation)
Pelaksanaan survei ditujukan untuk menduga parameter populasi. Pendekatan
klasik untuk menduga parameter populasi didasarkan pada aplikasi model disain
penarikan contoh (design based) dan penduga yang dihasilkan dari pendekatan itu
disebut penduga langsung (direct estimation). Data hasil survei ini dapat digunakan
untuk mendapatkan penduga yang terpercaya dari total maupun rata-rata populasi
suatu area atau domain dengan jumlah contoh yang besar. Namun, jika penduga
langsung tersebut digunakan untuk suatu area yang kecil maka akan menimbulkan
galat baku yang besar (Gosh & Rao, 1994).
Pendugaan Tidak Langsung (Indirect estimation)
Pada pendugaan area kecil terdapat dua jenis model dasar yang digunakan,
yaitu model level area dan model level unit (Rao 2003).
a) Model level area
Model level area merupakan model yang didasarkan pada ketersediaan
data pendukung yang hanya ada untuk level area tertentu, misalkan
=
,
,…, �
dengan parameter yang akan diduga adalah � yang
diasumsikan mempunyai hubungan dengan
. Data pendukung tersebut
digunakan untuk membangun model � = � � +
, dengan i= 1,2,3,....,m
dan ~ � , � ,sebagai pengaruh acak yang menyebar normal. Kesimpulan
mengenai � dapat diketahui dengan mengasumsikan bahwa model penduga
langsung
telah tersedia, yaitu
= � + , dengan i= 1,2,3,...,m. dan
sampling error ~� , � dengan � diketahui. Selanjutnya kedua model
tersebut digabung sehingga diperoleh model gabungan : = � � +
+
dengan i=1,2,3,....,m. Model tersebut merupakan bentuk khusus dari model
linier campuran.
b) Model level unit
Model level unit merupakan suatu model dengan data pendukung yang
tersedia bersesuaian secara individu dengan data respon, misalnya
=
,
, … , � sehingga diperoleh suatu model regresi tersarang
=
�
�+ +
dengan i= 1,2,3,...,m. dan j=1,2,3,.... ,
~ � , � dan
~� , � .
4
Empirical Best Linear Unbiased Prediction (EBLUP)
Model berikut merupakan model tingkat area yaitu:
�̂ =
�
�+
+
untuk i= 1,2, ....., m.
(1)
dengan
adalah peubah penyerta tingkat area dan adalah matriks rancangan.
Teknik penyelesaian model tersebut untuk memperoleh BLUP bagi � = � � +
telah dikembangkan oleh Henderson (1953), dengan asumsi � diketahui.
Penduga BLUP dari � berdasarkan persamaan (1) adalah
�̂ ��
�̂ ��
�
�
=
=
̂+
�
�̂ +
�̂ −
̂
�
−
̂
�
(2)
−̂
̂.
�
(3)
̂ adalah koefisien regresi yang diduga dengan
dengan = � ⁄ � + � dan �
−
� − ̂
̂= � −
�. Metode BLUP
generalized least squares (GLS) yaitu, �
yang dikembangkan Henderson mengasumsikan diketahuinya komponen ragam
pengaruh acak dalam model campuran linier, padahal pada kenyataannya
komponen ragam ini tidak diketahui sebagai akibatnya, ragam pengaruh acaknya
harus diduga. Harville (1977) dalam makalahnya menulis tentang pendugaan
komponen ragam dengan menggunakan metode kemungkinan maksimum
(maximum likelihood, ML) dan metode kemungkinan maksimum terkendala
(restricted maximum likelihood, REML). Pendugaan � baik dengan metode ML
maupun REML dilakukan dengan alogaritma Fisher scoring. Penduga EBLUP
dengan mengganti nilai � dengan penduganya �̂� dari penduga EBLUP (2) adalah
sebagai berikut:
�̂
�� �
= ̂ �̂ +
Spatial Empirical Best Linear Unbiased Prediction (SEBLUP)
̂ = (�̂ , … , �̂ ) ,
Misalkan didefinisikan vektor �
=
,…,
dan
,
dan
matriks
= ( � , … , �� )
dan
Z=
diag
=
,…,
Berdasarkan definisi vektor dan matriks tersebut, maka persamaan (4)
,…,
dalam notasi matriks adalah :
�̂ = � +
+ .
(4)
Model pada persamaan (4) mengasumsikan bahwa terdapat pengaruh acak
area, namun pengaruh tersebut saling bebas antar area. Pada kenyataannya, sangat
beralasan untuk mengatakan bahwa ada korelasi antar area yang berdekatan.
Korelasi tersebut akan semakin berkurang seiring dengan jarak yang bertambah.
Hal ini sesuai dengan hukum pertama tentang geografi yang dikemukakan oleh
Tobler (Tobler’s first low of geography) dalam Schabenberger dan Gotway (2005)
yang merupakan pilar kajian analisis data spasial, yaitu “everything is related to
everything else, but near things are more related then distant things”. Segala
sesuatu saling berhubungan satu dengan yang lainnya, tetapi sesuatu yang lebih
dekat akan lebih berpengaruh daripada sesuatu yang jauh. Model SAE dengan
memasukkan korelasi spasial antar area pertama kali diperkenalkan oleh Cressie
(Cressie 1991), dengan mengasumsikan ketergantungan spasial mengikuti proses
5
Conditional Autoregressive (Autoregresif bersyarat, CAR). Model SAE ini
kemudian dikembangkan lagi oleh beberapa peneliti, diantaranya salvati (2004),
Candra, Salvati, dan Chambers (2007), Pratesi dan Salvati (2007), dengan
mengasumsikan bahwa ketergantungan spatial yang dimasukkan kedalam
komponen galat dari faktor acak mengikuti proses Simultaneous Autoregressive
(Simultan otoregresif, SAR). Model SAR sendiri pertama kali diperkenalkan oleh
Anselin (Anselin 1992) dimana vektor pengaruh acak area memenuhi :
= ρW + u
(5)
koefisien ρ dalam persamaan (5) adalah koefisien otoregresi spasial yang
menunjukkan kekuatan dari hubungan spasial antar pengaruh acak. Nilai ρ berkisar
antara -1 sampai 1. Nilai ρ > 0 menunjukkan bahwa suatu area dengan nilai
parameter yang tinggi cenderung dikelilingi oleh area lain dengan nilai parameter
yang tinggi pula dan sebuah area dengan nilai parameter yang rendah pula. Disisi
lain, ρ < 0 menunjukkan bahwa suatu area dengan nilai parameter yang tinggi
dikelilingi oleh area lain dengan nilai parameter yang rendah, atau sebaliknya
(Savitz dan Raudenbush 2009). W adalah matriks pembobot spasial,
adalah
pengaruh acak area dan u adalah vektor galat dari pengaruh acak area dengan ratarata sama dengan nol dan ragam � Im Persamaan (5) dapat ditulis kembali sebagai
berikut :
= ( I – ρW)-1 u
(6)
dengan I adalah matriks identitas berukuran m × m. Dari persamaan (6) terlihat
bahwa rata-rata adalah 0 dan matriks koragam (G) adalah sebagai berikut :
G = � [(I – ρW)(I - ρWT)]-1
(7)
persamaan (6) disubtitusikan ke persamaan (4) menghasilkan :
̂= � +
�
�– �
̂ dengan R = diag �
matriks koragam dari �
= � +
adalah:
�
�
=
� �
−
+
(8)
adalah :
+ � [ �− �
�− �
]−
.
(9)
Penduga Spasial BLUP untuk parameter � dengan � , � dan � diketahui
�̂ � � , � =
×{
�̂
− }
{� � − �
�− �
�+
]−
�− �
� � + � [ �− �
̂ ) (10)
̂− �
}− (�
−
� − ̂
� −
̂ =
� dan �Ti adalah vektor berukuran 1 × m
dimana �
, , … , , , … . dengan 1 menunjuk pada lokasi ke-i. Penduga Spasial BLUP
tersebut diperoleh dengan memasukkan matriks koragam pada persamaan (7) ke
dalam penduga BLUP. Spasial BLUP akan sama dengan BLUP jika � = 0.
Seperti halnya dengan penduga EBLUP, penduga SEBLUP �̂ �̂ , �̂
diperoleh dari Spasial BLUP dengan mengganti nilai � , � dengan penduganya.
Asumsi kenormalan dari pengaruh acak digunakan untuk menduga � dan � dengan
menggunakan prosedur baik ML maupun REML dengan fungsi log-likelihood
.(Candra, Salvati, Chambers 2007). Penduga tersebut dapat diperoleh secara iteratif
6
dengan menggunakan algoritma scoring. Hasil pendugaan tersebut kemudian
digunakan untuk melakukan penduga terhadap SEBLUP, dengan rumus penduga
EBLUP adalah :
− }
̂+
{�̂ � − �̂
� − �̂
�̂ � �̂ , �̂ = � �
� �
×{
+ �̂ [ � − �̂
� − �̂
]−
̂ ) (11)
}− (�̂ − �
penduga KTG untuk penduga SEBLUP adalah sebagai berikut:
(12)
KTG[�̂ � , �̂ , �̂ ] ≈ � �̂ , �̂ + � �̂ , �̂ + � �̂ , �̂
dengan � �̂ , �̂ , � �̂ , �̂ dan � �̂ , �̂ dapat dilihat pada Lampiran 1.
Matriks Contiguity
Matriks contiguity (kedekatan) merupakan matriks pembobot spasial yang
menunjukan hubungan spasial suatu lokasi dengan lokasi lainnya yang bertetangga.
Pemberian nilai 1 diberikan jika lokasi-i bertetangga langsung dengan lokasi-j,
sedangkan nilai 0 diberikan jika lokasi-i tidak bertetangga dengan lokasi-j. Ada
beberapa jenis matriks contiguity antara lain sebagai berikut, yaitu Rook Contiguity,
Bishop Contiguity dan Queen Contiguity (Dubin,2009).
Rook
Bishop
*
*
I
*
Queen
*
*
i
*
*
(a)
*
(b)
*
*
*
*
i
*
*
*
*
(c)
Gambar 1. Ilustrasi matriks Contiguity tipe rook (a) , bishop (b), queen (c).
Matriks contiguity tipe rook mendefinisikan suatu lokasi i bertetangga
dengan lokasi j jika lokasi i bersinggungan sisi dengan lokasi j (Gambar 1(a)).
Matriks contiguity tipe Bishop mendefinisikan suatu lokasi i bertetangga dengan
lokasi j jika lokasi i bersinggungan sudut dengan lokasi j (Gambar 1(b)). Matriks
contiguity tipe queen mendefinisikan suatu lokasi i bertetangga dengan lokasi j jika
lokasi i bersinggungan sisi atau bersinggungan sudut dengan lokasi j (Gambar 1(c)).
Pada bentuk peta yang sebenarnya terkadang kita menemukan kesulitan
dalam mengidentifikasi kedekatan suatu lokasi apakah bersinggungan secara sudut
saja atau bersinggungan secara sisi saja. Matriks contiguity tipe queen merupakan
matriks yang efektif jika diterapkan pada peta sebenarnya karena matriks tersebut
hanya melihat apakah suatu lokasi bersinggungan atau tidak. Dengan demikian,
penelitian ini menggunakan matriks contiguity tipe queen.
Transformasi Logaritma EBLUP
Didefinisikan suatu transformasi logaritma dalam model campuran linier
sebagai berikut:
�̂ � =
�+
+
(13)
7
dengan �̂ � =
∑
∈�
log
~ N(0, � ), pengaruh
, galat penarikan contoh
acak area
~ N(0, � ) tetapi jika terdapat pengaruh spasial maka
=
menyebar MVN(0,G). Kurnia (2009) memaparkan bahwa dengan
,…,
mengikuti teori EBLUP baku untuk model (13) , yaitu EBLUP untuk nilai tengah
dari log
, maka penduga bagi � dapat ditulis sebagai berikut
�̂
�� �∗
= ̂ �̂ � +
̂
�
−̂
(14)
̂ diperoleh berdasarkan metode kuadrat terkecil terboboti untuk parameter
dengan �
regresi � dari model campuran linier, dimana ̂ = �̂� ⁄ �̂� + �̂ .
Karena yang diinginkan adalah suatu penduga aktual untuk nilai tengah
pada setiap area ke-i, maka digunakan sifat sebaran lognormal untuk melakukan
transformasi-balik dari model (14). Lebih lanjut, diasumsikan bahwa
�̂ �� �∗ menyebar normal. Dengan demikian, peduga nilai aktual untuk nilai
tengah atau penduga transformasi logaritma EBLUP ( �̂ � �� � ) untuk area ke-i
adalah
�̂ �� �∗ + ̂ �� �∗
�̂ � �� � =
(15)
dengan ̂ (�̂ �� �∗ ) adalah penduga kuadrat tengah galat (KTG) dari �̂ �� �∗ .
Kemudian penduga KTG bagi penduga nilai tengah pada persamaan (15) dapat
didekati sebagai berikut:
̂ �����∗
�
̂ (�̂ � �� � ) = ̂ (�̂�����∗) ̂ (�̂�����∗) −
.
(16)
Transformasi Logaritma SEBLUP
Dalam penelitian ini, akan diterapakan model campuran linier ke dalam
metode SEBLUP yaitu SEBLUP untuk nilai tengah dari log
, maka penduga
bagi � dapat ditulis sebagai berikut:
�̂
�� �∗
̂+
{�̂ � − �̂
� − �̂
�
� − �̂
� �̂ + �̂ [ � − �̂
=
×{
̂ � : (�̂ � , �̂ � , �̂ � , … . . �̂ �
dengan, (�
dan �̂ � =
−
∑
}
]−
∈�
log
̂ ) (17)
̂� − �
}− (�
. sama halnya
dengan EBLUP, pada metode SEBLUP ini diinginkan juga penduga aktual untuk
nilai tengah atau penduga transformasi logaritma EBLUP ( �̂ � �� � ) pada setiap
area ke-i, sehingga dperoleh:
�̂ � �� � =
�̂ �� �∗ + ̂ �� �∗
(18)
dengan ̂ (�̂ �� �∗ ) adalah penduga MSE dari �̂ �� �∗ . Kemudian penduga MSE
bagi penduga nilai tengah pada persamaan (18) dapat didekati sebagai berikut:
̂ (�̂
�
�� �
)=
̂ ������∗ )
̂ (�
̂ ������∗ )
̂ (�
−
̂ ������∗
�
.
(19)
8
3 METODE PENELITIAN
Kajian Simulasi
Simulasi dilakukan untuk mengevaluasi kebaikan model yang
dikembangkan. Proses simulasi dilakukan dengan langkah langkah sebagai berikut
ini.
1. Membuat peta buatan berbentuk seperti berikut:
Gambar 2. Peta simulasi
2.
3.
4.
5.
Berdasarkan Gambar 2 maka jumlah area (m) dalam simulasi ini adalah 49
Menentukan ukuran contoh di tiap area kecil.
Carilah matriks pembobot spasial contiguity Queen (W) berdasarkan peta yang
telah dibuat.
Simulasi ini menggunakan satu peubah yang diperhatikan ( ) dan satu peubah
penyerta . Model yang digunakan untuk memperoleh nilai logaritma peubah
yang diperhatikan (log( )). untuk area kecil ke-i dan unit ke-j adalah sebagai
berikut:
� �( ) = +
+ +
, = , , … , 9,
= , ,…,
(20)
Dimana
adalah peubah penyerta, adalah pengaruh acak area, dan
adalah galat penarikan contoh.
a. Nilai
dibangkitkan dengan menyebar normal N(2,1). Nilai
yang
diperoleh digunakan untuk seluruh skenario pada proses simulasi.
b. Menetapkan � = ,
sehingga persamaan (20) menjadi :
log(
= +
+ +
, = , , … , 9, = , , … , .
(21)
c. Membangkitkan dengan cara:
1) Membangkitkan menyebar N(0, � ) dengan � = . .
Merupakan komponen error pada persamaan (6)
2) Menetapkan nilai � = .
3) Mencari nilai
dengan memasukkan nilai
dengan = , , … , 9
dan nilai � ke persamaan (6)
d. membangkitkan
menyebar normal N(0, 0.3).
e. Menentukan nilai log( ) dengan memasukkan nilai
,
dan
ke
persamaan (21)
f. Mencari nilai aktual
dengan
= log � , sehingga dapat dikatakan
dibangkitkan dengan sebaran log-normal
Melakukan aggregasi di tiap area dengan cara:
9
a. Menghitung nilai tengah peubah yang diperhatikan untuk contoh di tiap area
kecil sebagai penduga langsung
�̂ = ∑ =
, untuk = , , … , 9, ,
= , ,…,
b. Kemudian menghitung nilai tengah peubah penyerta contoh di tiap area
kecil
, untuk = , , … , 9, ,
= , ,…,
= ∑=
c. Menghitung nilai tengah peubah yang diperhatikan berskala logaritma
untuk contoh di tiap area kecil sebagai penduga langsung berskala logaritma
, untuk = , , … , 9, , = , , … ,
�̂ � = ∑ = log
6. Mencari nilai penduga EBLUP ( �̂ �� � dengan memasukkan �̂ ke persamaan
(2)
7. Mencari nilai penduga SEBLUP (�̂ �� � ) dengan memasukkan �̂ ke
persamaan (10)
8. Mencari nilai penduga transformasi logaritma EBLUP (�̂ � �� � ) dengan
memasukkan �̂ � ke persamaan (14). Setelah itu dilakukan transformasi balik
sesuai persamaan (15)
9. Mencari nilai penduga transformasi logaritma SEBLUP (�̂ � �� � ) dengan
memasukkan �̂ � ke persamaan (17). Setelah itu dilakukan transformasi balik
sesuai persamaan (18)
10. Mengulangi langkah (4) sampai langkah (9) kecuali langkah (4a) sebanyak B =
1000 sehingga dapat dihitung nilai bias relatif (BR) tiap area, akar kuadrat
tengah galat relatif (AKTGR), rata-rata bias relatif dan rata-rata akar kuadrat
tengah galat relatif dari hasil pendugaan parameter sebagai berikut:
�
�̂ − �
BR = ∑
×
%
�
�
=
AKTG
Rata- rata BR =
�
= √ ∑(�̂ − � )
�
=
∑ = BR
Rata- rata AKTG =
∑ = AKTG
Keterangan:
a. � adalah parameter pada area kecil ke-i
b. �̂ adalah penduga area kecil pada area kecil ke-i dan iterasi ke-l
c. B adalah banyaknya iterasi, dalam penelitian ini B=1000
d. Bias adalah selisih antara nilai harapan dari penduga dengan parameter.
Bias bertujuan untuk melihat seberapa jauh suatu penduga dengan
parameternya (akurasi). Nilai bias yang mendekati nol menunjukkan bahwa
penduga tersebut memilki akurasi yang baik. Dalam penelitian ini, biasnya
tidak dimutlakkan dengan tujuan untuk melihat apakah penduganya bias ke
bawah (underestimate) atau bias ke atas (overestimate).
10
e.
f.
g.
h.
Bias relatif (BR) adalah persentasi bias terhadap parameternya
BR adalah bias relatif pada area kecil ke i
Rata-rata bias relatif (BR) adalah rata-rata bias relatif dari seluruh area
Kuadrat tengah galat adalah nilai harapan dari kuadrat selisih antara
penduga dengan parameternya. Secara formulasi, kuadrat tengah galat
mengandung dua komponen, yakni ragam penduga dan bias. Ragam
penduga untuk mengukur presisi. Presisi yang dimaksudkan dalam hal ini
adalah ukuran sejauh mana pengulangan suatu pendugaan akan
memberikan hasil yang sama. Semakin kecil nilai dari kuadrat tengah galat
maka kombinasi antara ragam penduga dan bias semakin kecil. Ragam
penduga dan bias semakin kecil menunjukkan presisi dan akurasi dari suatu
penduga semakin baik.
i. AKTG adalah akar kuadrat tengah galat pada area ke i
j. Rata-rata akar kuadrat tengah galat (AKTG) adalah rata-rata akar kuadrat
tengah galat dari seluruh area
11. Membandingkan nilai rata-rata bias relatif BR dan rata-rata akar kuadrat
tengah galat (AKTG) antara penduga EBLUP, penduga transformasi logaritma
EBLUP, penduga transformasi logaritma SEBLUP.
12. Mengulangi langkah (4) sampai langkah (11) kecuali langkah (4a) dengan nilai
� = , , dan nilai �= 0.5, 0.25 sehingga banyaknya skenario dalam
simulasi ini adalah 12.
Autokorelasi
spasial (�)
Tabel 1 Kombinasi simulasi
�
0.5
1
2
0.75 Simulasi 1 Simulasi 2
Simulasi 3
0.5 Simulasi 5 Simulasi 6
Simulasi 7
0.25 Simulasi 9 Simulasi 10 Simulasi 11
3
Simulasi 4
Simulasi 8
Simulasi 12
Penerapan
Studi kasus pada penelitian ini menggunakan data SUSENAS tahun 2010
dan PODES tahun 2011 yang dikeluarkan oleh Badan Pusat Statistik (BPS). Peubah
yang diamati pada penelitian ini adalah rata-rata pengeluaran per kapita per bulan
untuk kecamatan di wilayah Kota dan Kabupaten Bogor. Data yang tersedia pada
SUSENAS tidak mendukung pendugaan langsung pada tingkat kecamatan. Hal ini
dikarenakan contoh pada tingkat kecamatan berukuran kecil. Model yang
dikembangkan pada penelitian ini digunakan sebagai alternatif untuk mengatasi
permasalahan tersebut. Pemodelan dilakukan dengan memanfaatkan informasi dari
peubah yang dipilih dari data PODES sebagai peubah penyerta.
Data PODES dan SUSENAS yang diperoleh akan dianalisis dengan
langkah-langkah sebagai berikut:
1. Melakukan eksplorasi data, yaitu dengan memeriksa distribusi data pada data
rata-rata pengeluaran per kapita per bulan untuk kecamatan di wilayah Kota dan
Kabupaten Bogor SUSENAS 2010 kemudian memeriksa pengaruh spasialnya
2. Mencari matriks pembobot spasial wilayah Kota dan Kabupaten Bogor dengan
menggunakan matriks contiguity queen
11
3. Memilih peubah peubah penyerta dari data PODES 2011
4. Menduga rata-rata pengeluaran per kapita per bulan setiap kecamatan di
wilayah Kota dan Kabupaten Bogor dengan pendugaan langsung dan teknikteknik pendugaan yang dilakukan pada kajian simulasi
5. Mengevaluasi hasil pendugaan dengan membandingkan penduga average root
mean square error (ARMSE)
m = 49 area
Menentukan ukuran
contoh di tiap area
Contiguity queen (W )
log(
�̂
�� �
�̂
�̂
) dan
�̂
�� �
�̂
� �� �
Mengulangi
sebanyak B = 1000
BR dan AKTG
Membandingkan
hasil penduga
Gambar 3 Diagram alir tahapan kajian simulasi
�̂
�
�� �
12
Memriksa distribusi
peubah y
Memriksa autokorelasi
spasial peubah y
Contiguity queen (W )
Memilih peubah
penyerta x
�
�̂
��
�
�̂
�� �
�̂
�� �
�̂
� �� �
Mengevaluasi penduga
dengan penduga AKTG
Gambar 4 Diagram alir tahapan studi kasus
�̂
�
�� �
13
4 HASIL DAN PEMBAHASAN
Kajian Simulasi
Kajian simulasi ini dilakukan dengan empat penduga yaitu : (1) EBLUP
dengan menggunakan �̂ (EBLUP), (2) SEBLUP dengan menggunakan �̂
(SEBLUP) , (3) transfromasi balik EBLUP dengan menggunakan �̂ (Transformasi
Logaritma EBLUP), (4) transformasi balik SEBLUP dengan menggunakan
�̂ (Transformasi Logaritma SEBLUP) dan adapun hasilnya sebagai berikut:
Tabel 2 Nilai rata-rata bias relatif (BR) (%)
N(0 , 0.5)
N(0 , 1)
N(0 , 2)
N(0 , 3)
N(0 , 0.5)
N(0 , 1)
N(0 , 2)
N(0 , 3)
N(0 , 0.5)
N(0 , 1)
N(0 , 2)
N(0 , 3)
EBLUP
SEBLUP
61.38
61.38
61.63
61.86
61.55
61.53
61.61
61.84
EBLUP
SEBLUP
61.38
61.43
61.37
61.58
61.49
61.54
61.47
61.53
EBLUP
SEBLUP
61.39
61.39
61.45
61.40
61.46
61.53
61.51
61.46
�=0,75
Transformasi
Logaritma
EBLUP
-15.26
-15.26
-15.26
-15.26
�=0.5
Transformasi
Logaritma
EBLUP
-15.24
-15.25
-15.26
-15.26
�=0.25
Transformasi
Logaritma
EBLUP
-15.23
-15.24
-15.25
-15.25
Transformasi
Logaritma
SEBLUP
-15.20
-15.22
-15.23
-15.23
Transformasi
Logaritma
SEBLUP
-15.21
-15.22
-15.23
-15.24
Transformasi
Logaritma
SEBLUP
-15.21
-15.23
-15.24
-15.24
Dari Tabel 2 dapat dilihat bahwa nilai rata-rata BR dengan �=0.75 dan
� = . pada penduga transformasi logaritma EBLUP dan transformasi logaritma
SEBLUP sekitar 15.2% dan untuk penduga EBLUP dan SEBLUP sekitar 61%.
Perbedaan yang cukup besar antara penduga yang ditransformasi dengan penduga
yang tanpa dilakukan transformasi dimana rata-rata BR pada penduga yang
ditransformasi jauh lebih kecil. Ketika � diganti dengan 1 ,2, dan 3 , maka akan
menghasilkan nilai rata-rata BR yang hampir sama dengan � = . . Kemudian,
ketika nilai autokorelasinya (� diganti dengan 0.5 atau 0,25, hasilnya juga akan
hampir sama dengan �=0.75 untuk nilai rata-rata BR . Meskipun nilai rata-rata BR
pada penduga yang dilakukan transformasi lebih kecil yakni sekitar 15.2 %, akan
tetapi nilai 15.2 % masih berbias. Masalah bias tersebut belum diketahui
penyebabnya oleh peneliti sampai saat ini. Untuk arah biasnya, penduga EBLUP
14
dan SEBLUP mengalami overestimate . Penduga transformasi logaritma EBLUP
dan penduga transformasi logaritma SEBLUP menghasilkan penduga yang
underestimate.
Tabel 3 Nilai rata- rata AKTG
N(0 , 0.5)
N(0 , 1)
N(0 , 2)
N(0 , 3)
N(0 , 0.5)
N(0 , 1)
N(0 , 2)
N(0 , 3)
N(0 , 0.5)
N(0 , 1)
N(0 , 2)
N(0 , 3)
EBLUP
SEBLUP
23.48
23.70
23.97
24.23
23.57
23.76
23.97
24.21
EBLUP
SEBLUP
23.41
23.60
23.81
23.96
23.48
23.65
23.80
23.92
EBLUP
SEBLUP
23.38
23.57
23.73
23.84
23.44
23.61
23.74
22.83
�=0.75
Transformasi
Logaritma
EBLUP
6.67
6.67
6.68
6.68
�=0.5
Transformasi
Logaritma
EBLUP
6.65
6.66
6.67
6.67
�=0.25
Transformasi
Logaritma
EBLUP
6.63
6.65
6.66
6.67
Transformasi
Logaritma
SEBLUP
6.61
6.63
6.65
6.65
Transformasi
Logaritma
SEBLUP
6.62
6.64
6.65
6.66
Transformasi
Logaritma
SEBLUP
6.62
6.64
6.66
6.66
Dari Tabel 3 dapat dilihat bahwa nilai rata- rata AKTG dengan �=0.75 dan
� = . pada penduga transformasi logaritma EBLUP dan transformasi logaritma
SEBLUP sekitar 6.6 dan untuk penduga EBLUP dan SEBLUP sekitar 23.
Perbedaan yang cukup besar antara penduga yang ditransformasi dengan penduga
yang tanpa dilakukan transformasi dimana rata- rata AKTG pada penduga yang
ditransformasi jauh lebih kecil. Hal ini mengindikasikan bahwa peubah yang
diperhatikan yang memiliki distribusi tidak normal akan lebih baik jika dilakukan
transformasi logaritma terlebih dahulu lalu. Langkah berikutnya adalah
memasukkan hasil transformasi ke metode pendugaan area kecil lalu dilakukan
transformasi balik. Dampak dari melakukan transformasi logaritma yaitu galat yang
dihasilkan lebih kecil jika dibandingkan dengan metode yang tanpa dilakukan
transformasi . Ketika � diganti dengan 1 ,2, dan 3 , maka akan menghasilkan nilai
rata- rata AKTG yang hampir sama dengan � = . .Kemudian, ketika nilai
autokorelasinya (� diganti dengan 0.5 atau 0.25 maka hasilnya juga akan hampir
sama dengan �=0.75 untuk nilai rata- rata AKTGR.
Pada Tabel 3 juga dapat dilihat bahwa nilai rata- rata AKTGR dengan �=0.75
dan � = . pada penduga transformasi logaritma SEBLUP yaitu, 6.61. Nilai
tersebut lebih kecil jika dibandingkan dengan penduga transformasi logaritma
EBLUP yang nilai rata- rata AKTG nya sebesar 6.67 . Hal yang serupa juga terjadi
15
ketika � sama dengan 1 ,2, atau 3 dan nilai autokorelasinya (� sama dengan 0.5
atau 0.25. Akan tetapi khusus untuk � = dan �=0.25 nilai rata-rata AKTG antara
penduga transformasi logaritma SEBLUP dan penduga transformasi logaritma
EBLUP hampir sama yakni 6.66 . Meskipun nilai rata-rata AKTG pada penduga
transformasi logaritma SEBLUP lebih kecil dibandingkan dengan penduga
transformasi logaritma EBLUP tetapi selisihnya sangat kecil. Oleh karena itu,
penduga transformasi logaritma SEBLUP dan penduga transformasi logaritma
EBLUP memiliki presisi dan akurasi yang hampir sama baiknya.
Penerapan
Metode yang telah dikembangkan ini diterapkan pada Survei Sosial
Ekonomi Nasional (SUSENAS) tahun 2010 dan Potensi Desa (PODES) tahun 2011
yang dikeluarkan oleh Badan Pusat Statistik (BPS). Peubah yang diamati pada
penelitian ini adalah rata-rata pengeluaran per kapita per bulan untuk kecamatan di
wilayah Kota dan Kabupaten Bogor.
(a)
(b)
Gambar 5 Normal quantile quantile plot (a) Y, pengeluaran per kapita per bulan
(Rupiah) dan (b) bentuk transformasi logaritma peubah Y
Peubah pengeluaran per kapita pada data SUSENAS 2010 digunakan
sebagai peubah yang diperhatikan (Y), yaitu rata-rata pengeluaran per kapita per
bulan. Data SUSENAS 2010 mencakup 44 tersurvei kecamatan dan 111
desa/kelurahan di Kota dan Kabupaten Bogor. Berdasarkan plot, secara visual dapat
terlihat pada Gambar 5(a) bahwa pada sebaran datanya banyak titik yang tidak
berada pada persekitaran garis. Hal ini dapat menjadi indikator bahwa asumsi
kenormalan belum terpenuhi. Setelah dilakukan transformasi logaritma pada
peubah Y maka asumsi kenormalan terpenuhi dan hal tersebut dapat dilihat pada
Gambar 5(b), sebaran data berada disekitar garis.
Selanjutnya pada peubah yang diperhatikan (Y) akan dilihat ketergantungan
spasialnya atau dengan kata lain, apakah terdapat autokorelasi spasial atau tidak.
Pengukuran autokorelasi spasial dapat dihitung menggunakan metode Moran’s
Index (Indeks Moran) yaitu:
16
�=
∑= ∑
(∑ = ∑
=
=
−̅ (
)∑ =
− ̅)
−̅
Untuk mengidentifikasi adanya autokorelasi spasial atau tidak, dilakukan uji
signifikansi indeks Moran.
Tabel 4 Hasil Uji Autokorelasi Spasial dengan Indeks Moran
∗
Peubah
=� �
Indeks Moran
0.28
0.44
3.51
5.05
�
Uji signifikansi indeks Moran didekati dengan distribusi normal baku sehingga
menghasilkan
� . Pada Tabel 4 dapat dilihat bahwa uji autokorelasi spasial
dengan menggunakan Indeks Moran terhadap peubah yang diperhatikan (Y)
menghasilkan nilai
� = . . Nilai
� = . > −� = .
sehingga
pada taraf 5% dapat dikatakan bahwa data tersebut memiliki autokorelasi spasial.
Kemudian untuk transformasi logaritma peubah yang diperhatikan (Y)
menghasilkan
� = . . Nilai
� = . > −� = .
sehingga pada
taraf 5% dapat dikatakan bahwa transformasi logaritma peubah yang diperhatikan
(Y) memiliki autokorelasi spasial.
Kemudian untuk pemilihan peubah penyerta pada penelitian ini, dipilih
beberapa peubah yang relevan (Lampiran 2). Peubah tersebut dianggap bisa
mempengaruhi transformasi logaritma dari rata-rata pengeluaran per kapita per
bulan (rupiah) (Log Y). Lalu dilakukan seleksi lagi dengan menggunakan regresi
stepwise pada peubah penyerta. Tujuannya untuk mencari model terbaik sehingga
bisa dijadikan model yang tepat untuk melakukan pendugaan area kecil. Peubah
penyerta yang terpilih adalah jumlah desa dengan sumber mata pencaharian utama
sebagian besar penduduk adalah pertanian (X1).
Tabel 5 Jumlah desa dengan sumber mata pencaharian utama sebagian besar
penduduk adalah pertanian (X1)
No.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
Kecamatan
Nanggung
Leuwiliang
Pamijahan
Cibungbulang
Ciampea
Dramaga
Ciomas
Tamansari
Cijeruk
Cigombong
Caringin
Ciawi
Cisarua
Megamendung
Sukaraja
Babakan Madang
Sukamakmur
Cariu
Tanjungsari
Jonggol
Cileungsi
Kelapa Nunggal
X1
10
7
15
11
5
7
1
3
8
7
8
5
4
7
6
4
10
9
10
12
5
6
No.
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
Kecamatan
Gunung Putri
Citeureup
Cibinong
Bojong Gede
Tajur Halang
Kemang
Ranca Bungur
Parung
Ciseeng
Gunung Sindur
Rumpin
Cigudeg
Sukajaya
Jasinga
Tenjo
Parung Panjang
Bogor Selatan
Bogor Timur
Bogor Utara
Bogor Tengah
Bogor Barat
Tanah Sereal
X1
0
3
0
0
1
6
5
2
10
7
10
11
9
12
7
3
3
0
0
0
2
0
17
Setelah melalui proses eksplorasi data, pendugaan area kecil dilakukan dengan
lima penduga yaitu : (1) Penduga Langsung, (2) EBLUP dengan menggunakan �̂
(EBLUP), (3) SEBLUP dengan menggunakan �̂ (SEBLUP) , (4) transfromasi balik
EBLUP dengan menggunakan �̂ (Transformasi Logaritma EBLUP), (5)
transformasi balik SEBLUP dengan menggunakan �̂ (Transformasi Logaritma
SEBLUP) dan adapun hasilnya sebagai berikut:
Tabel 6 Dugaan Area Kecil untuk rata-rata Pengeluaran Per Kapita Tingkat
Kecamatan di Kabupaten dan Kota Bogor (Ribu Rupiah) 2010
Penduga
NO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
KEC
Nanggung
Leuwiliang
Pamijahan
Cibungbulang
Ciampea
Dramaga
Ciomas
Tamansari
Cijeruk
Cigombong
Caringin
Ciawi
Cisarua
Megamendung
Sukaraja
Babakan madang
Sukamakmur
Cariu
Tanjungsari
Jonggol
Cileungsi
Kelapa nunggal
Gunung putri
Citeureup
Cibinong
Bojong gede
Tajur halang
Kemang
Ranca bungur
Parung
Ciseeng
Gunung sindur
Rumpin
Cigudeg
Sukajaya
Jasinga
Tenjo
Parung panjang
Bogor selatan
Bogor timur
Bogor utara
Bogor tengah
Bogor barat
Tanah sereal
Langsung
194.56
359.44
255.51
292.93
472.09
465.98
961.73
463.16
483.18
406.61
586.33
613.77
557.76
499.37
661.43
983.40
291.76
306.95
325.55
363.68
740.22
256.29
1607.44
519.88
764.40
715.99
943.12
730.15
293.12
579.79
391.18
574.27
394.96
363.28
315.04
442.95
311.82
248.64
633.36
961.36
746.92
773.64
568.22
556.25
EBLUP
194.64
361.22
255.56
293.31
475.68
465.60
940.88
464.11
481.36
406.66
581.98
613.04
558.16
486.11
658.96
759.63
291.77
307.28
325.07
363.71
736.70
256.81
1357.89
523.81
764.87
718.50
917.75
706.99
294.49
582.12
390.98
566.89
395.01
363.95
314.80
442.46
312.31
250.13
634.58
941.35
748.43
774.73
569.16
559.05
SEBLUP
194.64
361.00
255.54
293.28
475.39
465.51
939.24
464.20
481.39
406.98
582.18
614.31
558.27
487.24
658.99
758.46
291.78
307.32
325.10
363.73
737.20
256.93
1353.59
524.26
765.09
718.65
917.40
706.32
294.50
582.67
391.00
566.86
394.95
363.73
314.77
442.34
312.19
250.09
634.83
940.43
748.25
774.10
569.15
559.00
TL EBLUP
188.38
309.50
245.01
280.88
422.77
414.34
813.63
439.41
457.75
365.46
485.34
490.12
509.43
404.03
596.48
577.05
282.10
294.25
298.61
343.33
663.43
247.57
946.33
472.01
718.45
657.48
837.78
653.30
270.32
552.83
383.77
503.12
375.30
325.59
294.61
403.57
282.48
242.16
528.60
703.55
614.44
658.60
509.80
483.22
TL
SEBLUP
188.40
307.55
244.91
280.61
421.32
414.75
809.70
439.99
458.19
368.84
486.05
494.69
509.05
408.19
597.93
578.81
282.25
294.60
298.29
343.39
662.89
248.44
940.53
472.16
718.63
658.70
838.27
650.66
272.55
557.42
383.94
503.44
374.54
323.26
293.72
401.57
281.68
241.78
529.25
706.61
613.84
656.37
509.86
483.50
18
Dari Tabel 6 dapat dilihat bahwa seluruh penduga memperlihatkan
kecamatan Gunung Putri memiliki rata-rata pengeluaran per kapita tertinggi
dibandingkan dengan kecamatan yang lain. Sedangkan, kecamatan yang diduga
memilki rata-rata pengeluaran per kapita terendah adalah kecamatan Nanggung.
Hal tersebut dikarenakan oleh pengaruh jumlah desa dengan sumber mata
pencaharian utama sebagian besar penduduk adalah pertanian pada kecamatan
Nanggung cukup tinggi sedangkan pada kecamatan Gunung Putri jumlah desa
untuk peubah tersebut adalah nol.
Tabel 7 Dugaan area kecil untuk selang kepercayaan 95% rata-rata Pengeluaran Per
Kapita Tingkat Kecamatan di Kabupaten dan Kota Bogor (Ribu Rupiah)
2010
Selang kepercayaan 95%
No.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
Kec.
Nanggung
Leuwiliang
Pamijahan
Cibungbulang
Ciampea
Dramaga
Ciomas
Tamansari
Cijeruk
Cigombong
Caringin
Ciawi
Cisarua
Megamendung
Sukaraja
Babakan Madang
Sukamakmur
Cariu
Tanjungsari
Jonggol
Cileungsi
Kelapa Nunggal
Gunung Putri
Citeureup
Cibinong
Bojong Gede
Tajur Halang
Kemang
Ranca Bungur
Parung
Ciseeng
Gunung Sindur
Rumpin
Cigudeg
Sukajaya
Jasinga
Tenjo
Parung Panjang
Bogor Selatan
Bogor Timur
Bogor Utara
Bogor Tengah
Bogor Barat
Tanah Sereal
Langsung
BA
BB
203.23
185.90
404.92
313.95
266.39
244.63
309.65
276.21
524.47
419.70
511.52
420.43
1067.84
855.61
491.21
435.12
520.85
445.52
464.17
349.04
647.18
525.48
723.35
504.19
604.14
511.38
601.69
397.04
713.60
609.26
1333.55
633.24
305.19
278.33
335.91
277.98
365.96
285.14
387.78
339.58
789.39
691.06
277.81
234.77
1819.39 1395.48
568.11
471.64
800.56
728.23
771.08
660.91
1059.21
827.04
820.44
639.85
323.86
262.38
626.47
533.12
405.52
376.84
653.06
495.49
412.58
377.33
394.97
331.59
350.95
279.13
492.65
393.25
334.36
289.27
267.59
229.70
688.52
578.19
1080.98
841.74
800.46
693.37
837.86
709.42
592.52
543.92
590.27
522.24
EBLUP
BA
203.25
404.85
266.45
309.72
523.75
511.21
1056.46
490.94
520.69
463.87
646.32
718.09
603.27
599.50
712.48
1223.64
305.23
336.02
366.22
387.92
788.07
277.83
1741.48
567.14
799.47
768.69
1045.81
816.36
323.80
625.31
405.54
651.33
412.61
395.15
351.11
492.99
334.38
267.55
686.88
1065.73
798.11
834.35
592.22
589.56
BB
185.92
313.97
244.69
276.29
419.11
420.21
845.37
434.86
445.42
348.91
524.83
500.19
510.61
395.86
608.27
561.65
278.37
278.12
285.46
339.73
689.85
234.79
1326.53
470.78
727.19
658.68
815.14
636.47
262.35
532.06
376.86
494.23
377.37
331.80
279.33
393.70
289.30
229.66
576.70
828.12
691.17
706.17
543.64
521.57
SEBLUP
BA
BB
203.61
185.66
398.43
319.37
257.23
253.76
298.70
287.17
498.96
442.47
469.02
466.40
972.59
877.05
488.68
440.09
502.04
463.12
455.87
360.97
640.15
525.10
674.01
568.50
574.65
538.47