Pemodelan Data Panel Spasial Menggunakan Model Sur-Sar Dengan Pendekatan Bayesian.

PEMODELAN DATA PANEL SPASIAL MENGGUNAKAN
MODEL SUR-SAR DENGAN PENDEKATAN BAYESIAN

HILMAN DWI ANGGANA

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul Pemodelan Data Panel
Spasial Menggunakan Model SUR-SAR dengan Pendekatan Bayesian adalah
benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan
dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang
berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari
penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di
bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.

Bogor, Januari 2016
Hilman Dwi Anggana
NIM G151130231

RINGKASAN
HILMAN DWI ANGGANA. Pemodelan Data Panel Spasial Menggunakan
Model SUR-SAR dengan Pendekatan Bayesian. Dibimbing oleh ASEP
SAEFUDDIN dan BAGUS SARTONO.
Seemingly Unrelated Regression (SUR) adalah sebuah sistem model yang
merupakan perluasan dari model regresi umum ketika terjadi permasalahan
adanya hubungan antar model individu yang dibangun secara simultan. SUR
merupakan hasil penelitian Zellner (1962) yang pertama mengakomodasi masalah
hubungan antar model individu terhadap efisiensi pendugaan parameter dan
informasi yang diperoleh. Konsep SUR telah banyak dikembangkan, salah
satunya dalam kajian statistika spasial (Anselin 1988).
Pada penelitian ini dikaji model individu yang merupakan regresi
otoregresif spasial (SAR) yang dibangun berdasarkan tahun yang berbeda.
Adanya hubungan model-model SAR ini diakomodasi dengan model SUR
sehingga menjadi model SUR-SAR berdasarkan data panel spasial. Permasalahan
yang dihadapi model SUR-SAR tidak hanya terbatas pada hubungan model-model

individu penyusunnya, tetapi juga terkait permasalahan metode/pendekatan
pendugaan parameternya yang memberikan solusi yang tidak closed form dan
sulitnya menentukan pengujian parameter secara statistik. Pendekatan Bayesian
merupakan salah satu metode pendugaan parameter yang dapat mengatasi
permasalahan tersebut karena lebih praktis (Griffiths 2001) dan secara statistika
memiliki banyak keuntungan (LeSage 2005).
Kajian model SUR-SAR dengan pendekatan Bayesian ini merupakan kajian
empiris pada data kejadian DBD dan faktor-faktor penyertanya dari 68 kelurahan
di Kota Bogor tahun 2009 - 2011. Proses pendugaan parameter dilakukan
menggunakan algoritma Gibbs Sampler dan Metropolis-Hasting melalui simulasi
Markov Chain Monte Carlo (MCMC) sampai tercapainya konvergen dalam hal
stasioneritas sebaran posterior parameter model. Berdasarkan analisis diperoleh
hasil bahwa otokorelasi spasial lag, kontribusi peubah prediktor yang berubah
setiap tahun, dan korelasi model individu (tahunan) dapat ditangkap oleh model
SUR-SAR yang didukung oleh data. Model SUR-SAR merupakan model yang
lebih baik daripada model-model individu SAR dalam mengepas data DBD Kota
Bogor 2009-2011 karena lebih efisien dalam menduga parameter dan memiliki
derajat kecocokan model yang lebih tinggi.
Kata kunci: DBD, Panel Spasial, Regresi Otoregresif Spasial, Seemingly
Unrelated Regression, Markov Chain Monte Carlo


SUMMARY
HILMAN DWI ANGGANA. Spatial Panel Data Modeling Using SUR-SAR
Model with Bayesian Approach. Supervised by ASEP SAEFUDDIN and BAGUS
SARTONO.
The Seemingly Unrelated Regression (SUR) is a model system that found
by Zellner (1962). The idea of using this model system is to accommodate the
problems from relationship among the individual model which built
simultaneously. The problems are the efficiency of parameter estimation and the
obtained information. SUR concept has been developed, one of them in the study
of spatial statistics (Anselin 1988).
In this study, the individual models are spatial lag regression or spatial
autoregressive models (SAR) which built by different years. The relationship
among SAR models is accommodated by the model so that it becomes SUR-SAR
model based on spatial panel data. The problems faced by SUR-SAR models are
not just limited to the relationship of individual models, but also the problem
related to a method/approach on the parameter estimation that provide a closed
form solution and has exact statistical test. Bayesian approach is one of the
parameter estimation method that can overcome these problems due to more
practical (Griffiths 2001) and statistically has many advantages (Lesage 2005).

The study of SUR-SAR model with the Bayesian approach is an empirical
study on Dengue Hemorrhagic Fever (DHF) data from 68 villages in the city of
Bogor during 2009 - 2011. The process of parameter estimation was performed by
Markov Chain Monte Carlo (MCMC) simulation with Metropolis-Hasting and
Gibbs Sampler algorithms until convergence in stationerity posterior distribution.
The analysis showed that the spatial lag autocorrelation, the contributions of
predictor variables which varies every year, and the correlation of individual
models (yearly) could be captured by SUR-SAR models and then supported by
the data. The SUR-SAR model was better than the individual SAR models in
fitting DHF data of Bogor during 2009 - 2011 due to had higher level of the
efficiency of parameter estimation and the goodnes of fit model.
Keywords: DHF, Seemingly Unrelated Regression, Spatial Autoregressive Model,
Spatial Panel, Markov Chain Monte Carlo

© Hak Cipta Milik IPB, Tahun 2016
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan

IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apa pun tanpa izin IPB

PEMODELAN DATA PANEL SPASIAL MENGGUNAKAN
MODEL SUR-SAR DENGAN PENDEKATAN BAYESIAN

HILMAN DWI ANGGANA

Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains
pada
Program Studi Statistika

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016


Penguji Luar Komisi pada Ujian Tesis :

Dr Ir Kusman Sadik, MSi

Judul Tesis : Pemodelan Data Panel Spasial Menggunakan Model SUR-SAR
dengan Pendekatan Bayesian
Nama
: Hilman Dwi Anggana
NIM
: G151130231

Disetujui oleh
Komisi Pembimbing

Prof Dr Ir Asep Saefuddin, MSc
Ketua

Dr Bagus Sartono, SSi MSi
Anggota


Diketahui oleh

Ketua Program Studi
Statistika

Dekan Sekolah Pascasarjana

Dr Ir Kusman Sadik, MSi

Dr Ir Dahrul Syah, MScAgr

Tanggal Ujian:
9 November 2015

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga tesis berjudul Pemodelan Data Panel Spasial
Menggunakan Model SUR-SAR dengan Pendekatan Bayesian ini berhasil

diselesaikan.
Terima kasih penulis ucapkan kepada Bapak Prof Dr Ir Asep Saefuddin,
MSc dan Bapak Dr Bagus Sartono, SSi MSi, selaku pembimbing, atas kesediaan
dan kesabaran untuk membimbing dan membagi ilmunya kepada penulis dalam
penyusunan tesis ini. Terimakasih kepada Bapak Dr Ir Kusman Sadik, MSi selaku
penguji luar komisi pembimbing. Ucapan terima kasih juga penulis sampaikan
sebesar-besarnya kepada seluruh Dosen Departemen Statistika IPB yang telah
mengasuh dan mendidik penulis selama di bangku kuliah hingga berhasil
menyelesaikan studi, serta seluruh staf Departemen Statistika IPB atas bantuan,
pelayanan, dan kerjasamanya selama ini.
Ucapan terima kasih yang tulus dan penghargaan yang tak terhingga juga
penulis ucapkan kepada kedua orangtua penulis Bapak Tatang Sasmita dan Ibu
Imas Lilis Heryani yang telah membesarkan dan mendidik penulis dengan penuh
kasih sayang demi keberhasilan penulis selama menjalani proses pendidikan, juga
kakak penulis Riska Liestiana serta seluruh keluarga penulis atas doa dan
semangatnya.
Terakhir tak lupa penulis juga menyampaikan terima kasih kepada seluruh
mahasiswa Pascasarjana Departemen Statistika atas segala bantuan dan
kebersamaannya selama menghadapi masa-masa terindah maupun tersulit dalam
menuntut ilmu, serta semua pihak yang telah banyak membantu dan tak sempat

penulis sebutkan satu per satu.
Semoga tesis ini dapat bermanfaat bagi semua pihak yang membutuhkan.

Bogor, Januari 2016
Hilman Dwi Anggana

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

1 PENDAHULUAN

Latar Belakang
Tujuan Penelitian

1
1
2

2 TINJAUAN PUSTAKA
Seemingly Unrelated Regression
Seemingly Unrelated Regression-Spatial Autoregressive Model
Bayesian Model
Markov Chain Monte Carlo
Algoritma Metropolis-Hasting
Algoritma Gibbs Sampler
Model Regresi Spasial dengan Pendekatan Bayesian
Bayesian Seemingly Unrelated Regression-Spatial Autoregressive Model
Diagnostik Konvergensi MCMC
Galat Baku Monte Carlo
Deviance Information Criterion


2
2
4
6
7
7
8
9
12
14
15
15

3 METODE PENELITIAN
Data
Metode Analisis Data

16
16
17

4 HASIL DAN PEMBAHASAN
Hubungan antar Model-model Individu
Penduga Model SUR-SAR dengan MCMC
Diagnostik Konvergensi MCMC
Ringkasan Statistik Posterior
Pengujian Keberartian Parameter Model
Evaluasi Model Hasil Simulasi MCMC
Perbandingan Model SUR-SAR dan Model Individu SAR
Nilai Dugaan Model SUR dan Model Individu
Analisis Efisiensi Pendugaan Parameter Melalui GBMC

19
19
19
19
21
22
23
24
24
25

5 SIMPULAN DAN SARAN
Simpulan
Saran

26
26
26

DAFTAR PUSTAKA

28

LAMPIRAN

30

RIWAYAT HIDUP

57

DAFTAR TABEL
1
2
3
4
5
6
7

Korelasi sisaan model-model individu
Uji Geweke hasil simulasi MCMC
Statistik posterior hasil simulasi MCMC
Statistik DIC
Galat baku posterior dan galat baku Monte Carlo hasil simulasi MCMC
Penduga parameter model SUR-SAR dan model individu SAR
GBMC SUR-SAR (A) dan GBMC individu SAR

19
20
21
22
23
24
25

DAFTAR GAMBAR
1 Peta Kota Bogor
2 Diagram alir simulasi MCMC

16
18

DAFTAR LAMPIRAN
1
2
3
4
5

Penurunan Sebaran Posterior Bersyarat Model Bayesian SAR
Penurunan Sebaran Posterior Bersyarat Model Bayesian SUR-SAR
Plot diagnostik simulasi MCMC model SUR-SAR
Matriks W queen contiguity kelurahan di Kota Bogor
Kode nomor kelurahan di Kota Bogor pada matriks bobot spasial W

30
35
40
52
56

1

1 PENDAHULUAN
Latar Belakang
Analisis regresi adalah sebuah analisis statistika yang digunakan untuk
mengkaji pola hubungan antar peubah. Pada beberapa kasus ekonometrika, sering
terjadi kasus pendugaan banyak model individu (model regresi) secara simultan.
Pendugaan model regresi secara simultan ini dapat menimbulkan isu terdapatnya
hubungan antar model regresi tersebut seperti halnya konsep pengukuran beberapa
peubah secara simultan pada analisis peubah ganda yang mengasumsikan antar
peubah saling berhubungan (Tim 2002 dan Sun et al. 2014).
Seemingly Unrelated Regression (SUR) yang diajukan oleh Zellner (1962)
adalah sebuah sistem model yang merupakan perluasan dari model regresi linier
yang dapat mengakomodasi hubungan antar model individu melalui struktur
hubungan antar galat model individunya (Sun et al. 2014). Felmlee dan Hargens
(1988) menunjukkan bahwa model SUR dapat mengatasi masalah efisiensi
pendugaan parameter dan informasi dari data yang hilang pada model-model
individu yang memiliki hubungan kesebayaan (contemporaneous correlation)
melalui nilai galat baku penduga parameter model SUR yang nilainya lebih kecil
dari galat baku penduga parameter model-model individunya. Pada kajian
statistika spasial, model SUR telah banyak dikembangkan, diantaranya penelitian
yang dilakukan oleh Wang dan Kockelman (2007), Zou dan Kockelman (2009),
dan Kakamu et al. (2011).
Model SUR digunakan pada data panel spasial dengan membangun modelmodel yang terdiri dari sebuah model regresi spasial pada setiap periode waktu
yang diduga untuk sebuah data cross section dari unit-unit spasialnya (Anselin
1988). Keuntungan penggunaan model SUR dalam model-model data panel
adalah memerhatikan aspek waktu yang memiliki parameter yang nilainya
berubah (time varying parameters) sehingga hal ini berguna bagi peneliti yang
tertarik dengan dinamika dari parameter (Kakamu et al. 2011). Walaupun analisis
data panel spasial berkembang pesat dalam beberapa area penelitian, model-model
panel spasial jarang digunakan dalam ekonometrika. Salah satu alasannya adalah
kesulitan mengevaluasi fungsi kemungkinan dari model (Kakamu et al. 2011)
Pendugaan parameter pada model SUR memiliki masalah yaitu solusi yang
dihasilkan merupakan solusi dalam bentuk persamaan yang tidak closed form
sehingga untuk mendapatkan solusinya memerlukan pendekatan analisis numerik
yang relatif rumit (Kakamu et al. 2011). Masalah lainnya terkait metode
pendugaan parameter adalah solusi numerik yang diperoleh sering menghasilkan
statistik yang tidak dapat diuji karena sulitnya menemukan formulasi uji statistik.
Salah satu alternatif praktis pendekatan pendugaan parameter yang digunakan
untuk model SUR adalah dengan menggunakan metode pendugaan Bayesian
(Griffiths 2001). Hal pendukung lainnya, ada beberapa keuntungan penggunaan
pendekatan Bayesian dalam pemodelan regresi spasial yang dikemukakan oleh
LeSage (2005), diantaranya adalah: pendekatan Bayesian dapat menemukan solusi
dari permasalahan pengujian hipotesis dalam pendekatan kemungkinan
maksimum yang dihitung secara numerik, mengurangi keketatan asumsi ragam

2
galat yang konstan pada metode kemungkinan maksimum, dan fleksibel dalam
perbandingan antar model.
Berdasarkan uraian di atas, menjadi hal yang menarik untuk mengkaji
model berbasis SUR pada data panel spasial seperti yang diungkapkan (Anselin
1988) menggunakan pendekatan Bayesian, dalam hal ini model spasial yang
digunakan adalah model otoregresif spasial /spatial autoregressive model (SAR)
yang diterapkan pada data kejadian DBD Kota Bogor tahun 2009-2011.
Tujuan Penelitian
Pada umumnya tujuan utama penelitian ini adalah untuk memberikan
khazanah baru pengembangan model regresi spasial (SAR) yang saling
berhubungan pada data panel spasial berdasarkan masalah efisiensi pemodelan
dan kepraktisan pendekatan pendugaan parameter model. Tujuan utama tersebut
diperinci kedalam tujuan khusus berikut ini :
1. Mengkaji penggunaan sistem SUR untuk data panel spasial melalui model
pembangun regresi SAR dengan pendekatan Bayesian yang diterapkan
pada data kejadian DBD Kota Bogor 2009 -2011.
2. Mengevaluasi kelayakan model yang dihasilkan melalui proses simulasi
berdasarkan konvergensi MCMC, efisiensi pendugaan model, dan
kecocokan model.

2 TINJAUAN PUSTAKA
Seemingly Unrelated Regression
Andaikan sebuah sistem model regresi dibangun dari M model regresi (M
peubah respon) dengan setiap model mempunyai n unit pengamatan yang sama,
,
vektor peubah respon dalam sistem dinotasikan dengan
matriks-matriks rancangan berisi peubah prediktor dari setiap model dalam sistem
berurutan adalah X1,X2,...,Xm. Sistem model dari M model regresi ini ditulis
(Zellner 1962) :

(1)

Berdasarkan sistem model yang diberi nama Seemingly Unrelated
Regression (SUR) ini maka akan terdapat M model regresi dan n unit pengamatan
pada data contoh yang digunakan untuk menduga parameter model. Model SUR
disajikan dalam bentuk umum untuk setiap model regresi (Zellner 1962) :
(2)

3
dengan
adalah vektor peubah respon berukuran
,
adalah matriks
rancangan yang bersifat non stokastik berukuran
,
menyatakan
banyaknya peubah prediktor yang dimasukkan pada model ke-m,
adalah
vektor koefisien regresi yang sifatnya tidak diketahui berukuran
dan
adalah vektor galat berukuran
.
Sistem model regresi dalam bentuk vektor-matriks model regresi yang
umum ditulis
(3)
Untuk model sistem SUR, model regresi secara umum ini berisi vektor-matriks
sebagai berikut

)

)

)

(4)

Zellner (1962) mengasumsikan bahwa M model akan memiliki hubungan
kesebayaan yang dinyatakan melalui struktur ragam-peragam galat model sistem
SUR pada persamaan (5) dan persamaan (6) berikut
|

(5)
|

(6)

Struktur ragam-peragam galat model SUR yaitu Ω merupakan matriks
definit positif yang dibangun berdasarkan nilai ragam-peragam galat model
individunya. Andaikan εm adalah vektor galat model ke-m dan
adalah vektor
galat model ke- , peragam keduanya dinotasikan
dengan
|

(7)

Model SUR tetap mempertahankan asumsi antar pengamatan saling bebas
sehingga nilai peragam galat antar unit pengamatan bernilai nol. Berdasarkan hal
ini ragam-peragam galat model SUR dapat ditulis

)
dengan adalah matriks identitas berukuran
positif yang dapat ditulis sebagai

(8)

dan Σ adalah matriks definit

4

)

(9)

Proses pendugaan parameter model sangat bergantung kepada matriks Ω.
Apabila nilai Ω diketahui, penduga generalized least square (GLS) atau metode
kuadrat terkecil terampat (MKTT) dari model SUR adalah
̂

(10)

akan tetapi pada prakteknya Ω tidak diketahui dan harus diduga dari data (Baltagi
2008). Pendugaan parameter dilakukan dengan feasible generalized least square
(FGLS) melalui prosedur 3 stage least square (3SLS) atau kuadrat terkecil tiga
tahap. Baltagi (2008) menjelaskan langkah-langkah pendugaan ini sebagai
berikut :
1. Lakukan pendugaan parameter yaitu dengan mencari ̂ menggunakan
metode kuadrat terkecil terhadap M model regresi, untuk m = 1,2,..,M.
̂ , untuk m =
2. Dari setiap model tentukan vektor sisaannya : ̂
1,2,..,M.
3. Untuk m,m’ = 1,2,…M, duga matriks ragam-peragam antar galat model regresi
yaitu hitung ̂ melalui :
̂ ̂ ⁄
.
i. Penduga ragam untuk setiap model regresi yaitu ̂
ii. Penduga
peragam
untuk
setiap
dua
model
yaitu
̂ ̂ ⁄(
.
̂
̂ .
4. Hitung ̂ ̂
sehingga diperoleh : ̂
( ̂
5. Nilai ̂ dapat dicari lagi menggunakan nilai-nilai sisaan hasil dugaan model
pada langkah 4 sampai diperoleh nilai yang konvergen sehingga prosedur ini
kadang disebut juga prosedur pendugaan model SUR iteratif.
Seemingly Unrelated Regression – Spatial Autoregressive Model
Regresi otoregresif spasial atau spatial autoregressive model (SAR) adalah
model regresi biasa dengan penambahan pengaruh spasial pada peubah responnya.
Model-model regresi spasial dapat memiliki hubungan kesebayaan. Anselin
(1988) mengenalkan konsep SUR spasial terhadap model-model regresi spasial
yang dibangun masing-masing untuk satu periode waktu tertentu. Andaikan
terdapat T periode waktu, sistem model SUR dari model regresi SAR ditulis

(11)

dengan mengasumsikan

|

5
Persamaan (11) dapat ditulis ulang dalam bentuk
(12)
dengan memisalkan
dan
ditransformasi menjadi model regresi umum sebagai berikut

, persamaan (12)

(13)
dengan y* adalah vektor peubah respon yang sudah ditransformasi berukuran
, P adalah matriks diagonal dengan nilai-nilai diagonalnya ρ1, ρ2,..., ρT
berukuran T×T, W adalah matriks pembobot spasial berukuran n×n, X adalah

matriks rancangan non stokastik berukuran
,
menyatakan
banyaknya peubah prediktor yang dimasukkan pada model ke-t, β adalah vektor
koefisien regresi yang tidak diketahui berukuran ∑
, dan ε adalah
vektor galat berukuran
.
Adanya hubungan antar model regresi SAR yang disajikan dalam sistem
model SUR-SAR dinyatakan melalui matriks ragam-peragam galat model SUR
yaitu

)

(14)


adalah galat model SUR-SAR yang sudah
Jika
dibakukan, Anselin (1988) menyatakan fungsi kepekatan peluang vektor v dapat
ditulis dalam bentuk sebaran normal ganda baku sebagai berikut



{

(15)

}

Dengan demikian, fungsi kemungkinan bagi model SUR-SAR adalah (Anselin
1988)

|

| |





| |

| |



{

| |

{

}

}

dengan
.
Logaritma natural dari fungsi kemungkinan model SUR-SAR yaitu
sebagai berikut

|

(16)

ditulis

6
|

| |

| |



| |

| |
|

{

| |

{

|

{

}

}
} (17)

Penduga kemungkinan maksimum untuk parameter model SUR-SAR ini
|
dilakukan dengan memaksimumkan fungsi
terhadap parameter yang
diduga melalui optimasi secara numerik. Metode pendugaan parameter lainnya
adalah dengan menggunakan instrumental variables (IV) dan metode kuadrat
terkecil tiga tahap (MKTTT) atau sering disebut FGLS (Anselin, 1988). Metode
kemungkinan maksimum, IV, dan FGLS semuanya memberikan solusi yang tidak
closed form sehingga diperlukan analisis numerik secara iteratif (Anselin 1988
dan Kakamu et al. 2011).
Bayesian Model

Pendekatan Bayesian berbeda dengan pendekatan statistika klasik yang
mengasumsikan bahwa parameter adalah suatu nilai tidak diketahui yang sifatnya
tetap. Chen et al. (2000) dan Gelman et al. (2004) menyebutkan bahwa
pendekatan ini didasarkan pandangan subjektif dari peluang, ketidakpastian
mengenai sesuatu yang tidak diketahui (parameter) dapat diekspresikan dengan
menggunakan aturan peluang melalui optimalisasi informasi dari parameter
(prior) dan informasi dari data (fungsi kemungkinan). Sebaran prior
mengekspresikan informasi yang tersedia bagi peneliti sebelum data dimasukkan
ke dalam analisis. Oleh karena itu, sebaran prior yang digunakan dalam model
berbasis Bayesian harus ditentukan terlebih dahulu sebelum melakukan
pemodelan (Hajarisman 2013).
Jika θ adalah parameter model dan D adalah data pengamatan, berdasarkan
teori Bayes sebaran posterior bagi θ bersyarat D ditulis (Chen et al. 2000) :
|

|

|

(18)

|
|
dengan
merupakan informasi dari data pengamatan setelah
memasukan parameter model θ, informasi ini sering disebut juga sebagai fungsi
kemungkinan dari parameter model,
merupakan sebaran prior bagi θ.
Penentuan sebaran prior merupakan hal yang sangat penting dalam modelmodel berbasis Bayesian. Namun, pada umumnya sebaran prior ini tidak diketahui
sehingga kita perlu menspesifikasikan sebaran prior yang tidak akan berpengaruh
terhadap sebaran posterior (Hajarisman 2013). Biasanya pada kasus seperti ini
sering digunakan sebaran prior noninformative. Namun, tidak pada semua kasus,
penggunaan sebaran prior noninformative memberikan hasil inferensi pada
sebaran posterior menjadi valid karena sebaran posterior menjadi improper (hasil
integrasi menjadi tak hingga) diakibatkan sebaran prior yang improper (Ntzoufras
2009).

7
Untuk memudahkan dan menyederhanakan proses inferensi Bayes ketika
tidak ada informasi yang diketahui secara pasti mengenai parameter
(noninformative) digunakan sebaran prior conjugate (Gamerman & Lopes, 2006).
Menurut Ntzoufras (2009), sebaran prior conjugate merupakan sebaran yang
memberikan sebaran prior dan posterior yang berasal dari keluarga sebaran yang
sama. Sebuah sebaran prior adalah anggota dari keluarga sebaran S dengan
| jika menghasilkan sebaran
parameter α adalah conjugate terhadap sebaran
| yang juga anggota dari keluarga sebaran yang sama. Dengan
posterior
|
̃ dengan α dan ̃ adalah
demikian jika
, maka
parameter dari sebaran prior dan posterior.
Penarikan contoh acak dilakukan dengan menggunakan sebaran posterior
bersyarat bagi masing-masing parameter dan pendugaan parameter dilakukan
dengan menghitung rataan posterior bersyarat dari parameter yang menjadi fokus
perhatian dalam model (Carlin & Louis, 2000). Gilks et al. (1996) dan Ntzoufras
(2009) mengatakan bahwa proses penarikan contoh acak dari sebaran posterior
bersyarat melibatkan integrasi dan komputasi yang rumit sehingga dilakukan
simulasi dengan Markov Chain Monte Carlo (MCMC).
Markov Chain Monte Carlo
Menurut Gilks et al. (1996), Markov Chain Monte Carlo (MCMC) pada
model berbasis pendekatan Bayesian adalah teknik simulasi yang digunakan untuk
membangkitkan contoh acak secara berurutan dari sebaran posterior bagi
parameter model. Ide simulasi MCMC pada model-model Bayesian berawal dari
permasalahan integrasi multidimensi yang tidak bisa diselesaikan secara analitik
biasa pada pencarian momen-momen (nilai harapan dan ragam) dari sebaran
posteriornya. Teknik MCMC mengkonstruksi contoh-contoh acak dari sebaran
posterior sebagai rantai Markov yang konvergen pada sebaran target (stasioner)
sehingga prosesnya dilakukan secara iteratif yang mana contoh yang dibangkitkan
bergantung pada satu nilai sebelumnya. Dua algoritma popular yang sering
digunakan dalam simulasi MCMC adalah algoritma Metropolis-Hasting dan
algoritma Gibbs Sampler (Ntzoufras 2009).
Algoritma Metropolis-Hasting
Algoritma Metropolis-Hasting biasanya digunakan ketika bentuk sebaran
posterior dari parameter yang menjadi perhatian penelitian mempunyai bentuk
yang tidak pasti sehingga dalam proses pembangkitan contoh acak parameter
memerlukan sebaran kandidat (Chen et al. 2000; Gamerman & Lopes 2006;
Ntzoufras 2009). Misalkan, untuk setiap tahap ke-s , contoh acak pada tahap
selanjutnya (
merupakan sebuah nilai kandidat
yang berasal dari
| . Sebaran kandidat ini mungkin dapat bergantung kepada
sebaran kandidat
| dan
| berurutan menyatakan sebaran posterior
nilai saat ini θ. Jika
bersyarat (biasanya berbentuk nilai hampiran) dari nilai kandidat dan nilai saat ini,
sebuah nilai kandidat
hasil pembangkitan dengan menggunakan sebaran
kandidat akan dievaluasi dengan menggunakan peluang penerimaan
dengan

8
|

|

|

|

(19)

jika nilai kandidat diterima, nilai contoh acak pada tahap selanjutnya menjadi
. Sedangkan jika nilai kandidat ditolak, nilai contoh acak pada tahap
selanjutnya menjadi
.
Ntzoufras (2009) meringkas algoritma Metropolis-Hasting dalam inferensi
Bayesian sebagai berikut :
1) Tentukan nilai inisiasi
.
2) Untuk s=1,2,…S , ulangi langkah-langkah berikut :
a. Tetapkan
b. Bangkitkan nilai kandidat parameter
yang berasal dari sebuah
|
sebaran kandidat
|

c. Hitung

|

|

|

d. Ganti
dengan peluang
; selainnya tetapkan
.
Salah satu kasus dari algoritma Metropolis-Hasting terjadi ketika nilai
|
|
sebaran kandidat yang simetris, yang mana berlaku
|
| . Algoritma Metropolis-Hasting pada kasus ini sering disebut dengan
algoritma Random-walk Metropolis dengan ciri utama peluang penerimaan
hanya bergantung kepada sebaran posterior target (Gamerman & Lopes
2006).
Algoritma Gibbs Sampler
Algoritma Gibbs sampler adalah kasus khusus lainnya dari algoritma
Metropolis-Hasting yang mana peluang penerimaan
selalu bernilai satu
untuk setiap iterasi sehingga contoh acak yang dibangkitkan (nilai kandidat) selalu
diterima sebagai contoh acak baru pada semua iterasi (Ntzoufras 2009). Pada
umumnya sebaran posterior bersyarat dari parameter yang sedang diperhatikan
dalam model berbasis Bayesian menggunakan algoritma ini memiliki bentuk
sebaran posterior bersyarat yang pasti.
Jika sebuah vektor parameter
(
dan nilai inisiasi yang

, untuk iterasi s = 1, 2,…, S, maka

diberikan

algoritma Gibbs sampler membangkitkan
(Gamerman & Lopes 2006 dan Hoff 2009) :
1) Bangkitkan

2) Bangkitkan
3) Bangkitkan
p) Bangkitkan

|

|

|

|

dari

sebagai berikut

9
sehingga algoritma Gibbs sampler ini akan memiliki vektor berurutan yang
memiliki hubungan sebagai berikut :

Untuk setiap tahap,
bergantung kepada
hanya
melalui
sehingga
bebas bersyarat
jika diberikan
. Sifat ini merupakan sifat dari rantai Markov sehingga semua contoh acak
berurutan pada algoritma Gibbs sampler merupakan sebuah rantai Markov.
Model Regresi Spasial dengan Pendekatan Bayesian
Menurut LeSage (1997), terdapat dua isu permasalahan pendugaan model
regresi spasial menggunakan pendekatan Bayesian melalui simulasi MCMC.
Kasus pertama adalah ketika semua sebaran posterior bersyarat bentuknya pasti
dan diketahui, misalkan bentuk sebaran posterior bersyarat bagi parameter
koefisien regresi adalah sebuah sebaran normal. Sebagai teladan, andaikan sebuah
model mempunyai parameter yang sedang diperhatikan adalah β dan σ2, dengan
sebaran posterior bersyarat bagi masing-masing parameter berurutan adalah
sebaran normal ganda dan sebaran invers-Gamma. Memulai dengan sebuah nilai
inisiasi untuk β, sebuah contoh acak dari sebaran invers-Gamma dibangkitkan,
misalkan hasil bangkitannya adalah ̂
, yang digunakan untuk membangkitkan
̂ menggunakan sebaran normal ganda, nilai ̂
kemudian digunakan untuk
membangkitkan contoh acak dari sebaran invers-Gamma lainnya yakni ̂
untuk mengganti ̂
, dan begitu seterusnya. Gelfand dan Smith (1990)
menunjukkan bahwa algoritma Gibbs sampler pada simulasi MCMC akan
memproduksi sebaran posterior bersama dari β dan σ2 yang sebarannya konvergen.
Jika contoh acak yang dibangkitkan bagi β dan σ2 saling bebas, berdasarkan
hukum bilangan besar nilai harapan bagi β dan σ2 nilainya diaproksimasi dari nilai
rataan contoh. Kasus sederhana ini adalah kasus yang mana sebaran posterior
bersyarat parameter model berasal dari sebaran posterior bersyarat yang
bentuknya diketahui yang sering disebut conjugate sampling sehingga
menimbulkan penggunaan sebaran prior conjugate pada model-model dengan
pendekatan Bayesian.
Kasus kedua yang lebih kompleks dari kasus pertama adalah sebaran
posterior bersama bagi parameter efek spasial, misalkan parameter ρ tidak
memiliki bentuk sebaran posterior yang pasti dan sulit dilakukan simulasi dengan
algoritma baku pada simulasi MCMC. Penarikan contoh acak bagi parameter efek
spasial bergantung kepada rasio dari pendekatan Uniform (Devrove 1986 dalam
LeSage 1997), biasanya penarikan contoh acak parameter efek spasial
menggunakan bantuan nilai sebaran kandidat berbentuk sebaran Uniform (LeSage
1997). Dengan demikian penggunaan sebaran prior noninformative untuk

10
parameter model regresi spasial pada penelitian ini hanya difokuskan pada
penggunaan sebaran prior conjugate.
Sebaran prior bagi parameter koefisien regresi (β) umumnya sebuah sebaran
normal ganda karena pada prakteknya sederhana dan secara komputasi telah
banyak dikembangkan (Gelman et al. 2014). Selain itu penggunaan sebaran
conjugate berbentuk sebaran normal ganda bagi β pada model-model regresi
dengan asumsi galat menyebar normal memberikan hasil pendugaan parameter
yang relatif identik dengan pendugaan kemungkinan maksimum karena sebaran
prior normal ganda merupakan sebaran yang datar/tidak berpengaruh (flat prior)
sehingga model regresi dengan pendekatan Bayesian adalah regresi terboboti dari
model regresi dengan pendekatan kemungkinan maksimum (Ntzoufras 2009 dan
Gelman et al. 2014). Penggunaan sebaran normal ganda bagi parameter β dalam
model-model regresi diantaranya Lindley dan Smith (1972), Ghosh dan Hoekstra
(1995), dan Austin (2008). Sedangkan pada model-model regresi spasial dengan
menggunakan sebaran normal ganda bagi parameter β diantaranya LeSage (1997)
dan Kakamu et al. (2011).
Penentuan sebaran prior bagi parameter spasial menggunakan sebaran prior
yang mudah dan sering diperlakukan sebagai sebuah konstanta, biasanya
menggunakan sebaran Uniform (LeSage 1997). Hal ini dilakukan karena sebaran
posterior bersyarat bagi parameter spasial yang digunakan untuk penarikan contoh
memiliki bentuk sebaran yang tidak pasti sehingga diperlukan sebuah sebuah
prosedur khusus untuk membangkitkan contoh acak. Prosedur khusus ini sering
disebut dengan ratio of uniforms sampling (Devrove 1986 dalam LeSage 1997).
Proses pembangkitan contoh acak bagi parameter spasial dengan prinsip ratio of
uniforms sampling dilakukan dengan algoritma Metropolis-Hastings dengan
sebaran kandidat merupakan sebaran normal baku (LeSage 1997).
Pada penelitian ini model regresi spasial yang digunakan adalah model
regresi otoregresif spasial/spatial autoregressive model (SAR). Model regresi
spasial SAR adalah sebuah model regresi umum dengan adanya penambahan
pengaruh spasial pada peubah responnya. Menurut LeSage (1997) model regresi
spasial SAR dengan pendekatan Bayesian (Bayesian SAR) adalah model regresi
SAR dengan adanya penambahan informasi awal pada parameter model berupa
sebaran prior conjugate untuk parameter koefisien regresi spasial β dan parameter
ragam σ2, sedangkan parameter koefisien otokorelasi spasial ρ menggunakan
sebaran Uniform. Model Bayesian SAR dapat ditulis sebagai berikut (LeSage
1997) :
(20)





dengan y adalah vektor peubah respon berukuran
, ρ adalah koefisien
otokorelasi spasial lag, W adalah matriks pembobot spasial berukuran
,
X adalah matriks rancangan yang bersifat non stokastik berukuran
, k menyatakan banyaknya peubah prediktor yang dimasukkan pada

11
model, β adalah vektor koefisien regresi yang sifatnya tidak diketahui berukuran
dan ε adalah vektor galat berukuran
.
Informasi awal mengenai parameter, parameter β menyebar normal ganda
dengan vektor rataan b0 dan matriks ragam-peragam B0, σ2 menyebar mengikuti
⁄ , dan ρ menyebar
sebaran invers-Gamma dengan parameter ⁄ dan
dan
mengikuti sebaran Uniform antara kebalikan nilai maksimum
nilai ciri dari matriks pembobot spasial (W). Sebaran posterior
minimum
{
} dengan mengasumsikan antar sebaran
bersama bagi parameter
prior saling bebas adalah
|

| |

|

{



{

(21)
}

}

}

{

Berdasarkan sebaran posterior bersama ini, akan ditentukan sebaran
posterior bersyarat bagi masing-masing parameter yaitu sebaran posterior
bersyarat bagi β, σ2, dan ρ. Sebaran posterior bersyarat bagi β adalah
|

|

∫∫

(22)

dengan
(
dan
(
2
Sebaran posterior bersyarat bagi σ adalah sebaran invers-Gamma dengan
parameter a1 dan d1 yang ditulis
|

|

∫∫

(23)

⁄ dan
{
}⁄
dengan
Sedangkan sebaran posterior bersyarat bagi ρ merupakan sebaran pendekatan
yang ditulis
|

∫∫

| |

|

{

}

(24)

Penurunan sebaran posterior bersyarat bagi masing-masing parameter model
Bayesian SAR dapat dilihat pada Lampiran 1.
Bentuk sebaran posterior bersyarat bagi ρ merupakan bentuk yang tidak
pasti sehingga untuk membangkitkan contoh acak bagi ρ diperlukan algoritma
Random-walk Metropolis dengan sebaran kandidatnya adalah sebaran normal
dibangkitkan dengan mempertimbangkan nilai saat
baku. Nilai kandidat
ini
dan nilai dari sebaran normal baku dengan parameter tuning (c)

12
melalui persamaan
Kemudian
dievaluasi dengan menggunakan peluang penerimaan
formula

nilai

kandidat
dengan

|
|

(25)

Bayesian Seemingly Unrelated Regression-Spatial Autoregressive Model
Kakamu et al. (2011) mengembangkan model Bayesian SAR dari LeSage
(1997) dengan sistem model dari Zellner (1962) yang disebut dengan model
Bayesian SUR-SAR. Model Bayesian SUR-SAR ini dibangun dengan beberapa
model regresi spasial SAR yang diasumsikan memiliki hubungan antar galat
model regresi SAR dengan pendugaan parmeter dilakukan menggunakan
pendekatan Bayesian. Berdasarkan penjelasan mengenai informasi sebaran prior
yang sering digunakan pada model-model regresi spasial sebelumnya dan seperti
pada model Bayesain SAR, model Bayesian SUR-SAR pada penelitian ini
menggunakan asumsi sebaran prior conjugate bagi parameter koefisien regresi β
dan matriks pembangun ragam-peragam galat model Σ, sedangkan parameter
koefisien otokorelasi spasial ρ menggunakan sebaran Uniform. Model Bayesian
SUR-SAR dapat ditulis (Kakamu et al. 2011) sebagai berikut :
(26)





Informasi awal mengenai parameter, parameter β menyebar normal ganda
dengan vektor rataan b0 dan matriks ragam-peragam B0, Σ menyebar mengikuti
sebaran invers-Wishart dengan parameter skala
dan derajat bebas , dan ρ
menyebar mengikuti sebaran seragam antara kebalikan nilai maksimum
nilai ciri dari matriks pembobot spasial (W)
dan minimum
(Kakamu et al. 2011). Sebaran posterior bersama berdasarkan fungsi
kemungkinan pada persamaan (16) dengan asumsi antar prior saling bebas ditulis
|

| |

{



| |

{

|

}| |

(27)
{

}

}

Sebaran posterior bersyarat bagi parameter β, Σ, dan ρ diperoleh
berdasarkan sebaran posterior marjinal dari fungsi sebaran posterior bersama pada
persamaan (27). Sebaran posterior bersyarat bagi parameter β adalah sebaran
normal ganda dengan vektor rataan ̃ dan matriks ragam-peragam ̃ ditulis
sebagai berikut

13
|

|

∫∫
(̃ ̃

(28)

dengan ̃

(̂ ̂
dan ̃ ( ̂
yang diperoleh dari
̂
.
dan ̂
Sebaran posterior bersyarat bagi Σ adalah sebaran invers-Wishart dengan
parameter skala ̃ dan derajat bebas ̃ yang ditulis
|

|

∫∫
(̃ ̃

(29)

dan ̃
.Sebaran posterior bersyarat bagi ρ
dengan ̃
digunakan untuk setiap model ke-t . Sebaran yang merupakan sebaran posterior
marjinal dari sebaran posterior bersama ini adalah sebuah sebaran pendekatan
berbentuk
|

|

|

|

∫∫∫
{

}

(30)

Secara lengkap penurunan sebaran posterior bersyarat bagi masing-masing
parameter model Bayesian SUR-SAR dapat dilihat pada Lampiran 2.
Bentuk sebaran posterior bersyarat bagi ρt merupakan bentuk yang tidak
pasti sehingga untuk membangkitkan contoh acak bagi ρt diperlukan algoritma
Random-walk Metropolis dengan sebaran kandidatnya adalah sebaran normal
baku. Nilai kandidat otokorelasi spasial lag model ke-t (
dibangkitkan
dan nilai dari sebaran normal
dengan mempertimbangkan nilai saat ini
baku melalui persamaan
(31)
Kemudian nilai kandidat dievaluasi dengan menggunakan peluang penerimaan
(
dengan formula
(

(

(

(

|

|

)

(32)

Nilai (
tentunya bergantung kepada nilai sebaran posterior tanpa
melibatkan model ke-t yang merupakan fungsi otokorelasi spasial selain model
.
ke-t pada saat ini

14
Diagnostik Konvergensi MCMC
Konvergensi dalam simulasi MCMC adalah isu yang sangat penting dalam
menghasilkan penduga parameter yang benar dari sebaran posterior yang sedang
dikaji. Sebuah masalah dalam simulasi MCMC adalah konvergensi tidak selalu
didiagnosis dengan jelas seperti dalam metode optimasi. Peneliti harus
menentukan banyaknya iterasi dan burn-in period dari proses simulasi MCMC
yang akan dilakukan dalam menganalisis sebaran posterior model. Diagnostik
konvergensi mengacu kepada tercapainya stasioneritas dari sebaran posterior
model. Ada dua cara yang dapat dilakukan dalam melakukan diagnostik
konvergensi MCMC yaitu melalui metode grafis dan metode formal pengujian
hipotesis (Ntzoufras 2009).
Metode grafis untuk diagnostik MCMC dapat dilakukan dengan
menggunakan trace plot, density plot, acf plot, dan ergodic mean plot. Trace plot
adalah plot antara nilai contoh acak/rantai Markov yang dibangkitkan dengan
indeks iterasinya. Suatu rantai Markov dikatakan stasioner dalam sebaran jika
nilai-nilai contoh acaknya tidak berubah sepanjang rantai Markov tersebut atau
dapat dikatakan jika rantai Markov tersebut cenderung stabil tidak membentuk
trend maupun periode tertentu. Plot rataan ergodik adalah plot antara rataan
kumulatif dengan indeks iterasi, jika plot rataan ergodik cenderung stabil maka
rantai Markov telah mencapai konvergen dalam hal rataan sebarannya. Karena
rantai Markov merupakan yang disimulasikan merupakan proses yang
berhubungan dengan waktu, untuk menilai suatu proses simulasi MCMC
konvergen atau belum dapat digunakan acf plot dan untuk menyatakan bentuk
sebaran dapat digunakan density plot.
Uji formal konvergensi MCMC dapat dilakukan dengan statistik uji
diantaranya adalah statistik Geweke, statistik Raftery-Lewis, statistik GelmanRubin, statistik Heidelberger-Welch, dan statistik Brooks-Gelman (Sinharay 2004).
Pada penelitian ini digunakan statistik uji diagnostik konvergensi MCMC yang
sederhana dan sering digunakan yaitu statistik uji Geweke. Geweke (1992)
mengajukan uji diagnostik konvergensi dari rataan setiap parameter secara
terpisah dari contoh acak yang dibangkitkan dari sebuah rantai tunggal.
Prosedurnya adalah dengan membagi contoh acak yang telah dibangkitkan
menjadi dua kelompok misalkan kelompok contoh acak A dan kelompok contoh
acak B , biasanya menjadi 10% awal (A) dan 50% akhir (B) dari total contoh acak
yang akan dievaluasi konvergensinya. Uji kesamaan rataan dari kedua kelompok
kemudian dilakukan untuk mengetahui apakah kedua kelompok contoh acak yang
dibangkitkan berasal dari sebaran yang stasioner atau belum.
Uji Geweke berlandaskan teori analisis spektral pada analisis deret waktu,
misalkan himpunan contoh acak yang dibangkitkan adalah {
},
rataan contohnya adalah ̅ dan fungsi kepekatan spektral dari deret waktunya
. Galat baku dari rataan contoh dihitung menggunakan persamaan
adalah
⁄ sehingga uji kesamaan rataan kelompok contoh acak A dan kelompok

contoh acak B menggunakan formula


̅



̅



(33)

15
̅ adalah rataan
yang secara asimtot mengikuti sebaran normal baku dengan ̅
contoh dari kelompok A dan kelompok B,
adalah banyaknya


iterasi/ukuran contoh kelompok A dan kelompok B,
adalah ragam rataan contoh dari kelompok A dan kelompok B. Secara spesifik
nilai | |yang besar, biasanya | |
mengindikasikan terdapat perbedaan rataan
antara contoh acak kedua kelompok sehingga rantai Markov yang disimulasikan
berasal dari sebaran yang belum konvergen (Ntzoufras 2009).
Galat Baku Monte Carlo
Hasil yang diperoleh dari simulasi MCMC merupakan himpunan contoh
acak yang perlu diketahui ukuran ketidakpastiannya (Ntzoufras 2009). Statistik
galat baku Monte Carlo (GBMC) merupakan ukuran ketidakpastian yang
menyatakan keragaman setiap nilai dugaan parameter yang diakibatkan proses
simulasi. GBMC idealnya memiliki nilai yang kecil untuk memperoleh dugaan
parameter yang memiliki presisi yang tinggi. Nilai GBMC merupakan fungsi dari
ukuran contoh/banyaknya iterasi sehingga dapat dikontrol oleh peneliti.
Secara sederhana GBMC dapat dihitung dengan menggunakan formula
[



]





[

]

(34)

dengan
merupakan himpunan contoh acak yang dibangkitkan dengan
[
] adalah galat
banyak iterasi S’ yang ditentukan setelah burn-in period,
] adalah dugaan otokorelasi contoh
baku posterior untuk S’ iterasi, dan [
acak dengan lag l yang berarti korelasi antara himpunan contoh acak pada iterasi
ke-s yaitu [
] dan pada iterasi ke-(s+l) yaitu [
] . Salah satu hal
penting dalam perhitungan GBMC adalah menentukan panjang lag maksimum,
penentuan panjang lag maksimum menggunakan aturan nilai otokorelasi yang
]
(Carlin &
mendekati nol biasanya panjang lag ditentukan ketika [
Louis 2000).
Deviance Information Criterion
Deviance Information Criterion (DIC) adalah statistik ukuran kebaikan yang
sering digunakan pada model-model berbasis pendekatan Bayesian (Spiegelhalter
et al. 2002). Formulasi DIC dituliskan sebagai
̅

̂ (̂

(35)

{
| } adalah rataan devians dari semua parameter yang
dengan ̅
dibangkitkan untuk pendugaan parameter pada simulasi MCMC, ̂ ( ̂
( { ( |̂ } adalah devians dari rataan posterior bersyarat semua parameter.
Model dikatakan memiliki derajat kebaikan yang tinggi apabila memiliki nilai
DIC kecil. Statistik DIC sering digunakan dalam perbandingan model dalam hal
mengepas data.

16

3 METODE PENELITIAN
Data
Data yang digunakan dalam kajian empiris ini adalah yang berasal dari
penelitian sebelumnya (Rahmat 2014). Data sekunder ini diperoleh dari Profil
Kesehatan dan Badan Pembangunan Daerah (Bapedda) Kota Bogor tahun 2009 –
2011. Unit pengamatannya adalah kelurahan yang berada di Kota Bogor
berjumlah 68 kelurahan. Sebagai data tambahan, peta Kota Bogor yang terdiri dari
68 kelurahan digunakan untuk membuat matriks bobot spasial berdasarkan konsep
berbatasan langsung (contiguity).

Gambar 1 Peta Kota Bogor
Peubah-peubah penelitiannya adalah banyaknya penderita/pasien DBD
sebagai peubah respon (Y), sedangkan peubah prediktornya adalah kepadatan
penduduk (X1), mobilitas penduduk (X2), rataan umur penderita (X3), dan
banyaknya Puskesmas/Puskesmas pembantu (X4). Peubah tambahan yang
menjelaskan adanya otokorelasi spasial lag (otokorelasi spasial pada peubah
respon) merupakan perkalian antara bobot spasial dan peubah respon yang
disajikan dalam bentuk vektor-matriks sebagai Wy.

17
Metode Analisis Data
Analisis pendahuluan untuk mengeksplorasi dan mendeskripsikan
karakteristik peubah-peubah penelitian tidak dilakukan dalam penelitian karena
hal tersebut sudah dilakukan pada penelitian sebelumnya. Hasil eksplorasi yang
dilakukan oleh Rahmat (2014) menunjukkan bahwa data dapat mendukung
penggunaan regresi spasial dan antar peubah prediktor tidak memiliki kolineritas
yang dapat mengakibatkan masalah serius pada model. Secara umum ada
beberapa tahapan yang dilakukan dalam menganalisis data DBD Kota Bogor 2009
– 2011 menggunakan model Bayesian SUR-SAR sebagai berikut :
1. Membuat matriks bobot spasial (W) dari peta Kota Bogor menggunakan
aturan queen contiguity. Matriks ini dibakukan terhadap barisnya sehingga
total elemen matriks setiap baris nilainya satu. Matriks bobot spasial terdapat
pada Lampiran 4 dan keterangan kode nomor kelurahan pada Lampiran 5.
2. Menduga model individu SAR untuk data tahunan menggunakan simulasi
MCMC seperti yang dilakukan Anggana (2012). Kemudian amati hubungan
antar sisaan dari model-model individunya.
3. Menspesifikasikan besarnya nilai-nilai inisiasi sebaran prior dan sebaran
posterior model Bayesian SUR-SAR kemudian mulai lakukan proses simulasi
MCMC.
4. Membangkitan nilai kandidat koefisien otokorelasi spasial lag (
untuk
model individu ke-t menggunakan algoritma Metropolis-Hastings melalui
prosedur Random walk seperti pada persamaan (31). Nilai kandidat kemudian
dievaluasi dengan peluang penerimaan pada persamaan (32) dan proses
diulang sampai semua model individu memiliki contoh acak sebagai koefisien
otokorelasi spasial lag yang dibangkitkan melalui proses simulasi.
5. Membangkitkan contoh acak vektor parameter koefisien regresi SUR-SAR
menggunakan algoritma Gibbs Sampler seperti pada persamaan (28).
6. Membangkitkan contoh acak matriks parameter ragam-peragam galat SURSAR menggunakan algoritma Gibbs Sampler seperti pada persamaan (29).
7. Mengulangi tahap ke-4 sampai tahap ke-6 hingga diperoleh himpunan contoh
acak semua parameter untuk S iterasi. Pisahkan himpunan contoh acak semua
parameter dari B iterasi pertama sebagai burn-in period .
8. Melakukan diagnostik konvergensi MCMC secara deskriptif menggunakan
trace plot, density plot, acf plot, dan ergodic plot dan melalui pengujian
formal menggunakan statistik Geweke. Jika simulasi yang dilakukan belum
konvergen dalam hal stasioneritas sebaran posteriornya maka burn-in period
(B) dan banyak iterasi (S) ditambah.
9. Menghitung statistik posterior model SUR-SAR diantaranya: rataan posterior,
persentil 2.5 posterior, median posterior, persentil 97.5 posterior, dan galat
baku posterior.
10. Melakukan uji keberartian parameter menggunakan 95% Credible Interval
(CI). Jika nilai persentil 2.5 posterior dan persentil 97.5 posterior berbeda
tanda maka parameter berbeda nyata secara statistik pada taraf nyata 5%.
11. Menghitung galat baku Monte Carlo kemudian lakukan evaluasi model
menggunakan galat baku posterior (GBP) dan galat baku Monte Carlo
(GBMC).

18
12. Membandingkan dan evaluasi model SUR-SAR dan model individu SAR
dengan melihat nilai dugaan parameter model, analisis efisiensi pendugaan
parameter, dan kebaikan model dalam mengepas data.
Semua proses komputasi dalam analisis data diterjemahkan kedalam bahasa
pemrograman S menggunakan kemasan program statistika R edisi 3.1.1 yang
dapat diunduh secara gratis. Program R untuk proses simulasi MCMC dapat
ditanyakan melalui email ke hilmandwianggana@gmail.com. Skema simulasi
MCMC dalam membangkitkan contoh acak dari parameter model SUR-SAR
digambarkan sebagai berikut :

Bangkitkan :
Hitung : (

( (



|

Bangkitkan :

|

)

Tidak

Ya
Ya
(



|

|

Vektor ρ
Bangkitkan :
Bangkitkan :
Himpunan ρ ,

̃ ̃

̃ ̃

, dan

* garis putus-putus menandakan proses diulang

Gambar 2 Diagram alir simulasi MCMC

19

4 HASIL DAN PEMBAHASAN
Hubungan antar Model-model Individu
Hal pertama yang harus diselidiki ialah hubungan antar model-model
individu (model yang dibangun untuk periode tahun tertentu). Adanya hubungan
antar model-model individu merupakan langkah awal menduga model dengan
menggunakan sistem SUR. Ukuran hubungan antar model-model individu
menggunakan statistik korelasi dari sisaan model-model individunya. Model
individu pada penelitian ini merupakan model otoregresif spasial (SAR). Karena
model SUR yang diajukan diduga dengan menggunakan pendekatan Bayesian,
pendugaan parameter terhadap model-model individu dilakukan dengan
menggunakan pendekatan Bayesian melalui simulasi MCMC seperti penelitian
yang dilakukan Anggana (2012).
Tabel 1 Korelasi sisaan model-model individu
Tahun
(2009;2010)
(2009;2011)
(2010;2011)

Korelasi
0.3692292
0.3343404
0.4623764

Statistik t
3.2277
2.8820
4.2364

p-value
0.001945
0.005326
0.000072

Berdasarkan Tabel 1 dapat dilihat bahwa nilai korelasi sisaan model-model
individu relatif tinggi. Nilai korelasi yang relatif tinggi dapat menjadi indikasi
bahwa ada hubungan model regresi SAR yang dibangun pada tahun 2009, 2010
dan 2011. Hal ini diperkuat dengan pengujian statistik pada taraf nyata 0.05,
pengujian keberartian korelasi menggunakan statistik uji t memberikan nilai pvalue yang lebih kecil dari 0.05 sehingga cukup bukti untuk mengatakan bahwa
terdapat hubungan yang nyata antar galat model-model individu SAR. Dengan
demikian penggunaan model regresi SAR dengan sistem SUR dapat
dipertimbangkan untuk digunakan pada data DBD Kota Bogor tahun 2009 – 2011.
Pendugaan Model SUR-SAR dengan MCMC
Regresi SAR untuk tahun 2009, 2010, dan 2011 yang disajikan dalam satu
sistem model SUR diduga dengan menggunakan simulasi MCMC. Hal yang
sangat penting adalah menentukan banyak iterasi dan burn-in period yang telah
menghasilkan rantai-rantai Markov yang konvergen dalam hal stasioneritas
sebarannya. Simulasi MCMC dicobakan dengan menentukan banyak iterasi
104,600 dan 20,000 iterasi pertama sebagai burn-in period dan menentukan nilainilai inisiasi parameter.
Diagnostik Konvergensi MCMC
Konvergensi dalam membangkitkan contoh acak yang merupakan sebuah
rantai Markov melalui simulasi MCMC merupakan hal yang harus diperhatikan
karena apabila hasil yang diperoleh dari MCMC tidak konvergen dapat
menimbulkan kesimpulan yang tidak valid. Istilah konvergensi mengacu kepada

20
tercapainya konvergensi dari sebaran posteriornya, dalam hal ini sebaran posterior
dari parameter sudah stasioner. Diagnostik konvergensi MCMC dapat dilakukan
dengan metode grafik diantaranya trace plot, density plot, acf plot, dan ergodic
mean plot serta pengujian hipotesis, misalnya uji Geweke.
Berdasarkan plot diagnostik untuk semua parameter model yang terdapat
pada Lampiran 3 menunjukkan bahwa simulasi MCMC telah mencapai konvergen
dengan banyak iterasi 104,600 dan burn-in period 20,000. Trace plot yang
merupakan plot antara indeks iterasi dengan nilai contoh acak hasil simulasi
MCMC tidak mengindikasikan terdapatnya
kecenderungan tertentu atau
periodesitas dari suatu rantai Markov, nilai-nilai yang