Universitas Sumatera Utara
k = jumlah variabel independen k = 1, 2, ...dst
I = matriks identitas dengan ukuran n x n
Terdapat empat model yang dapat dibentuk dari model umum regresi yaitu: 1.
Geographically Weighted Regression GWR
1
, ,
p i
i i
k i
i ik
i k
y u v
u v x
β β
ε
=
= +
+
∑
2. Spatial Lag Model SLM atau Spasial Autogressive Model SAR
Jika 0,
0 maka persamaan 2.4 menjadi: 2.8
3. Spatial Error Model SEM
Jika 0, 0 maka persamaan 2.4 menjadi:
2.9 4.
General Spatial Model atau Spatial Autoregressive Moving Average SARMA Jika
0, 0 maka persamaan 2.4 menjadi: ,
2.10
2.2.1 Model Geographically Weighted Regression GWR
Model Geographically Weighted Regression GWR adalah model regresi yang pertama kali diperkenalkan oleh Fotheringham pada tahun 1967 yang
merupakan salah
satu pengembangan
model regresi
OLS dengan
mempertimbangkan spasial atau lokasi Maulani, 2013. Model ini merupakan model regresi linier yang menghasilkan dugaan parameter model regresi yang
bersifat lokal untuk setiap lokasi atau titik dimana data tersebut diperoleh atau dikumpulkan. Model GWR dapat ditulis sebagai berikut :
2.7
Universitas Sumatera Utara
1
, ,
p i
i i
k i
i ik
i k
y u v
u v x
β β
ε
=
= +
+
∑
dimana:
i
y
:
Nilai observasi variabel respon untuk lokasi ke-i
i i
v u ,
: Menyatakan titik koordinat longitude, latitude lokasi i
,
k i
i
u v β
: Koefisien regresi variabel prediktor ke- k untuk lokasi ke-i Estimasi parameter di suatu titik ui ,vi akan lebih dipengaruhi oleh titik-
titik yang dekat dengan lokasi ui ,vi daripada titik-titik yang lebih jauh. Pemilihan pembobot spasial digunakan untuk menentukan besarnya pembobot
masing-masing lokasi yang berbeda. Salah satu cara yang digunakan untuk menentukan besarnya pembobot adalah dengan fungsi kernel. Pembobot yang
terbentuk dengan menggunakan fungsi kernel ini adalah fungsi jarak Gaussian Gaussian Distance Function, fungsi Exponential, fungsi Bisquare, dan fungsi
kernel Tricube. Fungsi pembobot yang digunakan pada penelitian ini adalah fungsi jarak Gaussian.
− =
2
2 1
exp ,
h d
v u
w
ij i
i j
dengan
2 2
j i
j i
ij
v v
u u
d −
+ −
=
adalah jarak euclidian antara lokasi
i i
v u ,
ke lokasi
j j
v u ,
dan h adalah parameter non negatif yang diketahui dan biasanya disebut parameter penghalus bandwidth.
Bandwidth dapat dianggap sebagai radius dari suatu lingkaran, sehingga sebuah titik yang berada dalam radius lingkaran dianggap masih memiliki
pengaruh. Di dalam pembentukan sebuah model GWR, bandwidth berperan sangat penting karena akan berpengaruh pada ketepatan model terhadap data,
2.11
2.12
Universitas Sumatera Utara
yaitu mengatur varians dan bias dari model Lestari, 2011. Ada beberapa metode yang digunakan untuk memilih bandwidth optimum, salah satu diantaranya adalah
metode Cross Validation CV sebagai berikut :
2 1
ˆ
n i
i i
CV h y
y h
≠ =
= −
∑
Dengan
h y
i ≠
adalah nilai penaksir
i
y
dimana pengamatan di lokasi
i i
v u ,
dihilangkan dari proses estimasi. Untuk mendapatkan nilai
h
yang optimal maka diperoleh dari
h
yang menghasilkan nilai Cross Validation CV minimum.
Pengujian kesesuaian model goodness of fit dilakukan dengan menguji kesesuaian
dari koefisien
parameter secara
serentak, yaitu
dengan mengkombinasikan uji regresi linier dengan model untuk data spasial. Hipotesis
yang digunakan sebagai berikut : H :
,
k i
i k
u v
β β
= untuk setiap
0,1, 2, , , dan
1, 2, ,
k p
i n
= =
tidak ada perbedaan yang signifikan antara model regresi global dan GWR
1
H : Paling sedikit ada satu ,
, 0,1, 2,
,
k i
i k
u v k
p β
β ≠
= ada perbedaan yang signifikan antara model regresi global dan GWR.
Statistik uji:
1
2 2
1 1
− −
= p
n H
SSE H
SSE F
hitung
δ δ
2.14 Jika hipotesis null
adalah benar berdasarkan data yang diberikan, maka nilai SSE
akan sama dengan nilai SSE . Akibatnya ukuran 2.13
Universitas Sumatera Utara
SSE SSE akan mendekati satu, sebaliknya jika tidak benar maka
nilainya cenderung mengecil Leung et. al., 2000 dalam Lestari, 2011 menghasilkan nilai yang relatif kecil, maka dapat dikatakan bahwa hipotesis
alternatif lebih cocok digunakan. Dengan kata lain model GWR mempunyai goodness of fit yang lebih baik dari pada model regresi global.
Adapun pengujian signifikansi parameter model pada setiap lokasi dilakukan dengan menguji parameter secara parsial. Hipotesisnya adalah sebagai
berikut : H :
,
k i
i
u v
β
=
, :
1
≠
i i
k
v u
H
β
dengan 1, 2,
, k
p =
Statistik uji yang digunakan :
ˆ , ˆ
k i
i hit
kk
u v T
c
β σ
=
Tolak jika, |
+ ,
| - .
; 2
3
2
2.2.2 Model Spatial Lag Model SLM atau Spatial Autoregressive Model