MODEL VECTOR AUTOREGRESSIVE-GENERALIZED SPACE TIME AUTOREGRESSIVE (VAR-GSTAR) DENGAN 2-MEANS CLUSTERING PADA CURAH HUJAN DI JAWA TENGAH.

MODEL VECTOR AUTOREGRESSIVE-GENERALIZED SPACE TIME
AUTOREGRESSIVE (VAR-GSTAR) DENGAN 2-MEANS
CLUSTERING PADA CURAH HUJAN DI JAWA TENGAH

oleh
MUTHAQIN DHAMAR WIDHORO JATI
M0111059

SKRIPSI
ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar
Sarjana Sains Matematika

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET
SURAKARTA
2016

i

r00


I

id,:r\ \t ll . r;'j
E.:rl.l.V:\, ' L'.?
E nl-llit!r..
'X'

er966

ffi}
w

?ar"I,{
Irlr?]v uErir{E}aHuod rlrull ulrp l?}il
'ery1eruo1er\ Ipnls rne"r3or6 uleday

sr0z NlIr

lz


1e33ue1

rp'ed upu1ts"rns {p

rrts{qBSro

t00 6 t0t86I q180z96r 'dIN
'ag'ddy'111'qrs8uruedprrt\ rrutsurnd'tsrg
I00 r 7,al66r 0el00l6{ 'dIN
'ruolJ',\l ''lS'S 'S rr€S oulag {.4raq 'r0
i00 1 er800z 0t?0r86r 'dIN
'ruoy'lt ''tg'g 'outeurA\ o.{A.oE
r00 e 6i800e 0ei0qt6r 'dIN
'ruox'N ''rg'g 'rurlrei,,\l IrS ulllJ

?i;;- e-tc
gt,cr'- g :

ii,;;


t'i

-'i':i,l

pBBuea

ue8uq

tsputsJ

dlN

uI?p ErutsN

r[n3ua6 eloBFuy
suts]ar{as
tsnloN
uBlBqsr

rlnBua4 rrts.,ltag


glge la1t{ 8I 'nqeg rruq uped 1u;e.(s iqnuarrleur ue;p1e.(urp uep
rln8ua6 uu,^d.ag uedepuq rp u"{utsr{llpadrp qe1e1

t00 z t0/86r qr80u96i 'dl}l
'lg'ddy"14'qrsBuruudprl\ rrueurnd

.ErCI

r00 e 601661 0610016r 'dIN
uroll'N ''iS'S ''S
?au r.,l^.ao 'ro

'11 Srrrqunqura6

'I

Surq

qalo Suiqurrqrp


6q0III0r\f i IIN
IJVT OUOHOLT\,UVITVHC I{IbVHJI}I,\1
ISdIUNS

HV)i{gJ }A\Yr IO \IVfi}H

HY'UJ]J VOVd

JNTA4JSNTD SNYTI/,{-E NVCNSO (U}ZS' -UVA) gA,TSSgzTCTAOJNV
qI4[IJ gCh'.dS OgZITV',Ug^igC-qAISSgADg UOJ|TV UOJS{A TUCOFI

ABSTRAK
Muthaqin Dhamar Widhoro Jati. 2016. MODEL VECTOR AUTOREGRESSIVE GENERALIZED SPACE TIME AUTOREGRESSIVE (VAR-GSTAR) DENGAN 2-MEANS CLUSTERING PADA CURAH HUJAN DI JAWA TENGAH.
Fakultas Matematika dan Ilmu Pengetahuan Alam. Universitas Sebelas Maret.
Curah hujan bulanan antar wilayah di 29 kabupaten/kotamadya Jawa Tengah mempunyai keragaman yang besar sehingga diperlukan pengelompokkan
curah hujan. Metode pengelompokkan dilakukan dengan 2-means clustering sehingga konstruksi model menjadi lebih sesuai daripada tanpa clustering. Data
curah hujan merupakan data yang dipengaruhi oleh ruang dan waktu. Oleh karena itu, model vector autoregressive-generalized space time autoregressive (VARGSTAR) dapat diterapkan ke dalam data curah hujan.
Pada model VAR-GSTAR diperlukan nilai pembobot untuk mengukur keterkaitan antar ruang curah hujan. Pembobot yang digunakan adalah normalisasi korelasi silang. Model VAR-GSTAR memiliki dua orde, yaitu orde waktu
yang diperoleh dari model VAR dan orde ruang yang ditentukan dari GSTAR

sehingga membentuk model VAR-GSTAR (p1 ). Penelitian ini bertujuan untuk
menerapkan model VAR-GSTAR dengan 2-means clustering pada curah hujan
di 29 kabupaten/kotamadya di Jawa Tengah.
Dari penelitian ini diperoleh model VAR-GSTAR (11 ) dengan nilai RMSE
173.312 untuk cluster rendah dan VAR-GSTAR (21 ) dengan nilai RMSE 203.272
untuk cluster tinggi. Berdasarkan nilai RMSE tersebut, kedua model baik untuk
digunakan.
Kata kunci: curah hujan, 2-means clustering, VAR-GSTAR.

iii

ABSTRACT
Muthaqin Dhamar Widhoro Jati. 2016. VECTOR AUTOREGRESSIVE
GENERALIZED SPACE TIME AUTOREGRESSIVE (VAR-GSTAR) MODEL
WITH 2-MEANS CLUSTERING ON RAINFALL OF CENTRAL JAVA. Faculty of Mathematics and Natural Sciences. Sebelas Maret University.
Monthly interregional rainfall within 29 subdistricts/districts of Central Java have huge variance. Because of huge variance, it needs clustering. The clustering method is the 2-means clustering. Clustered data is better than unclustered
data. Rainfall data have spatial and temporal effects. Therefore, VAR-GSTAR
model could be applied to monthly rainfall data.
VAR-GSTAR model needs a weight to measure correlation within interregional rainfall. The weighting is normalization of cross correlation. VAR-GSTAR
model has two orders. Autoregressive order is obtained from vector autoregressive (VAR) model and spatial order is determined from generalized space time

autoregressive (GSTAR) model. Because of two orders, the model could be constructed as VAR-GSTAR (p1 ) model. The purpose of this research is to apply
VAR-GSTAR model with 2-means clustering on rainfall data within 29 subdistricts/districts of Central Java.
The results of this research on rainfall data are VAR-GSTAR (11 ) model
for low cluster and VAR-GSTAR (21 ) model for high cluster. VAR-GSTAR (11 )
has root means square error (RMSE) 173.312 and VAR-GSTAR (21 ) has RMSE
203.272. Based on RMSE, these two models are good to be applied.
Keywords: rainfall, 2-means clustering, VAR-GSTAR.

iv

PERSEMBAHAN

Karya ini dipersembahkan untuk
kedua orang tua dan kakak-kakak atas doa dan dukungan yang diberikan.

v

KATA PENGANTAR

Puji syukur ke hadirat Tuhan Yang Maha Esa atas limpahan rahmatNya

sehingga penulis dapat menyelesaikan skripsi ini. Ucapan terimakasih penulis
sampaikan kepada
1. Dr. Dewi Retno Sari Saputro, S.Si., M.Kom. sebagai Pembimbing I yang
telah memberikan bimbingan materi, saran, dan motivasi dalam penulisan
skripsi ini.
2. Dra. Purnami Widyaningsih, M.App.Sc. sebagai Pembimbing II yang telah
memberikan bimbingan materi, motivasi dalam hal penulisan skripsi dan
saran penyusunan alur penulisan.
Semoga skripsi ini dapat bermanfaat.

Surakarta, Mei 2016

Penulis

vi

DAFTAR ISI

HALAMAN JUDUL . . . . . . . . . . . . . . . . . . . . . . . . . . . .


i

PENGESAHAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

ii

ABSTRAK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

iii

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

iv

PERSEMBAHAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

v

KATA PENGANTAR . . . . . . . . . . . . . . . . . . . . . . . . . . .


vi

ABSTRACT

DAFTAR ISI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii

I

DAFTAR TABEL . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

ix

PENDAHULUAN

1

1.1

Latar Belakang Masalah . . . . . . . . . . . . . . . . . . . . . . .


1

1.2

Perumusan Masalah

. . . . . . . . . . . . . . . . . . . . . . . . .

3

1.3

Tujuan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3

1.4

Manfaat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3

II LANDASAN TEORI

4

2.1

Tinjauan Pustaka . . . . . . . . . . . . . . . . . . . . . . . . . . .

4

2.2

Teori-Teori Penunjang . . . . . . . . . . . . . . . . . . . . . . . .

5

2.2.1

K-means Clustering . . . . . . . . . . . . . . . . . . . . . .

5

2.2.2

Model Vector Autoregressive (VAR) . . . . . . . . . . . . .

6

2.2.3

Model Vector Autoregressive-Generalized Space Time Au-

2.2.4

toregressive (VAR-GSTAR) . . . . . . . . . . . . . . . . .

6

Kestasioneran Model VAR-GSTAR . . . . . . . . . . . . .

7

vii

2.2.5

2.3

Pembobot Normalisasi Korelasi Silang pada Model VARGSTAR . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

2.2.6

Identifikasi Model . . . . . . . . . . . . . . . . . . . . . . .

8

2.2.7

Pendugaan Parameter . . . . . . . . . . . . . . . . . . . .

9

2.2.8

Metode Stepwise pada Model Regresi . . . . . . . . . . . .

13

2.2.9

Uji White Noise . . . . . . . . . . . . . . . . . . . . . . . .

14

2.2.10 Validasi Model VAR-GSTAR . . . . . . . . . . . . . . . .

14

Kerangka Pemikiran . . . . . . . . . . . . . . . . . . . . . . . . .

15

III METODE PENELITIAN

16

IV HASIL DAN PEMBAHASAN

18

4.1

Deskripsi Data . . . . . . . . . . . . . . . . . . . . . . . . . . . .

18

4.2

2-means Clustering . . . . . . . . . . . . . . . . . . . . . . . . . .

18

4.3

Uji Stasioneritas Data . . . . . . . . . . . . . . . . . . . . . . . .

20

4.4

Orde Model VAR . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

4.5

Model VAR-GSTAR dengan Pembobot Normalisasi Korelasi Silang 22

4.6

Asumsi White Noise Model VAR-GSTAR untuk 2 Cluster . . . .

32

4.7

Validasi Model VAR-GSTAR untuk 2 Cluster . . . . . . . . . . .

33

V PENUTUP

34

5.1

Kesimpulan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

34

5.2

Saran . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

36

DAFTAR PUSTAKA

37

viii

DAFTAR TABEL

4.1

Wilayah curah hujan dengan 2-means untuk masing-masing cluster 19

4.2

Nilai ADF Kabupaten/Kotamadya di Jawa Tengah pada cluster
rendah . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4.3

21

Nilai ADF Kabupaten/Kotamadya di Jawa Tengah pada cluster
tinggi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21

4.4

Nilai uji IPS untuk masing-masing cluster . . . . . . . . . . . . .

21

4.5

Nilai AIC masing-masing lag pada cluster tinggi dan cluster rendah 22

4.6

Nilai korelasi 5 lokasi pada cluster rendah . . . . . . . . . . . . .

23

4.7

Nilai korelasi 5 lokasi pada cluster tinggi . . . . . . . . . . . . . .

24

4.8

Pendugaan parameter dan uji signifikansi model VAR-GSTAR (11 )
pada cluster rendah . . . . . . . . . . . . . . . . . . . . . . . . . .

4.9

26

Pendugaan parameter dan uji signifikansi model VAR-GSTAR (21 )
pada cluster tinggi . . . . . . . . . . . . . . . . . . . . . . . . . .

27

4.10 Pendugaan parameter signifikan dan thitung model VAR-GSTAR
(11 ) pada cluster rendah menggunakan metode stepwise . . . . . .

28

4.11 Pendugaan parameter signifikan dan thitung model VAR-GSTAR
(21 ) pada cluster tinggi menggunakan metode stepwise . . . . . .

28

4.12 Nilai LB pada model VAR-GSTAR (11 ) pada cluster rendah . . .

33

4.13 Nilai LB pada model VAR-GSTAR (21 ) pada cluster tinggi

33

ix

. . .

BAB I
PENDAHULUAN
1.1

Latar Belakang Masalah

Besarnya curah hujan memiliki keragaman yang tinggi dalam ruang dan
waktu. Keragaman curah hujan menurut ruang dipengaruhi oleh letak geografis
(letak terhadap daratan dan lautan) (Bruce dan Clark [5]) dan keragaman curah hujan menurut waktu dipengaruhi oleh musim. Keragaman curah hujan yang
terjadi secara lokal pada suatu tempat menyebabkan penyebaran hujan tidak merata. Demikian juga curah hujan di Provinsi Jawa Tengah, memiliki keragaman
yang berbeda pada setiap wilayah sesuai keadaan geografisnya. Seperti curah
hujan di dataran tinggi Dieng dan di pesisir pantai utara Jawa Tengah memiliki
nilai curah hujan yang berbeda pada waktu yang sama. Karena curah hujan
di Jawa Tengah memiliki keragaman yang tinggi, diperlukan pengelompokkan
(clustering) wilayah untuk meminimalkan keragaman.
K-means clustering yang diperkenalkan oleh MacQueen [11], merupakan
teknik clustering dengan k banyaknya cluster dan means sebagai pusat cluster.
K-means clustering merupakan metode clustering yang mempartisi objek ke dalam k cluster berdasarkan kemiripan karakteristiknya. Objek yang mempunyai
karakteristik sama dikelompokkan ke dalam satu cluster yang sama dan objek
yang mempunyai karakteristik berbeda dikelompokkan ke dalam cluster yang lain
(Agusta [1]).
Data curah hujan merupakan data runtun waktu dan dengan data tersebut
dapat dimodelkan dengan model runtun waktu. Salah satu model runtun waktu
untuk data univariat adalah autoregressive (AR). Pada kenyatannya sering ditemukan data runtun waktu multivariat sehingga digunakan model runtun waktu
simultan yaitu model vector autoregressive (VAR) dengan orde p (Sims [16]).
1

Curah hujan yang telah dikelompokkan merupakan data multivariat sehingga dapat diterapkan ke dalam model VAR. Selain curah hujan memiliki efek waktu, juga memiliki efek ruang. Oleh karena itu data curah hujan dapat diterapkan
dalam model ruang waktu. Model ruang waktu antara lain yaitu space time autoregressive (STAR) yang diperkenalkan oleh Pfeifer dan Deutsch [13]. Model
STAR mensyaratkan nilai-nilai parameter yang diperoleh harus sama untuk setiap lokasi. Sering dijumpai karakteristik lokasi memiliki keragaman yang berbeda
sehingga hasil yang didapatkan dari model STAR kurang baik. Borovkova et al.
[4] mengembangkan model STAR menjadi model Generalized STAR (GSTAR).
Model GSTAR memberikan hasil yang lebih sesuai daripada model STAR. Hal ini
dikarenakan model GSTAR tidak menyaratkan nilai parameter-parameter yang
sama untuk setiap lokasi. Model GSTAR mengasumsikan data stasioner. Menurut Wutsqa dan Suhartono [6], model VAR-GSTAR merupakan model VAR
yang direpresentasikan ke dalam model GSTAR. Model VAR-GSTAR memiliki
dua orde yaitu orde waktu yang diperoleh dari model VAR dan orde ruang yang
ditentukan dari model GSTAR.
Model ruang waktu memiliki keterkaitan antar ruang yang ditunjukkan dengan pembobot. Suhartono dan Subanar [17] menyatakan 4 pembobot lokasi
yaitu biner, seragam, invers jarak, dan normalisasi korelasi silang. Pembobot biner menyatakan bernilai 1 untuk lokasi yang berdekatan dan 0 untuk lokasi yang
berjauhan. Karena terdapat 29 lokasi dan ukuran jauh dekat mengandung unsur
subjektif, pembobot biner kurang tepat untuk digunakan dalam model VARGSTAR. Karena karakteristik lokasi yang heterogen, pembobot seragam kurang
sesuai digunakan untuk model VAR-GSTAR. Bobot invers jarak yang diperoleh
dari jarak yang sesungguhnya belum dapat menerangkan keadaan geografis lokasi
secara tepat. Pembobot yang digunakan dalam penelitian ini adalah normalisasi
korelasi silang. Pembobot normalisasi korelasi silang diperoleh dari nilai korelasi
antar ruang. Nilai bobot yang dihasilkan memberikan ukuran yang lebih sesuai.
Sementara itu, penerapan model VAR dilakukan oleh Sumartini [19] pada
bidang ekonomi, Diani dkk. [8] menerapkan model VAR-neural network dan

2

GSTAR-neural network pada curah hujan di Kabupaten Malang, Nurani [14]
menerapkan model GSTAR pada data produksi minyak bumi, Nurhayati et al.
[12] menerapkan GSTAR pada bidang ekonomi, serta Wutsqa dan Suhartono [6]
menggunakan model VAR-GSTAR pada data wisatawan di Yogyakarta dan Bali.
Pada penelitian ini data curah hujan di 29 kabupaten/kotamadya dibentuk
ke dalam 2 cluster, cluster 1 menyatakan wilayah dengan curah hujan rendah
dan cluster 2 untuk curah hujan tinggi. Data curah hujan pada masing-masing
cluster diterapkan ke dalam model VAR-GSTAR dengan 2-means clustering.

1.2

Perumusan Masalah

Berdasarkan latar belakang masalah, terdapat 2 rumusan masalah yaitu
1. bagaimana menerapkan model VAR-GSTAR dengan 2-means clustering pada curah hujan di Jawa Tengah dan
2. apakah model dari masing-masing cluster baik untuk digunakan.

1.3

Tujuan

Tujuan yang hendak dicapai dalam penelitian ini adalah
1. menerapkan model VAR-GSTAR dengan 2-means clustering pada curah
hujan di Jawa Tengah dan
2. menentukan model dari masing-masing cluster yang baik untuk digunakan.

1.4

Manfaat

Manfaat yang diharapkan dari penelitian ini adalah memperluas pengetahuan tentang k-means clustering dan modelVAR-GSTAR serta menambah penerapannya pada data curah hujan di Jawa Tengah.

3