Optimasi Support Vector Regression Menggunakan Genetic Algorithm dan Particle Swarm Optimization Untuk Prediksi Curah Hujan Musim Kemarau

OPTIMASI SUPPORT VECTOR REGRESSION MENGGUNAKAN
GENETIC ALGORITHM DAN PARTICLE SWARM OPTIMIZATION
UNTUK PREDIKSI CURAH HUJAN MUSIM KEMARAU

GITA ADHANI

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul Optimasi Support Vector
Regression Menggunakan Genetic Algorithm dan Particle Swarm Optimization
Untuk Prediksi Curah Hujan Musim Kemarauadalah benar karya saya
denganarahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun
kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip
dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah
disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir
tesis ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Oktober 2014
Gita Adhani
NIM G651130566

RINGKASAN
GITA ADHANI. Optimasi Support Vector RegressionMenggunakan Genetic
Algorithm dan Particle Swarm Optimization Untuk Prediksi Curah Hujan Musim
Kemarau. Dibimbing oleh AGUS BUONO dan AKHMAD FAQIH.
Support Vector Regression (SVR) merupakan Support Vector Machine
(SVM) yang digunakan untuk kasus regresi.SVM adalah satu kumpulan teknik
klasifikasi dan regresi, yang merupakan pengembangan algoritme non-linear.
Metode regresi telah umum digunakan sebagai model prediksi, salah satunya
untuk model prediksi iklim musiman.Proses SVR membutuhkan fungsi kernel
untuk mentransformasikan input non-linearke ruang fitur berdimensi
tinggi.Penelitian ini berfokus pada penyusunan model prediksi curah hujan
musiman pada musim kemarau di 15 stasiun cuaca di Kabupaten Indramayu.
Metode dasar yang digunakan dalam penelitian ini adalahSVR dengan parameter
fungsi kernel dioptimasi menggunakan algoritme hybridGenetic Algorithm dan

Particle Swarm Optimization yang dikenal dengan istilah GAPSO.
Metode dalam penelitian ini diawali dengan mengidentifikasi dan
merumuskan masalah. Kemudian dilanjutkandengan data preprocessing, yaitu
mengumpulkan data yang akan digunakan dan membagi data tersebut menjadi
data latih dan data uji.Data processing dilakukan dengan mengolah data tersebut
dengan proses SVR yang dioptimasi dengan menggunakan GAPSO, melakukan
pengujian, dan langkah terakhir melakukan analisis dan evaluasi terhadap hasil
prediksi dan nilai observasi.Dalam tahap pemilihan data, data indeks Indian
Ocean Dipole (IOD) yang dikenal sebagai Dipole Mode Index (DMI) dan
Anomali Suhu Permukaan Laut (ASPL) NINO 3.4.digunakan sebagai prediktor
(peubah bebas) dengan curah hujan musim kemarau sebagai peubah respons
(target prediksi).Data yang digunakan dalam penelitian ini dari tahun 1978 hingga
tahun 2008.
Dalam proses SVR dilakukan pembagian data latih sebanyak 20 tahun dan
data uji sebanyak 10 tahun. Fungsi kernel SVR yang digunakan pada penelitian
ini adalah kernel RBF. SVR memiliki nilai cost dan parameter kernel RBF yang
harus di optimasi, yaitu C dan γ. Penentuan nilai cost (C)dan parameter fungsi
kernel (γ) berpengaruh pada model SVR yang dihasilkan. Semakin optimal
nilainya, semakin baik model yang dihasilkan. Untuk mendapatkan nilai C dan γ
yang optimal maka SVR dioptimasi dengan menggunakan teknik hybridGAPSO.

Teknik ini menggabungkan konsep-konsep dari GA dan PSO dan menciptakan
individu generasi baru tidak hanya melalui operasi crossover dan mutasi pada GA,
namun juga melalui proses PSO.
Model SVR tersebut diperoleh dengan menggunakan24 populasi, 100 kali
iterasi untuk masing-masing GA dan PSO, 10 iterasi GAPSO, rentang nilai C dan
γsecara berurutan dari 0.1 hingga 50 dan 0 hingga 10. Penelitian ini berhasil
memperoleh model SVR dengan nilai koefisien korelasi terbesar, yakni 0.87 dan
nilai galat NRMSE sebesar 10.43 pada stasiun Tugu.Stasiun Cikedung memiliki
nilai galat NMRSE terkecil, yakni 9.01 dan koefisien korelasi sebesar 0.78.
Kata kunci:curah hujan musim kemarau, Genetic Algorithm, Particle Swarm
Optimization, SupportVector Regression

SUMMARY
GITA ADHANI. Optimization of Support Vector Regression using Genetic
Algorithm and Particle Swarm Optimization for Rainfall Prediction in Dry
Season. Supervised by AGUS BUONO and AKHMAD FAQIH.
Support Vector Regression (SVR) is Support Vector Machine (SVM) that is
used for regression case. SVM is a set of classification and regression technique
which is development of non-linear algorithms. Regression method has been
commonly used for prediction models e.g. for seasonal climate prediction. SVR

process requires kernel functions to transform the non-linear inputs into a high
dimensional feature space. This research focused on predictive modeling rainfall
in the dry season at 15 weather stations in Indramayu district. The basic method
used in this study was SVR optimized by a hybrid algorithm GAPSO (Genetic
Algorithm and Particle Swarm Optimization).
This researchbegan by identifying and formulating problem. It then
continued by data preprocessing i.e. collecting the dataand determining training
data and test data. Data processing were performed by process data with SVR
optimized by using GAPSO, testing, and the last steps wereanalyzing and
evaluating the results predicted and observed values. In the collecting phase of the
data,Indian Ocean Dipole (IOD) index known as the Dipole Mode Index (DMI)
and NINO 3.4 Sea Surface Temperature Anomaly (SSTA) index data were used
as predictors (independent variables) while dry season rainfall was used as
response variables (dependent variables). The data used in this study were from
1978 to 2008.
In SVR process, we used data of 20 years as datatrainingand data of 10
years as data testing. SVR kernel function used in this study was RBF kernel.SVR
has cost and kernelfunctionparameter valuethat should be optimized i.e. C and γ,
respectively. These values givebig impact on the SVR model. The more the
optimal value of C and γ,the better the model. SVR was optimized by using the

hybrid technique GAPSO to obtain optimal value. Thistechniqueincorporates
concepts from GA and PSO and it creates individuals of new generation not only
by crossover and mutation operation in GA, but also through the process of PSO.
SVR model was obtained by using 24 populations, 100 times iteration for
each GA and PSO, 10 iterations of GAPSO. It was designed by using C
andγparameters, ranging from 0.1 to 50 and 0 to 10, respectively. This research
obtained a model of SVR with the highest correlation coefficient of 0.87 and
NRMSE error value of 10.43 at Tugu station. Cikedung station has the lowest
NMRSE error value of 9.01 and the correlation coefficient of 0.78.
Keywords:rainfall in dry season,Genetic Algorithm, Particle Swarm Optimization,
Support Vector Regression

© Hak Cipta Milik IPB, Tahun 2014
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan
IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini

dalam bentuk apa pun tanpa izin IPB

OPTIMASISUPPORT VECTOR
REGRESSIONMENGGUNAKANGENETIC
ALGORITHMDANPARTICLE SWARMOPTIMIZATIONUNTUK
PREDIKSI CURAH HUJAN MUSIM KEMARAU

GITA ADHANI

Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Komputer
pada
Program Studi Ilmu Komputer

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2014


Penguji Luar Komisi pada Ujian Tesis:

Irman Hermadi, SKom, PhD

Judul Tesis :Optimasi Support Vector Regression Menggunakan Genetic
Algorithm dan Particle Swarm Optimization Untuk Prediksi Curah
Hujan Musim Kemarau
Nama
: Gita Adhani
NIM
: G651130566

Disetujui oleh
Komisi Pembimbing

Dr Ir Agus Buono, MSi, MKom
Ketua

Dr Akhmad Faqih, SSi
Anggota


Diketahui oleh

Ketua Program Studi
Ilmu Komputer

Dekan Sekolah Pascasarjana

Dr Eng Wisnu Ananta Kusuma, ST, MT

Dr Ir Dahrul Syah, MScAgr

Tanggal Ujian: 27 Agustus 2014

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang
dipilih dalam penelitian yang dilaksanakan sejak bulan Oktober 2013 ini ialah

curah hujan, dengan judul Optimasi Support Vector Regression Menggunakan
Genetic Algorithm dan Particle Swarm Optimization Untuk Prediksi Curah
Hujan Musim Kemarau.
Terima kasih penulis ucapkan kepada Bapak Dr Ir Agus Buono, MSi
M.Komdan Bapak Dr Akhmad Faqih selaku pembimbing.Terima kasih juga
diucapkan kepada Bapak Toto Hartanto, SKom MSi selaku dosen mata kuliah
kolokium yang telah banyak memberi saran untuk penelitian ini. Ungkapan
terima kasih juga disampaikan kepada almarhum ayahanda, ibunda, adik, serta
teman-teman Anisaul Muawwanah, Husnul Khotimah, Kak Inggih, Abang
Ridhoatas segala bantuan, doa, dan kasih sayangnya.
Ungkapan terima kasih juga penulis sampaikan padapengelola
pascasarjana, seluruh dosen dan staf akademik Departemen Ilmu Komputer
Institut Pertanian Bogor, teman-teman angkatan 14, angkatan 15. Terima kasih
kepada teman-teman di Laboratorium Computational Intelligence Imu Komputer
Institut Pertanian Bogor atas kerja sama dalam melaksanakan penelitian. Semoga
karya ilmiah ini bermanfaat.

Bogor,Oktober 2014
Gita Adhani


DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

1 PENDAHULUAN
Latar Belakang
Perumusan Masalah
Tujuan Penelitian
Manfaat Penelitian
Ruang Lingkup Penelitian


1
1
2
2
3
3

2 METODE
Identifikasi dan Perumusan Masalah
Pengambilan dan Pemilihan Data
Pembagian Data
Proses Support Vector Regression (SVR)
OptimasiSupport Vector Regression (SVR) Menggunakan Genetic
Algorithm Dan Particle SwarmOptimization (GAPSO)
Analisis dan Evaluasi

3
4
4
4
4
7
11

3 HASIL DAN PEMBAHASAN
Identifikasi dan Perumusan Masalah
Pengambilan dan Pemilihan Data
Kinerja Model Berdasarkan Algoritme Optimasi
Analisis dan Evaluasi Hasil

12
12
14
16
19

4 SIMPULAN DAN SARAN
Simpulan
Saran

22
22
22

DAFTAR PUSTAKA

23

LAMPIRAN

25

RIWAYAT HIDUP

33

DAFTAR TABEL
1 Nilai korelasi dan NRMSE stasiun hujan Kabupaten Indramayu
2 Nilai koefisien korelasi dan NRMSE untuk masing-masing optimasi
pada tiap stasiun cuaca

17
18

DAFTAR GAMBAR
1 Diagram Alir Metodologi Penelitian
2 Ilustrasi mapping dari klasifikasi 2 dimensi ke dalam ruang fitur 3
dimensi (Gijsberts 2007)
3 Siklus Genetic Algorithm(GA) (Goldberg 1998)
4 Desain kromosom biner
5 Diagram pengklasifikasian metode GA dan PSO (Kao dan Zahara
2008)
6 IOD positif pada tahun 1997 (BOM 2010)
7 Nilai Dipole Mode Indeks (DMI) (JAMSTEC 2007)
8 Wilayah NINO (IRI 2007)
9 Peta wilayah stasiun cuaca Kabupaten Indramayu
10 Nilai korelasi DMI dengan CHMK MJJA
11 Nilai korelasi ASPL NINO 3.4 dengan CHMK MJJA
12 Grafik perbandingan observasi dan prediksi CHMK MJJA Stasiun
Tugu dan Stasiun Cikedung
13 Scatter plot observasi dengan prediksi Stasiun Tugu dan Stasiun
Cikedung
14 Grafik perbandingan nilai korelasi hasil prediksi metode optimasi
GAPSO, GA, dan PSO
15 Grafik perbandingan nilai NRMSE hasil prediksi metode optimasi
GAPSO, GA, dan PSO
16 Grafik nilai koefisien korelasi masing-masing stasiun cuaca
17 Grafik nilai galat NRMSE masing-masing stasiun cuaca
18 Diagram Taylor Stasiun Tugu dan Stasiun Cikedung
19 Grafik nilai standar deviasi masing-masing stasiun cuaca

3
7
8
9
10
12
13
13
14
15
15
17
18
19
19
20
20
21
21

DAFTAR LAMPIRAN
1Hasil analisis korelasi dengan metode pearson IOD dan data curah
hujan musim kemarau MJJA tahun 1979-2008
2 Hasil analisis korelasi dengan metode pearson ASPL NINO 3.4 dan
data curah hujan musim kemarau MJJA
3 Hasil simulasi peramalan stasiun cuaca Bangkir
4 Hasil simulasi peramalan stasiun cuaca Bulak

25
25
25
25

5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Hasil simulasi peramalan stasiun cuaca Cidempet
Hasil simulasi peramalan stasiun cuaca Cikedung
Hasil simulasi peramalan stasiun cuaca Losarang
Hasil simulasi peramalan stasiun cuaca Sukadana
Hasil simulasi peramalan stasiun cuaca Sumurwatu
Hasil simulasi peramalan stasiun cuaca Tugu
Hasil simulasi peramalan stasiun cuaca Ujungaris
Hasil simulasi peramalan stasiun cuaca Lohbener
Hasil simulasi peramalan stasiun cuaca Sudimampir
Hasil simulasi peramalan stasiun cuaca Jutinyuat
Hasil simulasi peramalan stasiun cuaca Kedokan Bunder
Hasil simulasi peramalan stasiun cuaca Krangkeng
Hasil simulasi peramalan stasiun cuaca Bondan
Grafik perbandingan seluruh stasiun cuaca di Kabupaten Indramayu
Scatter plot seluruh stasiun cuaca di Kabupaten Indramayu
Diagram Taylor untuk setiap stasiun pengamatan di Kabupaten
Indramayu

26
26
26
27
27
27
28
28
28
29
29
29
30
30
31
32

1 PENDAHULUAN
Latar Belakang
Indonesia merupakan negara yang terletak di antara 2 benua, yakni Benua
Asia dan Benua Australia, dan 2 Samudera, Samudera Pasifik dan Samudera
Hindia. Oleh karena itu iklim dan cuaca di Indonesia sangat dipengaruhi oleh
keadaan kedua samudera ini. Faktor iklim dan cuaca memiliki peranan penting
dalam berbagai bidang kehidupan manusia. Curah hujan merupakan salah satu
variabel penentu kondisi iklim, berkaitan langsung dengan keberhasilan bidang
pertanian dan perkebunan. Selain itu, curah hujan adalah faktor utama sebagai
bagian terpenting dari iklim di Indonesia yang berada di daerah tropik.
Terjadinya cuaca ekstrim termasuk kategori penyimpangan iklim, yaitu
suatu penyimpangan cuaca dan iklim dari kondisi normal dalam selang waktu
tertentu. Salah satu bentuk penyimpangan cuaca dan iklim adalah terjadinya
fenomena El Nino Southern Oscillation (ENSO), yakni El Nino dan La Nina.
Kejadian El Nino biasanya berhubungan dengan peristiwa kemarau panjang atau
kekeringan karena berkurangnya intensitas curah hujan, sedangkan La Nina
berhubungan dengan peristiwa banjir. La Nina menyebabkan penumpukan massa
udara yang banyak mengandung uap air di atmosfer Indonesia sehingga potensi
terbentuknya awan hujan semakin tinggi.
Fenomena anomali iklim di Samudera Pasifik berkaitan dengan ENSO dapat
diidentifikasi dari dataSouthern Oscillation Index (SOI) dan Anomali Suhu
Permukaan Laut (ASPL) di bagian tengah dan timur dari Samudera Pasifik Tropis
yang umumnya dinyatakan dalam bentuk nilai indeks NINO yang dibagi menjadi
beberapa zonasi, yaitu Nino1.2, Nino3, Nino4 dan NINO3.4. Selain fenomena
ENSOdi Samudera Pasifik, fenomena Indian Ocean Dipole (IOD)juga
memberikan dampak besar terhadap kondisi penyimpangan iklim akibat proses
interaksi lautan dan atmosfer. Kondisi penyimpangan iklim di daerah Samudera
Hindia dapat dilihat dari nilai Dipole Mode Index (DMI).
Indramayu merupakan salah satu daerah sentra produksi pertanian
khususnya padi di Indonesia.Wilayah ini sangat rentan terhadap kejadian
kekeringan dan banjir, khususnya ketika terjadi fenomena ENSO di Indonesia.
Bedasarkan data dari Laporan Tahunan Dinas Pertanian Kabupaten Indramayu
diketahui pada tahun-tahun terjadinya El Nino dan La Nina, Indramayu
mengalami kerusakan tanaman pangan (padi) yang cukup tinggi (Suciantini et al.
2006).Menurut Estiningtyas (2012) faktor utama gagal panen di Kabupaten
Indramayu disebabkan oleh kekeringan (79.8%), serangan organisme pengganggu
tanaman (15.6%) dan banjir (5.6%) yang berkaitan erat dengan adanya pengaruh
penyimpangan iklim. Upaya antisipasi kegagalan panen akibat kejadian anomali
iklim sangat diperlukan untuk menghindari kerugian. Salah satu upaya untuk
meningkatkan kemampuan petani dalam melakukan antisipasi kejadian
penyimpangan iklim ialah dengan memanfaatkan informasi prediksi iklim
musiman yang perlu terus ditingkatkan kualitas dan ketepatannya.
Penelitian ini berfokus pada penyusunan model prediksi curah hujan musim
kemarau di Kabupaten Indramayu. Prediktor yang digunakan merupakan peubahpeubah yang berkaitan dengan curah hujan musim kemarau. Peubah-peubah

2
tersebut antara lain adalah DMI dan Anomali Suhu Permukaan Laut (ASPL) di
wilayah NINO 3.4. Metode yang digunakan adalah Support Vector Regression
(SVR) yang dioptimasi dengan Genetic Algorithm(GA) dan Particle Swarm
Optimization(PSO).
SVR merupakan Support Vector Machine (SVM) yang digunakan untuk
kasus regresi. Penelitian dengan menggunaan metode SVR sebelumnya telah
dilakukan oleh Adhaniet al. (2013) mengenai prediksi curah hujan musim
kemarau menggunakan data SOI dan suhu permukaan laut NINO 3.4 dengan
metodeSVR. Proses SVR membutuhkan kernel untuk mentransformasikan input
non-linear ke ruang fitur berdimensi tinggi. Penelitian ini hanya menggunakan
kernelRadial Basis Function(RBF) karena penelitian Adhaniet al. (2013) telah
menunjukkan bahwa dengan kernel RBF menghasilkan nilai korelasi tinggi dan
galat yang kecil apabila dibandingkan dengan menggunakan kernel linear dan
polinomial. Selain itu, kernel RBF merupakan kernel yang sederhana dengan
parameter C dan γ. Kernel memiliki nilai parameter yang harus ditentukan terlebih
dahulu. Penelitian ini mengimplementasikan penggabungan 2 metode optimasi
untuk menemukan parameter fungsi kernel yang optimal yaitu GA dan PSO
dengan istilah GAPSO (Kao dan Zahara 2008).

Perumusan Masalah
Terjadinya cuaca ekstrim memiliki pengaruh yang besar terhadap berbagai
sektor yang bergantung pada kondisi iklim dan cuaca. Curah hujan yang tidak
menentu pada musim kemarau dapat berakibat buruk khususnya bagi para petani.
Resiko terhadap gagal panen merupakan hal yang umumnya terjadi. Informasi
mengenai curah hujan musim kemarau dapat membantu dalam menentukan pola
tanam dan varietas tanaman yang tepat untuk menghasilkan hasil panen maksimal.
Masalah yang akan dianalisis dalam penelitian ini adalah:
1 Bagaimana cara mendapatkan informasi prediksi mengenai curah hujan
musim kemarau Mei Juni Juli Agustus (CHMK MJJA) menggunakan DMI
dan ASPL NINO 3.4 dengan metode SVR?
2 Bagaimana kinerja luaran dari prediksi curah hujan musim kemarau dengan
metode SVR?
3 Bagaimana mengoptimasi parameter kernel RBF dengan menggunakan
algoritme hybrid GAPSO?

Tujuan Penelitian
Penelitian ini bertujuan melakukan penyusunan model prediksi curah hujan
musim kemarau mengambil studi kasus di wilayah Indramayu dengan metode
SVRyang dioptimasi menggunakan penggabungan GAdan PSO(GAPSO) dengan
menggunakan prediktor berupa data DMI dan indeks NINO 3.4.

3
Manfaat Penelitian
Manfaat penelitian ini diharapkan dapat membantu dalam berbagai bidang
yang membutuhkan informasi atau prediksi cuaca dan iklim. Selain itu, dapat
meningkatkan akurasi prediksi dalam meramalkan curah hujan pada musim
kemarau sehingga membantupetani untuk melakukan produksi.

Ruang Lingkup Penelitian
1

2

Ruang lingkup dalam penelitian ini:
Penelitian ini difokuskan pada pencarian model prediksi curah hujan musim
kemarau MJJA (Mei-Juni-Juli-Agustus) terbaik dari hasil pembelajaran
menggunakan SVR
Penelitian menggunakan data DMI, ASPL NINO 3.4, dan data observasi
daristasiun cuaca di Indramayu. Data DMI dan NINO 3.4 berasal dari situs
The International Research Institute for Climate and Society (IRI)dari tahun
1978 hingga tahun 2008. Data observasi merupakan data curah hujan musim
kemarau dari tahun 1978-2008 dari 15 stasiun cuaca di Kabupaten Indramayu.

2 METODE
Diagram alir metode penelitian yang dilakukan pada penelitian ini dapat
dilihat pada Gambar 1.

Gambar 1Diagram Alir Metodologi Penelitian

4
Identifikasi dan Perumusan Masalah
Domain masalah yang akan diselesaikan dalam penelititan ini adalah
mengembangkan model Support Vector Regression untuk menduga curah hujan di
musim kemarau di wilayah Indramayu yang dipotimasi dengan menggunakan
algoritme GAPSO. Diperlukan suatu pemahaman yang mendalam terkait hal-hal
penting dalam pencapain tujuan penelitian. Pemahaman mengenai literatur
dilakukan dengan mempelajari sumber dan jurnal yang terkait dengan penelitian.
Sumber dan jurnal yang terkait dalam peneletian ini meliputi proses pelatihan
SVR, algoritme optimasi GAPSO, penjelasan mengenai DMI, NINO, dan curah
hujan musim kemarau.

Pengambilan dan Pemilihan Data
Data yang digunakan adalah DMI yang menunjukkan fenomenaIndian
Ocean Dipole (IOD), indeks ASPL NINO 3.4, dan data observasi curah hujan
musim kemarau. Data DMI dan ASPL NINO 3.4 dari tahun 1978 sampai tahun
2008.Data ini didapat dari link data ERSST dari IRI Data Library (IRIDL)
(iridl.ldeo.columbia.edu/SOURCE/.NOAA/.NCDC/.ERSST/.version3b/.sst). Data
observasi merupakan data curah hujan tahun 1978-2008 dari 15 stasiun cuaca di
Kabupaten Indramayu. DMI dan ASPL NINO 3.4 digunakan sebagai prediktor
sedangkan data curah hujan musim kemarau Mei-Juni-Juli-Agustus (CHMK
MJJA) sebagai yang akan diprediksi.

Pembagian Data
Pembagian data bertujuan untuk memperoleh data latih dan data uji. Data
latih digunakan untuk membuat model SVR sedangkan data uji digunakan untuk
menghitung akurasi dari model SVR yang dihasilkan. Data uji yang digunakan
hanya sepanjang 1 tahun.

ProsesSupport Vector Regression(SVR)
Data latih diproses menggunakan pelatihan SVR untuk memperoleh model
dengan data yang digunakan berupa data curah hujan musim kemarau sebagai
masukan untuk pelatihan. Fungsi kernel yang digunakan dalam proses SVR
adalah RBF. Kinerja model dari fungsi kernel dapat diketahui melalui nilai
koefisien korelasi dan galat NRMSE.SVR memiliki nilai cost dan parameter
kernel RBF yang harus di optimasi, yaitu C dan γ. Penentuan nilai cost (C)dan
parameter fungsi kernel (γ) berpengaruh pada model SVR yang dihasilkan.
Semakin optimal nilainya, semakin baik model yang dihasilkan. Pencarian nilai
optimum untuk model SVR menggunakan penggabungan algoritme optimasi
GAPSO.
SVR merupakan penerapan SVM ntuk kasus regresi. Dalam kasus regresi
output berupa bilangan riil atau kontinyu. SVR merupakan metode yang dapat
mengatasi overfitting (kondisi model terlalu kompleks menjadikan hasil prediksi

5
kurangbaik), sehinggaakanmenghasilkan performansi yang bagus (Smola dan
Schölkopf 2004).
Ide dasar dari SVR dengan menentukan set data yang dibagi menjadi set
latih dan set uji. Kemudian dari set latih tersebut ditentukan suatu fungsi regresi
dengan batasan deviasi tertentu sehingga dapat menghasilkan prediksi yang
mendekati target aktual. Data latih diproses menggunakan pelatihan SVR untuk
memperoleh model dengan data yang digunakan berupa data DMI, ASPL NINO
3.4, data curah hujan musim kemarau sebagai masukan untuk pelatihan.
Misalnya kita mempunyai λ set data latih, (xj, yj) dengan j = 1, 2, … λ
dengan input x  { x1, x2 , x3 }  N dan output yang bersangkutan

y  { y i ,....., y  }   . Berdasarkan data, SVR bertujuan menemukan suatu fungsi
regresi f(x) yang mempunyai deviasi paling besar ε dari target aktual yi untuk
semua data latih. Fungsi regresi f(x)dapat dinyatakan dengan formula sebagai
berikut (Smola dan Schölkopf 2004):

(x) menunjukkan suatu titik di dalam ruang fitur berdimensi lebih tinggi, hasil
pemetaan dari input vektor x di dalam ruang input yang berdimensi lebih rendah.
Koefisien w dan b diprediksi dengan cara meminimalkan fungsi risiko (risk
function) yang didefinisikan dalam persamaan (Smola dan Schölkopf 2004):
λ

λ
dengan kendala



ε

f

ε

…λ

ε

…λ

)| ε|

f

dengan
ε

f

{

|

f

)|

Faktor ||w||2 dinamakan regularisasi. Meminimalkan ||w||2 akan membuat
suatu fungsi setipis mungkin sehingga bisa mengontrol kapasitas fungsi. Faktor
kedua dalam fungsi tujuan adalah kesalahan empiris (empirical error) yang diukur
dengan ε-insensitive loss function. Menggunakan de ε-insensitive loss function
harus meminimalkan norm dari w agar mendapatkan generalisasi yang baik untuk
fungsi regresi f. Oleh karena itu, masalah optimasi berikut perlu diselesaikan:
dengan kendala

| |
ε

…λ

ε

…λ

Asumsikan bahwa ada suatu fungsi f yang dapat mendekatisemua titik (xi,
yi), dengan presisi ε. Dalam kasus ini diasumsikan bahwa semua titik ada dalam

6
rentang f ± εfeas le. Dalam hal infeasible, ada kemungkinan dalam beberapa titik
keluar dari rentang f ± ε. enambahan variabel slackξ, ξ* dapat digunakan untuk
mengatasi masalah infeasible constraint dalam masalah optimasi. Selanjutnya,
masalah optimasi di atas bisa diformulasikan sebagai berikut:
λ

λ

∑ ξ ξ*

dengan kendala
ε
ε
*
ξ ξ

ξ
ξ

…λ
…λ

Konstanta C> 0 menentukan tawar menawar (trade off) antara ketipisan
fungsi f dan batas atas deviasi lebih dari ε masih ditoleransi. Semua deviasi lebih
besar daripada ε akan dikenakan pinalti sebesar C. Dalam SVR, ε sepadan dengan
akurasi dari aproksimasi terhadap data latih. Nilai ε yang kecil terkait dengan nilai
yang tinggi pada variabel slackξi dan akurasi aproksimasi yang tinggi. Sebaliknya,
nilai yang tinggi untuk ε berkaitan dengan nilai ξi yang kecil dan aproksimasi
yang rendah. Nilai yang tinggi untuk variabel slack akan membuat kesalahan
empiris mempunyai pengaruh yang besar terhadap faktor regulasi. Dalam SVR,
support vector adalah data latih yang terletak pada dan di luar batas f dari fungsi
keputusan, karena itu jumlah support vector menurun dengan naiknya ε
(Bermolen dan Rossi 2009).
Dalam formulasi dual, masalah optimisasi dari SVR adalah sebagai berikut:
λ

∑∑

λ

λ

λ
*

(

*



)

dengan kendala

*



*

λ
*



…λ
…λ

*

adalah dot-product kernel yang
C didefinisikan oleh pengguna,
didefinisikan sebagai
( ) . Dengan menggunakan
langrangemultiplier dan kondisi optimalitas, fungsi regresi secara eksplisit
dirumuskan sebagai berikut:
λ

∑(

*

)

7
SVR menggunakan fungsi kernel untuk mentransformasikan input yang
non-linear ke dalam ruang fitur yang dimensinya lebih tinggi karena pada
umumnya masalah dalam dunia nyata jarang yang bersifat linear separable.
Fungsi kernel dapat menyelesaikan kasus yang bersifat non-linear separable ini.
Gambar 2 menunjukkan ilustrasi fungsi kernel.

Gambar 2Ilustrasi mapping dari klasifikasi 2
dimensi ke dalam ruang fitur 3
dimensi (Gijsberts 2007)
Setelahnya, SVR akan melakukan perhitungan linear untuk menemukan
hyperplane yang optimal pada ruang fitur tersebut. Kernel akan memproyeksikan
data ke dalam ruang fitur berdimensi tinggi untuk menaikkan kemampuan
komputasi dari mesin pembelajaran linear. Persamaan fungsi KernelRBFsebagai
berikut:
γ‖



OptimasiSupport Vector Regression (SVR) MenggunakanGenetic Algorithm
Dan Particle SwarmOptimization (GAPSO)
Penelitian ini mengimplementasikan penggabungan 2 metode optimasi
untuk menemukan parameter fungsi kernel yang optimal yaituGAdanPSO dengan
istilah GAPSO. GA di perkenalkan oleh Holland pada tahun 1975. Algoritme ini
dikembangkan dari proses pencariansolusi optimasi menggunakan pencarian acak.
Pada proses pembangkitanpopulasi awal yang menyatakan sekumpulan solusi
dipilih secara acak. GA pada dasarnya adalah program komputer yang
mensimulasikanproses evolusi.Menurut Goldberg (1998), GA adalah suatu
algoritme pencarian yang didasarkan pada mekanisme seleksi alam. Dalam hal ini
populasi dari kromosom dihasilkan secara randomdan memungkinkan untuk
berkembang biak sesuai denganhukum evolusidengan harapan akan menghasilkan
individu kromosom yang prima. Kromosom ini pada kenyataannya adalah
kandidat penyelesaian dari masalah sehingga bila kromosom yang baik
berkembang, solusi yang baik terhadap masalah diharapkan dapat dihasilkan.

8
Penelitian terkait metode yang dioptimasi dengan GA dan PSO (GAPSO)
pernah dilakukan oleh Kao dan Zahara (2008) dan Ririd (2010). Kao dan Zahara
(2008) menerapkan optimasi GAPSO untuk fungsi multimodal. Teknik hybrid ini
menggabungkan konsep-konsep dari GA dan PSO dan menciptakan individu
generasi baru tidak hanya melalui operasi crossover dan mutasi pada GA, namun
juga melalui proses PSO. Hasil penelitian ini menunjukkan keunggulan kualitas
solusi dan konvergensi pendekatan hybrid GAPSO dibandingkan dengan 4
pendekatan lainnya menggunakan 17 fungsi multimodal yang diambil dari
literatur.
Juang (2004) melakukan penelitian terhadap pengoptimasian desain
recurrent neural dan fuzzy networks. Penelitian tersebut membandingkan kinerja
dari algoritme optimasi GAPSO dengan GA dan PSO. Konsep elitsm digunakan
dalam GAPSO. Setengah dari individu yang terbaik dalam suatu populasi
dianggap sebagai elite. Individu terbaik ini akan diolah menggunakan PSO
sedangkan setengah indvidu lainnya dalam populasi tersebut dihasilkan dengan
melakukan operasi crossover dan mutasi pada para elite hasil PSO. Penelitian
menunjukkan kinerja GAPSO lebih unggul dibandingkan dengan penggunaan GA
atau PSO.
Riridet al. (2010) melakukan pengklasifikasian menggunakan metode
Discriminatively Regularized Least Square (DRLS)yang dioptimasi dengan
GAPSO. Data yang digunakan untuk uji coba adalah database UCI, yaitu IRIS,
WINE, dan LENSA. Berdasarkan hasil uji coba untuk mengoptimasi metode
DRLSC maka nilai fitness yang dihasilkan metode GAPSO lebih baik jika
dibandingkan GA dan PSO dengan selisih nilai fitness 7.3e-008 hingga 0.025.
GA sangat tepat digunakan untuk penyelesaian masalah optimasi yang
kompleks dan sukar diselesaikan dengan menggunakan metode yang
konvensional.Siklus dari GA pertama kali diperkenalkan oleh Davis Goldberg.
Gambaran siklus tersebut dapat dilihat pada Gambar 3.

Gambar 3Siklus Genetic Algorithm (GA) (Goldberg 1998)
Untuk mengoptimalkan parameter kernel SVR (C dan γ) secara simultan,
kromosom setiap individu didefinisikan menjadi 2 bagian, yaitu gen C dan gen
γ(gamma). Pengkodean biner digunakan untuk merepresentasikan kromosom.
Gambar 4 adalah desain kromosom biner yang akan digunakan.

9
C
Γ
C1 C.. Cn γ1 γ.. γ n
Gambar 4Desain kromosom biner
Pada Gambar 4 menunjukkan kumpulan gen Cdan gen γdalam suatu
kromosom. Jumlah gen untuk masing - masing parameter ditentukan oleh rentang
nilai yang diberikan untuk parameter tersebut. Gen tersebut berisi nilai parameter
berupa angka 0 atau 1 yang akan diproses melalui cross over dan mutasi. Nilai
paremeter ini akan di-decoding sebagai masukan bagi proses SVR.
Kriteria penilaian yang digunakan dalam penelitian ini adalah tingkat
akurasi model SVR yang ditentukan dengan nilai Mean Square Error (MSE).
Dengan demikian, fungsi fitness yang digunakan adalah MSE. Individu yang
memiliki nilai MSE paling minimal dalam populasi adalah elitsm. Pembentukan
generasi selanjutnya dilakukan dengan cara melakukan crossover antara 2
individu dalam populasi yang memiliki nilai fitness terbaik. Hasil dari crossover
akan mengalami mutasi pada gen tertentu.
PSO adalah salah satu teknik optimasi evolusioner terbaruyang
dikembangkan oleh Eberhart dan Kennedy pada tahun 1995.Metode initerinspirasi
dari perilaku gerakan kawanan hewan seperti ikan, hewan herbivor, dan burung
yang kemudian tiap objek hewan disederhanakan menjadi sebuah partikel. Suatu
partikel dalam ruang memiliki posisi yang dikodekan sebagai vektor koordinat.
Vektor posisi ini dianggap sebagai keadaan yang sedang ditempati oleh suatu
partikel di ruang pencarian. Setiap posisi dalam ruang pencarian merupakan
alternatif solusi yang dapat dievaluasi menggunakan fungsi objektif. Setiap
partikel bergerak dengan kecepatan v.
Konsep dasar dari PSO yaitu mengembangkan simulasi sekumpulan burung
dalam ruang 2 dimensi direpresentasikan dengan partikel berdasarkan informasi
posisi dan kecepatan (velocity). Setiap partikel mengetahui nilai terbaiknya (Pbest)
dan posisinya (x). Selanjutnya, setiap partikel mengetahui nilai terbaik didalam
seluruh data (Gbest). Partikel selalu bergerak menuju potensial solusi yang
optimum. Kecepatan pergerakan tersebut dipengaruhi oleh velocity yang
diperbaharui setiap iterasinya. Perubahan velocity setiap partikel dipengaruhi oleh
nilai velocity sebelumnya, posisi Pbest, dan Gbest. Nilai random yang berbeda
dibangkitkan sebagai akselerasi Pbestdan Gbest(Eberhart dan Shi 2001).
Secara umum algoritme PSO adalah sebagai berikut:
1 Inisialisasi populasi partikel-partikel dengan posisi random dan velocity dalam
dimensi d di problem space
2 Untuk setiap partikel, evaluasi menggunakan fungsi fitness. Dalam hal ini,
fungsi fitness adalah fungsi yang akan dioptimalkan.
3 Bandingkan partikel yang dievaluasi tadi dengan partikel Pbest. Jika nilainya
lebih baik dari Pbest maka set nilai Pbest sama dengan nilai tersebut dan posisi Pbest
sama dengan lokasi partikel yang dievaluasi menggunakan fungsi fitness tersebut.
4 Identifikasi partikel terbaik dari suatu populasi sebagai Gbest.
5 Update velocity dan posisi partikel menggunakan persamaan:
vid= vid + c1*rand()*(pid – xid)+ c2*rand()*(pgb – xid)
xid = xid + vid

10
dengan:
vid = velocity partikel i dimensi d
xid = posisi partikel i dimensi d saat ini
c1= koefisien akselerasi personal influence
c2 = koefisien akselerasi social influence
pid = Pbest (personal best)
pgd = Gbest (global best)
6 Ulangi langkah kedua sampai kriteria berhenti terpenuhi, biasanya mencapai
nilai optimum atau sampai pada jumlah iterasi tertentu (Eberhart dan Shi 2001).
Penelitian ini menggabungkan 2 algoritme optimasi tersebut, yaitu GA dan
PSO. Algoritme ini bekerja dengan populasi awal dari solusi yang ada dan
menggabungkan kemampuan pencarian dari keduanya.PadaGambar 5
menggambarkan konsep penggabungan kedua algoritme tersebut.
Berikut adalah algoritma dari metode GAPSO (Kao dan Zahara 2008):
1 Inisialisasi Random populasi sebanyak 4N data.
2 Evaluasi dan ranking Evaluasi nilai fungsi fitness pada setiap 4N individu.
Fungsi fitness pada penelitian ini berdasarkan mean square error (MSE).


dengan y adalah nilai target yang diinginkan, f(x) adalah hasil keluaran dari
pengklasifikasian data.
3 Algoritma genetika dengan menggunakan real code operator GA, dari 4N/2
data terbaik.
3.1 Seleksi  dari 4N data pilih 4N/2 data dengan fitness terbaik.
3.2Crossover4N/2 data
3.3 Mutasi dengan pengaruh fungsi gaussian terhadap nilai
random.Probabilitas mutasi sebesar 0.2 sebagaimana persamaan:
4 Setelah pembelajaran dengan metode crossover dan mutasi, maka dilanjutkan
dengan pembelajaran PSO.

Gambar 5Diagram pengklasifikasian metode GA dan PSO
(Kao dan Zahara 2008)

11
2N individu baru yang dihasilkan dari real code GA digunakan untuk
menyesuaikan 2Npartikel yang tersisa dengan metode PSO. Prosedur penyesuaian
2N partikel pada metode PSO melibatkan pemilihan partikel terbaik global,
pemilihan neighborhood partikel terbaik, dan meng-update velocity. Partikel
terbaik global dari populasi ditentukan sesuai dengan urutan nilai fitness.
Neighborhood partikel terbaik yang dipilih terlebih dahulu dibagi dari 2N partikel
menjadi N partikel dan kemudian menentukan partikel dengan nilai fitness yang
lebih baik pada tiap neighborhood sebagai neighborhood partikel terbaik.

Analisis dan Evaluasi
Data uji digunakan sebagai masukan bagi model SVR untuk mendapatkan
output berupa nilai prediksi.Pengukuran keakurasian dan galat hasil prediksi yang
diperoleh dengan model SVR terhadap data uji menggunakan koefisien korelasi
(Persamaan 2) dan Normalized Root Mean Square Error(NRMSE)(Persamaan 3).
Nilai kesalahan (error) digunakan untuk mengetahui besarnya simpangan nilai
dugaan terhadap nilai aktual. Perhitungan error menggunakan NRMSE.Koefisien
korelasi (r) menunjukkan kekuatan hubungan antara 2 peubah. Kecocokan model
dikatakan semakin baik jika r mendekati 1 dan NRMSE mendekati 0. Selain itu,
analisis dan evaluasi juga dilakukan dengan menggunakan Diagram Taylor
(Taylor 2001). Diagram ini sangat baik untuk melakukan evaluasi banyak aspek
dari model yang kompleks ataupun menilai kehandalan dari beberapa model
sekaligus. Diagram Taylor dibangun dari Root Mean Square Error (RMSE),
standar deviasi (Persamaan 4), dan korelasiantara prediksi dengan observasi.

√[ ∑

dengan
r : koefisien korelasi
xi : nilai aktual/observasi
yi : nilai prediksi
n : jumlah data



[∑



]] ∑

√ ∑
dengan
xi : nilai aktual/observasi
yi : nilai prediksi
n : jumlah data
: standar deviasi dari prediksi

dengan:
s :standar deviasi




̅





12
: data observasi periode ke-i sampai n
̅ :rataan hitung

3 HASIL DAN PEMBAHASAN
Identifikasi dan Perumusan Masalah
ENSO berperan penting terhadap kondisi ekstrem dan variabilitas hujan.
Fluktuasi kejadian ENSO di Samudra Pasifik sangat berhubungan dengan curah
hujan di Indonesia (Aldrian et al. 2007). IOD adalah fenomena laut yang disertai
dengan fenomena atmosfer di katulistiwa Samudera Hindia yang mempengaruhi
iklim Australia dan negara-negara lain yang mengelilinginya Samudera Hindia
(Saji et al. 1999).IOD diidentifikasi sebagai penyimpangan kondisi fisik interaksi
lautan-atmosfer di Samudera Hindia tropis yang diduga dapat menyebabkan
kekeringan di Indonesia (Ashok et al. 2003).IOD merupakan perbedaan suhu
permukaan laut antara 2 daerah (kutub) yakni kutub barat Samudera Hindia(50°
BT 70° BT dan 10° LS 10° LU) dan kutub timur Samudera Hindia (90° BB
110° BB dan 10° LS 0° LU) (Saji et.al 1999). Gambar 6 menunjukkan lokasi
kutub yang menjadi perhitungan DMI. Fenomena tersebut merupakan kejadian
dipol yang terjadi di Samudera Hindia berupa mode dari variabilitas iklim
antartahun yang menghasilkan anomali angin, suhu permukaan laut dan curah
hujan di seluruh wilayah Samudera Hindia yang membawa kekeringan di
Indonesia (Septicorini 2009).

Gambar 6IOD positif pada tahun 1997 dengan suhu tinggi berada
pada kutub barat (west) dan rendah pada kutub timur
(east) (BOM 2010)
Intensitas IOD diwakili oleh anomali gradien suhu permukaan laut antara
Samudera Hindia bagian barat dan Samudera Hindia bagian timur. Gradien ini
disebut sebagai Dipole Mode Indeks (DMI). Jika DMI bernilai positif maka
menandakan fenomena IOD positif. Ketika DMI bernilai negatif maka terjadi
fenomena IOD negatif (JAMSTEC 2007).
Periode IOD positif ditandai dengan lebih dinginnya suhu di Samudera
Hindia bagian timur dibandingkan dengan suhu di Samudera Hindia bagian barat.

13
IOD positif berhubungan dengan penurunan curah hujan di wilayah tengah dan
selatan Australia serta Indonesia. Sebaliknya, periode IOD negatif ditandai dengan
lebih hangatnya suhu di Samudera Hindia bagian timur dan lebih dingin di
Samudera Hindia bagian barat. IOD negatif berhubungan dengan peningkatan
curah hujan di bagian selatan Australia dan negara-negara lain yang mengelilingi
Samudra Hindia, seperti Indonesia (BOM 2010). Gambar 1 menunjukkan nilai
DMI dari tahun 1965 hingga tahun 1995.
Anomali Suhu Permukaan Laut NINO (ASPL NINO) merupakan indeks
suhu permukaan laut di beberapa daerah tertentu. Terdapat 4 wilayah NINO
menurut IRI (2007), yaitu NINO1+2, NINO3, NINO 3.4, dan NINO4. Wilayah
NINO1+2 terletak antara ekuator 0° - 10° LS dan 80° - 90° BB. Daerah ini yang
pertama kali mengalami peningkatan suhu ketika terjadi peristiwa El Nino.
NINO3 terletak pada wilayah tengah Samudera Pasifik yaitu antara 5° LU - 5° LS
dan 90° - 150° BB. Wilayah NINO 3.4 terletak antara ekuator 5° LS - 5° LU dan
170° - 120° BB. NINO4 terletak pada bagian barat Samudera Pasifik antara 5° LU
- 5° LS dan 150° BB - 160° BT. Peta wilayah NINO dapat dilihat pada Gambar 7.

Gambar 7Nilai Dipole Mode Indeks (DMI) dari tahun 1965 sampai tahun 1995
(JAMSTEC 2007)
NINO 3.4 umumnya lebih sering digunakan untuk variabilitas iklim global
yang berdampak luas. Variabilitas suhu permukaan laut di wilayah ini memiliki
efek paling kuat pada pergeseran curah hujan di Pasifik Barat (IRI 2007).
Pergeseran lokasi curah hujan dari barat ke pusat Pasifik menyebabkan perubahan
lokasi pemanasan sehingga mendorong sebagian besar sirkulasi atmosfer global.
Ruang lingkup penelitian juga ditetapkan agar cakupan tepat pada tujuan yang
ingin dicapai.Diagram alir metode penelitian dapat dilihat pada Gambar 8.

Gambar 8Wilayah NINO (IRI 2007)

14
Pengambilan dan Pemilihan Data
Data DMI dari tahun 1978 sampai tahun 2008 didapat dari perhitungan
selisih Sea Surface Temperature (SST) antara ujung barat (50° BT 70° BT,10°
LS 10° N) dan ujung timur (90°BT -110°BT, 10°LS -0° LS) Samudera Hindia.
Data ini didapat dari situs IRI dengan cara membuka link data ERSST dari IRI
Data Library (IRIDL). Pada link tersebut kemudian akan dipilih data DMI (bagian
data selection) berdasarkan rentang waktu dan wilayah yang diinginkan.Data
NINO 3.4 memiliki rentang tahun yang sama dengan DMI. Data ini juga didapat
dari situs IRI dengan cara yang sama. Data observasi merupakan data curah hujan
tahun 1978-2008 dari 15 stasiun cuaca di Kabupaten Indramayu. DMI dan ASPL
NINO 3.4 digunakan sebagai prediktor sedangkan data CHMK MJJA sebagai
yang akan diprediksi. Gambar 9 menunjukkan peta wilayah 36 stasiun cuaca di
Kabupaten Indramayu. Stasiun yang digunakan pada penelitian diwakilkan
dengan kotak berwarna merah. Data curah hujan tersebut terbagi dalam 15 stasiun
hujan, yaitu:
1 Bangkir
2 Bulak
3 Bondan
4 Cidempet
5 Cikedung
6 Juntinyuat
7 Kedokan Bunder
8 Krangkeng
9 Losarang
10 Lohbener
11 Sukadana
12 Sumurwatu
13 Sudimampir
14 Tugu
15 Ujungaris

Gambar 9Peta wilayah stasiun cuaca Kabupaten Indramayu

15
Pemilihan prediktor untuk memprediksi CHMK MJJA dilakukan dengan
cara mengorelasikan DMI dan ASPL NINO 3.4 perbulan terhadap data curah
hujan musim kemarau MJJA dari stasiun cuaca yang digunakan. Hasil yang
didapatkan dengan mengorelasikan 2 nilai tersebut meperlihatkan bulan dengan
DMI dan ASPL NINO 3.4 yang memiliki nilai keterkaitan yang besar terhadap
nilai curah hujan musim kemarau.Tidak semua bulan prediktor DMI dan NINO
3.4 yang digunakan, hanya bulan dengan korelasi tertinggi dengan menggunakan
metode Pearson dengan curah hujan musim kemarau yang akan digunakan
sebagai prediktor.
Gambar 10 menunjukkan korelasi tertinggi DMI berada pada bulan Oktober
dengan nilai 0.50, korelasi tertinggi kedua pada bulan November dengan nilai
0.47, tertinggi ketiga pada bulan September dengan nilai 0.40. Gambar 11
menunjukkan nilai korelasi prediktor ASPL NINO 3.4. Nilai korelasi tertinggi
ASPL NINO 3.4 dimiliki oleh bulan Februari dengan nilai 0.24,bulan Januari
sebesar 0.20, dan bulan September sebesar 0.20. Nilai korelasi DMI dan ASPL
NINO 3.4 lebih lengkapnya dapat dilihat pada Lampiran 1 dan Lampiran 2.
0,6
0,5
0,4
0,3
0,2
0,1
0
-0,1

Sep

Oct

Nov

-0,2

Dec

Jan

Feb

Mar

Korelasi

Gambar 10Nilai korelasi DMI dengan CHMK MJJA
0,3
0,25
0,2
0,15
0,1
0,05
0
Sep

Oct

Nov

Dec

Jan

Feb

Mar

Korelasi

Gambar 11Nilai korelasi ASPL NINO 3.4 dengan CHMK MJJA

16
Nilai korelasi DMI dan ASPL NINO 3.4 terhadap curah hujan musim
kemarau dengan metode Pearson memiliki nilai negatif dan positif. Nilai negatif
pada korelasi data DMI menunjukkan hubungan yang berbanding terbalik.
Semakinbesar nilai DMI maka semakin kecil nilai curah hujan musim kemarau.
Hal ini dikarenakan suhu di Samudra Hindia bagian timur lebih rendah daripada
di bagian barat sehingga menyebabkan IOD positif yang berhubungan dengan
penurunan curah hujan di Indonesia. Korelasi NINO 3.4 yang bernilai positif
menunjukkan hubungan yang berbanding lurus. Semakin besar nilai NINO 3.4
maka semakin besar pula nilai curah hujan musim kemarau.Berdasarkan hasil
korelasi, penelitian ini akan menggunakan DMI pada bulan September, Oktober,
November serta indeks NINO 3.4 pada bulan September, Januari, dan Februari
sebagai prediktor dalam penyusunan model prediksi.

Kinerja Model Berdasarkan Algoritme Optimasi
Penelitian dilakukan terhadap data latih 20 tahunan dan data uji sebanyak 10
tahun. Kinerja dari fungsi kernel SVR dapat terlihat dari tingkat korelasi dan nilai
galat prediksi terhadap data pengamatan. Kinerja model dikatakan baik apabila
tingkat korelasi besar dan nilai galat prediksi yang dihasilkan kecil.
Pelatihan dengan menggunakan SVR membutuhkan parameter yang sesuai
dengan kernelnya. Untuk mendapatkan kernel yang optimal, pada saat pelatihan
dilakukan optimasi dengan menggunakan algoritme hybrid GAPSO. Parameter
yang dioptimalkan pada kernel RBF adalah parameter C dan parameter γ(gamma).
Berdasarkan hasil perhitungan optimasi parameter kernel RBF dengan
menggunakan 24 populasi, 100 kali iterasi untuk masing-masing proses pada GA
dan PSO, 10 iterasi proses GAPSO, rentang nilai C dan γsecara berurutan dari 0.1
hingga 50 dan 0 hingga 10, didapat nilai korelasi dan galat NRMSE dari prediksi
curah hujan musim kemarau MJJA untuk tiap stasiun. Tabel 1 memperlihatkan
nilai korelasi danNormalized Root Mean Square Error (NRMSE) dari masingmasing stasiun cuaca di Kabupaten Indramayu. Hasil prediksi lengkap dapat
dilihat pada Lampiran 3 hingga lampiran 17.
Penjelasan lebih lanjut dari kinerja fungsi kernel RBF pada model
SVRdijelaskan dalam grafik perbandingan Gambar 12. Grafik perbandingan
menggambarkan hubungan antara nilai observasi dan hasil prediksi CHMK MJJA.
Hubungan yang kuat antara observasi dan prediksi menunjukkan korelasi yang
semakin kuat dan semakin kecil pula ukuran galat antara nilai yang diamati dan
prediksi. Hasil lengkap grafik perbandingan untuk setiap stasiun cuaca dapat
dilihat pada Lampiran 18.
Pada Tabel 1 menunjukkan nilai observasi dan hasil prediksi CHMK MJJA
stasiun Tugu dan Bulak yang memiliki nilai koefisien korelasi terbesar, yakni 0.87
dan Stasiun Cikedung yang memiliki nilai NRMSE terkecil, yakni 9.01. Nilai
NRMSE stasiun Tugu adalah 10.43. Nilai ini lebih kecil dibandingkan dengan
NRMSE stasiun Bulak, yakni 11.53.

17
Tabel 1Nilai korelasi dan NRMSE stasiun hujan Kabupaten Indramayu
Stasiun
Bangkir
Bulak
Bondan
Cidempet
Cikedung
Juntinyuat
Kedokan Bunder
Krangkeng
Losarang
(a)
Lohbener
Sukadana
Sumurwatu
Sudimampir
Tugu
Ujungaris

Korelasi
0.72
0.87
0.72
0.67
0.78
0.72
0.82
0.13
0.32
0.78
0.57
0.73
0.49
0.87
0.49

(b)

NRMSE
13.93
11.53
9.47
16.02
9.01
16.56
15.16
32.55
15.10
12.22
20.85
15.60
18.49
10.43
17.98

(a)
(b)
Gambar 12Grafik perbandingan observasi dan prediksi CHMK MJJA (a) Stasiun Tugu
yang memiliki nilai koefisien korelasi terbesar, (b) Stasiun Cikedung yang
memiliki nilai galat NRMSE terkecil
Pada titik tertentu terdapat beberapa nilai curah hujan yang ekstrim pada
data observasi seperti, antara tahun 2001/2002, 2004/2005, dan 2007/2008 serta
beberapa titik ekstrim lainnya yang minimum dari curah hujan observasi.
Pendugaan dengan data DMI dan NINO 3.4 pada titik ekstrim tesebut belum
menghasilkan nilai prediksi yang optimal karena hasil prediksi yang dihasilkan
oleh model belum sensitif menangkap pola ekstrim tersebut.
Scatter plot pada Gambar 13 menunjukkan pola hubungan antara nilai
observasi dan nilai prediksi. Hubungan linear yang membentuk garis lurus
mengindikasikan bahwa ada hubungan yang erat antara observasi dan hasil
prediksi.Scatter plot untuk setiap stasiun cuaca dapat dilihat pada Lampiran 19.

18

Gambar 13Scatter plot observasi dengan prediksi (a) Stasiun Tugu dan (b) Stasiun
Cikedung
Hasil evaluasi prediksi yang diperoleh dengan menggunakan pemodelan
SVR yang dioptimasi dengan 3 metode berbeda menunjukkan variasi nilai
korelasi dan NRMSE. Perbandingan kinerja dari model SVR berdasarkan metode
optimasi dapat dilihat pada Tabel 2. SVR yang dioptimasi dengan hanya
menggunakan GA menghasilkan nilai korelasi yang rendah dan galat NRMSE
yang tinggi dibandingkan dengan menggunakan optimasi GAPSO dan PSO. SVR
yang dioptimasi dengan menggunakan PSO memiliki nilai korelasi dan galat
NRMSE yang tidak jauh berbeda dengan dengan nilai korelasi GAPSO. Namun,
nilai NRMSE yang dioptimasi dengan menggunakan PSO masih lebih tinggi bila
dibandingkan dengan menggunakan GAPSO. Grafik perbandingan nilai korelasi
dan NRMSE untuk masing-masing optimasi dapat dilihat pada Gambar 14 dan
Gambar 15.
Tabel 2Nilai koefisien korelasi dan NRMSE untuk masing-masing optimasi pada
tiap stasiun cuaca
Stasiun
Bangkir
Bulak
Bondan
Cidempet
Cikedung
Juntinyuat
Kedokan Bunder
Krangkeng
Losarang
Lohbener
Sukadana
Sumurwatu
Sudimampir
Tugu
Ujungaris

GAPSO
Korelasi
NRMSE
0.72
13.93
0.87
11.53
0.72
9.47
0.67
16.02
0.78
9.01
0.72
16.56
0.82
15.16
0.13
32.55
0.32
15.10
0.78
12.22
0.57
20.85
0.73
15.60
0.49
18.49
0.87
10.43
0.49
17.98

GA
Korelasi
NRMSE
0.52
18.18
0.66
19.82
0.54
11.19
0.56
20.94
0.75
10.83
0.58
20.66
0.81
22.91
0.06
34.19
0.25
17.32
0.69
18.42
0.61
25.37
0.77
17.65
0.36
23.87
0.70
12.66
0.35
20.31

PSO
Korelasi
NRMSE
0.72
13.79
0.88
11.47
0.57
10.96
0.64
16.16
0.78
9.04
0.72
16.67
0.81
17.49
0.13
32.55
0.32
16.07
0.80
12.08
0.63
24.82
0.80
16.35
0.47
18.68
0.79
11.05
0.44
18.40

Model SVR yang dioptimasi dengan GA menghasilkan nilai korelasi
tertinggi pada stasiun Kedokan Bunder sebesar 0.81 dan NRMSE terendah pada
stasiun Cikedung sebesar 10.83. Selanjutnya hasil prediksi dengan menggunakan

19

1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0

GAPSO
GA
Ujungaris

Tugu

Sudimampir

Sumurwatu

Sukadana

Lohbener

Losarang

Krangkeng

Juntinyuat

Kedokan Bunder

Cikedung

Cidempet

Bondan

Bulak

PSO
Bangkir

Korelasi

optimasi PSO menunjukkan stasiun yang memiliki nilai korelasi tertinggi adalah
Bulak sebesar 0.88, sedangkan stasiun Cikedung memiliki nilai NRMSE terendah
sebesar 9.04. Secara keseluruhan SVR yang dioptimasi dengan menggunakan
metode hybrid GAPSO menghasilkan nilai prediksi yang yang lebih baik
dibandingkan dengan penerapan terpisah metode optimasi GA dan PSO. Hal ini
ditunjukkan dengan nilai korelasi yang tinggi dan NRMSE yang rendah untuk
seluruh stasiun cuaca.

40
35
30
25
20
15
10
5
0

GAPSO
GA

Ujungaris

Tugu

Sudimampir

Sumurwatu

Lohbener

Sukadana

Losarang

Krangkeng

Kedokan Bunder

Juntinyuat

Cikedung

Cidempet

Bondan

Bulak

PSO
Bangkir

NRMSE

Gambar 14Grafik perbandingan nilai korelasi hasil prediksi metode
optimasi GAPSO, GA, dan PSO

Gambar 15Grafik perbandingan nilai NRMSE hasil prediksi metode
optimasi GAPSO, GA, dan PSO
Analisis dan Evaluasi Hasil
Prediksi curah hujan musim kemarau dengan menggunakan SVR yang
dioptimasi dengan algoritme hybrid GAPSO menghasilkan nilai koefisien korelasi
dan nilai galat NRMSE yang bervariasi. Berdasarkan fungsi kernel RBF, stasiun

20
Tugu dan Bulak memiliki nilai korelasi terbesar, sedangkan stasiun Cikedung
memiliki niali galat NRMSE terkecil. Nilai koefisien korelasi, galat NRMSE
antara hasil prediksi dengan data observasi curah hujan di musim kemarau di
Kabupaten Indramayu secara lengkap disajikan pada Gambar 16 dan Gambar 17.
1