Prediksi panjang musim hujan menggunakan support vector regression

PREDIKSI PANJANG MUSIM HUJAN MENGGUNAKAN
SUPPORT VECTOR REGRESSION

ABDUL BASITH HERMANIANTO

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Prediksi Panjang
Musim Hujan Menggunakan Support Vector Regression adalah benar karya saya
dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun
kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip
dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah
disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir
skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.
Bogor, Juli 2014
Abdul Basith Hermanianto
NIM G64100021

ABSTRAK
ABDUL BASITH HERMANIANTO. Prediksi Panjang Musim Hujan
Menggunakan Support Vector Regression. Dibimbing oleh AGUS BUONO dan
KARLINA KHIYARIN NISA.
Letak Indonesia yang berada di antara Samudra Pasifik dan Samudra
Hindia menyebabkan kondisi iklim di Indonesia dipengaruhi oleh kondisi iklim
global di kedua samudra tersebut. Oleh karena itu, panjang musim hujan sulit
diprediksi. Penelitian ini bertujuan untuk membuat permodelan prediksi panjang
musim hujan (PMH) menggunakan metode support vector regression (SVR).
Prediktor yang digunakan adalah southern oscillation index (SOI) dari Samudra
Pasifik dan dipole mode index (DMI) dari Samudra Hindia. Model yang terbentuk
kemudian dievaluasi menggunakan koefisien determinasi (R2) dan root mean
square error (RMSE). Data yang digunakan pada penelitian ini adalah data PMH
di 3 stasiun cuaca di Kabupaten Pacitan (Arjosari, Kebon Agung, dan Pringkuku)
tahun 1982/1983 hingga 2011/2012 sebagai data observasi serta data SOI dan

DMI tahun 1982 hingga 2011 sebagai data prediktor. Penelitian ini menghasilkan
model prediksi pada tiap stasiun cuaca. Nilai R2 terbaik pada stasiun cuaca
Arjosari, Kebon Agung, dan Pringkuku secara berturut-turut adalah 0.73, 0.63,
dan 0.58. Sementara itu, nilai RMSE terbaik pada stasiun cuaca Arjosari, Kebon
Agung, dan Pringkuku secara berturut-turut adalah 2.45, 3.23, dan 2.86.
Kata kunci: DMI, panjang musim hujan, SOI, SVR

ABSTRACT
ABDUL BASITH HERMANIANTO. Rainy Season Length Prediction Using
Support Vector Regression. Supervised by AGUS BUONO and KARLINA
KHIYARIN NISA.
Climate condition in Indonesia is influenced by the global condition on
both Pacific Ocean and Indian Ocean. This fact has caused difficulty in
determining the length of rainy season in Indonesia. The goal of this research is to
develop a model of rainy season length prediction using support vector regression
(SVR). The predictors are southern oscillation index (SOI) from Pacific Ocean
and dipole mode index (DMI) from Indian Ocean. The prediction model is then
evaluated with determination coefficient (R2) and root mean square error (RMSE).
The data used in this research is the length of rainy season data from 3 weather
stations in Pacitan district (Arjosari, Kebon Agung, and Pringkuku) between

1982/1983 and 2011/2012 as the observation data and SOI and DMI between
1982 and 2011 as the predictor data. The result of this research is a prediction
model for each climate station. The best R2 for Arjosari, Kebon Agung, and
Pringkuku weather stations are 0.73, 0.63, and 0.58 respectively. Meanwhile, the
best RMSE for Arjosari, Kebon Agung, and Pringkuku weather stations are 2.45,
3.23, and 2.86 respectively.
Keywords: DMI, length of rainy season, SOI, SVR

PREDIKSI PANJANG MUSIM HUJAN MENGGUNAKAN
SUPPORT VECTOR REGRESSION

ABDUL BASITH HERMANIANTO

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

Penguji: M. Asyhar Agmalaro, SSi MKom

Judul Skripsi : Prediksi Panjang Musim Hujan Menggunakan Support Vector
Regression
Nama
: Abdul Basith Hermanianto
NIM
: G64100021

Disetujui oleh

Dr Ir Agus Buono, MSi MKom
Pembimbing I

Karlina Khiyarin Nisa, SKom MT

Pembimbing II

Diketahui oleh

Dr Ir Agus Buono, MSi MKom
Ketua Departemen

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Penelitian
yang dilaksanakan sejak bulan Februari 2014 ini berjudul Prediksi Panjang Musim
Hujan Menggunakan Support Vector Regression.
Terima kasih penulis ucapkan kepada pihak-pihak yang telah berperan
dalam penyelesaian tugas akhir ini, antara lain:
1
Ibu dan ayah penulis, Suratun dan Joko Hermanianto, yang selalu
memberikan kasih sayang, dukungan, dan doa kepada penulis. Terima kasih
juga untuk keluarga penulis atas semua dukungan yang diberikan.

2
Bapak Dr Ir Agus Buono, MSi MKom dan Ibu Karlina Khiyarin Nisa,
SKom MT selaku pembimbing yang telah memberi arahan dan saran dalam
penyelesaian tugas akhir ini.
3
Bapak M. Asyhar Agmalaro, SSi MKom selaku dosen penguji yang telah
memberi masukan untuk penyelesaian tugas akhir ini.
4
Fildza, Amalia, Sintya, dan Khanif selaku rekan-rekan satu bimbingan atas
kerja sama dan bantuannya selama penulis menyelesaikan tugas akhir.
Terima kasih juga untuk Kak Gita, Shailla, Hariz, dan Uqi yang telah
memberikan bantuan dalam pengerjaan tugas akhir ini.
5
Seluruh dosen Departemen Ilmu Komputer atas ilmu yang telah diberikan
kepada penulis.
6
Pak Rizki, Pak Irvan, Pak Ridwan, dan pegawai Departemen Ilmu
Komputer lainnya yang telah memberikan bantuan kepada penulis, terutama
bantuan mengenai urusan administrasi di departemen.
7

Teman-teman S1 Ilmu Komputer angkatan 47 (Pixels 47), Forkom Alims
SMAN 1 Bogor, kelas IPA 8 Rakit Bambu SMAN 1 Bogor, kelas B12 TPB
IPB angkatan 47, asrama C2 lorong 9 angkatan 47, Himalkom IPB masa
bakti 2011-2012, Himalkom IPB masa bakti 2012-2013, dan angkatan
Rakit Bambu SMAN 1 Bogor yang telah mendukung penulis dan
memberikan banyak pelajaran hidup bagi penulis. Terima kasih kepada
Ocit, Bani, Zhilal, Thony, Angga, Dwiki, PN, Teki, Azza, Ardhito, Taufiq,
Mardi, Adit, Sodik, Dhiya, Rake, Edo, Suci, Atana, Ayu, Indry, Wahid,
Afit, dan teman-teman lain yang tidak dapat penulis sebutkan satu persatu.
8
Kakak angkatan (45 dan 46) serta adik angkatan (48 dan 49) S1 Ilmu
Komputer IPB yang telah memberikan dukungan kepada penulis. Terima
kasih kepada Bang Dan, Bang Momi, Tri, Lutfi, Ikhsan, Lusi, Nadia, dan
teman-teman lainnya.
serta pihak-pihak lain yang tidak dapat penulis sebutkan satu persatu.
Semoga karya ilmiah ini bermanfaat.

Bogor, Juli 2014
Abdul Basith Hermanianto


DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

PENDAHULUAN

1

Latar Belakang

1


Perumusan Masalah

2

Tujuan Penelitian

2

Manfaat Penelitian

2

Ruang Lingkup Penelitian

2

METODE

3


Identifikasi dan Perumusan Masalah

3

Pengambilan dan Pemilihan Data

4

Pembagian Data

7

Proses Support Vector Regression (SVR)

7

Pengujian Model

10


Analisis dan Evaluasi

10

Lingkungan Pengembangan

11

HASIL DAN PEMBAHASAN

11

Pengambilan dan Pemilihan Data

11

Proses Support Vector Regression (SVR)

13

SIMPULAN DAN SARAN

18

Simpulan

18

Saran

19

DAFTAR PUSTAKA

19

LAMPIRAN

21

RIWAYAT HIDUP

28

DAFTAR GAMBAR
1 Diagram alir pengerjaan penelitian
2 Ilustrasi penentuan panjang musim hujan pada stasiun cuaca Arjosari
periode 2011 hingga 2012
3 Peta Kabupaten Pacitan (Satyana 2014)
4 Cakupan wilayah perhitungan DMI (BOM 2014a)
5 Ilustrasi nonlinear support vector regression
6 Hasil korelasi SOI-PMH (♦) dan DMI-PMH (▲) di stasiun cuaca
Arjosari
7 Hasil korelasi SOI-PMH (♦) dan DMI-PMH (▲) di stasiun cuaca
Kebon Agung
8 Hasil korelasi SOI-PMH (♦) dan DMI-PMH (▲) di stasiun cuaca
Pringkuku
9 Perbandingan nilai akurasi setiap kernel pada stasiun Arjosari: (a)
nilai R2 dan (b) nilai RMSE
10 Diagram garis perbandingan nilai hasil prediksi dengan nilai observasi
pada stasiun cuaca Arjosari
11 Diagram pencar perbandingan nilai hasil prediksi dengan nilai
observasi pada stasiun cuaca Arjosari
12 Perbandingan nilai akurasi setiap kernel pada stasiun Kebon Agung:
(a) nilai R2 dan (b) nilai RMSE
13 Diagram garis perbandingan nilai hasil prediksi dengan nilai observasi
pada stasiun cuaca Kebon Agung
14 Diagram pencar perbandingan nilai hasil prediksi dengan nilai
observasi pada stasiun cuaca Kebon Agung
15 Perbandingan nilai akurasi setiap kernel pada stasiun Pringkuku: (a)
nilai R2 dan (b) nilai RMSE
16 Diagram garis perbandingan nilai hasil prediksi dengan nilai observasi
pada stasiun cuaca Pringkuku
17 Diagram pencar perbandingan nilai hasil prediksi dengan nilai
observasi pada stasiun cuaca Pringkuku
18 Perbandingan nilai akurasi model terbaik pada setiap stasiun cuaca:
(a) nilai R2 dan (b) nilai RMSE

3
5
5
7
9
11
12
13
14
14
14
15
16
16
17
17
17
18

DAFTAR LAMPIRAN
1 Nilai SOI dan DMI yang digunakan untuk permodelan SVR pada
stasiun cuaca Arjosari
2 Nilai SOI dan DMI yang digunakan untuk permodelan SVR pada
stasiun cuaca Kebon Agung
3 Nilai SOI yang digunakan untuk permodelan SVR pada stasiun cuaca
Pringkuku
4 Nilai DMI yang digunakan untuk permodelan SVR pada stasiun cuaca
Pringkuku
5 Nilai panjang musim hujan hasil observasi dan hasil prediksi
menggunakan kernel RBF, linear, dan polinomial pada stasiun cuaca
Arjosari

21
22
23
24

25

6 Nilai panjang musim hujan hasil observasi dan hasil prediksi
menggunakan kernel RBF, linear, dan polinomial pada stasiun cuaca
Kebon Agung
7 Nilai panjang musim hujan hasil observasi dan hasil prediksi
menggunakan kernel RBF, linear, dan polinomial pada stasiun cuaca
Pringkuku

26

27

PENDAHULUAN
Latar Belakang
Iklim adalah salah satu komponen ekosistem yang cukup berpengaruh bagi
kehidupan manusia, temasuk di bidang pertanian. Akan tetapi, iklim memiliki
sifat yang dinamis dan sulit dikendalikan. Keadaan iklim dapat berubah-ubah
seiring berjalannya waktu. Karena sifatnya yang dinamis, analisis terhadap
karakteristik iklim diperlukan agar kondisi iklim suatu daerah dapat lebih
dipahami dan informasi yang didapatkan dapat bermanfaat untuk keperluan
sehari-hari manusia.
Salah satu pengaruh iklim yang dapat dianalisis adalah panjang musim
hujan (PMH) suatu daerah. Panjang musim hujan sangat berpengaruh bagi
berbagai sektor kehidupan seperti pertanian, perikanan, dan sektor pembangunan.
Diketahuinya panjang atau pendek musim hujan pada suatu periode menentukan
kebijakan paling tepat yang dapat diambil untuk menyesuaikan dengan keadaan
iklim dan cuaca yang ada.
Indonesia merupakan negara kepulauan yang terletak di antara dua
samudra, yaitu Samudra Pasifik dan Samudra Hindia. Oleh karena itu, setiap
gejala iklim yang terjadi di kedua samudra tersebut turut memengaruhi keadaan
iklim di Indonesia sendiri. Ada beberapa peubah iklim global yang dapat
merepresentasikan perubahan atau anomali iklim yang terjadi baik di Samudra
Pasifik maupun Samudra Hindia, di antaranya adalah southern oscillation index
(SOI) dan dipole mode index (DMI). SOI merupakan indeks yang merefleksikan
kondisi Samudra Pasifik dibandingkan dengan keadaan lautan di sekitar
Indonesia. Pemilihan indeks ini berdasarkan fakta bahwa musim di Indonesia
dipengaruhi oleh kondisi Samudra Pasifik (Buono et al. 2014). SOI digunakan
untuk mengindikasikan perubahan dan intensitas dari El-Nino atau La-Nina di
Samudra Pasifik. Sementara itu, DMI mengindikasikan perbedaan suhu pada
ujung barat dan timur dari Samudra Hindia (Behera et al. 2013). Nilai DMI yang
positif mengindikasikan pergerakan angin di Samudra Hindia dari timur ke barat
sehingga menyebabkan keadaan iklim Indonesia menjadi kering. Sebaliknya nilai
DMI yang negatif mengindikasikan pergerakan angin di Samudra Hindia dari
barat ke timur sehingga menyebabkan lebih banyak hujan terjadi di Indonesia
(Chandrasekar 2010). Karena dapat merepresentasikan kondisi iklim di Samudra
Pasifik dan Samudra Hindia, kedua peubah iklim global tersebut dapat dijadikan
prediktor dalam melakukan prediksi terhadap kondisi iklim di Indonesia, termasuk
panjang musim hujannya.
Support vector machine (SVM) adalah salah satu metode machine
learning yang dikembangkan berdasarkan teori pembelajaran secara statistik
(Radhika dan Shashi 2009). SVM dapat digunakan untuk melakukan klasifikasi
maupun regresi. SVM yang digunakan untuk regresi sering dikenal juga dengan
istilah support vector regression (SVR). Penelitian menggunakan SVR telah
dilakukan sebelumnya oleh Adhani (2013) untuk memprediksi curah hujan pada
musim kemarau dengan SOI dan suhu permukaan laut Nino3.4 sebagai prediktor.
Penelitian tersebut menghasilkan nilai koefisien determinasi (R2) terbaik sebesar
0.76 dan root mean square error (RMSE) terbaik sebesar 1.73. Penelitian

2
menggunakan SVR juga telah dilakukan oleh Larasati (2012) untuk melakukan
pendugaan awal musim hujan dengan SOI sebagai prediktornya. Penelitian
tersebut menghasilkan nilai koefisien determinasi (R2) terbaik sebesar 0.7 dan root
mean square error (RMSE) terbaik sebesar 2.3.

Perumusan Masalah
Perubahan iklim yang terjadi di Indonesia banyak berdampak bagi
kehidupan masyarakat Indonesia di berbagai bidang. Berbagai strategi
penyesuaian terhadap perubahan iklim diperlukan untuk mengurangi dampak
negatif yang ditimbulkan oleh perubahan iklim. Salah satu strategi yang dapat
diterapkan adalah dengan mempelajari sifat dan karakteristik iklim dan
komponennya seperti panjang musim hujan serta gejala yang memengaruhinya.
Penelitian ini difokuskan untuk memprediksi panjang musim hujan di
Kabupaten Pacitan menggunakan metode support vector regression (SVR).
Prediktor yang digunakan ialah data southern oscillation index (SOI) dan dipole
mode index (DMI).
Dari rumusan masalah di atas, muncul pertanyaan penelitian sebagai berikut:
1 Bagaimana melakukan prediksi panjang musim hujan dengan southern
oscillation index (SOI) dan dipole mode index (DMI) sebagai prediktor
menggunakan metode SVR?
2 Bagaimana kinerja dari model prediksi panjang musim hujan
menggunakan metode SVR?

Tujuan Penelitian
Penelitian ini bertujuan melakukan permodelan prediksi panjang musim
hujan menggunakan metode support vector regression (SVR) dengan prediktor
southern oscillation index (SOI) dan dipole mode index (DMI) serta mengevaluasi
model yang dihasilkan.

Manfaat Penelitian
Prediksi panjang musim hujan yang diperoleh dari penelitian ini diharapkan
dapat membantu berbagai bidang yang membutuhkan informasi prediksi panjang
musim hujan antara lain: pertanian, perikanan, perkebunan, kehutanan,
pembangunan gedung, dan lain-lain. Masyarakat dapat mengembangkan strategi
yang tepat dalam menghadapi panjang musim hujan yang berbeda-beda tiap
tahunnya.

Ruang Lingkup Penelitian
Ruang lingkup dalam penelitian ini:

3
1

Penelitian ini difokuskan pada pencarian model prediksi panjang musim
hujan terbaik dari hasil pembelajaran menggunakan SVR.
2 Penelitian menggunakan data SOI, DMI, dan data observasi dari stasiun
cuaca di Kabupaten Pacitan.
3 Metode yang digunakan adalah epsilon support vector regression (ɛ SVR) dengan kernel linear, polinomial, dan radial basis function (RBF).
4 Penelitian ini menggunakan studi kasus di Kabupaten Pacitan.

METODE
Metode penelitian yang dilakukan terdiri atas beberapa tahap, yaitu: (1)
identifikasi dan perumusan masalah, (2) pengambilan dan pemilihan data, (3)
pembagian data, (4) proses support vector regression (SVR), (5) pengujian model,
dan (6) analisis dan evaluasi. Diagram alir penelitian ini dapat dilihat pada
Gambar 1.
Pemilihan kernel
dan parameter
SVR
Grid Search
Mulai

Pembagian data

Data
Latih

Studi literatur dan
perumusan masalah

Pemilihan
data

Data Uji

Selesai

Analisis dan
evaluasi

Pengujian

Pembentukan
model SVR

Model SVR

Gambar 1 Diagram alir pengerjaan penelitian

Identifikasi dan Perumusan Masalah
Penelitian yang dilakukan memiliki tujuan utama mengembangkan model
support vector regression yang tepat untuk memprediksi panjang musim hujan di
Kabupaten Pacitan. Untuk mencapai tujuan penelitian tersebut, pemahaman dalam
mengidentifikasi faktor-faktor penting yang dilibatkan dalam penelitian ini
diperlukan. Pemahaman tersebut diperoleh dengan cara melakukan studi pustaka
terhadap buku referensi dan jurnal-jurnal penelitian yang terkait dengan penelitian
ini. Referensi yang dipelajari meliputi pengertian SOI, pengertian DMI, hubungan
SOI dan DMI dengan keadaan iklim Indonesia, serta pengertian dan cara kerja
SVR. Dalam penelitian ini dilakukan juga pembatasan masalah dan ruang lingkup
agar cakupan penelitian yang dilakukan tidak terlalu luas dan tidak terlalu sempit.

4
Pengambilan dan Pemilihan Data
Data yang digunakan dalam penelitian ini adalah data observasi curah hujan
dari beberapa stasiun cuaca di Kabupaten Pacitan, data southern oscillation index
(SOI), dan data dipole mode index (DMI). Data observasi curah hujan yang
digunakan merupakan data curah hujan dari beberapa stasiun cuaca di Kabupaten
Pacitan pada rentang tahun 1982 sampai 2012. Data ini didapat dari Centre for
Climate Risk and Opportunity Management in Southeast Asia Pasific (CCROM SEAP) Institut Pertanian Bogor. Data observasi curah hujan ini kemudian
digunakan untuk menghitung panjang musim hujan (PMH). Untuk mendapatkan
data PMH, data observasi curah hujan yang berupa data curah hujan harian harus
diubah terlebih dahulu ke dalam bentuk dasarian. Dasarian adalah
pengelompokkan waktu menjadi 10 harian. Sebagai contoh, bulan Januari akan
terdiri dari 3 dasarian, yaitu dasarian I (tanggal 1 sampai 10), dasarian II (tanggal
11 sampai 20), dan dasarian III (tanggal 21 sampai akhir bulan). Pembagian
tersebut berlaku juga untuk bulan-bulan lainnya sehingga dalam 1 tahun akan
terdapat 36 dasarian. PMH dihitung berdasarkan banyaknya dasarian dari awal
musim hujan sampai akhir musim hujan. Kriteria awal musim hujan berdasarkan
ketentuan Badan Meteorologi, Klimatologi, dan Geofisika (BMKG) (2013) adalah
ketika tinggi curah hujan dasarian bulan-bulan musim hujan sudah lebih dari 50
mm dan terjadi secara berturut-turut sebanyak 2 dasarian. Sedangkan akhir musim
hujan adalah saat 1 dasarian sebelum awal musim kemarau. Definisi awal musim
kemarau berdasarkan ketentuan BMKG (2013) yaitu ketika tinggi curah hujan
dasarian pada bulan-bulan akhir musim hujan sudah kurang dari 50 mm yang
terjadi secara berturut-turut untuk 2 dasarian.
Gambar 2 menunjukkan ilustrasi penentuan panjang musim hujan pada
stasiun cuaca Arjosari pada periode Agustus 2011 hingga Juli 2012. Sumbu
horizontal menunjukkan periode musim hujan sedangkan sumbu vertikal
menunjukkan banyaknya curah hujan dalam satuan mm/dasarian. Garis horizontal
merah menunjukkan nilai curah hujan sebesar 50 mm/dasarian, yang digunakan
sebagai dasar penentuan dasarian yang memenuhi kriteria berdasarkan ketentuan
BMKG. Awal musim hujan pada ilustrasi Gambar 2 terjadi pada dasarian ketiga
bulan Oktober karena pada dasarian tersebut dan dasarian setelahnya (dasarian
pertama November) curah hujannya melebihi 50 mm/dasarian. Selain itu, Gambar
2 juga menunjukkan bahwa awal musim kemarau terjadi pada dasarian ketiga
bulan Mei karena pada dasarian tersebut dan satu dasarian setelahnya (dasarian
pertama Juni) nilai curah hujannya kurang dari 50 mm/dasarian. Panjang musim
hujan didapatkan dengan menghitung banyaknya dasarian mulai dari awal musim
hujan sampai satu dasarian sebelum awal musim kemarau, sehingga pada contoh
kasus Gambar 2 panjang musim hujannya adalah banyaknya dasarian mulai dari
dasarian ketiga Oktober sampai dengan dasarian kedua Mei yaitu 21 dasarian.
Data observasi curah hujan Kabupaten Pacitan yang digunakan dalam
penelitian ini diambil dari 3 stasiun cuaca, yaitu stasiun cuaca Arjosari, Kebon
Agung, dan Pringkuku. Peta Kabupaten Pacitan beserta ketiga kecamatan yang
digunakan datanya dapat dilihat pada Gambar 3 dengan tanda bintang
menunjukkan kecamatan tempat stasiun cuaca yang dimaksud berada.

5

Gambar 2 Ilustrasi penentuan panjang musim hujan pada stasiun cuaca
Arjosari periode 2011 hingga 2012

Gambar 3 Peta Kabupaten Pacitan (Satyana 2014)
Data SOI didapat dari situs Bureau of Meteorology (BOM) milik
pemerintahan Australia. SOI diukur dengan mengurangi anomali tekanan atmosfer
di daerah Tahiti (yang telah dibagi dengan standar deviasinya) dengan anomali
tekanan atmosfer di daerah Darwin, Australia. (yang telah dibagi dengan standar
deviasinya) (Clarke 2008). Perhitungan SOI dapat dirumuskan sebagai berikut:

6
a

dengan
Pdiff
Pdiff ave

= Perbedaan tekanan permukaan laut bulanan di Tahiti dan Darwin
= Rata-rata perbedaan tekanan permukaan laut bulanan di Tahiti dan
Darwin
Stdev Pdiff = Simpangan baku perbedaan tekanan permukaan laut bulanan di Tahiti
dan Darwin
Data DMI didapat dari menghitung selisih dari sea surface temperature
(SST) antara ujung barat (50E-70E,10S-10N) dan ujung timur (90E-110E,10S0N) Samudra Hindia (Saji et al. 1999). Cakupan wilayah untuk perhitungan DMI
dapat dilihat pada Gambar 4. DMI dapat dihitung menggunakan rumus sebagai
berikut:
a

dengan
Pdiff
Pdiff ave

= Perbedaan SST antara bagian barat dan bagian timur Samudra Hindia
= Rata-rata perbedaan SST antara bagian barat dan bagian timur
Samudra Hindia
Stdev Pdiff = Simpangan baku perbedaan SST antara bagian barat dan bagian timur
Samudra Hindia
Data SST sendiri didapat dari situs International Research Institute for
Climate and Society (IRI) milik Universitas Columbia, Amerika Serikat. Data
SST didapat dengan cara membuka tautan data extended reconstructed sea surface
temperature (ERSST) dari IRI Data Library (IRIDL). Pada tautan tersebut kemudian
dipilih data SST (bagian data selection) berdasarkan rentang waktu dan wilayah yang
diinginkan. Data SOI dan DMI yang digunakan adalah data SOI dan DMI dari
tahun 1982 sampai 2012.
Data PMH, SOI, dan DMI yang didapat selanjutnya diukur korelasinya
menggunakan analisis korelasi. Analisis korelasi yang digunakan adalah analisis
korelasi linear. Perhitungan analisis korelasi menurut Walpole (1992) adalah:

√[ ∑







][ ∑

(∑

)

(∑

) ]

Dengan
r = koefisien korelasi
xi = variabel pertama
yi = variabel kedua
n = jumlah data
Pada penelitian ini dilakukan dua buah analisis korelasi. Pertama, analisis
korelasi antara PMH dan SOI untuk menentukan bulan-bulan yang nilai SOI-nya
memiliki korelasi kuat dengan PMH. Kedua, analisis korelasi antara PMH dan
DMI untuk menentukan bulan-bulan yang nilai DMI-nya memiliki korelasi kuat
dengan PMH. Bulan-bulan yang dipilih adalah bulan-bulan yang memiliki

7
koefisien korelasi mendekati 1 atau - pada taraf nyata α. α yang d gunakan dalam
penelitian ini adalah 0.1 (10%).

Gambar 4 Cakupan wilayah perhitungan DMI (BOM 2014a)

Pembagian Data
Pembagian data dilakukan untuk memisahkan antara data latih dan data uji.
Data latih digunakan untuk membuat model dari support vector regression (SVR)
sedangkan data uji digunakan untuk mengevaluasi kinerja dari SVR yang telah
dimodelkan. Pembagian data dilakukan dengan metode percentage split. Pada
penelitian ini data dibagi menjadi dua bagian, yaitu 66.67% data (20 objek) untuk
data latih dan 33.33% data (10 objek) untuk data uji. Data yang digunakan sebagai
data latih adalah data 20 tahun awal (tahun 1982 hingga 2001) dari data yang ada,
sedangkan data yang digunakan sebagai data uji adalah data 10 tahun terakhir
(tahun 2002 hingga 2011) dari data yang ada.

Proses Support Vector Regression (SVR)
SVR merupakan penerapan support vector machine (SVM) untuk kasus
regresi. Dalam kasus regresi output berupa bilangan riil atau kontinu. SVR
merupakan metode yang dapat mengatasi overfitting sehingga akan menghasilkan
performansi yang bagus (Smola dan Schölkopf 2004). Ide dasar dari support
vector regression adalah dengan menentukan set data yang dibagi menjadi set
latih dan set uji. Kemudian dari set latih tersebut ditentukan suatu fungsi regresi
dengan batasan deviasi tertentu sehingga dapat menghasilkan prediksi yang
mendekati target aktual. Data latih diproses menggunakan pelatihan SVR untuk

8
memperoleh model terbaik. Data SOI, DMI, dan data panjang musim hujan
digunakan sebagai masukan untuk pelatihan.
Pada penelitian ini dilakukan pendekatan yang bersifat non-linear
separable. Gambar 5 menunjukkan sebuah ilustrasi SVR dengan pendekatan nonlinear. Pada gambar tersebut diilustrasikan suatu data latih λ, {(x1, y1), . . . , (xλ,
yλ)} ⊂ X × R, dengan X menunjukkan ruang input (e.g. X = R d ), akan dicari f(x)
yang memiliki deviasi maksimum ɛ dari setiap keluaran yi untuk semua masukan
data latih. Support vector regression (SVR) dengan parameter w dan b secara umum
dapat diekspresikan sebagai:
dengan x adalah masukan yang dipetakan ke dalam suatu ruang fitur oleh suatu
fungsi nonlinear Ø(x) (Yu et al. 2008). Koefisien w dan b diprediksi dengan
meminimalkan fungsi risiko yang didefinisikan dalam persamaan (Smola and
Schölkopf 2004):
mn
dengan kendala:

‖ ‖
,

, ,

λ

,

, ,

λ

Diasumsikan bahwa ada fungsi f yang dapat mendekati semua titik (xi, yi)
dengan pres s . Dalam hal n d asums kan bahwa semua t t k yang ada layak
(feasible) pada kisaran f ± . Dalam kasus t dak layak (infeasible), ada
kemungkinan bahwa beberapa titik berada di luar kisaran f ± . Penambahan
variabel slack ξ dan ξ* dapat digunakan untuk memecahkan masalah kendala
tidak layak (infeasible) pada masalah optimasi. Masalah optimasi ini dapat
dirumuskan sebagai berikut:
mn

∑(ξ

dengan kendala:

ξ)
ξ

ξ
ξ ,ξ

,

, ,



Dalam formulasi ganda (dual formulation), masalah optimasi SVR
dirumuskan sebagai berikut:
ma

∑∑

(



)

dengan kendala:
∑ α

α



9
α α

, , λ

adalah dot-product pada
dengan α dan α* adalah pengali Lagrange dan
kernel. Dengan menggunakan pengali Langrange dan kondisi optimalitas, fungsi
regresi dapat didefinisikan sebagai berikut:
λ

∑(α α )

Fungsi kernel dapat menyelesaikan kasus yang bersifat non-linear
separable ini. Setelahnya, SVR akan melakukan perhitungan linear untuk
menemukan hyperplane yang optimal pada ruang fitur tersebut. Kernel akan
memproyeksikan data dalam ruang fitur berdimensi tinggi untuk menaikkan
kemampuan komputasi dari mesin pembelajaran linear. Beberapa contoh fungsi
kernel antara lain:

Fungsi linear, persamaannya:


Fungsi polinomial, persamaannya:



Fungsi RBF, persamaannya:

Fungsi kernel yang digunakan dalam penelitian ini adalah linear,
polinomial, dan radial basis function (RBF). Kinerja model dari fungsi kernel
dapat diketahui melalui nilai koefisien determinasi (R2) dan root mean square
error (RMSE). Beberapa fungsi kernel memiliki nilai parameter yang harus
ditentukan terlebih dahulu. Parameter yang dimaksud adalah parameter , r, dan d
untuk fungsi kernel polinomial serta parameter untuk fungsi kernel RBF. Selain
parameter kernel, parameter lain yang harus ditentukan terlebih dahulu adalah
parameter C (cost). Parameter C merepresentasikan nilai penalti terkait galat yang
lebih besar daripada ɛ . Nilai parameter sangat berpengaruh terhadap model SVR
yang dihasilkan. Semakin optimal parameternya semakin baik model yang
dihasilkan.

Gambar 5 Ilustrasi nonlinear support vector regression

10
Pengujian Model
Pada tahap pengujian model, data uji digunakan untuk mengevaluasi kinerja
model SVR yang telah terbentuk sebelumnya dengan cara data uji dimasukkan
pada model SVR yang telah terbentuk. Pada tahap ini hasil terbaik dicari
menggunakan metode grid search. Metode grid search adalah metode yang
melibatkan penyusunan grid yang cocok dalam suatu ruang dimensi,
mengevaluasi fungsi objektif dari seluruh titik grid, serta menemukan titik grid
yang sesuai dengan fungsi objektif yang memiliki nilai optimum (Agmalaro
2011). Grid search yang diterapkan pada penelitian ini menyesuaikan dengan
kernel yang digunakan pada permodelan. Pada kernel linear, grid search yang
dilakukan adalah grid search 1 dimensi yaitu mencari C paling optimal. Pada
kernel polinomial, grid search yang dilakukan adalah grid search 4 dimensi yaitu
mencari C, , r, dan d paling optimal. Pada kernel RBF, grid search yang
dilakukan adalah grid search 2 dimensi yaitu mencari C dan pal ng opt mal.
Selanjutnya data prediksi panjang musim hujan yang dihasilkan oleh model SVR
akan dibandingkan dengan data panjang musim hujan yang telah dimiliki
sebelumnya.

Analisis dan Evaluasi
Pengukuran akurasi hasil prediksi yang diperoleh dengan model SVR
terhadap data uji menggunakan koefisien determinasi (R2) dan root mean square
error (RMSE). Kecocokan model dikatakan semakin baik jika R2 mendekati 1 dan
RMSE mendekati 0. Koefisien determinasi menunjukkan kekuatan hubungan
antara dua peubah. Menurut Walpole (1992) koefisien determinasi dirumuskan
sebagai berikut:
[∑ ̂ ̅̂
̅]


̂ ̅̂ ∑

̅

dengan
R2 = koefisien determinasi
yi = nilai aktual
ŷi = nilai prediksi
Nilai kesalahan (error) digunakan untuk mengetahui besarnya simpangan
nilai dugaan terhadap nilai aktual. Perhitungan galat menggunakan root mean square
error (RMSE) dirumuskan oleh Walpole (1992) sebagai berikut:

dengan
Xt = nilai aktual pada waktu ke-t
Ft = nilai dugaan pada waktu ke-t





11
Lingkungan Pengembangan
Spesifikasi perangkat keras yang digunakan dalam penelitian ini adalah
prosesor Intel Core i3, memori 2GB, dan operating system Microsoft® Windows
7 64bit. Adapun untuk perangkat lunak yang digunakan dalam penelitian ini
adalah Matlab R2013b 64bit, library LIBSVM (Chang dan Lin 2011), dan
Microsoft Excel 2007.

HASIL DAN PEMBAHASAN
Pengambilan dan Pemilihan Data
Data prediktor SOI yang didapat dari BOM dan DMI hasil perhitungan SST
dari IRIDL diseleksi agar dapat menjadi fitur yang representatif untuk proses SVR
yang dilakukan. Seleksi dilakukan dengan cara melakukan analisis korelasi linear
antara prediktor dengan data observasi yaitu PMH, kemudian bulan-bulan
prediktor yang memiliki korelasi kuat dengan PMH (memenuhi uji t) dipilih
menjadi atribut masukan pada proses SVR. Analisis korelasi dilakukan antara SOI
dengan PMH dan antara DMI dengan PMH. Kedua analisis korelasi tersebut
dilakukan pada setiap stasiun cuaca yang digunakan dalam penelitian ini
Ar osar , Kebon Agung, dan Pr ngkuku . Taraf nyata α yang d gunakan dalam
penelitian kali ini adalah 10%. Gambar 6, 7, dan 8 menunjukkan hasil korelasi dan
uji t pada setiap stasiun cuaca (Arjosari, Kebon Agung, dan Pringkuku).

Gambar 6 Hasil korelasi SOI-PMH (♦) dan DMI-PMH (▲) di
stasiun cuaca Arjosari
Gambar 6 menunjukkan korelasi antara SOI dan PMH serta korelasi antara
DMI dan PMH tiap bulannya pada stasiun cuaca Arjosari, termasuk bulan-bulan
yang korelasinya memenuhi uji t. Bulan-bulan yang korelasinya memenuhi uji t
yaitu bulan-bulan yang nilai korelasinya lebih besar dari nilai positif r tabel
(+0.3061) atau lebih kecil dari nilai negatif r tabel (-0.3061). Untuk variabel SOI,
bulan-bulan yang memenuhi syarat adalah bulan April (korelasi 0.44), Mei (0.44),

12
Juli (0.40), Agustus (0.41), September (0.48), November (0.38), dan Desember
(0.46), sedangkan untuk variabel DMI, bulan-bulan yang memenuhi syarat adalah
bulan September (-0.33) dan Oktober (-0.35). SOI dan DMI pada bulan-bulan
tersebut akan dijadikan masukan untuk proses SVR pada kasus stasiun Arjosari
sehingga setiap objek pada stasiun Arjosari memiliki 10 atribut yang terdiri atas 9
prediktor (7 SOI dan 2 DMI) dan 1 atribut observasi (PMH).
Gambar 7 menunjukkan korelasi antara SOI dan PMH serta korelasi antara
DMI dan PMH tiap bulannya pada stasiun cuaca Kebon Agung, termasuk bulanbulan yang korelasinya memenuhi uji t. Untuk variabel SOI, bulan-bulan yang
memenuhi syarat adalah bulan Agustus (0.44), September (0.49), Oktober (0.34),
November (0.32), dan Desember (0.36), sedangkan untuk variabel DMI, bulanbulan yang memenuhi syarat adalah bulan September (-0.42) dan Oktober (-0.38).
SOI dan DMI pada bulan-bulan tersebut akan dijadikan masukan untuk proses
SVR pada kasus stasiun Kebon Agung sehingga setiap objek pada stasiun Kebon
Agung memiliki 8 atribut yang terdiri atas 7 prediktor (5 SOI dan 2 DMI) dan 1
atribut observasi (PMH).
Gambar 8 menunjukkan korelasi antara SOI dan PMH serta korelasi antara
DMI dan PMH tiap bulannya pada stasiun cuaca Pringkuku, termasuk bulan-bulan
yang korelasinya memenuhi uji t. Untuk variabel SOI, bulan-bulan yang
memenuhi syarat adalah bulan Mei (0.51), Juni (0.34), Juli (0.53), Agustus (0.55),
September (0.55), Oktober (0.57), November (0.52), dan Desember (0.41),
sedangkan untuk variabel DMI, bulan-bulan yang memenuhi syarat adalah bulan
Januari (0.43), Februari (0.35), Maret (0.49), April (0.32), Juli (-0.34), September
(-0.48), Oktober (-0.49), dan November (-0.37). SOI dan DMI pada bulan-bulan
tersebut akan dijadikan masukan untuk proses SVR pada kasus stasiun Pringkuku
sehingga setiap objek pada stasiun Pringkuku memiliki 17 atribut yang terdiri atas
16 prediktor (8 SOI dan 8 DMI) dan 1 atribut observasi (PMH). Bulan bulan
yang dijadikan prediktor untuk setiap stasiun pada penelitian ini dapat dilihat pada
Tabel 1.

Gambar 7 Hasil korelasi SOI-PMH (♦) dan DMI-PMH (▲) di
stasiun cuaca Kebon Agung

13

Gambar 8 Hasil korelasi SOI-PMH (♦) dan DMI-PMH (▲) di
stasiun cuaca Pringkuku
Tabel 1 Bulan-bulan SOI dan DMI yang dijadikan prediktor pada proses SVR
Stasiun
Arjosari
Kebon
Agung

Bulan SOI
April, Mei, Juli, Agustus,
September, November, Desember
Agustus, September, Oktober,
November, Desember

Mei, Juni, Juli, Agustus,
Pringkuku September, Oktober, November,
Desember

Bulan DMI
September, Oktober
September, Oktober
Januari, Februari, Maret, April,
Juli, September, Oktober,
November

Proses Support Vector Regression (SVR)
Penelitian ini dilakukan dengan membuat model pada tiap stasiun cuaca
menggunakan tiga kernel (linear, polinomial, dan RBF) pada ɛ -SVR. Model
terbaik dibentuk dengan mencari parameter C (cost) yang paling sesuai untuk tiap
stasiun pada kernel linear, mencari parameter C, , r, dan d yang paling sesuai
untuk tiap stasiun pada kernel polinomial, serta mencari parameter C dan yang
paling sesuai untuk tiap stasiun pada kernel RBF. Pencarian parameter terbaik
dilakukan dengan menggunakan metode grid search.
1
Stasiun Cuaca Arjosari
Pada stasiun cuaca Arjosari parameter terbaik untuk kernel linear adalah C
sebesar 2-10. Nilai akurasi yang dihasilkan dari model terbaik pada kernel linear
adalah R2 sebesar 0.51 dan RMSE sebesar 3.78. Pada kernel polinomial,
parameter terbaik yang didapat adalah C sebesar 2-10.5, sebesar 2-6, r sebesar 5,
dan d sebesar 3. Nilai akurasi yang dihasilkan dari model terbaik pada kernel
polinomial adalah R2 sebesar 0.71 dan RMSE sebesar 2.48. Pada kernel RBF,

14
parameter terbaik yang didapat adalah C sebesar 226 dan sebesar 2-33.5. Nilai
akurasi yang dihasilkan dari model terbaik pada kernel RBF adalah R2 sebesar
0.73 dan RMSE sebesar 2.45. Perbandingan nilai R2 dan RMSE dari tiap kernel
dapat dilihat pada Gambar 9.
(b)
5

0.73

0.71
RMSE

R-square

(a)
1
0.8
0.6
0.4
0.2
0

0.51

3.78

4
3

2.48

2.45

2
1

RBF

Linear

0

Polinomial

RBF

Linear

Polinomial

Gambar 9 Perbandingan nilai akurasi setiap kernel pada stasiun Arjosari:
(a) nilai R2 dan (b) nilai RMSE

PMH

(a)
30
25
20
15
10
5
0

Prediksi
Observasi
02-03 03-04 04-05 05-06 06-07 07-08 08-09 09-10 10-11 11-12
Tahun

Gambar 10 Diagram garis perbandingan nilai hasil prediksi dengan nilai
observasi pada stasiun cuaca Arjosari

Prediksi

(b)
27
25
23
21
19
17
15
13
11
9
9 11 13 15 17 19 21 23 25 27
Observasi

Gambar 11 Diagram pencar perbandingan nilai hasil prediksi dengan nilai
observasi pada stasiun cuaca Arjosari

15
Gambar 9 menunjukkan bahwa dari ketiga kernel yang digunakan pada
stasiun cuaca Arjosari, kernel yang memprediksi paling baik adalah kernel RBF.
Hal ini disebabkan prediksi menggunakan kernel RBF memiliki nilai koefisien
determinasi (R2) terbesar dan RMSE terkecil di antara ketiga kernel yang
digunakan. Sementara itu, kernel yang paling buruk dalam memprediksi pada
stasiun cuaca Arjosari adalah kernel linear.
Gambar 10 menunjukkan perbandingan antara nilai hasil prediksi terbaik
menggunakan kernel RBF dengan nilai data observasi yang ada pada stasiun
cuaca Arjosari menggunakan diagram garis. Sumbu horizontal menunjukkan
periode musim hujan yang diprediksi, mulai dari periode 2002/2003 sampai
dengan periode 2011/2012. Sumbu vertikal menunjukkan besarnya panjang
musim hujan dalam satuan dasarian. Gambar 11 menunjukkan penyimpangan
nilai hasil prediksi terhadap nilai sebenarnya pada model terbaik menggunakan
kernel RBF pada stasiun cuaca Arjosari melalui diagram pencar. Titik biru yang
berada di atas garis merah menunjukkan bahwa hasil prediksi dari panjang musim
hujan lebih besar daripada panjang musim hujan hasil observasi. Sebaliknya, titik
biru yang berada di bawah garis merah menunjukkan bahwa hasil prediksi dari
panjang musim hujan lebih kecil daripada panjang musim hujan hasil observasi.
2
Stasiun Cuaca Kebon Agung
Pada stasiun cuaca Kebon Agung parameter terbaik untuk kernel linear
adalah C sebesar 2-8. Nilai akurasi yang dihasilkan dari model terbaik pada kernel
linear adalah R2 sebesar 0.32 dan RMSE sebesar 4.88. Pada kernel polinomial,
parameter terbaik yang didapat adalah C sebesar 23,
sebesar 2-9, r sebesar 2,
dan d sebesar 3. Nilai akurasi yang dihasilkan dari model terbaik pada kernel
polinomial adalah R2 sebesar 0.47 dan RMSE sebesar 3.77. Pada kernel RBF,
parameter terbaik yang didapat adalah C sebesar 226 dan sebesar 2-26.5. Nilai
akurasi yang dihasilkan dari model terbaik pada kernel RBF adalah R2 sebesar
0.63 dan RMSE sebesar 3.23. Perbandingan nilai R2 dan RMSE dari tiap kernel
dapat dilihat pada Gambar 12.
(b)

0.63
0.47
0.33

RBF

Linear

Polinomial

RMSE

R-square

(a)
1
0.8
0.6
0.4
0.2
0

5
4
3
2
1
0

4.88
3.77

3.23

RBF

Linear

Polinomial

Gambar 12 Perbandingan nilai akurasi setiap kernel pada stasiun Kebon
Agung: (a) nilai R2 dan (b) nilai RMSE
Gambar 12 menunjukkan bahwa dari ketiga kernel yang digunakan pada
stasiun cuaca Kebon Agung, kernel yang memprediksi paling baik adalah kernel
RBF. Hal ini disebabkan prediksi menggunakan kernel RBF memiliki nilai
koefisien determinasi (R2) terbesar dan RMSE terkecil di antara ketiga kernel
yang digunakan. Sementara itu, kernel yang paling buruk dalam memprediksi
pada stasiun cuaca Kebon Agung adalah kernel linear.

16
Gambar 13 menunjukkan perbandingan antara nilai hasil prediksi terbaik
menggunakan kernel RBF dengan nilai data observasi yang ada pada stasiun
cuaca Kebon Agung menggunakan diagram garis. Sumbu horizontal menunjukkan
periode musim hujan yang diprediksi, mulai dari periode 2002/2003 sampai
dengan periode 2011/2012. Sumbu vertikal menunjukkan besarnya panjang
musim hujan dalam satuan dasarian. Gambar 14 menunjukkan penyimpangan
nilai hasil prediksi terhadap nilai sebenarnya pada model terbaik menggunakan
kernel RBF pada stasiun cuaca Kebon Agung melalui diagram pencar. Titik biru
yang berada di atas garis merah menunjukkan bahwa hasil prediksi dari panjang
musim hujan lebih besar daripada panjang musim hujan hasil observasi.
Sebaliknya, titik biru yang berada di bawah garis merah menunjukkan bahwa hasil
prediksi dari panjang musim hujan lebih kecil daripada panjang musim hujan hasil
observasi.

PMH

(a)
35
30
25
20
15
10
5
0

Prediksi
Observasi
02-03 03-04 04-05 05-06 06-07 07-08 08-09 09-10 10-11 11-12
Tahun

Gambar 13 Diagram garis perbandingan nilai hasil prediksi dengan
nilai observasi pada stasiun cuaca Kebon Agung

Prediksi

(b)
27
25
23
21
19
17
15
13
11
9
9 11 13 15 17 19 21 23 25 27
Observasi

Gambar 14 Diagram pencar perbandingan nilai hasil prediksi dengan
nilai observasi pada stasiun cuaca Kebon Agung
3

Stasiun Cuaca Pringkuku
Pada stasiun cuaca Pringkuku parameter terbaik untuk kernel linear adalah
C sebesar 24. Nilai akurasi yang dihasilkan dari model terbaik pada kernel linear
adalah R2 sebesar 0.27 dan RMSE sebesar 3.23. Pada kernel polinomial,
parameter terbaik yang didapat adalah C sebesar 22.5, sebesar 2-10.5, r sebesar 0
dan d sebesar 3. Nilai akurasi yang dihasilkan dari model terbaik pada kernel

17
polinomial adalah R2 sebesar 0.58 dan RMSE sebesar 3.09. Pada kernel RBF,
parameter terbaik yang didapat adalah C sebesar 224 dan sebesar 2-24.5. Nilai
akurasi yang dihasilkan dari model terbaik pada kernel RBF adalah R2 sebesar
0.45 dan RMSE sebesar 2.86. Perbandingan nilai R2 dan RMSE dari tiap kernel
dapat dilihat pada Gambar 15.

(a)

(b)

0.5

0.58

0.46
0.27

0

4
RMSE

R-square

1
2.86

3.23

3.09

Linear

Polinomial

2
0

RBF

Linear

Polinomial

RBF

Gambar 15 Perbandingan nilai akurasi setiap kernel pada stasiun
Pringkuku: (a) nilai R2 dan (b) nilai RMSE
25

PMH

20
15
10
5
0

Prediksi
Observasi
02-03 03-04 04-05 05-06 06-07 07-08 08-09 09-10 10-11 11-12
Tahun

Prediksi

Gambar 16 Diagram garis perbandingan nilai hasil prediksi dengan nilai
observasi pada stasiun cuaca Pringkuku
27
25
23
21
19
17
15
13
11
9
9 11 13 15 17 19 21 23 25 27
Observasi

Gambar 17 Diagram pencar perbandingan nilai hasil prediksi dengan nilai
observasi pada stasiun cuaca Pringkuku
Gambar 15 menunjukkan bahwa dari ketiga kernel yang digunakan pada
stasiun cuaca Pringkuku, nilai koefisien determinasi (R2) terbesar diperoleh pada
saat penggunaan kernel polinomial. Sementara itu, RMSE terbaik diperoleh pada

18
saat penggunaan kernel RBF. Diantara ketiga kernel, kernel linear merupakan
kernel yang paling buruk dalam memprediksi pada stasiun cuaca Pringkuku.
Gambar 16 menunjukkan perbandingan antara nilai hasil prediksi terbaik
menggunakan kernel RBF dengan nilai data observasi yang ada pada stasiun
cuaca Pringkuku menggunakan diagram garis. Sumbu horizontal menunjukkan
periode musim hujan yang diprediksi, mulai dari periode 2002/2003 sampai
dengan periode 2011/2012. Sumbu vertikal menunjukkan besarnya panjang
musim hujan dalam satuan dasarian. Gambar 17 menunjukkan penyimpangan
nilai hasil prediksi terhadap nilai sebenarnya pada model terbaik menggunakan
kernel RBF pada stasiun cuaca Pringkuku melalui diagram pencar. Titik biru yang
berada di atas garis merah menunjukkan bahwa hasil prediksi dari panjang musim
hujan lebih besar daripada panjang musim hujan hasil observasi. Sebaliknya, titik
biru yang berada di bawah garis merah menunjukkan bahwa hasil prediksi dari
panjang musim hujan lebih kecil daripada panjang musim hujan hasil observasi.
Gambar 18 menunjukkan bahwa dari tiga stasiun cuaca yang digunakan
pada penelitian ini, nilai koefisien determinasi (R2) terbesar dan RMSE terkecil
diperoleh pada stasiun Arjosari saat menggunakan kernel RBF. Hal ini
menunjukkan model yang terbentuk pada stasiun cuaca tersebut menghasilkan
luaran yang berkorelasi paling kuat dengan data observasi yang ada dan
menghasilkan nilai rataan galat terkecil di antara ketiga stasiun cuaca.

1
0.8
0.6
0.4
0.2
0

0.73

(b)
5
0.63

4

0.58
RMSE

R-square

(a)

3

3.23
2.45

2.86

2
1

Arjosari RBF

Kebon Pringkuku Agung - Polinomial
RBF

0
Arjosari - Kebon Pringkuku
RBF
Agung - RBF
RBF

Gambar 18 Perbandingan nilai akurasi model terbaik pada setiap stasiun
cuaca: (a) nilai R2 dan (b) nilai RMSE

SIMPULAN DAN SARAN
Simpulan
Simpulan dari penelitian ini adalah pada stasiun cuaca Arjosari dan Kebon
Agung, model terbaik didapatkan saat permodelan dilakukan menggunakan kernel
RBF. Pada stasiun cuaca Arjosari, parameter yang digunakan pada model terbaik
adalah C sebesar 226 dan sebesar 2-33.5. Nilai akurasi terbaik yang didapat pada
stasiun Arjosari adalah R2 sebesar 0.73 dan RMSE sebesar 2.45. Pada stasiun

19
cuaca Kebon Agung, parameter yang digunakan pada model terbaik adalah C
sebesar 226 dan sebesar 2-26.5. Nilai akurasi terbaik yang didapat pada stasiun
Kebon Agung adalah R2 sebesar 0.62 dan RMSE sebesar 3.23. Pada stasiun cuaca
Pringkuku, nilai R2 tertinggi diperoleh saat menggunakan kernel polinomial
dengan nilai R2 sebesar 0.58, sedangkan nilai RMSE terkecil diperoleh saat
menggunakan kernel RBF dengan nilai RMSE sebesar 2.86. Dari keseluruhan
percobaan, nilai koefisien determinasi (R2) terbaik diperoleh pada stasiun cuaca
Arjosari saat menggunakan kernel RBF dengan nilai R2 sebesar 0.73 dan nilai
RMSE terbaik juga diperoleh pada stasiun cuaca Arjosari saat menggunakan
kernel RBF dengan nilai RMSE sebesar 2.45. Penelitian ini juga menghasilkan
simpulan bahwa kernel yang paling baik dalam memprediksi PMH menggunakan
SVR adalah kernel RBF, sedangkan kernel yang paling buruk dalam memprediksi
PMH menggunakan SVR adalah kernel linear.

Saran
Penelitian ini dapat dikembangkan lebih lanjut dengan menggunakan
algoritme optimasi selain grid search, seperti particle swarm optimization (PSO)
dan ant colony optimization, untuk mencari parameter-parameter terbaik dari
support vector regression pada permodelan yang dilakukan. Penelitian juga dapat
dikembangkan dengan cara menggunakan parameter lain selain C, , r, dan d
untuk dicari nilai paling optimalnya. Penelitian ini juga baru dapat melakukan
prediksi pada titik lokasi stasiun cuaca yang dipakai dalam penelitian berada,
belum dapat memprediksi panjang musim hujan di daerah sekitar lokasi stasiun
cuaca. Penelitian dapat dikembangkan juga menggunakan teori interpolasi atau
teori similaritas terhadap grid untuk memprediksi panjang musim hujan pada
daerah di sekitar stasiun cuaca.

DAFTAR PUSTAKA
Adhani G. 2013. Pendugaan curah hujan musim kemarau menggunakan data
southern oscillation index dan suhu permukaan laut Nino3.4 dengan metode
support vector regression [skripsi]. Bogor (ID): Institut Pertanian Bogor.
Agmalaro MA. 2011. Pemodelan statistical downscaling data GCM menggunakan
support vector regression untuk memprediksi curah hujan bulanan Indramayu
[tesis]. Bogor (ID): Sekolah Pascasarjana, Institut Pertanian Bogor.
[BMKG] Badan Meteorologi Klimatologi dan Geofisika. 2013. Prakiraan musim
hujan
[internet].
[diacu
2014
Jan
10].
Tersedia
dari:
www.bmkg.go.id/BMKG_Pusat/DataDokumen/PMH_1314.pdf.
Behera S, Brandt P, Reverdin G. 2013. The tropical ocean circulation and
dynamics. International Geophysics Series: Ocean Circulation and Climate.
103:385-404.
Buono A, Sitanggang IS, Mushthofa, Kustiyo A. 2014. Time-delay cascading
neural network architecture for modelling time-dependent predictor in onset

20
prediction. Journal of Computer Science. 10(6): 976-984. doi:
10.3844/jcspp.2014.976.984
[BOM] Bureau of Meteorology. 2014a. ENSO wrap-up: Current state of the
Pacific and Indian Ocean [internet]. [diacu 2014 Jul 22]. Tersedia dari:
http://www.bom.gov.au/climate/enso/#tabs=Indian-Ocean.
[BOM] Bureau of Meteorology. 2014b. S.O.I. (Southern Oscillation Index)
Archives - 1876 to present [internet]. [diacu 2014 Feb 26]. Tersedia dari:
http://www.bom.gov.au/climate/current/soihtm1.shtml.
Chandrasekar A. 2010. Basics of Atmospheric Science. New Delhi (IN): PHI
Learning Private Limited.
Chang CC, Lin CJ. 2011. LIBSVM : a library for support vector machines. ACM
Transactions on Intelligent Systems and Technology, 2:1-27.
Clarke AJ. 2008. An Introduction to the Dynamics of El Nino & the Southern
Oscillation. London (UK): Elsevier.
[IRI] International Research Institute for Climate and Society (US). 2014. NOAA
NCDC ERSST version3b sst: Extended reconstructed sea surface temperature
data
[internet].
[diacu
2014
Feb
27].
Tersedia
dari:
http://iridl.ldeo.columbia.edu/SOURCES/.NOAA/.NCDC/.ERSST/.version3b/.
sst/.
Larasati R. 2012. Prediksi awal musim hujan menggunakan data southern
oscillation index dengan metode support vector regression [skripsi]. Bogor
(ID): Institut Pertanian Bogor.
Radhika Y, Shashi M. 2009. Atmospheric temperature prediction using support
vector machine. International Journal of Computer Theory and Engineering
1:55-58.
Saji NH, Goswami BN, Vinayachandran PN, Yamagata T. 1999. A dipole mode
in the tropical Indian Ocean. Nature. 401:360 363.
Satyana G. 2014. Potential map of Pacitan Regency [internet]. [diacu 2014 Jul
21]. Tersedia dari: http://www.eastjava.com/plan/peta/html/pkab-pacitan.html
Smola AJ, Schölkopf B. 2004. A tutorial on support vector regression. Statistics
and Computing. 14:199-222.
Walpole ER. 1992. Pengantar Statistika Edisi ke-3. Sumantri B, penerjemah.
Jakarta (ID): Gramedia. Terjemahan dari: Introduction to Statistics 3rd Edition.
Yu PS, Chen ST, Chang IF. 2008. Support vector regression for real-time flood
stage forecasting. Research Express at NCKU. 4(10):11-15.

21
Lampiran 1 Nilai SOI dan DMI yang digunakan untuk permodelan SVR pada
stasiun cuaca Arjosari
Tahun
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011

Apr
-3.8
-17.0
2.0
14.4
1.2
-24.4
-1.3
21.0
-0.5
-12.9
-18.7
-21.1
-22.8
-16.2
7.8
-16.2
-24.4
18.5
16.8
0.3
-3.8
-5.5
-15.4
-11.2
15.2
-3.0
4.5
8.6
15.2
25.1

Mei
-8.2
6.0
-0.3
2.8
-6.6
-21.6
10.0
14.7
13.1
-19.3
0.5
-8.2
-13.0
-9.0
1.3
-22.4
0.5
1.3
3.6
-9.0
-14.5
-7.4
13.1
-14.5
-9.8
-2.7
-4.3
-5.1
10.0
2.1

Jul
-19.3
-7.6
2.2
-2.3
2.2
-18.6
11.3
9.4
5.5
-1.7
-6.9
-10.8
-18.0
4.2
6.8
-9.5
14.6
4.8
-3.7
-3.0
-7.6
2.9
-6.9
0.9
-8.9
-4.3
2.2
1.6
20.5
10.7

SOI
Agt
-23.6
0.1
2.7
8.5
-7.6
-14.0
14.9
-6.3
-5.0
-7.6
1.4
-14.0
-17.2
0.8
4.6
-19.8
9.8
2.1
5.3
-8.9
-14.6
-1.8
-7.6
-6.9
-15.9
2.7
9.1
-5.0
18.8
2.1

Sep
-21.4
9.9
2.0
0.2
-5.2
-11.2
20.1
5.7
-7.6
-16.6
0.8
-7.6
-17.2
3.2
6.9
-14.8
11.1
-0.4
9.9
1.4
-7.6
-2.2
-2.8
3.9
-5.1
1.5
14.1
3.9
25.0
11.7

Nov
-31.1
-0.7
3.9
-1.4
-13.9
-1.4
21.0
-2.0
-5.3
-7.3
-7.3
0.6
-7.3
1.3
-0.1
-15.2
12.5
13.1
22.4
7.2
-6.0
-3.4
-9.3
-2.7
-1.4
9.8
17.1
-6.7
16.4
13.8

Des
-21.3
0.1
-1.4
2.1
-13.6
-4.5
10.8
-5.0
-2.4
-16.7
-5.5
1.6
-11.6
-5.5
7.2
-9.1
13.3
12.8
7.7
-9.1
-10.6
9.8
-8.0
0.6
-3.0
14.4
13.3
-7.0
27.1
23.0

DMI
Sep
Okt
1.26
2.16
0.78
0.02
-1.76 -0.82
-0.31 -1.33
0.40
0.07
1.36
1.44
-0.54 -0.68
-0.98 -1.67
-0.66 -1.74
0.23
0.21
-1.84 -1.32
-1.26 -1.16
1.48
3.08
0.22 -0.14
-1.97 -2.70
2.52
3.53
-1.38 -1.93
0.09 -0.62
0.63 -0.26
-0.41 -0.81
1.31
1.87
0.74 -0.05
-0.16
0.09
-1.55 -0.90
2.07
2.58
0.77
0.10
0.15
0.76
-0.20
0.13
-2.46 -1.61
1.48
1