Pemodelan prediksi total hujan pada musim hujan menggunakan jaringan saraf tiruan dan support vector regression

(1)

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2013

DEDI SARWOKO

PEMODELAN PREDIKSI TOTAL HUJAN PADA MUSIM

HUJAN MENGGUNAKAN JARINGAN SARAF TIRUAN DAN


(2)

(3)

PERNYATAAN MENGENAI TESIS DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA

Dengan ini saya menyatakan bahwa tesis berjudul Pemodelan Prediksi Total Hujan pada Musim Hujan Menggunakan Jaringan Saraf Tiruan dan Support Vector Regression

adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

Bogor, Februari 2013

Dedi Sarwoko


(4)

(5)

ABSTRACT

DEDI SARWOKO. Artificial Neural Network and Support Vector Regression to Predict Total Rainfall in Wet Season. Supervised by AGUS BUONO and TOTO HARYANTO.

The Artificial Neural Network (ANN) and Support Vector Regression (SVR) models were developed to predict the total of rainfall in wet season in Indramayu. Onset Data, length of rainy season and monthly Southern Oscillation Index value on August, October and February are used as the input of the models. ANN employed in this study was multilayer perceptron with neuron hidden layer as many as 10, 30 and 50, and trained with gradientdescent backpropagation algorithm. SVR employed with three kinds of kernel functions, linear, polynomial and radial basis function. Models trained with three scenarios length of training data i.e. 15, 20 and 25 periode/ years. This research compared perfomance of two models by roort of mean squared error (RMSE), mean percent of error (MAPE) and correlation coefficient (R) values. The optimal performance of ANN model is mean of percent error 22,70%, root of mean squared error 231,32, and correlation 0,46 , resulted from model with 30 units hidden neuron and trained by 20 training data. SVR models showed better performance then ANN models. SVR model with linear kernel trained by 20 training data show the best performace with root of mean squared error 120,60, correlation 0,86 and mean of percent error 9,09%.

Keywords : Neural Network (NN), Support Vector Regression (SVR), rainfall, prediction


(6)

(7)

RINGKASAN

DEDI SARWOKO. Pemodelan Prediksi Total Hujan pada Musim Hujan menggunakan Jaringan Saraf Tiruan dan Support Vector Regression. Dibimbing oleh AGUS BUONO dan TOTO HARYANTO.

Fenomena iklim merupakan salah satu faktor yang sulit dikendalikan dan berpengaruh pada produktifitas tanaman pangan. Salah satu upaya untuk mengurangi resiko kerugian ekonomi dari hilangnya investasi pada proses penanaman maupun gagal panen adalah dengan cara mendeteksi dini fenomena iklim di masa mendatang. Kondisi ini mendorong dilakukannya prediksi iklim, khususnya prediksi curah hujan. Total hujan pada musim hujan memberikan gambaran kondisi ketersediaan air pada musim hujan dan musim berikutnya.

Keberhasilan dalam usaha meningkatkan produktifitas tanaman pangan dalam kaitannya dengan iklim sangat bergantung pada keberhasilan dalam menginterpretasikan dan meramalkan iklim dengan ketelitian yang tinggi. Tugas peramalan iklim ini menjadi pekerjaan yang menarik karena menyangkut tugas kemanusiaan dalam usaha meningkatkan produksi tanaman pangan.

Perkembangan teknologi komputasi telah menghasilkan model-model kecerdasan komputasional yang dapat diimplementasikan pada pekerjaan peramalan iklim. Model Jaringan Saraf Tiruan (JST) merupakan salah satu model yang banyak digunakan untuk penyelesaian permasalahan klasifikasi maupun regresi. Model Support Vector Regression (SVR) juga dapat menjadi alternatif untuk menyelesaikan kasus yang sama.

Tujuan utama dari penelitian ini adalah untuk mengembangkan model prediksi total hujan pada musim hujan, sebuah kasus regresi untuk memprediksi besaran curah hujan, dengan mencari pola hubungan antara total hujan pada musim hujan dengan panjang musim hujan, awal musim hujan dan nilai-nilai Southern Oscillation Index (SOI). Nilai-nilai SOI merupakan salah satu indikator untuk mengidentifikasi fenomena iklim global. Model diimplementasikan pada data history curah hujan di Kabupaten Indramayu Tahun 1966 s/d 2009. Wilayah ini merupakan salah satu pusat produksi padi utama di Jawa Barat.


(8)

Secara keseluruhan model yang dibuat dengan model SVR menunjukkan kinerja yang lebih baik dibanding kinerja model JST. Model JST gagal memprediksi pada kasus total hujan pada tahun 2002 yang merupakan kasus dengan total hujan paling rendah. Variasi perbedaan panjang data latih tidak menunjukkan pengaruh yang jelas terhadap peningkatan/penurunan kinerja model. Pemilihan data latih pada penelitian ini hanya dilakukan berdasarkan urutan waktu didapatnya data tersebut, tanpa memperhatikan sebaran data di dalamnya.

Kata kunci: Jaringan Saraf Tiruan (JST), Support Vector Regression (SVR), Curah Hujan, Prediksi


(9)

© Hak Cipta milik IPB, tahun 2013

Hak Cipta dilindungi Undang-undang

1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumber.

a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau tinjauan suatu masalah; b. Pengutipan tidak merugikan kepentingan yang wajar IPB

2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apapun tanpa izin IPB


(10)

(11)

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2013

Tesis

sebagai salah satu syarat untuk memperoleh gelar Magister Ilmu Komputer

pada

Program Studi Ilmu Komputer

DEDI SARWOKO

PEMODELAN PREDIKSI TOTAL HUJAN PADA MUSIM HUJAN MENGGUNAKAN JARINGAN SARAF TIRUAN DAN


(12)

(13)

Judul Tesis : Pemodelan Prediksi Total Hujan pada Musim Hujan Menggunakan Jaringan Saraf Tiruan dan Support Vector Regression

Nama : Dedi Sarwoko NIM : G651100191

Disetujui Komisi Pembimbing

Dr. Ir. Agus Buono, M.Si, M.Kom Ketua

Toto Haryanto, S.Kom, M.Si Anggota

Diketahui

Ketua Program Studi Ilmu Komputer

Dr. Yani Nurhadryani, S.Si, MT

Dekan Sekolah Pascasarjana

Dr. Ir. Dahrul Syah, M.Sc.Agr

Tanggal Ujian : 28 Desember 2012


(14)

(15)

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Maret 2012 ini adalah prediksi karakteristik curah hujan, dengan judul Pemodelan Prediksi Total Hujan pada Musim Hujan Menggunakan Jaringan Saraf Tiruan dan Support Vector Regression dengan studi kasus curah hujan di Kabupaten Indramayu.

Terima kasih penulis ucapkan kepada Bapak Dr. Ir. Agus Buono, M.Si, M.Kom dan Bapak Toto Haryanto, S.Kom, M.Si selaku pembimbing, serta Bapak Mushthofa, S.Kom, M.Sc selaku penguji dalam ujian tesis. Di samping itu, penghargaan penulis sampaikan kepada Pusat Diklat Kementerian Kehutanan dan Sekolah Pascasarjana IPB atas pemberian fasilitas baik pembiayaan maupun sarana/prasarana selama penyusunan karya ilmiah ini, dan untuk Badan Meteorologi Klimatologi dan Geofisika atas ketersediaan data untuk penelitian ini. Ungkapan terima kasih juga disampaikan kepada Ibunda, Istri dan putra tercinta serta seluruh keluarga, atas segala doa dan kasih sayangnya. Terima kasih kepada teman-teman angkatan XII Program Studi Ilmu Komputer atas kebersamaan dan bantuannya selama kuliah dan penyelesaian penelitian ini.

Semoga karya ini bermanfaat. Kritik dan saran sangat penulis harapkan demi kesempurnaan karya ini di kemudian hari.

Bogor, Februari 2013


(16)

RIWAYAT HIDUP

Penulis dilahirkan di Sukoharjo, 7 Nopember 1976, putra keenam dari tujuh bersaudara dari pasangan Bapak Siswo Sutomo (Alm) dan Ibu Tugiyem.

Tahun 1994 Penulis lulus dari SMA Negeri Sukoharjo dan pada tahun yang sama diterima di Program Studi Ilmu Komputer, Jurusan Matematika FMIPA UGM melalui seleksi UMPTN. Setelah menyelesaikan pendidikan sarjana di tahun 2000, pada tahun 2003 penulis diterima sebagai PNS di Departemen Kehutanan dengan penempatan di Unit Pelaksana Teknis BSPHH Wilayah IX Denpasar, pada tahun 2008 mutasi alih tugas pada Direktorat Bina Pengolaha dan Pemasaran Hasil Hutan di Jakarta. Tahun 2010 Penulis berkesempatan melanjutkan ke jenjang pascasarjana di Program Studi Ilmu Komputer Sekolah Pascasarjana IPB sebagai karyasiswa dari Kementerian Kehutanan.


(17)

xi DAFTAR ISI

Halaman

DAFTAR GAMBAR ... xii

DAFTAR TABEL ... xiii

DAFTAR LAMPIRAN ... xiv

BAB I PENDAHULUAN 1.1 Latar Belakang ... 1

1.2 Tujuan Penelitian ... 3

1.3 Ruang Lingkup Penelitian ... 3

1.4 Manfaat Penelitian ... 4

BAB II TINJAUAN PUSTAKA 2.1 Curah Hujan dan Prakiraan Musim ... 5

2.2 Southern Oscillation Index (SOI) ... 7

2.3 Jaringan Saraf Tiruan (JST) ... 8

2.4 JST Backpropagation ... 10

2.5 Support Vector Regression (SVR) ... 14

BAB III DATA DAN METODOLOGI PENELITIAN 3.1 Tahapan Penelitian ... 19

3.2 Data Penelitian ... 20

3.3 Praproses Pengolahan Data ... 20

3.4 Pembuatan Model untuk Percobaan ... 20

3.5 Pengolahan Data ... 21

3.6 Evaluasi Hasil Percobaan ... 22

3.7 Lingkup Pengembangan Sistem ... 23

BAB IV HASIL DAN PEMBAHASAN 4.1 Pemodelan menggunakan Jaringan Saraf Tiruan ... 26

4.2 Pemodelan menggunakan Support Vector Regression ... 30

4.3 Perbandingan Pemodelan JST dan SVR ... 35

4.4 Implementasi model SVR pada data wilayah ... 36

BAB V SIMPULAN DAN SARAN 5.1 Simpulan ... 39

5.2 Saran ... 39 DAFTAR PUSTAKA


(18)

xii

DAFTAR GAMBAR

Halaman 1 Ilustrasi Penentuan AwalMusim Hujan dan Awal Musim Kemarau Sesuai

Model Penentuan Awal Musim BMKG ... 5

2 Gambaran lokasi untuk menghitung SOI ... 7

3 Arsitektur JST Backpropagation dengan 1 lapisan tersembunyi ... 10

4 Fungsi akivasi Sigmoid Biner, Sigmoid Bipolar, Linier dan Linier Positif . 13 5 Ilustrasi fungsi regresi yang feasible untuk SVR linier ... 14

6 Ilustrasi pengaturan soft margin untuk SVR linier ... 16

7 Diagram Alir Penelitian ... 19

8 Ilustrasi Pengambilan Data Latih dan Data Uji ... 21

9 Grafik Perbandingan Hasil Prediksi Model JST ... 29

10 Grafik Perbandingan Hasil Prediksi Model SVR ... 34

11 Grafik Perbandingan kinerja model-model JST dan SVR ... 35


(19)

xiii DAFTAR TABEL

Halaman 1 Model JST dan SVR untuk Percobaan ... 21 2 Korelasi antara Total Hujan pada Musim Hujan dengan Panjang Musim

Hujan, Awal Musim Hujan dan SOI Bulanan. ... 25 3 Kinerja Model JST pada dataset rata-rata lima wilayah untuk data uji

sebanyak 28, 23 18 periode... 27 4 Kinerja Model JST pada dataset rata-rata lima wilayah untuk data uji yang

sama (18 tahun terakhir) ... 28 5 Parameter Percobaan Model SVR ... 32 6 Kinerja Model SVR pada dataset rata-rata lima wilayah untuk data uji

sebanyak 28, 23 dan 18 periode ... 32 7 Kinerja Model SVR pada dataset rata-rata wilayah untuk data uji yang

sama (18 tahun terakhir) ... 33 8 Koefisien korelasi peubah prediktor dengan total hujan musim hujan serta


(20)

xiv

DAFTAR LAMPIRAN

1 Algoritma Pembelajaran JST backpropagation ... 45

2 Tabel korelasi antara peubah respon (total hujan di musim hujan) dengan Awal Musim Hujan, Panjang MusimHujan dan SOI ... 47

3 Dataset untuk percobaan (rata-rata lima wilayah) ... 48

4 Dataset untuk percobaan (Wilayah 1) ... 49

5 Dataset untuk percobaan (Wilayah 2) ... 50

6 Dataset untuk percobaan (Wilayah 3) ... 51

7 Dataset untuk percobaan (Wilayah 4) ... 52

8 Dataset untuk percobaan (Wilayah 5) ... 53

9 Hasil Percobaan JST arsitektur 10 hidden neuron (JST-10) ... 54

10 Hasil Percobaan JST arsitektur 30 hidden neuron (JST-30) ... 55

11 Hasil Percobaan JST arsitektur 50 hidden neuron (JST-50) ... 56

12 Ilustrasi Proses Pemilihan Parameter SVR-L-A dengan grid search ... 57

13 Hasil Percobaan SVR Linier ... 58

14 Hasil Percobaan SVR Polynomial ... 59

15 Hasil Percobaan SVR RBF ... 60

16 Hasil Percobaan SVR Linier Wilayah 1 ... 61

17 Hasil Percobaan SVR Polynomial Wilayah 1 ... 62

18 Hasil Percobaan SVR RBF Wilayah 1 ... 63

19 Hasil Percobaan SVR Linier Wilayah 2 ... 64

20 Hasil Percobaan SVR Polynomial Wilayah 2 ... 65

21 Hasil Percobaan SVR RBF Wilayah 2 ... 66

22 Hasil Percobaan SVR Linier Wilayah 3 ... 67

23 Hasil Percobaan SVR Polynomial Wilayah 3 ... 68

24 Hasil Percobaan SVR RBF Wilayah 3 ... 69

25 Hasil Percobaan SVR Linier Wilayah 4 ... 70

26 Hasil Percobaan SVR Polynomial Wilayah 4 ... 71

27 Hasil Percobaan SVR RBF Wilayah 4 ... 72

28 Hasil Percobaan SVR Linier Wilayah 5 ... 73

29 Hasil Percobaan SVR Polynomial Wilayah 5 ... 74


(21)

1

BAB I PENDAHULUAN

1.1 Latar Belakang

Iklim merupakan fenomena alam yang mempunyai hubungan erat dengan berbagai aspek kehidupan manusia. Cuaca dan iklim merupakan salah satu peubah dalam produksi tanaman pangan yang sukar dikendalikan. Oleh karena itu dalam usaha pertanian, cara-cara bertani umumnya disesuaikan dengan kondisi iklim setempat. Pengaruh cuaca dan iklim terhadap produksi tanaman pangan perlu diketahui dan difahami oleh berbagai pihak, terutama bagi para perencana kebijakan bidang pertanian.

Penggunaan teknologi tinggi dan pengelolaan pertanian yang baik merupakan faktor yang berperan dalam peningkatan produksi tanaman pangan, hal tersebut juga menjadi faktor penyebab perbedaan produktifitas tanaman pangan yang mencolok antara negara maju dan negara berkembang. Namun demikian, faktor iklim juga menjadi penentu produktifitas tanaman pangan. Kejadian kemarau panjang (kekeringan) dan banjir merupakan penyebab utama kegagalan panen di Indonesia. Statistik Dinas Pertanian Tanaman Pangan Provinsi Jawa Barat menunjukkan prosentase terbesar penyebab padi puso adalah akibat dari kekeringan dan banjir. Pada musim tanam 2007/2008, faktor kekeringan berkontribusi sekitar 77% pada besar luasan sawah yang terkena gangguan alam, angka ini jauh lebih besar dibanding pengaruh faktor banjir dan gangguan alam lainnya (DIPERTA 2012).

Untuk daerah tropis, fenomena anomali iklim menimbulkan pergeseran pola curah hujan, perubahan besaran curah hujan, perubahan suhu udara. Akibat lebih lanjut adalah terjadinya musim kemarau yang panjang, kekeringan, terjadinya banjir dan meningkatnya gangguan hama dan penyakit tanaman (Irawan 2006). Untuk mengantisipasi resiko dampak fenomena iklim ini, diperlukan upaya untuk mendeteksi dini fenomena tersebut. Kebutuhan untuk mengetahui kondisi iklim di masa mendatang dalam skala musiman mendorong pentingnya dilakukan prediksi iklim khususnya prediksi curah hujan musiman. Karakteristik hujan yang biasanya digunakan untuk perencanaan operasional antara lain Awal Musim Hujan, Panjang Musim Hujan, Tinggi Hujan, dan yang tidak kalah penting adalah prediksi Sifat Hujan (Atas Normal, Normal dan Bawah Normal) (Faqih 2012)


(22)

Keberhasilan dalam usaha meningkatkan produksi tanaman pangan dalam hubungannya dengan iklim sangat bergantung pada keberhasilan dalam menginterpretasikan dan meramalkan iklim dengan ketelitian yang tinggi. Peramalan dan interpretasi iklim merupakan tugas yang cukup berat namun tetap menjadi pekerjaan yang menarik karena tugas ini merupakan tugas kemanusiaan dalam usaha meningkatkan produksi tanaman pangan (Tjasyono 2004).

Perkembangan teknologi komputasi (perangkat lunak) beserta perangkat keras komputer sangat menunjang untuk mengembangkan teknik-teknik prediksi iklim. Metode-metode yang dikembangkan pada bidang kecerdasan komputasional mengkombinasikan proses-proses pembelajaran, adaptasi dan evolusi untuk pembuatan aplikasi-aplikasi cerdas dan inovatif, sehingga dapat menjadi pandangan alternatif untuk melengkapi metode-metode yang telah dikembangkan secara statistik. Salah satu teknik komputasi adaptif yang banyak dikaji dalam pemodelan iklim adalah model jaringan Saraf tiruan (JST). Model ini meniru struktur arsitektur dan cara kerja otak manusia untuk melakukan proses pembelajaran terhadap satu set data pada kasus tertentu, sehingga apabila diberikan masukan yang baru, model JST mampu membuat generalisasi/prediksi sesuai dengan pola data yang dipelajarinya. Model JST dapat digunakan untuk pemodelan prediksi besaran curah hujan /kasus regresi (Hung et al. 2009; Buono et al. 2010; Mutaqqin 2011). Model JST juga dapat digunakan untuk pemodelan prediksi kejadian ada atau tidaknya petir / kasus klasifikasi (Anad et al. 2011).

Akhir-akhir ini metode Support Vector Machine (SVM) juga banyak dikaji untuk menyelesaikan berbagai kasus dalam data mining, klasifikasi, regresi dan peramalan deret waktu. Support Vector Regreesion (SVR) sebagai implementasi SVM untuk kasus regresi telah diimplementasikan untuk prediksi curah hujan bulanan (Agmalaro 2011). Pembandingan kinerja antara JST dan SVM telah dilakukan untuk prediksi deret waktu (Samsudin et al. 2010), metode SVM dapat menjadi metode alternatif yang menjanjikan.

Kabupaten Indramayu merupakan salah satu pusat produksi padi utama di Provinsi Jawa Barat dengan kontribusi produksi rata-rata sebesar 11,32% dari total produksi provinsi periode tahun 2007 – 2011 (DISPERTA 2012). Pergeseran


(23)

3

musim berpotensi menimbulkan kerugian yang besar akibat hilangnya investasi untuk kegiatan penanaman dan kerugian ekonomi akibat gagal panen. Model peramalan curah hujan sangat relevan dikembangkan untuk wilayah ini untuk meminimalkan resiko gagal panen tersebut. Nilai Southern Oscillation Index (SOI) merupakan salah satu indek global yang dapat digunakan untuk indikator mendeteksi terjadinya fenomena global El Nino dan La Nina (Irawan 2006). Curah hujan merupakan fenomena lokal yang sangat bervariasi antar lokasi. Total hujan pada musim hujan di suatu daerah sangat berhubungan dengan panjang musim hujan serta datangnya musim hujan. Keterlambatan datangnya musim hujan cenderung diikuti panjang musim hujan yang lebih pendek dari biasanya, sehingga total hujan pada musim hujan juga semakin kecil.

Penelitian ini mengevaluasi penggunaan model JST dan SVR untuk memprediksi total hujan pada musim hujan di Kabupaten Indramayu. Prediktor yang digunakan dalam penelitian ini adalah nilai SOI, awal musim hujan dan panjang musim hujan. Nilai SOI diharapkan dapat menangkap fenomena iklim global, sedangkan fenomena lokal di daerah tersebut diharapkan dapat ditangkap dari data histori awal musim hujan dan panjang musim hujan.

1.2 Tujuan Penelitian

Penelitian ini bertujuan untuk :

1. Membuat model Prediksi Total Hujan Musim Hujan dengan menggunakan Jaringan Saraf Tiruan (JST) dan Support Vector Regression (SVR).

2. Mengevaluasi pengaruh perbedaan arsitektur (banyaknya hidden neuron) pada JST, pengaruh perbedaan fungsi kernel yang digunakan pada SVR terhadap kinerja prediksi model.

3. Mengevaluasi pengaruh perbedaan banyaknya data latih untuk pelatihan model terhadap kinerja prediksi model.

1.3 Ruang LingkupPenelitian

Model prediksi total hujan yang akan dikembangkan mempunyai batasan-batasan sebagai berikut :

- Data untuk pelatihan dan pengujian model sebanyak 43 periode (tahun 1966 s/d 2009) di Kabupaten Indramayu


(24)

- Jaringan Saraf tiruan yang digunakan adalah JST backpropagation dengan satu lapisan tersembunyi dan banyaknya hidden neuron sebanyak 10, 30 dan 50.

- SVR yang digunakan adalah epsilon-SVR dengan fungsi kernel Linear, Polynomial dan RBF.

- Prediktor yang digunakan adalah nilai SOI, Awal Musim Hujan dan Panjang Musim Hujan

1.4 Manfaat Penelitian

Penelitian ini diharapkan memberikan kontribusi dalam pengembangan model penduga iklim, khususnya prediksi total hujan musim hujan dengan kontribusi atas penggunaan model kecerdasan komputasional SVR dan JST.


(25)

5

BAB II TINJAUAN PUSTAKA

2.1 Curah Hujan dan Prakiraan Musim

Curah hujan (mm) merupakan ketinggian air hujan yang jatuh pada tempat yang datar dengan asumsi tidak menguap, tidak meresap, dan tidak mengalir. Curah hujan 1 (satu) millimeter artinya dalam luasan satu meter persegi pada tempat yang datar tertampung air hujan setinggi satu milimeter atau tertampung air sebanyak satu liter (BMKG 2012a).

Curah hujan kumulatif 1 (satu) bulan adalah jumlah curah hujan yang terkumpul selama 28 atau 29 hari pada bulan pebruari dan 30 atau 31 hari untuk bulan-bulan lainnya. Curah hujan dasarian adalah jumlah curah hujan harian selama 10 hari. Jumlah hari dalam 1 (satu) bulan dibagi menjadi 3 dasarian yaitu, dasarian ke-1 pada 10 hari pertama (tanggal 1 s/d 10), dasarian ke-2 pada 10 hari kedua (tanggal 11 s/d 20), dan dasarian ke-3 mulai tanggal 21 hingga akhir bulan.

Gambar 1 Ilustrasi Penentuan Awal Musim Hujan dan Awal Musim Kemarau Sesuai Model Penentuan Awal Musim BMKG

Total hujan pada musim hujan merupakan jumlah curah hujan dasarian mulai dari dasarian awal musim hujan hingga dasarian sebelum mulai awal musim kemarau. Penentuan awal musim hujan (AMH) menurut BMKG diidentifikasi dengan jumlah curah hujan dasarian telah lebih dari 50 mm dan kemudian diikuti oleh minimal dua dasarian berikutnya, sedangkan awal musim kemarau diidentifikasi dengan jumlah curah hujan dasarian telah kurang dari 50 mm dan kemudian diikuti oleh minimal dua dasarian berikutnya.


(26)

Panjang musim hujan adalah jumlah dasarian antara awal musim hujan sampai dengan awal musim kemarau berikutnya. Ilustrasi penentuan awal musim sebagaimana pada Gambar 1, awal musim hujan jatuh pada dasarian ke-3 bulan Desember, sedangkan awal musim kemarau jatuh pada dasarian ke-1 bulan Juni, dan panjang musim hujan adalah 16 dasarian. Total hujan musim hujan merupakan jumlahan curah hujan pada dasarian ke-3 bulan Desember s/d dasarian ke-3 bulan Mei (tahun berikutnya).

Jumlah dasarian dalam satu tahun adalah 36 dasarian, sehingga seringkali digunakan penomoran dasarian ke-1 hingga dasarian ke-36. Dasarian ke-1 menunjuk pada dasarian ke-1 bulan Januari, sedangkan dasarian ke-36 menunjuk pada dasarian ke-3 bulan Desember. Dalam konteks identifikasi awal musim hujan, penomoran dasarian ini dapat diteruskan misalnya hingga dasarian ke-37, 38 dan seterusnya. Angka ini untuk menunjukkan bahwa awal musim hujan dapat mundur hingga dasarian ke-1, atau ke-2 pada bulan Januari tahun berikutnya.

Badan Meteorologi Klimatologi dan Geofisika (BMKG) dalam publikasi peramalan iklimnya secara klimatologis membagi wilayah Indonesia menjadi 407 pola hujan (342 pola Zona Musim / ZOM dan 65 pola Non ZOM). Pada wilayah dengan pola Zona Musim, BMKG mengeluarkan prakiraan Awal Musim Hujan dan Sifat Hujan di Musim Hujan, sedangkan pada wilayah Non Zona Musim, BMKG mengeluarkan prakiraan Curah Hujan Kumulatif dan Sifat Hujan Kumulatif periode Oktober s/d Mare. (BMKG 2012b). Pada level yang lebih detail, Stasiun BMKG tingkat propinsi setiap bulannya mengeluarkan analisis hujan bulan sebelumnya serta prakiran tingkat curah hujan dan sifat hujan tiga bulan berikutnya untuk setiap kabupaten atau yang lebih detail lagi.

Penelitian terkait prakiraan musim/curah hujan menggunakan teknik kecerdasaran komputasional telah banyak dilakukan. Model statistical downscaling menggunakan Support Vector Regression telah diimplementasikan untuk peramalan curah hujan bulanan di Kabupaten Indramayu dengan data GCM sebanyak 6 model (Agmalaro 2011). Model SVR yang diimplementasikan cukup bagus untuk memprediksi curah hujan pada kondisi normal, namun untuk kondisi ekstrim, nilai prediksi yang dihasilkan belum berhasil mendekati nilai observasi.


(27)

7

Demikian pula dengan model JST yang diimplementasikan untuk data yang sama (Muttaqin 2011), prediksi yang dihasilkan juga tidak dapat mendekati nilai-nilai yang ekstrim. Jaringan Saraf tiruan backpropgataion juga berhasil digunakan untuk menemukan pola prediksi curah hujan jangka pendek (1 hingga 3 jam) di 75 stasiun curah hujan di Bangkok (Hung et al. 2009).

2.2 Southern Oscillation Index (SOI)

Posisi geografis Indonesia rentan terhadap perubahan iklim. Fenomena El Nino dan La Nina menjadi fenomena yang umum diperdebatkan terkait dengan perubahan iklim. Fenomena iklim ini biasanya menimbulkan pergeseran curah hujan, perubahan besaran curah hujan dan perubahan temperatur udara. Dampak lebih lanjut adalah terjadinya musim kemarau yang makin panjang, kekeringan, banjir dan peningkatan gangguan hama dan penyakit tanaman.

Gejala El Nino biasanya dicirikan dengan meningkatnya suhu muka laut di kawasan Pasifik secara berkala pada selang waktu tertentu, dan meningkatnya perbedaan tekanan udara permukaan antara Darwin dan Tahiti (Gambar 2). Southern Oscillation Index (SOI) merepresentasikan perbedaan tekanan udara permukaan antara Darwin (mewaikili daerah India-Australia) dan Tahiti (mewakili daerah Amerika Selatan).

Gambar 2 Gambaran lokasi untuk menghitung SOI (Sumber : http://www.climatewatch.noaa.gov/)


(28)

Nilai SOI dihitung dengan formula :

= . . × 10 (1)

PA(..) = Anomali tekanan udara, yaitu rata-rata bulanan dikurangi rata-rata jangka panjang

Std.Dev.Diff = Standar Deviasi dari Perbedaan Tekanan Udara (1887 s/d 1989)

Nilai SOI negatif, berarti tekanan udara permukaan sepanjang Amerika Selatan lebih besar daripada wilayah India-Australia, dan jika SOI positif terjadi sebaliknya. Nilai SOI berkorelasi dengan curah hujan di kawasan Asia Tenggara dan Australia, karena itu perubahan nilai SOI dapat menjadi indikator yang baik untuk perubahan curah hujan (Irawan, 2006).

Nilai SOI negatif di bawah normal, mencapai -10 atau kurang, mengindikasikan peristiwa El Nino dan akan terjadi penurunan curah hujan di bawah normal, dan sebaliknya nilai SOI positif mencapai 10 atau lebih, mengindikasikan peristiwa La Nina dan akan terjadi peningkatan curah hujan di atas normal (Fox 2000 dalam Irawan 2006). Besaran nilai curah hujan dan nilai SOI sangat bervariatif dalam skala bulanan, mingguan atau harian. Nilai SOI yang ekstrim negatif atau positif dalam jangka waktu yang lama berpotensi menimbulkan dampak serius pada curah hujan dan ketersediaan air yang pada akhirnya berpengaruh ke produksi tanaman pangan (Irawan 2006). Nilai-nilai SOI bulanan dapat diperoleh melalui website Austalian Government – Bureau of Meteorolgy, (http://www.bom.gov.au).

2.3 Jaringan Saraf Tiruan

Jaringan Saraf Tiruan (JST) adalah sebuah sistem pemrosesan informasi yang mempunyai karakteristik kinerja tertentu yang sama dengan jaringan saraf biologis (Laurene 1993). Jaringan saraf tiruan telah dikembangkan sebagai generalisasi model matematis untuk cara pemahaman manusia (kognisi) atau saraf biologis, berdasarkan asumsi-asumsi berikut :


(29)

9

1. Pemrosesan informasi dilakukan pada beberapa elemen sederhana yang disebut dengan neuron.

2. Sinyal-sinyal dilewatkan antar neuron melalui jalur-jalur penghubung.

3. Masing-masing jalur penghubung mempunyai bobot tertentu, yang umumnya menjadi pengali dari sinyal yang dilewatkan.

4. Masing-masing neuron akan menerapkan sebuah fungsi aktifasi (biasanya non linier) terhadap masukannya (jumlahan dari sinyal-sinyal masukan yang sudah terboboti) untuk menentukan sinyal keluarannya.

Sebuah JST dicirikan oleh :

1. Pola hubungan-hubungan antar neuron-nya yang disebut dengan arsitektur, 2. Metode yang digunakan untuk penentuan bobot-bobot dari hubungan/koneksi

antar neuronnya, disebut dengan algoritma pelatihan (training) atau pembelajaran (learning), dan

3. Fungsi aktivasi yang digunakan.

JST berusaha meniru struktur arsitektur dan cara kerja otak manusia sehingga mampu menggantikan sebagian pekerjaan manusia, seperti pengenalan pola, prediksi, klasifikasi, pendekatan fungsi dan optimalisasi. JST mempunyai kelebihan seperti kemampuan menyelesaikan pekerjaan prediksi yang sifatnya nonlinier, waktu penyelesaian pekerjaan yang cepat, dan tahan terhadap adanya data yang hilang (missing data).

JST masuk dalam kategori supervised learning. Dalam kategori ini, model JST perlu dilatih untuk menemukan parameter bobot antar neuron yang terbaik. Model yang ditemukan atau model yang sudah terlatih selanjutnya dapat digunakan untuk melakukan tugas prediksi. Nilai-nilai bobot yang ditemukan belum tentu merupakan nilai yang optimal secara global (global optima), namun dapat berupa local optima, sebagai akibat dari penggunaan fungsi aktivasi dalam JST yang non linier yang akan menghasilkan solusi yang tidak global pada setiap kali pelatihan. Hal ini merupakan kelemahan JST. Namun demikian, walaupun solusi yang dihasilkan bukanlah yang global optima, JST memberikan solusi prediksi yang cukup akurat.


(30)

2.4 JST Backpropagation

Arsitektur backpropagation telah dikembangkan pada awal 1970-an oleh Rumelhart, Hinton dan Williams. Backpropagation merupakan arsitektur yang populer, efisien dan model yang mudah untuk JST dengan banyak lapisan yang komplek. Jaringan ini telah digunakan pada berbagai bidang seperti pemrosesan gambar, pemrosesan sinyal, pengenalan wajah, pengenalan suara dan lain-lain. Arsitektur ini telah menurunkan banyak tipe jaringan dengan berbagai perbedaan topologi dan metode pelatihannya.

2.4.1 Arsitektur JST backpropagation

Bentuk umum jaringan backpropagation terdiri dari sebuah lapisan input, sebuah lapisan output dan setidaknya sebuah lapisan tersembunyi. Setiap lapisan terhubung secara penuh dengan lapisan sebelumnya. Gambaran arsitektur JST dengan satu lapisan tersembunyi, n buah neuron input, p buah neuron tersembunyi dan m buah neuron output seperti pada Gambar 3. Unit-unit pada lapisan tersembunyi (Zj) dan lapisan output (Yk) dimungkinkan mempunyai bias, yang

pada gambar tersebut dinyatakan dengan v0j dan w0k.


(31)

11

Lapisan input dan output menunjukkan arah aliran informasi selama proses pemanggilan kembali/recall, yaitu proses untuk memasukkan data pada jaringan yang sudah dilatih untuk mendapatkan jawaban (output) dari JST. Arah aliran informasi yang ditampilkan pada Gambar 3 hanya arah pada fase perambatan maju (feedforward), sedangkan pada fase perambatan balik (backpropagation) saat proses pembelajaran, sinyal informasi mengalir dengan arah sebaliknya. Fase backpropagation tidak dilakukan pada proses pemanggilan kembali, namun hanya dilakukan pada saat jaringan sedang mempelajari satu set data latih.

2.4.2 Proses Pelatihan JST Backpropagation

Proses pelatihan jaringan backpropagation melibatkan tahapan berikut (Laurene 1993) :

1. Perambatan maju/feedforward dari masukan pola pelatihan.

2. Perambatan balik/backpropagation dari kesalahan yang ditemukan 3. Penyesuaian bobot

Pada tahap perambatan maju, setiap unit pada lapisan input (Xi) menerima

sinyal masukkan dan meneruskan sinyal tersebut dengan bobotnya ke setiap unit pada lapisan tersembunyi (Z1, …, Zp). Setiap unit pada lapisan tersembunyi (Zj)

akan mengitung nilai aktivasinya dengan dan mengirimkan sinyal keluarannya (zj)

ke setiap unit pada lapisan output. Setiap unit pada lapisan output (Yk) menghitung

masing-masing nilai aktivasinya (yk) dan keluar sebagi bentuk respon jaringan

terhadap masukan yang diterimanya.

Selama proses pembelajaran, masing-masing unit output membandingkan hasil perhitungan fungsi aktivasinya atau keluarannya (yk) dengan nilai target

obeservasi yang berkesesuaian, tk, untuk menentukan kesalahan yang terjadi

antara output jaringan dibanding nilai target sebenarnya (nilai aktual). Berdasarkan hitungan kesalahan tersebut, dihitung faktor kesalahan δk (k=

1,2,…,m). δk digunakan untuk mendistribusikan kesalahan yang ada pada unit

output Yk kembali ke setiap unit pada lapisan sebelumnya (unit tersembunyi yang

terhubung ke Yk). Nilai δk nantinya juga digunakan untuk memperbaharui

bobot-bobot dari jalur yang menghubungkan antara lapisan output dan lapisan tersembunyi. Dengan cara yang sama, nilai δj (j = 1, 2, …, p) juga dihitung untuk


(32)

setiap unit pada lapisan tersembunyi. Nilai δj ini tidak perlu dirambatkan balik ke

unit-unit pada lapisan input, namun digunakan untuk memperbaharui bobot pada jalur antara lapisan input dan lapisan tersembunyi.

Setelah seluruh faktor δ dihitung, bobot dari seluruh lapisan diperbaharui secara simultan. Penyesuain bobot wjk (dari unit tersembunyi Zj ke unit output Yk)

didasarkan pada faktor δk dan nilai aktivasi zj dari unit tersembunyi Zj. Penyesuain

bobot vij (dari unit input Xi ke unit tersembunyi Zj) didasarkan pada faktor δj dan

nilai aktivasi xi dari unit input.

Nomenklatur yang digunakan pada penjelasan proses pembelajaran disini adalah sebagai berikut :

x : vektor masukan untuk pelatihan, x = (x1, …, xi, …., xn)

t : vektor target keluaran , t = (t1, …, tk, …., tm)

δj : informasi kesalahan untuk unit ke-j pada lapisan tersembunyi δk : informasi kesalahan untuk unit ke-k pada lapisan output α : laju pembelajaran

Xi : Unit ke-i pada lapisan input;

Pada unit input, sinyal masukan dan sinyal keluarannya sama, yaitu xi.

v0j : bias untuk unit ke-j pada pada lapisan tersembunyi

vij : bobot pada penghubung antara unit ke-i pada lapisan input dan unit ke-j

pada lapisan tersembunyi

Zj : Unit ke-j pada lapisan tersembunyi;

Masukan pada unit tersembunyi Zj dinyatakan dengan z_inj :

= + = n i ij i j

j v xv

in z 1 0 _ (2) Sedangkan sinyal keluaran (aktivasi) dari Zj dinotasikan dengan zj :

) _

( j

j f z in

z =

(3) w0k : bias untuk unit ke-k pada lapisan output

wjk : bobot penghubung antara unit ke-j pada lapisan tersembunyi dan unit ke-k

pada lapisan output

Yk : Unit ke-k pada lapisan output;

Masukan pada unit output Yk dinyatakan dengan y_ink :

= + = p j jk j k

k w z w

in y 1 0 _ (4) Sedangkan sinyal keluaran (aktivasi) dari unit Yk dinotasikan dengan yk :

) _

( k

k f y in

y =

(5) Algoritma pelatihan JST backpropagation secara lengkap dapat dilihat di Lampiran 1.


(33)

13

2.4.3 Fungsi Aktivasi

Fungsi aktivasi merupakan fungsi yang menentukan level aktivasi, atau keadaan internal sebuah neuron dalam jaringan saraf tiruan, yang merupakan sebuah fungsi dari masukan yang diterima neuron tersebut. Pada JST backpropagation, fungsi aktivasi yang digunakan harus memenuhi karakteristik tertentu, yaitu kontinyu, terdiferensial dan fungsi yang tidak turun monoton.

Fungsi-fungsi aktivasi yang sering digunakan adalah Sigmoid Biner, yang mempunyai range output [0, 1] :

x

e x

f

+ =

1 1 ) (

(6) Sigmoid Bipolar, dengan range [-1,1] :

1 1

2 )

( −

+

= x

e x

f

(7) Linier, dengan range output tidak terbatas :

x x f( )=

(8) Linier Positif, dengan range dari 0 hingga tidak terbatas (positif) :

= , untuk > 00, untuk ≤ 0' (9)

Ilustrasi grafis untuk fungsi-fungsi aktivasi tersebut dapat dilihat pada Gambar 4.

( a ) Fungsi Sigmoid Biner ( b ) Fungsi Sigmoid Bipolar

( c ) Fungsi Linier ( d ) Fungsi Linier Positif Gambar 4 Fungsi aktivasi Sigmoid Biner, Sigmoid Bipolar, Linier dan Linier


(34)

2.5 Support Vector Regression (SVR)

SVR merupakan penerapan Support Vector Machine (SVM) untuk kasus regresi. Dalam kasus regresi, keluaran model ini berupa bilangan riil atau kontinyu. SVR merupakan metode yang dapat mengatasi overfitting, sehingga akan menghasilkan kinerja yang bagus (Smola dan Scholkoft, 2003).

Misal diberikan l buah data latih ( ), *) , … , ,, *, - ⊂ / × 0 dimana X merupakan ruang input, (misal X = 0 ), dalam ε-SVR, tujuan yang akan dicapai adalah untuk menemukan fungsi f(x) yang mempunyai deviasi paling besar senilai ε dari target aktual yi untuk keseluruhan data latih, dan pada saat yang

sama juga dicari yang setipis (flat) mungkin. Dengan demikian, semua kesalahan (selisih antara output fungsi dengan target aktual) akan diabaikan asalkan nilainya kurang dari ε, namun tidak akan menerima semua kesalahan yang lebih besar dari

ε.

Misal f(x) adalah fungsi linier dalam bentuk berikut :

= 〈2, 〉 + 5 dengan 2 ∈ /, 5 ∈ ℝ. (10)

dimana 〈. , . 〉 menyatakan dot product dalam X.

Ketipisan (flatness) untuk fungsi pada (10) mempunyai pengertian pencarian sebuah nilai w yang kecil, yang salah satu caranya adalah dengan meminimalkan nilai norm dari w, yaitu ‖2‖= = 〈2, 2〉. Hal tersebut dapat dituliskan dalam permasalahan optimisasi sebagai berikut :

min )=‖2‖= (11)

yang memenuhi : * − 〈2, 〉 − 5 ≤ A

〈2, 〉 + 5 − * ≤ A'


(35)

15

Persamaan (11) mengasumsikan bahwa terdapat sebuah fungsi f yang dapat mengakprosimasi seluruh pasangan , * dengan deviasi ε, atau dengan kata lain permasalahan optimisasi tersebut adalah feasible. Gambar 5 mengilustrasikan fungsi linier yang dapat mengakprosimasi seluruh pasangan , * dengan deviasi ε. Bila nilai ε sama dengan 0 maka didapatkan suatu fungsi regresi yang sempurna.

Kadangkala mungkin akan ditolerir/diterima adanya beberapa kesalahan (atau kasus yang infeasible), dimana terdapat keluaran dari fungsi menyimpang lebih dari ε. Untuk mengatasi pembatas yang infeasible pada permasalahan optimisasi (10), maka dapat ditambahkan variable slack ξi, ξi*. Selanjutnya

permasalahan optimisasi dapat diformulasikan sebagai berikut (Vapnik, 1995 dalam Smola dan Schölkopf, 2003) :

min )=‖2‖=+B ∑, D + D

F) (12)

yang memenuhi :G

* − 〈2, 〉 − 5 ≤ A + D 〈2, 〉 + 5 − * ≤ A + D∗

D , D∗ ≥ 0 '

konstanta C>0 menentukan tawar menawar (trade-off) antara ketipisan fungsi f dengan batas deviasi yang melebihi ε yang masih dapat ditoleransi. Hal ini kemudian berhadapan dengan yang disebut sebagai ε-insensitive lost function |D|J sebagai berikut:

|D|J ≔ |D| − A untuk lainnya0 jika |D| ≤ A ' (13)

Semua deviasi lebih besar dari ε dikenakan pinalti sebesar C. Penetapan nilai C yang besar berarti menekankan pentingnya faktor ε dibanding faktor ketipisan fungsi, sedangkan nilai C yang kecil berarti lebih mementingkan faktor ketipisan fungsi. Nilai ε ekuivalen dengan akurasi dari aproksimasi pada data latih. Gambar 6 menggambarkan situasi secara grafis penambahan variabel slack ξi, ξi* untuk


(36)

yang diluar daerah yang diarsir berkontribusi terhadap ongkos pinalti. Support vector adalah titik-titik dalam data latih yang terletak pada dan diluar pembatas dari fungsi regresi. Semakin kecil nilai ε, akurasi semakin tinggi, maka jumlah support vector semakin banyak, nilai variabel slack juga semakin tinggi sehingga memberi pengaruh yang lebih besar pada fungsi optimisasi.

Gambar 6 Ilustrasi pengaturan soft margin untuk SVR Linier

Permasalahan optimisasi pada persamaan (12), kebanyakan lebih mudah diselesaikan dalam formulasi dual (Smola dan Schölkopf, 2003), dan formulasi dual juga menyediakan kunci untuk memperluas SVM pada fungsi-fungsi non linier. Dalam formulasi dual, menggunakan metode pengganda Lagrange, permasalahan optimisasi (12) dapat dituliskan dengan :

Max Q−)=∑,,TF) R − R∗ SRT− RT∗U〈 , T〉 – A ∑,F) R + R∗ + ∑ * R − R, ∗

F)

' (14)

yang memenuhi

∑, R − R∗ = 0

F) dan R , R∗ ∈ W0, BX

w dapat diuraikan secara lengkap sebagai kombinasi linier dari vektor-vektor dalam data latih xi, 2 = ∑,F) R − R∗ , sehingga fungsi regresi dapat dituliskan sebagai :

= ∑, R − R∗ 〈 , 〉 + 5


(37)

17

Kompleksitas fungsi yang direpresentasikan dengan support vector tidak tergatung pada besarnya dimensi dari ruang input X, namun hanya tergantung pada banyaknya support vector. Algoritma lengkap support vector dapat diuraikan dalam dot product antar data. Pada saat mengevaluasi f(x), maka tidak perlu menghitung w secara eksplisit.

Penerapan SVR pada permasalahan kasus nonlinier, salah satu pendekatan penyelesaiannya dilakukan dengan menggunakan metode kernel. Hal ini dilakukan dengan melakukan praproses, memetakan data x dari ruang input X ke ruang fitur F dengan dimensi yang lebih tinggi melalui sebuah fungsi kernel

Y: / → Y .

Sering kali fungsi Y ini tidak tersedia atau tidak bisa dihitung, namun mengingat algoritma penyelesaian support vector regression hanya tergantung pada dot product antar titik-titik xi dalam ruang input, maka hanya cukup

mengetahui \ , ] = 〈Y , Y ′ 〉, selanjutnya permasalahan optimisasi support vector dapat dituliskan kembali sebagai berikut :

Memaksimalkan `

−)=∑ R − R∗ SR

T− RT∗U\ , T ,

,TF)

– A ∑, R + R∗ F)

+ ∑ * R − R, ∗ F)

' (16)

yang memenuhi

∑, R − R∗ = 0

F) dan R , R∗ ∈ W0, BX

, persamaan (15) dapat dituliskan kembali sebagai

2 = ∑, R − R∗ Y

F) dan = ∑,F) R − R∗ \ , + 5 (17)

Fungsi kernel \ , ] yang biasanya digunakan dalam SVR adalah :

• Kernel Linier : \ , ] = 〈 , ′〉

• Kernel Polynomial : \ , ] = 〈 , ]〉 + a b

• Kernel Radial Basis Function (RBF) : \ , ] = c

‖dedf‖g ghg


(38)

(39)

19

BAB III DATA DAN METODOLOGI PENELITIAN

3.1 Tahapan Penelitian

Proses penelitian dilakukan dengan tahapan-tahapan seperti pada Gambar 7. Mulai

Studi Literatur

Pengumpulan Data

Data SOI Data Hujan

Gambar 7 Diagram Alir Penelitian

Pemilihan Peubah prediktor untuk prediksi total hujan di musim hujan

Hasil

Dokumentasi dan Pelaporan

Selesai Pembuatan Model dengan JST

Pengolahan Data

(Pelatihan dan Pengujian Model)

Dataset untuk pelatihan dan pengujian model

Pembuatan Model dengan SVR

Pengolahan Data

(Pelatihan dan Pengujian Model)

Hasil


(40)

3.2 Data Penelitian

Data yang digunakan dalam penelitian ini adalah data sekunder curah hujan dari Badan Meteorologi Klimatologi dan Geofisika (BMKG) dan Data SOI dari website Badan Meteorologi Pemerintah Australia sebagai berikut :.

a. Data curah hujan terdiri dari data total hujan pada musim hujan, awal musim hujan dan panjang musim hujan dari lima wilayah hujan di Kabupaten Indramayu. Data-data tersebut merupakan hasil pengolahan (perhitungan) dari data curah hujan dasarian. Data total hujan pada musim hujan akan digunakan sebagai target prediksi, sedangkan data panjang musim hujan dan awal musim hujan digunakan sebagai bagian dari peubah prediktor.

b. Data SOI digunakan sebagai peubah prediktor untuk menangkap pengaruh iklim global terhadap fenomena curah hujan di Kabupaten Indramayu. Data SOI bulanan dapat diperoleh dari website Badan Meteorologi Pemerintah Australia pada alamat http://www.bom.gov.au.

3.3 Praproses Pengolahan Data

Model dibuat untuk diterapkan pada dataset yang merupakan rata-rata dari 5 (lima) wilayah. Analisa data awal dilakukan untuk menentukan peubah-peubah yang akan digunakan sebagai prediktor dengan melihat koefisien korelasi antara nilai Total Hujan di Musim Hujan (THMH) dengan nilai-nilai Awal Musim Hujan (AMH), Panjang Musim Hujan (PMH), nilai SOI bulan Agustus s/d Desember pada tahun yang sama serta nilai SOI pada bulan Januari hingga Juli pada tahun berikutnya.

3.4 Pembuatan Model untuk Percobaan

Model yang digunakan untuk percobaan adalah Jaringan Saraf Tiruan (JST) dan Support Vector Regression (SVR). JST yang dibuat adalah JST backpropagation dengan algoritma pembelajaran gradient descent dan dengan membandingkan banyaknya hidden neuron. Sedangkan untuk model SVR yang digunakan adalah epsilon-SVR dengan membandingkan tiga jenis fungsi kernel. Model-model tersebut selanjutnya dinotasikan seperti pada Tabel 1


(41)

21

Tabel 1 Model JST dan SVR untuk Percobaan

Model Keterangan

JST-10 Model JST dengan 10 hidden neuron JST-30 Model JST dengan 30 hidden neuron JST-50 Model JST dengan 50 hidden neuron SVR-L Model SVR dengan fungsi kernel Linier SVR-P Model SVR dengan fungsi kernel Polynomial SVR-R Model SVR dengan fungsi kernel RBF 3.5 Pengolahaan Data

Pada tahap pengolahan data, dilakukan pelatihan dan pengujian model. Proses validasi model dilakukan dengan cara melatih model dengan data latih sepanjang periode tertentu pada tahun-tahun yang berurutan, kemudian diuji untuk memprediksi data pada satu tahun berikutnya. Gambar 8 mengilustrasikan proses pengambilan data latih dan data uji percobaan, dengan data latih sepanjang 15 periode. Misalkan dipunyai dataset sepanjang 20 periode, maka hanya dapat dilakukan pengambilan 5 pasang data latih dan data uji. Pada penelitian ini, untuk mengetahui pengaruh penggunaan data latih, maka panjang periode data latih dibuat dalam tiga skenario, yaitu :

- Skenario A, menggunakan data latih sepanjang 15 periode - Skenario B, menggunakan data latih sepanjang 20 periode - Skenario C, menggunakan data latih sepanjang 25 periode


(42)

Penggunaan skenario data latih ini dikombinasikan dengan model-model dari JST dan SVR, akan menghasilkan 9 buah model percobaan dengan JST dan 9 buah model percobaan dengan SVR. Untuk mendapatkan hasil terbaik, pada setiap model JST dilakukan percobaan sebanyak 5 kali dan diambil satu hasil terbaiknya, sedangkan untuk model SVR dilakukan optimisasi parameter dengan metode grid search. Metode ini menyerupai metode trial dan error secara manual. Pada metode ini setiap parameter ditetapkan beberapa nilai yang akan digunakan, dan kemudian dipasangkan dalam grid n-dimensi, dengan n menunjukkan jumlah parameter. Setiap pasangan parameter digunakan dalam percobaan, dan dipilih pasangan parameter yang memberikan kinerja terbaik.

3.6 Evaluasi Hasil Percobaan

Untuk melihat kinerja model, hasil prediksi dievaluasi dengan menggunakan 3 (tiga) kriteria, yaitu (i) root mean squared error (RMSE) , (ii) mean absolute percentace error (MAPE), dan (iii) koefisien korelasi R.

RMSE dirumuskan sebagai berikut :

ij k = l)∑ * − *m =

F) (18)

Dengan * adalah data observasi ke-i dan *m hasil prediksi untuk data observasi ke-i dan n adalah banyaknya data observasi.

MAPE dirumuskan sebagai berikut :

jnok = )∑ pqr qmr

qr p

F) × 100% (19)

Kedua kriteria di atas, yaitu pengukuran kinerja prediksi berbasis residual (selisih antara data observasi dan prediksi) digunakan karena nilai observasi aktual untuk setiap prediksi telah diketahui. Semakin kecil nilai-nilai kriteria diatas, maka kinerja model semakin baik.

Koefisien korelasi produk momen (atau juga dikenal dengan korelasi Pearson), didefinsikan dengan

i = atu *, *m =yvar q var qmcov q,qm (20)

Dengan cov *, *m adalah kovarian antara observasi dan prediksi dan var * = cov *, * , var *m = cov *m, *m adalah variansi dari observasi dan prediksi.


(43)

23

3.7 Lingkup Pengembangan Sistem

Spesifikasi perangkat keras dan perangkat lunak yang akan digunakan dalam penelitian ini sebagai berikut :

• Perangkat keras : prosesor Intel® Core™ i5-450M @ 2.40GHz, Memori 2 GB dan hardisk 640 GB.

• Perangkat lunak : Windows 7 Professional, Matlab 7.7.0, SVM library (LIBSVM).


(44)

(45)

25

BAB IV HASIL DAN PEMBAHASAN

Untuk memilih peubah-peubah yang akan digunakan untuk memprediksi total hujan pada musim hujan, maka dilakukan analisis korelasi antara total hujan musim hujan dengan peubah lainnya. Nilai korelasi antara total hujan dengan peubah-peubah tersebut seperti pada Tabel 2.

Tabel 2 Korelasi antara Total Hujan pada Musim Hujan dengan Panjang Musim hujan, Awal Musim Hujan dan SOI Bulanan

Nama Peubah Koefisien Korelasi

Panjang Musim Hujan 0,73

Awal Musim Hujan -0,46

SOI Agustus 0,52

SOI September 0,45

SOI Oktober 0,46

SOI Nopember 0,45

SOI Desember 0,30

SOI Januari 0,35

SOI Februari 0,54

SOI Maret 0,35

SOI April 0,15

SOI Mei -0,15

SOI Juni 0,03

SOI Juli -0,29

Peubah-peubah yang paling berkorelasi dengan Total Hujan pada Musim Hujan (THMH) adalah Panjang Musim Hujan (PMH), Awal Musim Hujan (AMH), SOI-Februari, SOI Agustus dan SOI-Oktober. Kelima peubah tersebut digunakan sebagai peubah prediktor untuk menduga total hujan pada musim hujan. Nilai-nilai SOI bulan September dan bulan Nopember mempunyai koefisien korelasi 0,45, masih lebih kecil dibanding kelima peubah yang telah dipilih, serta mempunyai korelasi yang kuat dengan SOI bulan Oktober dan Agustus, sehingga tidak diikutkan sebagai peubah prediktor.

Untuk nilai SOI di bulan-bulan lainnya juga kurang berkorelasi dengan nilai total hujan musim hujan, yaitu koefisien korelasinya kurang dari 0,4. Nilai-nilai koefisien korelasi antar peubah selengkapnya dapat dilihat pada Lampiran 2.


(46)

Setelah dipilih peubah-peubah yang akan digunakan sebagai prediktor penduga total hujan pada musim hujan, maka disusun dataset yang digunakan untuk proses pelatihan dan pengujian yaitu pasangan nilai aktual peubah prediktor (PMH, AMH, SOI-8, SOI-10 dan SOI-2) dan target prediksi (THMH). Dataset yang digunakan dalam penelitian ini selengkapnya dapat dilihat pada Lampiran 3. Nilai-nilai panjang musim hujan, awal musim hujan dan total hujan pada musim hujan merupakan nilai rata-rata dari 5 (lima) wilayah hujan di Kabupaten Indramayu. Nilai-nilai peubah tersebut untuk masing-masing wilayah dapat dilihat pada Lampiran 4 s/d Lampiran 8.

4.1 Pemodelan menggunakan Jaringan Saraf Tiruan (JST)

JST yang diimplementasikan dalam penelitian ini adalah JST backpropagation dengan banyaknya hidden neuron 10, 30 dan 50. Untuk proses pembelajarannya menggunakan algoritma gradientdescent, dengan parameter learning rate 0,05 dan mimimum gradient 1 x 10-10. Fungsi aktivasi yang digunakan pada seluruh neuron pada hidden layer adalah sigmoid bipolar seperti pada persamaan (6), sedangkan untuk fungsi aktivasi pada neuron di output layer menggunakan fungsi sigmoid seperti pada persamaan (5). Sebelum diproses dalam JST, terlebih dahulu dilakukan normalisasi terhadap setiap peubah dalam data set pelatihan, dengan menggunakan formula :

{ | =}~€d} }~r•}~r• (21)

Data yang diolah dalam percobaan ini adalah data rata-rata lima wilayah seperti pada Lampiran 3, yaitu data panjang musim hujan (dalam angka yang menunjukkan jumlah dasarian PMH, dengan range nilai 8,33 s/d 18,00), data awal musim hujan (dalam angka yang menunjukkan angka dasarian AMH, dengan range nilai antara 29,25 s/d 36,50), SOI bulan Agustus, Oktober dan Februari (dalam angka dengan range nilai antara -35,70 s/d 21), dan data total hujan pada musim hujan, dalam satuan millimeter per musim hujan dengan range nilai antara 463,23 s/d 1.750,11. Setelah proses normalisasi, maka nilai data dari setiap peubah berada pada rentang nilai 0 s/d 1.


(47)

27

Implementasi model JST dengan tiga skenario data latih menghasilkan prediksi yang selengkapnya dapat dilihat pada Lampiran 9 s/d 11. Pengukuran kinerja terhadap model JST untuk masing-masing data uji yang digunakan, nilai kinerja selengkapnya seperti pada Tabel 3.

Tabel 3 Kinerja Model JST pada dataset rata-rata dari lima wilayah untuk data uji sebanyak 28, 23 dan 18 buah

Model JST RMSE MAPE R

A.Data Latih sebanyak 15 periode (28 data uji)

JST-10 338,29 33,63% 0,07

JST-30 312,74 31,54% 0,25

JST-50 305,10 30,33% 0,22

B. Data Latih sebanyak 20 periode (23 data uji)

JST-10 292,06 28,76% 0,19

JST-30 292,95 29,19% 0,34

JST-50 288,75 29,16% 0,11

C. Data Latih sebanyak 25 periode (18 data uji)

JST-10 236,78 23,25% 0,55

JST-30 238,80 23,87% 0,55

JST-50 246,82 23,86% 0,56

Secara keseluruhan, model JST-10-C, yaitu model JST dengan 10 hidden neuron yang dijalankan dengan skenario data latih sebanyak 25 buah, merupakan model terbaik dengan masing-masing nilai kinerjanya adalah RMSE 236,78, MAPE 23,25% dan R 0,55. Meskipun model JST-10-C merupakan model terbaik, namun model JST-10, yaitu JST dengan 10 hidden neuron ternyata tidak selalu menjadi yang terbaik pada setiap skenario data latih. Pada skenario data latih A, dengan data latih 15 periode, kinerja yang lebih baik ditunjukkan dari model JST dengan 30 hidden neuron dengan RMSE 312,74, MAPE 31,54% dan R 0,25, demikian juga pada skenario data latih B, dengan data latih 20 periode, kinerja terbaik juga dicapai oleh model JST dengan 30 hidden neuron (JST30-B) dengan RMSE 292,95, MAPE 29,19% dan R 0,34..

Evaluasi kinerja pada Tabel 3 dibuat dengan mengevaluasi seluruh prediksi yang dihasilkan oleh model JST-10, JST-30 dan JST-50 pada masing-masing skenario data latih. Dataset yang digunakan berisi data observasi sepanjang 43 periode (43 tahun), sehingga dengan masing-masing skenario (A, B dan C) dapat


(48)

diperoleh data uji dan hasil prediksi sebanyak 28, 23 dan 18 periode. Evaluasi model yang dilakukan pada periode data yang sama, yaitu hanya pada 18 periode terakhir (tahun 1991 s/d 2009), diperoleh hasil evaluasi kinerja yang selengkapnya dapat dilihat pada pada Tabel 4.

Tabel 4 Kinerja Model JST pada dataset rata-rata dari lima wilayah untuk data uji yang sama (18 tahun terakhir)

Model JST RMSE MAPE R

A.Data Latih sebanyak 15 buah (18 data uji)

JST-10 254,74 25,29% 0,17

JST-30 246,94 24,92% 0,38

JST-50 238,68 23,07% 0,38

B. Data Latih sebanyak 20 buah (18 data uji)

JST-10 244,23 23,26% 0,25

JST-30 231,32 22,70% 0,46

JST-50 246,90 24,18% 0,29

C. Data Latih sebanyak 25 buah (18 data uji)

JST-10 236,78 23,25% 0,55

JST-30 238,80 23,87% 0,55

JST-50 246,82 23,86% 0,56

Kinerja model pada Tabel 4 menunjukkan model JST-30-B mempunyai kinerja yang lebih baik dibanding model lainnya, yaitu mempunyai kinerja terbaik pada nilai RMSE (231,32) dan MAPE (22,68%), namun berdasarkan nilai korelasi, hasil yang lebih baik ditunjukkan oleh model JST-50-C. Nilai kinerja pada Tabel 4 juga tidak dapat menunjukkan adanya arsitektur JST yang selalu konsisten terbaik pada setiap skenario data latih, ataupun sebaliknya, adanya skenario data latih yang konsisten terbaik pada setiap arsitektur JST.

Perbandingan antara data observasi dengan hasil prediksi dari tiga model yang mempunyai kinerja terbaik pada setiap skenario data latih sesuai Tabel 4 (JST-50-A, JST-30-B dan JST-10-C) pada periode 1991 s/d 2009 (18 tahun) selengkapnya dapat dilihat pada Gambar 9. Label tahun pada gambar tersebut menunjukkan bahwa prosentase kesalahan prediksi terhadap nilai observasi di atas 20%.


(49)

29

(a). (b).

(c).

Gambar 9 Grafik Perbandingan Hasil Prediksi Model JST (a). JST-50-A, (b). JST-30-B, (c). JST-10-C

Hasil prediksi pada periode tahun 1991 s/s 2009 dari ketiga skenario data latih sebagaimana ditunjukkan pada Gambar 9 memperlihatkan bahwa prediksi model gagal mendekati data observasi pada tahun-tahun dengan total hujan yang rendah, yaitu tahun 1997, 2002 dan 2004. Data observasi pada tahun 2002 sebesar 463,23 mm, namun nilai prediksi yang dihasilkan dari model lebih dari 1090 mm, dengan persentase kesalahannya lebih dari 135%. Untuk tahun 2004, data observasi sebesar 653,38 mm, namun hasil prediksi lebih dari 973 mm, dengan


(50)

persentase kesalahan lebih dari 48%, sedangkan untuk tahun 1997 dengan data observasi total hujan musim hujan sebesar 702,67 mm, nilai prediksi yang dihasilkan model lebih dari 1056 mm dengan persentase kesalahan lebih dari 50%. Nilai-nilai prediksi pada tahun-tahun ini selalu lebih besar dari nilai observasi.

Pada tahun-tahun dengan data observasi total hujan pada musim hujan yang tinggi, kinerja prediksi yang dihasilkan model lebih baik dari pada hasil prediksi pada tahun-tahun dengan total hujan pada musim hujan yang rendah. Tahun 2001 yang merupakan tahun dengan total pada hujan musim hujan tertinggi sebesar 1482,27 mm, persentase kesalahan prediksi yang dihasilkan model, khususnya JST-30, JST dengan 30 hidden neuron, kurang dari 20%. Untuk tahun 2000 dengan data observasi 1297,38 mm dan tahun 1995 dengan data observasi 1257,33 mm, persentase kesalahan prediksi dari setiap model selalu kurang dari 20 %. Nilai prediksi untuk tahun-tahun ini selalu lebih kecil dari nilai observasi.

4.2 Pemodelan menggunakan Support Vector Regression

Pada percobaan menggunakan model SVR, diimplementasikan tiga fungsi kernel, yaitu Linier, Polynomial dan Radial Basis Function (RBF). Fungsi-fungsi kernel tersebut dalam LIBSVM (Chang dan Lin, 2012) diformulasikan sebagai berikut :

Linier \ •‚ƒ, „ƒ = •‚ƒ . „ƒ

Polynomial \ •‚ƒ, „ƒ = …•‚ƒ . „ƒ + atc 0 † Linier \ •‚ƒ, „ƒ = c ‡|ˆ‚‚ƒ ‚ƒ|=

Untuk mengimplementasikan SVR, maka perlu memilih parameter-parameter yang dibutuhkan oleh SVR dan oleh fungsi kernel yang digunakan. Parameter yang digunakan pada percobaan ini :

- Pada model SVR-L, dengan fungsi kernel linier, diatur parameter konstanta C dan ε.

- Pada model SVR-P, dengan fungsi kernel polynomial, diatur parameter γ

dan d (degree).


(51)

31

Proses validasi model pada percobaan ini dilakukan dengan melatih sebuah model dengan satu set data latih dan digunakan untuk memprediksi data satu periode berikutnya. Untuk data set dari rata-rata lima wilayah, yang berisi sebanyak 43 periode data, penggunaan skenario A, dengan data latih 15 periode, maka dapat dilakukan proses pelatihan dan pengujian sebanyak 28 kali. Proses pertama menggunakan data latih periode 1 s/d 15 dan data uji pada periode 16, sedangkan proses terakhir (ke-28) menggunakan data latih periode 28 s/d 42, dan data uji periode 43.

Pada setiap proses pelatihan dan pengujian, dilakukan pemilihan parameter terbaik dengan proses grid search, yang menyerupai metode trial dan error secara manual. Pada metode ini setiap parameter ditetapkan beberapa nilai yang akan digunakan, dan kemudian dikumpulkan dalam grid n-dimensi, dengan n menunjukkan jumlah parameter. Setiap pasang parameter digunakan untuk proses pelatihan dan pengujian, dan nilai kinerja prediksinya disimpan pada grid yang sesuai.

Sebagai contoh, pada model SVR-L, ditetapkan nilai untuk parameter C : 2 -7

, 2-6, …, 24, 25 ( 13 nilai) dan nilai untuk parameter ε : 0,01; 0,02; …; 0,19; 0,2 (20 nilai), sehingga dipunyai 160 pasang parameter C dan ε. Hasil pengukuran kinerja (MAPE) untuk pasangan data latih-data uji pertama (data latih periode ke-1 s/d ke-ke-15, dan data uji ke-ke-16), kinerja terbaik diperoleh dari nilai ε = 0,03 dan C = 16. Hasil pengukuran kinerja untuk setiap pasang parameter (grid) selengkapnya dapat di lihat pada Lampiran 12.

Proses yang sama dilakukan untuk pasangan data latih-data uji yang lain, dan dihitung rata-rata kinerja untuk setiap grid (pasang parameter), dan parameter dengan rata-rata kinerja terbaik dipilih untuk digunakan sebagai parameter model SVR. Sebagai contoh, rata-rata kinerja dari 28 pasang data latih-data uji untuk model SVR-L-A dapat dilihat pada Lampiran 12. Kinerja terbaik diperoleh dari pasangan parameter C = 4 dan ε = 0,12.

Pada penelitian ini, nilai-nilai parameter yang diujicobakan untuk setiap model serta parameter terbaik yang terpilih digunakan untuk pengujian akhir adalah seperti pada Tabel 5.


(52)

Tabel 5 Parameter Percobaan Model SVR

Model Nilai-nilai Parameter (proses grid serach)

Parameter terbaik Skenario Parameter SVR-L

(Linier)

C = 2-7; 2-6,…,;25

ε = 0,01; 0,02; … ; 0,2

SVR-L-A SVR-L-B SVR-L-C

C = 4; ε = 0,12 C = 16; ε = 0,15 C = 32; ε = 0,13 SVR-P

(Polynomial)

C = 20; ε = 0,05

γ = 2-7; 2-6;…; 25

d = 3; 4; 5; 6; 7

SVR-P-A SVR-P-B SVR-P-C

γ = 0,0625; d = 3

γ = 0,0625; d = 3

γ = 0,0625; d = 3 SVR-R

(RBF)

C = 20

ε = 0,01; 0,02; …; 0,2

γ = 2-7; 2-6; …; 25

SVR-R-A SVR-R-B SVR-R-C

γ = 0,125; ε = 0,1

γ = 0, 25; ε = 0,12

γ = 0,0625; ε = 0,08

Hasil percobaan setiap model dengan menggunakan parameter terbaik seperti pada Tabel 5, selengkapnya dapat dilihat pada Lampiran 13, 14 dan 15. Pengukuran kinerja terhadap seluruh hasil prediksi yang dihasilkan masing-masing model selengkapnya seperti pada Tabel 6.

Tabel 6 Kinerja Model SVR pada dataset rata-rata dari lima wilayah untuk data uji sebanyak 28, 23 dan 18 buah

Model SVR RMSE MAPE R

A. Data Latih sebanyak 15 buah (28 data uji)

SVR-L 197,17 16,63% 0,61

SVR-P 209,39 17,37% 0,61

SVR-R 194,03 16,59% 0,64

B. Data Latih sebanyak 20 buah (23 data uji)

SVR-L 178,81 13,33% 0,72

SVR-P 195,67 17,29% 0,64

SVR-R 176,50 15,14% 0,75

C. Data Latih sebanyak 25 buah (18 data uji)

SVR-L 138,44 11,16% 0,82

SVR-P 155,88 13,29% 0,76

SVR-R 134,38 11,05% 0,82

Secara keseluruhan model SVR-R-C, yaitu model SVR dengan kernel RBF yang dilatih menggunakan skenario data latih 25 periode mempunyai kinerja yang paling baik dengan RMSE 134,28 , MAPE 11,05% dan R 0,82. Model SVR-R juga konsisten menjadi model yang terbaik pada setiap skenario data latih,


(53)

33

khususnya pada kinerja RMSE dan kinerja R, sedangkan pada kinerja MAPE, pada skenario data latih 20 buah, SVR-L mempunyai nilai yang lebih baik (13,33% dibanding 15,14 %). Demikian juga dengan skenario C, penggunaan data latih sebanyak 25 periode selalu menunjukkan kinerja yang paling baik pada semua model kernel SVR, bahkan terlihat pola bahwa semakin banyak data latih yang digunakan, semakin baik kinerjanya.

Untuk pengukuran kinerja model SVR pada data uji yang sama, yaitu sebanyak 18 periode terakhir, hasil selengkapnya seperti pada Tabel 7.

Tabel 7 Kinerja Model SVR pada dataset rata-rata dari lima wilayah untuk data uji yang sama (18 tahun terakhir)

Model SVR RMSE MAPE R

A. Data Latih sebanyak 15 buah (18 data uji)

SVR-L 162,50 12,76% 0,73

SVR-P 150,22 12,81% 0,78

SVR-R 168,98 13,85% 0,70

B. Data Latih sebanyak 20 buah (18 data uji)

SVR-L 120,59 9,09% 0,86

SVR-P 158,85 14,64% 0,74

SVR-R 146,45 11,98% 0,80

C. Data Latih sebanyak 25 buah (18 data uji)

SVR-L 138,44 11,16% 0,82

SVR-P 155,88 13,29% 0,76

SVR-R 134,38 11,05% 0,82

Hasil pengukuran kinerja pada data uji yang sama, menunjukkan model yang mempunyai kinerja terbaik adalah SVR-L-B, yaitu model SVR dengan kernel linier yang dilatih dengan skenario data latih 20 buah. Namun demikian, penggunaan SVR-L tidak selalu menunjukkan kinerja yang terbaik di setiap skenario data latih, semikian pula dengan penggunaan sknario data latih B juga tidak selalu menjadi yang terbaik pada setiap kernel SVR.

Gambaran perbandingan antara data observasi dengan hasil prediksi dari model-model terbaik untuk setiap skenario data latih berdasar Tabel 7 (SVR-P-A, SVR-L-B dan SVR-R-C) pada 18 periode terakhir selengkapnya dapat dilihat pada Gambar 10.


(54)

(a). (b).

(c).

Gambar 10 Grafik Perbandingan Hasil Prediksi Model SVR (a). SVR-P-A, (b). SVR-L-B, (c). SVR-R-C

Hasil prediksi dari model-model SVR dapat mengikuti pola data observasi. Pada periode 2001 dan 2002, saat total hujan pada musim hujan menunjukkan nilai tertinggi dan terendahnya, ketiga model dapat mengikuti menemukan pola tersebut, walaupun tingkat kesalahan model SVR-R-C terhadap titik tertinggi masih mencapai 26%. Pada tahun 2007, model SVR-L-A dan SVR-P-C mempunyai pola yang sama gagal mendekati data observasi. Pada titik tersebut, prediksinya jauh di bawah data observasi dengan persentase kesalahan hingga 26%.

1991

1997 2009

y = 0.671x + 324.4 R² = 0.607

400 600 800 1000 1200 1400

400 600 800 1000 1200 1400

P re d ik si ( m m ) Observasi (mm) SVR-P-A Linear (SVR-P-A) 2007

y = 0.714x + 272.3 R² = 0.748

400 600 800 1000 1200 1400

400 600 800 1000 1200 1400

Pr e d ik si ( m m ) Observasi (mm) SVR-L-B Linear (SVR-L-B) 1992 1997 2002 1999 2007

y = 0.67x + 333.3 R² = 0.679

400 600 800 1000 1200 1400

400 600 800 1000 1200 1400

P re d ik si ( m m ) Observasi (mm) SVR-R-C Linear (SVR-R-C)


(55)

35

4.3 Perbandingan Pemodelan JST dan SVR

(a)

(b)

Gambar 11 Grafik perbandingan kinerja model-model JST dan SVR (a). MAE dan RMSE, (b). Persentase Kesalahan /MAPE

Berdasarkan evaluasi kinerja model-model JST dan SVR, gambaran perbandingan range nilai-nilai kesalahan (selisih nilai observasi dan prediksi) serta persentase kesalahan (selisih nilai observasi dan prediksi dibanding nilai observasi) dari model terbaik pada setiap skenario selengkapnya dapat dilihat pada Gambar 11. Model-model SVR secara keseluruhan mempunyai kinerja yang lebih baik dibanding model JST. Range nilai keasalahan prediksi setiap model

0.00 100.00 200.00 300.00 400.00 500.00 600.00 700.00

JST-50-A JST-30-B JST-10-C SVR-P-A SVR-L-B SVR-R-C

E rr o r at a u S el is ih O b se rv a si & P re d ik si C u ra h H u ja n ( m m ) Model Minimum |Error| Maksimum |Error| Rata-rata |Error| RMSE 0.00% 20.00% 40.00% 60.00% 80.00% 100.00% 120.00% 140.00% 160.00%

JST-50-A JST-30-B JST-10-C SVR-P-A SVR-L-B SVR-R-C

P ro se n ta se Ke sa la h a n ( E rr o r) P re d ik si Model Minimum Maksimum Rata-rata


(56)

SVR semuanya lebih kecil dibanding model JST, demikian pula persentase kesalahan prediksi. Besarnya persentase kesalahan dari model JST berasal dari gagalnya prediksi model tersebut mendekati nilai observasi pada tahun 2002, yang merupakan tahun dengan total hujan pada musim hujan terendah. Persentase kesalahan prediksi pada tahun tersebut lebih dari 100%.

4.4 Implementasi Model Prediksi pada Data Wilayah

Pada pembahasan sebelumnya, model-model diimplementasikan pada dataset yang merupakan rata-rata dari lima wilayah. Model SVR menunjukkan kinerja yang lebih baik dibanding model JST. Model-model SVR ini selanjutnya diimplementasikan pada data set wilayah 1 s/d 5 sebagaimana Lampiran 4 s/d Lampiran 8. Model diimplementasikan dengan peubah masukan yang sama, yaitu Panjang Musim Hujan, Awal Musim Hujan dan SOI bulan Agustus, Oktober dan Februari. Hasil prediksi untuk setiap model SVR pada setiap wilayah selengkapnya dapat dilihat pada Lampiran 16 s/d Lampiran 30. Perbandingan pengukuran kinerja RMSE dari setiap model dengan SVR dan setiap skenario data latih dapat dilihat pada Gambar 12.

Gambar 12 Perbandingan kinerja RMSE model SVR pada setiap wilayah hujan 0

50 100 150 200 250 300 350 400

Wilayah 1 Wilayah 2 Wilayah 3 Wilayah 4 Wilayah 5

R

M

S

E

(

m

m

)

Wilayah Hujan

SVR-L-A SVR-L-B SVR-L-C SVR-P-A SVR-P-B SVR-P-C SVR-R-A SVR-R-B SVR-R-C


(57)

37

Hasil pengukuran RMSE untuk setiap model sangat bervariasi, hal ini ada hubungannya dengan banyaknya data uji yang digunakan serta hubungan (korelasi) antara peubah prediktor dengan total hujan pada musim hujan di masing-masing wilayah hujan yang berbeda-beda. Nilai-nilai koefisien korelasi antara peubah respon (total hujan musim hujan) dengan peubah prediktor (awal musim hujan, panjang musim hujan dan SOI) pada setiap wilayah, serta banyaknya data set untuk setiap wilayah dapat dilihat pada Tabel 8.

Tabel 8 Koefisien korelasi peubah prediktor dengan total hujan musim hujan serta banyaknya data set pada Wilayah hujan 1 s/d 5

Dataset

Koefisien korelasi terhadap total hujan pada musim hujan Jumlah Data Panjang

Musim Hujan

Awal Musim Hujan

SOI Agustus

SOI Oktober

SOI Februari

Data Set

Data uji

Wilayah 1 0,78 -0,37 0,37 0,38 0,46 38 13

Wilayah 2 0,65 -0,10 0,12 0,23 0,42 29 4

Wilayah 3 0,55 -0,30 0,27 0,41 0,42 28 3

Wilayah 4 0,72 -0,59 0,41 0,31 0,41 41 16

Wilayah 5 0,81 -0,64 0,55 0,44 0,46 36 11

Pada Wilayah 2 dan 3, nilai kinerja RMSE lebih baik dibanding dengan tiga wilayah lainnya, namun melihat banyaknya data uji yang digunakan, perbedaan kinerja ini disebabkan karena perbedaan banyaknya data uji yang digunakan. Wilayah 2 dan dan 3 menggunakan yang jauh lebih sedikit dibanding wilayah lainnya, hasil perhitungan RMSE lebih kecil dibanding wilayah lainnya.

Pada Wilayah 2, penggunaan skenario data latih tampak mempengaruhi kinerja model, semakin banyak data latih kinerja model juga meningkat (menurunkan nilai RMSE). Untuk wilayah lain tidak nampak pengaruh penggunaan skenario data latih secara konsisten, penggunaan data latih yang lebih banyak tidak selalu menunjukkan kinerja yang lebih baik dibanding yang data latihnya lebih sedikit, namun demikian dari tiga skenario data latih, penggunaan data latih terbanyak (dengan 25 data latih) menunjukkan kinerja yang lebih baik dibanding skenario lainnya. Penggunaan fungsi kernel tidak menunjukkan


(58)

pengaruh yang konsisten terhadap kinerja model pada setiap wilayah. Tidak ada model dengan kernel tertentu yang kinerjanya dominan di setiap wilayah.

Karakteristik hubungan antara peubah respon dan peubah prediktor pada data Wilayah 1 s/d Wilayah 5 berbeda dengan hubungan pada data rata-rata lima wilayah sebagaimana yang ditunjukkan dari nilai-nilai koefisien korelasi peubah prediktor pada Tabel 8. Pada Wilayah 1 s/d Wilayah 4, SOI bulan Agustus dan Oktober kurang berkorelasi dengan total hujan pada musim hujan, sedangkan pada Wilayah 5, hubungan seluruh peubah prediktor dengan nilai total hujan pada musim hujan mempunyai korelasi yang lebih baik. Kondisi demikian mestinya memberikan kinerja yang lebih baik dibanding pada wilayah lainnya, namun apabila dilihat pada Gambar 12, kinerja RMSE pada Wilayah 5 cenderung lebih rendah dibanding wilayah lain. Hal ini disebabkan besarnya rentang nilai total hujan (nilai minimum dan nilai maksimum) pada Wilayah 5 dibanding wilayah lainnya (data set Wilayah 5 dapat dilihat pada Lampiran 8). Besarnya nilai RMSE pada Wilayah 5 dipengaruhi besarnya kesalahan prediksi pada tahun 1997 (tahun dengan total hujan yang rendah) dan pada tahun 2001 (tahun dengan total hujan yang tinggi). Hasil prediksi model SVR untuk data wilayah 5 selengkapnya dapat dilihat pada Lampiran 28, 29 dan 30.


(59)

39

BAB V SIMPULAN DAN SARAN

5.1Simpulan

Kesimpulan dari penelitian ini, bahwa model Jaringan Saraf Tiruan dan Support Vector Regrresion dapat digunakan untuk Model Prediksi Total Hujan pada Musim Hujan dengan prediktor Awal Musim Hujan, Panjang Musim Hujan dan SOI Agustus, Oktober dan Februari. Model JST terbaik diperoleh dari model dengan 30 buah hidden neuron dan dilatih dengan data latih 20 periode, dengan kinerja RMSE 231,32, MAPE 22,70% dan R 0,46. Model SVR terbaik diperoleh dari model dengan kernel Linier dan dilatih dengan skenario 20 periode data latih, dengan kinerja RMSE 120,60, MAPE 9,09 % dan R 0,86 .

Kinerja model SVR secara keseluruhan lebih baik dibanding kinerja model JST. Namun demikian penggunaan skenario data latih 15, 20 dan 25 periode tidak menunjukkan pengaruh yang konsisten terhadap peningkatan/penurunan kinerja 5.2 Saran

Model yang dibuat pada penelitian ini menggunakan prediktor berupa peubah-peubah yang secara observasi tidak dapat diperoleh pada waktu bersamaan. Hanya peubah Awal Musim Hujan dan SOI bulan Agustus yang dapat diperoleh lebih awal, sedangkan Panjang Musim Hujan, dan SOI Februari justru diperoleh setelah musim hujan berakhir. Oleh karena itu diperlukan model-model untuk memprediksi peubah-peubah tersebut. Hasil prediksi dari model tersebut dapat digunakan sebagai masukan pada model prediksi total hujan pada musim hujan ini sehingga dapat dilakukan prediksi yang lebih awal tanpa harus menunggu nilai observasi SOI bulan Februari.


(60)

(1)

400-70-15 21.00 3.34 87.00

400-72-19 17.50 3.34 112.00

400-224-16 20.00 3.33 109.00

400-130-8 22.50 3.32 108.00

400-93-5 22.00 3.32 90.00

400-197-5 21.60 3.32 115.00

400-254-4 21.10 3.32 99.00

400-131-10 21.00 3.32 103.00

4000-282-1 20.50 3.32 120.00

400-229-14 20.50 3.31 101.00

400-147-7 18.00 3.30 126.00

400-150-20 23.50 3.27 106.00

400-28-19 22.00 3.27 100.00

400-263-13 21.40 3.27 90.00

400-167-2 18.80 3.27 115.00

400-130-11 17.50 3.27 112.00

400-159-5 21.10 3.26 121.00

400-43-8 24.00 3.23 95.00

400-150-13 22.50 3.23 102.00

400-197-4 22.50 3.22 118.00

400-237-17 22.10 3.20 107.00

400-255-10 22.50 3.18 105.00

400-92-13 21.50 3.16 88.00

400-158-17 18.40 3.15 113.00

400-221-20 19.00 3.14 116.00

400-144-14 18.60 3.14 123.00

400-110-2 16.50 3.13 116.00

400-255-7 21.50 3.12 122.00

400-183-13 21.60 3.11 97.00

400-137-10 19.50 3.10 76.00

400-237-16 19.90 3.09 104.00

400-94-16 19.50 3.09 99.00

400-153-4 18.40 3.09 69.00

400-7-4 21.00 3.08 102.00

400-229-14 16.00 3.08 107.00

400-195-8 23.00 3.08 110.00

400-127-17 17.80 3.08 129.00

400-221-9 19.50 3.07 104.00

400-7-14 22.00 3.04 109.00

400-192-20 21.60 3.04 103.00

400-153-20 21.20 3.04 100.00

400-202-6 20.00 3.03 103.00

400-255-5 20.10 3.02 117.00


(2)

400-7-13 19.50 3.02 116.00

400-70-13 19.50 3.02 100.00

400-176-16 18.80 3.01 131.00

400-153-1 17.50 3.00 100.00

400-7-15 20.00 2.99 112.00

400-1-3 19.90 2.99 117.00

400-202-11 23.50 2.97 97.00

400-120-11 22.10 2.97 116.00

400-184-20 17.40 2.96 119.00

400-101-12 24.60 2.94 126.00

400-137-4 16.40 2.94 107.00

400-91-10 21.50 2.92 101.00

400-93-9 21.10 2.92 92.00

400-129-11 19.70 2.91 122.00

400-100-6 22.50 2.90 92.00

400-91-7 21.00 2.90 111.00

400-355-2 20.50 2.90 116.50

400-128-6 17.40 2.90 123.00

400-184-19 20.50 2.89 124.00

400-255-12 19.60 2.89 120.00

400-159-8 14.50 2.89 100.00

400-129-17 23.00 2.88 117.00

400-80-1 19.70 2.88 104.00

400-176-19 17.40 2.88 141.00

400-158-16 22.80 2.87 108.00

400-7-5 20.40 2.87 103.00

400-100-16 17.50 2.87 107.00

400-81-14 23.60 2.86 119.00

400-127-17 17.10 2.85 111.00

400-183-16 21.50 2.84 102.00

400-43-3 20.50 2.84 101.50

400-150-14 19.50 2.84 105.00

400-159-7 18.50 2.83 108.00

400-221-14 19.00 2.82 109.00

400-127-13 21.50 2.81 103.00

400-127-10 17.10 2.81 99.00

400-17-14 19.50 2.81 94.00

400-255-13 19.00 2.81 125.00

400-127-14 22.00 2.79 114.00

400-43-13 19.90 2.79 94.30

400-263-8 21.00 2.78 83.00

400-296-11 21.60 2.77 80.00

400-232-14 21.00 2.77 107.00


(3)

400-131-11 18.00 2.77 97.00

400-128-5 15.00 2.77 122.00

400-355-1 22.20 2.76 97.00

400-135-1 21.50 2.76 103.00

400-157-4 19.60 2.75 89.00

400-281-6 19.50 2.75 107.00

400-94-9 18.00 2.75 95.00

400-155-8 23.00 2.74 113.00

400-227-10 20.50 2.74 114.00

400-183-3 21.40 2.73 113.00

400-355-3 20.00 2.73 91.20

400-130-1 20.00 2.72 102.00

400-144-10 21.70 2.71 95.00

400-167-20 20.00 2.71 119.00

400-1-14 19.00 2.70 115.00

400-251-14 16.90 2.70 73.50

400-94-8 21.50 2.69 78.00

400-94-15 19.00 2.69 95.00

400-157-13 16.00 2.69 99.00

400-91-16 21.50 2.68 98.00

400-144-9 19.50 2.68 78.00

400-110-5 18.50 2.68 116.00

400-91-15 23.90 2.67 113.00

400-127-5 19.50 2.66 123.00

400-296-14 18.20 2.66 107.50

400-129-1 17.40 2.66 113.00

400-281-7 21.50 2.65 104.00

400-296-20 21.10 2.65 91.00

400-161-9 20.10 2.65 90.00

400-229-8 19.00 2.65 114.00

400-203-17 16.50 2.65 98.00

400-153-18 16.00 2.65 106.00

400-221-19 15.50 2.65 119.00

400-159-13 22.00 2.64 122.00

400-150-5 21.50 2.64 136.00

400-131-4 22.00 2.63 102.00

400-255-2 16.50 2.63 106.00

400-159-1 23.00 2.62 100.00

400-127-8 12.30 2.62 110.00

400-66-8 23.00 2.62 113.00

400-43-20 21.10 2.62 97.00


(4)

Lampiran 6. Keragaan Karakter Agronomi 104 Galur Mutan Hasil Seleksi Populasi Hasil Irradiasi 600 Gy Generasi M3

No Galur Panjang Malai (cm)

Bobot Biji (g)

Tinggi Tanaman (cm)

600-92-5 25.00 1.75 89.50

600-242-14 24.00 2.44 98.50

600-157-2 23.50 3.02 79.50

600-95-20 23.50 3.22 88.50

600-73-19 23.50 1.47 67.00

600-192-4 23.00 3.12 100.50

600-73-20 23.00 1.10 86.50

600-57-2 23.00 1.79 89.00

600-146-16 23.00 0.91 108.00

600-241-4 22.70 1.28 98.50

600-149-17 22.50 2.07 102.00

600-176-6 22.50 2.09 103.00

600-295-4 22.50 3.26 103.00

600-73-11 22.50 1.15 90.50

600-131-14 22.50 3.63 101.00

600-115-11 22.50 1.21 104.00

600-71-6 22.50 1.18 71.00

600-256-1 22.10 1.44 72.00

600-176-2 22.00 1.96 110.00

600-100-10 22.00 1.44 98.50

600-71-7 22.00 1.45 103.00

600-171-7 21.90 1.99 78.00

600-123-6 21.70 1.17 84.00

600-71-9 21.60 1.63 98.00

600-174-3 21.50 2.06 102.00

600-37-9 21.50 1.63 110.00

600-123-16 21.50 1.21 68.00

600-235-20 21.50 1.97 91.00

600-12-2 21.50 1.80 109.00

600-57-17 21.40 1.44 104.00

600-63-13 21.40 1.09 77.50

600-275-6 21.30 1.28 90.00

600-50-20 21.10 2.82 97.20

600-176-10 21.10 1.30 98.00

600-146-6 21.10 0.99 100.50

600-146-5 21.10 0.95 118.00

600-50-4 21.00 1.68 97.00

600-103-8 21.00 1.68 87.00

600-236 21.00 0.97 99.00


(5)

600-192-6 21.00 2.68 97.00

600-241-20 21.00 1.24 101.50

600-372-15 21.00 1.25 78.50

600-237-16 21.00 1.76 71.00

600-24-16 21.00 1.03 113.00

600-146-12 21.00 1.12 117.00

600-256-10 20.90 1.24 98.50

600-641-2 20.70 1.68 104.50

600-641-1 20.60 1.50 91.00

600-37-10 20.50 1.70 103.00

600-50-6 20.50 1.44 70.00

600-40-1 20.50 0.99 102.00

600-50-15 20.50 1.62 87.50

600-103-13 20.50 1.36 111.00

600-173-6 20.50 1.36 110.00

600-54-6 20.50 1.99 98.50

600-171-9 20.50 1.07 98.50

600-100-11 20.50 1.36 8.91

600-92-6 20.50 1.14 72.50

600-131-15 20.50 3.03 100.20

600-267-15 20.50 1.28 90.50

600-242-6 20.50 1.12 101.00

600-256-17 20.40 0.96 110.50

600-173-2 20.30 2.38 96.00

600-219-10 20.20 1.36 85.00

600-95-11 20.20 1.50 74.50

600-115-14 20.20 0.88 78.00

600-130-1 20.10 1.44 110.50

600-95-10 20.10 2.33 89.00

600-138-9 20.10 0.83 99.00

600-37-12 20.00 1.64 105.60

600-216-20 20.00 1.24 98.50

600-103-7 20.00 1.69 89.00

600-260-9 20.00 1.59 78.50

600-262-3 20.00 1.55 108.00

600-372-11 20.00 1.25 101.00

600-256-11 20.00 0.91 115.50

600-173-13 20.00 1.05 107.00

600-171-20 19.70 1.31 101.70

600-130-10 19.50 1.67 78.50

600-236-5 19.50 1.21 99.00

600-219-17 19.50 0.84 98.50

600-54-5 19.50 1.25 102.00


(6)

600-192-7 19.50 1.75 86.70

600-95-19 19.50 1.62 89.50

600-57-16 19.50 1.27 90.00

600-235-5 19.50 1.59 102.00

600-25-1 19.50 1.62 89.00

600-38-16 19.50 1.43 79.00

600-256-9 19.50 1.20 102.00

600-242-10 19.50 1.23 78.50

600-71-11 19.50 0.98 111.00

600-237-11 19.50 1.92 71.00

600-157-14 19.40 1.75 78.00

600-114-14 19.40 2.09 111.00

600-176-2 19.40 1.65 110.00

600-146-9 19.40 0.94 101.00

600-15-20 19.30 1.70 80.90

600-242-12 19.30 1.02 78.00

600-114-1 19.10 1.56 88.00

600-192-3 19.10 1.96 90.00

600-176-17 19.10 0.95 72.00