Support Vector Regression SVR

3.2 Data Penelitian

Data yang digunakan dalam penelitian ini adalah data sekunder curah hujan dari Badan Meteorologi Klimatologi dan Geofisika BMKG dan Data SOI dari website Badan Meteorologi Pemerintah Australia sebagai berikut :. a. Data curah hujan terdiri dari data total hujan pada musim hujan, awal musim hujan dan panjang musim hujan dari lima wilayah hujan di Kabupaten Indramayu. Data-data tersebut merupakan hasil pengolahan perhitungan dari data curah hujan dasarian. Data total hujan pada musim hujan akan digunakan sebagai target prediksi, sedangkan data panjang musim hujan dan awal musim hujan digunakan sebagai bagian dari peubah prediktor. b. Data SOI digunakan sebagai peubah prediktor untuk menangkap pengaruh iklim global terhadap fenomena curah hujan di Kabupaten Indramayu. Data SOI bulanan dapat diperoleh dari website Badan Meteorologi Pemerintah Australia pada alamat http:www.bom.gov.au.

3.3 Praproses Pengolahan Data

Model dibuat untuk diterapkan pada dataset yang merupakan rata-rata dari 5 lima wilayah. Analisa data awal dilakukan untuk menentukan peubah-peubah yang akan digunakan sebagai prediktor dengan melihat koefisien korelasi antara nilai Total Hujan di Musim Hujan THMH dengan nilai-nilai Awal Musim Hujan AMH, Panjang Musim Hujan PMH, nilai SOI bulan Agustus sd Desember pada tahun yang sama serta nilai SOI pada bulan Januari hingga Juli pada tahun berikutnya.

3.4 Pembuatan Model untuk Percobaan

Model yang digunakan untuk percobaan adalah Jaringan Saraf Tiruan JST dan Support Vector Regression SVR. JST yang dibuat adalah JST backpropagation dengan algoritma pembelajaran gradient descent dan dengan membandingkan banyaknya hidden neuron. Sedangkan untuk model SVR yang digunakan adalah epsilon-SVR dengan membandingkan tiga jenis fungsi kernel. Model-model tersebut selanjutnya dinotasikan seperti pada Tabel 1 Tabel 1 Model JST dan SVR untuk Percobaan Model Keterangan JST-10 Model JST dengan 10 hidden neuron JST-30 Model JST dengan 30 hidden neuron JST-50 Model JST dengan 50 hidden neuron SVR-L Model SVR dengan fungsi kernel Linier SVR-P Model SVR dengan fungsi kernel Polynomial SVR-R Model SVR dengan fungsi kernel RBF

3.5 Pengolahaan Data

Pada tahap pengolahan data, dilakukan pelatihan dan pengujian model. Proses validasi model dilakukan dengan cara melatih model dengan data latih sepanjang periode tertentu pada tahun-tahun yang berurutan, kemudian diuji untuk memprediksi data pada satu tahun berikutnya. Gambar 8 mengilustrasikan proses pengambilan data latih dan data uji percobaan, dengan data latih sepanjang 15 periode. Misalkan dipunyai dataset sepanjang 20 periode, maka hanya dapat dilakukan pengambilan 5 pasang data latih dan data uji. Pada penelitian ini, untuk mengetahui pengaruh penggunaan data latih, maka panjang periode data latih dibuat dalam tiga skenario, yaitu : - Skenario A, menggunakan data latih sepanjang 15 periode - Skenario B, menggunakan data latih sepanjang 20 periode - Skenario C, menggunakan data latih sepanjang 25 periode Gambar 8 Ilustrasi Pengambilan Data Latih dan Data Uji Penggunaan skenario data latih ini dikombinasikan dengan model-model dari JST dan SVR, akan menghasilkan 9 buah model percobaan dengan JST dan 9 buah model percobaan dengan SVR. Untuk mendapatkan hasil terbaik, pada setiap model JST dilakukan percobaan sebanyak 5 kali dan diambil satu hasil terbaiknya, sedangkan untuk model SVR dilakukan optimisasi parameter dengan metode grid search. Metode ini menyerupai metode trial dan error secara manual. Pada metode ini setiap parameter ditetapkan beberapa nilai yang akan digunakan, dan kemudian dipasangkan dalam grid n-dimensi, dengan n menunjukkan jumlah parameter. Setiap pasangan parameter digunakan dalam percobaan, dan dipilih pasangan parameter yang memberikan kinerja terbaik.

3.6 Evaluasi Hasil Percobaan

Untuk melihat kinerja model, hasil prediksi dievaluasi dengan menggunakan 3 tiga kriteria, yaitu i root mean squared error RMSE , ii mean absolute percentace error MAPE, dan iii koefisien korelasi R. RMSE dirumuskan sebagai berikut : ij k = l ∑ − m = F 18 Dengan adalah data observasi ke-i dan m hasil prediksi untuk data observasi ke-i dan n adalah banyaknya data observasi. MAPE dirumuskan sebagai berikut : jnok = ∑ p q r qm r q r p F × 100 19 Kedua kriteria di atas, yaitu pengukuran kinerja prediksi berbasis residual selisih antara data observasi dan prediksi digunakan karena nilai observasi aktual untuk setiap prediksi telah diketahui. Semakin kecil nilai-nilai kriteria diatas, maka kinerja model semakin baik. Koefisien korelasi produk momen atau juga dikenal dengan korelasi Pearson, didefinsikan dengan i = atu , m = cov q,qm yvar q var qm 20 Dengan cov , m adalah kovarian antara observasi dan prediksi dan var = cov , , var m = cov m, m adalah variansi dari observasi dan prediksi.

3.7 Lingkup Pengembangan Sistem

Spesifikasi perangkat keras dan perangkat lunak yang akan digunakan dalam penelitian ini sebagai berikut : • Perangkat keras : prosesor Intel® Core™ i5-450M 2.40GHz, Memori 2 GB dan hardisk 640 GB. • Perangkat lunak : Windows 7 Professional, Matlab 7.7.0, SVM library LIBSVM. 25

BAB IV HASIL DAN PEMBAHASAN

Untuk memilih peubah-peubah yang akan digunakan untuk memprediksi total hujan pada musim hujan, maka dilakukan analisis korelasi antara total hujan musim hujan dengan peubah lainnya. Nilai korelasi antara total hujan dengan peubah-peubah tersebut seperti pada Tabel 2. Tabel 2 Korelasi antara Total Hujan pada Musim Hujan dengan Panjang Musim hujan, Awal Musim Hujan dan SOI Bulanan Nama Peubah Koefisien Korelasi Panjang Musim Hujan 0,73 Awal Musim Hujan -0,46 SOI Agustus 0,52 SOI September 0,45 SOI Oktober 0,46 SOI Nopember 0,45 SOI Desember 0,30 SOI Januari 0,35 SOI Februari 0,54 SOI Maret 0,35 SOI April 0,15 SOI Mei -0,15 SOI Juni 0,03 SOI Juli -0,29 Peubah-peubah yang paling berkorelasi dengan Total Hujan pada Musim Hujan THMH adalah Panjang Musim Hujan PMH, Awal Musim Hujan AMH, SOI-Februari, SOI Agustus dan SOI-Oktober. Kelima peubah tersebut digunakan sebagai peubah prediktor untuk menduga total hujan pada musim hujan. Nilai-nilai SOI bulan September dan bulan Nopember mempunyai koefisien korelasi 0,45, masih lebih kecil dibanding kelima peubah yang telah dipilih, serta mempunyai korelasi yang kuat dengan SOI bulan Oktober dan Agustus, sehingga tidak diikutkan sebagai peubah prediktor. Untuk nilai SOI di bulan-bulan lainnya juga kurang berkorelasi dengan nilai total hujan musim hujan, yaitu koefisien korelasinya kurang dari 0,4. Nilai-nilai koefisien korelasi antar peubah selengkapnya dapat dilihat pada Lampiran 2. Setelah dipilih peubah-peubah yang akan digunakan sebagai prediktor penduga total hujan pada musim hujan, maka disusun dataset yang digunakan untuk proses pelatihan dan pengujian yaitu pasangan nilai aktual peubah prediktor PMH, AMH, SOI-8, SOI-10 dan SOI-2 dan target prediksi THMH. Dataset yang digunakan dalam penelitian ini selengkapnya dapat dilihat pada Lampiran 3. Nilai-nilai panjang musim hujan, awal musim hujan dan total hujan pada musim hujan merupakan nilai rata-rata dari 5 lima wilayah hujan di Kabupaten Indramayu. Nilai-nilai peubah tersebut untuk masing-masing wilayah dapat dilihat pada Lampiran 4 sd Lampiran 8.

4.1 Pemodelan menggunakan Jaringan Saraf Tiruan JST

JST yang diimplementasikan dalam penelitian ini adalah JST backpropagation dengan banyaknya hidden neuron 10, 30 dan 50. Untuk proses pembelajarannya menggunakan algoritma gradientdescent, dengan parameter learning rate 0,05 dan mimimum gradient 1 x 10 -10 . Fungsi aktivasi yang digunakan pada seluruh neuron pada hidden layer adalah sigmoid bipolar seperti pada persamaan 6, sedangkan untuk fungsi aktivasi pada neuron di output layer menggunakan fungsi sigmoid seperti pada persamaan 5. Sebelum diproses dalam JST, terlebih dahulu dilakukan normalisasi terhadap setiap peubah dalam data set pelatihan, dengan menggunakan formula : { | = } } ~r• } ~€d } ~r• 21 Data yang diolah dalam percobaan ini adalah data rata-rata lima wilayah seperti pada Lampiran 3, yaitu data panjang musim hujan dalam angka yang menunjukkan jumlah dasarian PMH, dengan range nilai 8,33 sd 18,00, data awal musim hujan dalam angka yang menunjukkan angka dasarian AMH, dengan range nilai antara 29,25 sd 36,50, SOI bulan Agustus, Oktober dan Februari dalam angka dengan range nilai antara -35,70 sd 21, dan data total hujan pada musim hujan, dalam satuan millimeter per musim hujan dengan range nilai antara 463,23 sd 1.750,11. Setelah proses normalisasi, maka nilai data dari setiap peubah berada pada rentang nilai 0 sd 1.