Lingkup Pengembangan Sistem DATA DAN METODOLOGI PENELITIAN

persentase kesalahan lebih dari 48, sedangkan untuk tahun 1997 dengan data observasi total hujan musim hujan sebesar 702,67 mm, nilai prediksi yang dihasilkan model lebih dari 1056 mm dengan persentase kesalahan lebih dari 50. Nilai-nilai prediksi pada tahun-tahun ini selalu lebih besar dari nilai observasi. Pada tahun-tahun dengan data observasi total hujan pada musim hujan yang tinggi, kinerja prediksi yang dihasilkan model lebih baik dari pada hasil prediksi pada tahun-tahun dengan total hujan pada musim hujan yang rendah. Tahun 2001 yang merupakan tahun dengan total pada hujan musim hujan tertinggi sebesar 1482,27 mm, persentase kesalahan prediksi yang dihasilkan model, khususnya JST-30, JST dengan 30 hidden neuron, kurang dari 20. Untuk tahun 2000 dengan data observasi 1297,38 mm dan tahun 1995 dengan data observasi 1257,33 mm, persentase kesalahan prediksi dari setiap model selalu kurang dari 20 . Nilai prediksi untuk tahun-tahun ini selalu lebih kecil dari nilai observasi.

4.2 Pemodelan menggunakan Support Vector Regression

Pada percobaan menggunakan model SVR, diimplementasikan tiga fungsi kernel, yaitu Linier, Polynomial dan Radial Basis Function RBF. Fungsi-fungsi kernel tersebut dalam LIBSVM Chang dan Lin, 2012 diformulasikan sebagai berikut : Linier \ •‚ƒ, „ƒ = •‚ƒ . „ƒ Polynomial \ •‚ƒ, „ƒ = …•‚ƒ . „ƒ + atc 0 † Linier \ •‚ƒ, „ƒ = c ‡|ˆ‚‚ƒ ‚ƒ|= Untuk mengimplementasikan SVR, maka perlu memilih parameter- parameter yang dibutuhkan oleh SVR dan oleh fungsi kernel yang digunakan. Parameter yang digunakan pada percobaan ini : - Pada model SVR-L, dengan fungsi kernel linier, diatur parameter konstanta C dan ε. - Pada model SVR-P, dengan fungsi kernel polynomial, diatur parameter γ dan d degree. - Pada model SVR-R, dengan fungsi kernel RBF, diatur parameter γ dan ε. Proses validasi model pada percobaan ini dilakukan dengan melatih sebuah model dengan satu set data latih dan digunakan untuk memprediksi data satu periode berikutnya. Untuk data set dari rata-rata lima wilayah, yang berisi sebanyak 43 periode data, penggunaan skenario A, dengan data latih 15 periode, maka dapat dilakukan proses pelatihan dan pengujian sebanyak 28 kali. Proses pertama menggunakan data latih periode 1 sd 15 dan data uji pada periode 16, sedangkan proses terakhir ke-28 menggunakan data latih periode 28 sd 42, dan data uji periode 43. Pada setiap proses pelatihan dan pengujian, dilakukan pemilihan parameter terbaik dengan proses grid search, yang menyerupai metode trial dan error secara manual. Pada metode ini setiap parameter ditetapkan beberapa nilai yang akan digunakan, dan kemudian dikumpulkan dalam grid n-dimensi, dengan n menunjukkan jumlah parameter. Setiap pasang parameter digunakan untuk proses pelatihan dan pengujian, dan nilai kinerja prediksinya disimpan pada grid yang sesuai. Sebagai contoh, pada model SVR-L, ditetapkan nilai untuk parameter C : 2 - 7 , 2 -6 , …, 2 4 , 2 5 13 nilai dan nilai untuk parameter ε : 0,01; 0,02; …; 0,19; 0,2 20 nilai, sehingga dipunyai 160 pasang parameter C dan ε. Hasil pengukuran kinerja MAPE untuk pasangan data latih-data uji pertama data latih periode ke- 1 sd ke-15, dan data uji ke-16, kinerja terbaik diperoleh dari nilai ε = 0,03 dan C = 16. Hasil pengukuran kinerja untuk setiap pasang parameter grid selengkapnya dapat di lihat pada Lampiran 12. Proses yang sama dilakukan untuk pasangan data latih-data uji yang lain, dan dihitung rata-rata kinerja untuk setiap grid pasang parameter, dan parameter dengan rata-rata kinerja terbaik dipilih untuk digunakan sebagai parameter model SVR. Sebagai contoh, rata-rata kinerja dari 28 pasang data latih-data uji untuk model SVR-L-A dapat dilihat pada Lampiran 12. Kinerja terbaik diperoleh dari pasangan parameter C = 4 dan ε = 0,12. Pada penelitian ini, nilai-nilai parameter yang diujicobakan untuk setiap model serta parameter terbaik yang terpilih digunakan untuk pengujian akhir adalah seperti pada Tabel 5. Tabel 5 Parameter Percobaan Model SVR Model Nilai-nilai Parameter proses grid serach Parameter terbaik Skenario Parameter SVR-L Linier C = 2 -7 ; 2 -6 ,…,;2 5 ε = 0,01; 0,02; … ; 0,2 SVR-L-A SVR-L-B SVR-L-C C = 4; ε = 0,12 C = 16; ε = 0,15 C = 32; ε = 0,13 SVR-P Polynomial C = 20; ε = 0,05 γ = 2 -7 ; 2 -6 ;…; 2 5 d = 3; 4; 5; 6; 7 SVR-P-A SVR-P-B SVR-P-C γ = 0,0625; d = 3 γ = 0,0625; d = 3 γ = 0,0625; d = 3 SVR-R RBF C = 20 ε = 0,01; 0,02; …; 0,2 γ = 2 -7 ; 2 -6 ; …; 2 5 SVR-R-A SVR-R-B SVR-R-C γ = 0,125; ε = 0,1 γ = 0, 25; ε = 0,12 γ = 0,0625; ε = 0,08 Hasil percobaan setiap model dengan menggunakan parameter terbaik seperti pada Tabel 5, selengkapnya dapat dilihat pada Lampiran 13, 14 dan 15. Pengukuran kinerja terhadap seluruh hasil prediksi yang dihasilkan masing- masing model selengkapnya seperti pada Tabel 6. Tabel 6 Kinerja Model SVR pada dataset rata-rata dari lima wilayah untuk data uji sebanyak 28, 23 dan 18 buah Model SVR RMSE MAPE R A. Data Latih sebanyak 15 buah 28 data uji SVR-L 197,17 16,63 0,61 SVR-P 209,39 17,37 0,61 SVR-R 194,03 16,59 0,64 B. Data Latih sebanyak 20 buah 23 data uji SVR-L 178,81 13,33 0,72 SVR-P 195,67 17,29 0,64 SVR-R 176,50 15,14 0,75 C. Data Latih sebanyak 25 buah 18 data uji SVR-L 138,44 11,16 0,82 SVR-P 155,88 13,29 0,76 SVR-R 134,38 11,05 0,82 Secara keseluruhan model SVR-R-C, yaitu model SVR dengan kernel RBF yang dilatih menggunakan skenario data latih 25 periode mempunyai kinerja yang paling baik dengan RMSE 134,28 , MAPE 11,05 dan R 0,82. Model SVR-R juga konsisten menjadi model yang terbaik pada setiap skenario data latih,