3.2 Tahapan Penelitian
Tahapan penelitian ini terangkum secara lengkap pada gambar Gambar 10.
Gambar 10 Tahapan proses penelitian
Tahap awal yang dilakukan pada penelitian ini adalah dimulai dari pemahaman terhadap permasalahan yang akan diselesaikan. Mengacu pada
tujuan, penelitian ini mencoba untuk mengembangkan model SVR yang dapat memprediksi curah hujan bulanan di wilayah Kabupaten Indramayu.
Untuk mendapatkan gambaran menyeluruh tentang domain penelitian yang akan
dilaksanakan, diperlukan studi literatur sehingga dapat mengukur dan melihat
seberapa berbeda dan pentingnya penelitian yang akan dilakukan. Setelah memahami masalah, maka tahap yang dilakukan selanjutnya
adalah pengumpulan data. Secara keseluruhan data observasi terdiri dari 22 periode tahun 1979 – 2000. Dengan demikian data GCM yang digunakan hanya
dari tahun 1979 – 2000. Berdasarkan titik observasi hujan dilihat koordinatnya, kemudian
berdasarkan titik koordinat tersebut akan digunakan untuk menentukan grid dari data luaran GCM dengan luasan grid berupa matriks 5x5. Titik koordinat
observasi berada ditengah-tengah luasan grid GCM yang akan diambil. Sebagai contoh, stasiun hujan memiliki titik koordinat 112 bujur timur dan 6 derajat
lintang selatan. Luasan grid yang di-cropp pada gcm merupakan grid matriks 5x5 dengan pusatnya merupakan lokasi stasiun hujan. Ilustrasi proses pengambilan
data GCM dengan grid 5x5 dapat dilihat pada Gambar 11.
Gambar 11 Ilustrasi proses cropping luasan grid data GCM.
Dikarenakan data observasi memiliki periode 22 tahun, maka proses cropping yang dilakukan mengikuti observasi sebanyak 12x22 tahun. Luasan grid
yang diperoleh dari prosis cropping keseluruhan luaran GCM adalah sebanyak 264 dari bulan Januari 1979 sampai dengan Desember 2000, sehingga jumlah
keseluruhan untuk data masukan menjadi 264 22x12 data dengan atribut sebanyak 25 5x5 buah. Kemudian diperoleh matriks baru berdasarkan titik
observasi dan luasan grid GCM seperti yang diperlihatkan oleh Tabel 3, dengan
nilai adalah jumlah cropping luasan GCM dan
menunjukkan grids matriks.
Tabel 3 Matriks data GCM mengikuti data observasi
Stasiun Observasi
Data GCM …
×
…
×
…
×
… … …
… …
… …
… …
… ..
×
Kemudian, untuk mengurangi masalah ukuran pada data luaran GCM yang berdimensi besar, maka dilakukan reduksi dimensi spasial dari matriks data
GCM dengan menggunakan PCA. Ilustrasi pereduksian dimensi dari data matriks GCM terlihat pada Tabel 4.
Tabel 4 PCA Matriks data GCM
Stasiun Observasi
PCA Data GCM …
… …
… …
… …
… …
… …
Proses analisis komponen utamaPCA adalah suatu analisis peubah ganda yang bertujuan untuk mereduksi dimensi data tanpa harus kehilangan informasi
secara berarti. Pada penelitian ini proses reduksi dilakukan dengan mengambil lebih dari satu komponen utama principal component, dengan keragaman
≥ 97. Proses reduksi menghasilkan atribut kolom data matriks baru yang berasal
dari komponen utama PCA sebesar m, dengan kearagamanprinciple component score lebih besar dari 97. Dapat dikatakan bahwa hasil reduksi dimensi
menggunakan PCA
menghasilkan variabel
baru sebanyak
m yang merepresentasikan informasi dengan tingkat kepercayaan sebesar 97 dari data
matriks sebelumnya dengan atribut kolom berupa vektor berukuran nxn, dimana m jauh lebih kecil dari pada nxn mnxn.
Dalam penelitian ini pemodelan membagi bulan didasarkan pada musim, yaitu bulan pada musim hujan dengan rataan curah hujuan yang tinggi terjadi pada
bulan Desember-Januari-Februari DJF, bulan pada musim kemarau dengan rataan curah hujan yang sedikit terjadi pada bulan Juni-Juli-AgustusJJA dan
bulan pada masa pancaroba yang merupakan peralihan musim hujan ke kemarau terjadi pada bulan Maret-April-Mei MAM serta peralihan musim kemarau ke
musim hujan terjadi pada bulan September-Oktober-NovemberSON. Sehingga PCA data matriks GCM terbagi menjadi 4 bagian menjadi GCM-DJF, GCM-
MAM, GCM-JJA, dan GCM-SON yang masing-masing berjumlah 66 baris. Langkah selanjutnya yaitu menyusun model SVR berdasarkan data GCM
dan observasi. Pada model SVR, data GCM akan berperan sebagai masukan, dan data observasi berperan sebagai targetnya. Namun, sebelum dilakukan
penyusunan model, terlebih dahulu harus dilakukan pembagian data menjadi data latih dan data uji menggunakan teknik -fold cross validation. Berdasarkan teknik
k-fold cross validation, seluruh data baik GCM maupun observasi dibagi menjadi k subset, yaitu S1, S2,…, Sk. Pada penelitian ini ditentukan nilai k sebesar 5.
Masing-masing subset memiliki ukuran yang sama. Pembagian data dilakukan secara acak dengan mempertahankan perbandingan jumlah baris data setiap kelas.
Pada proses pertama S2,…, S5 dijadikan data pelatihan dan S1 sebagai data uji, pada proses kedua S1,S3,…, S5 sebagai data pelatihan dan S2 sebagai data uji, dan
seterusnya sebanyak 5 kali pengulangan.
Setelah dilakukan pembagian data maka penyusunan model SVR dapat dilakukan. Ilustrasi arsitektur dari model SVR, diperlihatkan pada Gambar 12.
Gambar 12 Struktur SVR. Pada tahap pelatihan data yang digunakan adalah data latih sebagai
masukan untuk pelatihan menggunakan metode SVR dengan masing-masing fungsi kernel-nya adalah linear kernel, polynomial kernel, dan radial basis
function RBF kernel menghasilkan keluaran berupa model SVR. Dari fungsi kernel yang digunakan, sebelumnya diharuskan untuk menentukan nilai parameter
C untuk fungsi linear kernel, nilai parameter C, γ, r, dan d untuk fungsi
polynomial kernel, dan parameter C dan γ untuk fungsi RBF kernel. Penentuan
parameter fungsi kernel berpengaruh pada model SVR yang dihasilkan. Semakin optimal parameternya, maka semakin baik model yang dihasilkan. Dalam
penelitian ini untuk mendapatkan parameter fungsi kernel yang optimum dilakukan dengan menggunakan metode grid search didapatkan model SVR
dengan parameter yang optimal. Pada tahap pengujian, data uji digunakan sebagai masukan bagi model
SVR untuk mendapatkan keluaranouput berupa nilai estimasi atau nilai prediksi. Proses pelatihan dan pengujian dilakukan untuk setiap data GCM DJF, MAM,
JJA, SON dan berlangsung selama 5-fold cross validation sehingga menghasilkan nilai estimasi untuk keseluruhan data dengan rentang tahun periode
1979-200. Selanjutnya dilakukan proses evaluasi dan divalidasi dengan cara membandingkan nilai estimasi yang diperoleh dengan nilai dari pengamatan
sesungguhnya untuk menguji kehandalan model dalam melakukan pendugaan curah hujan bulanan di wilayah Kabupaten Indramayu. Tahap terakhir dari
penelitian yaitu melakukan dokumentasi dan pelaporan akhir hasil evaluasi yang menandakan penelitian yang dilakukan telah selesai.
3.3 Lingkup Pengembangan Model