Tahapan Penelitian DATA DAN METODOLOGI

3.2 Tahapan Penelitian

Tahapan penelitian ini terangkum secara lengkap pada gambar Gambar 10. Gambar 10 Tahapan proses penelitian Tahap awal yang dilakukan pada penelitian ini adalah dimulai dari pemahaman terhadap permasalahan yang akan diselesaikan. Mengacu pada tujuan, penelitian ini mencoba untuk mengembangkan model SVR yang dapat memprediksi curah hujan bulanan di wilayah Kabupaten Indramayu. Untuk mendapatkan gambaran menyeluruh tentang domain penelitian yang akan dilaksanakan, diperlukan studi literatur sehingga dapat mengukur dan melihat seberapa berbeda dan pentingnya penelitian yang akan dilakukan. Setelah memahami masalah, maka tahap yang dilakukan selanjutnya adalah pengumpulan data. Secara keseluruhan data observasi terdiri dari 22 periode tahun 1979 – 2000. Dengan demikian data GCM yang digunakan hanya dari tahun 1979 – 2000. Berdasarkan titik observasi hujan dilihat koordinatnya, kemudian berdasarkan titik koordinat tersebut akan digunakan untuk menentukan grid dari data luaran GCM dengan luasan grid berupa matriks 5x5. Titik koordinat observasi berada ditengah-tengah luasan grid GCM yang akan diambil. Sebagai contoh, stasiun hujan memiliki titik koordinat 112 bujur timur dan 6 derajat lintang selatan. Luasan grid yang di-cropp pada gcm merupakan grid matriks 5x5 dengan pusatnya merupakan lokasi stasiun hujan. Ilustrasi proses pengambilan data GCM dengan grid 5x5 dapat dilihat pada Gambar 11. Gambar 11 Ilustrasi proses cropping luasan grid data GCM. Dikarenakan data observasi memiliki periode 22 tahun, maka proses cropping yang dilakukan mengikuti observasi sebanyak 12x22 tahun. Luasan grid yang diperoleh dari prosis cropping keseluruhan luaran GCM adalah sebanyak 264 dari bulan Januari 1979 sampai dengan Desember 2000, sehingga jumlah keseluruhan untuk data masukan menjadi 264 22x12 data dengan atribut sebanyak 25 5x5 buah. Kemudian diperoleh matriks baru berdasarkan titik observasi dan luasan grid GCM seperti yang diperlihatkan oleh Tabel 3, dengan nilai adalah jumlah cropping luasan GCM dan menunjukkan grids matriks. Tabel 3 Matriks data GCM mengikuti data observasi Stasiun Observasi Data GCM … × … × … × … … … … … … … … … … .. × Kemudian, untuk mengurangi masalah ukuran pada data luaran GCM yang berdimensi besar, maka dilakukan reduksi dimensi spasial dari matriks data GCM dengan menggunakan PCA. Ilustrasi pereduksian dimensi dari data matriks GCM terlihat pada Tabel 4. Tabel 4 PCA Matriks data GCM Stasiun Observasi PCA Data GCM … … … … … … … … … … … Proses analisis komponen utamaPCA adalah suatu analisis peubah ganda yang bertujuan untuk mereduksi dimensi data tanpa harus kehilangan informasi secara berarti. Pada penelitian ini proses reduksi dilakukan dengan mengambil lebih dari satu komponen utama principal component, dengan keragaman ≥ 97. Proses reduksi menghasilkan atribut kolom data matriks baru yang berasal dari komponen utama PCA sebesar m, dengan kearagamanprinciple component score lebih besar dari 97. Dapat dikatakan bahwa hasil reduksi dimensi menggunakan PCA menghasilkan variabel baru sebanyak m yang merepresentasikan informasi dengan tingkat kepercayaan sebesar 97 dari data matriks sebelumnya dengan atribut kolom berupa vektor berukuran nxn, dimana m jauh lebih kecil dari pada nxn mnxn. Dalam penelitian ini pemodelan membagi bulan didasarkan pada musim, yaitu bulan pada musim hujan dengan rataan curah hujuan yang tinggi terjadi pada bulan Desember-Januari-Februari DJF, bulan pada musim kemarau dengan rataan curah hujan yang sedikit terjadi pada bulan Juni-Juli-AgustusJJA dan bulan pada masa pancaroba yang merupakan peralihan musim hujan ke kemarau terjadi pada bulan Maret-April-Mei MAM serta peralihan musim kemarau ke musim hujan terjadi pada bulan September-Oktober-NovemberSON. Sehingga PCA data matriks GCM terbagi menjadi 4 bagian menjadi GCM-DJF, GCM- MAM, GCM-JJA, dan GCM-SON yang masing-masing berjumlah 66 baris. Langkah selanjutnya yaitu menyusun model SVR berdasarkan data GCM dan observasi. Pada model SVR, data GCM akan berperan sebagai masukan, dan data observasi berperan sebagai targetnya. Namun, sebelum dilakukan penyusunan model, terlebih dahulu harus dilakukan pembagian data menjadi data latih dan data uji menggunakan teknik -fold cross validation. Berdasarkan teknik k-fold cross validation, seluruh data baik GCM maupun observasi dibagi menjadi k subset, yaitu S1, S2,…, Sk. Pada penelitian ini ditentukan nilai k sebesar 5. Masing-masing subset memiliki ukuran yang sama. Pembagian data dilakukan secara acak dengan mempertahankan perbandingan jumlah baris data setiap kelas. Pada proses pertama S2,…, S5 dijadikan data pelatihan dan S1 sebagai data uji, pada proses kedua S1,S3,…, S5 sebagai data pelatihan dan S2 sebagai data uji, dan seterusnya sebanyak 5 kali pengulangan. Setelah dilakukan pembagian data maka penyusunan model SVR dapat dilakukan. Ilustrasi arsitektur dari model SVR, diperlihatkan pada Gambar 12. Gambar 12 Struktur SVR. Pada tahap pelatihan data yang digunakan adalah data latih sebagai masukan untuk pelatihan menggunakan metode SVR dengan masing-masing fungsi kernel-nya adalah linear kernel, polynomial kernel, dan radial basis function RBF kernel menghasilkan keluaran berupa model SVR. Dari fungsi kernel yang digunakan, sebelumnya diharuskan untuk menentukan nilai parameter C untuk fungsi linear kernel, nilai parameter C, γ, r, dan d untuk fungsi polynomial kernel, dan parameter C dan γ untuk fungsi RBF kernel. Penentuan parameter fungsi kernel berpengaruh pada model SVR yang dihasilkan. Semakin optimal parameternya, maka semakin baik model yang dihasilkan. Dalam penelitian ini untuk mendapatkan parameter fungsi kernel yang optimum dilakukan dengan menggunakan metode grid search didapatkan model SVR dengan parameter yang optimal. Pada tahap pengujian, data uji digunakan sebagai masukan bagi model SVR untuk mendapatkan keluaranouput berupa nilai estimasi atau nilai prediksi. Proses pelatihan dan pengujian dilakukan untuk setiap data GCM DJF, MAM, JJA, SON dan berlangsung selama 5-fold cross validation sehingga menghasilkan nilai estimasi untuk keseluruhan data dengan rentang tahun periode 1979-200. Selanjutnya dilakukan proses evaluasi dan divalidasi dengan cara membandingkan nilai estimasi yang diperoleh dengan nilai dari pengamatan sesungguhnya untuk menguji kehandalan model dalam melakukan pendugaan curah hujan bulanan di wilayah Kabupaten Indramayu. Tahap terakhir dari penelitian yaitu melakukan dokumentasi dan pelaporan akhir hasil evaluasi yang menandakan penelitian yang dilakukan telah selesai.

3.3 Lingkup Pengembangan Model