Kesimpulan Saran Pengembangan model pemrograman paralel pada kalibrasi data untuk rekonstruksi data curah hujan

LAMPIRAN Lampiran 1 Perbandingan waktu rata-rata komputasi untuk proses reduksi matriks dengan PCA detik Ukuran Input Ukuran Output serial Matrikis grid Matriks reduksi 2 thread 3 thread 4 thread 3x3 1 0.2465 0.4508 0.6077 0.8004 3x3 3 0.4633 0.4575 0.6572 0.8058 3x3 5 0.5086 0.4669 0.6569 0.8570 5x5 1 0.7956 0.5432 0.7422 0.8737 5x5 3 0.8112 0.5767 0.7548 0.9327 5x5 5 0.8533 0.6160 0.7528 0.9070 7x7 1 1.2340 0.6850 0.8806 1.0117 7x7 3 1.2620 0.7017 0.8860 1.0428 7x7 5 1.2995 0.7145 0.8943 0.9762 paralel dengan 2 prosesor Lampiran 2 Perbandingan waktu rata-rata komputasi untuk proses regresi linear detik Ukuran Input serial Matriks reduksi 2 thread 3 thread 4 thread 1 0.1943 0.4314 0.6455 0.7893 3 0.2363 0.4482 0.6594 0.8142 5 0.2739 0.4793 0.6561 0.8368 paralel dengan 2 prosesor Lampiran 3 Perbandingan waktu rata-rata komputasi untuk proses rekonstruksi data curah hujan detik Ukuran Input serial Matriks reduksi 2 thread 3 thread 4 thread 1 0.1580 0.4254 0.6395 0.7528 3 0.1963 0.4624 0.6808 0.7783 5 0.2291 0.5236 0.7013 0.8511 paralel dengan 2 prosesor Lampiran 4 Perbandingan waktu rata-rata komputasi untuk gabungan ketiga proses detik Ukuran Input Ukuran Output serial Matrikis grid Matriks reduksi 2 thread 3 thread 4 thread 3x3 1 0.4477 0.6513 0.8735 1.1193 3x3 3 0.9953 0.7571 1.0052 1.1654 3x3 5 1.1700 0.8493 1.0967 1.2594 5x5 1 1.1872 0.7975 1.0447 1.1978 5x5 3 1.3541 0.8751 1.0768 1.3313 5x5 5 1.5304 0.9323 1.1251 1.3553 7x7 1 1.6286 0.9144 1.1438 1.3306 7x7 3 1.8018 1.0155 1.2256 1.4249 7x7 5 1.9984 1.0573 1.3015 1.4544 paralel dengan 2 prosesor Lampiran 5 Perbandingan speedup untuk proses reduksi matriks dengan PCA Ukuran Input Ukuran Output Grid Matriks Matriks Reduksi 2 thread 3 thread 4 thread 3x3 1 0.5468 0.4056 0.3080 3x3 3 1.0126 0.7050 0.5750 3x3 5 1.0893 0.7742 0.5934 5x5 1 1.4647 1.0720 0.9106 5x5 3 1.4066 1.0747 0.8697 5x5 5 1.3853 1.1335 0.9409 7x7 1 1.8014 1.4014 1.2197 7x7 3 1.7986 1.4245 1.2102 7x7 5 1.8187 1.4531 1.3312 paralel dengan 2 prosesor Lampiran 6 Perbandingan speedup untuk proses regresi linear Ukuran Input Matriks reduksi 2 thread 3 thread 4 thread 1 0.4504 0.3010 0.2461 3 0.5273 0.3584 0.2903 5 0.5714 0.4174 0.3273 paralel dengan 2 prosesor Lampiran 7 Perbandingan speedup untuk proses rekonstruksi Ukuran Input Matriks reduksi 2 thread 3 thread 4 thread 1 0.3714 0.2471 0.2099 3 0.4245 0.2883 0.2522 5 0.4375 0.3267 0.2692 paralel dengan 2 prosesor Lampiran 8 Perbandingan speedup untuk gabungan ketiga proses Ukuran Input Ukuran Output Grid Matriks Matriks Reduksi 2 thread 3 thread 4 thread 3x3 1 0.6875 0.5126 0.4000 3x3 3 1.3147 0.9902 0.8540 3x3 5 1.3777 1.0668 0.9290 5x5 1 1.4886 1.1364 0.9911 5x5 3 1.5474 1.2575 1.0171 5x5 5 1.6415 1.3602 1.1292 7x7 1 1.7811 1.4239 1.2240 7x7 3 1.7744 1.4702 1.2646 7x7 5 1.8900 1.5354 1.3740 paralel dengan 2 prosesor Lampiran 9 Perbandingan efesiensi untuk matriks reduksi PCA Ukuran Input Ukuran Output Grid Matriks Matriks Reduksi 2 thread 3 thread 4 thread 3x3 1 0.2734 0.2028 0.1540 3x3 3 0.5063 0.3525 0.2875 3x3 5 0.5446 0.3871 0.2967 5x5 1 0.7323 0.5360 0.4553 5x5 3 0.7033 0.5374 0.4349 5x5 5 0.6926 0.5668 0.4704 7x7 1 0.9007 0.7007 0.6098 7x7 3 0.8993 0.7122 0.6051 7x7 5 0.9094 0.7265 0.6656 paralel dengan 2 prosesor Lampiran 10 Perbandingan efesiensi untuk regresi linear Ukuran Input Matriks reduksi 2 thread 3 thread 4 thread 1 0.2252 0.1505 0.1231 3 0.2636 0.1792 0.1451 5 0.2857 0.2087 0.1636 paralel dengan 2 prosesor Lampiran 11 Perbandingan efesiensi untuk proses rekonstruksi Ukuran Input Matriks reduksi 2 thread 3 thread 4 thread 1 0.1857 0.1235 0.1049 3 0.2122 0.1441 0.1261 5 0.2187 0.1633 0.1346 paralel dengan 2 prosesor Lampiran 12 Perbandingan efesiensi untuk gabungan ketiga proses Ukuran Input Ukuran Output Grid Matriks Matriks Reduksi 2 thread 3 thread 4 thread 3x3 1 0.3437 0.2563 0.2000 3x3 3 0.6573 0.4951 0.4270 3x3 5 0.6888 0.5334 0.4645 5x5 1 0.7443 0.5682 0.4956 5x5 3 0.7737 0.6287 0.5086 5x5 5 0.8207 0.6801 0.5646 7x7 1 0.8905 0.7119 0.6120 7x7 3 0.8872 0.7351 0.6323 7x7 5 0.9450 0.7677 0.6870 paralel dengan 2 prosesor Lampiran 13 Perbandingan overhead untuk matriks reduksi PCA Ukuran Input Ukuran Output Grid Matriks Matriks Reduksi 2 thread 3 thread 4 thread 3x3 1 0.6550 0.9689 1.3542 3x3 3 0.4518 0.8511 1.1483 3x3 5 0.4252 0.8052 1.2055 5x5 1 0.2908 0.6887 0.9519 5x5 3 0.3422 0.6984 1.0542 5x5 5 0.3787 0.6523 0.9606 7x7 1 0.1360 0.5271 0.7895 7x7 3 0.1413 0.5099 0.8236 7x7 5 0.1295 0.4891 0.6529 paralel dengan 2 prosesor Lampiran 14 Perbandingan overhead untuk regresi linear Ukuran Input Matriks reduksi 2 thread 3 thread 4 thread 1 0.6684 1.0967 1.3843 3 0.6601 1.0824 1.3920 5 0.6847 1.0384 1.3997 paralel dengan 2 prosesor Lampiran 15 Perbandingan overhead untuk proses rekonstruksi Ukuran Input Matriks reduksi 2 thread 3 thread 4 thread 1 0.6928 1.1210 1.3477 3 0.7286 1.1654 1.3603 5 0.8182 1.1734 1.4731 paralel dengan 2 prosesor Lampiran 16 Perbandingan overhead untuk gabungan ketiga proses Ukuran Input Ukuran Output Grid Matriks Matriks Reduksi 2 thread 3 thread 4 thread 3x3 1 0.8548 1.2993 1.7909 3x3 3 0.5188 1.0151 1.3356 3x3 5 0.5285 1.0234 1.3488 5x5 1 0.4078 0.9022 1.2084 5x5 3 0.3960 0.7996 1.3084 5x5 5 0.3343 0.7198 1.1802 7x7 1 0.2002 0.6590 1.0325 7x7 3 0.2291 0.6493 1.0479 7x7 5 0.1163 0.6047 0.9104 paralel dengan 2 prosesor Lampiran 17 Perbandingan nilai R 2 dari pengujian k-fold cross validation untuk grid matriks 3x3 menjadi 1 k-fold minimum maksimum rata-rata s tandar de viasi 1 0.5199 0.8433 0.6715 0.0797 2 0.4610 0.6897 0.5891 0.0620 3 0.6963 0.8816 0.8078 0.0466 4 0.5252 0.8031 0.6730 0.0711 5 0.4666 0.8712 0.7030 0.1351 6 0.2205 0.6508 0.4763 0.1393 7 0.6319 0.8690 0.7721 0.0633 8 0.7126 0.8821 0.8017 0.0408 nilai R 2 Lampiran 18 Perbandingan nilai R 2 dari pengujian k-fold cross validation untuk grid matriks 3x3 menjadi 3 k-fold minimum maksimum rata-rata standar de vias i 1 0.4875 0.7615 0.6590 0.0783 2 0.4700 0.6939 0.5928 0.0567 3 0.6999 0.8854 0.8151 0.0448 4 0.5117 0.8089 0.6884 0.0843 5 0.4693 0.8805 0.7084 0.1456 6 0.1935 0.6189 0.4711 0.1309 7 0.5289 0.8592 0.7716 0.0850 8 0.6172 0.8796 0.7915 0.0647 nilai R 2 Lampiran 19 Perbandingan nilai R 2 dari pengujian k-fold cross validation untuk grid matriks 3x3 menjadi 5 k-fold minimum maks imum rata-rata s tandar de vias i 1 0.4705 0.7646 0.6516 0.0779 2 0.4674 0.7374 0.5888 0.0617 3 0.6927 0.8914 0.8159 0.0482 4 0.5207 0.8128 0.6861 0.0783 5 0.4472 0.8579 0.7085 0.1491 6 0.1835 0.6273 0.4673 0.1323 7 0.5520 0.8721 0.7633 0.0942 8 0.6382 0.8722 0.7878 0.0593 nilai R 2 Lampiran 20 Perbandingan nilai R 2 dari pengujian k-fold cross validation untuk grid matriks 5x5 menjadi 1 k-fold minimum maks imum rata-rata s tandar de vias i 1 0.5384 0.8427 0.6775 0.0736 2 0.4663 0.6956 0.5916 0.0608 3 0.4976 0.8745 0.7857 0.0851 4 0.5259 0.8040 0.6814 0.0767 5 0.4757 0.8717 0.7078 0.1315 6 0.2334 0.6592 0.4796 0.1365 7 0.5718 0.8633 0.7647 0.0705 8 0.5834 0.8807 0.7913 0.0665 nilai R 2 Lampiran 21 Perbandingan nilai R 2 dari pengujian k-fold cross validation untuk grid matriks 5x5 menjadi 3 k-fold minimum maks imum rata-rata s tandar de vias i 1 0.5016 0.8031 0.6668 0.0778 2 0.4595 0.6990 0.5934 0.0520 3 0.6990 0.8821 0.8102 0.0421 4 0.5249 0.8037 0.6904 0.0772 5 0.5156 0.8806 0.7247 0.1182 6 0.1926 0.6657 0.4794 0.1393 7 0.5369 0.8549 0.7666 0.0802 8 0.5834 0.8814 0.7882 0.0722 nilai R 2 Lampiran 22 Perbandingan nilai R 2 dari pengujian k-fold cross validation untuk grid matriks 5x5 menjadi 5 k-fold minimum maksimum rata-rata standar de vias i 1 0.4842 0.7550 0.6558 0.0769 2 0.4628 0.6726 0.5815 0.0550 3 0.7200 0.8580 0.8062 0.0391 4 0.5279 0.8205 0.6926 0.0809 5 0.4370 0.8723 0.7252 0.1236 6 0.1536 0.6784 0.4819 0.1506 7 0.5230 0.8433 0.7570 0.0938 8 0.6121 0.8692 0.7889 0.0620 nilai R 2 Lampiran 23 Perbandingan nilai R 2 dari pengujian k-fold cross validation untuk grid matriks 7x7 menjadi 1 k-fold minimum maks imum rata-rata s tandar de viasi 1 0.5550 0.8427 0.6829 0.0686 2 0.4718 0.7081 0.5954 0.0605 3 0.7001 0.8815 0.8087 0.0454 4 0.5290 0.8066 0.6842 0.0762 5 0.4899 0.8733 0.7154 0.1273 6 0.2408 0.6649 0.4841 0.1326 7 0.6148 0.8583 0.7665 0.0645 8 0.7253 0.8788 0.8029 0.0388 nilai R 2 Lampiran 24 Perbandingan nilai R 2 dari pengujian k-fold cross validation untuk grid matriks 7x7 menjadi 3 k-fold minimum maksimum rata-rata standar de vias i 1 0.5164 0.7659 0.6587 0.0681 2 0.4544 0.7004 0.5894 0.0598 3 0.6976 0.8818 0.8108 0.0426 4 0.5349 0.7957 0.6922 0.0737 5 0.5206 0.8756 0.7330 0.1248 6 0.2408 0.6667 0.4842 0.1327 7 0.6507 0.8500 0.7729 0.0613 8 0.7708 0.8778 0.8089 0.0289 nilai R 2 Lampiran 25 Perbandingan nilai R 2 dari pengujian k-fold cross validation untuk grid matriks 7x7 menjadi 5 k-fold minimum maks imum rata-rata s tandar de vias i 1 0.5286 0.7665 0.6531 0.0667 2 0.4579 0.6741 0.5854 0.0617 3 0.7039 0.8838 0.8065 0.0422 4 0.5427 0.7958 0.6881 0.0781 5 0.5213 0.8704 0.7415 0.1077 6 0.1804 0.6528 0.4697 0.1417 7 0.4458 0.8488 0.7466 0.1077 8 0.7702 0.8502 0.8087 0.0239 nilai R 2 ABSTRACT FAVORISEN R. LUMBANRAJA. Development of Parallel Programming Models on the Calibration of RegCM3 Data for Reconstruction of Rainfall Data Case Study: Rainfall of Indramayu District. Under direction of AGUS BUONO chair, HENDRA RAHMAWAN member. In the field of climatology with the long-term period, the Regional Climate Mode version 3 RegCM3 is a model of spatially oriented and able to produce regional- scale information that can be used to forecast rainfall. However, the data RegCM3 is a model of mathematics and physics and not based on real observations. Therefore, it is necessary to calibrate the model RegCM3 based observation points to reconstruct the rainfall data. Because of the large number of RegCM3 and observation points, the process requires a large number of resources for computing and computational time also. Therefore we need a technique to reduce computational time. One way to solve this problem is to use parallel programming. The purpose of this study is to develop a system to reconstruct the rainfall rainfall forecasting using data RegCM3 based observation points using parallel programming approach to accelerate the process of computing. The scope of research is the rainfall data from Java and rainfall observation data Indramayu to observe the performance of accuracy and computation time are done in parallel. The highest accuracy performed by the system is 89.14. The overall system using parallel programming is faster than serial program for large-sized data. This is showed by the value of speedup which is above 1. Keywords: Rainfall,RegCM3, PCA, Linear Regression, Parallel Programming 1 PENDAHULUAN

1.1. Latar Belakang

Kondisi iklim, khususnya curah hujan memberi pengaruh terhadap kegiatan yang dilakukan masyarakat. Dampak kejadian curah hujan yang ekstrim, seperti banjir dan kekeringan berdampak negatif terhadap aktivitas masyarakat. Salah satu bidang aktivitas masyarakat yang terkena dampak tersebut adalah adalah bidang pertanian. Kondisis curah hujan yang ekstrim dapat menyebabkan gagal panen dan kerusakan lahan pertanian. Bidang lain yang berdampak negatif terhadap curah hujan ekstrim adalah bidang transportasi. Hujan yang terus- menerus dapat menyebabkan banjir dan tergenangnya jalan, sehingga jalur transportasi menjadi terputus, serta dapat menyebabkan bencana longsor pada daerah yang terjal. Pemodelan data curah hujan merupakan salah satu faktor utama yang digunakan untuk membuat kebijakan daerah, khususnya di bidang tata kelola lahan, pertanian dan transportasi. Pemodelan data curah hujan diperlukan untuk menentukan daerah yang curah hujannya tinggi untuk memprediksi daerah yang rawan banjir, serta menentukan daerah yang curah hujannya rendah untuk memprediksi daerah rawan kekeringan. Oleh karena itu, perlu dikembangkan model untuk menganalisis dan memprediksi kondisi curah hujan. Terdapat dua hal yang perlu diperhatikan dalam mengembangkan model ini. Pertama, bahwa data pengamatan curah hujan pada titik-titik stasiun observasi iklim terbatas untuk mengembangkan suatu model curah hujan. Dan kedua, model dikembangkan untuk melakukan proses forecasting keadaan curah hujan di masa depan Buono et-al, 2010. Terdapat beberapa penelitian telah dilakukan yang berkaitan dengan model curah hujan di IPB, khususnya di Departemen Ilmu Komputer. Penelitian Normakristaguluh 2004, membandingkan PCR dengan Jaringan Syaraf Tiruan dalam proses peramalan data curah hujan pada model GCM. Hasil penelitianya menunjukka bahwa, akurasi dengan nilai R 2 menggunakan PCR tertinggi adalah 63 dan nilai akurasi R 2 dengan Jaringan Syaraf Tiruan tertinggi adalah 74. Penelitian lanjutan yang dilakukan oleh Apriyanti 2005 yang melakukan optimalisasi Jaringan Syaraf Tiruan, menunjukkan hasil akurasi hasil peramalan naik berdasarkan niali R 2 terbaik adalah 87.71. Kedua penelitian tersebut menggunakan GCM untuk memodelkan curah hujan. Selain GCM, terdapat model lain yaitu RegCM3. Model RegCM3 merupakan salah satu model yang umum digunakan untuk meneliti curah hujan. Kelebihan RegCM3 adalah tingkat resolusi yang lebih tinggi dibandingkan dengan GCM, sehingga dapat digunakan untuk menganalisis curah hujan pada wilayah tertentu yang bersifat lokal. Namun, karena data RegCM3 merupakan hasil perhitungan matematika dan fisika yang tidak berdasarkan keadaan sebenarnya, maka terjadi kesalahan data yang sistematis. Oleh karena itu, diperlukan suatu sistem yang dapat melakukan kalibrasi data Model RegCM3 sehingga mendekati keadaan curah hujan sebenarnya. Tetapi, terdapat beberapa tantangan dalam melakukan proses kalibarasi. Pertama, data curah hujan bersifat spatial dan temporal, sehingga dimensi data menjadi besar. Hal ini yang menyebabkan proses komputasi menjadi lambat. Maka perlu suatu pendekatan untuk mempercepat proses komputasi. Kedua, informasi yang dihasilkan dari proses kalibasi harus dapat diakses oleh pengguna dengan menggunakan jaringan internet.

1.2 Tujuan

Berdasarkan latar belakang tersebut, tujuan penelitian ini adalah mengembangkan sistem online untuk merekonstruksi data curah hujan menggunakan data Model RegCM3 bulanan berdasarkan titik-titik observasi pengamatan. Implementasi pemrograman sistem menggunakan pendekatan pemrograman paralel secara implisit untuk mempercepat proses komputasi .

1.3 Ruang Lingkup

Ruang lingkup penelitian meliputi: data yang digunakan pada penelitan ini adalah data curah hujan Model RegCM3 bulanan Desember 1958 sampai Juli 2002 dan data curah hujan bulanan hasil pengamatan dari titik statsiun observasi iklim di Kabutpaten Indramayu Januari 1989 sampai Desember 2007. Metode yang digunakan untuk merekonstruksi data curah hujan dari Model RegCM3 berdasarkan data obsevasi menggunakan proses regresi linear. Pengembangan sistem komputasi menggunakan pemrograman paralel secara implisit. Faktor- faktor yang akan diamati dan dianlisis adalah akurasi hasil rekonstruksi nilai curah hujan dan kinerja komputasi yang dilakukan secara paralel yang meliputi: speedup , efesiensi dan total parallel overhead. 2 TINJAUAN PUSTAKA

2.1 Model Sirkulasi Umum Global Circulation Model GCM

Model Sirkulasi Umum merupakan model matematika dari sirkulasi umum dari atmosfir planet atau lautan secara global dan didasarkan pada persamaan Navier-Strokes pada sphere yang sedang berotasi dengan istilah termodinamika dengan berbagai sumber energi Ratag 2002 dalam Normakristagaluh 2004. Persamaan-persamaan ini adalah dasar dari komputasi komputer yang kompleks yang umum digunakan untuk mensimulasikan keadaan atmosfir atau laut di Bumi. Atmospheric GCM AGCM dan Oceanic GCM OGCM merupakan komponen kunci pada Model Iklim Global Global Climate Mode. GCM dan Global Climate Model secara umum digunakan untuk melakukan proses prakiraan cuaca, pemahamaan terhadap iklim dan proyeksi terhadap perubahan iklim.Model ini menduga perubahan unsur-unsur cuaca secara regional pada grid-grid yang berukuran 3 o atau 4 o sampai 10 o menurut lintang dan bujur, dan dapat digunakan untuk peramalan atau menilai dampak yang mungkin timbul apabila terjadi perubahan di udara, laut, dan daratan.

2.2 Regional Climate Model 3RegCM3

Regional Climate Model RegCM merupakan model yang dikembangkan dengan perhitungan matematika dan fisika untuk memodelkan iklim. RegCM yang pertama, dikembangkan oleh Dickinson et-al 1989, Grogi dan Bates 1989 dan Grogi 1990 pada National Center for Atmospheric Research NCAR, dan di maintain di ICTP. Saat ini RegCM adalah versi generasi ke-tiga RegCM3. RegCM3 merupakan perbaikan dari RegCM2.5 yang dideskripsikan oleh Grogi dan Mearns 1999. Perbaikan meliputi representation of precipitation physics, surface physics , atmospheric chemistry dan aerosols, model input fields, serta user interface . Keuntungan menggunakan RegCM adalah memiliki resolusi yang lebih tinggi dari pada Global Climate Model GCM, sehingga dapat memodelkan iklim untuk area dengan skala kecil dan bersifat lokal. Model RegCM3 bekerja dengan meni RegC Suma meng RegC Gam 2.3 data kejad Di gu bebe perm peres ingkatkan re CM3 dapat m atera atau w ganalisis ilk CM3 pada t mbar 1 Ilustr Bumi Curah Hu Beberapa curah hujan dian hujan. urun, peneri rapa wilaya Curah huj mukaan sebe sapanperem esolusi dari menganalis wilayah terte kim dalam s itik obesrva asi permeta http:clim ujan informasi u n rata-rata ta Curah hujan imaan hujan ah tropika b an dibatasi elum menga mbesan ke d GCM pada sis iklim yan entu di pula skala besar asi di Bumi aan grid mat matepredicti untuk mengg ahunan, har n rata-rata t n tahunan b asah, curah sebagai ting alami aliran dalam tanah a wilayah ke ng mencaku au Jawa, sed global. Ilu dapat diliha triks RegCM on.netcont gambarkan ri hujan, pol tahunan san berkisar dari h hujan dapa ggi air hujan permukaan h Handoko ecil dan terb up wilayah t dang GCM d ustrasi pem at pada Gam M3 pada ko tentregiona keadaan su la musiman ngat bervaria i 70 mm per at melebihi 4 n dalam m n, evaporasi 1993 dalam batas. Mode tertentu di p digunakan u metaan grid d mbar 1. ordinat obs al-climate-m uatu wilayah , dan peluan asi menurut r tahun, sem 4000 mm p mm yang dit , dan m Normakris el pulau untuk data ervasi di models. h adalah ng t tempat. mentara di per tahun. terima di stagaluh 2004. Jumlah hari hujan umumnya dibatasi dengan jumlah hari dengan curah hujan 0.5 mm atau lebih. Jumlah hari hujan dapat dinyatakan per minggu, dekade, bulan, tahun, atau satu periode tanam tahap pertumbuhan tanaman, dimana curah hujan rata-ratanya dapat dihitung dengan cara menjumlahkan curah hujan harian hasil pengukuran sesuai dengan periode waktu yang diperlukan dan dibagi dengan periode waktu tersebut Hidayati 1983 dalam Normakristagaluh 2004. Data hujan mempunyai variasi yang sangat besar dibandingkan unsur-unsur iklim yang lain, baik variasi menurut tempat maupun waktu. Untuk mendapatkan gambaran wilayah diperlukan pengamatan yang cukup panjang dan kerapatan jaringan stasiun pengamatan yang memadai. Curah hujan yang diamati pada stasiun klimatologi meliputi tinggi hujan curah hujan, jumlah hari hujan, dan intensitas hujan.

2.4 Principal Components Analysis PCA

PCA atau analisis komponen utama yang disebut juga transformasi Karhunen-Loeve merupakan suatu teknik untuk mereduksi p peubah variabel pengamatan menjadi q peubah baru yang saling ortogonal, dimana masing-masing q peubah baru tersebut merupakan kombinasi linear dari p peubah lama. Pemilihan q peubah baru tersebut sedemikian rupa sehingga keragaman yang dimiliki oleh p peubah lama, sebagian besar dapat diterangkan atau dimiliki oleh q peubah baru. PCA akan cukup efektif jika antar p peubah asal memiliki korelasi yang cukup tinggi Smith, L.I.,2002. Misalnya diberikan objek pengamatan vektor Grid dengan dimensi p peubah, Grid=[grid 1 grid 2 grid 3 ... grid p ] yang akan direduksi menjadi vektorY=[y 1 y 2 y 3 ... y q ], dimana q p tanpa kehilangan informasi secara berarti, yang dapat dilihat sebagai berikut: