Permodelan Statistical Downscaling dengan Regresi Projection Pursuit untuk Peramalan Curah Hujan Bulanan (Kasus Curah hujan bulanan di Indramayu)

(1)

PEMODELAN

STATISTICAL DOWNSCALING

DENGAN REGRESI

PROJECTION PURSUIT

UNTUK PERAMALAN CURAH HUJAN

BULANAN

Kasus Curah hujan bulanan di Indramayu

AJI HAMIM WIGENA

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2006


(2)

PERNYATAAN MENGENAI DISERTASI DAN

SUMBER INFORMASI

Dengan ini saya menyatakan bahwa disertasi ‘Pemodelan Statistical Downscaling dengan Regressi Projection Pursuit untuk Peramalan Curah Hujan Bulanan. Kasus: Curah Hujan Bulanan di Indramayu’ adalah karya saya sendiri dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan atau tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir disertasi ini.

Bogor, Maret 2006

Aji Hamim Wigena NIM G32601002


(3)

ABSTRAK

AJI HAMIM WIGENA. Pemodelan Statistical Downscaling dengan Regresi Projection Pursuit untuk Peramalan Curah Hujan Bulanan. Kasus: Curah hujan bulanan di Indramayu. Dibimbing oleh AUNUDDIN, BARIZI, dan RIZALDI BOER.

Pemodelan Statistical Downscaling (SD) menyusun model hubungan fungsional antara luaran GCM dengan curah hujan lokal. Model SD memerlukan suatu domain (luasan dan lokasi) GCM sebagai peubah prediktor dan curah hujan lokal sebagai peubah respon. Penentuan domain GCM merupakan langkah pertama dalam penyusunan model SD.

Secara umum data curah hujan bersifat nonlinear dan tidak berdistribusi normal, sedangkan data luaran GCM (Generalized Circulation Model) bersifat curse of dimensionality dan multikolinearitas, sehingga langkah kedua dalam pemodelan SD adalah mereduksi dimensi data luaran GCM. Metode PPR (Projection Pursuit Regression) dapat digunakan untuk mengantisipasi karakteristik luaran GCM dan data curah hujan lokal, di mana PPR dapat melakukan reduksi dimensi dan menyusun model regresi yang bersifat nonparametrik dan data-driven. Pemodelan SD memerlukan panjang data historis tertentu. Periode data historis yang berbeda akan memberikan dugaan model yang berbeda pula. Suatu uji konsistensi model penduga dilakukan pada berbagai periode dan panjang data historis. Pene ntuan Daerah Prakiraan Musim (DPM) dilakukan berdasarkan hasil dugaan model SD.

Penelitian ini menggunakan data presipitasi GCM dan data curah hujan bulanan di Kabupaten Indramayu. Hasil studi literatur memberikan gambaran bahwa perkembangan pemodelan SD mengarah ke penggunaan teknik-teknik berbasis regresi nonlinear, model nonparametrik, dan data-driven. Hasil kajian analisis menunjukkan bahwa (1) Penentuan domain dapat dilakukan berdasarkan keeratan hubungan antara luaran GCM dengan peubah lokal, namun pemilihan grid dalam suatu domain yang berkorelasi tinggi tidak mudah dilakukan dan kemungkinan grid-grid dalam suatu domain tidak contiguous; (2) Penggunaan domain berukuran 8×8 grid dan tepat berada di atas lokasi target pendugaan memberikan curah hujan dugaan yang lebih stabil atau konsisten dan tidak terlalu sensitif terhadap data pencilan. Penentuan domain ini lebih praktis; (3) Pendugaan curah hujan bulanan dengan model PPR lebih akurat dan pola nilai dugaan lebih mendekati pola data aktualnya daripada model PCR (Principal Component Regression), terutama untuk panjang data historis yang lebih dari atau sama dengan 20 tahun; dan (4) DPM_PPR terdiri dari lima DPM. Lokasi kelima DPM adalah satu DPM di wilayah utara, satu DPM di wilayah selatan, dan tiga DPM di wilayah tengah kabupaten Indramayu. Secara umum perbedaan nilai dugaan curah hujan dengan aktualnya dalam DPM_PPR lebih kecil dari pada perbedaannya dalam DPM_BMG (Badan Meteorolgi dan Geofisika) dan pola nilai dugaannya relatif lebih mendekati pola data aktualnya.

Kata Kunci: Statistical Downscaling, GCM, PPR, PCR, curse of dimensionality, nonparametrik, data-driven


(4)

ABSTRACT

AJI HAMIM WIGENA. Statistical Downscaling Modeling using Projection Pursuit Regression to Forecast Monthly Rainfall. A Case of Monthly Rainfall in Indramayu. Under the direction of AUNUDDIN, BARIZI, and RIZALDI BOER.

Statistical Downscaling (SD) modeling develops a model of functional relation between GCM output and local rainfall. An SD model requires a GCM domain (area and location) as a predictor variable and the local rainfall as a response variable. The determination of the GCM domain is the first step in SD model development.

Generally, the local rainfall data are nonlinear and do not follow a normal distribution, while the characteristics of the GCM output are curse of dimensionality and multicollinearity. The second step in the SD model development is the dimension reduction of GCM data. A Projection Pursuit Regression (PPR) method can be used to reduce the GCM output dimension and to develop a regression model to anticipate the characteristics of both GCM output and the local rainfall data. The PPR model is categorized into a nonparametric and data-driven model. An SD model estimation needs a certain length of records. Different length of records would give different results. A test of model stability or consistency is accomplished to different periods and length of records. The determination of seasonal prediction region (Daerah Prakiraan Musim or DPM) is based on the SD model estimate.

This research uses precipitation GCM data and monthly rainfall data in Indramayu district. A literature review shows that the development of SD modeling tends to use techniques which are nonlinear, nonparametric, and data-driven. The results of the analysis indicate that (1) The determination of GCM domain can be based on the strong correlation between GCM output and the local variable, but the selection of grids in the domain may not be straight forward and would be resulted in not a contiguous domain; (2) The use of domain 8×8 grids above the target of estimation gives the estimate rainfall more stable or consis tent and not too sensitive to outlier data. The determination of the domain is easier and more practical; (3) The monthly rainfall estimation using PPR model is more accurate and the pattern of the estimate rainfall is more similar to that of the actual one than using PCR (Principal Component Regression) model, especially for the length of records more than or equal 20 years; and (4) DPM_PPR consists of five DPMs, i.e. one DPM in the north region, one DPM in the south region, and three DPMs in the middle region of Indramayu district. In general the difference between the actual and the estimate rainfall of DPM_PPR is smaller than that of DPM_BMG (Badan Meteorolgi dan Geofisika) and the pattern of the estimate rainfall is relatively similar to that of the actual rainfall.

Keywords: Statistical Downscaling, GCM, PPR, PCR, curse of dimensionality, nonparametric, data-driven


(5)

Pemodelan

Statistical Downscaling

dengan Regresi

Projection Pursuit

untuk Peramalan Curah Hujan Bulanan

Kasus: Curah hujan bulanan di Indramayu

AJI HAMIM WIGENA

Disertasi

sebagai salah satu syarat untuk memperoleh gelar Doktor pada

Program Studi Statistika

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2006


(6)

Judul Disertasi : Pemodelan Statistical Downscaling dengan Regresi Projection Pursuit untuk Peramalan Curah Hujan Bulanan.

Kasus: Curah hujan bulanan di Indramayu Nama : Aji Hamim Wigena

NIM : G326010021

Disetujui: Komisi Pembimbing

Dr. Ir. Aunuddin, MSc Ketua

Prof. Dr. Barizi, MES Dr. Ir. Rizaldi Boer, MAgr Anggota Anggota

Diketahui:

Ketua Program Studi Statistika Dekan Sekolah Pascasarjana

Dr. Ir. Budi Susetyo, MS Prof. Dr. Ir. Syafrida Manuwoto, MSc


(7)

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah SWT atas segala karunianya sehingga karya ilmiah ini berhasil diselesaikan. Penelitian telah dilaksanakan sejak pertengahan tahun 2003 dengan judul Pemodelan Statistical Downscaling dengan Regresi Projection Pursuit untuk Peramalan Curah Hujan Bulanan. Kasus: Curah Hujan Bulanan di Indramayu.

Penulis mengucapkan terima kasih kepada Dr. Ir. Aunuddin, MSc, Prof. Dr. Barizi, MES, dan Dr. Ir. Rizaldi Boer, MAgr atas bimbingan, arahan, dan sarannya selama penelitian ini. Terima kasih kami sampaikan juga kepada:

1. Pimpinan IPB dan FMIPA IPB atas kesempatan studi ini dan Direktorat Jendral Pendidikan Tinggi Depdiknas atas bantuan dana BPPS.

2. Pimpinan Sekolah Pascasarjana, Ketua PS Statistika, dan staf pengajar serta karyawan Sekolah Pascasarjana yang telah memberikan laya nan pengajaran dan administrasi dengan baik.

3. Rekan-rekan dosen Departemen Statistika yang selalu meluangkan waktu untuk berdiskusi dan memberikan saran serta dorongan moril, dan juga karyawan Departemen Statistika atas bantuannya.

4. Pimpinan LPPM dan staf administrasi atas dorongan morilnya.

5. Rekan-rekan di Laboratorium Klimatologi, Departemen Geofisika dan Meteorologi, FMIPA IPB atas bantuan fasilitas dan informasinya.

6. Kedua orang tua, Bapak Wigena dan Ibu Rusmiati, istri tercinta Evi Hartati dan anak-anak tersayang Genui Harviti, Ginea Harvita, Ganand a Hayardisi, dan Girisa Hartiwi, serta seluruh keluarga besar di Garut dan Jakarta yang telah memberikan dorongan moril dan do’a yang tulus; kepada Pesi atas bantuan pengolahan data.

Dengan segala kerendahan hati, penulis menyadari bahwa disertasi ini masih jauh dari sempurna. Namun demikian penulis berharap tulisan ini dapat bermanfaat bagi pihak-pihak lain yang memerlukan.

Bogor, Maret 2006 Aji Hamim Wigena NIM G326010021


(8)

RIWAYAT HIDUP

Penulis dilahirkan di Garut pada tanggal 28 September 1952, sebagai anak kedua dari pasangan Wigena dan Rusmiati. Pendidikan sarjana ditempuh di Departemen Statistika dan Komputasi, Fakultas Pertanian IPB, lulus pada tahun 1976. Pada tahun 1980 penulis diterima di Division of Computer Applications pada Asian Institute of Technology (AIT), Bangkok, Thailand, dan menyelesaikannya pada tahun 1981, dan pernah mengikuti pendidikan juga di Departement of Computing Science pada University of Alberta, Canada pada tahun 1986 s/d 1989. Kesempatan untuk melanjutkan ke program doktor pada program studi Statistika, Sekolah Pascasarjana IPB, diperoleh pada tahun 2001. Beasiswa pendidikan (BPPS) diperoleh dari Direktorat Jendral Pendidikan Tinggi, Depdiknas. Penulis bekerja sebagai dosen pada Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, IPB, sejak tahun 1977.

Penulis menikah dengan Evi Hartati dan telah dikaruniai empat orang anak, yaitu Genui Harviti, Ginea Harvita, Gananda Hayardisi dan Girisa Hartiwi.

Selama mengikuti program S3, penulis pernah menyajikan beberapa makalah karya ilmiah pada Seminar dan Workshop baik nasional maupun internasional. Karya-karya ilmiah ini merupakan bagian dari program S3 penulis. Karya-karya ilmiah tersebut adalah:

1) Wigena AH, Aunuddin. 2004a. Beberapa model statistical-downscaling untuk peramalan curah hujan. Pertemuan Ilmiah Nasional Basic Science I, di UNIBRAW Malang, 17 Januari 2004.

2) Wigena AH, Aunuddin. 2004b. Aplikasi projection pursuit dalam pemodelan statistical-downscaling. Seminar Nasional Statistika, di FMIPA IPB, Bogor, 4 September 2004.

3) Wigena AH, Aunuddin. 2004c. Application of projection pursuit and artificial neural network on statistical downscaling. International Conference on Statistics and Mathematics, Bandung, West Java.

4) Wigena AH, Aunuddin, Boer R. 2005a. Comparison of statistical downscaling models. Climate Forecast Application Workshop. 18-21 July 2005. AIT, Bangkok, Thailand.

5) Wigena AH, Aunuddin, Boer R. 2005b. Prediction of local rainfall from GCM output using projection pursuit. International Roundtable on Understanding and Prediction of Summer and Winter Moonson. 21-24 November 2005. Jakarta - Bandung.


(9)

DAFTAR ISI

Halaman

DAFTAR TABEL xi

DAFTAR GAMBAR xii

DAFTAR LAMPIRAN xiv

1. PENDAHULUAN 1

1.1. Latar Belakang 1

1.2. Tujuan Penelitian 4

1.3. Kegunaan Penelitian 5

1.4. Kerangka Pemikiran 6

2. PERKEMBANGAN TEKNIK STATISTICAL DOWNSCALING DAN

PERMASALAHAN STATISTIK 9

2.1. Pendahuluan 9

2.2. Karakteristik Luaran GCM 9

2.3. Teknik Downscaling 12

2.3.1. Pendekatan Dynamical Downscaling 13 2.3.2. Pendekatan Statistical Downscaling 14 2.4. Beberapa Teknik Statistical Downscaling 16 2.5. Kategori Teknik Statistical Downscaling 23 2.6. Permasalahan Dalam Teknik Statistical Downscaling 25

2.7. Simpulan 28

3. PENENTUAN DOMAIN GCM DALAM PENYUSUNAN MODEL

STATISTICAL DOWNSCALING 30

3.1. Pendahuluan 30

3.2. Bahan dan Metode 31

3.2.1. Bahan 31

3.2.2. Metode 31

3.3. Hasil dan Pembahasan 33

3.4. Simpulan 36

4. PENGGUNAAN PROJECTION PURSUIT UNTUK REDUKSI

DIMENSI DAN PEMODELAN STATISTICAL DOWNSCALING 37

4.1. Pendahuluan 37

4.2. Pereduksian Dimensi 38

4.3. Model Regresi Projection Pursuit 39

4.4. Bahan dan Metode 46

4.4.1. Bahan 46

4.4.2. Metode 46

4.5. Hasil dan Pembahasan 47

4.5.1. Perbandingan PPR dan PCR 47

4.5.2. Perbandingan PPR Berdasarkan Domain Segi8

dan Segi8kor 52


(10)

5. UJI KONSISTENSI MODEL STATISTICAL DOWNSCALING

BERBASIS PROJECTION PURSUIT DALAM PREDIKSI CURAH

HUJAN 55

5.1. Pendahuluan 55

5.2. Bahan dan Metode 55

5.2.1. Bahan 55

5.2.2. Metode 56

5.3. Hasil dan Pembahasan 56

5.4. Simpulan 67

6. PENENTUAN DAERAH PRAKIRAAN MUSIM BERBASIS

DUGAAN MODEL REGRESI PROJECTION PURSUIT 68

6.1. Pendahuluan 68

6.2. Bahan dan Metode 69

6.2.1. Bahan 69

6.2.2. Metode 69

6.3. Hasil dan Pembahasan 69

6.4. Simpulan 75

7. PEMBAHASAN UMUM 76

7.1. Penentuan Domain GCM 76

7.2. Metode Projection Pursuit 77

7.3. Daerah Prakiraan Musim 78

7.4. Metode Peramalan 79

8. SIMPULAN DAN SARAN 82

8.1. Simpulan 82

8.2. Saran 83

DAFTAR PUSTAKA 84


(11)

DAFTAR TABEL

Halaman

1. Beberapa GCM 11

2. Beberapa Teknik Statistical Downscaling 18

3. Kategori Teknik-Teknik Statistical Downscaling 24 4. RMSEP dan r untuk Setiap Domain Bujur Sangkar 34 5. RMSEP dan r untuk Setiap Domain Berdasarkan Korelasi 35

6. Tahun Pemodelan untuk Tahun Peramalan 2001 47

7. Curah Hujan Dugaan berdasarkan Panjang Data Historis (35, 30,

25, 20, dan 15 Tahun) dengan PCR dan PPR: untuk Domain Segi8 48 8. Curah Hujan Aktual dan Dugaan berdasarkan Panjang Data

Historis (35, 30, 25, 20, dan 15 Tahun) dan Domain (Segi8 dan

Segi8kor) dengan PPR 52

9. Tahun Pemodelan dan Tahun Peramalan untuk Konsistensi Model 56 10.Rataan dan STD RMSEP dan Nilai Korelasi (r) 57 11.RMSEP dan Korelasi ( r ) untuk Domain Segi8 59 12.RMSEP dan Korelasi ( r ) untuk Domain Segi8kor 60 13.Rataan dan STD RMSEP dan Nilai Korelasi (r) setelah Koreksi Data 64 14.RMSEP dan Korelasi ( r ) untuk Domain Segi8 setelah Koreksi Data 65 15.RMSEP dan Korelasi ( r ) untuk Domain Segi8kor setelah Koreksi

Data 66

16.Stasiun-Stasiun dalam DPM_BMG dan DPM_PPR 71 17.Curah Hujan Aktual dan Dugaan untuk Setiap DPM_PPR 73 18.Curah Hujan Aktual dan Dugaan untuk Setiap DPM_BMG 74


(12)

DAFTAR GAMBAR

Halaman

1. Tahapan Penelitian 7

2. Domain-Domain Berbentuk Bujur Sangkar 32

3. Domain-Domain Berdasarkan Korelasi 33

4. RMSEP untuk Domain-Domain Bujur Sangkar 34

5. Nilai r untuk Domain-Domain Bujur Sangkar 35 6. RMSEP untuk Domain-Domain Berdasarkan Korelasi 36 7. Nilai r untuk Domain-Domain Berdasarkan Korelasi 36 8. Nilai fungsi Y dan Proyeksi X terhadap Z 41

9. Domain Segi8 dan Segi8kor 47

10.Nilai RMSEP dan Korelasi (r) pada Metode PCR dan PPR dengan Berbagai Panjang Data Historis (35, 30, 25, 20, dan 15 tahun) 49 11.Dugaan Curah Hujan dengan Metode PCR dan PPR dengan

Panjang Data Historis 35 Tahun 50

12.Dugaan Curah Hujan dengan Metode PCR dan PPR dengan

Panjang Data Historis 30 Tahun 50

13.Dugaan Curah Hujan dengan Metode PCR dan PPR dengan

Panjang Data Historis 25 Tahun 51

14.Dugaan Curah Hujan dengan Metode PCR dan PPR dengan

Panjang Data Historis 20 Tahun 51

15.Dugaan Curah Hujan dengan Metode PCR dan PPR dengan

Panjang Data Historis 15 Tahun 51

16.Nilai RMSEP dan Korelasi (r) untuk Domain Segi8 dan Segi8kor dengan Berbagai Panjang Data Historis (35, 30, 25, 20, dan 15

tahun) 53

17.Plot Residua l, Y_Aktual dengan Y_dugaan Tahun Pemodelan

1967-1996 dan Tahun Prediksi 1997 (sebelum koreksi data) 61 18.Plot Residua l, Y_Aktual dengan Y_dugaan Tahun Pemodelan

1968-1997 dan Tahun Prediksi 1998 (sebelum koreksi data) 61 19.Plot Residua l, Y_Aktual dengan Y_dugaan Tahun Pemodelan


(13)

20.Plot Residua l, Y_Aktual dengan Y_dugaan Tahun Pemodelan

1967-1996 dan Tahun Prediksi 1997 (setelah koreksi data) 62 21.Plot Residua l, Y_Aktual dengan Y_dugaan Tahun Pemodelan

1968-1997 dan Tahun Prediksi 1998 (setelah koreksi data) 63 22.Plot Residua l, Y_Aktual dengan Y_dugaan Tahun Pemodelan

1969-1998 dan Tahun Prediksi 1999 (setelah koreksi data) 63

23.Daerah Prakiraan Musim BMG (BMG 2003) 70


(14)

DAFTAR LAMPIRAN

Halaman

1. Daftar Istilah 89

2. Elevasi dan Koordinat Setiap Stasiun di Kabupaten Indrama yu 90 3. Dendrogram Pengelompokan Stasiun Curah Hujan 91 4. Curah Hujan (mm) Aktual dan Dugaan Setiap DPM_PPR 92 5. Curah Hujan (mm) Aktual dan Dugaan Setiap DPM_BMG 93 6. Sub-Program S-Plus yang digunakan untuk Pendugaan Model PPR 94


(15)

1.

PENDAHULUAN

1.1. Latar Belakang

Informasi ramalan curah hujan sangat berguna bagi petani dalam mengantisipasi kemungkinan kejadian-kejadian ekstrim (kekeringan akibat El-Nino dan kebanjiran akibat La-Nina), yang sering menimbulkan kegagalan produksi pertanian. Curah hujan sebagai faktor yang penting bagi pertanian akan berpengaruh secara langsung terhadap ketersediaan air. Kurangnya ketersediaan air akan berdampak kekeringan, dan sebaliknya, apabila kelebihan air akan menimbulkan banjir jika tidak dilakukan pengelolaan dengan baik dan benar. Dampak kerugian akibat kekeringan maupun banjir pada sektor pertanian ini sering terjadi karena (1) kekurangan informasi tentang curah hujan yang akurat, cepat, dan bersifat spesifik lokasi; (2) tingkat kemampuan peramalan yang masih belum baik ; dan (3) tingkat adopsi pengguna akhir, dalam hal ini petani, terhadap hasil ramalan masih sangat rendah.1

Fenomena El Nino berkaitan dengan kejadian iklim ekstrim. Dalam periode 1960 sampai 1988 terdapat 10 dari 14 kali kemarau panjang terjadi pada tahun-tahun El Nino. Kejadian kekeringan pada tahun 1982/1983 telah menimbulkan kerugian yang sangat besar di Indonesia mencapai 0,4 miliar dollar AS dan pada tahun 1997/1998 sekitar 375 juta dollar AS di mana sebesar 24 persen di antaranya dari sektor pertanian. Kekeringan maupun banjir selalu terjadi hampir setiap tahun di Indonesia dengan luasan dan intensitas yang bervariasi. Dalam periode 1993 sampai 2002 rata-rata laha n pertanian yang terkena kekeringan seluas 220.380 hektar dengan lahan puso mencapai 43.434 hektar atau setara dengan 530.000 ton gabah kering giling (GKG), sedangkan yang terlanda banjir seluas 158.479 hektar dengan puso 38.928 hektar (setara dengan 400.000 ton GKG).1 Khususnya di kabupaten Indramayu, yang sangat sensitif terhadap kejadian iklim ekstrim, luas lahan yang terkena kekeringan pada tahun El Nino selalu melonjak tinggi dibanding tahun normal. Pada tahun-tahun ekstrim kering (El Nino 1991, 1994, dan 1997), kerugian ekonomi akibat kegagalan panen di

1

http://www.kompas.com/kompas-cetak/0308/24/Fokus/508786.htm (24-08-2003)


(16)

daerah ini mencapai Rp 571 miliar, sedangkan pada tahun-tahun ekstrim basah, kerugian dapat mencapai Rp. 91 miliar (GFM & BMG, 2003).

Proses pembentukan hujan di kawasan tropis, termasuk Indonesia, merupakan proses yang sukar disimulasikan. Storch & Zwiers (1999) menyatakan bahwa belum ada suatu model iklim yang dapat digunakan untuk memprediksi curah hujan dengan baik. Topografi dan interaksi antara laut, darat dan atmosfir yang kompleks mempersulit prediksi curah hujan di wilayah Indonesia sehingga diperlukan model peramalan curah hujan yang akurat pada skala lokal (propinsi atau kabupaten) dengan mempertimbangkan informasi tentang sirkulasi atmosfir global yang dapat diperoleh dari luaran GCM (General Circulation Model).

GCM adalah suatu model berbasis komputer yang terdiri dari berbagai persamaan numerik dan deterministik yang terpadu dan mengikuti kaidah-kaidah fisika. GCM mensimulasi peubah-peubah iklim global pada setiap grid (berukuran ±2,5o atau ±300 km2) setiap lapisan (layer) atmosfir, yang selanjutnya digunakan untuk memprediksi pola-pola iklim dalam jangka waktu panjang (tahunan).

Dalam kajian klimatologi jangka panjang GCM merupakan suatu model yang berorientasi spasial dan temporal dan mampu menghasilkan ciri sirkulasi global pada skala besar, yaitu skala benua dan skala tahun atau dekade, dengan resolusi rendah. GCM merupakan alat prediksi utama iklim dan cuaca secara numerik dan sebagai sumber informasi primer untuk menilai pengaruh perubahan iklim. Namun informasi GCM masih berskala global dan tidak untuk fenomena skala lebih kecil (mesoscale atau lokal), sehingga sulit untuk memperoleh langsung informasi berskala lokal dari GCM. Resolusi GCM terlalu rendah untuk memprediksi iklim lokal yang dipengaruhi oleh sirkulasi atmosfir dan parameter lokal seperti topografi dan tataguna lahan, tetapi GCM masih mungkin digunakan untuk memperoleh informasi skala lokal atau regional bila teknik downscaling digunakan (Fernandez 2005).

Teknik downscaling adalah suatu proses transformasi data dari suatu grid dengan unit skala besar menjadi data pada grid-grid dengan unit skala yang lebih kecil. Wilby & Wigley (1997) menyatakan bahwa downscaling adalah suatu cara menginterpolasi peubah-peubah prediktor atmosfir berskala regional terhadap peubah-peubah berskala lebih kecil. Ada dua jenis teknik downscaling yaitu


(17)

dynamical downscaling dan statistical downscaling. Dynamical downscaling merupakan proses downscaling yang dilakukan secara terus menerus sepanjang waktu di mana perubahan data suatu peubah pada grid- grid dengan skala yang lebih kecil mengikuti perubahan data peubah yang sama pada grid berskala besar. Statistical downscaling adalah proses downscaling yang bersifat statik di mana data pada grid- grid berskala besar dalam periode dan jangka waktu tertentu digunakan sebagai dasar untuk menentukan data pada grid berskala lebih kecil. Teknik ini menggunakan model statistik yang menggambarkan hubungan antara data pada grid-grid berskala besar dengan data pada grid berskala lebih kecil. Dalam statistical downscaling peubah-peubah data pada kedua jenis grid (besar dan kecil) sama atau berbeda. Teknik lainnya adalah statistical-dynamical downscaling yang merupakan kombinasi kedua nya.

Sehubungan dengan kajian dampak iklim dalam bidang pertanian dengan skala lokal diperlukan suatu pendekatan statistical downscaling (SD) untuk memprediksi curah hujan pada skala lokal dengan resolusi tinggi berdasarkan data GCM berskala global. Pendekatan SD menjembatani skala global GCM dengan skala yang lebih kecil, berdasarkan adanya hubungan fungsional antara kedua skala tersebut (Fuentes & Heimann 2000). Menurut Uvo et al. (2001), metode ini menduga nilai peubah meteorologis dalam selang waktu tertentu berdasarkan karakteristik sirkulasi atmosfir berskala besar atau mentransformasi data GCM ke peubah yang berskala lebih kecil. Pendekatan ini menggunakan model regresi untuk menentukan hubungan fungsional antara peubah iklim skala global GCM sebagai prediktor dengan peubah iklim lokal sebagai prediktan (respon). Namun data GCM tidak dapat digunakan secara langsung sebagai prediktor pada model regresi yang baku.

Data iklim (data GCM dan curah hujan) umumnya bersifat non-stasioner dalam ruang dan waktu, dinamik dan non- linear, menyebar non-Gaussian atau mungkin tidak mempunyai sebaran yang baku. Data GCM merupakan data spasial dan temporal di mana kemungkinan besar terjadi korelasi spasial antara data pada grid yang berbeda dalam satu domain dan otokorelasi dalam data deret waktu. Pemodelan SD untuk pendugaan curah hujan harus memperhatikan kendala-kendala tersebut.


(18)

Di samping itu domain GCM merupakan salah satu faktor dalam SD, yaitu lokasi dan luasan area permukaan atmosfir. Domain menentukan keakuratan pendugaan model sehingga pene ntuan domain merupakan langkah penting dalam SD. Dalam pemodelan SD domain ini dijadikan sebagai prediktor yang berdimensi banyak di mana kemungkinan terjadi curse of dimensionality, korelasi spasial antar grid dalam domain, dan multikolinearitas antar peubah. Semakin besar domain dan semakin banyak peubah akan menimbulkan permasalahan statistik dalam pemodelan, terutama bila data historisnya tidak lebih banyak dari besar domain dan jumlah peubah.

Selama ini ada beberapa metode SD yang telah digunakan antara lain regresi linear berganda, regresi komponen utama, dan korelasi kanonik (untuk multi respon) (Wilby & Wigley 1997). Analisis komponen utama dapat digunakan untuk mengatasi masalah curse of dimensionality. Regresi komponen utama dapat mengatasi korelasi spasial atau multikolinearitas antar peubah prediktor (grid-grid) tetapi metode ini bersifat linear sehingga belum dapat mengatasi sifat data GCM yang non- linear dan belum mengatasi masalah otokorelasi pada data deret waktu (temporal). Kombinasi regresi komponen utama dan ARIMA telah digunakan untuk mengatasi otokorelasi (Notodiputro et al. 2004). Metode Regresi Projection Pursuit (PPR – Projection Pursuit Regression) berpotensi untuk mengatasi masalah- masalah tersebut dan dapat digunakan untuk pemodelan SD. Metode PPR ini telah digunakan dalam penyusunan model kalibrasi dalam bidang kimia (Malthouse 1995), di mana PPR dapat mengatasi multikolinearitas antara peubah prediktor dan sifat peubah respon yang nonlinear dan tidak berdistribusi baku.

1.2. Tujuan Penelitian

Model- model SD untuk peramalan curah hujan atau unsur iklim lainnya telah dikaji dan diterapkan di wilayah luar tropis berdasarkan peubah-peubah data GCM dan memberikan hasil ramalan cukup baik. Model ini tentunya berkaitan dengan kondisi keragaman iklim di wilayah masing- masing. Apakah model-model SD ini dapat diterapkan di wilayah tropis dengan keragaman iklim Indonesia? Oleh karena itu penelitian ini bertujuan mengkaji metode Projection


(19)

Pursuit untuk memperoleh suatu model SD untuk peramalan curah hujan bulanan yang lebih akurat dan dapat diterapkan di wilayah Indonesia. Secara spesifik tujuan penelitian ini adalah:

1) Mempelajari perkembangan teknik-teknik SD dan permasalahan yang sering terjadi dalam pemodelan SD.

2) Menentukan domain GCM yang sesua i untuk pendugaan curah hujan lokal. 3) Menyusun model SD dengan metode PPR yang menggambarkan hubungan

fungsional antara data GCM dan curah hujan dan apakah model PPR dapat mengatasi masalah curse of dimensionality, multikolinearitas, dan nonlinear. Model PPR dibandingkan dengan PCR (Principal Component Regression) yang selama ini banyak digunakan untuk pemodelan SD. Kedua model menggunakan domain GCM yang sama.

4) Mempelajari apakah panjang data historis berpengaruh terhadap peramalan curah hujan, yaitu apakah data historis yang lebih pendek sudah representatif untuk pemodelan SD, dan mengetahui konsistensi peramalan curah hujan untuk berbagai tahun yang berbeda. Data pencilan (outlier) kemungkinan akan berpengaruh terhadap pemodelan sehingga pemeriksaan dan koreksi terhadap data pencilan dilakukan untuk memperoleh model yang lebih baik. Hasilnya adalah suatu model PPR dan domain GCM tertentu yang akan digunakan dalam kajian berikutnya.

5) Menentukan wilayah prakiraan hujan, yaitu pewilayahan atau pengelompokan (regionalisasi) stasiun curah hujan di kabupaten Indramayu, sehingga hanya satu model peramalan untuk satu kelompok stasiun. Model PPR diterapkan untuk regionalisasi stasiun-stasiun curah hujan. Pewilayahan dilakukan berdasarkan pola model dugaan setiap stasiun curah hujan. Hasil yang diharapkan adalah peta pewilayahan prakiraan curah hujan sehingga satu wilayah dapat diwakili dengan satu model.

1.3. Kegunaan Penelitian

Metode Projection Pursuit diharapkan dapat digunakan sebagai metode alternatif yang handal untuk pemodelan SD dan dapat digunakan untuk kajian-kajian dampak iklim.


(20)

1.4. Kerangka Pemikiran

Penelitian ini mencakup Studi Literatur terutama tentang data Luaran GCM dan Teknik-Teknik SD luaran GCM dan Permasalahan Statistik dalam pemodelan SD, Pene ntuan Wilayah dan Stasiun Curah Hujan, Penentuan Peubah Luaran GCM, kemudian Pengumpulan Data baik curah hujan maupun luaran GCM, Penentuan Domain GCM, Pre-processing (Reduksi Dimensi) yang kemudian dilakukan Pemodelan SD, Uji Konsistensi berdasarkan model SD yang terbentuk, dan selanjutnya dilakukan Penentuan Daerah Prakiraan Musim berdasarkan pola model penduga. Tahapan penelitian ini tercantum pada Gambar 1.1. Penelitian ini menggunakan data curah hujan lokal dari 32 stasiun di kabupaten Indramayu dan data presipitasi (luaran GCM).

Pemodelan SD menyusun model hubungan fungsional antara luaran GCM dengan curah hujan lokal sehingga model SD memerlukan suatu domain (luasan dan lokasi) GCM yang akan memberikan pendugaan curah hujan yang akurat. Dalam hal ini luaran GCM dalam domain sebagai peubah prediktor yang akan menentukan peubah responnya, yaitu curah hujan lokal. Penentuan domain GCM merupakan langkah pertama dalam penyusunan model SD.

Secara umum data curah hujan bulanan bersifat nonlinear dan tidak berdistribusi yang baku, sedangkan data luaran GCM bersifat curse of dimensionality terutama bila dimensi semakin besar dan multikolinearitas, sehingga langkah kedua dalam pemodelan SD adalah mereduksi dimensi data luaran GCM. Model nonparametrik (soft modeling) dan bersifat data-driven diperlukan untuk mengatasi masalah data curah hujan yang bersifat nonlinear dan tidak berdistribusi yang baku. Metode PPR merupakan salah satu metode yang dapat digunakan untuk mengatasi masalah- masalah tersebut, di mana PPR dapat melakukan reduksi dimensi dan menyusun model regresi yang bersifat nonparametrik dan data-driven.


(21)

Teknik-Teknik Statistical Downscalling Penentuan Peubah-Peubah Data Presipitasi GCM X Data Curah HujanLokal Y

Ana lisis St a t ist ik a Da t a M e t e orologis

Penentuan Wilayah dan Stasiun Curah Hujan Pengumpulan Data Presipitasi Pengumpulan

Data Curah Hujan

Penentuan Domain GCM Studi Literatur Pre-processing (Reduksi Dimensi) 2 Kab. Indramayu (32 stasiun) Presipitasi (Data GCM) Survei Teknik Statistical Downscalling Pemodelan Statistical Downscalling Uji Konsistensi Model Penduga Model SD Penentuan Daerah Prakiraan Musim (DPM) Daerah Prakiraan Musim (DPM) Data Hasil Reduksi Z 3 4 1 Domain GCM 6 5

Gambar 1.1. Tahapan Penelitian

(Nomor pada setiap kotak menunjukkan Tahapan Analisis Statistika)

Pemasalahan lain yang berkaitan dengan pemodelan SD adalah panjang data historis dan periodenya. Panjang data historis juga akan menentukan dugaan model SD. Panjang data historis berapa yang cukup representatif untuk pemodelan SD. Biasanya dalam pendugaan model digunakan panjang data historis lebih dari 30 tahun. Periode data historis yang berbeda nampaknya akan memberikan dugaan model yang berbeda pula, sehingga dalam penelitian ini akan dilakukan uji konsistensi model penduga pada berbagai periode untuk panjang data historis tertentu.

Pene ntuan Daerah Prakiraan Musim (DPM) dilakukan berdasarkan hasil dugaan model SD dengan domain luaran GCM dan panjang data historis yang


(22)

diperoleh pada tahapan sebelumnya. DPM yang terbentuk akan dibandingkan dengan DPM berdasarkan data dasarian (BMG 2003; Nuryadi 2005).

Perkembangan Teknik SD Luaran GCM dan Permasalahan Statistik diuraikan pada Bab 2. Penentuan Domain GCM untuk Penyusunan Model SD diuraikan pada Bab 3. Bab 4 membahas Penggunaan Projection Pursuit untuk Reduksi Dimensi dalam Pemodelan SD, yaitu tentang penggunaan PPR dalam pemodelan SD. PPR dibandingkan dengan PCR pada setiap panjang data historis (35, 30, 25, 20, dan 15 tahun). PPR juga dibandingkan berdasarkan dua domain GCM. Bab 5 membahas Uji Konsistensi Model SD Berbasis Projection Pursuit dalam Prediksi Curah Hujan, yaitu konsistensi pendugaan pada beberapa tahun peramalan. Dua domain GCM pada Bab sebelumnya juga dibandingkan berdasarkan konsistensi model. Untuk kedua domain ini dilakukan pemeriksaan data pencilan dan pembandingan model dengan data tanpa pencilan (yang dikoreksi) dengan model sebelumnya yang menggunakan data yang ada pencilan sehingga diperoleh domain yang relatif tidak sensitif terhadap data pencilan. Bab 6 membahas Penentuan Daerah Prakiraan Musim Berbasis Dugaan Model Regresi Projection Pursuit. Dalam Bab ini dilakukan pewilayahan 32 stasiun curah hujan di kabupaten Indramayu berdasarkan dugaan model dan domain GCM pada Bab 4 dan 5. Pembahasan Umum pada Bab 7 mencakup bahasan-bahasan pada Bab 2, 3, 4, 5, dan 6. Simpulan dan Saran dicantumkan pada Bab 8.


(23)

2.

PERKEMBANGAN TEKNIK

STATISTICAL

DOWNSCALING

DAN PERMASALAHAN STATISTIK

2.1. Pendahuluan

Luaran GCM hanya dapat memberikan informasi untuk skala besar dan belum dapat memberikan secara langsung informasi untuk skala kecil. Pada umumnya GCM hanya menghasilkan informasi tentang sirkulasi atmosfir berskala besar (Sailor & Li 1999). Luaran GCM belum dapat digunakan terutama untuk kawasan tropis dengan topografi dan vegetasi yang heterogen karena GCM belum dapat mempertimbangkan kondisi heterogenitas di kawasan berskala lokal dengan resolusi lebih tinggi daripada resolusi luaran GCM, sehingga diperlukan suatu proses downscaling, yaitu teknik SD. Teknik SD digunakan untuk mendapatkan informasi pada skala lokal berdasarkan luaran GCM yang berskala besar atau resolusi rendah.

Teknik SD membentuk suatu model statistik yang menyatakan hubungan fungsional antara peubah-peubah prediktor (luaran GCM) dengan peubah respon lokal. Model ini berupa fungsi transfer (Sailor et al. 2000; Trigo & Palutikof 2001) yang melakukan transfer informasi dari luaran GCM terhadap peubah lokal sehingga dapat digunakan untuk memprediksi nilai peubah lokal berdasarkan luaran GCM. Prediksi iklim dengan resolusi lebih tinggi ini selanjutnya diperlukan untuk kajian iklim, misalnya untuk keperluan dalam bidang pertanian.

Berbagai Teknik SD telah digunakan terhadap luaran GCM dengan karakteristik, asumsi-asumsi, dan permasalahannya masing- masing. Berbagai upaya telah dilakukan agar karakteristik dan asumsi yang disyaratkan bagi suatu teknik SD sesuai dengan karakteristik data yang akan digunakan (luaran GCM dan curah hujan) dan teknik SD tersebut dapat mengatasi masalahnya. Dalam Bab 2 ini dibahas tentang luaran GCM dan karakteristik nya, pendekatan downscaling, beberapa teknik SD yang selama ini digunakan, dan permasalahan dalam SD.

2.2. Karakteristik Luaran GCM

Studi dampak iklim biasanya menghendaki skenario perubahan iklim regional atau lokal dengan resolusi spasial dan temporal tinggi. Dalam kajian klimatologi jangka panjang GCM mampu menghasilkan ciri sirkulasi global pada


(24)

skala besar atau resolusi rendah dan merupakan sumber informasi primer untuk menilai pengaruh perubahan iklim. GCM merupakan model numerik, deterministik, dan simulasi komputer yang kompleks tentang kondisi iklim dengan berbagai komponennya yang berubah sepanjang waktu. GCM menggambarkan hubungan matematik sejumlah interaksi fisika, kimia, dan dinamika atmosfir bumi. Model ini diakui dan diyakini sebagai model penting dalam upaya memahami iklim di masa lampau, sekarang dan masa yang akan datang.

GCM adalah suatu alat penting dalam studi keragaman iklim dan perubahan iklim (Zorita & Storch 1999). Model ini menggambarkan sejumlah subsistem-subsistem dari iklim di bumi, seperti proses-proses di atmosfir, lautan, dan daratan, dan mampu mensimulasi kondisi-kondisi iklim berskala besar. Misalnya GCM dapat memproduksi dengan baik pola-pola keragaman atmosfir dan temperatur permukaan laut (sea surface temperature atau SST). Namun GCM dirancang tidak untuk menghasilkan informasi penting dengan resolusi lebih tinggi, misalnya untuk temperatur dan curah hujan skala lokal. Walaupun GCM dapat melakukan simulasi dengan baik untuk peubah iklim skala besar, tetapi tidak untuk peubah dengan skala yang lebih kecil (lokal atau regional) (Huth & Kysely 2000). Beberapa alasan mengapa GCM tidak menghasilkan informasi untuk skala lokal, antara lain (Zorita & Storch 1999): (1) Deskripsi solusi spasial tentang struktur permukaan bumi, terutama topografi, tidak jelas; (2) Hidrodinamika atmosfir bersifat nonlinear dan adanya interaksi nonlinear antara grid skala kecil; (3) Terlalu banyak parameter yang tidak mungkin tepat untuk proses-proses pada skala kecil.

Penyempurnaan GCM dilakukan terus untuk mengatasi perbedaan skala, yaitu dengan (1) Meningkatkan kemampuan komputer, terutama untuk resolusi lebih tinggi, sehingga RCM (Regional Circulation Model) atau LAM (Limited Area Model) dari luaran GCM dapat dilakukan; (2) Menerapkan teknik SD. Menurut Fuentes & Heimann (2000) GCM perlu disempurnakan secara terus menerus dan bertahap, meskipun model- model ini masih belum memadai untuk fenomena berskala lebih kecil di kawasan dengan topografi yang kompleks. Oleh


(25)

karena itu GCM tidak dapat digunakan secara langsung untuk studi dampak iklim regional atau lokal.

Beberapa model sirkulasi global yang ada, antara lain GISS (Goddard Institute for Space Studies) dari NASA, GFDL (Geophysical Fluid Dynamic Laboratory) dari NOAA, UKMO (United Kingdom Meteorological Office), CSIRO (Commonwealth Scientific and Industrial Research Organization) dari Australia, dan NCEP (National Centers for Environmental Prediction). Setiap GCM berbeda dalam bentuk resolusi spasial (Tabel 2.1) dan persamaan-persamaan untuk membangkitkan parameter-parameter atmosfir.

Tabel 2.1. Beberapa GCM

No Nama GCM Resolusi Jumlah Lapisan

1 GISS1

4,0º×5,0º 20

2 UKMO2 2,80º×3,75º 19

3 GFDL3 2,8º×2,8º 18

4 CSIRO4 1,875º×1,875º 18

5 NCEP5 2,5º×2,5º 17

6 ECHAM6

2,8125º×2,789º 18

Selama ini GCM telah dikembangkan dan digunakan di Indonesia untuk simulasi, prediksi dan pembuatan skenario iklim. GCM juga telah dimanfaatkan untuk mempelajari variabilitas iklim dan mengkaji dampak perubahan iklim (Ratag 2001; Mole et al. 2001). Siswanto dan Ratag (2001) memprediksi curah hujan dan temperatur permukaan bulanan berbasis GCM CSIRO-9. Prediksinya dilakukan dengan menjalankan model sirkulasi global dari tahun 1949 sampai dengan 1999, menggunakan data pengamatan temperatur permukaan untuk memprediksi curah hujan tahun 2000, dengan kriteria (1) di bawah normal, (2) normal, dan (3) di atas normal.

1

http://www.giss.nasa.gov/tools/modelE [10Januari 2006]

2

http://www.pcmdi.llnl.gov/~/36ukmo_TOC.htm [12 Maret 2006]

3

http://www.pcmdi.llnl.gov/~/17derf.htm [12 Maret 2006]

4 http://www.ioci.org.au [12 Maret 2006]

5 http://www.cdc.noaa.gov/cdc/data.ncep.reanalysis.html [12 Maret 2006]


(26)

Pemodelan SD memerlukan domain GCM yang terdiri dari sejumlah grid dan berada pada suatu lokasi tertentu. Data luaran GCM dalam suatu domain umumnya bersifat curse of dimensionality, yang sering menjadi masalah terutama kalau dimensinya atau domainnnya semakin besar, yaitu jika pemodelan SD melibatkan banyak peubah dan lapisan-lapisan atmosfir. Dalam keadaan ini data bersifat nonlinear dan tidak berdistribusi yang baku, seperti sebaran normal. Masalah lain yang berkaitan dengan data adalah terjadinya korelasi spasial dan/atau multikolinearitas antar peubah. GCM menghasilkan luaran untuk berbagai peubah pada berbagai lapisan atmosfir atau ketinggian. Apabila banyak peubah dan lapisan yang terlibat dalam pemodelan SD maka permasalahan data akan semakin kompleks.

2.3. Teknik Downscaling

GCM beresolusi rendah dan tidak memiliki resolusi lebih kecil dari 100 km2 sehingga model ini tidak akan dapat meresolusikan kejadian-kejadian atau efek-efek berskala meso atau lokal dari keberadaan heterogenitas topografi, vegetasi, dan komposisi tanah (Ratag 2001). Untuk kawasan dengan topografi yang relatif homogen, seperti pada kawasan dengan perubahan ketinggian yang relatif kecil, parameter-parameter skala kecil GCM akan me madai digunakan untuk memprediksi variabilitas dan perubahan lokal. Perubahan iklim yang disimulasi terjadi dalam satu grid kemungkinan besar akan berlaku secara merata pada wilayah-wilayah yang homogen tersebut. Sebaliknya, pada kawasan dengan variasi topografi yang besar sangat dipengaruhi oleh iklim regional, sehingga perlu dilakukan pendekatan downscaling untuk memprediksi peubah lokal. Teknik SD diperlukan untuk menjembatani jenjang antara skala besar GCM dengan skala di kawasan di mana studi dampak ik lim akan dilaksanakan.

Pada pendekatan downscaling suatu model berskala meso dengan resolusi tinggi ditempatkan pada grid-grid GCM dan digunakannya syarat-syarat batas (boundary conditions) hasil prediksi GCM terhadap batas-batas model berskala meso tersebut. Dalam downscaling iklim regional atau lokal berada pada kondisi iklim skala global, dan informasi pada skala kecil ini diperoleh dari skala besar (Storch et al. 2001). Model berskala meso ini, yang beresolusi tinggi dengan


(27)

ukuran grid lebih kecil daripada grid GCM, dapat memperhitungkan topografi lokal, vegetasi, dan jenis tanah, dan mentranslasikan hasil prediksi GCM pada skala lokal. Ada dua jenis pendekatan downscaling yaitu (1) dynamical downscaling dan (2) statistical downscaling. Dynamical downscaling dilakukan dengan cara menetapkan GCM tersarang dengan resolusi spasial yang lebih tinggi, sedangkan SD berdasarkan hubungan fungsional antara prediktor berskala besar dan peubah respon berskala kecil. Pendekatan lainnya adalah statistical-dynamical downscaling yang merupakan gabungan kedua pendekatan sebelumnya.

2.3.1. Pendekatan Dynamical Downscaling

Pendekatan dynamical downscaling menggunakan model berskala lebih kecil daripada skala GCM. Salah satu model meso adalah model area terbatas, yang dikenal dengan LAM. GCM mensimulasi nilai parameter-parameter berskala global, sedangkan LAM mensimulasi nilai parameter berdasarkan nilai- nilai pada grid-grid GCM. Grid-grid LAM berada tersarang pada grid GCM sehingga secara kontinu LAM tergantung kepada GCM. LAM ini dikendalikan oleh GCM dalam batas-batas domainnya. Proses simulasi ini memerlukan komputasi yang intensif dan terus menerus.

DARLAM (Division of Atmospheric Research Limited Area Model) merupakan salah satu model meso melalui pendekatan dynamical downscaling. DARLAM berskala 44 km2 dengan 9 level vertikal yang dikembangkan oleh CSIRO Australia. Model DARLAM dibentuk untuk kawasan Asia Tenggara dan ditempatkan secara tersarang di dalam grid model global ECMWF (European Center for Medium Range Weather Forecast) atau NCEP (National Center for Environmental Prediction). Model lainnya adalah model sirkulasi regional, yang dikenal dengan RCM yang berskala lebih besar dari skala pada LAM tetapi lebih kecil daripada skala pada GCM. Di Indonesia hasil prediksi DARLAM telah digunakan untuk reanalisis curah hujan di 15 stasiun curah hujan (Ratag 2001). Secara umum hasil reanalisis menunjukkan bahwa model DARLAM telah mampu mensimulasi pola umum curah hujan meskipun perbedaan nilai prediksi masih besar.


(28)

2.3.2. Pendekatan Statistical Downscaling

Pendekatan SDmenggunakan data regional atau global untuk memperoleh hubungan fungsional antara skala lokal dengan skala global GCM, seperti model regresi. Pendekatan SD disusun berdasarkan adanya hubungan antara grid skala besar (prediktor) dan grid skala lokal (respon) yang dinyatakan dengan model statistik yang dapat digunakan untuk menterjemahkan anomali-anomali skala global menjadi anomali dari beberapa peubah iklim lokal (Zorita & Storch 1999). Pendekatan ini mencari informasi skala lokal dari skala global melalui hubungan fungsional antara kedua skala tersebut (Storch et al. 2001). Namun untuk keadaan skala global yang sama, keadaan skala lokalnya bisa bervariasi atau adanya regionalisasi. SD menjelaskan hubungan antara skala global dan lokal dengan lebih memperhatikan keakuratan model penduga untuk mempelajari dampak perubahan iklim (Yarnal et al. 2001).

Pendekatan SD memanfaatkan data GCM untuk peramalan iklim lokal (Fuentes & Heimann 2000). Dalam pendekatan ini perlu dilakukan pemilihan peubah-peubah yang akan dijadikan sebagai prediktor dan penentuan domain (lokasi dan jumlah grid), karena kedua hal ini merupakan faktor kritis yang akan mempengaruhi kestabilan peramalan (Wilby & Wigley 2000). Dengan demikian dalam hal peramalan curah hujan, pemilihan peubah prediktor (data GCM) sebaiknya berdasarkan pada adanya korelasi yang kuat antara peubah tersebut dengan curah hujan.

Hasil dari model SD terkait langsung dengan statistik iklim pada waktu sebelumnya dan dapat memberikan hasil ramalan deret waktu yang panjang untuk studi dampak iklim. Model ini juga memerlukan data deret waktu yang homogen dalam berbagai perubahan iklim (Schubert & Henderson-Sellers 1997). Model SD juga akan memberikan hasil yang baik jika ketiga syarat berikut terpenuhi, yaitu (1) Hubungan erat antara respon dengan prediktor yang menjelaskan keragaman iklim lokal dengan baik; (2) Peubah prediktor disimulasi baik oleh GCM, dan (3) Hubungan antara respon dengan prediktor tidak berubah dengan perubahan waktu dan tetap sama meskipun ada perubahan iklim (Busuioc et al. 2001).

Model SD merupakan suatu fungsi transfer (Sailor et al. 2000; Trigo & Palutikof 2001), yang menggambarkan hubungan fungsional sirkulasi atmosfir


(29)

global dengan unsur- unsur iklim lokal. Secara umum bentuk modelnya adalah sebagai berikut:

Y = f(X) (2.1)

di mana: Y(t x p) = peubah-peubah iklim lokal (misal: curah hujan),

X(t x q x s x g) = peubah-peubah luaran GCM (misal: presipitasi),

t = banyaknya waktu (misal: harian, dasarian, atau bulanan), p = banyaknya peubah y,

q = banyaknya peubah x, s = banyaknya lapisan atmosfir, g = banyaknya grid domain GCM.

Model SD tersebut sangat kompleks dan solusi yang baku untuk model ini belum tersedia. Kompleksitas model ini terjadi karena berbagai kemungkinan sebagai berikut:

1) q>1 dan X berkorelasi,

2) q>1 dan pengamatan peubah Y berotokorelasi,

3) q>1, X berkorelasi, dan pengamatan peubah Y berotokorelasi.

Pada umumnya model SD melibatkan data deret waktu (t) dan data spasial GCM (g). Banyaknya peubah y, peubah x, dan lapisan atmosfir dalam model, dan otokorelasi dan kolinearitas pada peubah y maupun pada peubah x menunjukkan tingkat kompleksitas model. Semakin banyak peubah y dan peubah x, semakin kompleks model SD. Dengan demikian dalam penerapan dan pengembangan model SD untuk wilayah Indonesia diperlukan suatu solusi terutama terhadap permasalahan pemodelan me lalui kajian teoritis, verifikasi, validasi dan evaluasi model. Pengembangan ini dapat berupa modifikasi terhadap teknik-teknik SD yang ada.

Selama ini ada berbagai teknik untuk pemodelan SD, antara lain analisis regresi linear berganda dan analisis regresi komponen utama (Huth & Kysely 2000; Mpeloska et al. 2001; Uvo et al. 2001; Lanza et al. 2001; Bergant et al. 2002), analisis korelasi kanonik (Landman & Tennant 2000; Busuioc et al. 2001; Chen D & Chen Y 2002; Fenoglia-Marc 2001), analisis regresi berstruktur pohon (Tree Structure Regression-TSR) (Li & Sailor 2000), Multivariate Additive


(30)

Regression Spline (MARS), Artificial Neural Network (ANN) (Sailor et al. 2000; Dawson & Wilby 2001; Wilby et al. 1998; Cavazos 1999; Mpeloska et al. 2001), metode analog (Zorita & Storch 1999), model rantai Markov (Charles et al. 1999a; Charles et al. 1999b ). Disamping itu ada beberapa metode pre-processing yang digunakan antara lain single value decomposition (SVD), analisis komponen utama. Beberapa metode yang berpotensi untuk pendugaan model SD antara lain model PPR (Projection Pursuit Regression), model aditif terampat (Generalized Additive Model atauGAM), metode Bayes. Pada Tabel 2.2 tercantum, beberapa teknik SD yang pernah digunakan di luar wilayah Indonesia.

Beberapa kajian tentang model SD telah dilakukan untuk data curah hujan di Indonesia, khususnya di kabup aten Indramayu dan data di sekitar area Saguling. Notodiputro et al (2004) mengkaji penggunaan model regresi komponen utama yang dikombinasikan dengan ARIMA. Metode ini diterapkan terhadap data temperatur GCM dan curah hujan di area Saguling. Wigena dan Aunuddin (2004b) menggunakan metode projection pursuit (PP) untuk pre-processing dan PPR dan kombinasi antara PP dan ANN, dan membandingkan kedua metode tersebut dengan kombinasi antara PCA (Principal Component Analysis) dan ANN. Berdasarkan kajian awal tersebut metode PP dan PPR menjadi fokus kajian lebih mendalam dalam penelitian ini.

2.4. Beberapa Teknik Statistical Downscaling

Meskipun GCM dapat digunakan untuk menghasilkan dugaan dengan resolusi yang lebih tinggi, teknik SD luaran GCM masih diperlukan terutama untuk memperoleh informasi dari masing- masing lokasi untuk keperluan studi dampak iklim. Teknik SD merupakan pendekatan alternatif untuk mengatasi kesenjangan skala antara kemampuan sirkulasi iklim dengan GCM dan kebutuhan ekosistem dan model- model sektoral (Giorgi & Mearns 1991 diacu dalam Zorita & Storch 1999). Kim et al. (1984), diacu dalam Huth & Kysely (2000), mulai menggunakan model statistik untuk SD. Teknik ini menjadi populer karena relatif sederhana dan biaya komputasi murah, tidak memerlukan komputasi yang intensif seperti halnya dynamical downscaling (RCM atau LAM).


(31)

Teknik SD masih berkembang terus sesuai dengan tingkat kompleksitasnya. Hal ini sejalan dengan adanya berbagai teknik untuk SD di berbagai tempat terutama di Eropa, Amerika, dan Australia. Bahkan beberapa teknik SD telah diklasifikasikan dan dibandingkan berdasarkan kompleksitas secara teknis dan keakuratan pendugaan (Wilby & Wigley 1997; Zorita & Storch 1999; Sailor & Li 1999). Namun teknik-teknik ini belum diterapkan di kawasan tropis seperti Indonesia.

Perkembangan teknik-teknik SD tercantum pada Tabel 2.2, berdasarkan kepustakaan yang ada sampai tahun 2005. Perkembangan ini mulai dari penggunaan MOS (Model Output Statistics) untuk SD oleh Klein (1982), diacu dalam Sailor & Li (1999), sampai dengan teknik-teknik yang linear seperti Empirical Orthogonal Function (EOF) atau PCAdan nonlinear seperti ANN.

Pada umumnya teknik SD yang banyak digunakan adalah teknik SD berbasis model regresi linear, seperti MOS, Perfect Prognosis, PCA, CCA, regresi polinomial, regresi bertatar. Tetapi yang paling banyak digunakan adalah regresi dengan PCA, yang sering disebut PCR. Dalam hal ini PCA digunakan sebagai metode pereduksian dimensi karena adanya masalah multikolinearitas. Demikian juga penggunaan SVD oleh Uvo et al. (2001). Teknik SD berbasis model nonlinear dan nonparametrik yang digunakan adalah ANN dan MARS. ANN digunakan antara lain oleh Zorita & Storch (1999), Trigo & Palutikof (1999), Cavazos (1999), dan Sailor et al. (2000). MARS digunakan sebagai teknik SD oleh Corte-Real et al. (1996), diacu dalam Li &Sailor (2000). Teknik CART atau TSR berbasis klasifikasi dan bersifat linear yang digunakan oleh Zorita & Storch (1999) dan Li & Sailor (2000). Charles et al. (1999b) memperkenalkan penggunaan metode rantai Markov untuk teknik SD.


(32)

Tabel 2.2. Beberapa Teknik Statistical Downscaling

Teknik SD Peubah Lokal Peubah Prediktor GCM Kepustakaan

MOS Peubah cuaca permukaan Peubah atmosfir bebas (NWP) Glahn & Lowry (1972)2

MOS dan Perfect

Prognosis Peubah cuaca permukaan Peubah atmosfir bebas (NWP) Klein (1982)

2

Weather Generator Curah hujan harian * UKTR Goodes & Palutikof (1978)1

PCA dan CCA Curah hujan musiman * ECHAM-1 Storch et al.(1993)1

Regresi Polinomial Temperatur Sea surface temperature

(SST)

GISS Hewitson (1994)

Regresi ganda bertatar Temperatur permukaan Peubah atmosfir bebas CCC Winkler et al. (1995)2

PCA dan MARS Curah hujan bulanan * UKTR Corte-Real et al. (1996)1

PCA dan Analog Curah hujan harian * ECHAM-1 Cubasch et al. (1996)1

Cluster dan PCA Curah hujan harian * HadCM2 Corte-Real et al. (1997)1

PCA, CCA, Analog & ANN

Curah hujan harian dan bulanan

Sea level pressure (SLP) ECHAM-3 Zorita & Storch (1999)

ANN Temperatur maksimum

dan minimum harian

* HadCM3 Trigo & Palutikof (1999)1

ANN Curah hujan harian Humidity Cavazos (1999)

Keterangan:

1). diacu dalam Trigo & Palutikof (2001)

2). diacu dalam Sailor & Li (1999)


(33)

Tabel 2.2. (Lanjutan)

Teknik SD Peubah Lokal Peubah Prediktor GCM Kepustakaan

CART Curah hujan harian SLP ECHAM-3 Zorita & Storch (1999)

NHMM Curah hujan harian Moisture, SLP CSIRO-9 Charles et al. (1999a)

Charles et al. (1999b)

PCA dan CCA Curah hujan musiman * Had CM3 Gonzales-Ronco (2000)1

ANN dan MOS Kecepatan angin harian SST, Humidity, SLP,

Geopotential height

NCAR Sailor et al. (2000)

PCA dan Regresi berganda

Curah hujan bulanan; temperatur bulanan

Geopotential height, Geopotential thickness

ECHAM-3 Huth & Kysely (2000)

TSR Curah hujan harian Humidity, SLP, Wind speed NCAR Li & Sailor (2000)

CCA Curah hujan regional SST NCEP Landman & Tenant (2000)

SVD dan Regresi linear Curah hujan rata-rata Precipitable water, Wind speed

Uvo et al. (2001)

CCA Curah hujan musiman SLP HadCH2 Busuioc et al. (2001)

PCA Jumlah hari waktu

pembungaan Dandelion

SST NCEP/NCAR

HadCM-3 ECHAM-4

Bergant et al (2002)

CCA dan PCA Temperatur Geopotential height, NCEP/NCAR Chen D & Chen Y (2002)

PCA dan Regresi linear; Analog

Temperatur harian; Curah hujan musiman

SST, SLP ERA-40 Fernandez (2005)

Keterangan:

1). diacu dalam Trigo & Palutikof (2001)

2). diacu dalam Sailor & Li (1999)


(34)

Teknik SD berawal dari metode numerical weather prediction (NWP) (Wilks 1995) dari National Weather Services (NWS) yang digunakan untuk peramalan curah hujan. Teknik SD yang pernah digunakan adalah Perfect Prognosis dan MOS oleh Klein (1982), diacu dalam Sailor & Li (1999). MOS lebih banyak digunakan untuk peramalan jangka menengah daripada Perfect Prognosis yang sering digunakan untuk jangka pendek. MOS, yang termasuk teknik prediksi cuaca tradisional, sebelumnya mulai diperkenalkan penggunaannya untuk prediksi peubah cuaca dari luaran suatu model numerik oleh Glahn & Lowry (1972), diacu dalam Sailor et al. (2000). Teknik MOS menentukan suatu hubungan statistik antara hasil ramalan model prediksi numerik dan suatu peubah respon (Bocchieri & Glahn 1972). Dalam prosesnya prosedur MOS terdiri dari dua tahap, yaitu (1) Membuat hubungan empirik antara peubah cuaca lokal aktual sebagai respon dan peubah prediktor berskala besar; (2) Menerapkan hubungan ini, berupa persamaan regresi, terhadap peubah dari luaran model prediksi cuaca berskala besar. Pada dasarnya MOS ini berbasis model regresi linear.

Metode Analog merupakan alternatif teknik SD luaran GCM. Metode ini termasuk teknik prediksi cuaca tradisional juga seperti MOS dan Perfect Prognosis. Pada dasarnya dalam metode ini luaran GCM dibandingkan dengan data pengamatan historisnya. Pola luaran GCM yang paling sesuai digunakan sebagai analoginya dari data pengamatan. Selanjutnya secara simultan pola luaran GCM tersebut diasosiasikan dengan peubah cuaca lokal aktual.

Metode Analog memerlukan data historis yang cukup panjang untuk memperoleh analogi yang memadai. Metode ini lebih cocok untuk kawasan dengan topografi yang relatif homogen dan akan memberikan hasil yang kurang baik untuk kawasan dengan topografi yang kompleks (Zorita & Storch 1999). Pada umumnya metode ini tidak digunakan untuk memprediksi, tetapi sebagai suatu cara untuk menspesifikasi kondisi cuaca lokal yang bersesuaian dengan pola luaran GCM.

Pada awalnya metode Analog pernah diterapkan pertama kali dalam peramalan cuaca dan prediksi jangka pendek masing- masing oleh Lorenz pada tahun 1969 dan kemudian oleh Barnett & Palutikof pada tahun 1978 (Zorita &


(35)

Storch 1999). Metode ini merupakan metode yang sederhana, namun jarang digunakan sebagai teknik SD (Zorita et al. 1995; Biau et al. 1999). Zorita & Storch (1999) dan Fernandez (2005) menggunakan kombinasi EOF atau PCA dengan metode Analog. EOF ini digunakan untuk mengatasi masalah multikolinearitas dalam data luaran GCM.

Model lain yang paling banyak digunakan sebagai teknik SD adalah model regresi linear mulai dari yang sederhana sampai regresi linear berganda, baik model parametrik maupun nonparametrik. Pada dasarnya model ini membuat hubungan fungsional antara luaran GCM dengan peubah iklim lokal. Model regresi ini telah digunakan untuk SD dan khusus diterapkan untuk menilai perubahan iklim oleh Kim et al (1984), diacu dalam Wilby & Wigley (1997). Hewitson (1994) menggunakan model ini dengan fungsi polinomial untuk hubungan antara luaran GCM dengan temperatur permukaan. Winkler et al (1995), diacu dalam Sailor & Li (1999), menggunakan model regresi bertatar (stepwise).

Pendekatan model regresi umumnya mene ntukan hubungan linear atau nonlinear antara peubah lokal dengan peubah prediktornya yang berskala global. Hubungan nonlinear umumnya diimplementasi dengan jaringan syaraf tiruan (ANN). Teknik ini dapat menghasilkan model nonlinear antara peubah lokal dan peubah luaran GCM. Cavazos (1999) dan Cavazos & Hewitson (2002) telah menggunakan ANN untuk memperoleh model SD antara SLP (tekanan permukaan laut), geopotential height, dan kelembaban dengan curah hujan harian. Trigo & Palutikof (2001) menerapkan ANN baik untuk model linear maupun nonlinear dengan menggunakan data luaran GCM HadCM2 sebagai prediktor dan curah hujan di Iberia sebagai peubah respon.

Teknik-teknik SD yang lebih kompleks antara lain CCA, MARS, CART atau TSR. Teknik SD dengan CCA menentukan hubungan dua gugus peubah X dan Y dan menghasilkan sejumlah pasangan pola hubungan yang bekorelasi optimal antara keduanya. CCA telah digunakan oleh Storch et al. (1997), diacu dalam Zorita & Storch (1999), Zorita & Storch (1999), Gonzales-Ronco (2000), diacu dalam Trigo & Palutikof (2001), Landman & Tenant (2000), Busuioc et al. (2001). MARS adalah model regresi spline aditif berganda yang bersifat nonlinear


(36)

dan nonparametrik di mana pendugaan modelnya berdasarkan fungsi spline. MARS ini telah digunakan oleh Corte-Real et al (1996), diacu dalam Li &Sailor (2000), untuk pendugaan curah hujan bulanan berdasarkan luaran GCM UKTR (United Kingdom Meteorological Transient). CART atau TSR merupakan gabungan antara klasifikasi dan regresi. Dalam proses pendugaannya teknik ini melakukan pengelompokan biner berdasarkan kriteria tertentu sampai kriteria optimal tercapai. Pada akhir pengelompokan dilakukan pendugaan berdasarkan model regresi tertentu untuk setiap kelompok.

Di samping itu ada teknik SD yang menggunakan metode rantai Markov terutama untuk klasisfikasi cuaca yang bersifat diskrit. Charles et al. (1999a; 1999b) telah menerapkan model rantai Markov, yang disebut Nonhomogenuous Hidden Markov Model (NHMM), untuk memprediksi curah hujan harian berdasarkan luaran GCM (SLP) CSIRO 9. NHMM ini berdasarkan proses stokastik ganda di mana proses-proses yang ‘tersembunyi’ (hidden atau unobserved) hanya dapat diketahui melalui sejumlah proses stokastik lainnya yang dapat menghasilkan sekuen data pengamatan. Dalam NHMM didefinisikan adanya hubungan bersyarat stokastik antara pola kejadian curah hujan harian aktual dengan sejumlah keadaan cuaca yang tersembunyi.

Ada beberapa teknik SD yang merupakan kombinasi dari dua metode, antara lain Huth & Kysely (2000) menggunakan regresi linear ganda dengan PCA untuk memprediksi total curah hujan dan temperatur rata-rata bulanan berdasarkan SST luaran GCM ECHAM-3 di Republik Cekoslovakia; Uvo et al. (2001) mengembangkan model regresi linear berdasarkan dekomposisi nilai singular (SVD) untuk pendugaan curah hujan rata-rata dengan basis 12 jam di pulau Kyushu Jepang. Sailor et al. (2000) mengkombinasikan ANN dengan MOS untuk data luaran GCM NCAR (National Centre for Atmospheric Research) untuk memprediksi kecepatan angin permukaan harian. Chen D & Chen Y (2002) menggunakan CCA dan PCA untuk peramalan temperatur berdasarkan luaran GCM NCEP/NCAR.

Secara umum teknik-teknik SD banyak digunakan untuk memprediksi curah hujan harian, bulanan, maupun musiman, dan temperatur. Teknik SD tidak hanya dapat digunakan untuk memprediksi peubah iklim lokal, tetapi juga peubah


(37)

respon lainnya, antara lain populasi zooplankton di Belanda dan polusi udara di London (Wilby et al. 2004). Bergant et al (2002) memprediksi jumlah hari untuk mulai pembungaan tanaman Dandelion berdasarkan temperatur (luaran GCM). Peubah prediktor yang sering digunakan adalah SST (Sea Surface Temperature), SLP (Sea Level Pressure), Geopotential height, Humidity. Peubah prediktor lainnya yang digunakan, antara lain Wind speed, Precipitable water, Presipitasi.

2.5. Kategori Teknik Statistical Downscaling

Teknik-teknik SD pada Tabel 2.2 dapat dikelompokkan menjadi lima kategori seperti tercantum pada Tabel 2.3. Kategori ini berdasarkan teknik berbasis Regresi atau Klasifikasi, teknik dengan model Linear atau model Nonlinear, teknik dengan model Parametrik atau model Nonparametrik, teknik berbasis Proyeksi atau Seleksi, dan teknik berbasis model-driven atau data-driven. Sailor & Li (1999) mengemukakan bahwa ada dua kelompok teknik SD, yaitu (1) Teknik SD berbasis Regresi; dan (2) Teknik SD berbasis Klasifikasi tipe cuaca. Kelompok teknik pertama baik digunakan untuk memprediksi peubah lokal yang bersifat kontinu berdasarkan waktu, sedangkan kelompok teknik kedua dapat digunakan baik untuk peubah lokal yang kontinu maupun diskrit. Zorita & Storch (1999) mengklasifikasikan teknik-teknik SD menjadi tiga kategori, yaitu (1) Teknik SD berbasis model linear; (2) Teknik SD berbasis model nonlinear; dan (3) Teknik SD berbasis klasifikasi tipe cuaca.

Suatu teknik SD bisa termasuk ke dalam kombinasi kelima kategori. PCR termasuk kategori metode berbasis regresi, linear, parametrik, berbasis proyeksi, dan model-driven. PCR adalah suatu metode pemodelan regresi berdasarkan PCA, di mana PCA melakukan pereduksian dimensi atau melakukan proyeksi peubah-peubah awal berdimensi besar menjadi sejumlah peubah-peubah baru yang berdimensi lebih kecil, yang disebut komponen utama. Model regresi dibentuk berdasarkan peubah-peubah baru sebagai prediktor. Modelnya sudah ditentukan sejak awal (model-driven), bersifat linear, dan parametrik yang ketat asumsi. Pendugaan model dilakukan dengan metode kuadrat terkecil.


(38)

Tabel 2.3. Kategori Teknik-Teknik Statistical Downscaling

No Kategori Teknik-Teknik SD

a. Berbasis Regresi MOS, Perfect Prognosis, Analog, PCR, CCA, MARS, Regresi bertatar, ANN, [PPR]

1

b. Berbasis Klasifikasi CART (TSR), NHMM

a. Model Linear MOS, Perfect Prognosis, Analog, Regresi bertatar, PCR, CCA, CART (TSR) 2

b. Model Nonlinear ANN, MARS, [PPR]

a. Model Parametrik MOS, Regresi bertatar, PCR, CCA, CART (TSR)

3

b. Model Nonparametrik ANN, MARS, [PPR] a. Berbasis Proyeksi PCR, [PPR]

4

b. Berbasis Seleksi CART (TSR), Regresi Bertatar

a. Model driven MOS, PCR, CCA, Regresi Bertatar, ANN 5

b. Data driven MARS, CART (TSR), [PPR]

Keterangan: [PPR] belum digunakan dalam SD

Berbeda dengan PCR, MARS berbasis regresi, nonlinear, nonparametrik yang tidak memerlukan asumsi yang ketat (soft modeling), dan data-driven. Dalam metode ini pendugaan model regresi menggunakan fungsi spline berdasarkan kondisi data, tanpa model yang baku dan spesifik. Teknik SD lainnya yang berbasis regresi, nonlinear, nonparametrik dan model-driven adalah ANN.

Model regresi bertatar termasuk kategori teknik berbasis regresi, linear, parame trik, berbasis seleksi, dan model-driven. Dalam teknik ini dilakukan proses seleksi peubah prediktor yang memenuhi syarat masuk ke dalam model. CART atau TSR termasuk teknik SD berbasis klasifikasi di mana dalam prosesnya teknik ini melakukan penge lompokan secara bertahap, bersifat linear, parametrik, berbasis seleksi, dan data-driven.

Model PPR termasuk kategori model berbasis regresi nonlinear, nonparametrik, berbasis proyeksi, dan data-driven, serta tidak mempunyai bentuk model yang baku dan tidak ketat asumsi atau tidak memerlukan asumsi seperti halnya pada model regresi parametrik. Teknik ini tidak menghasilkan bentuk model penduga, tetapi dapat memberikan hasil pendugaannya. Serupa dengan PCR, PPR melakukan pendugaan model yang diawali dengan pereduksian dimensi peubah asal menjadi peubah baru berdimensi lebih kecil dari dimensi asal, sehingga PPR termasuk kategori model regresi berbasis proyeksi. Dalam


(39)

proses pendugaan modelnya, teknik ini menggunakan fungsi kernel atau spline serupa dengan pada teknik MARS, yang membiarkan model PPR mengikuti keadaan datanya, sehingga PPR termasuk ke dalam kategori model berbasis data-driven.

2.6. Permasalahan Dalam Teknik Statistical Downscaling

Pemodelan SD diawali dengan penyusunan hubungan fungsional antara peubah atmosfir skala global dengan peubah skala lokal. Pemodelan ini memerlukan asumsi-asumsi dan prosedurnya. Prosedur-prosedurnya mencakup pemilihan peubah lokal sebagai peubah respon (y), pemilihan peubah global sebagai peubah prediktor (X) dan domain GCM, dan penentuan model dan metode pendugaannya.

Beberapa asumsi diperlukan dalam penggunaan model statistik untuk teknik SD. Asumsi penting untuk menilai dampak iklim dengan pendekatan statistik adalah adanya hubungan antara sirkulasi atmosfir skala besar dan iklim lokal yang tidak berubah dengan terjadinya perubahan iklim, meskipun tidak ada jaminan demikian (Zorita & Storch 1999). Namun jika data pengamatan historis (record length) untuk pemodelan cukup panjang, maka data tersebut dapat diasumsikan mengandung informasi penting tentang kondisi iklim yang berbeda atau adanya perubahan iklim. Hal ini berguna untuk menilai iklim lokal dengan memanfaatkan model statistik yang dapat mengidentifikasi informasi tersebut dalam data historis, dan dapat menduga kemungkinan dampaknya terhadap iklim lokal. Keadaan ini akan valid jika keragaman di masa lampau sama dengan keragaman pada saat sekarang dan masa datang. Tetapi kenyataannya bahwa model yang dapat memberikan hasil yang baik untuk masa lampau belum tentu berimplikasi bahwa model tersebut dapat digunakan dengan baik pula untuk kondisi yang akan datang, bahkan ada kemungkinan model itu sudah tidak berlaku lagi karena adanya perubahan keragaman, apalagi kalau ada kejadian ekstrim.

Sehubungan dengan teknik SD ini, Zorita et al (1995) mengemukakan tiga asumsi, yaitu (1) GCM dapat memprediksi peubah atmosfir berskala besar yang lebih realistis daripada memprediksi peubah iklim lokal; (2) Hubungan antara peubah skala besar dan lokal tidak berubah dengan adanya perubahan


(40)

iklim; dan (3) Prosedur statistik tidak hanya menghasilkan suatu replika data historis tetapi juga makna pengaruh setiap peubah dan hubungannya secara fisik terhadap peubah lokal. Yarnal et al (2001) menyatakan bahwa salah satu asumsi dalam pemodelan SD adalah kestabilan hubungan antara peubah luaran GCM dengan peubah lokal, di mana hubungan ini tidak tergantung waktu (time invariant). Namun hubungan ini umumnya tidak stabil, terutama kalau banyak peubah yang terlibat dalam penyusunan model dan untuk jangka panjang.

Cavazos (1999) menyebutkan asumsi-asumsi dalam pemodelan linear, yaitu (1) Kelinearan; (2) Kenormalan; dan (3) Tidak ada multikolinearitas. Dengan asumsi kelinearan, model SD harus bersifat linear. Model ini memerlukan asumsi kenormalan, di mana suatu model tidak dapat digunakan secara langsung bila peubah lokal tidak menyebar normal, terutama untuk model paramterik. Pada umumnya peubah lokal tidak menyebar normal, misalnya curah hujan. Luaran GCM menyebar normal selama sirkulasi atmosfir skala besar menyebar normal, tetapi secara umum kenyataannya tidak normal (Cavazos 1999). Multikolinearitas adalah suatu keadaan di mana peubah-peubah prediktor dalam model saling berkorelasi tinggi. Keadaan ini akan menjadi masalah dalam penduga model yang berbias dan overestimate.

Pada dasarnya model SD adalah model regresi yang melibatkan pemodelan suatu fungsi antara satu atau lebih peubah prediktor dan satu atau lebih peubah respon, yaitu pendugaan f(X). Bentuk umum model SD pada persamaan (2.1) terdiri dari peubah respon Y(t x p) dan peubah prediktor X(t x q x s x g) . Bila

fungsi f(X) diketahui, maka pendugaannya dapat dilakukan dengan baik. Tetapi pada kenyataannya bentuk fungsi ini sering tidak diketahui dan model yang tidak tepat akan memberikan hasil dugaan yang tidak tepat pula (Friedman & Stuetzle 1981). Bila bentuk fungsi tidak diketahui dan hanya melibatkan satu peubah prediktor, maka f(X) dapat dimodelkan dengan pemulusan linear seperti spline atau kernel. Untuk jumlah peubah prediktor yang lebih banyak, metode pemulusan linear akan bermasalah karena data prediktor bersifat curse of dimensionality di mana ukuran ruang peubah prediktor bertambah besar secara eksponensial sesuai dengan bertambahnya jumlah peubah prediktor. Hal ini akan


(41)

menimbulkan masalah dalam pendugaan f(X) apabila tidak didukung dengan jumlah data yang besar.

Tahap awal dalam SD adalah pemilihan peubah lokal dan lokasi target pendugaan, sehubungan dengan peubah respon pada model SD. Peubah ini harus terukur dan berhubungan dengan sirkulasi global. Pada umumnya temperatur banyak digunakan dalam studi SD. Temperatur bersifat kontinu dan berdistribusi normal. Di samping itu curah hujan juga sering digunakan. Curah hujan berdistribusi skewed dengan nilai minimum nol dan berhubungan dengan proses-proses yang terjadi pada skala lokal sehingga sukar untuk proses-proses downscaling (Yarnal et al. 2001).

Setelah peubah respon terpilih, tahap berikutnya adalah memilih peubah prediktor dan domainnya. Peubah prediktor mempengaruhi lingkungan pada tingkat permukaan dan dapat disimulasi secara akurat oleh GCM (Yarnal et al. 2001). Peubah GCM yang sering digunakan adalah SLP, geopotential height, moisture, humidity, dew point temperature, vorticity, dan presipitasi. Presipitasi pernah digunakan sebagai prediktor oleh Venugopal et al (1999), diacu dalam (Yarnal et al. 2001), dan Semenov & Barrow (1996), Palutikof & Wigley (1995), dan Wilks (1999), diacu dalam Giorgi & Hewitson (2001). Presipitasi bulanan luaran GCM merupakan salah satu peubah prediktor yang berpotensi digunakan dalam pemodelan SD (BIOCLIM 2004).

Peubah respon juga bersifat temporal sehingga kemungkinan ada masalah otokorelasi. Jika peubah respon lebih dari satu, maka masalah multikolinearitas mungkin terjadi dalam peubah respon. Permasalahan lain yang mungkin terjadi pada peubah respon adalah kondisi kawasan di mana lokasi target pendugaan akan dilakukan, terutama berkaitan dengan kehomogenan topografi dan vegetasi di wilayah target di kawasan tropis seperti Indonesia. Wilayah yang heterogen memerlukan teknik SD yang dapat digunakan dengan skala ‘titik’ (point scale), yaitu khusus untuk suatu lokasi tertentu, tidak berlaku untuk wilayah sekitarnya yang lebih luas. Untuk wilayah target yang lebih homogen, teknik SD dapat digunakan untuk pendugaan target yang lebih luas. Kejadian ekstrim pada peubah respon juga akan merupakan masalah dalam pendugaan model SD. Kejadian ini akan menjadi data pencilan yang mungkin akan mengganggu pendugaan model


(42)

SD, sehingga teknik SD harus bersifat kekar (robust) terhadap kejadian ekstrim atau pencilan.

Peubah prediktor bersifat spasial (g) dan temporal (t) sedangkan peubah respon bersifat temporal (t) di mana peubah ini berupa deret waktu. Kedua jenis peubah ini mempunyai permasalahannya masing- masing, di samping masalah curse of dimensionality terutama pada peubah prediktor. Peubah prediktor adalah data luaran GCM yang tergantung pada luasan dan lokasi domain GCM yang bersifat spasial sehingga kemungkinan adanya korelasi spasial antar grid dalam domain. Keadaan ini menunjukkan kemungkinan adanya masalah multikolinearitas antar grid. Demikian juga jika model melibatkan lebih dari satu prediktor dan lebih dari satu lapisan atmosfir, yang kemungkinan ada korelasi antara peubah prediktor. Di samping bersifat spasial, prediktor ini bersifat temporal sehingga kemungkinan ada masalah otokorelasi.

Secara umum permasalahan dalam pemodelan SD adalah sebagai berikut: (1) Luasan dan lokasi domain GCM, yaitu jumlah grid dalam domain dan lokasi

domain di mana peubah prediktornya berkorelasi tinggi dengan peubah respon.

(2) Peubah prediktor (luaran GCM) yang bersifat curse of dimensionality, nonlinear, non Gaussian, bahkan tidak mengikuti sebaran statistik yang baku, dan multikolinearitas.

(3) Peubah respon juga bersifat nonlinear, non Gaussian, bahkan tidak mengikuti sebaran statistik yang baku.

(4) Panjang data historis, di mana umumnya teknik SD memerlukan data historis yang relatif panjang.

(5) Data peubah respon yang ekstrim atau pencilan.

2.7. Simpulan

1). Penggunaan suatu teknik SD perlu memperhatikan permasalahan yang ada. Teknik-teknik SD yang ada sudah memberikan hasil yang cukup akurat dengan berbagai asumsi dan kendala tertentu. Pada kenyataannya teknik SD masih terus berkembang dan mencoba untuk mengantisipasi permasalahan yang ada sehingga dapat memberikan hasil dugaan dengan


(43)

kesalahan yang relatif kecil. Teknik-teknik SD berbasis regresi nonlinear, nonparametrik, proyeksi atau seleksi, dan data-driven akan menjadi pilihan yang lebih tepat untuk data iklim, antara lain metode PPR.

2). Pemilihan domain GCM yang berhubungan kuat dengan peubah responnya masih merupakan masalah dalam SD. Peubah prediktornya bersifat curse of dimensionality dan peubah respon umumnya bersifat nonlinear dan tidak menyebar menurut sebaran yang baku (tidak normal), sehingga diperlukan teknik SD berbasis regresi nonlinear, nonparametrik, proyeksi atau seleksi, dan data-driven. Masalah lainnya berkaitan dengan kestabilan model hubungan peubah prediktor dengan peubah respon dari waktu ke waktu atau bahwa apakah model tersebut time invariant. Meskipun tidak sering menjadi kendala, panjang data historis dan data peubah respon yang ekstrim (mungkin berupa data pencilan) juga dapat mempengaruhi hasil pendugaan model SD.


(44)

3.

PENENTUAN DOMAIN GCM DALAM PENYUSUNAN

MODEL

STATISTICAL DOWNSCALING

3.1. Pendahuluan

Domain GCM berperan penting dalam pemodelan SD. Data pada domain ini dijadikan sebagai faktor yang menentukan pendugaan dalam pemodelan SD. Pemodelan SD menghubungkan data luaran GCM pada domain tertentu yang berskala global dengan data yang berskala lebih kecil atau skala lokal. Pemilihan domain GCM akan menentukan hasil peramalan dan merupakan faktor kritis dalam pemodelan SD (Wilby & Wigley 2000). Ketepatan pemilihan domain, baik luasan maupun lokasinya, akan menghasilkan pendugaan curah hujan yang lebih akurat. Dengan demikian diperlukan suatu metode untuk memperoleh domain optimum.

Selama ini belum ada suatu metode yang dapat digunakan untuk pemilihan domain GCM. Pada umumnya domain ditetapkan secara apriori yaitu berupa persegi (atau bujur sangkar) mencakup lokasi pendugaan. Dalam penelitiannya tentang teknik SD, Bergant et al (2002) menyarankan domain minimum seluas 8×8 grid dengan posisi tepat di atas lokasi target pendugaan. Fernandez (2005) membandingkan tiga domain untuk peramalan rata-rata temperatur harian dan rata-rata curah hujan di sekitar Eropa. Ketiga domain tersebut adalah (1) domain besar (30oLU-75oLS dan 30oBB-40oBT), (2) domain sedang yaitu seperempat dari domain besar atau seluas 22,5o lintang dan 35o bujur, dan (3) domain kecil seluas 10o lintang dan 20o bujur. Hasil kajiannya menunjukkan bahwa perbedaan luasan ketiga domain kurang berpengaruh terhadap hasil peramalan.

Secara umum dalam pemodelan SD antara peubah respon dan peubah prediktor harus berkorelasi kuat. Busuioc et al (2000) menyatakan bahwa salah satu syarat dalam pemodelan SD adalah adanya hubungan erat antara respon dengan prediktor. Hal ini dapat menjadi pertimbangan dalam penentuan domain GCM. Domain dipilih berdasarkan nilai korelasi tinggi sehingga domain terpilih terdiri dari grid-grid dengan data yang berkorelsi tinggi dengan data peubah respon. Wigena & Aunuddin (2004a) menggunakan domain yang tidak contiguous, yaitu sebagian di sebelah utara dan sebagian di sebelah selatan lokasi


(45)

target pendugaan, di mana grid-grid dalam domain tersebut berkorelasi tinggi dengan curah hujan di lokasi target. Wigena et al (2005) menentukan domain GCM dengan teknik variogram. Teknik ini digunakan untuk menentukan luasan domain sedangkan lokasinya ditentukan berdasarkan nilai korelasi tinggi suatu grid dengan curah hujan di lokasi target. Namun teknik ini memerlukan area dasar atau awal untuk penentuan variogram, misalnya wilayah Indonesia (6oLU-11oLS dan 95oBT-141oBT). Hasil pendugaan dengan PCR menunjukkan bahwa domain denga n variogram memberikan hasil (r=0.78; RMSEP=98) lebih baik daripada domain 8×8 grid tepat di atas lokasi target (r=0.60; RMSEP=119). Dalam Bab ini dibahas tentang kajian berbagai domain GCM. Kajian ini bertujuan untuk memperoleh domain yang dapat digunakan untuk penyusunan model SD.

3.2. Bahan dan Metode

3.2.1. Bahan

Data GCM yang digunakan adalah presipitasi tahun 1966 sampai dengan 2001, yang diperoleh dari ECHAM, dengan wilayah 50oLU-40oLS dan 50o -185oBT, yang mencakup wilayah Indonesia (6oLU-11oLS dan 95o-141oBT). Penelitian ini juga menggunakan data curah hujan di stasiun Sukadana kabupaten Indramayu, dengan panjang data historis 35 tahun (tahun 1966 sampai dengan 2001).

3.2.2. Metode

Penentuan domain dilakukan berdasarkan (1) domain berbentuk segi bujur sangkar (Berga nt et al. 2002), dan (2) nilai korelasi tinggi (=0.6) antara sejumlah grid dalam domain dengan curah hujan di stasiun Sukadana. Domain-domain berbentuk segi bujur sangkar yang digunakan berlokasi tepat di atas wilayah kabupaten Indramayu dengan berbagai uk uran (Gambar 3.1), yaitu: (1) 8×8 grid (Segi8), (2) 10×10 grid (Segi10), (3) 12×12 grid (Segi12), (4) 14×14 grid (Segi14), dan (5) 16×16 grid (Segi16). Sedangkan domain-domain yang berdasarkan korelasi antara grid- gird dalam wilayah 50oLU-40oLS dan 50o-185oBT dengan lokasi target pendugaan, yaitu atb1t88 (besar), atb2t88 (sedang), dan atb3t88 (kecil), seperti tercantum pada Gambar 3.2. Ketiga domain ini masing- masing


(1)

89

Lampiran 1. Daftar Istilah

ARIMA

Autoregressive Integrate Moving Average

ANN

Artificial Neural Network

CART

Classification and Regression Tree

CCA

Canonical Correlation Analysis

CCC

Canadian Climate Center

CSIRO

Commonwealth Scientific and Industrial Research

Organization

DARLAM

Division of Atmospheric Research Limited Area Model

DPM

Daerah Prakiraan Musim

DPM_BMG DPM hasil pewilayahan olen BMG (2003)

DPM_PPR

DPM hasil pewilayahan dengan model PPR

GCM

General Circulation Model

GFDL

Geophysical Fluid Dynamic Laboratory

GISS

Goddard Institute for Space Studies

LAM

Limited Area Model

MARS

Multivariate Additive Regression Spline

MOS

Model Output Statistics

NCAR

National Centre for Atmospheric Research

NCEP

National Centers for Environmental Prediction

NHMM

Non Homogenuous Hidden Markov Model

NWP

Numerical Weather Prediction

NWS

National Weather Services

PCA

Principal Component Analysis

PCR

Principal Component Regression

PP

Projection Pursuit

PPR

Projection Pursuit Regression

RCM

Regional Circulation Model

RMSEP

Root Mean Square Error of Prediction

TSR

Tree Structure Regression

UKMO

United Kingdom Meteorological Office

UKTR

United Kingdom Meteorological Transient

SD

Statistical Downscaling

SLP

Sea Level Pressure

SST

Sea Surface Temperature

STD

Standard Deviation


(2)

90

Lampiran 2.

Elevasi dan Koordinat Setiap Stasiun di Kabupaten Indramayu

No Stasiun Nama Stasiun Elevasi(mdpl) LS BT

1a Bugel 1 6,299 107,985

10 Indramayu 6 6,345 108,322

10a Cidempet 7 6,352 108,247

1 Anjatan 1 6,355 107,954

1c Tulangkacang 1 6,357 107,006

4 Bulak/Kandanghaur 2 6,363 108,113

11 Bangkir 11 6,385 108,291

2a Bugis 7 6,389 107,932

17 Karangasem 24 6,395 107,054

23a Sudimampir 4 6,402 108,366

7 Losarang 2 6,405 108,149

12 Lohbener 11 6,406 108,282

16 Wanguk 1 6,416 107,957

15 Luwungsemut 8 6,427 107,009

9a Tugu * 6,433 108,333

23b Juntinyuat 5 6,433 108,438

5 Gabuswetan 8 6,445 107,039

13b Jatibarang 3 6,456 108,307

23 Ujungaris 12 6,457 108,287

8 Cikedung * 6,467 108,167

13a Sudikampiran 7 6,482 108,364

29 Temiyang 26 6,487 107,021

18b Cipancuh 8 6,488 107,944

6 Kroya 48 6,489 107,064

26 Krangkeng 5 6,503 108,483

27 Kedokan Bunder 7 6,509 108,424

9 Sumurwatu * 6,517 108,1

3b Gantar 22 6,528 107,973

14 Sukadana 18 6,546 108,315

3c Bantarhuni 35 6,589 107,951


(3)

91

Lampiran 3

. Dendrogram Pengelompokan Stasiun Curah Hujan

Sukra Indr

amay Buge

l Wan

guk Cid e

mpe t

Ujga ris Bula

k Lohb

ener Losa

rang Bang

kir

Sudi mam

p Kedk

nbun Kran

gken Junti

nyu Sudi

kam p Jatib

ara

T lka cang Lwse

mu t Kroy

a Krga

sem Gbsw

etan Bugi

s Anj a

tan Tug

u Cike

dung Suka

dana

Tem i yang Gant

ar Bant

arhu Bond

an Cipa

ncuh Sum

urwa t

31.50

54.33

77.17

100.00

Similarity


(4)

92

Lampiran 4

. Curah Hujan (mm) Aktual dan Dugaan Setiap DPM_PPR

DPM1_PPR

0 100 200 300 400 500

1 2 3 4 5 6 7 8 9 10 11 12

Aktual Dugaan

DPM2_PPR

0 100 200 300 400 500

1 2 3 4 5 6 7 8 9 10 11 12

Aktual Dugaan

DPM3_PPR

0 100 200 300 400 500

1 2 3 4 5 6 7 8 9 10 11 12

Aktual Dugaan

DPM4_PPR

0 100 200 300 400 500

1 2 3 4 5 6 7 8 9 10 11 12

Aktual Dugaan

DPM5_PPR

0 100 200 300 400 500

1 2 3 4 5 6 7 8 9 10 11 12

Aktual Dugaan


(5)

93

Lampiran 5

. Curah Hujan (mm) Aktual dan Dugaan Setiap DPM_BMG

DPM1_BMG

0 100 200 300 400 500

1 2 3 4 5 6 7 8 9 10 11 12

Aktual Dugaan

DPM2_BMG

0 100 200 300 400 500

1 2 3 4 5 6 7 8 9 10 11 12

Aktual Dugaan

DPM3_BMG

0 100 200 300 400 500

1 2 3 4 5 6 7 8 9 10 11 12

Aktual Dugaan

DPM4_BMG

0 100 200 300 400 500

1 2 3 4 5 6 7 8 9 10 11 12

Aktual Dugaan

DPM5_BMG

0 100 200 300 400 500

1 2 3 4 5 6 7 8 9 10 11 12

Aktual Dugaan

DPM6_BMG

0 100 200 300 400 500

1 2 3 4 5 6 7 8 9 10 11 12 Aktual Dugaan


(6)

94

Lampiran 6

. Sub-Program S-Plus yang digunakan untuk Pendugaan Model PPR

ppreg

(x, y, min.term, max.term=min.term,

wt=rep(1,nrow(x)), rwt=rep(1,ncol(y)),

xpred=NULL,optlevel=2,bass=0,span="cv")

Outputs by

ppreg

:

ypred

matrix of predicted values for y given the matrix xpred. If xpred was not input, then ypred contains the residuals for the model fit.

fl2

the sum of squared residuals divided by the total corrected sums of squares.

alpha

a minterm by ncol(x) matrix of the direction vectors, alpha[m,j] contains the j-th component of the direction in the m-th term.

beta

a minterm by ncol(y) matrix of term weights, beta[m,k] contains the value of the term weight for the m-th term and the k-th response variable.

z

a matrix of values to be plotted against zhat. z[i,m] contains the z value of the i-th observation in the m-th model term, i.e., z equals x %*% t(alpha). The columns of z have been sorted.

zhat

a matrix of function values to be plotted. zhat[i,m] is the smoothed ordinate value (phi) of the i-th observation in the m-th model term evaluated at z[i,m].

allalpha

a three dimensional array, the [m,j,M] element contains the j-th component of the direction in the m-th model term for the solution consisting of M terms. Values are zero for M less than minterm.

allbeta

a three dimensional array, the [m,k,M] element contains the term weight for the m-th term and the k-th response variable for the solution consisting of M terms. Values are zero for M less than minterm.

esq

esq[M] contains the fraction of unexplained variance for the solution consisting of M terms. Values are zero for M less than minterm.

esqrsp

matrix that is ncol(y) by maxterm containing the fraction of

unexplained variance for each response. esqrsp[k,M] is for the k-th response variable for the solution consisting of M terms, for M ranging from min.term to max.term. Other columns are zero.