Statistical Downscaling dengan Model Aditif Terampat untuk Pendugaan Curah Hujan Ekstrim

STATISTICAL DOWNSCALING DENGAN MODEL ADITIF
TERAMPAT UNTUK PENDUGAAN CURAH HUJAN EKSTRIM

LILIES HANDAYANI

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul “Statistical Downscaling
dengan Model Aditif Terampat untuk Pendugaan Curah Hujan Ekstrim” adalah
benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan
dalam bentuk apapun kepada perguruan tinggi manapun. Sumber informasi yang
berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari
penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di
bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.

Bogor, Juni 2014

Lilies Handayani
G151120131

* pelimpahan hak cipta atas karya tulis dari penelitian kerjasama dengan pihak luar IPB harus
didasarkan pada perjanjian kerjasama yang terkait

RINGKASAN
LILIES HANDAYANI. Statistical Downscaling dengan Model Aditif Terampat
untuk Pendugaan Curah Hujan Ekstrim. Dibimbing oleh AJI HAMIM WIGENA
dan ANIK DJURAIDAH.
Perubahan iklim global dapat meningkatkan kejadian curah hujan ekstrim.
Curah hujan ekstrim adalah kondisi curah hujan di atas atau di bawah rata-rata
kondisi normalnya. Curah hujan ekstrim, secara garis besar dapat dibedakan
menjadi curah hujan ekstrim basah yang berdampak kebanjiran dan curah hujan
ekstrim kering yang berdampak kekeringan. Analisis yang mengkaji kejadiankejadian ekstrim dibutuhkan untuk memperkecil dampak buruk karena adanya
kejadian curah hujan ekstrim tersebut.
Model-model dalam menganalisis curah hujan sudah banyak diterapkan di
antaranya global circulation model (GCM). Skala spasial yang digunakan dalam

GCM masih bersifat global. Data ini tentu saja tidak dapat menjelaskan
variabilitas dalam skala lokal yang lebih detail. Teknik untuk menurunkan ukuran
skala spasialnya salah satunya dengan menggunakan statistical downscaling (SD).
SD merupakan suatu teknik yang menggunakan model statistika untuk
mengetahui hubungan antara suatu data yang berskala global dengan data yang
berskala lokal.
Karakteristik data GCM yang bersifat nonlinear dan berdimensi besar
mengakibatkan kesulitan dalam analisis, terlebih lagi jika peubah penjelasnya
semakin banyak. Permasalahan ini dapat diatasi dengan suatu metode alternatif
yang lebih fleksibel terhadap asumsi yang disebut metode nonparametrik. Dalam
penelitian ini, metode nonparametrik yang digunakan adalah model aditif
terampat yang merupakan perluasan dari model aditif dan didasarkan pada model
regresi linear dengan memodelkan peubah respon sebagai kombinasi aditif dari
hubungan fungsional peubah penjelas yang tidak memerlukan adanya asumsi
mengenai distribusi sisaan.
Hasil yang diperoleh menunjukkan bahwa dugaan curah hujan ekstrim di
kabupaten Indramayu dengan menggunakan model statistical downscaling
berbasis model aditif terampat yang dihasilkan menunjukkan kecenderungan yang
mirip dengan pola data aktualnya dengan nilai RMSE dan RMSEP berturut-turut
sebesar 67.676 dan 40.113. Pendugaan curah hujan ekstrim di kabupaten

Indramayu tiga tahun ke depan memberikan hasil dugaan terbaik dari semua
periode analisis yang digunakan dengan nilai korelasi sebesar 0.787.
Kata kunci : curah hujan ekstrim, global circulation
downscaling, model aditif terampat

model,

statistical

SUMMARY
LILIES HANDAYANI. Statistical Downscaling with Generalized Additive
Model for Extreme Rainfall Estimation. Supervised by AJI HAMIM WIGENA
and ANIK DJURAIDAH.
Global climate change may also increase the incidence of extreme rainfall.
Extreme rainfall is the rainfall that above or below the average normal conditions.
Extreme rainfall will be wet extreme rainfall which causes flooded and dry
extreme rainfall which causes drought. An analysis examining the extreme events
is needed to minimize the adverse impacts due to the extreme rainfall events.
The model used in analyzing rainfall is global circulation model (GCM).
Spatial scale used in the GCM is global so these data certainly can not explain the

variability in a local scale. Techniques to reduce the size of spatial scale uses
statistical downscaling (SD). SD is a statistical technique that uses the model to
evaluate the relation between a global scale data with local scale data.
Characteristics of the GCM data are nonlinear and has large dimensions can
make difficulty in the analysis, especially if it has many predictor variables. This
problem can be overcame by more flexible alternative methods. Nonparametric
methods that can properly accommodate the influence of nonlinear without having
to know the explicit form is generalized additive model (GAM). GAM is an
extension of the additive model based on linear regression model by modeling
response as an additive combination of the functional form of predictors that do
not require an assumption about the distribution of residual.
The results show that estimation of extreme rainfall in Indramayu district by
using SD based on GAM obtained showed a trend similar to the pattern of the
actual data with the value of RMSE and RMSEP, respectively for 67.676 and
40.113. Estimation of extreme rainfall in Indramayu district 3 years ahead gives
the best estimate result than all periods of analysis used with a correlation value of
0.787.
Keywords : extreme rainfall, global circulation model, statistical downscaling,
generalized additive model


© Hak Cipta Milik IPB, Tahun 2014
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah, dan pengutipan tersebut tidak merugikan kepentingan
IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apapun tanpa izin IPB

STATISTICAL DOWNSCALING DENGAN MODEL ADITIF
TERAMPAT UNTUK PENDUGAAN
CURAH HUJAN EKSTRIM

LILIES HANDAYANI

Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Program Studi Statistika


SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2014

Penguji Luar Komisi pada Ujian Tesis : Dr Anang Kurnia

Judul Tesis : Statistical Downscaling dengan Model Aditif Terampat untuk
Pendugaan Curah Hujan Ekstrim
Nama
: Lilies Handayani
NIM
: G151120131

Disetujui oleh
Komisi Pembimbing

Dr Ir Aji Hamim Wigena, MSc
Ketua


Dr Ir Anik Djuraidah, MS
Anggota

Diketahui oleh

Ketua Program Studi
Statistika

Dekan Sekolah Pascasarjana

Dr Ir Anik Djuraidah, MS

Dr Ir Dahrul Syah, MScAgr

Tanggal Ujian : 18 Juni 2014

Tanggal Lulus :

PRAKATA

Puji syukur penulis panjatkan kehadirat Allah SWT atas limpahan rahmat
dan ridho-Nya, kesempatan, dan kesehatan yang dikaruniakan-Nya sehingga tesis
yang berjudul “Statistical Downscaling dengan Model Aditif Terampat untuk
Pendugaan Curah Hujan Ekstrim” ini dapat terselesaikan.
Terima kasih penulis ucapkan kepada Bapak Dr Ir Aji Hamim Wigena, MSc
dan Ibu Dr Ir Anik Djuraidah, MS selaku pembimbing, atas kesediaan dan
kesabaran untuk membimbing dan membagi ilmunya kepada penulis dalam
penyusunan tesis ini. Ucapan terima kasih juga penulis sampaikan sebesarbesarnya kepada seluruh Dosen Departemen Statistika IPB yang telah mengasuh
dan mendidik penulis selama di bangku kuliah hingga berhasil menyelesaikan
studi, serta seluruh staf Departemen Statistika IPB atas bantuan, pelayanan, dan
kerjasamanya selama ini.
Ucapan terima kasih yang tulus dan penghargaan yang tak terhingga juga
penulis ucapkan kepada Ayahanda dan Ibunda tercinta H Rosadi Usman, SPd
dan Hj Masaat Labalado, MPd yang telah membesarkan dan mendidik penulis
dengan penuh kasih sayang demi keberhasilan penulis selama menjalani proses
pendidikan, juga adikku tersayang Wahyu Hidayat, SPdn serta keluarga besarku
atas doa dan semangatnya.
Terakhir tak lupa penulis juga menyampaikan terima kasih kepada seluruh
mahasiswa Pascasarjana Departemen Statistika dan Rumana Sulsel IPB atas
segala bantuan dan kebersamaannya selama menghadapi masa-masa terindah

maupun tersulit dalam menuntut ilmu, serta semua pihak yang telah banyak
membantu dan tak sempat penulis sebutkan satu per satu.
Semoga tesis ini dapat bermanfaat bagi semua pihak yang membutuhkan.

Bogor, Juni 2014

Lilies Handayani

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi


1 PENDAHULUAN
Latar Belakang
Tujuan Penelitian

1
1
2

2 TINJAUAN PUSTAKA
Curah Hujan
Teori Nilai Ekstrim
Global Circulation Model (GCM)
Statistical Downscaling (SD)
Analisis Regresi Nonparametrik

3
3
3
4

5
6

3 METODE PENELITIAN
Data
Metode Analisis

10
10
10

4 HASIL DAN PEMBAHASAN
Eksplorasi Data
Pemodelan
Perbandingan Metode GEV dan SD
Validasi dan Uji Konsistensi Model

12
12
15
18
19

5 SIMPULAN DAN SARAN
Simpulan
Saran

20
20
21

DAFTAR PUSTAKA

21

LAMPIRAN

23

RIWAYAT HIDUP

38

DAFTAR TABEL
1
2
3
4
5
6
7
8

Deskripsi data curah hujan kabupaten Indramayu tahun 1979-2008
Curah hujan ekstrim kabupaten Indramayu tahun 1979-2008
Nilai akar ciri dan proporsi kumulatif analisis komponen utama
Nilai rata-rata dan simpangan baku dari nilai dugaan parameter GEV
dan nilai return
Hasil analisis model aditif terampat
Nilai RMSE, RMSEP, dan korelasi metode GEV dan SD
Nilai RMSEP dan korelasi di setiap panjang data pendugaan model SD
berbasis GAM
Nilai korelasi pendugaan model SD berbasis GAM untuk pendugaan
curah hujan ekstrim 3 tahun ke depan

13
14
15
15
17
19
19
20

DAFTAR GAMBAR
1
2
3
4
5
6

Ilustrasi proses statistical downscaling (Sutikno 2008)
Lokasi penelitian (Wigena 2006)
Pola curah hujan kabupaten Indramayu tahun 1979-2008
Matriks plot antara data curah hujan ekstrim dengan KU terpilih
Plot hubungan fungsional masing-masing KU terpilih
Plot antara curah hujan ekstrim dengan nilai dugaan

6
10
13
16
18
18

DAFTAR LAMPIRAN
1 Plot masing-masing variabel data GCM
2 Nilai cross correlation function (CCF) tertinggi masing-masing
variabel data GCM
3 Plot masing-masing variabel data GCM dengan time lag yang
menghasilkan korelasi paling tinggi
4 Uji kehomogenan ragam data GCM
5 Nilai dugaan parameter GEV dan nilai return
6 Plot data curah hujan ekstrim dengan masing-masing KU terpilih
7 Eksplorasi data curah hujan ekstrim dengan masing-masing KU terpilih
8 Hasil analisis model aditif terampat
9 Plot antara curah hujan ekstrim dengan KU terpilih (KU1, KU2, KU3,
KU4, KU5, dan KU6)

23
28
29
33
34
34
35
37
37

1

PENDAHULUAN
Latar Belakang

Iklim berperan besar terhadap kehidupan manusia seperti dalam bidang
pertanian, transportasi, telekomunikasi, dan pariwisata. Curah hujan sebagai unsur
iklim yang paling tinggi keragaman dan fluktuasinya, serta paling dominan
mencirikan iklim di Indonesia saat ini juga dipengaruhi oleh perubahan iklim
global yang dapat menyebabkan kejadian curah hujan ekstrim. Curah hujan
ekstrim adalah kondisi curah hujan di atas atau di bawah rata-rata kondisi
normalnya yang secara garis besar dapat dibedakan menjadi curah hujan ekstrim
basah yang berdampak kebanjiran dan curah hujan ekstrim kering yang
berdampak kekeringan. Analisis yang mengkaji kejadian-kejadian ekstrim
dibutuhkan untuk memperkecil dampak buruk karena adanya kejadian curah hujan
ekstrim tersebut (Prang 2006).
Penggunaan model sebaran nilai ekstrim terampat (generalized extreme
value, GEV) dapat menggambarkan pola kejadian ekstrim curah hujan.
Pemodelan dengan GEV sangat bermanfaat untuk melihat karakteristik nilai
ekstrim dalam suatu proses lingkungan tertentu dengan memberikan interpretasi
mengenai perilaku ekor kanan fungsi peluangnya yang mengandung nilai-nilai
ekstrim, walaupun model GEV tidak menghasilkan dugaan curah hujan ekstrim
dengan cukup akurat (Sadik 1999).
Model iklim yang mampu mensimulasi curah hujan di Indonesia dengan
baik hingga saat ini belum banyak ditemukan. Topografi dan interaksi laut, darat,
dan atmosfir yang sangat kompleks menambah kerumitan simulasi dan prediksi
curah hujan di wilayah Indonesia sehingga diperlukan model peramalan curah
hujan pada skala lokal dengan mempertimbangkan informasi tentang sirkulasi
atmosfer global yang dapat diperoleh dari data global circulation model (GCM).
GCM dipandang sebagai data yang paling berpotensi dalam hal menyimulasikan
iklim masa lampau, sekarang, dan memprediksi perubahan-perubahan iklim yang
mungkin terjadi di masa mendatang (Wilby et al. 2009).
Skala spasial yang digunakan dalam GCM masih bersifat global. Data ini
tentu saja tidak dapat menjelaskan variabilitas dalam skala lokal yang lebih detail.
Teknik transformasi data dari unit skala besar menjadi data pada unit skala yang
lebih kecil menggunakan statistical downscaling (SD) yang memanfaatkan model
statistika untuk menentukan hubungan antara suatu data yang berskala global
dengan data yang berskala lokal. Perbedaan skala antara peubah penjelas dan
respon dapat diatasi menggunakan teknik SD dengan peubah responnya adalah
curah hujan skala lokal sedangkan curah hujan skala global sebagai peubah
penjelasnya direpresentasikan oleh data GCM (Haryoko 2004).
Data GCM memiliki karakteristik, yaitu bersifat nonlinear, berdimensi
tinggi, dan terdapat multikolinearitas sehingga pemodelan SD membutuhkan
teknik analisis yang tepat agar model yang dihasilkan dapat digunakan untuk
menggambarkan dengan baik fenomena yang terjadi. Penelitian menggunakan
data GCM telah dilakukan oleh Haryoko (2004) yang mengkaji metode untuk
mereduksi dimensi GCM dalam penyusunan model SD. Penelitian ini hanya fokus
pada pra-pemrosesan SD dan menghasilkan kesimpulan bahwa analisis komponen
utama dapat digunakan untuk menghilangkan multikolinieritas pada data GCM.

2
Analisis yang paling sering digunakan untuk memodelkan hubungan antar
peubah penjelas dan respon yang juga dapat diterapkan pada SD adalah analisis
regresi linear. Adrianto (2006) mengkaji SD dengan pendekatan regresi linear,
dalam hal ini regresi komponen utama dalam pemodelannya. Namun model
regresi linear memiliki asumsi-asumsi yang kuat sehingga sering menyulitkan dan
dapat mengurangi presisi kesimpulan karena karakteristik dari data GCM yang
tidak memenuhi asumsi tersebut. Karakteristik data GCM yang bersifat nonlinear
pun dapat bermacam-macam dan akan bertambah sulit dalam analisis jika peubah
penjelasnya semakin banyak. Permasalahan ini dapat diatasi dengan suatu metode
alternatif yang lebih fleksibel terhadap asumsi yang disebut metode nonparametrik.
Penelitian tentang pemodelan SD dengan pendekatan nonparametrik, antara
lain dengan menggunakan metode regresi projection pursuit untuk peramalan
curah hujan bulanan (Wigena 2006), regresi splines adaptif berganda untuk
peramalan produksi padi (Sutikno 2008), dan Artificial Neural Network (Wilby et
al. 2009), namun ketiga penelitian ini belum mengkaji kejadian ekstrim dalam
pemodelannya. Mondiana (2012) telah mengkaji pemodelan curah hujan ekstrim
secara parametrik tanpa mengakomodasi pengaruh nonlinear pada data GCM.
Metode nonparametrik yang berpotensi untuk pendugaan model SD dalam
kajian ekstrim adalah model aditif terampat (generalized additive model, GAM).
GAM pertama kali dikembangkan oleh Hastie dan Tibshirani pada tahun 1986.
Metode ini dapat mengakomodasi dengan baik adanya pengaruh nonlinear tanpa
harus mengetahui bentuk pengaruh tersebut secara eksplisit. Selain itu metode ini
juga kekar (robust) terhadap pencilan. GAM merupakan perluasan dari model
aditif yang didasarkan pada model regresi linear dengan memodelkan curah hujan
lokal ( y ) sebagai kombinasi aditif dari hubungan fungsional peubah penjelas
yang tidak memerlukan adanya asumsi mengenai sebaran sisaan. Setiap hubungan
fungsional peubah penjelas diduga secara nonparametrik dengan metode
pemulusan (Beck & Jackman 1997).
Penelitian ini mengkaji pemodelan SD dengan pendekatan model aditif
terampat untuk menggambarkan kejadian curah hujan ekstrim yang terjadi dalam
jangka waktu tertentu. Data yang digunakan adalah data curah hujan di kabupaten
Indramayu, karena kabupaten Indramayu merupakan penyuplai beras terbesar di
Jawa Barat. Areal persawahan di Indramayu saat ini semakin berkurang akibat
dampak perubahan iklim yang ekstrim dan pemanasan global.
Tujuan Penelitian
Tujuan dari penelitian ini, antara lain :
1. Membandingkan hasil dugaan curah hujan ekstrim menggunakan sebaran nilai
ekstrim dengan model statistical downscaling dengan pendekatan parametrik
dan nonparametrik (model aditif terampat).
2. Melakukan uji validasi dan konsistensi terhadap model terbaik yang
dihasilkan

3

2

TINJAUAN PUSTAKA
Curah Hujan

Kehidupan manusia dan makhluk hidup lainnya di muka bumi ini tidak lepas
dari pengaruh cuaca dan iklim. Unsur cuaca dan iklim yang sangat bervariasi
adalah curah hujan. Di Indonesia yang mayoritas penduduknya adalah petani,
curah hujan merupakan faktor utama yang mempengaruhi hasil produksi pertanian
yang optimal.
Curah hujan adalah ketinggian air hujan yang terkumpul dalam tempat yang
datar, tidak menguap, tidak meresap, dan tidak mengalir. Satuan curah hujan
diukur dalam milimeter (mm) atau inci. Curah hujan 1 (satu) milimeter artinya
dalam luasan satu meter persegi pada tempat yang datar tertampung air setinggi
satu milimeter atau tertampung air sebanyak satu liter. Curah hujan yang jatuh di
wilayah Indonesia dipengaruhi oleh beberapa faktor antara lain bentuk
medan/topografi, arah lereng medan, arah angin yang sejajar garis pantai dan jarak
perjalan angin di atas medan. Cuaca ekstrim adalah keadaan atau fenomena
kondisi cuaca di atas normal yang terjadi pada suatu wilayah tertentu berskala
jangka pendek (Hidayat 2008).
Identifikasi tentang curah hujan ekstrim dapat menggunakan metode block
maxima, yaitu dengan membuat blok periode waktu yaitu periode tahunan. Blok
yang terbentuk selanjutnya dianalisis untuk menentukan nilai pengamatan yang
maksimum dan pengamatan-pengamatan tersebut dianggap sebagai pengamatan
yang ekstrim (Gilli & Kellezi 2003).
Teori Nilai Ekstrim
Teori nilai ekstrim (extreme value theory, EVT) adalah salah satu teori yang
membahas kejadian-kejadian ekstrim. EVT memberi perhatian pada informasi
kejadian-kejadian ekstrim yang diperoleh untuk membentuk fungsi sebaran dari
nilai-nilai tersebut. Analisis terhadap nilai-nilai ekstrim fenomena curah hujan
sangatlah penting, terutama bagi pemerintah dan kementerian terkait untuk
pengambilan suatu kebijakan (Sadik 1999).
Analisis tentang kejadian ekstrim memungkinkan kita untuk menduga
terjadinya kejadian ekstrim tersebut. Misalkan Y1 , Y2 ,  , Yn adalah peubah acak

yang bebas dan identik, maka Y(n ) = max(Y1 , Y2 , , Yn ) konvergen pada sebaran
kumulatif:
1
 
− 
ξ
y
µ

 
exp − 1 + ξ
,ξ ≠0

  
σ  
F( µ ,σ ,ξ ) ( y ) =  

 
y − µ 
exp − exp −
,ξ =0

 
σ 

Dalam pemodelan nilai maksimum suatu peubah acak, EVT akan menyerupai
teori limit pusat (central limit theorem) dalam memodelkan jumlah peubah acak
dan diketahui bahwa secara asimptotik, nilai ekstrim curah hujan akan konvergen
mengikuti fungsi kepekatan GEV (generalized extreme value) berikut:

4
1
1

− −1
− 

ξ
ξ
y
y
µ
µ
1






 1 + ξ
exp − 1 + ξ
  ,ξ ≠0

σ 
 
σ 
σ  
f ( µ ,σ ,ξ ) ( y ) = 


1

y−µ
 y − µ 
 exp −
,ξ =0

 exp − exp −
σ 
σ 



σ
dengan µ adalah parameter lokasi, σ adalah parameter skala, dan ξ adalah
parameter bentuk. Pendugaan parameter-parameter tersebut dilakukan dengan
metode kemungkinan maksimum (Chaves 2001).
Besaran/kuantitas yang menjadi perhatian bukan hanya tertuju pada
pendugaan parameter itu sendiri, tetapi pada kuantil yang juga disebut sebagai
tingkat pengembalian (return level) dari penduga GEV. Nilai dugaan tingkat
pengembalian, sebagai berikut:
−ξˆ



ˆ

1
σ


µˆ +  − ln1 −   − 1 , ξˆ ≠ 0




ξˆ 
 k 

Rˆ pk = 


 1 
, ξˆ = 0
µˆ − σˆ log − log1 − 
k





dengan k adalah jangka waktu dan p adalah periode. Nilai dugaan tingkat
pengembalian curah hujan maksimum yang diperoleh akan dipakai untuk validasi
pada data curah hujan. Nilai tingkat pengembalian merupakan nilai maksimum
yang diharapkan akan dilampaui satu kali dalam jangka waktu k dengan periode p,
atau dengan kata lain dalam k jangka waktu, curah hujan akan mencapai nilai
maksimum R (Gilli & Kellezi 2003).

Global Circulation Model
Global circulation model (GCM) merupakan alat terpenting dalam
memahami sistem iklim karena mampu memberikan informasi tentang pergeseran
iklim di masa yang akan datang. GCM menghasilkan data dalam bentuk grid atau
petak wilayah dengan resolusi rendah (2,5o atau ± 300 km) yang
merepresentasikan keadaan iklim global tetapi tidak dalam skala regional atau
lokal. Data GCM dalam bentuk grid-grid menunjukkan bahwa GCM merupakan
salah satu contoh bentuk data spasial, yaitu data yang berkaitan dengan keruangan.
GCM merupakan penggambaran matematis dari sejumlah besar interaksi
fisika, kimia, dan dinamika atmosfer bumi. Model ini menduga perubahan unsurunsur cuaca dalam bentuk luaran grid-grid menurut lintang dan bujur. Model ini
dapat di-run untuk menduga kepekaan iklim terhadap kondisi yang berbeda
seperti perubahan gas rumah kaca. GCM seringkali digunakan untuk menyimulasi
iklim pada kondisi dua kali CO2. Penelitian dengan menggunakan GCM
seringkali terkendala pada pemilihan luas, metode, dan domainnya, ini tentu saja
dapat menyulitkan untuk melanjutkan analisis. Pendekatan yang dapat dilakukan
untuk menyelesaikan masalah tersebut adalah dengan penentuan domain
menggunakan statistical downscaling (SD).
SD menghubungkan peubah iklim global dan lokal sebagai proyeksi output
GCM dalam skala lokal menggunakan metode statistika. Kendala yang dihadapi

5
dalam penggunaan metode statistika untuk downscaling adalah data GCM yang
digunakan berupa data deret waktu dengan jumlah yang banyak dan tidak saling
bebas sehingga tidak dapat langsung digunakan dalam model statistik, sehingga
pemodelan SD dilakukan terlebih dahulu dengan jalan pra-pemrosesan reduksi
dimensi domain grid untuk mengatasi kasus multikolinearitas. Metode reduksi
dimensi yang sering digunakan adalah analisis komponen utama (AKU), namun
kinerja AKU sendiri hanyalah sebatas memapatkan dimensi grid skala besar
menjadi kecil belum pada bagaimana mendapatkan validasi model terbaik.
Ide awal dari AKU adalah menyusutkan dimensi dari sekumpulan data yang
berisi sejumlah peubah penjelas yang saling berhubungan, dengan tetap
mempertahankan sebanyak mungkin keragaman yang dapat dijelaskan.
Pereduksian dimensi dilakukan dengan cara mentransformasi peubah-peubah asli
yang berkorelasi menjadi satu set peubah baru yang tidak berkorelasi. Peubahpeubah baru ini disebut sebagai komponen utama (KU) yang merupakan
ringkasan/susutan dari peubah asal dengan tetap mampu menjelaskan semaksimal
mungkin peubah asalnya (Johnson & Wichern 2002).
KU adalah kombinasi linear dari p peubah asal yang merupakan koordinat
baru dari rotasi peubah asal sebagai sumbu koordinat. Sumbu baru ini mampu
menjelaskan keragaman maksimum dan menghasilkan penjelasan yang lebih
sederhana. Syarat membentuk KU agar mempunyai keragaman yang besar dengan
memilih e i ' = e1 e2  e p sedemikian hingga var(e i ' X ) maksimum, dengan

[

]

e i ' e i = 1 dan cov(e i ' X, e i ' ' X ) = 0 , untuk i ' < i ; i = 1, 2, p ; i '= 1, 2, p

KU dapat diperoleh dari pasangan nilai akar ciri (λi ) matriks ragam
peragam atau matriks korelasi. Presentase keragaman total yang dapat dijelaskan
oleh KU ke-i adalah sebagai berikut:
Proporsi ragam ke - i =

λi

λ1 + λ 2 +  + λ p

dengan p adalah banyaknya peubah asal. Jumlah KU yang dipilih mampu
memberikan kumulatif persen keragaman antara 80-90% dari total keragaman
(Jolliffe 1986).
Statistical Downscaling
Downscaling adalah suatu cara menginterpolasi peubah-peubah penjelas
atmosfir berskala besar terhadap peubah-peubah berskala lebih kecil. Proses
downscaling umumnya dibutuhkan ketika dampak dari berbagai variasi dan
perubahan peubah-peubah iklim tidak dapat diduga dari prediksi resolusi global
GCM, oleh karena dampak tersebut sangat sensitif terhadap iklim skala lokal.
Teknik downscaling telah banyak dikembangkan dengan maksud meningkatkan
manfaat informasi regional yang dihasilkan GCM serta menyediakan informasi
iklim resolusi tinggi.
Statistical downscaling merupakan pendekatan empiris mengenai hubungan
secara statistika antara sirkulasi pada atmosfer dan curah hujan. Model SD
memberikan hasil yang baik dengan syarat 1) hubungan erat antara respon dengan
penjelas yang menjelaskan keragaman iklim lokal dengan baik, 2) peubah
penjelas disimulasi baik oleh GCM, dan 3) hubungan antara peubah penjelas dan

6
respon tidak berubah dengan perubahan waktu dan tetap sama meskipun ada
perubahan iklim (Busuioc et al. 2001).
Metode SD didasarkan pada asumsi bahwa iklim lokal dikendalikan oleh
dua faktor, yaitu kondisi iklim skala besar (resolusi rendah) dan
kondisi/karakteristik fisiografik regional/lokal. Informasi iklim regional atau lokal
dapat diperoleh dengan langkah awal menentukan suatu model statistik yang
menghubungkan peubah iklim skala besar ( X ) dengan peubah-peubah regional
dan lokal ( y ). Luaran skala besar dari simulasi GCM dimasukkan sebagai input
bagi model statistik tersebut untuk memperkirakan karakteristik iklim lokal atau
regional yang bersangkutan. Bentuk umum model SD, yaitu:
y (t ) = f X (t × g )
dengan,
y (t )
: peubah iklim lokal (curah hujan)

(

X (t× g )
t
g

)

: peubah luaran GCM (presipitation)
: banyaknya waktu (bulanan)
: banyaknya grid domain GCM
Global Circulation Model
(peubah penjelas)

1o = 100 km
2.5o
2.5o

Kabupaten Indramayu
(luas wilayah 84 x 25 km2)

Statistical
Downscaling
Observasi Permukaan
(peubah respon)

Gambar 1 Ilustrasi proses statistical downscaling (Sutikno 2008)
Teknik SD yang digunakan beragam berdasarkan region/spasial, temporal,
peubah respon/prediktan, peubah penjelas, dan metode statistik yang digunakan
membangun model hubungan skala besar dan skala lokal/regional. Teknik SD
yang sering digunakan adalah regresi, korelasi kanonik, dan dekomposisi nilai
singular (Uvo et al. 2001).
Analisis Regresi Nonparametrik
Analisis regresi adalah analisis yang digunakan untuk melihat hubungan
antar peubah respon dan penjelas. Pendekatan pendugaan yang paling sering
digunakan adalah pendekatan parametrik. Asumsi yang mendasari pendekatan ini

7
adalah kurva regresi dapat diwakili oleh suatu model parametrik (Hardle 1994).
Bentuk umum dari model regresi linear, yaitu:
y = β 0 + β1 x1 + β 2 x 2 +  + β p x p + ε

dengan y adalah peubah respon, xi (i = 1, 2,  p ) adalah peubah penjelas,

β j ( j = 0,1, p ) adalah parameter pada model, ε adalah galat acak, dan p adalah

banyaknya peubah penjelas.
Metode pendugaan parameter model tersebut dapat dilakukan dengan
berbagai cara. Metode yang paling popular adalah metode kuadrat terkecil (MKT).
Permasalahan-permasalahan yang terjadi pun banyak ditemukan karena
persyaratan yang harus dipenuhi pada asumsi-asumsi yang mendasari MKT
seringkali menyulitkan, namun tentunya ada solusi untuk permasalahan tersebut.
MKT terboboti dapat digunakan untuk mengatasi ketidakhomogenan ragam,
masalah multikolinearitas pada regresi linear berganda dapat diatasi regresi
komponen utama dan regresi gulud.
Metode-metode di atas dikenal sebagai metode regresi parametrik. Dalam
perkembangannya metode tersebut juga belum dapat menjawab semua
permasalahan yang ada. Kesulitan dalam menentukan bentuk model yang tepat
jika tidak ada informasi awal mengenai bentuk hubungan peubah respon dan
penjelasnya merupakan masalah yang sering terjadi. Diagnostik terhadap perilaku
sisaan sebenarnya dapat dijadikan alat untuk melihat bentuk hubungan tersebut,
namun langkah ini membutuhkan proses yang panjang dan pengalaman yang
cukup untuk menduga bentuk hubungan yang tepat. Permasalahan tersebut dapat
diselesaikan dengan berkembangnya suatu metode regresi nonparametrik yang
tidak memerlukan asumsi sebaran data sehingga metode ini menjadi lebih kekar
(Draper & Smith 1981).
Regresi nonparametrik digunakan untuk memodelkan hubungan antar
peubah tanpa penetapan bentuk khusus tentang fungsi regresinya. Hubungan
antara respon y dengan peubah penjelas x dinyatakan dalam model berikut:
y i = f (xi ) + ε i , untuk i = 1, 2, , n
dengan f (.) menyatakan bentuk hubungan fungsional nonparametrik dan ε i
adalah galat acak.

Fungsi Pemulusan Spline
Proses pemulusan merupakan salah satu langkah penting pada pendugaan
model nonparametrik. Tujuan dari pemulusan adalah untuk memperkecil
keragaman dari data yang tidak memiliki pengaruh sehingga ciri-ciri dari data
akan tampak lebih jelas. Pemulusan pada dasarnya merupakan suatu proses yang
secara sistematik dapat menghilangkan pola data yang kasar (berfluktuasi),
selanjutnya dapat mengambil pola data yang dijelaskan secara umum. Fungsi
pemulus spline merupakan fungsi yang mempunyai fleksibilitas tinggi dan
mampu menangani data yang perilakunya berubah-ubah pada subinterval tertentu.
Spline merupakan potongan polinomial (piecewise polynomial), yaitu polinomial
yang memiliki sifat tersegmen yang kontinu dan mempunyai keunggulan dalam
mengatasi pola data yang menunjukkan naik/turun dengan tajam dengan bantuan
titik-titik knot serta kurva yang dihasilkan relatif mulus (Hardle 1994).

8
Fungsi spline berorde ke-m dengan satu peubah penjelas adalah sembarang
fungsi yang secara umum dapat disajikan dalam bentuk:
m −1

s

r =1

k =1

f ( x ) = β 0 + ∑ β r X r + ∑ β r + k ( x − K k )+

m −1

dengan fungsi sepenggal (truncated) sebagai berikut:
(x − K k )m+ −1 ; x ≥ K k
m −1
( x − K k )+ = 
0
; x ≥ Kk
K k adalah matriks yang berisi knot ke-k dari vektor peubah penjelas x;
k = 1, 2,  , s ; dan s adalah banyaknya knot. Knot diartikan sebagai suatu titik
fokus dalam fungsi spline sehingga kurva yang dibentuk tersegmen pada titik
tersebut. Selanjutnya, f ( xi ) pada model nonparametrik diperoleh dengan
meminimumkan fungsi jumlah kuadrat terpenalti (penalized least square), yaitu:
n

[

]

1

2
2
J = ∑ y i − fˆ ( xi ) + λ ∫ [ f '' ( x )] dx
i =1

 0 


a

b

dengan a merupakan jumlah kuadrat sisaan atau fungsi jarak antara data dan
dugaan, b merupakan penalti kekasaran (ukuran kemulusan kurva dalam
memetakan data), dan λ ≥ 0 adalah parameter pemulus. Minimisasi J pada nilai
λ tertentu akan memberikan kompromi antara kebaikan pengepasan dengan
kemulusan kurva (penalty). Nilai λ yang besar akan memberikan bobot penalti
(kemulusan) yang besar dan mempunyai ragam yang kecil. Setelah ditentukan
turunan pertama terhadap f maka diperoleh fungsi pemulus linier, yaitu:
−1
fˆ = (1 + λK ) y = S y
dengan K adalah matriks penalti yang mempunyai struktur spesifik, yaitu:
K = D T C −1 D

D (n −2 )×n adalah matriks upper triagonal yang memiliki struktur sebagai berikut:
λ1−1

0
 

 0

dan C (n − 2 )×(n − 2 )
sebagai berikut:

(

− λ1−1 + λ−21

)

λ−21




λ
λ
− λ +λ









λ−n1− 2 − λ−n1− 2 + λ−n1−1 λ−n1−1 
adalah matriks symmetric tridiagonal yang memiliki struktur
−1
2

(

−1
2

−1
3

)



0

−1
3

(

λ2

2(λ1 + λ 2 )
 λ
2(λ 2 + λ3 ) 
2






0

λn−2


)

0
0







λn−2

2(λ n − 2 + λ n −1 )
0

Pemilihan Parameter Pemulus Optimal
Pemilihan parameter pemulus optimal dapat ditentukan dari rataan kuadrat
sisaan (mean square error, MSE), yaitu:

9

[

]

2
1 n
y i − fˆ ( xi )

n i =1
Metode pemilihan parameter pemulus lainnya adalah menggunakan metode
validasi silang terampat (generalized cross validation, GCV), yaitu:
2
1 n
y i − fˆ ( xi )

MSE
n
GCV = i =1
= −1
2
1
[tr (I ) − tr (H )]2 n [tr (I − H )]
n

MSE =

[

(

]

)

−1

dengan H = X X T X X T dan I adalah matriks identitas.
Pemilihan faktor pemulus optimal dalam regresi nonparametrik dapat
dilakukan melalui derajat bebas efektif yang diperoleh dari fungsi berikut:

Df = tr (S )

S merupakan matriks pemulus dengan S = (1 + λK ) (Eubank 1988).
−1

Model Aditif Terampat
Model nonparametrik kemudian diperluas untuk peubah penjelas lebih dari
satu dan dikenal dengan model aditif yang didefinisikan sebagai berikut:
y = f 0 + ∑ f j (X j ) + ε
p

j =1

dengan ε bebas stokastik terhadap peubah penjelas X , dan memenuhi E (ε ) = 0

2
dan cov(ε ) = σ I , sedangkan f j adalah bentuk fungsional antara respon dengan

peubah penjelas X j .
Perluasan model aditif untuk sebaran keluarga eksponensial menjadi model
aditif terampat (generalized additive model selanjutnya disingkat GAM). Bentuk
umum model GAM adalah sebagai berikut:

[(

)]

η = g E y x1 , x 2 , , x p = f 0 + ∑ f j (xij ) , untuk i = 1, 2,  , n
p

j =1

dengan g adalah fungsi penghubung dan f j adalah bentuk hubungan fungsional
antara peubah respon dan penjelas yang dimodelkan secara nonparametrik dengan
suatu fungsi pemulus (Hastie & Tibshirani 1990).
Metode pendugaan GAM menggunakan algoritma backfitting. Pendugaan
fungsi mulus f 0 , f 1 (.), f 2 (.),  , f p (.) pada model aditif, dengan E f j X j = 0
menggunakan galat partial R j = y − f 0

( ( ))
− ∑ f (X ) sehingga E (R X ) = f (X )
p

k≠ j

k

k

2

j

j

j

j

p


dengan meminimumkan E y − f 0 − ∑ f k (X k ) , maka penduga f j akan
k =1


diperoleh secara iteratif jika diberikan penduga f i untuk i ≠ j (Hastie &
Tibshirani 1990).
Setelah model aditif terampat terbentuk, selanjutnya dapat dilakukan
prediksi nilai-nilai peubah respon untuk peubah penjelas baru dengan membuat

10
matriks prediksi X p yang berisi nilai-nilai peubah penjelas baru. Matriks prediksi

(

p
T
diperoleh dari persamaan μˆ p = X βˆ , dengan βˆ = X X + λS
2006).

3

)

−1

X T y (Wood

METODE PENELITIAN
Data

Data GCM yang digunakan adalah data curah hujan bulanan Climate Model
Intercomparison Project (CMIP5) yang dikeluarkan oleh Belanda dari situs web
http://www.climatexp.knmi.nl/ (diakses pada tanggal 31 Desember 2013) pada
tahun 1979 sampai dengan 2008 dengan posisi wilayah 16.25oLU – 1.25oLS dan
98.75oBB – 116.25oBT . Luasan daerah berbentuk persegi berukuran 8 x 8 grid,
sehingga terdapat 64 peubah X.

daerah
amatan

Gambar 2 Lokasi penelitian (Wigena 2006)
Data curah hujan lokal yang digunakan adalah data rata-rata curah hujan
dari stasiun klimatologi kabupaten Indramayu. Data curah hujan dari stasiun ini
berada pada rentang waktu 1979 sampai dengan 2008 (panjang data 30 tahun)
dengan total 360 data.
Metode Analisis
Eksplorasi Data
1. Data curah hujan kabupaten Indramayu
a. Statistika deskriptif sebagai informasi awal untuk melihat keragaman dari
data amatan
b. Mengidentifikasi data curah hujan ekstrim dengan metode block maxima,
yaitu dengan membagi data dalam blok periode tahunan lalu menentukan
data curah hujan maksimum di setiap tahun
c. Membagi data curah hujan ekstrim atas dua bagian, yaitu data training
untuk menyusun model (tahun 1979-2005) dan data testing untuk validasi
model (tahun 2006-2008)
2. Data GCM

11
a. Membuat plot masing-masing peubah data GCM
b. Mengevaluasi hubungan curah hujan dengan setiap peubah data GCM
menggunakan cross correlation function (CCF)
c. Memeriksa kehomogenan ragam peubah-peubah data GCM menggunakan
uji Bartlett
d. Mereduksi dimensi peubah penjelas (data GCM) yang bersesuaian dengan
curah hujan ekstrim menggunakan analisis komponen utama (AKU),
dengan langkah-langkah berikut:
• Anggap sekumpulan observasi xi , dengan i = 1, 2,  , p pada input data

Rn
• Membuat matriks ragam peragam atau matriks korelasi, misalnya A
• Menentukan nilai akar ciri (eigen value) dengan menggunakan
persamaan A − λI = 0
• Menentukan jumlah komponen utama berdasarkan ukuran keragaman
lebih dari 90% dan nilai akar ciri lebih besar dari satu (λi > 1)
• Menghitung skor komponen utama (KU) dari model y i = a i' X , dengan

a i adalah vektor ciri (eigen vector)
Pemodelan
1. Sebaran nilai ekstrim GEV
a. Menentukan nilai dugaan parameter ( µˆ , σˆ , dan ξˆ ) menggunakan metode
kemungkinan maksimum
b. Menentukan nilai tingkat pengembalian curah hujan yang akan memberikan
gambaran curah hujan maksimum yang diharapkan dapat dilampaui satu
kali dalam jangka waktu tertentu
2. Statistical downscaling (SD) berbasis komponen utama (KU)
a. Pembentukan model dengan menggunakan metode kuadrat terkecil (MKT)
b. Pemeriksaan multikolinearitas berdasarkan nilai variance inflation Factor
1
dengan Ri2 adalah koefisien
(VIF) menggunakan formula (VIF )i =
2
1 − Ri
determinasi dari peubah penjelas KU i yang diregresikan terhadap peubah
penjelas lainnya. Jika nilai VIF < 10 , maka tidak ada indikasi multikolinear
3. Statistical downscaling (SD) berbasis model aditif terampat
a. Membuat plot peubah curah hujan ekstrim dengan masing-masing KU
terpilih untuk melihat indikasi awal adanya pengaruh nonlinear pada data
b. Menentukan derajat pemulus dan banyaknya knot pemulus pada peubah
penjelas yang mempunyai hubungan nonlinear
c. Menduga fungsi f j pada model η = f 0 + ∑ f j (xij ) , untuk i = 1, 2,  , n
p

j =1

menggunakan algoritma backfitting, dengan langkah-langkah berikut:
• Nilai awal: f 0 = E (y ) , f 1(0 ) = f 2(0 ) =  = f p(0 ) = 0 , m = 0
• Iterasi:
- m = m +1

12
- untuk j = 1 sampai p:
p

(

R j = y − f 0 − ∑ f k(m ) (X k ) , f j(m ) = E R j X j
k≠ j

)
2

p


• Ulangi tahap iterasi sampai JKG = y − f 0 − ∑ f k(m ) (X k ) tidak turun
k =1


d. Membuat plot hubungan fungsional dari model yang dibentuk untuk
melihat bentuk ketergantungan peubah curah hujan ekstrim dengan masingmasing KU terpilih

Validasi dan Uji Konsistensi Model
1. Menghitung nilai root mean square error of prediction (RMSEP)

1 n
( yi − yˆ i )2 . Semakin kecil nilai

n i =1
RMSEP, maka semakin kecil perbedaan antara nilai dugaan dengan nilai
aktual, yang berarti model yang dibentuk semakin akurat dalam menghasilkan
nilai dugaan
2. Menghitung nilai korelasi antara curah hujan ekstrim dengan nilai dugaan
n
 n  n 
n∑ y i yˆ i −  ∑ y i  ∑ yˆ i 
i =1
 i =1  i =1 
menggunakan formula r =
untuk
 n 2  n 2  n 2  n 2 
n∑ y i −  ∑ y i   n∑ yˆ i −  ∑ yˆ i  
 i =1  
 i =1    i =1
 i =1
menunjukkan keeratan hubungan antara nilai dugaan dengan nilai aktualnya.
Semakin besar (dan positif) nilai korelasi maka semakin kuat hubungan antara
nilai dugaan dan nilai aktualnya, yang berarti pola nilai dugaan semakin
mendekati pola data aktualnya
menggunakan formula RMSEP =

4

HASIL DAN PEMBAHASAN
Eksplorasi Data

Data Curah Hujan Kabupaten Indramayu
Deskripsi data curah hujan untuk untuk Kabupaten Indramayu perlu
dilakukan sebagai informasi awal untuk mengetahui karakteristik dan pola curah
hujan yang digunakan untuk analisis berikutnya. Hasil yang diperoleh
menunjukkan bahwa di kabupaten Indramayu dari tahun 1979 sampai 2008
memiliki rata-rata curah hujan sebesar 123 mm. Nilai curah hujan terendah
sebesar 0 mm dan nilai curah hujan tertinggi sebesar 583 mm, sedangkan nilai
simpangan baku yang digunakan untuk menyatakan keragaman curah hujan di
kabupaten Indramayu sebesar 110 mm.
Gambar 3 menunjukkan pola curah hujan di kabupaten Indramayu dari tahun
1979 sampai 2008 berpola monsun. Pola monsun merupakan pola curah hujan
yang membentuk huruf U atau dengan kata lain memiliki satu puncak musim
hujan (unimodal). Pola monsun pada kabupaten Indramayu memiliki puncak

13

curah hujan (mm)

tepatnya pada bulan Januari karena rata-rata curah hujannya paling tinggi diantara
bulan-bulan lainnya. Gambar 3 juga dapat memperlihatkan periode musim hujan
dan musim kemarau yaitu musim hujan yang umumnya terjadi antara bulan
Oktober sampai Maret dan musim kemarau terjadi antara bulan April sampai
September.

bulan

Gambar 3 Pola curah hujan kabupaten Indramayu tahun 1979-2008
Tabel 1 menunjukkan bahwa pada bulan-bulan yang masuk dalam musim
hujan rata-rata curah hujan bulanannya relatif tinggi sedangkan pada bulan-bulan
di musim kemarau, curah hujannya relatif rendah. Simpangan baku terbesar
berada pada bulan Januari yaitu 126.30 mm yang menunjukkan bahwa curah
hujan pada bulan Januari 1979-2008 sangat beragam.
Tabel 1 Deskripsi data curah hujan kabupaten Indramayu tahun 1979-2008
Simpangan
Nilai
Nilai
Bulan
Rata-rata
Baku
Minimum Maksimum
Januari
308.80
126.30
78.70
582.60
Februari
226.80
106.90
89.80
521.30
Maret
161.20
57.20
75.70
280.10
April
141.24
46.49
54.47
245.67
Mei
86.43
46.09
6.40
185.67
Juni
62.11
41.24
9.93
166.87
Juli
30.66
33.55
0.00
153.33
Agustus
14.62
16.52
0.00
58.20
September
16.94
21.76
0.00
66.00
Oktober
63.76
51.07
0.07
165.60
November
148.20
83.50
17.50
346.20
Desember
210.60
62.40
122.70
402.20
Identifikasi curah hujan ekstrim pada kabupaten Indramayu dilakukan
dengan menggunakan metode block maxima, yaitu dengan membuat blok periode

14
waktu yaitu periode tahunan sehingga terdapat 30 blok (dari tahun 1979 sampai
2008). Setelah blok terbentuk selanjutnya ditentukan nilai curah hujan tertinggi di
setiap blok dan curah hujan tersebut dianggap sebagai curah hujan ekstrim seperti
yang tertera pada Tabel 2.
Tabel 2 Curah hujan ekstrim kabupaten Indramayu tahun 1979-2008
Curah Hujan
Curah Hujan
Curah Hujan
Tahun
Tahun
Tahun
(mm)
(mm)
(mm)
1979
301
1989
354
1999
264
1980
320
1990
383
2000
363
1981
583
1991
283
2001
326
1982
404
1992
343
2002
455
1983
293
1993
379
2003
242
1984
287
1994
508
2004
521
1985
278
1995
424
2005
235
1986
246
1996
414
2006
409
1987
267
1997
582
2007
356
1988
402
1998
346
2008
439
Data GCM
Eksplorasi dilakukan dengan membuat plot masing-masing peubah data
GCM (Lampiran 1), lalu mengevaluasi hubungan curah hujan dengan setiap
peubah data GCM menggunakan cross correlation function (CCF), sehingga
diperoleh peubah-peubah data GCM dengan time lag yang menghasilkan korelasi
paling tinggi dengan data curah hujan yang disajikan pada Lampiran 2.
Pemodelan selanjutnya dilakukan dengan menggunakan peubah data curah hujan
dan peubah data GCM sesuai dengan time lag yang terpilih.
Pemeriksaan kehomogenan ragam data GCM menggunakan test Bartlett atau
Levene untuk acuan dalam penentuan matriks yang akan digunakan pada
pereduksian dimensi GCM, dengan hipotesis berikut :
H0 : ragam data GCM homogen
H1 : ragam data GCM tidak homogen
Berdasarkan hasil uji kehomogenan ragam (Lampiran 4), diperoleh nilai
nilai − p < α = 0.05 sehingga H0 ditolak, berarti ragam dari data GCM tidak
homogen. Karena ragam data GCM tidak homogen, maka matriks yang digunakan
dalam reduksi dimensi data GCM adalah matriks korelasi.
Data GCM yang digunakan adalah data pengamatan yang bersesuaian
dengan data curah hujan ekstrim. Data GCM merupakan data bulanan dengan
luasan daerah berbentuk persegi berukuran 8 x 8 grid, sehingga terdapat 64
peubah X. Dimensi ini dianggap cukup besar untuk dianalisis, sehingga perlu
dilakukan pereduksian dimensi dari komponen peubah asal menjadi dimensi
komponen utama (KU), KU yang dihasilkan merupakan ringkasan dari peubah
asal dengan tetap mampu menjelaskan semaksimal mungkin peubah asalnya.
Tabel 3 menunjukkan bahwa jumlah komponen utama yang memiliki nilai
akar ciri yang lebih besar daripada satu (λi > 1) adalah sebanyak enam komponen
utama (KU). Kumulatif proporsi dari KU ke-1 sampai KU ke-6 bernilai 90.3% hal
ini menunjukkan bahwa KU tersebut mampu menjelaskan sebesar 90.3% peubah

15
asalnya. Analisis selanjutnya peubah respon (y) dalam hal ini adalah curah hujan
ekstrim di kabupaten Indramayu akan dimodelkan dengan enam peubah penjelas
(peubah data GCM yang direduksi menggunakan AKU) yang merupakan skor
komponen utama (KU 1 , KU 2 , KU 3 , KU 4 , KU 5 , KU 6 ) .
Tabel 3 Nilai akar ciri dan proporsi kumulatif analisis komponen utama
KU ke- Akar Ciri
Proporsi
Proporsi Kumulatif
1
41.452
0.648
0.648
2
8.386
0.131
0.779
3
3.281
0.051
0.830
4
2.046
0.032
0.862
5
1.482
0.023
0.885
6
1.119
0.017
0.903
7
0.960
0.015
0.918
8
0.766
0.012
0.930
9
0.695
0.011
0.940
10
0.543
0.008
0.949
11
0.391
0.006
0.955
12
0.384
0.006
0.961




63
0.000
0.000
1.000
64
0.000
0.000
1.000
Pemodelan
Sebaran Nilai Ekstrim GEV
Teori nilai ekstrim bertujuan untuk mengkaji perilaku stokastik suatu proses
pada suatu nilai ambang tertentu. Analisis ini juga memungkinkan untuk menduga
suatu kejadian ekstrim (yang diinterpretasikan oleh nilai return) dengan
menggunakan distribusi GEV. Hasil dugaan parameter-parameter GEV dan nilai
return disajikan secara lengkap pada Lampiran 5.
Tabel 4 menunjukkan bahwa penduga parameter lokasi µ , parameter skala
σ , dan parameter bentuk ξ tiap tahun memberikan hasil yang tidak terlalu jauh
berbeda. Hal ini ditunjukkan oleh nilai simpangan baku berturut-turut 5.549,
3.148, dan 0.094. Nilai ini menunjukkan tingkat keragaman yang relatif kecil.
Tabel 4 Nilai rata-rata dan simpangan baku dari nilai dugaan parameter GEV dan
nilai return
µ̂
Statistik
σˆ
ξˆ
R̂ 12
Rata-rata
Simpangan Baku

68.893
5.549

68.667
3.148

0.191
0.094

284
14.793

Hasil dugaan dari nilai return yang diperoleh memberikan nilai RMSE
sebesar 129.536, RMSEP sebesar 113.484, dan nilai korelasi sebesar 0.107. Nilai
RMSE dan RMSEP yang besar serta korelasi yang kecil tersebut menunjukkan

16
bahwa distribusi GEV belum cukup baik dalam menghasilkan nilai dugaan curah
hujan ekstrim di kabupaten Indramayu.
SD Berbasis Komponen Utama
Data curah hujan ekstrim di kabupaten Indramayu selanjutnya akan
dianalisis menggunakan regresi komponen utama (RKU) dan pendugaan
parameter-parameternya menggunakan metode kuadrat terkecil (MKT). Data
peubah penjelas (KU) yang dipilih adalah data yang bersesuian dengan data curah
hujan ekstrim di kabupaten Indramayu, sehingga kemungkinan akan mengalami
perubahan karakteristik pada peubah tersebut, namun setelah dilakukan pengujian,
nilai-nilai VIF semuanya lebih kecil dari 10 sehingga asumsi tidak adanya
multikolinearitas tetap terpenuhi pada peubah penjelas tersebut. Model RKU yang
dihasilkan yaitu :
y = 302 + 4.22 KU 1 − 4.71KU 2 − 4.00 KU 3 − 15.40 KU 4 + 7.70 KU 5 − 13.70 KU 6
Nilai R 2 = 16.3% menunjukkan bahwa pada model dengan MKT, data

GCM hanya dapat menjelaskan sebesar 16.3% keragaman dari data curah hujan
ekstrim kabupaten Indramayu. Hasil dugaan dari RKU memberikan nilai RMSE
sebesar 101.433, RMSEP sebesar 70.839, dan nilai korelasi sebesar 0.404. Nilainilai tersebut menunjukkan bahwa SD berbasis KU belum menghasilkan model
pendugaan yang baik.
SD Berbasis Model Aditif Terampat
Langkah selanjutnya dilakukan eksplorasi terhadap data. Eksplorasi
dilakukan dengan membuat matriks plot data untuk melihat indikasi awal apakah
ada pengaruh nonlinear atau tidak. Gambar 4 memperlihatkan bahwa hubungan
parsial antara peubah respon dengan masing-masing peubah penjelas ada yang
tidak linear. Hal ini jelas terlihat dengan sebaran data yang menyebar mengikuti
suatu sebaran nonlinear tertentu.
curah hujan ekstrim

curah hujan ekstrim

Skor komponen utama

Skor komponen utama

17
Gambar 4 Matriks plot antara data curah hujan ekstrim dengan KU terpilih
Hasil plot di atas menunjukkan bahwa sudah selayaknya dalam penentuan
model, pengaruh nonlinear diakomodasi karena jika ini tidak dilakukan, maka
model yang dihasilkan tidak cukup baik. Eksplorasi lebih lengkap disajikan pada
Lampiran 6 dan Lampiran 7 yang menunjukkan plot curah hujan ekstrim dengan
masing-masing KU terpilih. Plot tersebut dibentuk dari model dengan derajat
bebas terbaik atau dengan kata lain memiliki nilai GCV (generalized cross
validation) terkecil jika dibandingkan model dengan derajat bebas yang lain.
Derajat bebas terpilih untuk masing-masing hubungan fungsional antara curah
hujan ekstrim dengan KU akan dijadikan acuan dalam pemodelan GAM.
Model aditif terampat (GAM) merupakan model alternatif yang selanjutnya
digunakan untuk mengakomodasi pengaruh nonlinear dari peubah penjelas
melalui pendekatan regresi nonparametrik. Pemodelan regresi nonparametrik
memiliki kelenturan terutama dalam penentuan bentuk kurva yang tidak perlu
ditentukan secara a priori, tetapi kurva dibentuk sesuai dengan datanya (data
driven). Analisis GAM dilakukan dengan memodelkan curah hujan ekstrim
sebagai kombinasi aditif dari hubungan fungsional peubah KU terpilih. Hasil
analisis GAM disajikan secara lengkap pada Lampiran 8 dan Lampiran 9.
Berdasarkan hasil yang diperoleh pada Lampiran 8, terlihat bahwa peubah
penjelas KU2, KU3, dan KU5 memberikan pengaruh yang tidak nyata terhadap
peubah respon (curah hujan ekstrim), hal ini diakibatkan karena sebaran data pada
plot parsial yang ditunjukkan pada Lampiran 9 menyebar di daerah rataan yang
mengindikasikan bahwa tidak ada kontribusi dari peubah penjelas KU2, KU3, dan
KU5 terhadap peubah curah hujan ekstrim. Sehingga pemodelan dengan GAM
dilakukan hanya dengan melibatkan peubah penjelas KU1, KU4, dan KU6. Model
GAM yang diperoleh, yaitu: y = f (KU 1) + f (KU 4 ) + f (KU 6 )
Tabel 5 Hasil analisis model aditif terampat
Hubungan
Derajat
F
Nilai p
λ
Fungsional
Bebas
f(KU1)
8.517
4.047
0.001
1.499
f(KU4)
1.000
6.171
0.017
0.362
f(KU6)
3.655
2.164
0.080
1.500
Berdasarkan metode GAM diperoleh nilai λ optimum yang
menggambarkan tingkat kemulusan kurva dari masing-masing peubah penjelas.
Selain itu, juga diperoleh plot hubungan fungsional peubah penjelas pada Gambar
5 yang mempertegas hasil sebelumnya, dimana hubungan antara peubah respon
dengan beberapa peubah penjelas bersifat