Model Aditif Terampat Vektor Dengan Komponen Utama Untuk Pendugaan Curah Hujan Ekstrim (Studi Kasus: Indramayu).

MODEL ADITIF TERAMPAT VEKTOR DENGAN KOMPONEN
UTAMA UNTUK PENDUGAAN CURAH HUJAN EKSTRIM
(STUDI KASUS: INDRAMAYU)

EKA PUTRI NUR UTAMI

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul “Model Aditif Terampat
Vektor dengan Komponen Utama untuk Pendugaan Curah Hujan Ekstrim (Studi
Kasus: Indramayu)” adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi
manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada

Institut Pertanian Bogor.
Bogor, Januari 2016

Eka Putri Nur Utami
NIM G151130091

* Pelimpahan hak cipta atas karya tulis dari penelitian kerjasama dengan pihak luar IPB harus
didasarkan pada perjanjian kerjasama yang terkait

RINGKASAN
EKA PUTRI NUR UTAMI. Model Aditif Terampat Vektor dengan Komponen
Utama untuk Pendugaan Curah Hujan Ekstrim (Studi Kasus: Indramayu).
Dibimbing oleh AJI HAMIM WIGENA dan ANIK DJURAIDAH.
Perubahan iklim yang terjadi beberapa tahun terakhir ini mengakibatkan
terjadinya curah hujan ekstrim. Curah hujan ekstrim ini berpotensi menimbulkan
banjir yang akhirnya dapat mengakibatkan gagal panen. Oleh karena itu
pemodelan curah hujan diperlukan untuk meminimumkan dampak yang terjadi.
Statistical downscaling (SD) merupakan model statistik yang digunakan
untuk menduga curah hujan (berskala lokal) dengan memanfaatkan informasi dari
data luaran global circulation model (GCM). Data GCM adalah data hasil

simulasi komputer yang memanfaatkan kaidah fisika, kondisi lautan, dan
perubahan iklim pada atmosfer bumi yang dapat digunakan untuk menduga unsurunsur iklim saat ini ataupun di masa yang akan datang. Permasalahan yang
muncul dalam metode SD adalah penentuan teknik statistika yang tepat untuk
memodelkan curah hujan ekstrim.
Sebaran nilai ekstrim yang biasa digunakan dalam teori nilai ekstrim adalah
generalized extreme value (GEV) dan generalized pareto distribution (GPD).
Penggunaan sebaran GEV memiliki kelemahan yaitu akan menghilangkan banyak
data amatan. Oleh karena itu diusulkan untuk menggunakan GPD.
Pemodelan yang dapat digunakan dalam SD antara lain model aditif
terampat (generalized additive model/GAM) yang dapat mengatasi pengaruh
nonlinier masing-masing peubah penjelas terhadap peubah respon dengan teknik
pemulusan. Kekurangan dari metode ini adalah GAM hanya terbatas pada
sebaran-sebaran yang termasuk ke dalam sebaran keluarga eksponensial,
sedangkan GPD tidak termasuk ke dalam sebaran keluarga eksponensial. Selain
itu, metode GAM hanya dapat membuat satu fungsi hubung dari parameter
sebarannya. Permasalahan tersebut, diatasi dengan vector generalized additive
model (VGAM). Teknik ini merupakan perluasan dari model aditif terampat
karena VGAM yang tidak terbatas pada sebaran keluarga eksponensial. Tujuan
dari penelitian ini adalah menduga curah hujan ekstrim menggunakan VGAM
berdasarkan sebaran GPD di Kabupaten Indramayu.

Data curah hujan di Indramayu digunakan sebagai peubah respon dan data
presipitasi GCM sebagai peubah penjelas. Data penelitian dibagi menjadi dua
yaitu data tahun 1979-2007 untuk pemodelan dan data tahun 2008 sebagai validasi
model. Ukuran grid data GCM yang digunakan yaitu ukuran � × dan 8� × 8.
Sifat dari data GCM yang berdimensi tinggi dan terdapat multikolinearitas diatasi
dengan menggunakan analisis komponen utama.
Pemodelan VGAM dilakukan terhadap data yang lebih besar dari nilai
ambang dengan menggunakan metode backfitting vector. Pemilihan nilai ambang
ini dilakukan dengan menggunakan mean residual life plot (MRLP). Pemulusan
data menggunakan pemulusan spline dan pemilihan derajat bebas optimum
dilakukan dengan memilih nilai Akaike Information Criterion (AIC) terkecil.
Pemodelan dilakukan dengan memodelkan keseluruhan bulan, dan membagi
bulan dalam empat kelompok. Kelompok tersebut adalah bulan hujan, peralihan

hujan-kering, kering, dan peralihan kering-hujan. Model yang dibuat adalah
model keseluruhan dan model setiap kelompok.
Hasil analisis komponen utama menghasilkan dua komponen utama untuk
data grid � × dan empat komponen utama untuk data grid 8� × 8�. Proporsi
keragaman kumulatif yang dihasilkan adalah 96% untuk data ukuran grid � ×
dan 95% untuk grid 8� × 8. Berdasarkan hasil MRLP diperoleh nilai ambang

secara keseluruhan adalah 145. Nilai ambang untuk kelompok bulan hujan,
peralihan hujan-kering, kering, dan peralihan kering-hujan berturut-turut adalah
145, 100,10 dan 45.
Hasil pemodelan VGAM pada tahap awal menunjukkan data grid � ×
menghasilkan nilai root mean square error prediction (RMSEP) yang lebih
rendah dibandingkan dengan data grid 8 × 8 . Oleh karena itu pada tahap
selanjutnya pemodelan dilakukan dengan menggunakan data grid � × . Secara
keseluruhan hasil pendugaan curah hujan dengan metode VGAM yang berbasis
GPD mampu menghasilkan pola dugaan yang mirip dengan data aktual.
Penggunaaan kuantil yang berbeda untuk setiap kelompok bulan menghasilkan
dugaan yang lebih baik. Kelompok bulan kering memiliki nilai dugaan yang
mendekati aktual pada kuantil rendah yaitu kuantil 5 dan 10, kelompok bulan
hujan pada kuantil 75, kelompok bulan peralihan hujan-kering pada kuantil 50,
sedangkan pada kelompok bulan peralihan kering-hujan dugaan terbaik yaitu pada
kuntil 25. Kebaikan model menunjukkan bahwa model VGAM dengan GPD
menghasilkan dugaan yang konsisten meskipun panjang data dugaan ditambah,
nilai RMSEP yang dihasilkan tidak jauh berbeda jika dibandingkan dengan
melakukan dugaan pada satu tahun.

Kata kunci : generalized pareto distributions, model aditif terampat vektor,

statistical downscaling, teori nilai ekstrim

SUMMARY
EKA PUTRI NUR UTAMI. Vector Generalized Additive Model with Principal
Components to Estimate Extreme Rainfall (Case Study: Indramayu). Supervised
by AJI HAMIM WIGENA and ANIK DJURAIDAH.
In the last few years, climate change happened and caused extreme rainfall.
A high extreme rainfall potentially cause flooded and then impact on agricultural.
Therefore modeling rainfall data needed to minimize the impact.
Statistical downscaling (SD) is a statistical model to predict rainfall data
(local-scale) by using the information of global circulation model (GCM). The
GCM data is a computer simulation result of a large number interaction of
physics, chemistry, and dynamics of the earth’s atmosphere. GCM can be used to
predict climate elements in the future. The problems for SD are to choose the
methods for modeling the extreme events.
There are two distributions in extreme value theory. They are generalized
extreme value (GEV) and generalized pareto distributions (GPD). Modeling based
on GEV will elliminate some data, than proposed modeling with generalized
pareto distributions (GPD).
One of the models used in SD is generalized additive models (GAM). The

advantage of GAM is it can be solved the non-linear effects of predictor variables
to responses variable by using a smoothing technique. Unfortunately, GAM are
restricted to one-parameter distributions within the classical exponential family,
whereas GPD is not included of exponential family. So, there are a new method to
solve this problems. The methods known as vector generalized models (VGAM).
The method of VGAM is claimed to be a larger framework of distribution.
VGAM was an extension from generalized additive models which is not restricted
for exponential family. The purpose of this research is to predict the rainfall data
in Indramayu based on extreme value distribution (GPD) with VGAM technique.
This research used monthly rainfall data in Indramayu from1979 to 2008 as
independent variable and precipitation from GCM as dependent variables. The
data divided into two parts, first is 1979-2007 as data modeling and then 2008 as
data validation. There are two size of grid for GCM data, that is � × and
8� × 8. Principal compenent analysis used to reduce the dimention of the data and
solved the multicollinearity.
Data for modeling are the rainfall data that is greater than the threshold
value. The threshold values choosed by using the mean residual life plot (MRLP).
The method of VGAM are estimated by vector backfitting algorithm with vector
smoothing. The optimum degree of freedom from smoothing is choosed by the
minimum Akaike Information Criterion (AIC). For the first step, modeling the

data for all month and then modeling data for group of month. The groups are
rainfall, rainfall-dry transition, dry and transition dry-rainfall.
The result of principal component analysis show that there are two
components choosed for grid data � × and four components for 8� × 8. The
cumulative proportion of data variety is 96% for grid data � × and 95% for
grid data 8� × 8. Based on MRLP, the threshold value for all months is 145 and

the threshold value for group rainy, rainy-dry transition, dry and dry-rainy
transition are 145, 100, 10 and 45 respectively.
For the model of all month, VGAM result shows that the model from grid
data � × have the lowest value of RMSEP than the model from grid data 8� ×
8. So for the next step, modeling is use with the data from grid � × . Overall, the
result show that predicted value have the same pattern with the actual data. By
using different quantile for each group of month can give a better estimation than
using a same quantile. Dry group have a good predicted value at quantile 5 and
10, but for the rainy group is at quantile 75. Goodness of fit model showed that
VGAM based on GPD can give consistent result for different length data.
Keywords : extreme value theory, generalized pareto distribution, statistical
downscaling, vector generalized additive model.


© Hak Cipta Milik IPB, Tahun 2016
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah, dan pengutipan tersebut tidak merugikan kepentingan
IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apapun tanpa izin IPB

MODEL ADITIF TERAMPAT VEKTOR DENGAN
KOMPONEN UTAMA UNTUK PENDUGAAN
CURAH HUJAN EKSTRIM
(STUDI KASUS: INDRAMAYU)

EKA PUTRI NUR UTAMI

Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada

Program Studi Statistika

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016

Penguji Luar Komisi pada Ujian Tesis : Dr Ir Kusman Sadik, MSi

Judul Tesis : Model Aditif Terampat Vektor dengan Komponen Utama untuk
Pendugaan Curah Hujan Ekstrim (Studi Kasus: Indramayu)
Nama
: Eka Putri Nur Utami
NIM
: G151130091

Disetujui oleh
Komisi Pembimbing

Dr Ir Aji Hamim Wigena, MSc

Ketua

Dr Ir Anik Djuraidah, MS
Anggota

Diketahui oleh

Ketua Program Studi
Statistika

Dekan Sekolah Pascasarjana

Dr Ir Kusman Sadik, MSi

Dr Ir Dahrul Syah, MScAgr

Tanggal Ujian : 19 November 2015

Tanggal Lulus :


PRAKATA
Puji syukur penulis panjatkan kepada Allah SWT atas limpahan rahmat dan
karunia-Nya sehingga penulis dapat menyelesaikan tesis yang berjudul “Model
Aditif Terampat Vektor dengan Komponen Utama untuk Pendugaan Curah Hujan
Ekstrim (Studi Kasus: Indramayu)”. Sesungguhnya penyelesaian tugas akhir ini
semuanya adalah berkat kemudahan dan pertolongan dari-Nya.
Terima kasih penulis ucapkan kepada Bapak Dr.Ir.Aji Hamim Wigena, MSc
dan Ibu Dr.Ir.Anik Djuraidah,MS selaku pembimbing, yang telah sabar
membimbing penulis dalam penyusunan tesis ini. Penulis juga mengucapkan
ucapan terima kasih kepada Bapak Dr.Ir.Kusman Sadik MSi sebagai dosen
penguji dan Ibu Dr. Ir. Indahwati,MSi selaku dosen perwakilan prodi statistika
yang telah meluangkan waktunya hadir pada sidang tesis saya.
Penulis juga mengucapkan ucapan terimakasih yang sebesar-besarnya
kepada seluruh dosen departemen Statistika IPB yang telah mendidik dan
memberikan ilmunya kepada penulis selama di bangku kuliah hingga berhasil
menyelesaikan studi, serta seluruh staf departemen Statistika IPB atas bantuan,
pelayanan, dan kerjasamanya selama ini.
Terimakasih juga kepada rekan-rekan satu grup riset downscaling, Bapak
Agus M Soleh serta Shynde Limar Kinanti dan Dewi Santri atas kerjasamanya
selama ini dalam penelitian downscaling sehingga penyusunan tesis ini dapat
selesai dengan baik.
Ucapan terima kasih yang tulus dan penghargaan yang tak terhingga juga
penulis ucapkan kepada kedua orangtua, Bapak Isman dan Ibu Nuriyah yang
telah memberikan kasih sayangnya kepada penulis dan mendidik penulis dengan
penuh kasih sayang. Selain itu kepada kedua adikku tersayang Lena Dwi
Prestiyani dan Widiya Tri Astuti atas doa dan semangatnya.
Terakhir tak lupa penulis juga mengucapkan terima kasih kepada seluruh
mahasiswa Pascasarjana departemen Statistika atas kerjasama dan
kebersamaannya selama menghadapi masa-masa perkuliahan baik itu senang
ataupun susah. Terimakasih karena telah menciptakan kenangan yang takkan
terlupakan. Semoga tesis ini dapat bermanfaat bagi semua pihak yang
membutuhkan.

Bogor, Januari 2016

Eka Putri Nur Utami

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

1 PENDAHULUAN
Latar Belakang
Tujuan Penelitian

1
1
2

2 TINJAUAN PUSTAKA
Statistical Downscaling (SD)
Teori Nilai Ekstrim
Model Aditif Terampat Vektor (VGAM)
Model Aditif Terampat Vektor untuk Nilai Ekstrim

3
3
4
6
10

3 METODE PENELITIAN
Data
Analisis Data

11
11
11

4 HASIL DAN PEMBAHASAN
Eksplorasi Data
Penentuan Nilai Ambang
Pemodelan GCM

13
13
13
15

5 SIMPULAN DAN SARAN
Simpulan
Saran

25
25
25

DAFTAR PUSTAKA

26

LAMPIRAN

27

RIWAYAT HIDUP

38

DAFTAR TABEL
1. Nilai akar ciri dan proporsi keragaman dari kumulatif analisis
komponen utama
2. Nilai AIC dari model VGAM pada beberapa derajat bebas
3. Nilai RMSEP untuk model awal
4. Hasil uji sebaran GPD dengan uji Kolmogorov-Smirnov
5. Nilai AIC dari model VGAM pada beberapa derajat bebas pemulus
setiap komponen utama
6. Penduga parameter VGAM masing-masing kelompok bulan
7. Nilai RMSEP data dugaan pada berbagai kuantil
8. Nilai RMSEP pada panjang data dugaan yang berbeda
9. Nilai korelasi data dugaan dengan data aktual pada pada panjang data
dugaan yang berbeda

15
16
18
19
19
21
23
23
24

DAFTAR GAMBAR
1 . Ilustrasi proses statistical downscaling
2 . Pola curah hujan Kabupaten Indramayu tahun 1979-2008
3. Grafik MRLP data curah hujan
4. Grafik hubungan pendugaan parameter GPD dengan
nilai ambang data curah hujan rata-rata
5. Pengepasan model VGAM pada data berukuran ×
6. Pengepasan model VGAM pada data berukuran 8 × 8
7. MRLP curah hujan masing-masing kelompok bulan
8. Pengepasan model VGAM pada model kelompok curah hujan
9. Grafik hasil validasi silang model terhadap data curah
hujan tahun 2008 pada kuantil atas
10. Grafik hasil validasi silang model terhadap data curah hujan tahun 2008
pada kuantil bawah sampai atas

3
13
14
14
17
17
18
20
22
22

DAFTAR LAMPIRAN
1.
2.
3.
4.

Plot diagnostik kecocokan data curah hujan dengan GPD
Plot curah hujan ekstrim dengan skor komponen utama terpilih
Nilai dugaan curah hujan tahun 2008 pada model awal
Grafik hubungan pendugaan parameter dengan nilai ambang pada data
curah hujan setiap kelompok bulan
5. Plot diagnostik untuk nilai ambang terpilih setiap kelomok bulan
6. Plot pemulusan pada data curah hujan rata-rata berdasarkan kelompok
bulan
7. Nilai aktual dan dugaan curah hujan pada model setiap kelompok bulan
pada tahun 2008

27
28
29
32
33
35
37

1 PENDAHULUAN
Latar Belakang
Indonesia merupakan negara kepulauan yang beriklim tropis. Perubahan
iklim yang terjadi beberapa tahun terakhir ini mengakibatkan terjadinya curah
hujan ekstrim. Curah hujan ekstrim merupakan kondisi curah hujan yang sangat
tinggi atau sangat rendah. Curah hujan ekstrim tinggi berpotensi menimbulkan
banjir yang akhirnya mengakibatkan gagal panen. Oleh karena itu diperlukan
pendugaan melalui suatu pemodelan untuk mengantisipasi dampak yang akan
terjadi.
Penelitian mengenai pemodelan curah hujan menjadi salah satu hal penting
untuk memprediksi curah hujan. Salah satu metode pemodelan curah hujan adalah
dengan memanfaatan data Global Circulation Model (GCM). Menurut Wigena
(2006) GCM merupakan sumber informasi primer dan dapat digunakan untuk
memprediksi iklim dan cuaca secara numerik. GCM merupakan model peramalan
curah hujan pada skala lokal dengan mempertimbangkan berbagai informasi
atmosfer global yang disimulasikan.
Teknik statistika yang menyatakan hubungan fungsional antara peubahpeubah luaran GCM dengan peubah respon lokal dikenal dengan statistical
downscaling (SD). Peubah respon lokal yang digunakan untuk pemodelan curah
hujan adalah curah hujan daerah setempat dan data GCM sebagai peubah skala
global. Pemodelan SD dengan menggunakan data GCM menyertakan peubah
berdimensi besar yang saling berkorelasi, sehingga untuk mengatasi hal ini
pereduksian dimensi umumnya dilakukan dengan menggunakan analisis
komponen utama.
Permasalahan yang muncul dalam metode SD adalah menentukan teknik
statistika yang tepat. Berbagai penelitian mengenai metode SD sudah dikaji dan
menunjukkan gambaran perkembangan pemodelan SD banyak mengarah ke
teknik statistika berbasis regresi parametrik, semi parametrik atau statistika
nonparametrik. Penelitian mengenai pemodelan semi parametrik dilakukan oleh
Rizki (2014) dan memperoleh kesimpulan bahwa pola hubungan fungsional curah
hujan dengan komponen utama memiliki hubungan yang berupa gabungan
parametrik dan nonparametrik yaitu semiparametrik kubik.
Penelitian mengenai curah hujan yang berbasis nilai ekstrim telah
dilakukan sebelumnya. Secara umum data curah hujan tidak mengikuti sebaran
normal, sehingga pemodelan baku tidak dapat dilakukan. Beberapa penelitian
menyatakan bahwa curah hujan memiliki sebaran gamma. Sedangkan untuk curah
hujan ekstrim, banyak pendekatan dilakukan dari teori nilai ekstrim.
Penelitian curah hujan ekstrim sudah dilakukan antara lain oleh Mondiana
(2012) yang menggunakan regresi kuantil, dan Handayani (2014) yang melakukan
penelitian mengenai SD untuk curah hujan berdasarkan sebaran nilai ekstrim
Generalized Extreme Value (GEV). Menurut Mallor (2009) pemilihan nilai
ekstrim dengan metode block maxima yang mengikuti sebaran GEV akan
mengakibatkan hilangnya banyak data, sehingga baik digunakan jika data yang
dimiliki sangat banyak. Alternatif lain dalam pemilihan nilai ekstrim adalah
dengan metode peaks over threshold (POT). Nilai ekstrim yang diperoleh dari
metode ini akan mengikuti sebaran generalized pareto distribution (GPD).

2
Contoh penelitian curah hujan yang berdasarkan sebaran GPD adalah Li et
al. (2005) yang mengidentifikasi curah hujan ekstrim di wilayah Australia.
Penelitian tersebut tidak menggunakan peubah penjelas dalam pemodelan curah
hujan ekstrim, hanya menduga parameter-parameter GPD. Oleh karena itu
penelitian kali ini akan melakukan pemodelan curah hujan ekstrim yang
mengikuti sebaran GPD dengan mengikutsertakan pengaruh peubah luaran GCM.
Model aditif terampat (generalized additive model/GAM) adalah suatu
metode nonparametrik yang dapat digunakan untuk memodelkan data GCM.
GAM merupakan generalisasi dari model linier terampat (generalized linear
model /GLM). Metode GAM mengganti bentuk linier hubungan Y dan X sebagai
suatu hubungan fungsional yang diharapkan mampu mengatasi pengaruh nonlinier
terhadap peubah y (Hastie dan Tibshirani, 1986)
Kelemahan dari metode GLM dan GAM adalah peubah respon terbatas
pada sebaran keluarga eksponensial, sedangkan GPD tidak termasuk kedalam
keluarga eksponensial. Yee dan Wild (1996) memperkenalkan teknik model aditif
terampat vektor (vector generalized aditif model/VGAM) yang merupakan
perluasan dari teknik GAM, teknik ini memperluas teknik GAM ataupun GLM
dalam tiga cara utama:
1. Sebaran y tidak terbatas hanya untuk keluarga eksponensial
2. Mampu mengatasi multi respon y dengan prediktor linear atau
prediktor aditif
3.
tidak harus merupakan fungsi dari mean , akan tetapidapat sebagai
fungsi dari parameter lainnya, yaitu � = � g
untuk setiap
parameter
Sehingga VGAM dapat mengatasi banyak sebaran dan model yang
memungkinkan. Yee dan Wild (1996) telah mengembangkan metode
VGLM/VGAM yang menjadi dasar berkembangnya metode tersebut. Salah
satunya dilakukan oleh Yee dan Stephenson (2007) mengenai VGLM/VGAM
untuk nilai ekstrim. Penelitian tersebut menggunakan sebaran dari teori nilai
ekstrim yaitu GEV dan GPD sebagai dasar dalam pemodelanVGAM. Sehingga
dalam penelitian kali ini metode tersebut akan dikaji dan diikuti namun dengan
menggunakan data presipitasi dari data luaran GCM sebagai bagian dari statistical
downscaling. Teknik VGAM diharapkan mampu menduga curah hujan ekstrim
yang terjadi di wilayah Indramayu.
Tujuan Penelitian
Tujuan penelitian ini adalah menduga curah hujan ekstrim menggunakan
model aditif terampat vektor berdasarkan sebaran GPD di Kabupaten Indramayu.

3

2 TINJAUAN PUSTAKA
Statistical Downscalling
Data GCM adalah data hasil simulasi komputer yang memanfaatkan
kaidah fisika, kondisi lautan, dan perubahan iklim pada atmosfer bumi yang dapat
digunakan untuk menduga unsur-unsur iklim saat ini ataupun di masa yang akan
datang. Data yang dihasilkan GCM berupa unsur-unsur iklim dalam bentuk grid
(persegi) . Setiap grid berukuran . ° � × � . ° dan memiliki nilai unsur-unsur iklim
masing-masing. Namun, data GCM masih berskala global dan tidak cocok
digunakan untuk menduga unsur-unsur iklim pada skala yang lebih kecil.
Resolusi data GCM yang rendah tidak cocok digunakan sebagai penduga data
berskala lokal, tetapi masih memungkinkan sebagai penduga jika menggunakan
teknik downscaling.
Downscaling adalah suatu teknik transformasi hasil simulasi GCM pada
skala besar ke dalam skala yang lebih kecil. Statistical downscaling (SD) adalah
proses downscaling yang memanfaatkan ilmu statistika untuk menduga data
berskala lokal. SD didasarkan pada pandangan bahwa iklim regional dikondisikan
oleh dua faktor yaitu iklim skala global dan kondisi fisiografi lokal yaitu curah
hujan di daratan (Wilby et al. 2004). Gambar 1 menunjukkan ilustrasi dari SD.
Output dari data GCM adalah memberikan masukan untuk pemodelan
statistik terhadap data daerah lokal yang berhubungan. SD dapat dimulai
denganmenghubungkan variabel iklim skala global X dengan variabel-variabel
lokal Y . Luaran skala besar dari simulasi GCM dimasukkan sebagai input bagi
model statistik tersebut untuk memperkirakan karakteristik iklim lokal atau
regional yang bersangkutan. Bentuk umum dari model SD adalah:
�=f �
dengan ,

: peubah iklim lokal (curah hujan)

: peubah GCM (presipitasi)
t
: banyaknya waktu (bulanan)
g
: banyaknya grid domain GCM

Gambar 1 Ilustrasi proses statistical downscaling
Sumber:Wilby RL & Dawson (2007)

4
Teori Nilai Ekstrim
Teori nilai ekstrim (extreme value theory, EVT) merupakan salah satu cara
yang dapat digunakan untuk memodelkan kejadian-kejadian ekstrim. Hal yang
membedakan antara EVT dengan teknik statisktika lain adalah EVT bertujuan
untuk menghitung pola stokastik dari amatan yang sangat besar atau sangat kecil
dibandingkan dengan amatan lain. Analisis nilai ekstrim biasanya memerlukan
pendugaan dari sebaran amatan yang lebih ekstrim dari yang sudah diamati (Coles
2001).
Model EVT didasarkan pada kejadian-kejadian ekstrim. Misalkan peubah
acak Y , Y … , Y yang bebas stokastik identik dengan sebaran F maka EVT
didasarkan pada nilai M �yaitu
M = maks{Y , … , Y }
Sebaran Mn pada teori dapat diturunkan dengan mudah jika sebaran Y diketahui.
Pemilihan kejadian ekstrim terdiri dari dua cara, pertama memilih kejadian
ekstrim dalam suatu blok atau yang dikenal dengan block maxima sehingga data
mengikuti sebaran generalized extreme value distribution (GEV). Fungsi sebaran
GEV adalah sebagai berikut :

y−
ξ
] }
F y = exp {− [ + ξ
σ
y−µ

dengan x ∶ + ξ
> , -∞ < µ < ∞, σ > 0 dan -∞ < ξ < ∞, dalam model ini ξ,
σ
σ, dan µ berturut-turut adalah parameter bentuk, skala, dan lokasi.
Kelemahan dari metode blok maxima adalah keharusan membagi data ke
dalam ukuran blok yang sama. Selain itu pemilihan nilai maksimum dari setiap
blok akan mengakibatkan hilangnya banyak data amatan. Oleh karena itu metode
kedua yang digunakan untuk menentukan kejadian ekstrim adalah dengan
menentukan nilai ambang u dan dikenal dengan metode pemilihan nilai ambang
(peaks over threshold/POT) . Metode POT ini akan mengakibatkan data
mengikuti sebaran generalized pareto distribution (GPD). Kejadian-kejadian
ekstrim didefinisikan sebagai data Y yang lebih besar dari u. Dalam terminologi
kejadian ekstrim Y − u disebut excesses (Yee 2007).
Fungsi sebaran Y − u untuk Y > u didekati dengan fungsi berikut yang
dikenal dengan sebaran pareto terampat (generalized pareto distribution/GPD).
G y =�{

σ

−�

−�exp

ξy −� ξ
���������, ξ
σ
−y

+�

dan fungsi kepekatan GPD:
g� y = � {σ

σ

������������������, ξ =

ξy −� ξ −
σ
−y

+�

exp

σ

σ



���������, ξ ≠

������������������, ξ =

(1)

5
dalam model ini ξ adalah parameter bentuk, dan σ adalah parameter skala.
Sebaran GPD akan menjadi bentuk pareto jika nilai ξ > . Hubungan antara
sebaran GPD dengan pareto dapat diturunkan sebagai berikut:

jika ξ > maka � = �


g� y = � �

+�



=� �


+�

=� �




=� �





=

� �

=







� �


� �−�

+




� �




� �−

��


�−













�−




�−






�−

�−



���

+

� �


+

��
Sehingga fungsi kepekatan pareto adalah:
��� �
h� y = �+


dengan � = �� dan merupakan parameter dari sebaran pareto.




Penentuan nilai ambang u pada GPD dapat ditentukan dengan berbagai
cara salah satunya adalah dengan menggunakan mean residual life plot (MRLP).
Pemilihan nilai ambang dengan menggunakan MRLP dianalogikan seperti
menentukan ukuran blok yang akan dipilih sehingga ada keseimbangan antara
bias dan keragaman. Nilai ambang yang terlalu rendah mengakibatkan pendekatan
dari model yang gagal atau parameter yang diduga bias meskipun ragamnya kecil
sedangkan nilai ambang yang terlalu tinggi akan mengakibatkan jumlah nilai
excesses yang diamati sedikit sehingga mengakibatkan keragaman yang tinggi.
Prosedur untuk menentukan nilai ambang ini dapat dilakukan dengan cara
membentuk MRLP. Titik plot X, Y dalam MRLP ditentukan berdasarkan:
{ u�,���

u

∑ =u (y

− u) ��������� ∶ u < � y

s}

dengan y , … . , y u � adalah observasi sebanyak nu yang melebihi nilai u dan
y s �adalah nilai terbesar dari Yi. Interpretasi dari MRLP tidak selalu mudah dan
sedikit subjektif. Nilai ambang batas yang dipilih adalah nilai yang berada diatas
nilai dimana plot mendekati linear terhadap u ( Mallor et al. 2009).
Pendugaan parameter dari sebaran GPD dapat dilakukan dengan
menggunakan metode kemungkinan maksimum. Jika terdapat y , … , y adalah k

6
banyaknya pengamatan yang melebihi nilai ambang u. Untuk ξ ≠
kemungkinan didapatkan dari persamaan (1) menjadi
ξy
ℓ� �σ, ξ� = � −k log σ − � + � � �∑ = log � + � �
ξ

���

fungsi log-

σ

dengan syarat � + �
> untuk i= 1, ...,k . Maksimisasi dari fungsi log�
kemungkinan tersebut dibutuhkan teknik analisis numerik, dan salah satu analisis
numerik yang digunakan adalah metode Newton Raphson.
Model Aditif Terampat Vektor

Regresi linear klasik memerlukan asumsi bahwa peubah respon mengikuti
sebaran Normal. Kenyataannya, banyak ditemukan peubah respon yang tidak
mengikuti sebaran Normal. Oleh karena itu dikembangkan suatu metode yang
dapat mengatasi peubah respon yang tidak menyebar normal yaitu model linier
terampat (generalized linear model/GLM). Regresi linear, regresi Poisson, regresi
logistik, analisis probit dan beberapa model lainnya dapat diperlakukan sebagai
kasus dari GLM. Peningkatan yang utama dari GLM dibandingkan regresi linear
adalah kemampuan untuk mengatasi kelas sebaran peubah respon yang lebih besar
tetapi masih termasuk ke dalam keluarga eksponensial.
Terdapat tiga komponen utama dalam GLM yaitu (McCullagh dan Nelder
1983):
1. Komponen acak: komponen acak adalah peubah respon Y. Dalam
model linier terampat peubah respon diasumsikan mengikuti sebaran
keluarga eksponensial.
2. Komponen sistematik: komponen sistematik adalah kombinasi linier
dari x , x , … , xp . Sehingga dapat dituliskan sebagai berikut:
p
=�∑ = β X
disebut juga sebagai penduga linier atau linear predictor dan β
adalah konstanta.
3. Fungsi hubung: yaitu fungsi yang menghubungkan antara komponen
acak dengan komponen sistematik. Misalkan E� y = � selanjutnya
dapat dibuat hubungan
p
g
= � =�∑ = β X
Fungsi hubung yang berpola linier memiliki keterbatasan yaitu tidak
mampu mengatasi hubungan nonlinier antara peubah respon dengan peubah
bebas. Oleh karena itu dikembangkan model aditif terampat atau generalized
additive models (GAM) sebagai model semi-parametrik yang dapat mengatasi
pengaruh tidak linier peubah respon. GAM merupakan bentuk aditif dari model
GLM dengan mengubah bentuk linier dari ∑ β x menjadi penjumlahan
hubungan fungsional f . � antara peubah bebas dengan peubah respon yang
dimodelkan secara nonparametrik dengan suatu fungsi pemulus (Hastie dan
Tibshirani 1987). Bentuk umum model GAM adalah sebagai berikut:
=�β + ∑ = f X

Batasan dalam metode GLM/GAM yaitu metode ini hanya dapat
memodelkan satu parameter dari sebarannya. Contohnya pada model linier,
peubah respon Y diasumsikan mengikuti sebaran Normal �, � dengan fungs

7
hubung
= � = �T� �. Teori standar GLM/GAM memperlakukan parameter σ
sebagai skala.
Yee dan Wild (1996) mengusulkan suatu metode yang lebih luas yang
mampu memodelkan lebih dari satu parameter dan tidak terbatas hanya pada
keluarga eksponensial. Metode ini dikenal dengan vector generalized linear model
(VGLM) dan vector generalized additive model (VGAM). VGLM/VGAM
merupakan perluasan dari model GLM/GAM dengan mengikutsertakan lebih dari
satu prediktor aditif ( ) (Mackenzie dan Yee 2002). Banykanya prediktor aditif
( ) yang dapat diikutseratkan maksimal sebanyak jumlah parameter dari sebaran
yang digunakan. Sehingga VGLM/VGAM diklaim berpotensial untuk menangani
berbagai model dari bermacam-macam sebaran.
Bentuk umum dari VGLM adalah sebagai berikut:
f �|�;

= h �,

,…,

(2)

m adalah banyaknya parameter dalam sebaran yang digunakan.
= �T, … , �T ,

dengan

=�

T

dan �T� = �β

x = �� β + � β

…�β

�x + ⋯ + β

p

p

dan
�xp = � β + ∑

Persamaan (3) dalam bentuk umum VGAM berubah menjadi
� =�β

+�f

�x + ⋯ + f

p �xp

=�β

+�∑

p
=

f

p
=

β

x ����

x

(3)

(4)

Model dalam persamaan (2) , dapat dibuat menjadi bentuk log-kemungkinan

dengan

ℓ � =�∑ = � {

� }

� ,…,

� = � �T � . Nilai � β = � ϑℓ⁄ϑβ menunjukkan skor vektor

=�

untuk model dan ℐ � = �

−ϑ ℓ �


adalah matriks informasi. Algoritma
ϑ��ϑ�T

Newton-Raphson untuk memaksimalkan log-kemungkinan adalah


+ℐ �





=��



�−

= � ∑ = � T ��



��� �



Untuk setiap iterasi a. dapat dituliskan dalam bentuk iterasi kuadrat terkecil
terboboti yang pertama kali diperkenalkan oleh Green (1984):


∑��=� � �� �� �− �

dengan � adalah matriks berukuran m × m dengan element (j, k)
ϑ ℓ

= � −�
ϑ ϑ
Persamaan (4) merupakan penjumlahan fungsi pemulusan dari peubah
bebas yang diduga secara simultan. Proses pemulusan dalam model aditif
terampat merupakah langkah penting dalam proses pendugaan. Pada metode
GAM, pemulusan dilakukan dengan pemulusan spline. Oleh karena itu pada
metode VGAM pemulusan dilakukan dengan menggunakan pemulusan vektor
spline. Fungsi pemulusan vektor f(x) yang dituliskan f x , … , f x � T dapat
diduga dengan meminimumkan jumlah kuadrat terpenalti, yaitu:

8
∑ = {� − �� x �}T ∑− {� − �� � } + � ∑ =

∫ f ′′ t �dt (5)

Pada persamaan (5), Σi adalah matriks ragam peragam galat yang bersifat
definit positif. Setiap komponen dari fungsi f memiliki parameter non-negatif
pemulusan . Seperti halnya pada spline, persamaan (5) dapat diubah ke dalam
suatu nilai dari vektor fungsi f pada observasi nilai x. Jika � < � < ⋯ < �� ,
T

dan
,
�� = � (f x , … , f x , … , f x , … , f x )
� = � �T, … , �T� T
� = diag� � , … , � . Maka kriteria jumlah kuadrat terpenalti pada persamaan (5)
sama dengan
� − � T � − � � − � + � � T ��
dan ��� = � �� − �T �⨂ diag� , … ,
. Elemen-elemen dari matriks T dan Q
adalah sebagai berikut:


��

= � h−



�+ ,�



��





+ ,

= � − h− + h−+

= � − h−+

= �h + h + ⁄

�,�−

= �

�,�+

=h⁄

h = � x + − � x untuk i= 1,…., n-1

Pendugaan VGLM dan VGAM
Pendugaan VGLM dilakukan dengan menggunakan metode iteratively
reweighted least square dengan algoritma sebagai berikut:
1. Bentuk matriks � V dari � dan , … , p
� � ≡ � = � � � , … , �� �
�V = � � ⊗ �
Sedangkan p � adalah matriks kendala dengan elemen 0 dan 1. Penentuan
nilai ini berdasarkan fungsi hubung yang ditetapkan.

2. Inisialisasi : a =

dan tentukan �

dari �

atau �

3. Jika diperlukan hitung � , ℓ , definisikan �
� }
ℓ � =�∑ = � { � ,…,
4. Hitung turunan pertama dan kedua �� dan �
�� � = � ϑℓ⁄ϑ



= � −�

5. Hitung �


=��

ϑ ℓ
ϑ ϑ

=� �

+� �

T

,…,�

6. Setelah itu
(a). Regresikan �







T

T

dengan fungsi:

terhadap � V

dengan bobot

9
W



= diag� w W

untuk menghasilkan �
∗∗ −
��
� ∗∗ − = � � V

�V

≡��

⊗�



,…,w W

+ � ε∗∗





= �T, … , �T

T

(b) Tentukan
= � �V ��
(c). Hitung � , � dari �
(d). Uji kekonvergenan, konvergen jika � − � � − < ε
(e). Jika tidak konvergen dan a < iterasi�maksimum� , maka:


a = a + �kemudian hitung �
,�
dan


7. Simpan a,��



=�

,�



,�

+ �



�− ��



sebagai penduga akhir

Seperti halnya GAM, metode VGAM dilakukan dengan menggunakan
algoritma backfitting. Pada prosedur lebih dari satu kovariate, algoritma
backfitting dapat diaplikasikan terhadap peubah bebas terkoreksi zi dengan
menggunakan vektor pemulus. Istilah ini disebut sebagai algoritma backfitting
vektor (Yee & Wild 1996).
Metode pendugaan VGAM menggunakan algoritma vektor backfitting
yang diaplikasikan terhadap zi dapat dituliskan sebagai berikut:
Inisialisasi:
� = rata − rata�{� , . . . , � } dan � = �, k= 1, . . .,p
� adalah peubah bebas terkoreksi, � = � � � + + � � − �
di adalah elemen ke j dari �

= � ϑℓ ⁄ϑ

dan �

= � −�

ϑ ℓ

ϑη ϑη

Iterasi untuk β=1,2…
(a) Iterasikan untuk k=1,….p
(i) Hitunglah fungsi vektor � ∗ sebagai fungsi vektor bobot penghalus
dan (bobot Wi), i=1, . . ., n
dari observasi x , �
′′
∑ = {� − � � x }T � �{� − � � x } +� ∑ =
� t �dt
�∫f
T

x …….,� x
dengan � x = � �
(ii) Duga intersep β = � β + rata − rata�{� ∗ �
x = � ∗ x − ��rata − rata�{� ∗
(iii) Duga �
(b) Berhenti jika perbedaan antara � − dengan �

.

, … . �∗ � }
x , … . �∗ x }
kecil.

Pada iterasi diatas �� adalah penyesuaian dari zi sehingga efek dari semua
peragam kecuali ke-k dihilangkan. Penyesuaian β dibutuhkan untuk
memudahkan identifikasi.


=� � −�β −�∑ ≠ �





10
Proses pemulusan dalam model aditif terampat merupakah langkah
penting dalam proses pendugaan. Derajat bebas dari fungsi pemulus mengukur
banyaknya pemulusan yang dilakukan. Berdasarkan Yee (2015), derajat bebas
didefinisikan sebagai teras dari matriks A, df = teras�
dan A didefinisikan
sebagai berikut:
=�

+ ∑�



Matriks K adalah matriks penalti yang sudah didefinisikan sebelumnya dan ∑
merupakan matriks ragam peragam galat. Besarnya pemulusan yang dapat
dilakukan adalah 2 sampai n. Semakin besar derajat bebas artinya semakin banyak
pemulusan yang dilakukan.

VGAM untuk Nilai Ekstrim
Analisis VGAM dengan sebaran GPD akan memiliki dua penduga sesuai
dengan jumlah parameter dalam fungsi sebaran. Model VGAM GPD dapat
dituliskan sebagai berikut (Yee & Stephenson, 2007)
log σ� x = �

log� ξ + � � = �

=�β

+f x

=�β

+f x

+ ⋯ + f x � (6)

Nilai dugaan dari VGAM GPD pada persentil-p adalah sebagai berikut:
σ
yp = � + � �[ − p −ξ − ]
ξ

(7)

dengan nilai σ dan ξ yang diperoleh dari persamaan (6) dan (7), sedangkan p
adalah besarnya persentil.

11

3 METODE PENELITIAN
Data
Data yang digunakan adalah data curah hujan bulanan Kabupaten
Indramayu dari tahun 1979 sampai dengan 2008 sebagai peubah respon dan data
GCM presipitasi sebagai peubah bebas. Data luaran GCM yang digunakan berasal
dari Climate Model Intercomparison Project (CIMP5) dan diperoleh dari
http://climexp.knmi.nl.
Keterbatasan penelitian ini adalah data curah hujan lokal yang digunakan
hanya sampai tahun 2008. Hal ini dikarenakan adanya program dari BMKG pada
tahun tersebut sehingga data sampai tahun 2008 dapat dipertanggungjawabkan.
Selain itu alasan lainnya adalah dikarenakan agar dapat membandingkan dengan
penelitian-penelitian yang sudah dilakukan sebelumnya.
Berdasarkan Wigena (2006) ukuran grid yang digunakan adalah 8� × 8.
Penelitian kali ini akan mencoba ukuran lain yaitu � × , dengan alasan korelasi
antar grid pada ukuran grid tersebut lebih tinggi. Posisi wilayah untuk data grid
8� × 8 adalah 1.25 – 18.75 LS sampai 98.75 – 118.75 BT. Sedangkan posisi
wilayah untuk data grid � × adalah 1.25 – 11.25 LS sampai 101.25 – 113.75.
Data yang dihasilkan GCM berupa grid-grid berdasarkan garis lintang dan garis
bujur dengan ukuran . ° ±
�km .
Analisis Data
1. Eksplorasi Data
a. Deskripsi data curah hujan dengan membuat diagram kotak garis data
curah hujan berdasarkan bulan amatan untuk melihat pola curah hujan
yang terjadi.
b. Mengidentifikasi data curah hujan ekstrim dengan menentukan nilai
ambang melalui MRLP.
c. Melakukan uji kesesuaian sebaran dengan menggunakan uji
Kolmogorov-Smirnov. Pengujian ini dilakukan dengan menyesuaikan
fungsi sebaran empirik curah hujan lokal yang diatas nilai ambang Fn(y)
dengan sebaran teoritis tertentu F0(y) dengan hipotesis:
H0 : Fn(y) = F0(y) ( data mengikuti sebaran GPD )
H1 : Fn(y) ≠ F0(y) ( data tidak mengikuti sebaran GPD )
Fn(y) adalah fungsi sebaran kumulatif tertentu.
Statistik uji Kolmogorov-Smirnov ini adalah
D-hitung = sup | Fn(y) - F0(y)|
Untuk mendapatkan kesimpulan maka D-hitung dibandingkan
dengan tabel ( D1-α ) pada tabel Kolmogorov Smirnov.
2. Data GCM
a. Mereduksi data GCM yang bersesuaian dengan analisis komponen
utama (AKU), dengan langkah-langkah sebagai berikut:
i. Sekumpulan data GCM berukuran p × p, dengan p = �dan�8
ii. Menghitung matriks ragam peragam atau matriks korelasi A
iii. Menghitung nilai akar ciri dengan menggunakan persamaan | − � |
iv. Menghitung skor komponen utama (KU) dari setiap akar ciri, yaitu
� = � a′ � , dengan a′ adalah vektor ciri.
v. Menentukan jumlah KU terpilih berdasarkan akar ciri lebih dari 1

12
b. Melihat pola sebaran skor KU sebagai peubah penjelas (x) dengan
peubah respon curah hujan (y)
3. Pemodelan
Pemodelan dilakukan dengan membagi dua data menjadi data untuk
pemodelan sampai tahun 2007 dan data tahun 2008 untuk validasi model.
Selanjutnya menghitung rata-rata curah hujan bulanan dari 15 stasiun. Nilai
rata-rata inilah yang menjadi peubah respon dalam pemodelan. Tahap
pemodelan adalah sebagai berikut:
a. Menentukan derajat bebas pemulus pada peubah yang mempunyai
hubungan nonlinear dengan pemulusan vektor spline dan nilai
akaike information criterion (AIC)
AI� = k − ln ��
b. Menduga fungsi f pada model dengan menggunakan algoritma
backfitting vector.
c. Melakukan prediksi dengan menggunakan data validasi dan model
yang sudah dibentuk. Nilai dugaan curah hujan dapat dirumuskan:
σ
yp = � + � �[ 1 − p −ξ − 1]
ξ
dengan p adalah besarnya kuantil. Penelitian kali ini menggunakan
kuantil yang berbeda untuk setiap kelompok bulan, yaitu;
i. Bulan hujan: 75, 90,95
ii. Bulan peralihan hujan-kering: 25, 70, 75
iii. Bulan kering: 5, 10, 25
iv. Bulan peralihan kering-hujan: 10, 25, 50
4. Validasi dan Kebaikan model
Validasi dan kebaikan model dilakukan untuk memilih model terbaik
yang sudah dibuat. Validasi ini dilakukan dengan cara menghitung korelasi
dan nilai root mean square error of prediction (RMSEP). Korelasi antara
nilai dugaan dan nilai aktul digunakan untuk melihat kesamaan pola dugaan.
Semakin mendekati satu artinya data dugaan dan data aktual memiliki
hubungan yang kuat dan memiliki pola yang sama. Rumus korelasi adalah
sebagai berikut:
n
 n  n 
n yi yˆ i    yi   yˆ i 
i 1
 i 1  i 1 
r
 n 2  n  2  n 2  n  2 
n yi    yi   n yˆ i    yˆ i  
 i 1    i 1
 i 1  
 i 1

Selain itu nilai RMSEP digunakan untuk melihat rata-rata eror antara data
dugaan dengan data aktual. Semakin kecil nilai RMSEP artinya semakin
kecil selisih antara nilai dugaan dengan nilai aktual artinya, model yang
dibangun semakin baik. Rumus dari RMSEP adalah:
RMSEP = � √ �∑ = y − � ŷi

13

4 HASIL DAN PEMBAHASAN
Eksplorasi Data
Eksplorasi data dilakukan sebagai informasi awal untuk mengetahui
karakteristik curah hujan di Indramayu. Deskriptif statistik menunjukkan bahwa
rata-rata curah hujan di Kabupaten Indramayu pada tahun 1979 sampai 2008
adalah 123 mm dengan curah hujan minimum yaitu 0 dan curah hujan maksimum
mencapai 583 mm. Nilai simpangan baku sebesar 110 mm menggambarkan
keragaman data curah hujan yang cukup besar.
Gambar 2 menunjukkan gambaran curah hujan di Kabupaten Indramayu
yang berpola monsun. Pola monsun adalah pola curah hujan yang membentuk
huruf U atau dapat dikatakan memiliki satu puncak musim hujan. Pola curah
hujan pada Kabupaten Indramayu memiliki puncak curah hujan pada bulan
Januari dan berada pada nilai terendah sekitar bulan Agustus. Rata-rata curah
hujan bulan Januari yaitu sebesar 308 mm, sedangkan rata-rata curah hujan bulan
Agustus adalah 16 mm. Berdasarkan Gambar 2 dapat dilihat bahwa terjadi
kejadian ekstrim pada beberapa bulan yaitu Februari, Juli, Agustus, September,
November dan Desember.

Gambar 2 Pola Curah hujan Kabupaten Indramayu tahun 1979 – 2008
Penentuan Nilai Ambang
Identifikasi curah hujan ekstrim dilakukan dengan menentukan nilai
ambang (u) dengan menggunakan MRLP. Gambar 3 adalah hasil MRLP untuk
curah hujan rata-rata di Kabupaten Indramayu. Nilai ambang dipilih dengan cara
melihat pola grafik yang membentuk garis lurus atau linier terhadap u. Ketika pola
grafik sudah tidak beraturan maka nilai ambang dipilih pada titik awal terjadinya
perubahan pola tersebut. Pada Gambar 3 terlihat pola mulai konstan di titik 100
dan mulai terjadi perubahan di titik antara 100 dan 200 seperti yang ditunjukkan
pada garis putus-putus. Selanjutnya untuk menentukan titik nilai ambang
digunakan grafik range pendugaan parameter dengan nilai ambang pada Gambar

14

Rata-rata nilai kejadian ekstrim

4. Berdasarkan grafik pada Gambar 4, nilai dugaan kedua parameter konstan di
nilai 145 maka nilai ambang yang dipilih pada kasus ini adalah 145.
Plot diagnostik kecocokan data dengan sebaran dapat dilihat pada
Lampiran 1. Grafik fungsi kepekatan peluang dengan data menunjukkan bahwa
data ekstrim yang diambil mengikuti sebaran GPD. Sementara itu hasil plot
peluang dan plot kuantil-kuantilnya pada Lampiran 1 juga menunjukkan data
mengikuti sebaran teoritisnya yaitu GPD. Hal ini dikarenakan kedua plot
membentuk garis lurus mengikuti sebaran teoritisnya.

Parameter skala

Gambar 3 Grafik MRLP data curah hujan

Parameter bentuk

Nilai ambang

Nilai ambang

Gambar 4 Grafik hubungan pendugaan parameter GPD dengan nilai ambang pada
data curah hujan rata-rata

15
Pengujian formal perlu dilakukan untuk meningkatkan kepercayaan data
ekstrim yang diambil sudah mengikuti sebaran GPD. Pada penelitian kali ini
pengujian formal dilakukan dengan uji Kolmogorov-Smirnov. Hasil pengujian
menghasilkan statistik hitung 0.047, nilai ini lebih kecil dari nilai kritisnya 0.11
pada α = 5% sehingga hipotesis nol tidak ditolak. Hal ini menunjukkan bahwa
data curah hujan ekstrim yang terpilih mengikuti sebaran GPD.
Pemodelan Data GCM
Data GCM yang digunakan adalah data presipitasi dengan ukuran grid
� × dan 8� × 8. Peubah GCM yang berjumlah banyak ini dianggap terlalu
besar dan saling berkorelasi, sehingga akan mengakibatkan kondisi buruk.
Analisis komponen utama dilakukan untuk mengatasai masalah ini.
Hasil analisis komponen utama dapat dilihat pada Tabel 1. Jumlah
komponen yang memiliki akar ciri lebih besar dari satu �� > �pada data grid
� × adalah sebanyak dua komponen. Proporsi kumulatif yang dihasilkan KU
ke-1 dan KU ke-2 adalah 96% artinya dua KU mampu menjelaskan 96% peubah
asalnya. Sedangkan pada data grid 8� × 8, akar ciri yang memiliki nilai yang lebih
besar dari satu adalah empat komponen dengan proporsi kumulatif 95%. Dengan
demikian jumlah komponen utama yang digunakan pada data grid � × adalah
sebanyak dua komponen dan pada data grid 8� × 8 sebanyak empat komponen
dimana keragaman yang mampu dijelaskan keduanya hampir sama.
Tabel 1 Nilai akar ciri dan proporsi keragaman kumulatif dari hasil analisis
komponen utama
Proporsi
Ukuran Grid
KU keAkar ciri
Proporsi
keragaman
kumulatif
1
5.65
0.89
0.89
2
1.59
0.07
0.96
�×
3
0.86
0.02
0.98
4
0.53
0.01
0.98
5
0.40
0.00
0.99
1
6.51
0.66
0.66
2
3.53
0.19
0.86
8×8
3
2.14
0.07
0.93
4
1.19
0.02
0.95
5
0.85
0.01
0.96
Analisis selanjutnya adalah data curah hujan rata-rata (y) akan dimodelkan
dengan skor komponen utama terpilih, dua komponen utama untuk data grid
� × dan empat komponen utama untuk data grid 8� × 8. Pemodelan analisis
VGAM dilakukan dengan memodelkan curah hujan yang berada diatas nilai
ambang sebagai kombinasi aditif dari skor komponen utama terpilih. Eksplorasi
skor komponen utama terhadap curah hujan rata-rata pada Lampiran 2
mengindikasikan bahwa hubungan antara peubah respon dengan masing-masing

16
peubah penjelas ada yang tidak linear, hal ini terlihat dari sebaran data yang
membentuk pola tidak linear.
Penelitian kali ini terdiri dari beberapa alternatif model untuk memperoleh
model yang paling baik. Model pertama adalah model dasar tanpa dummy, model
kedua adalah model dengan menambahkan satu peubah dummy (1 untuk bulan
hujan dan 0 untuk bulan kering), dan model ketiga adalah model dengan empat
kategori (hujan, peralihan hujan-kering, kering dan peralihan kering-hujan).
Model aditif terampat menggunakan pemulusan dan teknik pemulusan
yang digunakan dalam model ini adalah pemulusan vektor spline. Banyaknya
pemulusan yang dilakukan ditunjukkan dengan besarnya derajat bebas. Semakin
besar derajat bebas maka pemulusan yang dilakukan semakin banyak.
Penentuan derajat bebas dilakukan dengan membuat model semua
kemungkinan derajat bebas pada setiap komponen dari 2 sampai banyaknya
observasi. Derajat bebas terbaik adalah model yang memiliki nilai AIC paling
kecil dibandingkan dengan derajat bebas yang lain. Nilai AIC setiap model dapat
dilihat pada Tabel 2. Berdasarkan hasil tersebut pada data grid � × , derajat
bebas yang dipilih untuk KU1 adalah 9 dan 7 untuk KU2, sedangkan untuk data
grid 8� × 8 derajat bebas yang dipilih untuk KU1, KU2, KU3, dan KU4 berturutturut adalah 9, 3, 2 dan 4.
Tabel 2 Nilai AIC dari model VGAM pada beberapa derajat bebas
Grid � ×
Grid 8 × 8
derajat
bebas
KU1
KU2
KU1
KU2
KU3
KU4
2 1410.91 1405.08 1416.89 1405.95
1398.11 1414.23
3 1410.40 1403.45 1417.17 1405.11
1398.73 1411.60
4 1408.92 1402.81 1416.67 1405.68
1398.81 1410.36
5 1407.50 1402.20 1416.14 1406.03
1398.80 1410.38
6 1406.65 1401.76 1415.78 1406.24
1398.86 1410.72
7 1406.26 1401.66 1415.44 1406.32
1399.10 1410.96
8 1406.16 1401.89 1415.18 1406.33
1399.56 1411.05
9 1406.15 1402.32 1415.12 1406.33
1400.19 1411.08
10 1406.16 1402.83 1415.33 1406.42
1400.92 1411.17
Pengepasan model terhadap data 2008 dilakukan dengan menggunakan
kuantil ke 50. Hasil pengepasan untuk masing-masing grid � × dan 8� × 8
ditampilkan pada Gambar 5 dan Gambar 6. Berdasarkan kedua gambar tersebut,
terlihat bahwa pola dugaan curah hujan data grid � × dan 8� × 8 hampir sama.
Pada kedua data terlihat bahwa hasil nilai dugaan curah hujan belum membentuk
pola monsun seperti pola curah hujan aktual.
Berdasarkan Gambar 5 dan Gambar 6, kedua model menduga curah hujan
pada musim kering jauh diatas nilai aktualnya dan menduga curah hujan ekstrim
pada musim hujan dibawah nilai aktual. Terdapat beberapa bulan yang memiliki
nilai dugaan mendekati nilai aktual yaitu bulan November dan Desember. Nilai
dugaan curah hujan tahun 2008 masing-masing model secara lengkap dapat dilihat
pada Lampiran 4.

17
Penambahan peubah dummy tidak memberikan hasil yang signifikan pada
pendugaan curah hujan. Dugaan yang dihasilkan hampir sama antara model awa