Pemodelan Statistical Downscaling Dengan Regresi Kuantil Menggunakan Lasso Untuk Pendugaan Curah Hujan Ekstrim

PEMODELAN STATISTICAL DOWNSCALING DENGAN
REGRESI KUANTIL MENGGUNAKAN LASSO UNTUK
PENDUGAAN CURAH HUJAN EKSTRIM

DEWI SANTRI

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul “Pemodelan Statistical
Downscaling dengan Regresi Kuantil menggunakan LASSO untuk Pendugaan
Curah Hujan Ekstrim” adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi
manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.
Bogor, Maret 2016
Dewi Santri
G151130031

* pelimpahan hak cipta atas karya tulis dari penelitian kerjasama dengan pihak luar IPB harus
didasarkan pada perjanjian kerjasama yang terkait

RINGKASAN
DEWI SANTRI. Pemodelan Statistical Downscaling dengan Regresi Kuantil
menggunakan LASSO untuk Pendugaan Curah Hujan Ekstrim. Dibimbing oleh AJI
HAMIM WIGENA dan ANIK DJURAIDAH.
Curah hujan ekstrim yang sering terjadi di Indonesia menimbulkan berbagai
dampak negatif, diantaranya yang berkaitan dengan bidang pertanian. Tanaman
padi merupakan tanaman yang rentan terhadap kejadian ekstrim yaitu El-Nino dan
La-Nina. Oleh karena itu pemodelan curah hujan diperlukan untuk meminimumkan
dampak yang terjadi.
Model-model untuk menganalisa curah hujan sudah banyak diterapkan di
antaranya global circulation model (GCM). Data luaran GCM adalah data hasil
simulasi komputer yang memanfaatkan kaidah fisika, kondisi lautan, dan

perubahan iklim pada atmosfer bumi dan dapat merepresentasikan unsur – unsur
iklim pada masa lampau, saat ini dan di masa yang akan datang. Data luaran GCM
masih berskala global, sehingga akan sulit untuk menjelaskan keragaman dalam
skala lokal yang lebih rinci. Hal ini berdampak pada rendahnya tingkat akurasi
prediksi curah hujan yang dihasilkan. Statistical Downscaling (SD) diyakini dapat
menangani permasalahan tersebut. Metode ini menghubungkan antara data luaran
GCM dan curah hujan untuk menduga perubahan pada skala lokal dengan
menggunakan metode regresi.
Regresi kuantil merupakan salah satu metode yang dapat digunakan untuk
menganalisis pola terjadinya curah hujan ekstrim. Regresi kuantil dapat mengukur
efek peubah penjelas tidak hanya di pusat sebaran data, tetapi juga pada bagian atas
atau bawah ekor sebaran. Kelebihan lain dari regresi kuantil adalah sangat efisien
jika sisaan tidak menyebar normal dan kekar terhadap adanya pencilan.
Data luaran GCM yang memiliki multikolinearitas tidak dapat langsung
diterapkan dalam model SD. Metode-metode yang dapat digunakan untuk
mengatasi masalah multikolinearitas dalam SD antara lain metode analisis
komponen utama (AKU), metode shrinkage seperti Least Absolute Shrinkage and
Selection Operator (LASSO) dan ridge. Metode AKU paling sering digunakan
dalam mereduksi dimensi data luaran GCM dan menangani masalah
multikolinearitas.

Metode
shringkage
selain
dapat
menghilangkan
multikolinearitas juga dapat meminimumkan ragam penduga parameter dari model
regresi. Tujuan penelitian ini adalah menentukan model curah hujan ekstrim di
Kabupaten Indramayu dengan pendekatan SD menggunakan metode regresi kuantil
dengan LASSO dan AKU serta memilih model SD terbaik dari kedua metode yang
digunakan tersebut.
Peubah respon yang digunakan adalah data rata-rata curah hujan bulanan
yang diperoleh dari 11 stasiun klimatologi di Kabupaten Indramayu pada tahun
1979-2008. Peubah prediktor (GCM) yang digunakan adalah data curah hujan
bulanan Climate Model Intercomparison Project (CMIP5) yang dikeluarkan oleh
KNMI, Belanda pada tahun 1979 sampai dengan 2008 dengan posisi wilayah –
18.75o – 1.25oLS dan 101.25o – 116.25oBT. Analisis data yang dilakukan meliputi
pemodelan regresi kuantil dengan penalti LASSO dan pemodelan regresi kuantil
dengan AKU.

Hasil penelitian menunjukkan bahwa dugaan curah hujan ekstrim di

kabupaten Indramayu dengan model SD menggunakan regresi kuantil dengan
LASSO menghasilkan prediksi yang lebih konsisten terhadap berbagai selang
waktu dugaan dibandingkan model yang menggunakan metode AKU. Model
terbaik yang diperoleh berasal dari model yang dibangun oleh regresi kuantil
dengan metode LASSO pada grid 6×6 yaitu model regresi kuantil linear. Model ini
memiliki nilai quantile verification skill score (QVSS) paling tinggi dan nilai root
mean square error of prediction (RMSEP) paling rendah diantara model-model
yang lain. RMSEP model SD dengan LASSO pada grid 6×6 lebih rendah
dibandingkan dengan model pada grid 8×8, sedangkan pada model AKU kedua grid
memiliki nilai RMSEP yang hampir sama. Pendugaan curah hujan ekstrim di
Kabupaten Indramayu untuk satu tahun ke depan memberikan hasil dugaan terbaik
dari semua periode analisis yang digunakan.
Kata kunci : curah hujan ekstrim, global circulation model, LASSO, regresi
kuantil , statistical downscaling.

SUMMARY
DEWI SANTRI. Statistical Downscaling Modeling with Quantile Regression using
LASSO to Estimate Extreme Rainfall. Supervised by AJI HAMIM WIGENA and
ANIK DJURAIDAH.
Extreme rainfall that frequently occurs in Indonesia has negative impact. For

example in agriculture, El Nino and La nina can damage rice plants that will reduce
rice production. Therefore modeling extreme rainfall is needed to minimize the
negative impact.
Global circulation model (GCM) has been widely applied to analize the
extreme rainfall. The GCM data is a computer simulation result of a large number
interaction of physics, chemistry, and dynamics of the earth’s atmosphere. GCM
data can represent the past, present or future climate. However, GCM data has
global scale and unable to provide reliable information at local scale. Statistical
Downscaling (SD) has been developed in an attempt to bridge this scale gap. SD
uses regression models to represent the link between GCM data and local rainfall.
Quantile regression is a method that can be used to analyze extreme rainfall.
Quantile regression can measure the effect of explanatory variables not only in the
center of the data, but also on the top or bottom of the distribution data. Quantile
regression does not assume homogenous residual variance and normality of the
error distribution.
GCM data which has multicolinearity can not be directly applied in SD
model. The methods that can be used to overcome multicollinearity are principal
component analysis (PCA) and shrinkage methods such as Least Absolute
Shrinkage and Selection Operator (LASSO) and ridge. PCA is the most commonly
used in SD modeling. PCA can reduce the dimension of GCM data and

multicollinearity. Shringkage method can eliminate multicolinearity and minimize
variance. The objectives of this study are modeling SD using quantile regression
with LASSO and PCA to predict extreme rainfall in Indramayu and to choose the
best SD model of both methods.
This research used the average monthly rainfall data from 11 climatological
stations in Indramayu from 1979 to 2008 as independent variable and precipitation
from GCM data as dependent variables. GCM data used is from Climate Model
Intercomparison Project (CMIP5) issued by KNMI, the Dutch from 1979 to 2008
with the position –18.75o – 1.25oS and 101.25o–116.25oE from the website
http://www.climatexp.knmi.nl/. Training data starting from 1979 to 2007 and 2008
for testing data. Data analyzes were performed consisting of quantile regression
modeling with LASSO penalty and quantile regression modeling with PCA.
The result shows that the prediction of extreme rainfall in Indramayu with SD
models using quantile regression with LASSO is more consistent at any time
prediction compared to models using PCA. The best model is a linear quantile
regression (model using LASSO and 6×6 grid). The model has the highest quantile
verification skill scores (QVSS) and the the lowest root mean square error of
prediction (RMSEP) among the other models. For the model that using LASSO, it
shows that prediction of the model with a 6×6 grid has the lower RMSEP than 8×8
grid, while model that use PCA shows that there is not much difference between


the two size of grid. The estimation of extreme rainfall in Indramayu for one year
ahead provides the best estimates compare to all periods of analysis used.
Keywords: extreme rainfall, global circulation model, LASSO, quantile regression,
statistical downscaling,

© Hak Cipta Milik IPB, Tahun 2016
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau
menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apa pun tanpa izin IPB

PEMODELAN STATISTICAL DOWNSCALING DENGAN
REGRESI KUANTIL MENGGUNAKAN LASSO UNTUK
PENDUGAAN CURAH HUJAN EKSTRIM

DEWI SANTRI


Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains
pada
Program Studi Statistika

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016

Penguji Luar Komisi pada Ujian Tesis:

Dr Ir Muhammad Nur Aidi, MS

Judul Tesis : Pemodelan Statistical Downscaling dengan Regresi Kuantil
menggunakan LASSO untuk Pendugaan Curah Hujan Ekstrim
Nama
: Dewi Santri

NIM
: G151130031

Disetujui oleh
Komisi Pembimbing

Dr Ir Aji Hamim Wigena, MSc
Ketua

Dr Ir Anik Djuraidah, MS
Anggota

Diketahui oleh

Ketua Program Studi
Statistika

Dekan Sekolah Pascasarjana

Dr Ir Kusman Sadik, Msi


Dr Ir Dahrul Syah, MScAgr

Tanggal Ujian: 31 Desember 2015

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Judul yang
dipilih dalam penelitian yang dilaksanakan sejak bulan Mei 2015 ini ialah
Pemodelan statistical downscaling dengan regresi kuantil menggunakan LASSO
untuk pendugaan curah hujan ekstrim.
Terima kasih penulis ucapkan kepada Bapak Dr Ir Aji Hamim Wigena, MSc
dan Ibu Dr Ir Anik Djuraidah, MS selaku pembimbing, atas kesediaan dan
kesabaran untuk membimbing dan membagi ilmunya kepada penulis dalam
penyusunan tesis ini. Ucapan terima kasih juga penulis sampaikan sebesar-besarnya
kepada seluruh Dosen Departemen Statistika IPB yang telah mengasuh dan
mendidik penulis selama di bangku kuliah hingga berhasil menyelesaikan studi,
serta seluruh staf Departemen Statistika IPB atas bantuan, pelayanan, dan

kerjasamanya selama ini.
Ucapan terima kasih yang tulus dan penghargaan yang tak terhingga juga
penulis ucapkan kepada Ayahanda dan Ibunda tercinta La Hafili dan Wa Nia
yang telah membesarkan dan mendidik penulis dengan penuh kasih sayang demi
keberhasilan penulis selama menjalani proses pendidikan, juga kakak tersayang
beserta suami Rahmatia, SPd dan Saharudin, AMd serta keluarga besarku atas doa
dan semangatnya.
Terakhir tak lupa penulis juga menyampaikan terima kasih kepada seluruh
mahasiswa Pascasarjana Departemen Statistika atas segala bantuan dan
kebersamaannya selama menghadapi masa-masa terindah maupun tersulit dalam
menuntut ilmu, serta semua pihak yang telah banyak membantu dan tak sempat
penulis sebutkan satu per satu.
Semoga karya ilmiah ini bermanfaat bagi semua pihak yang membutuhkan.

Bogor, Maret 2016
Dewi Santri

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

1 PENDAHULUAN
Latar Belakang
Tujuan Penelitian

1
1
2

2 TINJAUAN PUSTAKA
Global circulation model (GCM) dan Statistical Downscaling (SD)
Regresi Kuantil
Least Absolute Shrinkage and Selection Operator (LASSO)
Validasi Silang

2
2
3
5
6

3 METODE
Data
Metode Analisis

7
7
7

4 HASIL DAN PEMBAHASAN
Deskripsi Data
Regresi Kuaantil dengan LASSO
Regresi Kuantil dengan Analisi Komponen Utama
Perbandingan SD Regresi Kuantil menggunakan LASSO dan Analisis
Komponen Utama
Validasi dan Uji Konsistensi Model LASSO

10
10
11
14

5 SIMPULAN DAN SARAN
Simpulan
Saran

18
18
18

DAFTAR PUSTAKA

18

LAMPIRAN

21

RIWAYAT HIDUP

46

16
16

DAFTAR TABEL
1 Deskripsi data curah hujan di Kabupaten Indramayu
2 Nilai lambda optimum untuk masing-masing model
3 Perbandingan nilai RMSEP di setiap panjang data pendugaan model SD
dengan regresi kuantil menggunakan LASSO dan AKU
4 Nilai RMSEP dan korelasi di setiap panjang data pendugaan model SD
dengan regresi kuantil menggunakan LASSO
5 Nilai korelasi pendugaan model SD dengan regresi kuantil menggunakan
LASSO untuk pendugaan curah hujan ekstrim 1 tahun ke depan

10
11
16
17
17

DAFTAR GAMBAR
1
2
3
4
5
6
7
8
9
10
11

Ilustrasi proses Statistical Downscaling
Diagram alir metode analisis
Diagram kotak garis curah hujan Kabupaten Indramayu
Nilai QVSS dari keenam model yang menggunakan LASSO untuk grid
8×8 dan grid 6×6
Nilai RMSEP dari keenam model yang menggunakan LASSO untuk grid
8×8 dan grid 6×6
Nilai prediksi dari Model M4 untuk metode LASSO pada grid 8×8
Nilai prediksi dari Model M1 untuk metode LASSO pada grid 6×6
Nilai QVSS dari keenam model yang menggunakan AKU untuk grid 8×8
dan grid 6×6
Nilai RMSEP dari keenam model yang menggunakan AKU untuk grid
8×8 dan grid 6×6
Nilai prediksi dari Model M2 untuk metode AKU pada grid 8×8
Nilai prediksi dari Model M1 untuk metode AKU pada grid 6×6

3
9
11
12
13
13
13
14
14
15
15

DAFTAR LAMPIRAN
1 Nilai λ dan CV untuk grid 8×8
2 Nilai λ dan CV untuk grid 6×6
3 Proporsi keragaman, proporsi kumulatif dan standar deviasi dari
komponen utama model linear menggunakan AKU untuk grid 8×8
4 Proporsi keragaman, proporsi kumulatif dan standar deviasi dari
komponen utama model kuadrat menggunakan AKU untuk grid 8×8
5 Proporsi keragaman, proporsi kumulatif dan standar deviasi dari
komponen utama model linear menggunakan AKU untuk grid 6×6
6 Proporsi keragaman, proporsi kumulatif dan standar deviasi dari
komponen utama model kuadrat menggunakan AKU untuk grid 6×6
7 Penduga parameter model M1 metode LASSO untuk grid 8×8
8 Penduga parameter model M2 metode LASSO untuk grid 8×8
9 Penduga parameter model M3 metode LASSO untuk grid 8×8

21
21
22
22
22
23
23
24
25

10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36

Penduga parameter model M4 metode LASSO untuk grid 8×8
Penduga parameter model M5 metode LASSO untuk grid 8×8
Penduga parameter model M6 metode LASSO untuk grid 8×8
Penduga parameter model M1 metode LASSO untuk grid 6×6
Penduga parameter model M2 metode LASSO untuk grid 6×6
Penduga parameter model M3 metode LASSO untuk grid 6×6
Penduga parameter model M4 metode LASSO untuk grid 6×6
Penduga parameter model M5 metode LASSO untuk grid 6×6
Penduga parameter model M6 metode LASSO untuk grid 6×6
Penduga parameter model M1 metode AKU untuk grid 8×8
Penduga parameter model M2 metode AKU untuk grid 8×8
Penduga parameter model M3 metode AKU untuk grid 8×8
Penduga parameter model M4 metode AKU untuk grid 8×8
Penduga parameter model M5 metode AKU untuk grid 8×8
Penduga parameter model M6 metode AKU untuk grid 8×8
Penduga parameter model M1 metode AKU untuk grid 6×6
Penduga parameter model M2 metode AKU untuk grid 6×6
Penduga parameter model M3 metode AKU untuk grid 6×6
Penduga parameter model M4 metode AKU untuk grid 6×6
Penduga parameter model M5 metode AKU untuk grid 6×6
Penduga parameter model M6 metode AKU untuk grid 6×6
Nilai QVSS dan RMSEP model yang menggunakan LASSO
Nilai QVSS dan RMSEP model yang menggunakan AKU
Nilai prediksi masing-masing model untuk metode LASSO grid 8×8
Nilai prediksi masing-masing model untuk metode AKU grid 8×8
Nilai prediksi masing-masing model untuk metode LASSO grid 6×6
Nilai prediksi masing-masing model untuk metode AKU grid 6×6

26
28
29
31
32
32
33
34
35
36
36
37
37
37
38
38
38
39
39
39
40
40
41
42
43
44
45

1 PENDAHULUAN
Latar Belakang
Curah hujan ekstrim adalah kondisi curah hujan di atas atau di bawah ratarata kondisi normalnya. Menurut BMKG (2008) curah hujan ekstrim adalah curah
hujan di atas 400 mm/bulan atau di atas 100 mm/hari. Dampak negatif dari
terjadinya curah hujan ekstrim salah satunya yang berkaitan dengan masalah di
bidang pertanian misalnya terjadinya gagal panen. Pada tahun 2010 produksi padi
mengalami penurunan akibat iklim ekstrim yaitu dari 1.58 juta ton di tahun 2009
menjadi sebesar 1.55 juta ton di tahun 2010 (BPS 2011). Hal ini menjadikan studi
tentang perubahan iklim sangat diperlukan untuk meminimumkan kerugian yang
mungkin terjadi.
Curah hujan merupakan kejadian kompleks yang melibatkan topografi dan
interaksi antara laut, darat dan atmosfir sehingga mempersulit prediksi curah hujan
itu sendiri. Oleh karena itu diperlukan model peramalan curah hujan yang akurat
pada skala lokal dengan mempertimbangkan informasi tentang sirkulasi atmosfir
global yang dapat diperoleh dari data luaran GCM (global circulation model).
(Handayani, 2014)
GCM tersusun atas rangkaian model-model numerik yang merepresentasikan
sejumlah komponen subsistem dari iklim bumi. GCM memiliki kemampuan untuk
melakukan simulasi iklim secara skala besar. Model ini diyakini sebagai model
penting dalam upaya memahami iklim di masa lampau, sekarang dan masa yang
akan datang (Wilby et al. 2009).
Data luaran GCM masih berskala global sehingga akan sulit untuk
memperoleh informasi yang berskala lokal (kabupaten atau kota). Agar dapat
menangani masalah tersebut diperlukan suatu metode untuk mentransformasi hasil
simulasi GCM pada skala global ke skala lokal. Pendekatan statistical downscaling
(SD) diyakini dapat menangani permasalahan rendahnya akurasi prediksi curah
hujan. Metode ini menghubungkan antara data luaran GCM dan curah hujan untuk
menduga perubahan pada skala lokal dengan menggunakan model regresi.
Informasi dari skala global dalam data luaran GCM akan diproyeksikan terhadap
informasi skala lokal stasiun cuaca.
Metode regresi yang dapat digunakan untuk menganalisis data yang
mengandung nilai ekstrim adalah regresi kuantil. Regresi kuantil tidak
membutuhkan asumsi parametrik dan bermanfaat untuk menganalisis bagian
tertentu dari suatu sebaran bersyarat (Buhai 2004). Kelebihan lain dari regresi
kuantil adalah efisien jika sisaan tidak menyebar normal dan kekar terhadap
pencilan. Hal tersebut membuat regresi kuantil banyak digunakan untuk
memodelkan data yang mengandung nilai ekstrim.
Pada data luaran GCM terdapat multikolinearitas atau antar peubah GCM
saling berkorelasi tinggi. Hal ini akan menyebabkan nilai dugaan parameter model
regresi menjadi tidak tepat. Oleh karena itu langkah pertama yang harus dilakukan
adalah mengatasi masalah multikolinearitas dalam data GCM tersebut.
Metode-metode yang dapat digunakan untuk mengatasi masalah
multikolinearitas dalam SD antara lain metode analisis komponen utama (AKU),
metode shrinkage ridge dan Least Absolute Shrinkage and Selection Operator

2
(LASSO). Metode AKU merupakan metode yang paling sering digunakan. Metode
AKU dapat mereduksi dimensi dari GCM dan menangani masalah
multikolinearitas.
Metode
shringkage
selain
dapat
menghilangkan
multikolinearitas juga dapat meminimumkan ragam penduga parameter dari model
regresi. Kelebihan LASSO dibandingkan metode ridge adalah LASSO dapat
menyusutkan koefisien penduga tepat nol sehingga dapat melakukan seleksi peubah
sehingga model lebih sederhana dan saling bebas (Hastie et.al 1990).
Penelitian mengenai model SD dengan regresi kuantil sebelumnya telah
banyak dilakukan, antara lain Djuraidah dan Wigena (2011) menggunakan regresi
kuantil untuk mengeksplorasi curah hujan di Kabupaten Indramayu pada data yang
mengandung pencilan. Penelitian tersebut menghasilkan kesimpulan bahwa regresi
kuantil dapat digunakan untuk mendeteksi kondisi-kondisi ekstrim, baik ekstrim
kering (kuantil ke-5) maupun ekstrim basah (kuantil ke-95). Mondiana (2012)
mengkaji pemodelan curah hujan ekstrim dengan menggunakan regresi kuantil
dengan reduksi peubah GCM menggunakan analisis komponen utama, namun
model yang dihasilkan belum dapat mengakomodasi dengan baik pengaruh
nonlinear. Keseluruhan dari penelitian tersebut menggunakan metode AKU dalam
pemodelan SD.
Pemodelan SD pada penelitian ini menggunakan regresi kuantil dengan
LASSO. Penambahan penalti LASSO dalam model regresi kuantil membuat
analisis SD menjadi lebih sederhana karena pemodelan SD dan penanganan
multikolinearitas data luaran GCM dapat dilakukan dalam satu kali tahapan. Selain
itu LASSO juga dapat secara simultan melakukan reduksi dimensi data luaran GCM
dan mengontrol ragam penduga koefisien pada regresi kuantil.
Tujuan Penelitian
Tujuan dari penelitian ini. yaitu :
1. Menentukan model curah hujan ekstrim di Kabupaten Indramayu dengan
pendekatan statistical downscaling menggunakan metode regresi kuantil
dengan LASSO dan AKU.
2. Menentukan model SD terbaik antara model yang menggunakan metode
LASSO dan AKU.

2 TINJAUAN PUSTAKA
Global Circulation Model (GCM) dan Statistical Downscaling (SD)
Global circulation model (GCM) merupakan alat terpenting dalam
memahami sistem iklim karena mampu memberikan informasi tentang pergeseran
iklim dari masa lampau sekarang dan di masa yang akan datang. GCM berskala
besar (global) atau memiliki resolusi yang rendah sehingga belum
memperhitungkan fenomena pada skala kecil (lokal). GCM membuat simulasi
peubah-peubah iklim global pada setiap grid (berukuran ±2,5° atau ±300 km2)
setiap lapisan (layer) atmosfir, yang selanjutnya digunakan untuk memprediksi
pola-pola iklim dalam jangka waktu tahunan (Wigena 2006).
Kelemahan model GCM dalam melakukan pendugaan adalah tingkat akurasi
prediksinya yang rendah. Kelemahan ini disebabkan oleh curah hujan yang

3
ditentukan oleh suatu proses fisika yang sangat rumit, sensitif, dan nonlinier yang
tidak dapat dimodelkan oleh GCM (Stockdale et al. 1998).

Gambar 1 Ilustrasi proses Statistical Downscaling (Sutikno 2008)
Model SD adalah suatu fungsi transfer yang menggambarkan hubungan
fungsional sirkulasi atmosfir global (hasil GCM) dengan unsur-unsur iklim lokal.
Pemilihan peubah-peubah prediktor dan penentuan domain (lokasi dan jumlah grid)
merupakan faktor kritis yang akan mempengaruhi kestabilan peramalan (Wilby dan
Wigley 2000). Model ini juga memerlukan data deret waktu yang homogen dalam
berbagai perubahan iklim. Model SD memberikan hasil yang baik dengan syarat
berikut: (1) Hubungan erat antara respon dengan prediktor yang menjelaskan
keragaman iklim lokal dengan baik, (2) Peubah prediktor disimulasi baik oleh
GCM, dan (3) Hubungan antara respon dengan prediktor tidak berubah dengan
perubahan waktu dan tetap sama meskipun ada perubahan iklim (Busuioc et al.
2001). Bentuk umum model SD, yaitu :
���
� =
dengan,
: peubah iklim lokal (curah hujan)

���
: peubah luaran GCM (presipitasi)
: banyaknya waktu (bulanan)
: banyaknya grid domain GCM

Regresi Kuantil
Regresi kuantil pertama kali dikemukakan oleh Koenker dan Bassett pada
tahun 1978. Regresi kuantil merupakan teknik statistika yang digunakan untuk
menduga hubungan antara peubah respon dengan peubah penjelas pada fungsi
kuantil bersyarat tertentu (Mondiana 2012). Metode ini merupakan suatu metode

4
regresi dengan pendekatan memisahkan atau membagi data menjadi kuantil-kuantil
tertentu yang kemungkinan memiliki nilai dugaan yang berbeda (Sari 2015)
Regresi kuantil meminimumkan galat mutlak terboboti dan menduga model
dengan menggunakan fungsi kuantil bersyarat pada suatu sebaran data. Metode
regresi kuantil tidak membutuhkan asumsi parametrik dan regresi kuantil sangat
bermanfaat untuk menganalisis bagian tertentu dari suatu sebaran bersyarat (Buhai
2004). Keuntungan utama dari regresi kuantil adalah efisien jika sisaan tidak
menyebar normal dan kekar terhadap adanya pencilan.
Untuk peubah acak dengan fungsi sebaran peluang

=
kuantil ke-� dari didefenisikan sebagai fungsi invers � = �nf⁡{ , �
�}
dengan �
, , sebagai contoh median adalah
.5
Untuk contoh acak berukuran � dari peubah acak = , … ,
, median
contoh adalah penduga yang meminimumkan jumlah mutlak galat yaitu
m�n ∑|

− �|

m�n ∑|





=

seperti halnya median contoh, metode ini bisa dikembangkan untuk model regresi
kuantil
= �′ � + �
dengan =
,…,
′ adalah vektor respon berukuran � × , � =
,…, �
adalah matriks peubah penjelas berukuran � × � , � = � , … , �� ′ adalah vektor
parameter berukuran � × , dan � = � , … , � ′ adalah vektor galat berukuran
� × . Regresi disebut sebagai regresi median yang merupakan perluasan dari
median contoh. Penduga koefisien pada model regresi
merupakan solusi dari
minimisasi fungsi


=

′�|

Hubungan fungsional antara peubah respon dengan peubah penjelas pada
regresi kuantil merupakan hubungan fungsional antara kuantil bersyarat peubah
respon dengan peubah penjelas yang membentuk fungsi linier yaitu �| =
=
′� � . Menurut Koenker (2005), penduga regresi kuantil ke-� untuk �⁡�⁡ ,
merupakan solusi dari masalah minimisasi fungsi
m�n [∑ �{ | � ≥ ′� �} �| − ′�| + ∑ �{ | � < ′� �} − � | − ′�|]
(3)


Persamaan (3) memberikan bobot � untuk seluruh pengamatan yang lebih
besar dari nilai optimum yang belum diketahui dan memberikan bobot − �
terhadap seluruh pengamatan yang lebih kecil dari nilai optimum. Persamaan (3)
kemudian dapat diringkas menjadi persamaan dengan ekspresi tunggal seperti pada
persamaan (4) berikut:
− ′�
(4)
m�n ∑ = ��


dengan ��
adalah fungsi kerugian yang tidak simetrik. Fungsi kerugian dapat
dijabarkan sebagai berikut:
= ⁡ (� − � < )⁡⁡⁡,⁡⁡⁡ < � <
��
dengan I(.) merupakan fungsi indikator, I(A) = 1 jika A benar dan I(A) = 0 selainnya.

5
Pendugaan dalam regresi kuantil diperoleh dengan menyelesaikan masalah
pemrograman linier. Salah satu metode yang dapat digunakan untuk pendugaan
parameter regresi kuantil adalah metode simpleks.
Chen dan Wei (2005) mengemukakan tahapan dalam metode simpleks
sebagai berikut :
misalkan �⁡ = [ − �′�]+ , �⁡ = [�′ � − ]+ , ∅ = [�]+ , dan � = [−�]+ dengan
′, X merupakan matriks peubah penjelas dan [ ]+ adalah bagian
⁡=
,,,
yang tidak negatif dari z.
Untuk kasus regresi median, pendekatan simpleks menyelesaikan masalah
m�n ∑|


=



� ′�|

dapat diselesaikan dengan :
m�n{ ′ � + ′ �| = �′ � + � − �}


dimana adalah vektor satu berukuran �.
Misalkan �⁡ = [�′ −�′ � −�], = ∅′ , �′ , �′ , �′ ′, dan = ′ , ′ ′ , ′ ′,
dengan ′ = , … p , perumusan ulang dari masalah model linier baku:
m�n ′
dengan kendala � = , ,
max ′ , dengan kendala �′
max⁡ ′ | � =

. Masalah ini memiliki bentuk ganda yaitu
, yang dapat disederhanakan menjadi



+ , � = � , maka rumusan menjadi
=
max ′ { ′ |� = �}
Untuk regresi kuantil, masalah minimisasi adalah
Jika

m�n� ∑ ��
=



� ′�

dan analog dengan tahapan sebelumnya, rumusan masalah menjadi
max� ⁡ ′ | � = − � �
Penilaian kebaikan model dilakukan dengan menghitung Quantile
Verification Skill Score (QVSS). QVSS didefinisikan sebagai berikut :
∑ = �� | − �̂� |
��� = −
∑ = �� | − � |
dengan �
merupakan kuantil ke-� dari . Nilai QVSS berada pada selang [0,1].
Nilai QVSS yang mendekati 1 mengindikasikan bahwa model memiliki
kemampuan ramalan yang baik dan jika nilai QVSS yang mendekati 0
mengindikasi model memiliki kemampuan ramalan yang kurang baik.
Least Absolute Shrinkage and Selection Operator (LASSO)
Metode Least Absolute Shrinkage and Selection Operator (LASSO)
diperkenalkan pertama kali oleh Tibshirani pada tahun 1996. LASSO adalah
metode penalti alternatif dari metode kuadrat terkecil yang berfungsi dalam
penyeleksian peubah dan menghindari masalah overfitting.
Penduga koefisien LASSO � �
juga dapat ditulis dalam persamaan
Lagrangian berikut:

6
�̂ �
= m�n ∑ = ( − � − ∑�=
� ) + � ∑�= |� |
Sedangkan pada penduga regresi kuantil ke-� untuk �⁡�⁡ , setelah ditambahkan
penalti LASSO dapat ditulis sebagai berikut
− � ′� + � ∑�= |� |
(5)
m�n ∑ = ��


dengan � adalah parameter penalti (regularizer) yang mengontrol besarnya
penyusutan. Salah satu cara untuk mencari nilai � yang optimal adalah dengan
menggunakan metode cross validation (CV). Nilai � yang optimal adalah � dengan
nilai CV terkecil. Jika � = , maka maka penduga LASSO memberikan hasil yang
sama dengan penduga kuadrat terkecil. Jika � dinaikkan, maka nilai mutlak dugaan
koefisiennya menjadi semakin kecil menuju nol untuk � menuju tak hingga dan
memungkinkan beberapa koefisien tepat nol, sehingga dapat berfungsi sebagai
seleksi peubah.
Least Angle Regression (LAR) merupakan suatu metode regresi yang
algoritmanya dapat dimodifikasi menjadi algoritma komputasi untuk metode
LASSO. Modifikasi dari LAR untuk LASSO menghasilkan efisiensi algoritma
dalam menduga koefisien LASSO dengan komputasi yang lebih cepat
dibandingkan pemrograman kuadratik. Algoritma LAR untuk melakukan
pendugaan koefisien dari LASSO adalah sebagai berikut (Hastie et al. 1990):
1. Membakukan peubah bebas sehingga memiliki nilai tengah nol dan ragam satu.
Dimulai dengan sisaan �⁡ = ⁡ − ̅ , dan � , � , …⁡, �� = ⁡. Pembakuan ini
dimaksudkan agar dapat membandingkan dugaan koefisien regresi yang
memiliki ragam yang berbeda dalam suatu model.
2. Mencari peubah bebas yang paling berkorelasi dengan �.
3. Mengubah nilai � dari 0 bergerak menuju koefisien kuadrat terkecil
,� ,
sampai kompetitor ⁡yang lain memiliki korelasi yang cukup dengan sisaan
akibat .
4. Mengubah nilai � dan � bergerak ke arah koefisien kuadrat terkecil bersama
dari sisaan sekarang dengan ( , ) sampai kompetitor yang lain memiliki
korelasi yang cukup dengan sisaan akibat ( , )
5. Jika koefisien bukan nol mencapai nilai nol, keluarkan peubah tersebut dari
gugus peubah aktif dan hitung kembali arah kuadrat terkecil bersama.
6. Mengulang langkah nomor 4 sampai semua � peubah bebas dimasukkan.
Setelah min � − , � ⁡langkah, solusi model penuh untuk kuadrat terkecil
diperoleh.
Validasi Silang
Setiap metode regulasi memiliki koefisien penalti yang berfungsi untuk
mengontrol jumlah regulasi yang ada. Hal ini juga dapat menentukan seberapa baik
model yang terbentuk. Terdapat beberapa metode pemilihan model terbaik yang
dapat digunakan antara lain nilai Cp Mallows, validasi silang atau Cross Validation
(CV), dan validasi silang terampat atau Generalized Cross Validation (GCV).
Metode validasi silang paling baik digunakan untuk menangani masalah over
fitting. Ide utama dari metode ini adalah tidak menggunakan semua data yang ada
dalam membangun model dan menyisakan sebagian data untuk validasi. Metode ini
juga merupakan cara paling sederhana dan intuitif untuk menduga sisaan prediksi.

7
Salah satu metode tipe validasi silang adalah k-fold. Pada metode ini semua
data dibagi secara acak ke dalam k bagian atau folds dengan � = , . . . , . Fold kek digunakan sebagai validasi (testing) dan sisanya digunakan untuk membangun
model (training), iterasi ini berulang sampai K kali. Pada saat = � metode ini
disebut validasi silang leave-one-out.
Prosedur dari validasi silang k-fold adalah sebagai berikut:
1. Bagi data set { , … , �} secara acak menjadi k- fold yang sama besar, � , … , �
2. Untuk � = , . . . , :
 Gunakan
,
, � � sebagai data training dan ,
, � �
sebagai data testing.

 Untuk masing-masing parameter � {� , … , � }, hitung nilai �̂� pada
data training serta hitung jumlah sisaan pada data testing:

� = ∑
− �̂�

��

3. Untuk setiap nilai �, hitung rata-rata sisaan dari semua fold,
�� � =




=

� =



∑∑
=

��

− �̂�



4. Nilai � terbaik adalah � dengan nilai CV paling kecil.



3 METODE
Data

Data luaran GCM yang digunakan adalah data presipitasi bulanan Climate
Model Intercomparison Project (CMIP5) yang dikeluarkan oleh KNMI. Belanda
dari situs web http://www.climatexp.knmi.nl/ pada tahun 1979 sampai dengan 2008
dengan posisi wilayah –18.75o – 1.25oLS dan 101.25o – 116.25oBT. Data curah
hujan lokal yang digunakan adalah data rata-rata curah hujan di Kabupaten
Indramayu Propinsi Jawa Barat yang diukur dari 11 stasiun klimatologi yakni
stasiun Karang Anyar, Pusakanegara, Tulang Kacang, Juntinyuat, Losarang,
Dempet, Indramayu, Krangkeng, Sukadana, Karangkendal dan Gegesik.
Metode Analisis
1. Eksplorasi Data
a. Mendeskripsikan data curah hujan di Kabupaten Indramayu dengan statistika
deskriptif
b. Mengidentifikasi data curah hujan ekstrim dengan diagram kotak garis, data
curah hujan yang berada di luar kotak garis merupakan curah hujan ekstrim.
c. Membagi data curah hujan di Kabupaten Indramayu menjadi dua yaitu curah
hujan tahun 1979 sampai tahun 2007 sebagai data training dan curah hujan
tahun 2008 sebagai data testing.
2. Pemodelan SD menggunakan regresi kuantil dengan LASSO

8
a. Memilih nilai koefisien penalti (� ) yang optimum dengan menggunakan
metode cross validation (CV), nilai lambda dengan nilai CV terkecil
merupakan nilai lambda optimum.
b. Memodelkan data curah hujan di Kabupaten Indramayu dengan data luaran
GCM dengan menggunakan nilai lambda optimum.
3. Pemodelan SD menggunakan regresi kuantil dengan AKU
a. Mereduksi dimensi peubah penjelas (data GCM) yang bersesuaian dengan
curah hujan ekstrim menggunakan analisis komponen utama (AKU)
b. Memodelkan regresi kuantil dengan peubah respon curah hujan di Indramayu
dan peubah prediktor skor KU.
4. Validasi dan Uji Konsistensi Model
a. Menghitung nilai root mean square error of prediction (RMSEP)

1 n
 yi  yˆ i 2 . Semakin kecil nilai

n i 1
RMSEP, maka semakin kecil perbedaan antara nilai dugaan dengan nilai
aktual, yang berarti model yang dibentuk semakin akurat dalam menghasilkan
nilai dugaan
b. Menghitung nilai korelasi antara curah hujan ekstrim dengan nilai dugaan
n
 n  n 
n y i yˆ i    y i   yˆ i 
i 1
 i 1  i 1 
menggunakan formula r 
yang
2
2
n
n
n
n

 
 


n y i2    y i   n yˆ i2    yˆ i  
 i 1    i 1
 i 1  
 i 1
menunjukkan keeratan hubungan antara nilai dugaan dengan nilai aktualnya.
Semakin besar (dan positif) nilai korelasi maka semakin kuat hubungan antara
nilai dugaan dan nilai aktualnya, yang berarti pola nilai dugaan semakin
mendekati pola data aktualnya (Draper & Smith 1981)
menggunakan formula RMSEP 

9

Gambar 2 Diagram alir metode analisis
Jumlah model yang akan dibangun pada penelitian ini sebanyak 6 model yang
terdiri dari:
1. M1 adalah model regresi kuantil linear
2. M2 model regresi kuantil linear dengan tambahan peubah boneka pada setiap
bulan
3. M3 model regresi kuantil linear dengan tambahan peubah boneka untuk empat
bulanan. Model ini didasarkan pada penelitian Sutikno (2008) yang mengatakan
bahwa curah hujan dibagi dalam 4 kelompok bulan yakni bulan basah (Januari,
Februari, Desember), kelompok bulan peralihan bulan basah ke bulan kering
(Maret,April dan Mei), kelompok bulan kering (Juni, Juli dan Agustus) dan
kelompok bulan peralihan bulan kering ke bulan basah (September, Oktober dan
November) sehingga untuk menampung informasi tersebut bisa ditambahkan
peubah boneka dalam model sesuai dengan kelompok bulan yang ada.
4. M4 model regresi kuantil kuadratik, model ini didasari oleh penelitian Djuraidah
dan Wigena (2011) yang mengatakan curah hujan bulanan di Indramayu
memiliki pola kuadratik.
5. M5 model regresi kuantil kuadratik dengan penambahan peubah boneka untuk
setiap bulan.
6. M6 model regresi kuantil kuadratik dengan penambahan peubah boneka untuk
empat bulanan.

10

4 HASIL DAN PEMBAHASAN
Deskripsi Data
Deskripsi data curah hujan bulanan untuk Kabupaten Indramayu perlu
dilakukan sebagai informasi awal untuk mengetahui karakteristik dan pola curah
hujan yang digunakan untuk analisis berikutnya. Tabel 1 menunjukkan deskripsi
data curah hujan di Kabupaten Indramayu. Menurut Haryoko (2004), musim
kemarau mulai pada bulan April - September dan musim hujan berada antara
Oktober – Maret. Dapat dilihat pada Tabel 1 bahwa bulan-bulan yang termasuk
dalam musim hujan rata-rata memiliki curah hujan yang relatif tinggi akan tetapi
terjadi pergeseran musim dimana musim hujan baru terjadi pada bulan November
yang seharusnya sudah terjadi pada bulan Oktober. Pergeseran juga terjadi pada
musim kemarau yakni pada bulan April yang seharusnya tidak terjadi curah hujan
yang tinggi ternyata memiliki curah hujan yang tinggi. Rata-rata curah hujan
tertinggi terjadi pada bulan Januari dengan intensitas 308.8 mm. Simpangan baku
tertinggi terjadi pada bulan januari yaitu 126.3 mm yang menunjukkan bahwa pada
bulan january memiliki tingkat keragaman curah hujan yang tinggi. Koefisien
kemiringan untuk semua bulan lebih dari nol yang menandakan bahwa sebaran data
pengamatan tidak normal dan menjulur ke kanan, artinya nilai rata-rata lebih besar
dari median dan modus. Hal ini mengindikasikan bahwa terdapat curah hujan
ekstrim pada data data pengamatan.

Bulan
Jan
Feb
Mar
Apr
May
Jun
Jul
Aug
Sep
Oct
Nov
Dec

Tabel 1 Deskripsi data curah hujan di Kabupaten Indramayu
Rataan Simpangan Baku Minimum Maksimum kemiringan
308.8
126.3
78.7
582.6
0.53
226.8
106.9
89.8
521.3
1.14
161.2
57.2
75.7
280.1
0.67
141.24
46.49
54.47
245.67
0.31
86.43
46.09
6.40
185.67
0.24
62.11
41.24
9.93
166.87
0.75
30.66
33.55
0.00
153.33
2.01
14.62
16.52
0.00
58.20
1.42
16.94
21.76
0.00
66.00
1.33
63.76
51.07
0.07
165.60
0.34
148.2
83.5
17.5
346.2
0.82
210.6
62.4
122.7
402.2
1.36

Gambar 3 merupakan diagram kotak garis dari data curah hujan di Kabupaten
Indramayu menunjukkan bahwa pada bulan Februari, Juli, Agustus, September,
November dan Desember terdapat curah curah hujan bulanan yang lebih tinggi dari
kondisi normalnya hal ini membuktikan bahwa curah hujan di Indramayu
terindikasi terjadi curah hujan ekstrim. Gambar 3 juga menunjukkan bahwa data
curah hujan di Kabupaten Indramayu merupakan tipe monsunal karena memiliki
pola sinusoidal dimana terdapat satu puncak terendah. Menurut Tjasjono (1999)
dalam Pribadi (2012) tipe seperti ini dipengaruhi oleh angin monsoon. Angin

11
monsoon adalah angin yang sangat mempengaruhi pola cuaca di daerah tropis dan
berkaitan dengan musim hujan dan musim kemarau.
600

Curah Hujan (mm/bulan)

500

400

300

200

100

0
Jan

Feb

Mar

Apr

Mei

Jun
Jul
Bulan

Agu

Sep

Okt

Nov

Des

Gambar 3 Diagram kotak garis curah hujan Kabupaten Indramayu
Regresi Kuantil dengan LASSO
Korelasi tertinggi antar peubah GCM adalah sebesar 0.99 yang terletak pada
grid 75 dan grid 65 di mana kedua grid ini saling berdekatan. Semakin dekat letak
antar grid maka akan memiliki korelasi yang semakin tinggi dan sebaliknya
semakin jauh letak antar grid maka korelasinya akan semakin kecil.
Kendala yang sering dihadapi oleh peneliti adalah tentang penetuan luasan
grid dari data GCM. Terlalu sempit luasan grid/domain yang digunakan akan
mengurangi informasi pengaruh global/regional. Sebaliknya, luasan grid yang
terlalu luas menyebabkan informasi lokal akan berkurang (Sutikno 2008). Oleh
karena itu pada penelitian ini juga akan dicobakan jumlah grid yang lebih kecil dari
grid 8×8 yaitu 6×6 grid. Hasil prediksi dari kedua jumlah grid tersebut
dibandingkan untuk mengetahui jumlah grid mana yang memiliki tingkat ketepatan
prediksi yang lebih baik.
Langkah pertama yang dilakukan adalah mencari nilai lambda optimum dari
LASSO dengan menggunakan metode validasi silang. Nilai lambda optimum yang
diperoleh untuk Model M1 yaitu sebesar 0.35 dengan nilai CV sebesar 38.75. Tabel
2 adalah nilai lambda optimum dari LASSO pada masing-masing model pada kedua
ukuran luasan grid.
Tabel 2 Nilai lambda optimum untuk masing-masing model
Model
Lambda optimum
Grid 8×8
Grid 6×6
M1
0.35
21.14
M2
0.22
0.41
M3
1.10
21.63
M4
94.70
0.45
M5
6.92
0.49
M6
94.70
0.45

12
Pemodelan data dilakukan dengan menggunakan nilai lamda optimum dari
masing-masing model dan akan dihitung nilai QVSS dan RMSEP dari tiap model.
Gambar 4 menunjukkan bahwa untuk grid 8×8 nilai QVSS tertinggi ada pada
Model M4 (kuantil kuadratik), model dengan nilai QVSS tertinggi adalah model
terbaik. Nilai RMSEP dari Model M4 dapat dilihat pada gambar 5 yaitu 71.85 untuk
kuantil ke 75, 103.88 untuk kuantil ke 90 dan 135.56 untuk kuantil 95. Nilai
RMSEP ini relatif kecil jika dibandingkan dengan model lainnya. Sedangkan pada
grid 6×6 model M1 memiliki nilai QVSS tertinggi (Gambar 4) dan memiliki nilai
RMSEP terendah, sehingga diperoleh model terbaik adalah Model M4 pada grid
8×8 dan M1 pada grid 6×6. Diketahui kedua model tersebut merupakan model yang
tidak memiliki peubah boneka. Hal ini mengindikasikan bahwa penambahan
peubah boneka atau pengelompokan bulan tidak memberikan pengaruh yang
signifikan terhadap kebaikan hasil prediksi. Hal ini juga terjadi pada penelitian
Mondiana (2012) dimana model terbaik yang didapatkan adalah model tanpa
peubah boneka. Secara grafis juga dapat dilihat pada gambar 5 bahwa nilai RMSEP
model pada grid 6×6 cenderung lebih kecil dibandingkan model pada grid 8×8
sehingga dapat dikatakan bahwa grid 6×6 memiliki ketepatan prediksi yang lebih
baik dibandingkan dengan model pada grid 8×8.
Prediksi curah hujan untuk tahun 2008 dilakukan dengan menggunakan
model terbaik. Gambar 6 adalah hasil prediksi curah hujan oleh model M4 dengan
jumlah grid 8×8 . Pada Model M4 dapat dilihat bahwa curah hujan ekstrim pada
bulan februari dapat diprediksi dengan baik oleh Model M4 pada kuantil ke 95.
Bulan Februari merupakan intensitas curah hujan tertinggi yang terjadi di tahun
2008 dengan nilai 439 mm/bulan. Nilai ini dapat diestimasi dengan baik oleh
prediksi pada kuantil ke-90 yakni 429.177 mm/bulan. Model M1 juga dapat
menduga curah hujan pada bulan Januari dan Maret dengan baik. Secara umum,
untuk bulan-bulan yang berada di musim kemarau (April-September), nilai prediksi
pada kuantil ke-75, ke-90, dan ke-95 lebih tinggi dari nilai aktual, namun mampu
mengikuti pola curah hujan aktual dengan baik. Hal yang sama terjadi pada model
terbaik yang menggunakan grid 6×6 (Model M1) pada gambar 7 dimana curah
hujan pada bulan januari dan maret dapat diprediksi dengan baik oleh Model M1
pada kuantil ke 90.
0,7
0,6

QVSS

0,5
0,4

q75

0,3

q90

0,2

q95

0,1
0
M1 M2 M3 M4 M5 M6 M1 M2 M3 M4 M5 M6
grid 8x8

grid 6x6

Gambar 4 Nilai QVSS dari keenam model yang menggunakan LASSO untuk grid
8×8 dan grid 6×6

13
180
160
140

RMSEP

120
100

q75

80

q90

60

q95

40
20
0
M1

M2

M3

M4

M5

M6

grid 8x8

M1

M2

M3

M4

M5

M6

grid 6x6

Curah Hujan (mm/bulan)

Gambar 5 Nilai RMSEP keenam model yang menggunakan LASSO untuk grid 8×8
dan grid 6×6
500
450
400
350
300
250
200
150
100
50
0

tau= 0.95
tau= 0.90
tau= 0.75
aktual

Jan Feb Mar Apr Mei Jun Jul Agu Sept Okt Nov Des

Bulan

Gambar 6 Nilai prediksi dari Model M4 untuk metode LASSO pada grid 8×8

Curah Hujan (mm/bulan)

500
450
400
350
300

tau= 0.95

250

tau= 0.90

200
150

tau= 0.75

100

aktual

50
0
Jan Feb Mar Apr Mei Jun Jul Agu Sept Okt Nov Des

Bulan

Gambar 7 Nilai prediksi dari Model M1 untuk metode LASSO pada grid 6×6

14
Regresi Kuantil dengan Analisis Komponen Utama
Langkah pertama yang dilakukan sebelum memodelkan regresi kuantil adalah
melakukan reduksi dimensi GCM dengan menggunakan AKU. Pemilihan jumlah
komponen utama yang digunakan dengan menggunakan kriteria ragam kumulatif
dari komponen utama (KU). Jumlah KU yang terpilih adalah KU dengan ragam
kumulatif yang lebih dari 95%. Sama halnya dengan metode LASSO kriteria
pemilihan model terbaik pada metode AKU juga menggunakan nilai QVSS, model
dengan nilai QVSS tertinggi merupakan model terbaik. Gambar 8 menunjukkan
nilai QVSS masing-masing model untuk jumlah grid 8×8 dan grid 6×6. Pada jumlah
grid 8×8 model terbaik ada pada Model M5 sedangkan pada jumlah grid 6×6 model
terbaik ada pada Model M1. Gambar 9 juga menunjukkan bahwa RMSEP antara
model yang menggunakan grid 8×8 dan grid 6×6 tidak menunjukkan perbedaan
yang signifikan sehingga tidak bisa diketahui jumlah grid yang paling baik untuk
model yang menggunakan metode AKU.
0,8
0,7

QVSS

0,6
0,5
0,4

q75

0,3

q90
q95

0,2
0,1
0

M1

M2

M3

M4

grid 8x8

M5

M6

M1

M2

M3

M4

M5

M6

grid 6x6

Gambar 8 Nilai QVSS dari enam model yang menggunakan AKU untuk grid 8×8
dan grid 6×6

140
120

RMSEP

100
80

q75

60

q90

40

q95

20
0
M1 M2 M3 M4 M5 M6 M1 M2 M3 M4 M5 M6
grid 8x8

grid 6x6

Gambar 9 Nilai RMSEP dari enam model yang menggunakan AKU untuk grid 8×8
dan grid 6×6

15

Prediksi curah hujan untuk tahun 2008 dengan menggunakan model terbaik.
Gambar 10 adalah hasil prediksi curah hujan untuk model dengan jumlah grid 8×8
(Model M2) dan gambar 11 untuk hasil prediksi curah hujan model yang
menggunakan grid 6×6 (Model M1). Dapat dilihat pada gambar 10 bahwa prediksi
M2 menunjukkan pola yang sedikit berbeda dari curah hujan sebenarnya dimana
prediksi bulan Februari lebih rendah dari bulan Januari. M1 pada grid 6×6
menunjukkan pola prediksi yang lrbih baik dari M2 pada grid 8 × 8 dimana M1
dapat mengkuti pola data aktual dengan baik. M1 juga dapat menduga curah hujan
pada bulan Januari, Februari dan Maret dengan baik.

Curah Hujan (mm/bulan)

600
500
400
tau= 0.95
300

tau= 0.90

200

tau= 0.75
aktual

100
0
jan

feb mar apr mei jun

jul

agu sept okt Nov Des

Bulan

Gambar 10 Nilai prediksi dari Model M2 untuk metode AKU pada grid 8×8

500

curah hujan (mm/bulan)

450
400
350
300

tau= 0.95

250

tau= 0.90

200

tau= 0.75

150

aktual

100
50
0
Jan Feb Mar Apr Mei Jun

Jul Agu Sept Okt Nov Des

Bulan

Gambar 11 Nilai prediksi dari Model M1 untuk metode AKU pada grid 6×6

16
Perbandingan SD Regresi Kuantil menggunakan LASSO dan Analisis
Komponen Utama
Perbandingkan hasil prediksi dari model SD yang menggunakan metode
LASSO dan yang menggunakan metode AKU dapat dilihat dari nilai RMSEP.
Menurut Hastie et all (1990), pada dasarnya ketepatan hasil prediksi yang diperoleh
dari regresi LASSO dan AKU saling berkompetisi. Salah satu kelebihan metode
LASSO dibandingkan AKU terletak pada model yang dihasilkan dimana model
yang menggunalan LASSO lebih sederhana dan mudah diinterpretasi. Acharjee
(2013) juga membandingkan regresi LASSO dan AKU dengan menggunakan
kriteria RMSEP dimana diketahui bahwa regresi LASSO memiliki nilai RMSEP
yang lebih rendah dibandingkan dengan regresi AKU. Pada kasus ini diketahui
bahwa nilai RMSEP model yang menggunakan metode LASSO dan AKU tidak
berbeda signifikan atau cenderung sama. Tabel 3 adalah perbandingan nilai RMSEP
dari kedua metode untuk panjang data yang berbeda. Dapat diketahui bahwa nilai
RMSEP dari LASSO khususnya pada kuantil 90 memiliki standar deviasi yang
kecil, hal ini menunjukkan bahwa model LASSO khususnya model pada kuantil ke
90 memiliki hasil prediksi yang lebih konsisten dibandingkan dengan model yang
menggunakan metode AKU.
Tabel 3 Perbandingan nilai RMSEP di setiap panjang data pendugaan model SD
dengan regresi kuantil menggunakan LASSO dan AKU
Data
Data
RMSEP
Model
Validasi
LASSO
AKU
Q90

Q95

Q90

Q95

1979-2007

2008

90.71

118.92

91.70

110.46

1979-2006

2007-2008

89.48

119.99

115.36

121.73

1979-2005

2006-2008

95.30

133.62

102.93

126.45

1979-2004

2005-2008

98.95

147.50

110.68

133.21

1979-2003

2004-2008

106.32

141.30

116.37

136.53

6.82

11.35

10.26

10.28

Standar deviasi

Validasi dan Uji Konsistensi Model LASSO
Validasi adalah tahapan untuk memperoleh gambaran tentang keakuratan
dugaan model tersebut. Tabel 4 menunjukan bahwa semakin panjang data yang
akan diduga maka akan menghasilkan nilai RMSEP yang semakin besar pula dan
nilai korelasi data curah hujan aktual dan curah hujan prediksi akan semakin
mengecil, meskipun tidak menunjukkan perbedaan yang sangat signifikan. Model
SD dengan regresi kuantil menggunakan LASSO yang memberikan nilai RMSEP
terkecil, sekaligus nilai korelasi terbesar pada pendugaan data curah hujan ekstrim
untuk 1 tahun ke depan.
Hasil tersebut menunjukkan bahwa pendugaan model SD dengan regresi
kuantil menggunakan LASSO sangat baik digunakan untuk menduga curah hujan

17
ekstrim di Kabupaten Indramayu untuk 1 tahun ke depan karena memiliki korelasi
yang tinggi serta nilai RMSE dan RMSEP yang rendah. Namun, perlu
diperhitungkan lagi kekonsistenan model yang dihasilkan tersebut untuk setiap
waktu pendugaan yang berbeda.
Tabel 4 Nilai RMSEP dan korelasi di setiap panjang data pendugaan model SD
dengan regresi kuantil menggunakan LASSO
Data
Data Dugaan Kuantil ke �
RMSE
RMSEP
Korelasi
Historis
75
73.47
68.71
0.94
29 th
1 th
90
105.73
90.71
0.94
95
129.66
118.92
0.90
75
73.58
67.53
0.87
28 th
2 th
90
107.41
89.48
0.90
95
133.66
119.99
0.87
75
73.70
69.04
0.87
27 th
3 th
90
106.79
95.30
0.89
95
141.54
133.62
0.86
75
74.10
67.47
0.86
26 th
4 th
90
106.69
98.95
0.87
95
151.54
147.50
0.84
Konsistensi model SD dengan regresi kuantil menggunakan LASSO dapat
diketahui dari hasil pendugaan yang konsisten pada berbagai waktu pendugaan.
Model SD akan memberikan hasil yang baik jika hubungan antara peubah respon
dengan peubah penjelas tidak berubah dengan perubahan waktu dan tetap sama
meskipun ada perubahan iklim, atau model SD tetap konsisten dalam pendugaannya
pada waktu-waktu yang berbeda (Wigena 2006). Nilai korelasi untuk setiap data
historis yang tercantum pada Tabel 5 berikut.
Tabel 5 Nilai korelasi pendugaan model SD dengan regresi kuantil menggunakan
LASSO untuk pendugaan curah hujan ekstrim 1 tahun ke depan
Data Historis Data Dugaan Kuantil ke - �
Ko