Pemodelan Statistical Downscaling Dengan Regresi Kuantil Regularisasi Gulud Dan Elastic-Net Untuk Pendugaan Curah Hujan Di Indramayu

PEMODELAN STATISTICAL DOWNSCALING DENGAN
REGRESI KUANTIL REGULARISASI GULUD DAN ELASTIC-NET
UNTUK PENDUGAAN CURAH HUJAN DI INDRAMAYU

TRI BUDI NOVIA CAHYANI

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul Pemodelan Statistical
Downscaling dengan Regresi Kuantil Regularisasi Gulud dan Elastic-net untuk
Pendugaan Curah Hujan di Indramayu adalah benar karya saya dengan arahan dari
komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan
tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang
diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks
dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.
Bogor, September 2016
Tri Budi Novia Cahyani
NIM G151140181

RINGKASAN
TRI BUDI NOVIA CAHYANI. Pemodelan Statistical Downscaling dengan
Regresi Kuantil Regularisasi Gulud dan Elastic-net untuk Pendugaan Curah
Hujan di Indramayu. Dibimbing oleh AJI HAMIM WIGENA dan ANIK
DJURAIDAH.
Indonesia yang terletak antara 6o LU sampai 11o LS dan antara 95o BT
sampai 141o BT, dan dilintasi garis khatulistiwa memiliki iklim tropis dengan
keragaman curah hujan yang besar. Hal tersebut dapat menyebabkan peningkatan
atau penurunan curah hujan secara ekstrim. Curah hujan ekstrim dapat
menimbulkan dampak buruk pada berbagai sektor, salah satunya adalah sektor
pertanian karena dapat merusak tanaman.
Indonesia merupakan negara agraris yang cukup maju sektor pertaniannya.
Salah satu hasil pertanian terpenting di Indonesia adalah padi, yang banyak
dihasilkan di wilayah Pulau Jawa. Kabupaten Indramayu merupakan salah satu
penghasil padi terbesar di Jawa Barat yang berpotensi besar terkena dampak buruk

adanya curah hujan ekstrim. Pemodelan curah hujan tersebut perlu dilakukan
untuk menghindari dampak buruk yang mungkin terjadi.
Regresi kuantil adalah suatu teknik yang dapat digunakan untuk
memodelkan curah hujan ekstrim. Regresi kuantil dapat mengukur efek peubah
penjelas pada berbagai nilai kuantil sebaran data. Pembentukan model regresi
tersebut dapat dilakukan dengan memanfaatkan data luaran dari General
Circulation Models (GCM). Akan tetapi, GCM menghasilkan data berskala
global, sehingga sulit memperoleh informasi berskala lokal secara langsung. Suatu
teknik yang dapat digunakan untuk menghubungkan data berskala global dengan
data berskala lokal disebut dengan downscaling.
Statistical downscaling (SD) adalah salah satu teknik downscaling yang
menetapkan hubungan fungsional antara data curah hujan dengan data luaran
GCM. Karakteristik data GCM selain berskala global adalah terdapat
multikolinieritas antar gridnya. Hal tersebut menyebabkan data GCM tidak dapat
digunakan secara langsung dalam memodelkan curah hujan sebelum
multikolinieritas diatasi.
Metode yang sering digunakan untuk mengatasi multikolinieritas adalah
analisis komponen utama atau analisis komponen utama fungsional. Selain
metode tersebut, multikolinieritas juga dapat diatasi menggunakan regularisasi
gulud, lasso, atau elastic-net (gabungan dari regularisasi gulud dan lasso).

Regularisasi gulud mengatasi multikolinieritas dengan membuat nilai koefisien
peubah penjelas menjadi sangat kecil mendekati nol. Regularisasi lasso dapat
membuat koefisien tersebut bernilai nol sehingga peubah penjelas yang
bersesuaian dapat dikeluarkan dari model. Keunggulan tersebut membuat lasso
dapat menghasilkan model dengan peubah penjelas yang lebih sedikit dan
mempermudah interpretasi. Akan tetapi, ketika banyaknya pengamatan lebih
besar daripada banyaknya peubah penjelas, regularisasi gulud tetap memberikan
hasil prediksi yang lebih baik. Pada penelitian ini digunakan regularisasi gulud
dan elastic-net pada regresi kuantil untuk prediksi curah hujan ekstrim.
Pemodelan tersebut dilakukan dengan menggunakan data curah hujan pada
ZOM 79 Kabupaten Indramayu tahun 1981-2013 digunakan sebagai peubah

respon dan data presipitasi GCM sebagai peubah penjelas. Sebelum pembentukan
model, pada data GCM dilakukan pergeseran waktu untuk mendapatkan peubah
penjelas yang berkorelasi tinggi dengan peubah respon. Selanjutnya data dibagi
menjadi dua bagian, yaitu data pemodelan (tahun 1981-2012) untuk membangun
model dan data validasi (tahun 2013) untuk validasi. Langkah awal yang
dilakukan dalam membangun model adalah menentukan nilai parameter
regularisasi yang optimum. Penentuan parameter regularisasi gulud dan elastic-net
yang optimum dilakukan dengan menggunakan metode validasi silang (CV).

Selanjutnya, pemodelan dilakukan untuk pendugaan nilai-nilai curah hujan pada
nilai-nilai kuantil ke-0.75, ke-0.90, dan ke-0.95.
Hasil pemodelan regresi kuantil gulud dan kuantil elastic-net dapat
digunakan untuk prediksi curah hujan tinggi yang terjadi pada Bulan Januari
(kuantil ke-0.75) dan Bulan Desember (kuantil ke-0.90) dengan baik. Nilai
prediksi dan nilai aktual curah hujan memiliki pola yang sama serta konsisten
pada berbagai waktu yang berbeda. Akan tetapi, model regresi kuantil elastic-net
memberikan hasil prediksi yang lebih baik dengan nilai RMSEP validasi yang
lebih rendah dan nilai korelasi yang lebih tinggi daripada model regresi kuantil
gulud.
Kata kunci: general circulation model, regresi kuantil, regularisasi elastic-net,
regularisasi gulud, statistical downscaling

SUMMARY
TRI BUDI NOVIA CAHYANI. Statistical Downscaling Modelling with Ridge
and Elastic-net Regularized Quantile Regression for Rainfall Prediction in
Indramayu. Supervised by AJI HAMIM WIGENA and ANIK DJURAIDAH.
Indonesia is located between 6o N to 11o S latitude and between 95o to 141o
E longitude, also crossed the equator has a tropical climate with a high diversity of
rainfall. It can cause an extreme decrease or increase of rainfall. Extreme rainfall

has a negative impact in many sectors, especially agriculture because it can
damage the plants.
Indonesia is an agrarian country with a good development in agricultural
sector. Rice is an important agricultural product which are mostly produced in
Java. Indramayu is one of the largest rice producer in West Java with a big
potential threatened by the impact of extreme rainfall. Modeling of extreme
rainfall is needed to avoid negative effects that may occur.
Quantile regression is a technique that can be used to model extreme
rainfall. It measures the effect of the explanatory variables at the various quantiles
of the distribution data. Quantile regression model can be built using the output of
General Circulation Models (GCM) data. However, GCM generate a global scale
data, making it difficult to directly obtain local scale information. A technique that
can be used to link a global scale data with a local scale data is downscaling.
Statistical downscaling (SD) is one of the downscaling technique that
developes a functional relation between rainfall data and GCM data. GCM data is
not only has a global scale but also high correlation between its grids, usually
calle multicollinearity. This causes the GCM data can’t be used directly in
modeling rainfall before overcoming multicollinearity.
The method often used to overcome multicollinearity is principal
component analysis or functional principal component analysis. Another method

can be used to overcome multicollinearity is regularization, such as ridge, lasso, or
elastic-net (a combination of ridge and lasso regularization) regularization. Ridge
regularization overcomes multicollinearity by setting the coefficient of the
explanatory variables becomes very small near zero. Lasso regularization can set
the coefficient exactly zero so the corresponding explanatory variables can be
excluded from the model. It makes lasso can produce models with fewer
explanatory variables and simplify interpretation. However, when the number of
observations is greater than the number of explanatory variables, the ridge
regularization still gives a better prediction. This study applied ridge and elasticnet regularization to quantile regression for the prediction of extreme rainfall.
The modeling is built using rainfall data in ZOM 79 Indramayu from 1981
to 2013 as the response variable GCM precipitation data as explanatory variables.
Time lag for GCM data is determined before modelling to get predictor variables
with higher correlation to response variable. The data is divided into two parts,
training data (1981-2012) to build the model and testing data (2013) for
validation. The initial step in model building is determine the optimum
regularization parameters. The optimum ridge and elastic-net regularization
parameters are determined using cross validation (CV) method. The models is

conducted then to predict extreme values of rainfall on the upper quantiles of the
data, 0.75th, 0.90th, and 0.95th quantiles.

Both quantile ridge and quantile elastic-net regression models can predict
extreme values of rainfall that occurred in January (0.75th quantile) and December
(0.90th quantile) well. The predicted value and actual value of rainfall has the
similar pattern and consistent at various different times. However, quantile elasticnet regression model provides a better prediction than quantile ridge regression
model with the lower validation RMSEP value and the higher correlation value.
Keywords: elastic-net regularization, general circulation models, quantile
regression, ridge regularization, statistical downscaling

© Hak Cipta Milik IPB, Tahun 2016
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan
IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apa pun tanpa izin IPB

PEMODELAN STATISTICAL DOWNSCALING DENGAN
REGRESI KUANTIL REGULARISASI GULUD DAN ELASTIC-NET

UNTUK PENDUGAAN CURAH HUJAN DI INDRAMAYU

TRI BUDI NOVIA CAHYANI

Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains
pada
Program Studi Statistika

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016

Penguji Luar Komisi pada Ujian Tesis : Dr Ir Erfiani, MSi

Judul Tesis : Pemodelan Statistical Downscaling dengan Regresi Kuantil
Regularisasi Gulud dan Elastic-net untuk Pendugaan Curah Hujan
di Indramayu

Nama
: Tri Budi Novia Cahyani
NIM
: G151140181

Disetujui oleh
Komisi Pembimbing

Dr Ir Aji Hamim Wigena, MSc
Ketua

Dr Ir Anik Djuraidah, MS
Anggota

Diketahui oleh

Ketua Program Studi Statistika

Dekan Sekolah Pascasarjana


Dr Ir Kusman Sadik, MSi

Dr Ir Dahrul Syah, MScAgr

Tanggal Ujian: 28 Juli 2016

Tanggal Lulus:

PRAKATA
Segala puji dan syukur bagi Allah subhanahu wa ta’ala atas segala rahmat
dan karunia-Nya sehingga proposal penelitian yag berjudul “Pemodelan Statistical
Downscaling dengan Regresi Kuantil Regularisasi Gulud dan Elastic-net untuk
Pendugaan Curah Hujan di Indramayu” berhasil diselesaikan.
Penulis menyadari keberhasilan penulisan proposal ini tidak terlepas dari
dukungan dan bimbingan berbagai pihak. Oleh karena itu, penulis ingin
menyampaikan ucapan terima kasih kepada:
1. Dr Ir Aji Hamim Wigena, MSc dan Dr Ir Anik Djuraidah, MS selaku dosen
pembimbing atas segala bimbingan dan waktu yang telah diberikan.
2. Dr Ir Erfiani, MSi selaku dosen penguji dan Dr Ir I Made Sumertajaya, MS
selaku moderator pada ujian tesis.

3. Ibu Puji Mulyati, Bapak M. Kusnadi, Eko Budi Sanyoto, Dwi Budi Setiari,
Liesca Levy Sandhy, Slamet Rianto, dan suami Dorit Bayu Islam Nuswantoro
atas segala dukungannya.
4. Seluruh staf Departemen Statistika IPB.
5. Teman-teman mahasiswa pascasarjana statistika dan statistika terapan IPB.
6. Semua pihak lain yang telah membantu penyusunan tesis yang tidak dapat
disebutkan satu persatu.
Penulis menyadari masih banyak kekurangan pada tesis ini, sehingga
penulis mengharapkan kritik dan saran yang membangun. Semoga tesis ini dapat
bermanfaat bagi yang membacanya.

Bogor, September 2016
Tri Budi Novia Cahyani

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

1 TINJAUAN PUSTAKA

2

2 PENDAHULUAN
Latar Belakang
Tujuan Penelitian
General Circulation Models dan Statistical Downscaling
Regresi Kuantil
Regularisasi Gulud (L2)

1
1
2
2
3
4

Regularisasi Lasso (L1)

5

Regularisasi Elastic-net

6

Algoritma Semismooth Newton Coordinate Descent (SNCD)

7

Validasi Silang

10

3 METODE
Data
Prosedur Analisis Data

10
10
11

4 HASIL DAN PEMBAHASAN
Eksplorasi Data Curah Hujan
Pergeseran Waktu Data Presipitasi GCM
Regresi Kuantil
Regresi Kuantil Gulud

12
12
13
13
15

Regresi Kuantil Elastic-net

15

Pemilihan Model Terbaik

17

Konsistensi Model

20

5 SIMPULAN

21

DAFTAR PUSTAKA

21

LAMPIRAN

24

RIWAYAT HIDUP

31

DAFTAR TABEL
1 Statistika deskriptif curah hujan (mm/bulan) Kabupaten Indramayu
tahun 1981-2013
2 Nilai parameter gulud optimum hasil CV dan RMSEP pemodelan
3 Nilai prediksi curah hujan per bulan tahun 2013 dari model regresi
kuantil gulud
4 Nilai parameter elastic-net optimum hasil CV dan RMSEP pemodelan
5 Nilai prediksi curah hujan per bulan tahun 2013 dari model regresi
kuantil elastic-net
6 Nilai RMSEP validasi model regresi kuantil gulud dan kuantil elasticnet pada pendugaan curah hujan dalam 1 tahun
7 Nilai korelasi model regresi kuantil gulud dan kuantil elastic-net pada
pendugaan curah hujan dalam 1 tahun

13
15
15
16
16
20
21

DAFTAR GAMBAR
1 Skema statistical downscaling
2 Pendugaan koefisien untuk lasso dan gulud
3 Wilayah penalti regularisasi gulud, lasso, dan elastic-net dengan = 0.5
untuk � = 2
4 Pola curah hujan bulanan Kabupaten Indramayu tahun 1981-2013
5 Pola peubah GCM X21 sebelum dan setelah digeser 1 periode
6 Data curah hujan dengan beberapa nilai kuantil
7 Nilai RMSEP validasi model pada kuantil ke-0.75, ke-0.90, dan ke-0.95
8 Nilai korelasi model pada kuantil ke-0.75, ke-0.90, dan ke-0.95
9 Plot kuantil data dan nilai dugaan model regresi kuantil elastic-net
10 Plot kuantil data dan nilai dugaan model regresi kuantil gulud
11 Nilai prediksi model regresi kuantil gulud untuk curah hujan pada tahun
2013
12 Nilai prediksi model regresi kuantil elastic-net untuk curah hujan pada
tahun 2013

3
6
7
12
14
14
17
17
18
18
19
19

DAFTAR LAMPIRAN
1 Pergeseran waktu peubah presipitasi GCM dan korelasi sebelum dan
sesudah pergeseran terhadap curah hujan
2 Nilai kuantil data curah hujan per bulan
3 Hasil CV untuk regresi kuantil gulud pada kuantil ke-0.75 tahun
prediksi 2013
4 Nilai � optimum pada berbagai nilai dari CV untuk regresi kuantil
elastic-net tahun prediksi 2013
5 Peta analisis sifat hujan Bulan Februari 2013 dan Bulan April 2013
Provinsi Jawa Barat
6 Algoritma / Diagram Alir Penelitian

24
25
26
28
29
30

1 PENDAHULUAN
Latar Belakang
Curah hujan adalah salah satu komponen iklim, yang merupakan bagian
penting dari ekosistem alam. Curah hujan dapat menentukan ketersediaan air yang
terdapat pada bumi, sehingga memiliki peranan penting bagi manusia, terutama
pada sektor pertanian yang sangat bergantung pada ketersediaan air. Secara
astronomis, Indonesia yang terletak antara 6o LU sampai 11o LS dan antara 95o
BT sampai 141o BT, dan dilintasi garis khatulistiwa memiliki iklim tropis dengan
keragaman curah hujan yang besar. Peningkatan atau penurunan curah hujan
secara ekstrim akan berdampak buruk bagi pertanian karena dapat merusak
tanaman. Hal tersebut tentu sangat berpengaruh bagi Indonesia yang merupakan
negara agraris. Pulau Jawa adalah salah satu pulau di Indonesia yang memiliki
sektor pertanian yang baik, sehingga dapat terancam dampak curah hujan ekstrim.
Salah satu contoh dampak buruk tersebut telah terjadi di Kabupaten Indramayu.
Kabupaten Indramayu merupakan salah satu penghasil padi terbesar di Jawa
Barat dan mendapat julukan sebagai lumbung padi nasional. Curah hujan ekstrim
yang terjadi pada awal tahun 2006 menyebabkan banjir yang merendam area
sawah hingga seluas 38.981 hektar. Kerugian juga terjadi pada sektor perikanan
dan infrastruktur, karena 7.377 hektar area tambak dan 24.287 rumah juga
terendam banjir. Total kerugian yang ditimbulkan mencapai 252 miliar rupiah.
Oleh karena itu, pemodelan untuk prediksi curah hujan ekstrim diperlukan untuk
menghindari dampak buruk yang mungkin terjadi. Regresi kuantil adalah salah
satu metode yang dapat digunakan dalam pediksi curah hujan ekstrim karena
dapat mengukur efek peubah penjelas di bagian atas, pusat, maupun bawah
sebaran data. Djuraidah & Wigena (2011) telah menggunakan regresi kuantil
untuk mengeksplorasi curah hujan pada Kabupaten Indramayu. Penelitian tersebut
menghasilkan kesimpulan bahwa regresi kuantil dapat digunakan untuk
mendeteksi kondisi ekstrim kering (kuantil ke-0.05) maupun ekstrim basah
(kuantil ke-0.95).
Pemodelan curah hujan dapat dilakukan dengan memanfaatkan data yang
berasal dari luaran General Circulation Models (GCM). Data luaran GCM
merepresentasikan berbagai sistem yang terdapat di bumi, termasuk atmosfer,
lautan, permukaan tanah, dan laut es yang sangat berguna bagi penelitian tentang
perubahan dan variabilitas iklim (Yang et al. 2012). Namun GCM menghasilkan
data berskala global, sehingga sulit memperoleh informasi berskala lokal secara
langsung. Resolusi data GCM terlalu rendah untuk memprediksi data iklim lokal
yang dipengaruhi oleh sirkulasi atmosfer dan parameter lokal seperti topografi dan
tataguna lahan sehingga diperlukan suatu teknik yang disebut downscaling
(Wigena 2006). Statistical downscaling (SD) adalah salah satu teknik
downscaling yang sering digunakan dalam pemodelan iklim dengan
memanfaatkan data berskala global untuk memperoleh kesimpulan pada skala
lokal. Data berskala global yang digunakan sebagai penjelas adalah data luaran
GCM dan data berskala lokal sebagai respon adalah data curah hujan.
Permasalahan lain timbul karena karakteristik data GCM selain memiliki dimensi
yang besar, juga terdapat multikolinieritas antar grid.

2
Multikolinieritas pada umumnya dapat diatasi dengan analisis komponen
utama (AKU) dan analisis komponen utama fungsional (AKUF). Mondiana
(2012) melakukan pemodelan curah hujan ekstrim menggunakan regresi kuantil
dan mereduksi dimensi peubah penjelas dengan AKU. Sari (2015) juga
menggunakan regresi kuantil untuk memprediksi curah hujan ekstrim, sedangkan
multikolinieritas diatasi dengan metode AKUF. Selain kedua metode tersebut,
multikolinieritas juga dapat diatasi menggunakan regularisasi lasso. Soleh (2015)
melakukan pemodelan menggunakan pemodelan linier sebaran gamma dan pareto
terampat dengan regularisasi lasso untuk pendugaan curah hujan ekstrim. Santri
(2016) membangun model regresi kuantil dengan regularisasi lasso. Metode lain
yang dapat digunakan untuk mengatasi multikolinieritas adalah regularisasi gulud
dan elastic-net. Pada penelitian ini akan dilakukan pemodelan curah hujan ekstrim
dengan menggunakan regresi kuantil regularisasi gulud dan elastic-net.

Tujuan Penelitian
Tujuan dari penelitian ini adalah :
1. Melakukan pemodelan dengan regresi kuantil menggunakan regularisasi
gulud dan elastic-net untuk pendugaan curah hujan di Kabupaten Indramayu.
2. Menentukan model terbaik yang dapat digunakan untuk pendugaan curah
hujan di Kabupaten Indramayu.

2 TINJAUAN PUSTAKA
General Circulation Models dan Statistical Downscaling
General Circulation Models (GCM) sering digunakan dalam studi mengenai
perubahan dan variabilitas iklim. Pada GCM, peubah iklim global disimulasikan
pada setiap grid untuk setiap lapisan atmosfer, sehingga data dari luaran GCM
berupa grid-grid dengan ukuran 2.5o×2.5o atau sekitar 300 km × 300 km. Data
tersebut dapat digunakan untuk memprediksi pola iklim jangka panjang, misalnya
tahunan. Data GCM memiliki karakteristik berdimensi besar dengan resolusi
kasar, dan multikolinieritas (Wigena 2006).
Downscaling merupakan suatu teknik untuk melakukan proyeksi masa
depan dari data iklim lokal menggunakan data luaran GCM yang beresolusi kasar.
Statistical downscaling (SD) adalah salah satu jenis pendekatan downscaling yang
sering digunakan. Metode SD menetapkan hubungan matematis antara data luaran
GCM yang berskala relatif kasar dengan peubah iklim lokal berskala baik
berdasarkan data pengamatan. Pendekatan SD kebanyakan menggunakan metode
regresi (Abraham et al. 2011). Skema dari teknik SD disajikan pada Gambar 1.
Model SD dapat menggambarkan hubungan antara peubah-peubah berskala
global dari data luaran GCM dengan peubah berskala lokal, yaitu curah hujan.
Pembuatan model SD yang baik harus memmperhatikan tiga hal, yaitu keeratan
hubungan antara peubah respon dan peubah penjelas, peubah penjelas
disimulasikan dengan baik oleh peubah GCM, dan hubungan antara peubah

3
respon dan penjelas tidak berubah dengan adanya perubahan waktu dan tetap
sama meskipun terdapat perubahan iklim (Busuioc et al. 2001).
Bentuk model SD secara umum adalah:
=� �
dengan
= vektor peubah iklim lokal (curah hujan) atau respon

= matriks peubah luaran GCM (presipitasi) atau penjelas

Gambar 1 Skema statistical downscaling
Regresi Kuantil
Regresi kuantil pertama kali diperkenalkan oleh Roger Koenker dan Gilbert
Bassett pada tahun 1978. Regresi kuantil memodelkan nilai kuantil dari sebaran
peubah respon pada nilai tertentu dari peubah penjelas (Koenker & Hallock 2001).
Hal tersebut memungkinkan regresi kuantil untuk menduga respon di berbagai
nilai kuantil dari sebaran data.
Regresi kuantil sangat berguna ketika melakukan pemodelan yang fokus
pada bagian tertentu dari sebaran bersyarat suatu data, misalnya pada kuantil
bagian atas atau bawah sebaran data respon. Keuntungan lain dalam menggunakan
regresi kuantil adalah dapat melakukan pemodelan tanpa harus memenuhi asumsiasumsi parametrik tertentu, misalnya syarat sebaran yang harus dipenuhi suatu
data (Buhai 2005).
Suatu peubah acak bilangan real � yang memiliki fungsi sebaran:
= �<

maka kuantil ke-� dari peubah acak � tersebut didefinisikan sebagai:

�}
� = inf{ : �
� � = �
untuk setiap � [ , ].
Dalam menduga kuantil ke- �, regresi kuantil meminimumkan jumlah dari
sisaan mutlak terboboti. Pada model:
=
+ �� + �
dengan �× = vektor peubah respon
�× = vektor satu
= intersep

4
� �� = matriks peubah penjelas
� �× = vektor parameter
� �× = vektor galat
regresi kuantil ke- � , < � < didefinisikan sebagai solusi dari masalah
minimisasi:
min [




̂}
{ : � ≥�0 +�′� �

�|

− �′ �| +





̂}
{ : �
.
={
��
−� ,
Solusi dari pendugaan pada regresi kuantil diperoleh menggunakan metode
optimasi seperti pemrograman linier. Permasalahan optimasi fungsi kerugian pada
regresi kuantil dapat juga ditulis sebagai berikut:
min{� ′ + − � ′ | − � = − ,
ℝ� , ,
ℝ+� } ,
dengan = [ −
− ��]+ dan = [ −
− ��]− .
Permasalahan tersebut dapat dilihat sebagai bentuk kanonik:
}
,
min{ ′ �|�� −




dengan = ( ′� , � ′, − � ′) , � = ′ , ′ , ′ ′ , � = [� ⋮ � ⋮ −�], = � , dan
= ℝ� × ℝ+� . Oleh karena itu, bentuk primal dari permasalahan optimasi
tersebut menjadi:
min ′ �


dengan kendala �� =

.
Bentuk dual dari persamaan tersebut adalah:
max ′

dengan kendala �′
atau dapat disederhanakan menjadi:
[� − , �]� }
max{ ′ |�′ = ,


Misalkan = + − � , maka permasalahan menjadi:
[ , ]� }.
max{ ′ |�′ = − � �′ ,
Salah satu metode yang dapat digunakan dalam menyelesaikan
permasalahan pemrograman linier pada regresi kuantil adalah algoritma simpleks
dengan memanfaatkan matriks (Chen & Wei 2005). Algoritma simpleks terdiri
atas dua tahap, yaitu tahap pertama memilih kolom dari � sebagai kolom pivot
dan tahap kedua mengganti kolom dari � atau −� sebagai kolom basis atau
nonbasis. Solusi yang optimal diperoleh dengan menjalankan kedua tahap tersebut
secara iteratif.
Regularisasi Gulud (L2)
Regresi gulud diperkenalkan oleh Arthur E. Hoerl dan Robert W. Kennard
pada tahun 1970, yang menjadi salah satu solusi bagi permasalahan

5
multikolinieritas. Pendugaan
menambahkan penalti gulud:

koefisien

regresi

gulud

dilakukan

dengan




=

pada minimisasi jumlah kuadrat galat regresi linier. Dugaan koefisien dapat
dituliskan dalam persamaan Lagrange menjadi:


= argmin [∑
�0 ,�

− �′ �



=



+�∑

]

=

dengan � = banyaknya pengamatan dan � =banyaknya peubah penjelas.
Dengan adanya penalti tersebut, terjadi penyusutan koefisien pada regresi
gulud. Besarnya penyusutan dikontrol oleh parameter gulud � . Semakin besar
nilai � maka semakin besar penyusutan koefisien yang terjadi hingga mendekati
nol. Hasil penduga koefisien gulud tidak equivariant dengan adanya perbedaan
skala pada data input, sehingga data perlu dibakukan terlebih dahulu sebelum
digunakan (Hastie et al. 2008).
Seperti halnya pada regresi linier, penalti juga dapat ditambahkan pada
regresi kuantil untuk mengatasi masalah miltikolinieritas. Dugaan koefisien pada
regresi kuantil dengan penalti gulud dituliskan sebagai berikut:


− �′ � + � ∑



= argmin [∑ ��
�0 ,�



=

].

=

(1)

Penyelesaian dari permasalahan optimasi tersebut dapat diselesaikan secara
numerik menggunakan pemrograman linier.
Regularisasi Lasso (L1)
Least Absolute Shrinkage and Selection Operator (lasso) adalah salah satu
metode penyusutan seperti gulud yang dapat mengatasi permasalahan
multikolinieritas yang diperkenalkan oleh Tibshirani (1996). Pendugaan koefisien
pada regresi dengan lasso didefinisikan sebagai:

dengan penalti



= argmin ∑
�0 ,�



=

∑| |
=

− �′ �


.

Dugaan koefisien regresi dengan menggunakan lasso dapat dituliskan dalam
bentuk persamaan Lagrange menjadi:

∑�=



= argmin [∑
�0 ,�

=





−� �



+ � ∑| |].
=

Penalti
| | pada lasso menyebabkan persamaan tersebut nonlinier
dalam , sehingga tidak dapat diperoleh solusi secara tertutup seperti pada gulud.
Dalam hal ini diperlukan pemrograman kuadratik. Berbeda dengan gulud,

6
regularisasi lasso melakukan seleksi peubah penjelas yang saling berkorelasi,
karena nilai yang cukup kecil dapat menyebabkan koefisien bernilai nol (Hastie
et al. 2008). Hal tersebut menyebabkan lasso dapat menghasilkan model dengan
peubah penjelas yang lebih sedikit (parsimoni).
Gambar 2 memberikan ilustrasi tentang penalti lasso dalam membuat nilai
koefisien menjadi 0 pada � = . ̂ adalah nilai dugaan dari metode kuadrat
terkecil dan garis elips merah adalah fungsi galat kuadrat terkecil. Daerah penalti
memiliki bentuk belah ketupat, sedangkan daerah
untuk lasso | | + | |
penalti untuk gulud
+
memiliki bentuk lingkaran. Belah ketupat
memiliki sudut, maka ketika elips menyentuh sudut tersebut berarti salah satu
koefisien bernilai 0. Lingkaran tidak memiliki sudut, sehingga elips menjadi lebih
sulit bersinggungan dengan daerah kendala pada titik 0. Ketika � > , maka
kendala lasso memiliki sudut lebih banyak sehingga peluang suatu koefisien
bernilai 0 lebih besar.

Gambar 2 Pendugaan koefisien untuk lasso (kiri) dan gulud (kanan)
Sumber: Hastie et al. (2008)
Pada regresi kuantil dengan regularisasi lasso, penduga koefisien dituliskan
sebagai berikut:


= argmin [∑ ��
�0 ,�

=





− �′ � + � ∑| |].
=

Regularisasi Elastic-net
Regularisasi lasso seperti yang telah dipaparkan memiliki beberapa
kekurangan, antara lain (Zou & Hastie 2005):
1. Ketika � > � , maka lasso hanya memilih � peubah yang diikutkan
dalam model.
2. Jika ada sekumpulan peubah dengan korelasi tinggi, maka lasso hanya
sembarang memilih salah satu peubah saja.
3. Ketika � < �, kinerja lasso lebih didominasi oleh gulud (Tibshirani,
1996).
Zou dan Hastie (2005) memperkenalkan penalti elastic-net sebagai berikut:

7


∑[ | | +
=



].

Jika = , maka elastic-net menjadi penalti gulud dan jika = maka
elastic-net menjadi penalti lasso. Pada regularisasi elastic-net terdapat penyusutan
koefisien bersama dari peubah-peubah penjelas yang berkorelasi seperti gulud dan
seleksi peubah seperti lasso (Hastie et al. 2008). Ilustrasi penalti gulud, lasso, dan
elastic-net disajikan pada Gambar 3.
Penduga koefisien pada regresi kuantil regularisasi elastic-net adalah:


= argmin [∑ ��
�0 ,�

Gambar 3

=





− �′ � + � ∑( | | +
=



)].

(2)

Wilayah penalti regularisasi untuk � = .
penalti gulud,
penalti lasso, dan
penalti elastic-net pada = .5.
Sumber: Zou & Hastie (2005)

Algoritma Semismooth Newton Coordinate Descent (SNCD)
Beberapa algoritma optimasi dapat digunakan untuk menyelesaikan
permasalahan dalam pendugaan parameter pada regresi kuantil dengan
regularisasi elastic-net (termasuk regularisasi lasso dan gulud pada kasus khusus
ketika
bernilai 0 atau 1). Congrui Yi dan Jian Huang pada tahun 2015
mengombinasikan algoritma semismooth Newton dan coordinate descent untuk
menyelesaikan permasalahan tersebut, yang dikenal dengan nama algoritma
Semismooth Newton Coordinate Descent (SNCD).
Algoritma semismooth Newton telah dibuktikan dapat mecapai kondisi yang
konvergen, namun penerapannya pada data berdimensi tinggi dapat membutuhkan
waktu yang cukup lama. Algoritma coordinate descent telah terbukti efektif untuk
permasalahan optimasi pada model regresi berdimensi tinggi, namun tidak ada
jaminan akan tercapai kondisi yang konvergen dalam iterasinya. Algoritma SNCD
menerapkan algoritma semismooth Newton pada setiap iterasi pada coordinate
descent. Dengan demikian, algoritma SNCD dapat mencapai kondisi yang

8
konvergen dan lebih cepat dibandingkan algoritma semismooth Newton (Yi &
Huang 2015).
Permasalahan optimasi regresi kuantil dengan regularisasi elastic-net
dengan intersep adalah:


min [ ∑ �
�0 ,� �

− �′ � + � ( ‖�‖ +



=



‖�‖ )]

, ‖�‖ = ∑�= | | , ‖�‖ = ∑�=
dengan
= ��
, � = banyaknya
pengamatan, dan � = banyaknya peubah penjelas.
Kondisi Karush-Kuhn-Tucker (KKT) dapat digunakan untuk memperoleh
solusi optimal dari suatu permasalahan optimasi konveks. Perumusan ulang
kondisi KKT untuk permasalahan optimasi regresi kuantil dengan regularisasi
elastic-net adalah sebagai berikut:


− ∑�

=


− �′ � =



− ∑�


− �′ �



=

+�

+�



=

�| | ,
= , ,…,�
{
dengan � adalah turunan pertama dari fungsi � dan �| | menunjukkan subgradien
dari nilai mutlak , yaitu
{sign }, jika | | ≠
�| | = {
[− , ],
jika | | = .
Kondisi KKT yang terakhir dari permasalahan tersebut dapat dituliskan kembali
dengan soft-thresholding operator sebagai berikut:
��
⟺ = Prox� +
dengan menggunakan nilai threshold 1, maka soft-thresholding operator menjadi:
| |− +
=
= sign
Prox|.|
sehingga
�| | ⇔ − ( + ) = .
Misalkan �
,∀
ℝ (turunan Newton dari � ) dan dugaan
� �′
̃
̃, �̃) dengan sisaan ̃ = − ̃ − �′ �
̃ . Nilai
̃
koefisien terakhir adalah � = ( , �
dugaan koefisien diperoleh dengan menetapkan dan � pada nilai tertentu.
(i) Nilai dugaan baru untuk
diperoleh dengan menganggap semua koefisien
bernilai tetap kecuali , sehingga kondisi KKT menjadi:


− ∑ �(


maka



=



− � �) = − ∑ � ( ̃ + ̃ −


∑ �( ̃ + ̃ − )
=



adalah suatu fungsi dari
menggunakan SNA untuk

′̃




=

(− ∑ � ( ̃ + ̃ − ))
=

)= .

, sehingga dugaan koefisien terbaru dengan
diberikan sebagai berikut:
∑�= � ̃
̃

+ �
.
∑= � ̃

9
(ii) Nilai dugaan baru untuk
dapat dilakukan dengan menganggap semua
peubah sebagai konstanta kecuali dan , sehingga kondisi KKT menjadi:


− ∑ �( ̃ +

=

̃ −

)

+�

+�



=

)

+�

+�

{ − ( + )=
Selanjutnya, penduga koefisien dapat diperoleh dengan memisalkan
=[ ],



− ∑ �( ̃ +
=[ �
=

̃ −


+
dan dengan mempertimbangkan dua situasi:
(a) | ̃ + | > . Untuk dengan | + | > maka




= [� ∑ � ( ̃ +
=

̃ −

)

+�



dugaan koefisien terbaru diberikan sebagai
← sign( ̃ + ̃ )
∑�= � ̃
+�
+� − ̃

.
← ̃ +
∑�= � ̃
+� −
maka
(b) | ̃ + |
. Untuk dengan | + |




= [� ∑ � ( ̃ +
=

̃ −

)

+�







]

� ]



� ]



dugaan koefisien terbaru diberikan sebagai
∑�= � ̃
+ ̃ ∑�= � ̃



← .
Algoritma pendugaan nilai koefisien pada regresi kuantil regularisasi
elastic-net dapat dituliskan sebagai berikut:
̃, dan �̃ �‖�
̃‖, untuk = .
(a) Tentukan nilai awal ̃ , �
(b) Tentukan nilai batas, misal � = .
(c) = +
̃, dan �̃ ke(d) Perbarui nilai ̃ , �
̃
̃
(e) Hitung ∆ , ∆�, dan ∆�̃
(f) Jika ∆ ̃
� dan jika ada nilai di mana ∆ ̃
�, dan ∆ ̃
� maka nilai
koefisien
dan selesai diperbarui.
̃
(g) Jika ∆ > � dan jika ada nilai di mana ∆ ̃ > �, dan ∆ ̃ > � maka kembali
ke langkah (c).

10
Validasi Silang
Validasi silang (cross validation - CV) adalah salah satu metode yang dapat
digunakan untuk memperoleh nilai parameter dari metode regularisasi. Geisser
(1975) mendeskripsikan secara umum bahwa CV dilakukan dengan mengambil
rata-rata dari sejumlah penduga yang dihasilkan dari bagian data yang ditahan
(Arlot & Celisse, 2010). Pada CV, data dibagi menjadi dua kelompok, yaitu data
pemodelan dan data validasi. Pengelompokkan data pemodelan dan data validasi
dilakukan secara acak, dan setiap pengamatan memiliki peluang yang sama
menjadi data validasi.
-fold cross-validation adalah bentuk umum dari CV. Pada -fold crossvalidation data dibagi menjadi bagian dengan ukuran sama, umumnya nilai
yang digunakan adalah 5 atau 10 (James et al. 2013). Pemodelan pertama
dilakukan dengan bagian pertama digunakan untuk validasi dan − bagian
selanjutnya digunakan untuk pemodelan. Dari pemodelan tersebut diperoleh
dugaan koefisien model dan galat (MSE) yang dihitung dari data validasi.
Selanjutnya pemodelan kedua dilakukan dengan bagian data kedua untuk validasi
dan

bagian lainnya digunakan untuk pemodelan. Hal yang sama terus
dilakukan hingga − bagian awal dari data digunakan untuk pemodelan dan
bagian terakhir digunakan untuk validasi. Cross validation error (CVE) adalah
rata-rata dari semua nilai MSE yang diperoleh.
Dalam pemilihan parameter regularisasi, CVE adalah :

dengan



� =





=

� adalah galat pada validasi ke- ,
� =

∑�





bagian data ke-



̂
−� �



3 METODE
Data
Penelitian ini menggunakan dua data, yaitu data curah hujan bulanan
Kabupaten Indramayu pada tahun 1981 sampai dengan 2013 sebagai peubah
respon dan data presipitasi GCM dari Climate Model Intercomparison Project
(CIMP5) yang diperoleh dari http://climexp.knmi.nl pada wilayah 1.25o LS –
18.75o LS dan 101.25o BT – 118.75o BT sebagai peubah penjelas. Data curah
hujan bulanan Kabupaten Indramayu diperoleh dari rataan stasiun cuaca pada
Zona Musim (ZOM) 79, yaitu stasiun Krangkeng, Sukadana, Karangkendal, dan
Gegesik. ZOM menurut definisi BMKG adalah daerah yang pola hujan rataratanya memiliki perbedaan yang jelas antara musim hujan dan musim kemarau.
Berdasarkan garis lintang dan garis bujur yang digunakan untuk data GCM,
terdapat 8 × 8 grid data GCM yang digunakan dengan masing-masing grid
berukuran 2.5o × 2.5o, sehingga terdapat 64 peubah penjelas.

11
Prosedur Analisis Data
Langkah-langkah yang dilakukan dalam menganalisis data untuk prediksi
curah hujan ekstrim adalah sebagai berikut:
1.
Eksplorasi data dengan statistik deskriptif dan membuat diagram pencar
data curah hujan maupun data GCM pada masing-masing grid untuk melihat
karakteristik dan pola data, serta menghitung besarnya korelasi antara kedua
data tersebut.
2.
Menentukan pergeseran waktu data GCM terhadap data curah hujan dengan
menggunakan Cross Correlation Function (CCF). Hal tersebut dilakukan
untuk memperoleh data lag GCM yang memiliki korelasi lebih kuat dengan
data curah hujan (Wigena, 2015). CCF dapat dihitung dengan rumus:

=
3.
4.

5.

adalah koragam dari dan pada lag ke- ,
adalah
dengan �
simpangan baku dari , dan adalah simpangan baku dari .
Membagi data menjadi dua bagian, yaitu data pemodelan (tahun 1981-2012)
dan data validasi (tahun 2013).
Melakukan pemodelan SD dengan regresi kuantil pada data pemodelan
menggunakan regularisasi gulud dan elastic-net. Pemodelan dilakukan
menggunakan data baku curah hujan sebagai peubah respon dan data baku
lag GCM sebagai peubah penjelas dengan langkah-langkah sebagai berikut:
a.
Memilih nilai parameter regularisasi (gulud/elastic-net) yang
optimum. Pemilihan parameter tersebut dilakukan
dengan
menggunakan CV untuk setiap nilai � , nilai lambda yang dipilih
adalah yang menghasilkan CVE minimum.
b.
Membuat model regresi kuantil menggunakan lambda optimum yang
terpilih. Terdapat tiga model yang dibuat berdasarkan nilai kuantil atas
yang mewakili nilai ekstrim, yaitu pada kuantil ke-0.75, ke-0.90, dan
ke-0.95.
Membandingkan hasil prediksi pada data validasi dari model yang diperoleh
pada langkah keempat dengan nilai-nilai kuantil aktual data dan mengukur
kebaikan model dengan menghitung korelasi antara nilai aktual dengan nilai
prediksi dan RMSEP validasi menggunakan formula:


6.



=√ ∑

=

−̂

Model terbaik adalah model yang memiliki nilai korelasi terbesar dan nilai
RMSEP validasi terkecil.
Membangun model untuk pendugaan curah hujan satu tahun pada tahun
2012, 2011, dan 2010 untuk melihat konsistensi model.

12

4 HASIL DAN PEMBAHASAN
Eksplorasi Data Curah Hujan
Data curah hujan di Kabupaten Indramayu pada tahun 1981-2013
menunjukan bahwa rata-rata curah hujan bulanan adalah 127,19 mm/bulan dengan
simpangan baku 107,47 mm/bulan. Nilai curah hujan tertinggi terjadi pada Bulan
Januari tahun 2006 yaitu sebesar 498 mm/bulan dan nilai curah hujan terendah
sebesar 0 mm/bulan. Hal tersebut menunjukkan besarnya keragaman curah hujan
yang terdapat di Kabupaten Indramayu, dengan nilai yang sangat ekstrim dari
nilai rata-ratanya.
Pola curah hujan bulanan ditunjukkan oleh Gambar 4. Pada gambar tersebut
terlihat bahwa curah hujan dalam setahun memiliki pola menyerupai huruf U,
sehingga curah hujan yang tinggi terdapat pada awal dan akhir tahun, yang
menunjukkan musim hujan. Musim kemarau ditunjukkan oleh curah hujan yang
rendah dan terjadi pada pertengahan tahun. Curah hujan ekstrim banyak terjadi
pada Bulan Januari dan Desember.

Gambar 4 Pola curah hujan bulanan Kabupaten Indramayu tahun 1981-2013
Tabel 1 menyajikan statistika deskriptif curah hujan bulanan. Bulan Januari
memiliki nilai rataan dan simpangan baku curah hujan tertinggi, yaitu sebesar
263,36 mm/bulan dan 112,92 mm/bulan. Hal tersebut menunjukkan bahwa pada
Bulan Januari sering terjadi curah hujan yang cukup tinggi (ekstrim) dengan
keragaman curah hujan yang tinggi pula, sesuai dengan pola pada Gambar 4.
Curah hujan ekstrim dan keragaman tertinggi kedua terjadi pada Bulan Desember,
yaitu sebesar 225,61 mm/bulan dan 92,16 mm/bulan.
Kriteria bulan basah menurut klasifikasi tipe iklim yang digunakan oleh
BMKG adalah apabila curah hujan pada satu bulan di atas 200 mm dan bulan
kering adalah apabila curah hujan pada satu bulan di bawah 100 mm. Curah hujan
di antara 100 mm sampai 200 mm dikategorikan sebagai bulan lembab. Nilai
rataan curah hujan per bulan pada Tabel 1 menunjukkan bahwa rata-rata
Kabupaten Indramayu mengalami bulan basah pada Bulan Januari, Februari, dan
Desember, bulan lembab pada Bulan Maret, April, Mei, dan November, bulan
kering pada Bulan Juni sampai Oktober.

13
Tabel 1 Statistika deskriptif curah hujan (mm/bulan) Kabupaten Indramayu
tahun 1981-2013
Bulan
Rataan Simpangan Baku Nilai Maksimum Nilai Minimum
Jan
263.36
112.92
498.00
78.25
Feb
219.13
090.60
394.75
59.00
Mar
190.13
060.05
341.25
81.00
Apr
164.18
058.58
313.00
67.00
May
109.36
058.70
301.00
24.00
Jun
078.50
058.64
246.75
14.00
Jul
038.03
039.85
124.25
00.00
Aug
014.50
019.16
056.50
00.00
Sep
017.47
028.14
117.67
00.00
Oct
060.40
057.82
190.50
00.00
Nov
145.65
091.32
372.25
14.67
Dec
225.61
092.16
490.25
78.00

Pergeseran Waktu Data Presipitasi GCM
Pergeseran waktu (time lag) untuk data presipitasi GCM dilakukan untuk
meningkatkan korelasi data tersebut dengan data curah hujan. Jeda (lag) yang
tepat dapat ditentukan dengan menghitung korelasi silang antara data presipitasi
GCM dengan data curah hujan menggunakan Cross Correlation Function (CCF),
yaitu memilih nilai CCF yang tertinggi.
Dari hasil perhitungan CCF diperoleh hasil bahwa beberapa peubah data
presipitasi GCM perlu digeser untuk memperoleh korelasi yang lebih kuat dengan
data curah hujan, namun ada juga yang tidak perlu dilakukan pergeseran.
Pergeseran waktu untuk data presipitasi GCM dan korelasi sebelum dan setelah
pergeseran tersebut diberikan pada Lampiran 1. Secara keseluruhan, terjadi
peningkatan korelasi rata-rata 62,69% pada peubah presipitasi GCM terhadap
curah hujan.
Peubah presipitasi GCM X21, X51, dan X60 memiliki korelasi tertinggi
dengan peubah curah hujan pada time lag ke-1. Sebagai contoh, Gambar 5
menunjukkan pola dari perilaku peubah GCM X21 sebelum digeser dan sesudah
digeser 1 periode. Dari kedua gambar tesebut terlihat bahwa peubah GCM X21
yang telah digeser 1 periode memiliki pola yang sama dengan data aktual curah
hujan pada Gambar 4. Interpretasi dari time lag tersebut berarti perilaku curah
hujan pada bulan sekarang dipengaruhi oleh perilaku presipitasi GCM X21 pada
satu bulan sesudahnya.
Regresi Kuantil
Regresi kuantil dapat digunakan untuk melihat perilaku data pada berbagai
nilai kuantil sebaran data. Oleh karena itu, regresi kuantil dapat digunakan untuk
pemodelan curah hujan ekstrim, yaitu pada kuantil ke-0.75, ke-0.90, dan ke-0.95.
Namun, data GCM memiliki korelasi yang tinggi antar-grid, menyebabkan adanya

14
multikolinieritas pada model. Regularisasi gulud dan elastic-net dapat diterapkan
pada model regresi kuantil untuk mengatasi permasalahan tersebut. Pemodelan
dilakukan menggunakan software R dengan package ‘hqreg’.

Gambar 5 Pola peubah GCM X21 sebelum (kiri) dan setelah (kanan) digeser 1 periode
Gambar 6 menunjukkan plot curah hujan dengan nilai kuantil ke-0.75, ke0.90, dan ke-0.95. Nilai kuantil ke- � menunjukkkan suatu nilai dalam sebaran
data yang membatasi � data bagian bawah dan − � data bagian atas. Oleh
karena itu, biasanya nilai kuantil ke-0.90 lebih tinggi daripada nilai kuantil ke0.75. Begitu pula nilai kuantil ke-0.95 lebih tinggi daripada nilai kuantil ke-0.90
dan ke-0.75. Nilai-nilai kuantil tersebut disajikan pada Lampiran 2.

Gambar 6 Data curah hujan dengan beberapa nilai kuantil.
kuantil ke-0.90,
kuantil ke-0.75

kuantil ke-0.95,

15
Regresi Kuantil Gulud
Pada regresi kuantil gulud diperlukan suatu parameter � untuk penalti
gulud (∑ ) . Parameter gulud � pada persamaan (1) dapat ditentukan
menggunakan CV, yaitu dengan memilih parameter � yang memberikan nilai
CVE minimum. Nilai � optimum yang diperoleh dari CV selanjutnya digunakan
untuk membentuk model regresi kuantil gulud. Tabel 2 menyajikan nilai-nilai �
hasil CV dan RMSEP pemodelan dari model menggunakan nilai � tersebut pada
data pemodelan, yaitu data tahun 1981-2012. Pada kuantil yang semakin tinggi
nilai � semakin kecil, berarti pada kuantil yang semakin tinggi penyusutan yang
terjadi pada nilai koefisien model semakin kecil. Hasil CV pada kuantil-75 secara
lengkap diberikan pada Lampiran 3.
Tabel 2 Nilai parameter gulud optimum hasil CV dan RMSEP pemodelan
Kuantil ke0.75
0.90
0.95

Lambda �
1.12×10-2
0.44×10-2
0.14×10-2

CVE RMSEP pemodelan
18.42
22.88
22.86
13.23
34.28
7.99

Model yang telah terbentuk menggunakan data pemodelan tersebut
selanjutnya digunakan untuk memprediksi data validasi, yaitu data tahun 2013.
Nilai prediksi curah hujan tahun 2013 yang diperoleh dari model regresi kuantil
gulud dengan nilai kuantil ke-0.75, ke-0.90, dan ke-0.95 disajikan pada Tabel 3.
Tabel 3 Nilai prediksi curah hujan per bulan tahun 2013 dari model regresi
kuantil gulud
Bulan
Januari
Februari
Maret
April
Mei
Juni
Juli
Agustus
September
Oktober
November
Desember

Nilai Prediksi pada Kuantil ke-

0.75
322.41
279.40
228.50
192.46
139.89
097.31
053.39
024.96
024.15
076.15
170.06
285.97

0.90
383.59
338.07
287.79
253.44
195.47
148.59
095.62
061.18
063.20
126.49
236.29
357.15

0.95
428.32
369.79
312.12
288.43
229.77
180.98
116.39
073.97
079.30
149.70
280.76
417.41

Regresi Kuantil Elastic-net
Pada regresi kuantil elastic-net terdapat dua penalti yang digunakan, yaitu
penalti lasso (∑| |) dan penalti gulud (∑ ) . Pada persamaan (2), terlihat
bahwa parameter untuk penalti lasso adalah � × sedangkan parameter untuk
penalti gulud adalah � × − , dengan
, .

16
Nilai-nilai dan � yang akan digunakan ditentukan melalui CV. Tahapan
awal CV untuk menentukan parameter elastic-net adalah memilih nilai � optimum
yang menghasilkan CVE terkecil untuk setiap nilai
, . Nilai yang
digunakan pada penelitian ini adalah = . , . , … , .9 . Selanjutnya, nilai
parameter yang digunakan pada model regresi kuantil elastic-net adalah pasangan
nilai dan � yang menghasilkan CVE terkecil. Nilai-nilai pasangan parameter
tersebut terdapat pada Lampiran 4.
Hasil CV yang dilakukan untuk model regresi kuantil elastic-net
menunjukkan bahwa nilai parameter untuk penalti lasso lebih besar daripada nilai
parameter untuk penalti gulud. Nilai dan � optimum yang diperoleh dari CV
pada data pemodelan, nilai parameter lasso � maupun gulud �[ − ] , serta
nilai RMSEP pemodelan pada model yang dibentuk dengan data pemodelan
disajikan pada Tabel 4. Tabel tersebut menunjukkan bahwa parameter untuk lasso
bernilai lebih besar, berarti kontribusi lasso pada model yang terbentuk lebih besar
daripada kontribusi gulud. Nilai RMSEP pemodelan yang diperoleh dari model
regresi kuantil elastic-net juga lebih kecil daripada nilai RMSEP pemodelan dari
model regresi kuantil gulud.
Tabel 4 Nilai parameter elastic-net optimum hasil CV dan RMSEP pemodelan
Parameter Parameter
Kuantil Alpha Lambda
RMSEP
Lasso
Gulud
CVE
pemodelan
ke�

�[ − ]
0.75
0.7
1.35×10-3 22.57 0.94×10-3 0.40×10-3
17.77
-3
-3
-3
0.90
0.9
6.00×10
13.22 5.40×10
0.60×10
21.44
-3
-3
-3
0.95
0.9
2.70×10
7.87 2.43×10
0.27×10
27.44
-3
-3
-4
0.75
0.7
1.35×10
22.57 0.94×10
4.04×10
Model yang telah terbentuk tersebut selanjutnya digunakan untuk prediksi
13.22
pada data validasi tahun 2013. Nilai prediksi curah hujan bulanan pada tahun 2013
7
dari model yang dibangun dengan nilai-nilai parameter hasil CV tersebut dengan
kuantil ke-0.75, ke-0.90, dan ke-0.95 disajikan pada Tabel 5.
Tabel 5 Nilai prediksi curah hujan per bulan tahun 2013 dari model regresi
kuantil elastic-net
Bulan
Januari
Februari
Maret
April
Mei
Juni
Juli
Agustus
September
Oktober
November
Desember

Nilai Prediksi pada Kuantil ke-

0.75
335.74
281.58
213.95
174.22
135.29
106.74
062.81
041.36
037.88
107.33
177.91
302.27

0.90
384.16
335.94
281.75
245.38
187.08
155.04
097.18
056.71
063.07
134.20
254.05
368.65

0.95
426.22
366.40
299.64
276.18
219.48
183.09
110.55
66.02
74.90
149.27
286.74
432.29

17
Pemilihan Model Terbaik
Dari model regresi kuantil gulud dan kuantil elastic-net yang diperoleh
sebelumnya dapat ditentukan model mana yang lebih baik dalam melakukan
prediksi untuk curah hujan ekstrim. Kebaikan model dapat diukur dengan
menghitung RMSEP validasi dan korelasi antara nilai dugaan curah hujan dan
nilai kuantil aktual data curah hujan per bulan dari data validasi. Perbandingan
RMSEP validasi dari kedua model disajikan pada Gambar 7. Gambar tersebut
menunjukkan bahwa nilai RMSEP validasi yang dihasilkan oleh model regresi
kuantil elastic-net lebih rendah dari pada nilai RMSEP validasi yang dihasilkan
oleh model regresi kuantil gulud pada kuantil ke-0.75 dan kuantil ke-0.90, namun
pada kuantil ke-0.95 nilai RMSEP validasi pada model regresi kuantil elastic-net
sedikit lebih tinggi daripada nilai RMSEP validasi pada model regresi kuantil
gulud meskipun tidak nyata. Hal tersebut berbanding lurus dengan nilai RMSEP
pemodelan yang diperoleh dari model pada subbab sebelumnya, yaitu model
regresi kuantil elastic-net memberikan nilai sisaan yang lebih kecil daripada
model regresi kuantil gulud.

Gambar 7 Nilai RMSEP validasi model pada kuantil ke-0.75, ke-0.90, dan ke0.95. ∎ model regresi kuantil gulud, ∎ model regresi kuantil elastic-net

Perbandingan korelasi dari kedua model terdapat pada Gambar 8. Gambar
tersebut menunjukkan bahwa korelasi antara nilai aktual dengan nilai prediksi
yang dihasilkan oleh kedua model sangat tinggi, yaitu berada pada kisaran 0.99.
Namun, model regresi kuantil elastic-net memberikan korelasi antara nilai aktual
dengan nilai prediksi yang lebih tinggi daripada korelasi antara nilai aktual dengan
nilai prediksi yang dihasilkan oleh model regresi kuantil gulud pada kuantil ke-

Gambar 8 Nilai korelasi model pada kuantil ke-0.75, ke-0.90, dan ke-0.95. ∎
model regresi kuantil gulud, ∎ model regresi kuantil elastic-net

18
0.75 dan ke-0.90, namun pada kuantil ke-0.95 model regresi kuantil elastic-net
menghasilkan nilai korelasi yang sedikit lebih rendah meskipun tidak nyata. Hasil
yang diperoleh pada Gambar 7 dan Gambar 8 tersebut menunjukkan bahwa model
regresi kuantil elastic-net menghasilkan nilai prediksi yang lebih baik daripada
model regresi kuantil gulud.
Gambar 9 dan Gambar 10 memperlihatkan bahwa regresi kuantil elastic-net
maupun regresi kuantil gulud dapat menduga nilai kuantil dari data aktual dengan
sangat baik. Kedua model memberikan n