Regresi Kuantil Lasso Dan Gulud Dengan Validasi Silang Untuk Prediksi Curah Hujan Ekstrim

REGRESI KUANTIL LASSO DAN GULUD DENGAN VALIDASI
SILANG UNTUK PREDIKSI CURAH HUJAN EKSTRIM

HILDA ZAIKARINA

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul Regresi Kuantil Lasso
dan Gulud dengan Validasi Silang untuk Prediksi Curah Hujan Ekstrim adalah
benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan
dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang
berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari
penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di
bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.

Bogor, Agustus 2016
Hilda Zaikarina
NIM G151140031

*

Pelimpahan hak cipta karya tulis dari penelitian kerjasama dengan pihak luar IPB
harus didasarkan pada perjanjian kerjasama yang terkait

RINGKASAN
HILDA ZAIKARINA. Regresi Kuantil Lasso dan Gulud dengan Validasi Silang
untuk Prediksi Curah Hujan Ekstrim. Dibimbing oleh ANIK DJURAIDAH dan
AJI HAMIM WIGENA.
Indonesia merupakan negara agraris yang memiliki potensi di sektor
pertanian. Salah satu wilayah penghasil padi di Indonesia adalah Kabupaten
Indramayu yang memiliki areal persawahan 56.11% dari luas wilayah
keseluruhan. Salah satu unsur iklim yang mempengaruhi produktivitas pertanian
adalah curah hujan. Kondisi curah hujan yang tinggi, disebut juga curah hujan
ekstrim berada jauh dari curah hujan lainnya, dapat menyebabkan kerugian bagi
berbagai pihak.

Regresi kuantil merupakan salah satu metode analisis untuk menduga curah
hujan ekstrim. Peubah prediktor yang digunakan pada regresi kuantil adalah data
luaran presipitasi GCM. Data luaran GCM memiliki multikolinieritas yang dapat
mengakibatkan solusi pendugaan parameter regresi menjadi tidak unik. Solusi
yang unik dapat diperoleh dengan menambahkan regularisasi lasso dan gulud
pada regresi kuantil.
Penambahan regularisasi menyebabkan dibutuhkan koefisien lasso dan
koefisien gulud yang diperoleh dari proses validasi silang (VS). Validasi silang
memilih dugaan koefisien lasso dan gulud berdasarkan nilai galat validasi silang
(GVS) yang minimum, namun proses VS dinilai tidak stabil dalam memilih
koefisien yang optimum. Ketidakstabilan proses VS terlihat pada pemilihan nilai
koefisien yang berbeda pada setiap ulangan yang berbeda. Ketidakstabilan proses
VS diatasi dengan metode persentil. Metode persentil adalah proses VS yang
diulang lebih dari satu kali dan memilih koefisien berdasarkan posisi persentil
yang ditentukan.
Pada penelitian ini dilakukan modifikasi metode persentil untuk
menentukan kritertia terbaik koefisien lasso dan gulud untuk prediksi curah hujan
ekstrim. Modifikasi yang dilakukan adalah memilih koefisien lasso dan gulud
yang memiliki GVS minimum. Nilai koefisien yang terpilih akan dibangun model
statistical downscaling menggunakan regresi kuantil dengan penambahan

regularisasi lasso dan gulud untuk menduga curah hujan ekstrim. Kedua model
regresi kuantil tersebut akan dipilih model terbaik dalam memprediksi curah hujan
berdasarkan nilai RMSEPvalidasi terkecil dan korelasi tertinggi. Posisi kuantil yang
dipilih adalah Q(0.75), Q(0.90), dan Q(0.95).
Data yang digunakan adalah data curah hujan sebagai peubah respon dan
data luaran presipitasi GCM sebagai peubah prediktor. Data curah hujan pada
tahun 1981-2013 diambil dari rataan empat stasiun yaitu Stasiun Krangkeng,
Sukadana, Karangkendal, dan Gegesik. Keempat stasiun tersebut berada pada satu
zona musim (ZOM) yang sama yaitu ZOM 79. Data luaran GCM yang digunakan
adalah data curah hujan bulanan data Climate Model Intercomparison Project
(CMIP5). Jumlah grid yang digunakan adalah 8 8 grid, sehingga terdapat 64
peubah prediktor.
Berdasarkan hasil yang diperoleh, kriteria terbaik koefisien lasso adalah
pada P
. Hal ini ditunjukkan dengan nilai RMSEP validasi yang konsisten
lebih kecil pada setiap kuantil jika dibandingkan dengan pemilihan koefisien

berdasarkan GVS minimum. Berbeda dengan regulasasi gulud, pada Q(0.75) dan
Q(0.90) lebih baik memilih koefisien gulud berdasarkan GVS minimum,
sedangkan pada Q(0.95) lebih baik memilih koefisien gulud yang berada pada

P
.
Koefisien terpilih tersebut lalu digunakan untuk membangun model regresi
kuantil. Regresi kuantil regularisasi lasso dan gulud dapat menggambarkan
kondisi curah hujan ekstrim di Kabupaten Indramayu dengan baik karena nilai
RMSEPvalidasi yang kecil dan korelasi yang tinggi. Pada regresi kuantil regularisasi
lasso untuk prediksi curah hujan tahun 2013 diperoleh RMSEPvalidasi sebesar
13.57, 15.78, dan 16.74 untuk masing-masing Q(0.75), Q(0.90), dan Q(0.95).
Nilai RMSEPvalidasi pada regresi kuantil gulud yang diperoleh adalah 15.94, 15.85,
dan 18.00 pada masing-masing Q(0.75), Q(0.90), dan Q(0.95). Pada regularisasi
lasso dan gulud, nilai korelasi antara prediksi dengan data aktual kuantil yang
diperoleh adalah 0.99, yang berarti prediksi curah hujan sudah mampu
memprediksi curah hujan aktual. Berdasarkan RMSEPvalidasi terkecil, regresi
kuantil lasso lebih baik dalam memprediksi curah hujan ekstrim dibandingkan
regresi kuantil gulud. Regresi kuantil lasso dan gulud dapat memprediksi dengan
tepat curah hujan ekstrim di bulan Januari yang berada pada Q(0.75) dan curah
hujan ekstrim bulan Desember yang berada pada Q(0.90). Oleh karena itu, regresi
kuantil dengan regularisasi lasso terbaik dalam prediksi curah hujan ekstrim di
Kabupaten Indramayu.
Kata kunci: regresi kuantil, regularisasi lasso, regularisasi gulud, validasi silang,

persentil

SUMMARY
HILDA ZAIKARINA. Lasso and Ridge Quantile Regression using Cross
Validation to Estimate Extreme Rainfall. Supervised by ANIK DJURAIDAH and
AJI HAMIM WIGENA.
Indonesia in an agricultural country with potential in agricultural sector.
One of the rice producing region is Indramayu that has 56.11% rice cutivation of
total area. One of climate elements that affecting agricultural productivity is
rainfall. High rainfall conditions, also known as extreme rainfall, caused negative
effect.
Quantile regression is one method to estimate extreme rainfall. A model in
quantile regression relates functionally the precipitation of GCM output as
predictor variables with rainfall data as response variable. High dimension of
precipitation of GCM output leads to multicollinearity that makes the solution of
regression becomes not unique. The solution to handle that problem is to select
variables and to shrinkage coefficient using lasso and ridge.
A method commonly used is cross validation (CV) to determined lasso
and ridge coefficients. It was found that the process of CV is not stable in
choosing lasso and ridge coefficients when the processes are repeated. Some

variation is expected because the grouping of data in CV is random. Percentile
method was proposed to deal with instability CV and found that from a hundred
replicates the best lasso cefficient to build linear model is over than P(0.75).
In this research, there is modification of percentile method to determined
the best criteria of lasso and ridge coefficients. Modification carried out on
choosing lasso and ridge coefficients not only in over than P(0.75) but also in
minimum of cross validation error (CVE). Those coefficients used in quantile
regression model to predict extrem rainfall. Between the lasso and quantile
regression models will choosed the best model to predict extrem rainfall based on
the smallest root mean square error prediction (RMSEPtesting) and the highest
correlation. The main focus is on the extreme values at Q(0.75), Q(0.90), and
Q(0.95).
Data used in this research are local monthly rainfall and precipitation of
GCM data. Local monthly data in 1981-2013 at Indramayu, Indonesia, is the
average of four weather stations Krangkeng, Sukadana, Karangkendal, and
Gegesik. All of stations in the same zone of season, ZOM 79. Precipitation of
GCM data are consists of monthly rainfall data Climate Model Intercomparison
Project (CMIP5). The observed area is a square shaped area of 8 8 grid, which
resulting in 64 predictor variables.
Results shows the best criteria of lasso coefficients are in over than

P(0.75). It is indicated by the value of RMSEPtesting in each quantile are smaller
than CVE minimum. While in ridge coefficients are better to choose them in CVE
minimum for Q(0.75) and Q(0.90), but in Q(0.95) is better to chosse in over than
P(0.75). The value of RMSEPtesting of lasso regualrization are 13.57, 15.78, and
16.74 at Q(0.75), Q(0.90), and Q(0.95) respectively, while those of ridge
regularization are 15.94, 15.85, and 18.00 at the same quantile. Both lasso and
ridge regularization has high correlation. The correlation between prediction and
actual quantile data are 0.99, it shows the prediction of lasso and ridge quantile

regression models can capture the actual quantile data. Based on the smallest
RMSEPtesting, lasso quantile regression was better than that with ridge
regularization to estimate extreme rainfall in Indramayu. Quantile regression with
lasso and rigde regularization can capture extreme rainfall in 2013, such as
extreme rainfall in January and December at Q(0.75) and Q(0.90).
Keywords: quantile regression, lasso regularization, ridge regularization, cross
validation, percentile

© Hak Cipta Milik IPB, Tahun 2016
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan

atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan
IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apa pun tanpa izin IPB

REGRESI KUANTIL LASSO DAN GULUD DENGAN VALIDASI
SILANG UNTUK PREDIKSI CURAH HUJAN EKSTRIM

HILDA ZAIKARINA

Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains
pada
Program Studi Statistika

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR

BOGOR
2016

Penguji Luar Komisi pada Ujian Tesis: Dr Bagus Sartono, MSi

Judul Tesis : Regresi Kuantil Lasso dan Gulud dengan Validasi Silang untuk
Prediksi Curah Hujan Ekstrim
Nama
: Hilda Zaikarina
NIM
: G151140031

Disetujui oleh
Komisi Pembimbing

Dr Ir Anik Djuraidah, MS
Ketua

Dr Ir Aji Hamim Wigena, MSc
Anggota


Diketahui oleh

Ketua Program Studi
Statistika

Dekan Sekolah Pascasarjana

Dr Ir Kusman Sadik, MS

Dr Ir Dahrul Syah, MScAgr

Tanggal Ujian: 25 Juli 2016

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang
dipilih dalam penelitian yang dilaksanakan sejak bulan Januari 2016 ini ialah

statistical downscaling, dengan judul Pemodelan Statitistical Downscaling
menggunakan Regresi Kuantil Lasso dan Gulud dengan Validasi Silang untuk
Prediksi Curah Hujan Ekstrim.
Terima kasih penulis ucapkan kepada Ibu Dr Ir Anik Djuraidah, MS dan
Bapak Dr Ir Aji Hamim Wigena, MSc selaku pembimbing, serta Bapak Dr Bagus
Sartono MSi selaku penguji luar komisi yang telah banyak memberi saran. Penulis
pun mengucapkan terima kasih pada Direktorat Jenderal Pendidikan Tinggi
(DIKTI) atas beasiswa Fresh Graduate yang diberikan, seluruh dosen dan staf
Departemen Statistika IPB atas ilmu, bimbingan, dan bantuannya. Terima kasih
penulis sampaikan pada Global Journal of Pure and Applied Mathematics
(GJPAM) atas diterimanya tesis ini dalam bentuk jurnal. Penghargaan setinggitinggi nya penulis sampaikan kepada Bapak, Ibu, Suami, Ade, serta seluruh
keluarga, atas segala pengorbanan, doa, dan kasih sayangnya kepada penulis.
Semoga karya ilmiah ini bermanfaat.

Bogor, Agustus 2016
Hilda Zaikarina

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN

vi

1

PENDAHULUAN
Latar Belakang
Tujuan Penelitian

1
1
2

2

TINJAUAN PUSTAKA

3

Statistical Downscaling (SD)

3

Regresi Kuantil

4

Persentil Lasso (L1) dan Gulud (L2)

6

METODE

8

Data

8

Prosedur Analisis Data

8

3

4

5

HASIL DAN PEMBAHASAN

10

Eksplorasi

10

Pemodelan Regresi Kuantil Regularisasi Lasso dan Gulud

11

Prediksi Curah Hujan Ekstrim

12

Prediksi Curah Hujan Ekstrim Tahun 2013

14

SIMPULAN DAN SARAN
Simpulan
Saran

17
17
17

DAFTAR PUSTAKA

18

LAMPIRAN

16

RIWAYAT HIDUP

23

DAFTAR TABEL
1 Deskripsi Curah Hujan Bulanan Tahun 1981-2013
2 Rangkuman Model M4 Prediksi Tahun 2013

10
14

DAFTAR GAMBAR
Ilustrasi downscaling.
RMSEPpemodelan Model Regresi Kuantil Lasso dan Gulud
RMSEPvalidasi dan Korelasi Model Regresi Kuantil Lasso dan Gulud
Plot Data Kuantil Curah Hujan Aktual dengan Prediksi Curah Hujan
Regresi Kuantil Regularisasi Lasso Tahun 2013
5 Plot Data Kuantil Curah Hujan Aktual dengan Prediksi Curah Hujan
Regresi Kuantil Regularisasi Gulud Tahun 2013
6 Plot Data Aktual Curah Hujan Tahun 2013 dengan Prediksi Curah
Hujan (a) Regresi Kuantil Regularisasi Lasso dan (b) Regresi Kuantil
Regularisai Gulud
1
2
3
4

3
12
12
15
15

16

DAFTAR LAMPIRAN
1 Alur Proses Validasi Silang (VS)
2 Perbandingan Pola Curah Hujan dengan Peubah Presipitasi GCM
sebelum dan sesudah digeser (lag)
3 Nilai Korelasi antara Curah Hujan dengan Peubah Presipitasi GCM
sebelum dan sesudah digeser (lag)
4 Rangkuman Regresi Kuantil Regularisasi Lasso dan Gulud
Berdasarkan Koefisien yang memiliki GVS minimum
5 Hasil RMSEP(Persentil) Setiap Prediksi Tahun

21
22
23
24
25

1 PENDAHULUAN
Latar Belakang
Indonesia sebagai negara agraris memiliki potensi di sektor pertanian.
Salah satu hasil pertanian yang menjadi sumber makanan pokok di Indonesia
adalah padi. Kabupaten Indramayu adalah salah satu produsen padi terbesar di
Jawa Barat. Sebesar 57.94% atau sekitar 118211 ha wilayahnya adalah areal
persawahan (BPS 2015). Hal ini menyebabkan Kabupaten Indramayu dikenal
sebagai lumbung padi.
Produktivitas padi tergantung dari salah satu unsur iklim yaitu curah hujan.
Setiap tahun di musim penghujan terjadi banjir di Kabupaten Indramayu dengan
penyebab utama adalah faktor alam dan ulah manusia (BPS 2015). Pada awal
bulan Januari 2013, ratusan areal sawah Kabupaten Indramayu terendam banjir
(Shantika 2013). Banjir yang terjadi mengakibatkan produktivitas padi menjadi
menurun. Banjir terjadi ketika curah hujan tinggi atau disebut juga sebagai curah
hujan ekstrim yang memiliki nilai jauh dari curah hujan lainnya. Dampak negatif
curah hujan ekstrim menyebabkan kajian pendugaan curah hujan ekstrim menjadi
penting.
Data luaran Global Circulation Model (GCM) berupa presipitasi dapat
digunakan sebagai alat prediksi iklim dan cuaca secara numerik serta sebagai
sumber informasi primer untuk menilai perubahan iklim (Wigena 2006).
Informasi GCM masih berskala global, sehingga diperlukan suatu teknik untuk
menduga curah hujan skala lokal dengan tingkat akurasi yang tinggi yaitu teknik
statistical downscaling (SD). Beberapa penelitian sebelumnya tentang pemodelan
SD untuk prediksi curah hujan di Kabupaten Indramayu telah dilakukan. Wigena
(2006) menggunakan regresi projecction pursuit, Djuraidah dan Wigena (2011)
menggunakan regresi kuantil, Handayani (2014) menggunakan model aditif
terampat, Kinanti (2015) menggunakan model linier dengan sebaran pareto
terampat, dan Soleh (2015) menggunakan model linier sebaran pareto teramapat
dan sebaran gamma untuk memprediksi curah hujan.
Curah hujan memiliki fungsi sebaran tidak simetrik dan nilai ekstrim curah
hujan berada pada bagian ekor fungsi sebaran. Regresi kuantil dinilai cocok untuk
menduga curah hujan ekstrim karena analisis ini sangat berguna pada sebaran
yang tidak simetrik, padat di ekor sebarannya, atau sebarannya terpotong
(Djuraidah dan Wigena 2011). Regresi kuantil dapat memberikan kesimpulan
yang sama memuaskan pada kondisi regresi konvensional yang seluruh asumsinya
terpenuhi (Tareghian dan Rasmussen 2013). Peubah prediktor yang digunakan
pada model regresi kuantil adalah data presipitasi GCM. Data presipitasi GCM
memiliki dimensi yang tinggi, hal ini menyebabkan adanya multikolinieritas
(Wigena 2006). Solusi untuk mengatasi multikolinieritas adalah dengan
pereduksian dimensi, seleksi peubah dan penyusutan koefisien (Soleh 2015).
Mondiana (2012) mengatasi multikolinieritas pada regresi kuantil menggunakan
analisis komponen utama. Sari (2015) menggunakan komponen utama fungsional
dan Santri (2016) menambahkan regularisasi lasso pada model regresi kuantil.
Selain regularisasi lasso, multikolinieritas pada peubah penjelas dapat diatasi
dengan regularisasi gulud.

2
Pemilihan dugaan koefisien lasso dan gulud pada model regresi kuantil
dilakukan dengan metode validasi silang (VS). Proses VS memiliki
ketidakstabilan dalam memilih koefisien. Hasil koefisien lasso dan gulud dari
proses validasi silang pada setiap ulangan tidak unik. Untuk mengatasi hal ini,
Roberts dan Nowak (2013) mengembangkan suatu metode yang disebut metode
persentil. Penelitian Roberts dan Nowak (2013) diaplikasikan pada regresi linier
regularisasi lasso. Pada penelitian ini, metode persentil diterapkan pada regresi
kuantil regularisasi lasso dan regularisasi gulud.
Tujuan Penelitian
Tujuan penulisan penelitian ini adalah sebagai berikut:
1. Menentukan kriteria terbaik koefisien lasso dan gulud pada regresi kuantil.
2. Memodelkan regresi kuantil dengan regularisasi lasso dan gulud
menggunakan koefisien terbaik.
3. Menentukan model terbaik untuk pendugaan curah hujan ekstrim di
Kabupaten Indramayu.

3

2 TINJAUAN PUSTAKA
Statistical Downscaling (SD)
GCM merupakan suatu model berorientasi spasial dan temporal yang
menjadi alat prediksi utama iklim dan cuaca secara numerik serta sebagai sumber
informasi primer untuk menilai pengaruh perubahan iklim (Wigena 2006, Wigena
2011). GCM menghasilkan data dalam bentuk grid atau petak wilayah dengan
resolusi rendah (2.5o 2.5o atau ± 300 km 300 km).
Sutikno (2008) mengungkapkan GCM memiliki potensi dalam hal
mensimulasikan iklim masa lampau dan sekarang, namun terdapat
ketidaksesuaian skala antara GCM yang beresolusi rendah dengan skala ruang
untuk kajian dampak regional. Pada daerah topografi kompleks, sepanjang garis
pantai dan daerah-daerah dengan tutupan lahan yang heterogen, model GCM
hasilnya dinilai kurang sensitif.
Berbagai teknik downscaling dikembangkan untuk meningkatkan
informasi regional yang dihasilkan GCM serta menyediakan informasi iklim
resolusi tinggi. Teknik tersebut adalah GCM, dynamic downscaling, dan
statistical downscaling (SD). Teknik SD merupakan pendekatan yang relatif
sederhana dan murah dalam komputasinya. Model SD menggambarkan hubungan
data berskala besar (global) sebagai peubah prediktor dengan data berskala kecil
(lokal) sebagai peubah respon (Mejia et al. 2010). Hubungan ini terlihat pada
ilustrasi Gambar 1.
Menurut Busuioc et al. (2010), model SD dapat memberikan hasil yang
baik jika memiliki: 1) hubungan yang erat antara peubah respon dengan peubah
prediktor, sehingga keragaman iklim lokal dapat dijelaskan dengan baik, 2)
peubah prediktor disimulasi baik oleh GCM, dan 3) hubungan antara respon
dengan perubahan waktu dan tetap sama meskipun ada perubahan iklim. Berikut
adalah model umum SD:

dengan y peubah skala lokal respon (data curah hujan) berukuran
, adalah
peubah prediktor (data presipitasi GCM) berukuran
, adalah banyaknya
waktu (bulan), dan adalah banyak grid skala global GCM.

Gambar 1 Ilustrasi downscaling.
(http:/epscorspo.nevada.edu/nsf/climate1/climate10.html)

4
Regresi Kuantil
Regresi kuantil diperkenalkan oleh Koenker dan Bassett tahun 1978 yang
merupakan perluasan dari fungsi kuantil (Buhai 2005). Peubah acak respon (Y)
memiliki fungsi sebaran
, untuk setiap
, kuantil kepeubah Y didefinisikan
yang merupakan
kuantil ke- dari peubah Y.
Regresi kuantil (Koenker dan Basset 1978; Koenker dan Hallock 2001)
pada dasarnya adalah model regresi liner dengan kuantil dari sebaran peubah
respon. Berbeda pada model regresi linier konvensional, regresi kuantil tidak
memerlukan asumsi kehomogenan ragam sisaan atau asumsi lainnya terkait
dengan sisaan. Regresi kuantil dapat memberikan hasil yang memuaskan seperti
regresi linier konvensional pada kondisi seluruh asumsi sisaan terpenuhi
(Tareghian dan Rasmussen 2013).
Fungsi regresi kuantil linier adalah sebagai berikut:
|

dengan

adalah
vektor
peubah
penjelas,
adalah matriks parameter dari regresi kuantil ke- dan
adalah banyaknya peubah prediktor. Penduga parameter
, pada observasi
dengan
diperoleh dari persamaan berikut:
̂

dengan



didefinisikan sebagai berikut:

atau penduga
[∑

{

regresi kuantil ke- merupakan solusi dari minimisasi fungsi:
| �



|

|



| �

|

|]

Perbedaan mendasar yang dapat terlihat adalah pemberian bobot. Observasi
dengan sisaan kurang dari nol diberikan bobot
sedangkan sisanya
diberikan bobot sebesar .
Solusi ̂ pada regresi linier kuadrat terkecil menjadi unik ketika peubah
prediktor � �
� tidak mengandung multikolinieritas. Jika peubah prediktor
memiliki multikolinieritas maka solusi ̂ menjadi banyak atau tidak unik,
sehingga interpretasi dari solusi menjadi kurang bermakna. Ketika peubah-peubah
prediktor memiliki korelasi yang tinggi, satu peubah dengan nilai koefisien yang
tinggi dapat mengurangi nilai koefisien tinggi di peubah lainnya, dengan kata lain
adanya korelasi negatif dengan peubah sebelumnya. Perlu ditambahkan
regularisasi untuk mengurangi konsekuensi dari multikolinieritas. Regularisasi
menambahkan suatu ambang batas atas nilai untuk koefisien peubah prediktor,
sehingga diperoleh solusi yang sedikit dan koefisien-koefisien peubah prediktor
memiliki ragam yang lebih kecil. Regresi gulud dan lasso merupakan dua bentuk
regularisasi regresi.

5

Regularisasi Lasso (L1)
Lasso atau least absolute shrinkage and selection operator diperkenalkan
oleh Tibshirani (1996). Prinsip kerja lasso adalah meminimumkan jumlah mutlak
koefisien kurang dari suatu konstanta, dengan konstanta tersebut lebih dari sama
dengan nol. Batasan ini yang menyebabkan lasso cenderung untuk menghasilkan
koefisien mendekati atau sama dengan nol. Koefisien yang bernilai nol
menunjukkan bahwa lasso melakukan seleksi peubah, sehingga efek dari peubah
prediktor yang terkuat yang dapat diperoleh dan dapat mengurangi keragaman
dari nilai prediksi (Tibshirani 1996).
adalah pasang data untuk pemodelan dengan
Misal
) adalah peubah prediktor,
(
adalah peubah respon, dan
) diperoleh
, dugaan koefisien regresi kuantil regularisasi lasso ( ̂
dari solusi:


(

)

dengan batasan ∑ | | � , �
adalah parameter lasso. Solusi ̂
juga dituliskan dalam persamaan Lagrange sebagai berikut:


)

(

� ∑|

dapat

|

Solusi koefisien regresi kuantil regularisasi lasso tidak dapat diperoleh
dalam bentuk tertutup, tetapi harus dalam bentuk kuadratik (Tibshirani 1996).
, maka ̂
Koefisien lasso � mengontrol kekuatan dari penalty. Jika �
sama dengan dugaan parameter regresi kuantil tanpa regularisasi. Jika �
,
maka ̂
sama dengan nol. Regularisasi lasso dapat melakukan penyusutan
̂
hingga tepat sama dengan nol (Tibshirani 2013).
Regularisasi Gulud (L2)

Regresi gulud pertama kali diperkenalkan oleh Hoerl dan Kennard pada
tahun 1970. Prinsip dari gulud adalah meminimukan suatu batasan yaitu jumlah
kuadrat koefisen kurang dari suatu konstanta. Berbeda dengan lasso, gulud tidak
melakukan seleksi peubah karena penyusutan koefisien akibat penambahan
penalti gulud tidak akan sama dengan nol. Penambahan regularisasi gulud pada
regresi kuantil mengakibatkan solusi dugaan koefisien regresi kuantil regularisasi
) diperoleh dari meminimumkan fungsi:
gulud ( ̂

̂



dengan batasan ∑

)

(

� , �

adalah koefisien gulud. Solusi

dapat juga dituliskan dalam persamaan Lagrange sebagai berikut:


(

)

� ∑

6
Penduga koefisien regresi yang diperoleh menggunakan regresi gulud
tidak equivariant, artinya penduga koefisien tersebut akan berbeda hasilnya jika
peubah asal dibakukan dengan peubah asal tidak dibakukan. Pendugaan
disarankan sebelumnya membakukan skala peubah prediktor sehingga memiliki
nilai harapan nol dan ragam satu.
Persentil Lasso (L1) dan Gulud (L2)
Validasi silang (VS) merupakan metode yang umum digunakan pada
penambahan regularisasi di regresi kuantil untuk mendapatkan nilai koefisien
regularisasi. Larson pada tahun 1931 pertama kali memperkenalkan VS. Ide awal
ini dikembangkan karena adanya keterbatasan jumlah data yang dapat digunakan
pada suatu analisis, sehingga satu set data yang sama dibagi menjadi data
pemodelan dan sisanya data validasi (Arlot dan Celisse 2010). Proses VS dapat
dilihat pada Lampiran 1.
Prosedur VS yang paling klasik adalah leave-one-out (LOO). Pada
prosedur LOO, seluruh observasi dikurangi satu
digunakan sebagai data
pemodelan dan satu observasi sebagai data validasi. Proses LOO membutuhkan
waktu relatif lama pada
(Lund 2013). Pada LOO menghasilkan galat
tinggi karena pengepasan model pada set data pemodelan ukurannya dekat dengan
data set lengkap.
Alternatif dari LOO yang biasa digunakan adalah -folds, yaitu membagi
data ke dalam K bagian dengan setiap bagian terdiri dari
. Pada prosedur
-folds, observasi sebanyak
digunakan sebagai data pemodelan dan
sebanyak
observasi sebagai data validasi. Hanya sebanyak
iterasi yang
dibutuhkan untuk menghitung galat validasi silang (GVS), sehingga waktu yang
diperlukan untuk mendapatkan koefisien regularisasi menjadi lebih sedikit dan
ragam dugaan galat menjadi lebih kecil.
Kelemahan dari VS pada regularisasi lasso adalah pemilihan koefisien
lasso tergantung dari ukuran yang ditentukan (Roberts dan Nowak, 2013). Nilai
yang berbeda dapat menghasilkan nilai lambda optimum yang berbeda juga. Hal
ini menunjukkan terdapat ketidakstabilan pada VS. Hasil VS yang tidak unik
diduga karena proses pengelompokan observasi ke dalam setiap grup dilakukan
secara acak (Lund, 2013). Ketidakstabilan VS diatasi dengan suatu metode yang
disebut metode persentil (Roberts dan Nowak, 2013). Metode ini diterapkan pada
generalized linier model dengan regularisasi lasso, sehingga disebut persentil
lasso. Pada penelitian ini, metode persentil akan diterapkan pada analisis regresi
kuantil regularisasi lasso dan gulud. Berikut adalah algoritma dari metode
persentil pada regresi kuantil:
1. Untuk
sampai dengan
a) Secara acak masukkan data observasi berukuan ke dalam -grup untuk
proses VS.
b) Pengepasan model regresi kuantil dengan regularisasi lasso atau gulud.
c) Diperoleh �̂ sebagai koefisien optimum dengan nilai GVS minimum.
2. Lakukan langkah 1 sebanyak M kali. Sehingga diperoleh koefisien lasso atau
(�̂ �̂
gulud sebanyak M,
�̂ ) dengan masing-masing �̂
memiliki nilai GVS.

7
3. Tentukan , yaitu persentil dari
. Nilai �̂ terpilih merupakan �̂
dengan adalah persentil dari
.
4. Koefisien lasso atau gulud optimum metode persentil adalah �̂ .
Berdasarkan simulasi yang dilakukan Roberts dan Nowak (2013)
pemilihan persentil
yang terbaik adalah
. Pada persentil tersebut
koefisien lasso yang terpilih memberikan kestabilan dengan mengurangi peubah
pengganggu pada model.

8

3 METODE
Data
Data yang digunakan adalah data curah hujan lokal bulanan pada tahun
1981-2013 sebagai peubah respon. Data curah hujan diambil dari stasiun yang
berada di satu zona musim yang sama (ZOM 79). ZOM 79 berada di Kabuparen
Indramayu Timur Bagian selatan Propinsi Jawa Barat. Data curah hujan yang
digunakan berasal dari Stasiun Krangkeng, Sukadana, Karangkendal, dan Gegesik,
Kabupaten Indramayu.
Data global, sebagai peubah prediktor, yang digunakan adalah data curah
hujan bulanan Climate Model Intercomparison Project (CMIP5) yang dikeluarkan
oleh KNMI, Belanda dari situs web http://www.climatexp.knmi.nl/ pada tahun
1981-2013 dengan posisi wilayah 18.75 o – 1.25oLS dan 101.25o – 116.25oBT.
Luasan daerah berbentuk persegi berukuran 8 x 8 grid, sehingga terdapat 64
peubah prediktor.
Prosedur Analisis Data
1.
2.

3.

4.

5.

Berikut ini adalah langkah-langkah analisis data:
Deskripsi data curah hujan sebagai informasi awal keragaman data amatan.
Membandingkan plot curah hujan dengan setiap peubah prediktor dan
menghitung korelasi antara keduanya. Jika plot peubah prediktor belum
mengikuti pola curah hujan dan korelasi keduanya kecil, maka peubah
prediktor akan di geser (lag) menggunakan cross correlation function (CCF).
Membagi data menjadi dua, yaitu data pemodelan dan data validasi. Model
yang dibuat sebanyak empat untuk melihat konsistensi model. Berikut adalah
model yang dibentuk:
1) Model 1 (M1) : data pemodelan tahun 1981-2009 dan data validasi tahun
2010.
2) Model 2 (M2) : data pemodelan tahun 1981-2010 dan data validasi tahun
2011.
3) Model 3 (M3) : data pemodelan tahun 1981-2011 dan data validasi tahun
2012.
4) Model 4 (M4) : data pemodelan tahun 1981-2012 dan data validasi tahun
2013.
Menyiapkan data kuantil curah hujan aktual, yaitu data curah hujan pada
setiap model yang dikelompokkan berdasarkan bulan dari Januari sampai
dengan Desember lalu dipilih Q(0.75), Q(0.90) dan Q(0.95) pada setiap bulan.
Data kuantil keempat model dibangun berdasarkan tahun yang sama seperti
data pemodelan pada langkah (3). Data kuantil curah hujan aktual digunakan
untuk menentukan root mean square error of prediction (RMSEP), baik
RMSEPpemodelan maupun RMSEPvalidasi.
Melakukan analisis SD pada setiap model menggunakan metode regresi
kuantil regularisasi lasso (L1) dan gulud (L2), dengan langkah-langkah berikut:
1) Memilih dugaan koefisien lasso dan gulud optimum, pada masing-masing
Q(0.75), Q(0.90) dan Q(0.95) melalui proses VS yang diulang sebanyak
100 kali. Koefisien optimum yang dipilih adalah koefisien dengan nilai

9
GVS minimum. Pada poin ke-3 algoritma Roberts dan Nowak (2013),
setiap �̂ pada
memiliki GVS masing-masing. Nilai �̂ dipilih
berdasarkan nilai GVS minimum dari keseluruhan �̂ pada
. Hal ini
dilakukan untuk membandingkan hasilnya dengan pemilihan persentil
.
2) Memodelkan regresi kuantil dengan regularisasi lasso dan gulud
menggunakan nilai koefisien lasso dan gulud yang optimum pada Q(0.75),
Q(0.90) dan Q(0.95).
6. Menghitung RMSEPpemodelan dan RMSEPvalidasi dari prediksi yang diperoleh
pada langkah (5). Formula keduanya adalah sama, yaitu sebagai berikut:
√ ∑

̂

dengan
, dengan adalah banyaknya observasi data kuantil,
adalah nilai curah hujan aktual pada data kuantil, dan ̂ adalah nilai prediksi
curah hujan dari model.
7. Menghitung korelasi antara (data kuantil curah hujan aktual) dengan ̂
(prediksi curah hujan) model masing-masing kuantil.
8. Membuat plot antara ̂ ketiga kuantil dengan y (curah hujan aktual) tahun
2013 untuk melihat keakuratan model dalam menangkap curah hujan ekstrim.

10

4 HASIL DAN PEMBAHASAN
Eksplorasi
Deskripsi Curah Hujan
Curah hujan tertinggi terjadi pada Bulan Januari dengan besar 498
mm/bulan, sedangkan curah hujan terendah adalah 0 mm/bulan. Lampiran 2(a)
menunjukkan curah hujan memiliki pola huruf U, dicirikan dengan memiliki satu
puncak musim hujan. Puncak musim hujan terjadi pada Bulan Januari dengan
rata-rata curah hujan sebesar 263.36 mm/bulan. Curah hujan ekstrim terjadi pada
saat curah hujan lebih dari 400 mm/bulan (BMKG 2008). Bulan Januari dan
Desember merupakan bulan dengan curah hujan ekstrim karena memiliki curah
hujan tertinggi sebesar 498 mm/bulan dan 490.25 mm/bulan.
Tabel 1 Deskripsi Curah Hujan Bulanan Tahun 1981-2013
Bulan
Januari
Februari
Maret
April
Mei
Juni
Juli
Agustus
September
Oktober
November
Desember

Rata-rata
263.36
219.13
190.13
164.18
109.36
78.50
38.03
14.50
17.47
60.40
145.65
225.61

Simpangan
Baku
112.92
90.60
60.05
58.58
58.70
58.64
39.85
19.16
28.14
57.82
91.32
92.16

Min

Max

78.25
59.00
81.00
67.00
24.00
14.00
0.00
0.00
0.00
0.00
14.67
78.00

498.00
394.75
341.25
313.00
301.00
246.75
124.25
56.50
117.67
190.50
372.25
490.25

Rata-rata curah hujan pada musim kemarau relatif rendah dibandingkan
dengan musim hujan yaitu sekitar 14.50 – 109.36 mm/bulan. Berbeda dengan
musim kemarau, curah hujan pada bulan-bulan di musim hujan hujan relatif tinggi
dengan rata-rata curah hujan berkisar 145.65 – 263.36 mm/bulan. Simpangan
baku terbesar berada pada puncak musim hujan, Bulan Januari, yaitu sebesar
112.92 mm/bulan. Simpangan baku terendah berada pada puncak musim kemarau,
Bulan Agustus, yaitu sebesar 19.16 mm/bulan. Dilihat dari nilai rata-rata dan
maksimum curah hujan, Bulan Januari dan Desember termasuk pada bulan dengan
curah hujan ekstrim dibandingkan dengan bulan hujan lainnya. Bulan pada curah
hujan ekstrim ini yang akan menjadi salah satu perhatian model agar dapat
menangkap bulan ekstrim basah tersebut.

11
Pergeseran Waktu pada Data Presipitasi GCM
Data presipitasi GCM diharapkan mampu menangkap curah hujan dengan
optimal. Hal ini ditunjukkan melalui pola data presipitasi GCM yang mengikuti
pola dari curah hujan. Indikasi pola antara keduanya mirip adalah nilai korelasi
antara curah hujan dengan data presipitasi GCM tinggi. Pada Lampiran 3
diperoleh nilai korelasi setiap peubah pada data presipitasi GCM dengan curah
hujan berada diantara nilai
sampai dengan
. Masih terdapat nilai
korelasi kecil yang berarti terdapat peubah yang belum mengikuti pola curah
hujan. Untuk mengatasinya digunakan metode fungsi korelasi silang (CCF) pada
data presipitasi GCM. Melalui metode ini akan diperoleh nilai pergeseran
berdasarkan nilai korelasi silang tertinggi antara data presipitasi dengan data
curah hujan. Besarnya pergeseran waktu sesuai dengan hasil CCF. Pergeseran
dapat bernilai negatif, nol, dan positif. Jika nilai negatif maka peubah
prediktor bergeser maju sebanyak bulan. Nilai sama dengan nol menunjukkan
peubah prediktor tidak bergeser. Jika nilai positif, maka peubah prediktor
bergeser mundur sebanyak bulan
Sebagai contoh, Lampiran 2(b) menunjukkan peubah � memiliki pola yang
tidak sama dengan pola curah hujan dan nilai korelasi keduanya sebesar
(Lampiran 3). Melalui metode CCF pada Lampiran 2(c) terlihat bahwa peubah �
memiliki korelasi tertinggi pada
, sehingga peubah � perlu digeser sejauh 2
bulan ke belakang. Hasil dari pergeseran menunjukkan pola peubah � sudah
mengikuti pola curah hujan (Lampiran 2(d)) dengan nilai korelasi yang meningkat
menjadi
(Lampiran 3). Berbeda dengan peubah � yang memiliki korelasi
tertinggi pada
(Lampiran 2(e)). Peubah � perlu digeser sejauh 1
bulan ke depan. Hasil persgeseran (Lampiran 2(f)) menunjukkan peubah �
sudah mengikuti pola curah hujan. Sama halnya pada presipitasi lainnya dilakukan
pergeseran sesuai dengan nilai pergeseran yang diperoleh. Lampiran 3
menunjukkan nilai korelasi sebelum dan sesudah lag. Diperoleh hasil seluruh
presipitasi GCM memiliki nilai ���
. Berdasarkan nilai korelasi antara curah
hujan dengan data luaran GCM, sebanyak 10.94% atau 7 peubah tidak digeser,
sedangkan sisanya sebesar 89.04% atau 57 peubah presipitasi digeser sejauh
bulan. Data presipitasi GCM yang sudah digeser selanjutnya digunakan untuk
membangun model.
Pemodelan Regresi Kuantil Regularisasi Lasso dan Gulud
Model regresi kuantil dengan koefisien lasso dan gulud yang diperoleh dari
proses VS yang diulang sebanyak 100 kali. Nilai koefisien optimum yang dipilih
adalah yang memiliki nilai GVS minimum dari 100 koefisien optimum.
Regularisasi lasso membutuhkan waktu lebih lama dibandingkan dengan
regularisasi gulud. Pada regularisasi lasso seratus koefisien lasso membutuhkan
waktu kurang lebih 20 jam untuk setiap kuantil, sedangkan regularisasi gulud
kurang lebih 12 jam. Proses VS pada regresi kuantil regularisasi lasso lebih lama
diindikasikan karena pada regularisasi lasso terdapat proses seleksi peubah,
sedangkan pada regularisasi gulud tidak.

12

Gambar 2 RMSEPpemodelan Model Regresi Kuantil Lasso dan Gulud
Pada Lampiran 4, dari keempat model nilai koefisien lasso dan gulud
optimum yang terpilih tidak berbeda jauh, namun persentil yang terpilih berbedabeda untuk setiap kuantil, baik lasso atau pun gulud. Nilai �̂ pada regresi kuantil
regularisasi lasso lebih besar dibandingkan dengan regularisasi gulud, hal ini
bukan berarti lasso memberikan pengaruh lebih besar dibandingkan regularisasi
gulud pada model regresi kuantil. Besarnya koefisien lasso dan gulud tidak dapat
dibandingkan secara langsung karena batasan yang dimiliki kedua regularisasi
tersebut berbeda. Regularisasi lasso memiliki batasan dengan tanda mutlak
sedangkan gulud memiliki batasan dengan tanda kuadratik.
Gambar 2 menunjukkan perbandingan nilai RMSEPpemodelan pada keempat
model untuk regularisasi lasso dan gulud. Pada regularisasi lasso maupun gulud
Q(0.75) konsisten memiliki nilai RMSEPpemodelan yang paling kecil dibandingkan
kuantil lainnya. Nilai RMSEPpemodelan tertinggi berada pada kuantil 0.95 pada
setiap model. Nilai RMSEPpemodelan yang kurang dari 40 dan korelasi lebih dari
0.97 untuk seluruh kuantil menunjukkan model regresi kuantil dengan
penambahan regularisasi lasso dan gulud termasuk model yang baik.
Prediksi Curah Hujan Ekstrim
Keempat model yang dibentuk sebelumnya akan digunakan untuk
memprediksi curah hujan ekstrim. Model 1 akan digunakan untuk memprediksi
tahun 2010, model 2 tahun 2011, model 3 tahun 2012, dan model 4 tahun 2013.
Keempat prediksi dari model ini akan dibandingkan untuk melihat konsistensi
model dalam hal memprediksi curah hujan ekstrim. Prediksi yang dihasilkan dari
model 1 akan dibandingkan dengan data kuantil tahun 1981-2010, model 2 tahun

Gambar 3 RMSEPvalidasi dan Korelasi Model Regresi Kuantil Lasso dan Gulud

13
1981-2011, model 3 tahun 1981-2012, dan model 4 tahun 1981-2013. Gambar 3
menunjukkan hasil RMSEPvalidasi dan korelasi prediksi curah hujan dari model
regresi kuantil. Hasil yang diperoleh tidak berbeda jauh dengan RMSEPvalidasi.
Q(0.75) konsisten memiliki nilai RMSEPvalidasi yang paling kecil dibandingkan
dengan Q(0.90) dan Q(0.95) untuk setiap prediksi tahun. Tabel 2 menunjukkan
nilai RMSEPvalidasi kurang dari 50 dengan korelasi lebih dari 0.95. Hal ini
menunjukkan bahwa model sudah akurat dalam memprediksi curah hujan ekstrim
untuk setiap kuantil.
Nilai koefisien lasso dan gulud yang digunakan pada model untuk prediksi
curah hujan ekstrim adalah yang memiliki GVS terkecil dari kandidat 100 nilai
koefisien lasso dan gulud yang optimum. Roberts dan Nowak (2013)
menyarankan untuk mengambil persentil atas yaitu P( ) dengan lebih dari
. Nilai RMSEPvalidasi dari metode GVS terkecil dibandingkan dengan
RMSEPvalidasi dari metode persentil Roberts dan Nowak (2013). Pada Lampiran 4
terlihat nilai koefisien lasso dan gulud dengan GVS terkecil untuk setiap ulangan
tidak bergeser besar satu sama lain. Nilai pergeseran yang tidak besar terlihat dari
simpangan baku dari 100 nilai koefisien optimum, pada Q(0.75), Q(0.90), dan
Q(0.95) regularisasi lasso berturut turut adalah 0.006, 0.211, dan 0.004.
Simpangan baku pada regularisasi gulud Q(0.75), Q(0.90), dan Q(0.95) adalah
0.002, 0.108, dan 0.001. Nilai koefisien lasso dan gulud dari ulangan 100 proses
VS yang tidak berbeda jauh, akan tetapi menghasilkan nilai RMSEPvalidasi yang
berbeda cukup besar.
Untuk melihat perbedaan nilai RMSEPvalidasi, 100 koefisien lasso dan gulud
yang optimum pada
sebelumnya dibangun model M1, M2, M3, dan M4.
Model ini digunakan untuk memprediksi curah hujan yang akan digunakan untuk
menghitung RMSEPvalidasi, sehingga diperoleh sebanyak 100 RMSEP validasi mulai
dari P(0.01) sampai dengan P(1). Nilai koefisien lasso dan gulud terpilih
berdasarkan GVS minimum pada Lampiran 5 setiap prediksi tahun untuk seluruh
kuantil bukan merupakan RMSEPvalidasi yang terkecil. Nilai RMSEPvalidasi tersebut
berada di antara nilai minimum dan maksimum P(0.01) sampai dengan P(1).
Sekalipun RMSEPvalidasi yang berasal dari koefisien dengan GVS minimum tidak
mencapai nilai maksimum RMSEPvalidasi keseluruhan 100 RMSEPvalidasi, hasil
yang diperoleh relatif besar. Hal ini terlihat signifikan pada regularisasi lasso
terutama di Q(0.95) yang mendekati nilai maksimum P
. Jika
dibandingkan dengan pemilihan persentil atas yaitu P
, mengandung
kemungkinan diperoleh RMSEPvalidasi yang maksimum. Akan tetapi, jika dilihat
pada nilai minimum RMSEPvalidasi untuk P
secara konsisten pada
regularisasi lasso di setiap kuantil memberikan nilai yang lebih kecil
dibandingkan dengan RMSEPvalidasi untuk GVS minimum. Berbeda dengan
regularisasi gulud, nilai RMSEPvalidasi pada koefisien yang memiliki GVS
minimum lebih kecil dibandingkan dengan P
untuk Q(0.75) dan
Q(0.90). Namun pada Q(0.95) regularisasi gulud, RMSEPvalidasi dari P
lebih baik karena nilainya lebih kecil dibandingkan dari GVS minimum. Hal ini
menunjukkan algoritma Roberts dan Nowak (2013) dengan memilih koefisien
lasso pada P
lebih baik dibandingkan memilih koefisien berdasarkan
GVS minimum. Pada regularisasi gulud untuk Q(0.75) dan Q(0.90) pemilihan
koefisien gulud berdasarkan GVS minimum lebih baik dibandingkan pada
P
.

14
Prediksi Curah Hujan Ekstrim Tahun 2013
Pada penelitian sebelumnya, Mondiana (2012) melakukan pendugaan curah
hujan ekstrim menggunakan regresi kuantil dengan penambahan komponen utama
untuk mengatasi multikolinier. Hasil RMSEPvalidasi dari model regresi kuantil
dengan komponen utama adalah 85.43 untuk Q(0.75), Q(0.90) sebesar 116.98,
dan Q(0.95) sebesar 179.65. Sari (2015) mengembangkan penelitian Mondiana
(2012) dengan mengatasi multikolinier menggunakan analisis komponen utama
fungsional, diperoleh RMSEPvalidasi pada Q(0.90) dan Q(0.95) adalah 100.45 dan
124.69. Nilai RMSEPvalidasi yang diperoleh pada penelitian Mondiana (2012) dan
Sari (2015) didapatkan dari perbandingan antara curah hujan prediksi model
dengan curah hujan aktual tahun 2008. Berbeda pada penelitian ini yang
membandingkan curah hujan prediksi model dengan curah hujan dari data kuantil
curah hujan aktual. Perbandingan prediksi curah hujan dengan data kuantil dinilai
lebih tepat karena prediksi yang diperoleh dari model adalah prediksi pada kuantil
tertentu, sehingga lebih sesuai jika prediksi tersebut dibandingkan dengan data
aktual curah hujan pada kuantil yang bersesuaian.
Berdasarkan RMSEPvalidasi yang terbaik dari hasil perbandingan pemilihan
koefisien antara GVS minimum dan P
, Tabel 2 menunjukkan
RMSEPvalidasi dan korelasi untuk prediksi tahun 2013. Nilai RMSEPvalidasi pada
penelitian ini jauh lebih kecil dari penelitian sebelumnya. Oleh karena itu
perbandingan prediksi curah hujan model regresi kuantil lebih tepat dibandingkan
dengan curah hujan aktual pada kuantil yang bersesuaian.
Tabel 2 Rangkuman Model M4 Prediksi Tahun 2013
Regularisasi
Lasso

Gulud

Kuantil
ke0.75
0.90
0.95
0.75
0.90
0.95

Koefisien
3.55 × 10-2
2.03 × 10-2
1.49 × 10-2
1.12 × 10-2
3.40 × 10-3
2.63 × 10-3

Kriteria
P
P
P

GVS min
GVS min
P

RMSEPvalidasi Korelasi
13.57
15.78
16.74
15.94
15.85
18.00

0.99
0.99
0.99
0.99
0.99
0.99

Nilai korelasi pada seluruh kuantil bernilai 0.99 yang menunjukkan model
regresi kuantil yang dibangun sudah mampu menggambarkan pola curah hujan
pada setiap kuantil. Pola ini terlihat pada Gambar 4 dan Gambar 5, curah hujan
dugaan setiap kuantil dari model dekat dengan data kuantil aktual pada kuantil
yang sama. Kedekatan pola ini pun terbukti dengan nilai RMSEP validasi yang relatif
kecil. Pada regularisasi lasso, nilai RMSEPvalidasi yang terkecil adalah Q(0.75)
dibandingkan kuantil lainnya. Sedangkan pada regularisasi gulud, RMSEP validasi
yang terkecil berada pada Q(0.90), tetapi nilai ini tidak berbeda jauh dengan
Q(0.75). Semakin besar kuantil menunjukkan curah hujan yang semakin ekstrim.
Pada Kabupaten Indramayu ZOM 79 curah hujan ekstrim tinggi, yaitu Q(0.90)
dan Q(0.95), lebih baik digambarkan oleh regresi kuantil regularisasi gulud karena
nilai RMSEPvalidasi yang lebih kecil dibandingkan dengan penambahan regularisasi
lasso. Pada Q(0.75), regresi kuantil dengan regularisasi lasso memberikan nilai

15

Gambar 4 Plot Data Kuantil Curah Hujan Aktual dengan Prediksi Curah Hujan
Regresi Kuantil Regularisasi Lasso Tahun 2013
RMSEPvalidasi yang lebih kecil dibandingkan dengan regresi kuantil dengan
regularisasi gulud.
Gambar 6 menunjukkan nilai prediksi curah hujan masing-masing kuantil
yang digabungkan dengan plot aktual curah hujan pada tahun 2013. Terlihat
bahwa curah hujan ekstrim bulan Januari dan Desember berada di prediksi curah
hujan regresi kuantil regularisasi lasso. Curah hujan pada bulan Januari berada di
Q(0.75), sedangkan bulan Desember berada di Q(0.90). Bulan basah lainnya bulan
April berada pada Q(0.75). Gambar 6 untuk regresi kuantil regularisasi gulud
mampu memprediksi curah hujan ekstrim pada bulan Januari dan Desember.
Curah hujan bulan Januari berada pada Q(0.75) dan bulan Desember berada pada
Q(0.90). Hal ini menunjukkan bahwa model regresi kuantil regularisasi lasso dan
gulud mampu menduga curah hujan ekstrim Kabupaten Indramayu pada tahun
2013.

Gambar 5 Plot Data Kuantil Curah Hujan Aktual dengan Prediksi Curah Hujan
Regresi Kuantil Regularisasi Gulud Tahun 2013

Curah Hujan (mm)

16

500
450
400
350
300
250
200
150
100
50
0
1

2

3

4

5

6

7

8

9

10

11

12

8

9

10

11

12

Bulan

(a)

Curah Hujan (mm)

600
500
400
300
200
100
0
1

2

3

4

5

6

7

Bulan

(b)
Keterangan:

Prediksi Curah Hujan Q(0.95)
Prediksi Curah Hujan Q(0.90)
Prediksi Curah Hujan Q(0.75)
Curah Hujan Aktual Tahun 2013

Gambar 6 Plot Data Aktual Curah Hujan Tahun 2013 dengan Prediksi Curah
Hujan (a) Regresi Kuantil Regularisasi Lasso dan (b) Regresi Kuantil
Regularisai Gulud

17

5 SIMPULAN DAN SARAN
Simpulan
Kriteria pemilihan dugaan koefisien lasso pada Q(0.75), Q(0.90), dan
Q(0.95) yang terbaik adalah melalui metode persentil Roberts dan Nowak (2013).
Koefisien lasso terbaik memiliki RMSEPvalidasi terkecil pada P
.
Berbeda dengan regularisasi gulud, koefisien gulud yang terbaik pada Q(0.75) dan
Q(0.90) adalah melalui metode galat validasi silang (GVS) minimum, sedangkan
pada Q(0.95) koefisien gulud terbaik adalah melalui metode persentil Roberts dan
Nowak (2013).
Regresi kuantil lasso pada prediksi curah hujan tahun 2013 memiliki
RMSEPvalidasi sebesar 13.57, 15.78, dan 16.74 untuk masing-masing Q(0.75),
Q(0.90), dan Q(0.95). Pada regresi kuantil gulud nilai RMSEPvalidasi yang
diperoleh adalah 15.94, 15.85, dan 18.00 untuk masing-masing kuantil yang sama.
Korelasi pada setiap masing-masing Q(0.75), Q(0.90), dan Q(0.95) adalah sebesar
0.99 menunjukkan regresi kuantil lasso dan gulud baik dalam memprediksi curah
hujan. Regresi kuantil lasso lebih baik dibandingkan regresi kuantil gulud dalam
memprediksi curah hujan di Kabupaten Indramayu karena memiliki RMSEPvalidasi
yang paling kecil.

Saran
Penarikan simpulan pada penelitian ini terbatas untuk kasus curah hujan di
Kabupaten Indramayu. Dibutuhkan simulasi untuk dapat menarik simpulan secara
umum. Simulasi dapat dilakukan pada regresi kuantil dengan menambahkan
regularisasi lasso, gulud dan gabungan keduanya yaitu elastic-net (EN).

18

DAFTAR PUSTAKA
Arlot S, Celisse A. 2010. A survey of cross-validation procedures for model
selection. Statsitics Surveys. (4): 40-79.
Buhai S. 2005. Quantile Regression Overview and Selected Applications. Journal
Ad Astra. 4.2005.
Busuioc A, Chen D, Hellstrom C. 2001. Performance Of Statistical Downscaling
Models In GCM Validation And Regional Climate Change Estimates:
Application For Swedish Precipitation. Int J Climatol. 21:557-578.
Djuraidah A, Wigena AH. 2011. Regresi Kuantil untuk Eksplorasi Pola Curah
Hujan di Kabupaten Indramayu. Jurnal Ilmu Dasar. 1(12):50-56.
Handayani L. 2014. Statistical Downscaling dengan Model Aditif Terampat untuk
Pendugaan Curah Hujan Ekstrim [Tesis]. Bogor (ID): Institut Pertanian
Bogor.
Kinanti SL, Wigena AH, Djuraidah A. 2015. Statistical Downscaling with
Generalized Pareto Distribution (Study Case: Extreme rainfal estimation).
Di dalam: Kusumo FA, Wijayanti IE, Alucius IE, Susanti Y, editor.
Proceedings of the 7th SEAMS UGM International Conference on
Mathematics and its applications 2015: Enhancing the Role of
Mathematics in Interdisciplinary Research; 2015 Ags 18-21; Yogyakarta,
Indonesia Yogyakarta (ID): AIP Publishing LLC.
Koenker R, Basset G, 1978. Regression Quantiles. Econometrica. 1(46):33-50.
Koenker R, Hallock K. 2001. Quantile regression. Journal of Economic
Perspectives. 15:143-156.
Lund KV. 2013. The Instability of Cross-Validated Lasso. [Thesis]. Oslo (NO):
University of Oslo.
Mejia J et al. 2010. Scientists Face Challenges in Downscaling Global Climate
Models [Internet]. [Diunduh pada 6 April 2016]. Tersedia pada:
http:/epscorspo.nevada.edu/nsf/climate1/climate10.html
Mondiana QM. 2012. Pemodelan Statistical Downscaling Dengan Regresi Kuantil
Untuk Pendugaan Curah Hujan Ekstrim [Tesis]. Bogor (ID): Institut
Pertanian Bogor.
Roberts S, Nowak G. 2013. Stabilizing the Lasso against Cross Validation
Variability. Computational Statistics and Data Analysis .70:198-211.
Santhika E. 2013. Banjir Genangi Sawah, Petani Indramayu Tunda Tanam Padi
[Internet].
[diunduh
14
Juni
2016].
Tersedia
pada:
http://nrmnews.com/2013/01/06/banjir-genangi-sawah-petani-indramayutunda-tanam-padi/.
Santri D. 2016. Statistical Downscaling Modeling with Quantile Regression using
Lasso to Estimate Extreme Rainfall. Di dalam: Kusumo FA, Wijayanti IE,
Alucius IE, Susanti Y, editor. Proceedings of the 7th SEAMS UGM
International Conference on Mathematics and Its Applications 2015:
Enhancing the Role of Mathematics in Interdisciplinary Research
[Internet]. 2015 Agus 18-21. Yogyakarta, Indonesia. [diunduh 2016 Jul
27]. Tersedia pada: http//scitation.aip.org/content/aip/proceeding/aipcp
/10.1063/1.4940862.

19
Sari WJ. 2015. Pemodelan Statistical Downscaling dengan Regresi Kuantil
Komponen Utama Fungsional untuk Prediksi Curah Hujan Ekstrim [Tesis].
Bogor (ID): Institut Pertanian Bogor.
Soleh AM, Wigena AH, Djuraidah A, Saefudin A. 2015. Pemodelan Statistical
Downscaling untuk Menduga Curah Hujan Bulanan menggunakan Model
Linier Terampat Sebaran Gamma. Jurnal Informatika Pertanian.
24(2):215-222.
Sutikno. 2008. Statistical downscaling Luaran GCM dan Pemanfaatannya untuk
Peramalan Prod