Pemodelan Statistical Downscaling Dengan Regresi Kuantil Spline Untuk Prediksi Curah Hujan Ekstrim Di Kabupaten Indramayu.

PEMODELAN STATISTICAL DOWNSCALING DENGAN REGRESI
KUANTIL SPLINE UNTUK PREDIKSI CURAH HUJAN EKSTRIM DI
KABUPATEN INDRAMAYU

NOOR ELL GOLDAMEIR

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul “Pemodelan Statistical
Downscaling dengan Regresi Kuantil Spline untuk Prediksi Curah Hujan Ekstrim
di Kabupaten Indramayu” adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi
manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.
Bogor, Desember 2015

Noor Ell Goldameir
G152120101

* pelimpahan hak cipta atas karya tulis dari penelitian kerjasama dengan pihak luar IPB harus
didasarkan pada perjanjian kerjasama yang terkait

RINGKASAN
NOOR ELL GOLDAMEIR. Pemodelan Statistical Downscaling dengan Regresi
Kuantil Spline untuk Prediksi Curah Hujan Ekstrim di Kabupaten Indramayu.
Dibimbing oleh ANIK DJURAIDAH dan AJI HAMIM WIGENA.
Curah hujan sangat berpengaruh terhadap aktivitas kehidupan manusia.
Keragamannya cukup besar dan mencirikan iklim di Indonesia. Perubahan iklim
global dapat meningkatkan kejadian-kejadian curah hujan ekstrim. Sebuah analisis
dibutuhkan untuk memperoleh informasi prediksi curah hujan yang sangat
berguna untuk mengurangi akibat dari kemungkinan kejadian-kejadian curah
hujan ekstrim.
Statistical downscaling (SD) menggunakan model statistika dapat

digunakan untuk analisis antara data berskala lokal sebagai peubah respon (data
curah hujan) dengan data berskala global sebagai peubah prediktor (data
presipitasi luaran Global circulation model (GCM)). Ide dasar dari SD adalah
menentukan parameter hubungan antara peubah iklim skala global dengan peubah
iklim skala lokal. Selanjutnya, model SD ini digunakan untuk prediksi iklim skala
lokal.
Regresi kuantil merupakan perluasan dari regresi median pada berbagai
nilai kuantil. Metode ini digunakan untuk mengukur efek peubah prediktor tidak
hanya dipusat sebaran data tetapi juga pada bagian atas atau bawah ekor sebaran.
Analisis ini sangat berguna dalam penerapannya, khususnya nilai ekstrim yang
merupakan masalah penting. Bentuk hubungan fungsional pada regresi kuntil
dapat berupa parametrik, nonparametrik, ataupun keduanya. Hubungan fungsional
nonparametrik dapat dimodelkan dengan spline. Tujuan penelitian ini adalah
memodelkan SD dengan regresi kuantil spline dan memprediksi curah hujan
ekstrim di kabupaten Indramayu.
Data yang digunakan dalam penelitian ini adalah data curah hujan dari
tahun 1979-2008 dan data presipitasi GCM dengan pergeseran waktu (GCM-lag)
Climate Model Intercomparison Project (CMIP5) dari tahun 1979-2008. Data
curah hujan dari stasiun klimatologi di kabupaten Indramayu digunakan sebagai
peubah respon dan data presipitasi GCM-lag digunakan sebagai peubah

prediktor. Pada GCM dilagkan agar menghasilkan korelasi yang kuat sehingga
menghasilkan pendugaan curah hujan yang lebih baik. Dalam data dibagi menjadi
dua bagian, yaitu data pada tahun 1979-2007 untuk pemodelan dan data pada
tahun 2008 untuk prediksi. Penambahan peubah boneka dapat mengatasi masalah
keheterogenan sisaan. Peubah boneka ditentukan dengan metode regresi kuadrat
terkecil parsial (RKTP) yang menunjukkan bahwa berdasarkan plot antara nilai
skor prediktor dan skor respon yang dihasilkan dari komponen utama terdapat 5
kelompok data curah hujan (Sahriman 2014).
Karakteristik data GCM-lag yang berdimensi besar dan multikolinieritas
diatasi dengan analisis komponen utama (AKU). Hasil AKU menunjukkan bahwa
terdapat empat komponen utama (KU) yang memiliki proporsi kumulatif
keragaman sebesar 95% dari peubah asal. Empat komponen utama terpilih
tersebut selanjutnya diplotkan dengan curah hujan untuk melihat pola hubungan
fungsional pada masing-masing KU. Berdasarkan penelitian Rizki (2014)
menunjukkan bahwa kombinasi titik simpul spline dengan derajat kubik terbaik

adalah 14, 8, 7, 5. Selanjutnya pendugaan parameter model dilakukan
menggunakan regresi kuantil. Pemilihan model terbaik dilakukan dengan kriteria
dan root mean square error (
).

nilai pseudo
Hasil penelitian menunjukkan bahwa model SD dengan peubah boneka
memberikan peningkatan yang nyata pada nilai pseudo dan penurunan yang
serta pada prediksi model juga memberikan peningkatan
nyata pada nilai
yang nyata pada nilai korelasi
dan penurunan yang nyata pada nilai root mean
). Hal ini menunjukkan bahwa dengan
square error of prediction (
adanya penambahan peubah boneka membuat model semakin baik dalam
melakukan prediksi. Plot pada model SD dengan peubah boneka menunjukkan
pola yang lebih mirip dengan data aktual. Model SD ini dapat digunakan untuk
prediksi curah hujan ekstrim baik dengan model regresi kuantil polinomial dengan
peubah boneka (RKPB) maupun model regresi kuantil spline dengan peubah
boneka (RKSB). Model yang paling baik untuk menggambarkan nilai ekstrim
biasa pada kuantil ke 90 adalah model RKPB dengan pseudo
dan
serta prediksi model RKPB mempunyai nilai korelasi dengan
dan
Selanjutnya, model yang paling baik untuk

menggambarkan nilai ekstrim yang lebih tinggi pada kuantil ke 95 adalah model
RKSB dengan pseudo
dan
serta prediksi model
dan
RKSB mempunyai nilai korelasi dengan
Prediksi curah hujan yang dilakukan satu tahun kedepan dengan menggunakan
model SD memberikan hasil yang konsisten.
Kata kunci : Global circulation model, regresi kuantil, spline, statistical
downscaling

SUMMARY
NOOR ELL GOLDAMEIR. Statistical Downscaling Modeling with Quantile
Spline Regression to Predict Extreme Rainfall in Indramayu District. Supervised
by ANIK DJURAIDAH and AJI HAMIM WIGENA.
Rainfall took effect on the human activity. The variants was big and
characterized the climate in Indonesia. Global climate change could increase the
extreme rainfall events. An analisis was needed to get the rainfall prediction
information that could be useful to decrease the effect of the extreme rainfall
events.

Statistical downscaling (SD) used statistics model could be used to
analysis the relationship between local scale data as the respond variable (rainfall
data) and global scale data as the predictor variable (output global circulation
model data (GCM)). The basic idea of SD was to determine parameter of
relationship between global scale climate variable with local scale climate
variable. Furthermore, this SD model can be used for prediction of local scale
climate.
Quantile regression was the elaboration of the median regression in every
quantile. This method was used to measure the effect of the predictor variable not
only in the center of the distribution but also in the top and the tail of the
distribution. The analysis was useful in the implementation, especially for the
extreme value which was an important matter. The functional form of relationship
in quantile regression can be a parametric, nonparametric or both. In the
nonparametric functional relationship can be modeled with spline. The purpose of
the research was to model the SD using the quantile spline regression and to
predict the extreme rainfall in Indramayu district.
Data that used in this study is the rainfall data from 1979-2008 and the
GCM precipitation Climate Model Inter comparison Project (CMIP5) data with
time lag (GCM-lag) from 1979-2008. Rainfall data from the climatology station in
Indramayu Regency was used as the respond variable and the GCM-lag

precipitation data was used as the predictor variable. The GCM-lag is generated
for strong correlation so that it could generate better rainfall estimation. The data
was divided into two parts, 1979-2007 data was used for modeling and 2008 data
was used for prediction model. The addition of the dummy variable could solve
the heterogeneity of the residual. The dummy variable was determined by the
partial least square regression (PLSR) to show that based on the predictor and
respond variable value plot generated by the principal component (PC) there were
five groups of rainfall data (Sahriman 2014).
The GCM-lag data have big dimension and multicollinearity were solved
by principal component analysis (PCA). The result of PCA showed that there
were four principal components (PCs) that was chosen and was plotted with the
rainfall to show the functional pattern in every PC. Rizki (2014) showed that the
combination of the cubic spline degree were 14, 8, 7, 5. Then, the estimation of
SD the parameter model was conducted using quantile regression. The choice of
and root mean square
the best model was done with the criteria of the pseudo
).
error (

The result of the research showed that the SD model with the dummy

variable had a significant development on the correlation
and significant
) value. It showed
decreasing on the root mean square error of prediction (
that by adding dummy variable the model could give better prediction. SD model
plot with dummy variable showed that the pattern have similar to the actual data.
The SD model could be used to predict the extreme rainfall either with quantile
polynomial regression model with dummy variable (QPRD) or spline quantile
regression model with dummy variable (QSRD). The best model to describe the
extreme value was the 90th quantile is QPRD model with pseudo
and
and the prediction of QPRD model had a
correlation value with
and
Then the best model
th
that describe the higher extreme value was the 95 quantile is QSRD model with
pseudo
and
and the prediction of QSRD model

and
The rainfall
had the correlation value with
prediction that has been done for the next year using SD model gave a consistent
result.

Keywords: Global circulation model, quantile regression, spline, statistical
downscaling

© Hak Cipta Milik IPB, Tahun 2015
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah, dan pengutipan tersebut tidak merugikan kepentingan
IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apapun tanpa izin IPB

PEMODELAN STATISTICAL DOWNSCALING DENGAN

REGRESI KUANTIL SPLINE UNTUK PREDIKSI CURAH
HUJAN EKSTRIM DI KABUPATEN INDRAMAYU

NOOR ELL GOLDAMEIR

Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Program Studi Statistika Terapan

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015

PRAKATA
Puji syukur penulis panjatkan kehadirat Allah SWT atas limpahan rahmat
dan ridho-Nya, kesempatan, dan kesehatan yang dikaruniakan-Nya sehingga tesis
yang berjudul “Pemodelan Statistical Downscaling dengan Regresi Kuantil Spline
untuk Prediksi Curah Hujan Ekstrim di Kabupaten Indramayu” ini dapat

terselesaikan.
Terima kasih penulis ucapkan kepada Ibu Dr Ir Anik Djuraidah, MS dan
Bapak Dr Ir Aji Hamim Wigena, MSc selaku pembimbing, atas kesediaan dan
kesabaran untuk membimbing dan membagi ilmunya kepada penulis dalam
penyusunan tesis ini. Ucapan terima kasih penulis sampaikan kepada Bapak Dr Ir
I Made Sumertajaya, MSi sebagai penguji luar komisi pada ujian tesis yang telah
banyak memberikan kritik, saran dan arahan yang sangat membangun dalam
penyusunan tesis ini. Ucapan terima kasih juga penulis sampaikan sebesarbesarnya kepada seluruh Dosen Departemen Statistika IPB yang telah mengasuh
dan mendidik penulis selama di bangku kuliah hingga berhasil menyelesaikan
studi, serta seluruh staf Departemen Statistika IPB atas bantuan, pelayanan, dan
kerjasamanya selama ini.
Ucapan terima kasih yang tulus dan penghargaan yang tak terhingga juga
penulis ucapkan kepada Ayahanda dan Ibunda tercinta H Waziruddin dan Hj
Roslaili yang telah membesarkan dan mendidik penulis dengan penuh kasih
sayang demi keberhasilan penulis selama menjalani proses pendidikan, juga kakak
dan adik tersayang dr Maha Chakri Willheljulya dan drg Robbykha Rosalien atas
doa dan semangatnya.
Terakhir tak lupa penulis juga menyampaikan terima kasih kepada seluruh
mahasiswa Pascasarjana Departemen Statistika atas segala bantuan dan
kebersamaannya selama menghadapi masa-masa terindah maupun tersulit dalam
menuntut ilmu, serta semua pihak yang telah banyak membantu dan tak sempat
penulis sebutkan satu per satu.
Semoga tesis ini dapat bermanfaat bagi semua pihak yang membutuhkan.

Bogor,

Desember 2015

Noor Ell Goldameir

DAFTAR ISI
DAFTAR TABEL
DAFTAR GAMBAR
DAFTAR LAMPIRAN
1 PENDAHULUAN
Latar Belakang
Tujuan Penelitian
2 TINJAUAN PUSTAKA
Statistical Downscaling
Regresi Kuantil
Regresi Kuantil Polinomial
Spline
Regresi Kuantil Spline
Regresi dengan Peubah Boneka
3 METODE PENELITIAN
Data
Metode Analisis
4 HASIL DAN PEMBAHASAN
Eksplorasi Data
Deskripsi Data Curah Hujan
Deskripsi Data GCM-Lag
Analisis Komponen Utama
Penyiapan Data
Pola Hubungan Curah Hujan dengan Komponen Utama
Pemodelan Statistical Downscaling
Model Regresi Kuantil Polinomial
Model Regresi Kuantil Spline
Model Regresi Kuantil Polinomial dengan Peubah Boneka
Model Regresi Kuantil Spline dengan Peubah Boneka
Perbandingan Model
5 SIMPULAN DAN SARAN
Simpulan
Saran
DAFTAR PUSTAKA
LAMPIRAN
RIWAYAT HIDUP

vi
vi
vi
1
1
2
2
2
3
5
6
7
8
8
8
9
12
12
12
14
14
15
15
17
17
18
19
20
21
23
23
23
24
26
47

DAFTAR TABEL
1
2
3
4

Deskripsi data curah hujan di kabupaten Indramayu tahun 1979-2008
Nilai akar ciri, proporsi keragaman dan proporsi kumulatif keragaman
analisis komponen utama
Nilai pinalti kekasaran
dan GCV untuk setiap KU pada berbagai
jumlah derajat bebas
korelasi
dari beberapa model
Nilai pseudo
statistical downscaling

13
15
16
21

DAFTAR GAMBAR
Ilustrasi proses statistical downscaling
Fungsi indikator
Fungsi spline berderajat linier dengan jumlah titik simpul satu
Pola curah hujan di kabupaten Indramayu
Plot antara presipitasi data GCM grid 1 lag 2 dengan waktu
Plot hubungan fungsional antara curah hujan dan KU yang terpilih
Plot prediksi pada model regresi kuantil polinomial untuk kuantil ke
50, 75, 90 dan 95 pada tahun 2008
8 Plot prediksi pada model regresi kuantil spline untuk kuantil ke 50, 75,
90 dan 95 pada tahun 2008
9
Plot prediksi pada model regresi kuantil polinomial dengan peubah
boneka untuk kuantil ke 50, 75, 90 dan 95 pada tahun 2008
10 Plot prediksi pada model regresi kuantil spline dengan peubah boneka
untuk kuantil ke 50, 75, 90 dan 95 pada tahun 2008
11 Nilai
dan
dari beberapa model statistical downscaling

1
2
3
4
5
6
7

3
4
6
13
14
16
17
18
19
20
22

DAFTAR LAMPIRAN
1
2
3
4
5
6
7
8
9
10
11
12
13

Plot masing-masing peubah data GCM-lag
Nilai variance inflation factors (VIF) pada data GCM-lag
Uji kehomogenan ragam pada data GCM-lag
Plot antara curah hujan dan komponen utama ke-1 (KU1)
Plot antara curah hujan dan komponen utama ke-2 (KU2)
Plot antara curah hujan dan komponen utama ke-3 (KU3)
Plot antara curah hujan dan komponen utama ke-4 (KU4)
Koefisien model regresi kuantil polinomial dan regresi kuantil
polinomial dengan peubah boneka pada kuantil ke 50, 75, 90 dan 95
Koefisien model regresi kuantil spline dan regresi kuantil spline
dengan peubah boneka pada kuantil ke 50, 75, 90 dan 95
Nilai dugaan regresi kuantil polinomial pada tahun 2008
Nilai dugaan regresi kuantil spline pada tahun 2008
Nilai dugaan regresi kuantil polinomial dengan peubah boneka pada
tahun 2008
Nilai dugaan regresi kuantil spline dengan peubah boneka pada tahun
2008

27
35
36
36
39
40
42
43
44
45
45
45
46

1 PENDAHULUAN
Latar Belakang
Iklim merupakan fenomena alam yang sangat penting terhadap berbagai
aktivitas kehidupan manusia khususnya pada bidang pertanian. Unsur iklim yang
memiliki keragaman dan fluktuasi paling tinggi di Indonesia adalah curah hujan.
Perubahan iklim global dapat meningkatkan kejadian-kejadian iklim ekstrim
seperti curah hujan ekstrim. Curah hujan ekstrim adalah kondisi curah hujan di
atas atau di bawah rata-rata kondisi normalnya. Menurut BMKG (2008), indikator
intensitas curah hujan dikatakan ekstrim apabila intensitas curah hujan lebih besar
dari 400 mm/bulan. Curah hujan ekstrim basah akan berdampak pada banjir
sehingga dapat menyebabkan gagal panen atau produksi padi menurun. Dengan
demikian, sebuah analisis dibutuhkan untuk memperoleh informasi prediksi curah
hujan yang tepat dan sangat berguna untuk mengurangi akibat dari kemungkinan
kejadian-kejadian ekstrim.
Model dalam menganalisa curah hujan yang sudah diterapkan yaitu
global circulation model (GCM) yang merupakan model simulasi sirkulasi
atmosfer dalam skala global. GCM dipandang sebagai metode yang paling
berpotensi dalam hal menyimulasikan iklim pada masa lampau, sekarang, dan
memprediksi perubahan-perubahan iklim yang mungkin terjadi di masa
mendatang (Wilby et al. 2009). GCM dalam skala spasial bersifat global sehingga
belum bisa menjelaskan keadaan seperti curah hujan lokal sehingga diperlukan
suatu teknik untuk menduga peubah iklim skala lokal dengan tingkat akurasi
tinggi (Zorita dan Storch 1999). Suatu teknik untuk menghubungkan antara data
global dan data lokal menggunakan model statistika untuk membuat hubungan
antara suatu data yang berskala global (data GCM) dengan data yang berskala
lokal (data curah hujan) (Fernandez 2005).
Permasalahan utama yang muncul pada pemodelan SD adalah
mendapatkan metode statistika yang dapat menggambarkan hubungan antara
curah hujan dan GCM (Sutikno 2008). Metode statistika berkembang dari
pendekatan parametrik sampai dengan nonparametrik. Metode parametrik
memerlukan asumsi yang ketat. Karakteristik data iklim yang nonlinier dapat
diatasi dengan suatu metode alternatif yang lebih fleksibel terhadap asumsi adalah
metode nonparametrik. Penelitian tentang pemodelan SD dengan metode
nonparametrik, antara lain Handayani (2014) telah mengkaji model aditif terampat
untuk prediksi curah hujan ekstrim di kabupaten Indramayu. Selanjutnya, Rizki
(2014) telah mengkaji pemodelan semiparametrik yaitu dengan metode regresi
spline terpenalti (P-spline) dengan pendekatan model linier campuran untuk
prediksi curah hujan di kabupaten Indramayu, namun penelitiannya belum
mengkaji kejadian ekstrim dalam pemodelannya.
Pola perubahan dan intensitas curah hujan ekstrim dapat dimodelkan
dengan regresi kuantil. Metode ini dapat digunakan untuk mengukur efek peubah
prediktor tidak hanya di pusat sebaran data, tetapi juga pada bagian atas atau
bawah ekor sebaran. Hal ini sangat berguna bila nilai ekstrim merupakan
permasalahan penting (Djuraidah & Wigena 2011). Pemodelan SD untuk
pendugaan kajian ekstrim telah dilakukan, antara lain Mondiana (2012)
melakukan pendugaan curah hujan ekstrim dengan regresi kuantil menggunakan

2
analisis komponen utama (AKU) sebagai metode reduksi dimensi. Kemudian,
Sari (2015) telah mengkaji pemodelan curah hujan ekstrim dengan regresi kuantil
menggunakan analisis komponenen utama fungsional (AKUF) sebagai metode
reduksi dimensi di Kabupaten Indramayu.
Bentuk hubungan fungsional antara peubah respon dengan peubah
prediktor pada regresi kuantil dapat dikembangkan dalam bentuk nonparametrik.
Salah satu bentuk hubungan fungsional nonparametrik adalah spline. Berdasarkan
hasil penelitian Rizki (2014) diketahui bentuk hubungan fungsional terbaik adalah
spline. Djuraidah & Rahman (2009) telah menggunakan metode regresi kuantil
spline untuk menggambarkan polusi udara di kota Surabaya. Penelitian ini
mengkaji pemodelan SD dengan menggunakan regresi kuantil spline untuk
prediksi curah hujan ekstrim di kabupaten Indramayu.
Tujuan Penelitian
Tujuan penulisan dalam penelitian ini adalah memodelkan statistical
downscaling dengan regresi kuantil spline dan memprediksi curah hujan ekstrim
di kabupaten Indramayu.

2 TINJAUAN PUSTAKA
Statistical Downscaling
Global circulation model (GCM) atau model sirkulasi umum adalah
model simulasi sirkulasi atmosfer dalam skala global. GCM mensimulasi peubahpeubah iklim global pada setiap grid (berukuran
atau
) setiap
lapisan (layer) atsmosfir, yang selanjutnya digunakan untuk memprediksi polapola iklim dalam jangka waktu panjang (tahunan) (Wigena 2006). Namun,
informasi GCM masih berskala global sehingga diperlukan suatu teknik untuk
menduga peubah iklim skala lokal dengan tingkat akurasi tinggi, yaitu dengan
menggunakan statistical downscaling.
Statistical downscaling (SD) adalah pendekatan empiris mengenai
hubungan secara statistika antara atmosfir global (GCM) dengan curah hujan. Ide
dasar dari SD adalah menentukan parameter hubungan antara iklim skala global
dengan iklim skala lokal dan menggunakan hubungan ini untuk proyeksi hasil
simulasi GCM pada iklim masa lalu, sekarang, atau masa depan yang berskala
lokal. SD menggunakan model statistik dalam menggambarkan hubungan antara
data pada grid berskala global (prediktor) dengan data pada grid yang berskala
lokal (respon) untuk menterjemahkan anomali-anomali skala global menjadi
anomali dari beberapa peubah iklim lokal (Zorita dan Storch 1999).
Bentuk umum model SD dapat disajikan pada persamaan (1):
(1)
dengan
: Peubah-peubah iklim lokal (misal: curah hujan)
: Peubah GCM (misal: presipitasi)
: Banyaknya waktu (misal: bulanan)
: Banyaknya grid domain GCM.

3
Busuioc et al. (2001) menyatakan bahwa model SD akan memberikan hasil yang
baik dengan syarat, yaitu hubungan antara peubah respon dengan prediktor harus
berkorelasi tinggi untuk menjelaskan keragaman iklim lokal dengan baik, peubah
prediktor harus disimulasikan dengan baik oleh GCM, dan hubungan antara
peubah respon dengan prediktor tidak berubah dengan adanya perubahan waktu
serta tetap sama meskipun ada perubahan iklim di masa depan. Ilustrasi proses SD
dapat dilihat pada Gambar 1.
Global Circulation Model
(Peubah Prediktor)

2.5o
2.5o

Kabupaten Indramayu

Observasi Permukaan
(Peubah Respon)
Gambar 1

Statistical
Downscaling

Ilustrasi proses statistical downscaling (Sumber: Sutikno 2008)
Regresi Kuantil

Regresi kuantil pertama kali diperkenalkan oleh Koenker dan Basset
pada tahun 1978. Regresi kuantil adalah teknik statistika yang digunakan untuk
menduga hubungan antara peubah respon dengan peubah prediktor pada fungsi
kuantil bersyarat tertentu. Regresi kuantil meminimumkan jumlah galat mutlak
terboboti dan menduga model dengan menggunakan fungsi kuantil bersyarat pada
suatu sebaran data. Metode regresi kuantil tidak membutuhkan asumsi parametrik
dan regresi kuantil sangat bermanfaat untuk menganalisis bagian tertentu dari
suatu sebaran bersyarat (Buhai 2005).
Keuntungan dari regresi kuantil yaitu efesien jika sisaan tidak menyebar
normal dan kekar terhadap adanya pencilan. Regresi kuantil dapat mengukur efek
peubah prediktor tidak hanya di pusat sebaran data tetapi juga pada bagian atas
dan bawah ekor sebaran. Metode ini sangat berguna dalam penerapan, khususnya
bila nilai ekstrim merupakan permasalahan penting (Djuraidah & Wigena 2011).
Peubah acak dengan fungsi sebaran peluang dapat disajikan pada
persamaan (2):
(2)
terdapat fungsi kebalikan yang merupakan kuantil kedari
untuk
yang didefinisikan pada persamaan (3). Sebagai contoh Q(0.5) adalah
median.
(3)

4
Contoh acak berukuran dari peubah acak , yaitu
, median contoh
adalah penduga yang meminimumkan jumlah mutlak galat dapat disajikan pada
persamaan (4):
(4)
Seperti halnya median contoh, metode ini bisa dikembangkan untuk model regresi
kuantil yang disajikan pada persamaan (5):
(5)
dengan
adalah vektor peubah respon berukuran
adalah matriks peubah prediktor berukuran
dan
dengan
adalah vektor parameter berukuran
adalah vektor galat berukuran
disebut sebagai regresi median yang merupakan perluasan
Regresi
dari median contoh. Penduga koefisien pada model
merupakan solusi dari
minimasi fungsi pada persamaan (6):
(6)
Hubungan fungsional antara peubah respon dengan peubah prediktor pada regresi
kuantil merupakan hubungan fungsional yang membentuk fungsi linier dinyatakan
pada persamaan (7):
(7)
Secara umum menurut Koenker (2005) penduga regresi kuantil ke
untuk
merupakan solusi dari masalah minimisasi fungsi pada
persamaan (8):
(8)
Persamaan (8) memeberikan bobot untuk seluruh pengamatan yang lebih besar
dari nilai optimum yang belum diketahui dan memberikan bobot
terhadap
seluruh pengamatan yang lebih kecil dari nilai optimum. Persamaan (8) dapat
dibentuk menjadi persamaan (9):
(9)
dengan
adalah fungsi kerugian (loss function) yang tidak simetris. Fungsi
kerugian dengan
yang dapat disajikan dalam bentuk persamaan (10):
(10)
merupakan fungsi indikator,
jika benar dan
dengan
selainnya. Fungsi indikator dapat diilustrasikan pada gambar (3).
y

x
-1

Gambar 2

0

1

Fungsi indikator

5
Pendugaan dalam regresi kuantil diperoleh dengan meyelesaikan masalah
pemrograman linier. Salah satu metode yang dapat digunakan untuk pendugaan
parameter regresi kuantil adalah metode simpleks. Menurut Chen (2005), metode
simpleks banyak digunakan dalam aplikasi statistika. Dalam teorinya, jumlah
iterasi dapat meningkat secara eksponensial tergantung ukuran datanya dan
metode ini masih dapat digunakan untuk ukuran data yang kurang dari 10000.
Chen dan Wei (2005) mengemukakan tahapan dalam metode simpleks
sebagai berikut:
Misalkan
,
dan
adalah matriks peubah prediktor
dengan
berukuran
adalah vektor parameter berukuran
,
dan
bagian yang tidak negatif dari . Untuk kasus regresi median,
pendekatan simpleks menyelesaikan masalah pada persamaan (20). Dapat
dengan adalah vektor
diselesaikan dengan
saatu berukuran
Misalkan
dan
dengan
Perumusan ulang dari masalah
dengan kendala
,
Masalah ini
model linier baku yaitu
memiliki bentuk ganda yaitu
dengan kendala
dapat
Jika
maka
disederhanakan menjadi
rumusan menjadi
Untuk regresi kuantil, masalah minimasi
dan analog dengan tahapan sebelumnya, rumusan
adalah
masalah menjadi
Pengujian parameter untuk setiap kuantil menggunakan uji dengan
hipotesis sebagai berikut:

dengan

. Statistik uji dapat dinyatakan pada persamaan (11):
(11)

dengan

adalah parameter

simpangan baku dari parameter
.

ke-

pada kuantil ke- dan

adalah

pada kuantil ke- . Kriteria Tolak

apabila

Regresi Kuantil Polinomial
Regresi kuantil polinomial merupakan regresi kuantil dengan bentuk
hubungan fungsional antara peubah prediktor dan respon dimodelkan dengan
berderajat . Hal ini digunakan untuk mengatasi hubungan peubah respon dengan
prediktor yang bersifat polinomial. Bentuk umum model regresi kuantil
dapat disajikan pada persamaan (12) yang
polinomial derajat dengan
merupakan pengembangan dari persamaan (7):
(12)

6
dengan

adalah vektor koefisien polinomial berukuran
adalah matriks peubah prediktor berukuran
adalah vektor galat berukuran
dan
Spline

Spline adalah potongan polinomial yang kontinu, sehingga dapat
menggambarkan karakteristik lokal pada data (Eubank 1988). Titik perpaduan
bersama dimana terdapat perubahan pola perilaku pada interval yang berbeda
disebut dengan titik simpul (knot). Jumlah titik simpul yang digunakan perlu
ditetapkan terlebih dahulu dengan mencoba semua kombinasi jumlah titik simpul
yang mungkin ditentukan secara manual. Secara umum fungsi spline derajat
dapat disajikan pada persamaan (13):
(13)
dengan
:
Vektor koefisien spline dengan
adalah bilangan bulat positif
: Basis fungsi pangkat terpotong (FPT)
berderajat
: Titik simpul spline ke .
Bentuk fungsi spline berderajat 1 (linier), 2 (kuadratik) dan 3 (kubik)
beruturut-turut dapat disajikan pada persamaan (14), (15) dan (16):
(14)
(15)
(16)
Adapun bentuk fungsi spline berderajat linier dengan jumlah titik simpul satu dari
persamaan (14) dapat dibentuk menjadi persamaan (17):
(17)
Fungsi pada persamaan (17) dapat dibentuk menjadi persamaan (18). Kemudian,
ilustrasi grafik fungsi
dapat disajikan pada Gambar 3.
(18)

Gambar 3

Fungsi spline berderajat linier dengan jumlah titik simpul satu

Pendugaan parameter diperoleh dengan meminimumkan fungsi jumlah
kuadrat terpenalti (penalized least square) dapat disajikan pada persamaan (19):
(19)
a

b

7
dengan a merupakan jumlah kuadrat sisaan atau fungsi jarak antara data dan
dugaan, b merupakan penalti kekasaran (ukuran kemulusan kurva dalam
memetakan data), dan
adalah parameter pemulus. Minimisasi pada nilai
tertentu akan memberikan kebaikan pengepasan dengan kemulusan kurva. Nilai
yang besar akan memberikan bobot penalti (kemulusan) yang besar dan
mempunyai ragam yang kecil. Penduga pemulus linier dapat disajikan pada
persamaan (20):
(20)
dengan adalah matriks penalti yang mempunyai struktur spesifik yang dapat
disajikan pada persamaan (21):
(21)
adalah matriks triagonal atas (upper tridiagonal) yang dapat disajikan
pada persamaan (22):
h1 1
h1 1 h2 1
h2 1
0
0

1
1
1
1
0
h2
h2 h3
h3

0
(22)






0


hn 1 2
hn 1 2 hn 11 hn 11
adalah matriks tridiagonal simetris (symmetric tridiagonal) yang
dan
dapat disajikan pada persamaan (23):
2 h1 h2
h2

0
2 h2 h3


2
(23)



hn 2
0

hn 2 2 hn 2 hn 1
Pemilihan penduga pemulus optimal dapat ditentukan dari rataan kuadrat
sisaan (mean square error/MSE) dapat disajikan pada persamaan (24):
(24)
Metode pemilihan parameter pemulus lainnya adalah menggunakan metode
validasi silang terampat (generalized cross validation/GCV) yang dapat disajikan
pada persamaan (25):
(25)
dengan
dan adalah matriks identitas. Derajat bebas efektif
yang diperoleh dari fungsi pemulus yang dapat disajikan pada persamaan (26):
(26)
merupakan matriks pemulus dengan
(Eubank 1988).
Regresi Kuantil Spline
Regresi kuantil spline merupakan regresi kuantil dengan bentuk
hubungan fungsional antara peubah prediktor dan respon dimodelkan dengan
spline. Bentuk umum model regresi kuantil spline derajat dengan
dapat disajikan pada persamaan (27) yang merupakan pengembangkan dari
adalah vektor koefisien spline,
persamaan (7).

8
adalah bilangan bulat positif,
berderajat dan
adalah titik simpul spline ke

adalah basis FPT
(Eubank, 1988).
(27)

Regresi dengan Peubah Boneka
Regresi dengan peubah boneka adalah metode statistika yang digunakan
untuk membentuk model hubungan antara peubah respon dengan satu atau lebih
peubah prediktor, dimana satu atau lebih peubah prediktor yang digunakan
bersifat boneka. Peubah boneka adalah peubah yang digunakan untuk
mengkuantitatifkan peubah yang bersifat kualitatif (misalkan: jenis kelamin, ras,
agama, perubahan kebijakan pemerintah, dan lain-lain). Peubah ini sering juga
disebut peubah binari, kategorik atau dikotom. Sebagai contoh, misalkan
perbedaan jenis kelamin (1 = laki-laki, 0 = perempuan), ras (1 = kulit putih,
0 = kulit berwarna), pendidikan (1 = sarjana, 0 = non-sarjana). Bentuk umum
model regresi dengan peubah boneka dapat disajikan pada persamaan (28):
(28)
dengan
adalah vektor peubah respon berukuran
adalah vektor parameter berukuran
adalah matriks peubah prediktor berukuran
adalah
adalah
vektor koefisien peubah boneka berukuran
matriks peubah boneka berukuran
dengan misalkan bernilai 1 jika data
ke-i masuk kategori pertama dan 0 jika data ke-i masuk kategori kedua,

.

3 METODE PENELITIAN
Data
Data yang digunakan dalam penelitian ini adalah data curah hujan di
kabupaten Indramayu sebagai peubah respon sedangkan data GCM-lag
(presipitasi) dari Climate Model Intercomparison Project (CMIP5) sebagai
peubah
prediktor.
Data
GCM-lag
diperoleh
dari
situs
web
http://www.climatexp.knmi.nl/ yang dikeluarkan oleh KNMI Belanda. Data
GCM-lag memberikan hasil pendugaan curah hujan yang lebih baik dan dengan
penambahan peubah boneka mampu memperbaiki hasil dugaan data curah hujan
(Sahriman 2014). Domain yang digunakan berukuran
grid (64 peubah
dan
prediktor) yang terletak pada posisi
di atas wilayah kabupaten Indramayu. Penggunaan ukuran domain
grid di atas wilayah Kabupaten Indramayu memberikan hasil yang lebih
stabil serta tidak sensitif terhadap pencilan (Wigena 2006). Data iklim (data curah
curah hujan dan GCM-lag) merupakan data iklim bulanan dengan panjang data
yang digunakan dari tahun 1979-2008. Dalam penelitian ini data dibagi menjadi
dua bagian, yaitu data pada tahun 1979-2007 untuk pemodelan dan data pada
tahun 2008 untuk prediksi model.

9
Metode Analisis
1.

Eksplorasi data
Tahapan eksplorasi data ini terdiri dari beberapa langkah sebagai berikut:
a.
Deskripsi data curah hujan
Statistika deskripstif sebagai informasi awal untuk melihat keragaman
dari data amatan curah hujan dan menggunakan diagram kotak garis
untuk mengidentifikasi adanya curah hujan ekstrim.
b.
Deskripsi data GCM-lag
Menentukan pergesaran waktu (time lag) pada data GCM dengan
menggunakan fungsi korelasi silang (cross correlation function, CCF)
dengan menggunakan persamaan (29) (Sahriman 2014):
(29)
dengan
adalah korelasi silang antara deret dan pada time
lag ke ,
adalah peragam antara dan pada time lag ke ,
adalah simpangan baku pada peubah prediktor
dan
adalah
simpangan baku pada peubah respon .
i.
Membuat plot masing-masing peubah data GCM-lag.
ii.
Mengidentifikasi multikolinearitas berdasarkan nilai variance
) atau faktor inflasi penyimpangan baku
inflation factor (
kuadrat pada data GCM-lag dengan menggunakan persamaan
(30):
(30)

c.

2.

adalah koefisien determinasi dari peubah prediktor
dengan
KU ke yang diregresikan terhadap peubah prediktor lainnya
,
dan
. Jika nilai
KU ke dengan
maka terdapat indikasi multikolinier.
Analisis komponen utama
Mereduksi dimensi peubah prediktor pada data GCM-lag dengan
menggunakan analisis komponen utama (AKU). Misalkan
pada input data
.
sekumpulan pengamatan , dengan
Adapun langkah-langkahnya sebagai berikut (Sahriman 2014):
i.
Memeriksa kehomogenan ragam peubah data GCM-lag
menggunakan uji Bartlett.
ii.
Menentukan nilai akar ciri dengan menggunakan
.
iii. Menentukan jumlah komponen utama berdasarkan ukuran
keragaman lebih dari 90% dan nilai akar ciri lebih besar dari
.
satu
iv. Menghitung skor komponen utama (KU) dari model
,
dengan adalah vektor ciri.

Penyiapan data
Tahapan penyiapan data ini terdiri dari beberapa langkah sebagai berikut:
Pola hubungan curah hujan dengan komponen utama
Menentukan pola hubungan fungsional antara curah hujan sebagai peubah
respon dengan KU terpilih pada langkah 1.c. Pembuatan plot dilakukan

10
pada berbagai kemungkinan derajat bebas untuk melakukan pengepasan
pola dengan jumlah derajat bebas optimum ditentukan menggunakan
kriteria GCV minimum dengan menggunakan formula pada persamaan (25)
(Rizki 2014).
a.
Membangkitkan basis polinomial pada komponen utama (Rizki 2014).
b.
Membangkitkan basis spline pada komponen utama (Rizki 2014),
yang terdiri dari:
i.
Penentuan jumlah simpul dalam suatu model dapat dilakukan
dengan menggunakan persamaan (31):
(31)
dengan adalah jumlah titik simpul, adalah jumlah derajat
bebas dari pemulus spline, adalah jumlah parameter model,
dan adalah derajat model.
ii.
Penentuan jarak antara titik simpul dapat dilakukan dengan
menggunakan persamaan (32):
(32)
dengan adalah jarak antara titik simpul, adalah jumlah data
amatan dan adalah jumlah titik simpul:
iii. Membangkitkan basis FPT dengan menggunakan persamaan
(33):
(33)

c.

dengan adalah peubah bebas,
adalah titik simpul ke- pada
peubah prediktor, dan adalah derajat tertinggi pada model
spline.
Membangkitkan peubah boneka
Menurut Sahriman (2014), peubah boneka ditentukan berdasarkan plot
antara nilai skor prediktor ( ) dan skor respon ( ) yang dihasilkan dari
komponen utama pada model regresi kuadrat terkecil parsial (RKTP).
Berdasarkan plot tersebut menunjukkan bahwa terdapat 5 kelompok
data curah hujan berdasarkan kelompok warna dominan yang terdiri
dari:
i.
Kelompok 1 umumnya terjadi pada bulan Mei sampai dengan
mm/bulan.
Oktober dengan intensitas
ii.
Kelompok 2 umumnya terjadi pada bulan Maret, April, dan
November dengan intensitas
mm/bulan.
iii. Kelompok 3 umumnya terjadi pada bulan Desember dengan
mm/bulan.
intensitas
iv. Kelompok 4 umumnya terjadi pada bulan Februari dengan
intensitas
mm/bulan.
v.
Kelompok 5 umumnya terjadi pada bulan Januari dengan
intensitas lebih dari
mm/bulan.
Pengelompokan ini berdasarkan pada hasil analisis diskriminan
dengan persentase ketepatan pengelompokan sebesar 94.8%. Data
curah hujan yang masuk sebagai anggota kelompok diberi nilai satu
(1) sedangkan yang tidak masuk sebagai anggota kelompok diberi
nilai nol (0) untuk masing-masing kelompok yang telah terbentuk.
Oleh karena itu, pada akhirnya akan terbentuk empat peubah boneka

11
karena untuk kelompok terakhir merupakan nilai curah hujan yang
bernilai nol pada empat kelompok sebelumnya.
3.

Pemodelan statistical downsaling
Tahapan membangun model ini akan dilakukan dengan beberapa model SD
menggunakan metode regresi kuantil pada kuantil ke 50, 75, 90 dan 95.
Pada kuantil pada ke 50 untuk menggambarkan model di pusat data, pada
kuantil ke 75 untuk menggambarkan model di kuartil ketiga, pada kuantil ke
90 dan 95 untuk menggambarkan model pada nilai ekstrim. Kriteria
kebaikan model yang digunakan yaitu dengan nilai pseudo
dan root
Adapun model yang akan dibangun pada
mean square error
penelitian ini terdiri dari:
a.
Model regresi kuantil polinomial
Peubah prediktor pada model ini dibentuk dari hasil penelitian Rizki
(2014) dengan basis terdiri dari
dan
.
b.
Model regresi kuantil spline
Peubah prediktor pada model ini dibentuk dari hasil penelitian Rizki
(2014) dengan basis terdiri dari

c.

d.

dan
.
Model regresi kuantil polinomial dengan peubah boneka
Peubah prediktor pada model ini dibentuk dari hasil penelitian Rizki
(2014) dengan peubah boneka dari hasil penelitian Sahriman (2014).
Basis pada model ini terdiri dari
dan
Model regresi kuantil spline dengan peubah boneka
Peubah prediktor pada model regresi ini dibentuk dari hasil penelitian
Rizki (2014) dengan peubah boneka dari hasil penelitian Sahriman
(2014). Basispada model ini terdiri dari

dan

.

12
4.

Perbandingan model
Tahapan ini diawali dengan melakukan prediksi terhadap masig-masing
model SD menggunakan kriteria dengan nilai korelasi ( ) menggunakan
dengan
persamaan (38) dan root mean square error of prediction
menggunakan persamaan (39):
(34)

(35)
dengan adalah nilai peubah respon pada data validasi ke , adalah nilai
adalah banyaknya pengamatan.
dugaan pada data validasi ke dan
Selanjutnya, membandingkan model dengan kriteria
dan
.

4 HASIL DAN PEMBAHASAN
Eksplorasi Data
Deskripsi Data Curah Hujan
Deskripsi data curah hujan di Kabupaten Indramayu digunakan sebagai
informasi awal untuk mengetahui karakteristik dan pola curah hujan yang akan
digunakan untuk analisis selanjutnya. Tabel 1 menunjukkan bahwa nilai
simpangan baku tertinggi terdapat pada bulan Januari sebesar 126.30 mm/bulan
sedangkan terendah terdapat pada bulan Agustus sebesar 16.52 mm/bulan. Nilai
simpangan baku tertinggi menunjukkan bahwa curah hujan bulan Januari dari
tahun 1979 sampai dengan 2008 sangat beragam. Hal ini dapat ditunjukkan pada
perbedaan nilai minumum dan maksimum curah hujan yang sangat jauh yaitu
berkisar antara 0-582.60 mm/bulan. Selanjutnya, Koefisien kemiringan untuk
semua bulan dari tahun 1979 sampai dengan 2008 lebih dari nol. Koefisien
kemiringan tertinggi berada pada bulan Juli sebesar 2.01 dan terendah pada bulan
Mei sebesar 0.24. koefisien kemiringan yang lebih dari nol merupakan indikator
bahwa sebaran data pengamatan tidak normal dan menjulur kekanan. Artinya
bahwa nilai rata-rata lebih besar dari median dan modus. Dengan kata lain, bahwa
terdapat curah hujan ekstrim (tinggi) pada data pengamatan. Diagram kotak garis
data curah hujan disajikan pada Gambar 4.
Gambar 4 menunjukkan bahwa pola curah hujan bulanan di Kabupaten
Indramayu merupakan tipe monsun karena memiliki pola yang berbentuk huruf U
atau dengan kata lain memiliki satu puncak musim hujan. Berdasarkan Haryoko
(2004), daerah perkiraan musim (DPM) adalah musim hujan dimulai dari Oktober
sampai dengan Maret sedangkan musim kemarau dimulai dari April sampai
dengan September. Musim penghujan ditandai dengan curah hujan sebesar 150
mm/bulan sedangkan musim kemarau ditandai dengan curah hujan kurang dari
150 mm/bulan (BMKG dalam Pribadi 2012). Adanya pencilan di bulan-bulan
tertentu pada musim hujan mengindikasikan curah hujan ekstrim tinggi sedangkan
musim kemarau mengindikasikan terjadinya curah hujan ekstrim rendah.

13

600

500

Curah Hujan

400

300

200

100

0

Jan

Gambar 4

Feb

Mar

Apr

Mei

Jun Jul
Waktu

Ags

Sep

Okt

Nov

Des

Pola curah hujan di kabupaten Indramayu

Tabel 1

Deskripsi data curah hujan di kabupaten Indramayu tahun 1979-2008
RataSimpangan
Nilai
Nilai
Koefisien
Bulan
Rata
Baku
Minimum
Maksimum Kemiringan
Januari
308.80
126.30
78.70
582.60
0.53
Februari
226.80
106.90
89.80
521.30
1.14
Maret
161.20
57.20
75.70
280.10
0.67
April
141.24
46.49
54.47
245.67
0.31
Mei
86.43
46.09
6.40
185.67
0.24
Juni
62.11
41.24
9.93
166.87
0.75
Juli
30.66
33.55
0.00
153.33
2.01
Agustus
14.62
16.52
0.00
58.20
1.42
September
16.94
21.76
0.00
66.00
1.33
Oktober
63.76
51.07
0.07
165.60
0.34
November
148.20
83.50
17.50
346.20
0.82
21
Desember
0.60
62.40
122.70
402.20
1.36

Curah hujan rendah minimum pada musim kemarau berkisar antara 0
sampai dengan 54.47 mm/bulan sedangkan curah hujan maksimum berkisar 58.2
mm/bulan sampai dengan 245.67 mm/bulan. Curah hujan rendah minimum pada
musim hujan berkisar antara 0.07 sampai dengan 122.7 mm/bulan sedangkan
curah hujan maksimum berkisar 165.6 mm/bulan sampai dengan 582.6 mm/bulan.
Menurut BMKG (2008), indikator intensitas curah hujan dikatakan ekstrim
apabila intensitas curah hujan lebih besar dari 400 mm/bulan. Berdasarkan data
penelitian ini diperoleh 12 intensitas curah hujan ekstrim tinggi. Intensitas curah
hujan ekstrim tinggi terjadi pada bulan Januari yaitu 582.60 mm/bulan (1981),
581.93 mm/bulan (1997), 508.00 mm/bulan (1994), 454.73 mm/bulan (2002),
423.87 mm/bulan (1995), 414.33 mm/bulan (1996), 409.00 mm/bulan (2006),

14
404.33 mm/bulan (1982). Intensitas curah hujan ekstrim tinggi terjadi pada bulan
Februari, yaitu 521.27 mm/bulan (2004), 439.33 mm/bulan (2008), 428.20
mm/bulan (2002), dan intensitas curah hujan ekstrim tinggi pada bulan Desember
yaitu 402.20 mm/bulan (2008).
Deskripsi Data GCM-Lag
Eksplorasi dilakukan dengan membuat plot masing-masing peubah data
GCM-lag lebih lengkap dapat disajikan pada lampiran 1. Gambar 5 menunjukkan
bahwa plot data GCM-lag untuk grid 1 lag 2 terhadap waktu. Kemudian,
dilakukan identifikasi adanya multikolinieritas yang dapat ditunjukkan dengan
nilai
lebih besar dari 10. Lampiran 2 menunjukkan bahwa nilai
berkisar
antara 5.501 sampai dengan 1220.451. Hal ini mengindikasikan bahwa adanya
multikolinieritas atau hubungan yang kuat antar grid yang saling berdekatan pada
data GCM-lag. Dengan demikian, data GCM-lag tidak bisa digunakan langsung
untuk pemodelan sehingga perlu dilakukan pereduksian dimensi data.

Gambar 5

Plot antara presipitasi data GCM grid 1 lag 2 dengan waktu
(Sumber: Sahriman 2014)

Analisis Komponen Utama
Analisis komponen utama (AKU) dilakukan untuk mereduksi dimensi
atau mengatasi adanya masalah multikolinieritas dalam data. Diawali dengan
pemeriksaan kehomogenan ragam menggunakan uji Bartlett’s atau levene’s,
dengan hipotesis sebagai berikut.
: Ragam data GCM-lag homogen
: Ragam data GCM-lag tidak homogen
Berdasarkan hasil uji kehomogenan ragam pada Lampiran 3 diperoleh bahwa nilai
p < = 0.05 sehingga
ditolak, berarti dapat disimpulkan bahwa data GCM-lag
tidak homogen. Dengan demikian, matriks yang digunakan pada AKU dibentuk
dengan menggunakan matriks korelasi dalam mereduksi dimensi data GCM-lag.
Tabel 2 menunjukkan bahwa jumlah KU yang memiliki akar ciri lebih
besar dari satu adalah sebanyak empat KU. Proporsi kumulatif keragaman KU1
sampai dengan KU4 bernilai 95%. Hal ini menunjukkan bahwa KU tersebut

15
mampu menjelaskan dengan proporsi keragaman total sebesar 95% dari peubah
asal. Dengan demikian, analisis selanjutnya sebagai peubah respon yaitu curah
hujan di kabupaten Indramayu akan dimodelkan dengan empat peubah prediktor
yaitu KU1, KU2, KU3 dan KU4 dimana peubah prediktor merupakan peubah data
GCM-lag yang direduksi dengan menggunakan AKU.
Tabel 2

Nilai akar ciri, proporsi keragaman dan proporsi kumulatif keragaman
analisis komponen utama
Proporsi
Proporsi
Kumulatif
Komponen Utama (KU) Akar Ciri
Keragaman
Keragaman
KU1
53.15
0.83
0.83
KU2
3.80
0.06
0.89
KU3
2.69
0.04
0.93
KU4
1.15
0.02
0.95
KU5
0.66
0.01
0.96
KU64

0

0

1

Penyiapan Data
Pola Hubungan Curah Hujan dengan Komponen Utama
Pengepasan pola hubungan antara curah hujan dengan KU1, KU2, KU3
dan KU4 dapat diketahui dengan membuat plot yang dilakukan dengan berbagai
kemungkinan jumlah derajat bebas. Tabel 3 menunjukkan bahwa semakin banyak
jumlah derajat bebas maka semakin kecil nilai penalti kekasaran ( ). Semakin
kecil nilai maka plot akan tampak semakin kasar. Berdasarkan pada Tabel 3
terlihat bahwa jumlah derajat bebas optimum berdasarkan kriteria GCV minimum
pada masing-masing komponen utama terpilih yaitu KU1, KU2, KU3, dan KU4
secara berturut-turut adalah 18, 11, 9, dan 7. Hal ini sesuai dengan gambar plot
data antara curah hujan dengan KU1, KU2, KU3, dan KU4 pada Lampiran 4
sampai dengan Lampiran 7. Gambar pada lampiran tersebut menunjukkan bahwa
semakin banyak jumlah derajat bebas maka pola plotnya semakin kasar dan
mendekati ke pola data aktual. Plot data dengan GCV minimum digambarkan
dengan garis warna biru sedangkan plot data pada derajat bebas yang dicobakan
digambarkan dengan garis warna merah.
Plot data curah hujan dengan KU terpilih dengan derajat bebas optimum
disajikan pada Gambar 6. Plot data curah hujan dengan KU1 terlihat membentuk
pola yang mendekati pola linear. Plot data curah hujan KU3 terlihat membentuk
pola yang mendekati pola kuadratik. Akan tetapi plot data curah hujan dengan
KU2 dan plot data curah hujan dengan KU4 tidak membentuk pola parametrik
tertentu. Jumlah titik simpul optimum ditentukan melalui penentuan jumlah
derajat bebas optimum berdasarkan kriteria GCV minimum. Selanjutnya, jumlah
titik simpul pada suatu model bergantung pada jumlah parameter dan derajat dari
basis pangkat terpotong model tersebut. Kombinasi titik simpul 14, 8, 7 dan 5
dengan derajat kubik merupakan kombinasi titik simpul terbaik (Rizki 2014).

16
Tabel 3

Gambar 6

Nilai pinalti kekasaran
dan GCV untuk setiap KU pada berbagai
jumlah derajat bebas (Sumber: Rizki 2014)

Plot hubungan fungsional antara curah hujan dan KU yang terpilih
(Sumber: Rizki 2014)

17
Pemodelan Statistical Downscaling
Model Regresi Kuantil Polinomial
dan
serta
Tabel 4 menyajikan nilai-nilai pseudo
Gambar 11 menyajikan ilustrasi dari nilai
dan
pada model regresi
menunjukkan bahwa adanya
kuantil polinomial (RKP). Nilai-nilai pseudo
peningkatan setelah kuantil ke 50 dan memberikan nilai yang hampir sama pada
kuantil ke 75, 90 dan 95 dengan pseudo
pseudo
pseudo
dan pseudo
. Nilai korelasi tidak
menunjukkan perbedaaan yang nyata atau dengan kata lain nilainya hampir sama
dan
pada kuantil ke 50, 75, 90 dan 95 dengan
Nilai
dan
cenderung meningkat dengan bertambahnya
nilai kuantil dengan
dan
serta
dan
. Koefisien-koefisien persamaan
model RKP dapat disajikan pada Lampiran 8.

Gambar 7

Plot prediksi pada model regresi kuantil polinomial untuk kuantil
ke 50, 75, 90 dan 95 pada tahun 2008

Secara umum model RKP pada Gambar 7 dapat memprediksi intensitas
curah hujan dengan baik. Prediksi curah hujan di Kabupaten Indramayu pada
bulan Januari sampai dengan Desember dapat mengikuti pola data aktual dengan
baik. Pada musim kemarau nilai-nilai prediksi untuk kuantil ke 50, 75, 90 dan 95
lebih tinggi dari nilai-nilai aktual dan dapat mengikuti pola dengan baik. Nilai
prediksi curah hujan pada bulan April sampai dengan September pada kuantil 50
berturut-turut sebesar 150.06 mm/bulan, 92.64 mm/bulan, 51.35 mm/bulan, 33.27
mm/bulan, 17.12 mm/bulan, 20.54 mm/bulan.
Musim hujan terutama di bulan Februari merupakan intensitas curah
hujan tertinggi dengan nilai aktual dapat diprediksi dengan baik oleh prediksi pada
kuantil ke 95. Namun, untuk bulan Oktober sampai dengan Januari dan Maret
nilai-nilai prediksi berada lebih tinggi dari nilai-nilai aktual. Nilai prediksi di

18
bulan Februari lebih mendekati nilai aktual. Nilai-nilai prediksi lebih lengkap
dapat disajikan pada Lampiran 10.
Model Regresi Kuantil Spline
Nilai-nilai pseudo ,
, dan
dapat disajikan pada Tabel
4 serta Gambar 11 menyajikan ilustrasi dari nilai
dan
pada model
regresi kuantil spline (RKS). Nilai pseudo
menunjukkan bahwa adanya
peningkatan setelah kuantil ke 50 dan memberikan nilai yang hampir sama pada
pseudo
kuantil ke 75, 90 dan 95 dengan pseudo
pseudo
dan pseudo
. Nilai korelasi tidak
menunjukkan perbedaaan yang nyata atau dengan kata lain nilainya hampir sama
dan
pada kuantil ke 50, 75, 90 dan 95 dengan
. Nilai
dan
cenderung meningkat dengan bertambahnya
nilai kuantil dengan
dan
serta
dan
Koefisien-koefisien persamaan model
RKS dapat disajikan pada Lampiran 9.

Gambar 8

Plot prediksi pada model regresi kuantil spline untuk kuantil ke 50,
75, 90 dan 95 pada tahun 2008

Gambar 8 menunjukkan bahwa model RKS dapat memprediksi intensitas
curah hujan dengan baik. Secara umum pola prediksi curah hujan untuk kuantil ke
50, 75, 90 dan 95 dapat mengikuti pola dengan data aktual dengan baik. Adapun
nilai aktual pada bulan Februari dapat diprediksi dengan baik di atas kuantil ke 95
yang merupakan saat curah hujan tertinggi. Pada musim hujan pada bulan Oktober
sampai dengan Januari dan Maret nilai-nilai prediksi berada lebih tinggi dari nilainilai aktual. Nilai prediksi di bulan Februari juga mendekati nilai aktual.
Musim kemarau nilai-nilai prediksi pada setiap kuantil lebih tinggi dari
nilai-nilai aktual dan dapat mengikuti pola dengan baik. Nilai prediksi curah hujan
pada bulan April sampai dengan September pada kuantil 50 berturut-turut sebesar
153.31 mm/bulan, 85.77 mm/bulan, 60.62 mm/bulan, 32.39 mm/bulan, 11.80

19
mm/bulan, 13.84 mm/bulan. Nilai-nilai prediksi lebih lengkap dapat disajikan
pada Lampiran 11.
Model Regresi Kuantil Polinomial dengan Peubah Boneka
Tabel 4 menyaj