Model Statistical Downscaling dengan Time Lag Data Global Circulation Model untuk Peramalan Curah Hujan

MODEL STATISTICAL DOWNSCALING DENGAN TIME LAG DATA
GLOBAL CIRCULATION MODEL UNTUK PERAMALAN
CURAH HUJAN

SITTI SAHRIMAN

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul Model Statistical
Downscaling dengan Time Lag Data Global Circulation Model untuk Peramalan
Curah Hujan adalah benar karya saya dengan arahan dari komisi pembimbing dan
belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber
informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam
Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.
Bogor, September 2014
Sitti Sahriman
NIM G15212023

RINGKASAN
SITTI SAHRIMAN. Model Statistical Downscaling dengan Time Lag Data
Global Circulation Model untuk Peramalan Curah Hujan. Dibimbing oleh ANIK
DJURAIDAH dan AJI HAMIM WIGENA.
Sebagai negara kepulauan, Indonesia rentan terhadap dampak perubahan
iklim. Perubahan iklim menjadi ancaman serius pada berbagai bidang, khususnya
pada bidang pertanian. Naiknya suhu permukaan bumi menyebabkan terjadinya
perubahan pola musim yang berdampak pada menurunnya produktivitas pertanian.
Curah hujan merupakan unsur iklim dengan keragaman cukup besar di Indonesia.
Oleh karena itu, pendugaan curah hujan memberikan kontribusi positif bagi
bidang pertanian.
Statistical downscaling merupakan model statistik yang digunakan untuk
menduga data curah hujan (berskala lokal) dengan memanfaatkan informasi
global berupa data presipitasi (berskala global) dari luaran global circulation
model climate model intercomparison project (GCM CMIP5). Namun umumnya,

data luaran GCM berdimensi besar sehingga memungkinkan terjadinya
multikolineritas pada data presipitasi. Oleh karena itu, model statistical
downscaling yang dapat mengatasi masalah tersebut adalah regresi kuadrat
terkecil parsial (RKTP) dan regresi komponen utama (RKU).
Umumnya, korelasi antara data curah hujan dengan data presipitasi GCM
harus kuat untuk menjelaskan dengan baik keragaman iklim lokal. Penentuan
pergeseran waktu (time lag) dibutuhkan terhadap data presipitasi GCM untuk
menghasilkan korelasi yang kuat antara kedua peubah. Time lag ditentukan
berdasarkan korelasi silang tertinggi antara data curah hujan dengan data
presipitasi GCM. Korelasi silang dihitung menggunakan fungsi korelasi silang
(CCF). Tujuan dari penelitian ini adalah menentukan time lag data presipitasi
GCM dan membangun model statistical downscaling menggunakan metode
RKTP dan RKU dengan time lag data presipitasi GCM. Data Curah hujan di
Kabupaten Indramayu digunakan sebagai peubah respon dan data presipitasi
GCM digunakan sebagai peubah predictor pada periode 1979-2008. Data periode
1979-2007 digunakan untuk membangun model dan data periode 2008 digunakan
untuk validasi model.
Pemodelan dengan menggunakan metode RKTP pada data GCM-lag (GCM
dengan time lag) memberikan nilai R2 sekitar 71.7% dan nilai RMSE (root mean
square error) sekitar 57.93. Berdasarkan pendugaan data curah hujan periode

2008, model RKTP menghasilkan nilai korelasi sekitar 0.93 dengan nilai root
mean square error of prediction (RMSEP) sekitar 75.26. Selain itu, metode RKTP
menunjukkan 5 kelompok data curah hujan berdasarkan plot antara skor dan
skor . Pengelompokan ini digunakan sebagai peubah boneka dalam model RKU.
Model RKU mampu memberikan R2 berkisar 62%−63% dan nilai RMSE berkisar
66.21−67.14. Nilai korelasi yang dihasilkan berkisar 0.88−0.91 dengan RMSEP
berkisar 71.91 − 77.29. Hal ini berarti bahwa model RKTP lebih baik dalam
menjelaskan keragaman data dibandingkan model RKU. Pola sisaan model RKU
menunjukkan kondisi ragam yang heterogen. Hal ini diatasi dengan mengalikan
pembobot ke dalam model RKU (RKUB). Pembobot ditentukan berdasarkan
keragaman setiap bulan. Pembobot dapat meningkatkan nilai R2 model RKU

sekitar 8.78% dengan nilai RMSE, korelasi, dan RMSEP yang relatif sama dengan
model RKU. Akan tetapi, sisaan model RKUB masih heterogen. Masalah ini
diatasi dengan menambahkan peubah boneka ke dalam model RKU (RKUK).
Hasilnya menunjukkan bahwa model RKU dengan peubah boneka memberikan
nilai R2 (berkisar 92.9%−93.4%) dan korelasi (0.99) yang lebih tinggi daripada
model RKU, RKTP, dan RKUB. Nilai RMSE berkisar 28.06−29.09 dan RMSEP
berkisar 28.48−31.04. Model RKU dengan bobot dan peubah boneka (RKUBK)
memberikan hasil yang sama dengan model RKUK. Penambahan peubah boneka

ke dalam model RKUB mampu meningkatkan nilai R2 sekitar 30.1% dan
menurunkan nilai RMSE sekitar 37.83. Penambahan peubah boneka ke dalam
model RKU maupun RKUB mampu menghasilkan model dengan sisaan yang
lebih homogen. Secara umum, model RKUK menunjukkan performa yang lebih
baik daripada model RKU, RKTP, RKUB, maupun RKUBK. Dengan nilai R2 dan
korelasi yang relatif sama dengan model RKUBK, model RKUK lebih sederhana.
Model RKUK dengan satu komponen merupakan model statistical downscaling
terbaik. Model tersebut memiliki nilai RMSEP (28.48) yang lebih kecil dan nilai
korelasi (0.99) yang tinggi serta ragam sisaan yang lebih homogen daripada model
lainnya. Analisis juga dilakukan terhadap data presipitasi GCM tanpa time lag.
Model statistical downscaling dengan prediktor GCM-lag mempunyai nilai R2
yang lebih tinggi dan RMSEP yang lebih rendah daripada model statistical
downscaling dengan GCM tanpa time lag.
Kata kunci: fungsi korelasi silang, global circulation model, peubah boneka,
regresi kuadrat terkecil parsial, regresi komponen utama, statistical
downscaling

SUMMARY
SITTI SAHRIMAN. Statistical Downscaling Model with Time Lag of Global
Circulation Model to Forecast Rainfall. Supervised by ANIK DJURAIDAH and

AJI HAMIM WIGENA.
As an archipelago country, Indonesia is more vulnerable to the climate
change impacts. Climate change can be a serious threat to many fields, especially
agriculture. Rising temperatures on the earth surface may alter the weather
patterns thus cause declining in agricultural productivity. Rainfall is one of
fundamental element of climate which has large variability. Therefore, the
estimation of rainfall give an essential contribution to the agriculture development.
Statistical downscaling is a statistical model used to estimate rainfall data
(local-scale) by using global information such as the precipitation data (globalscale) from global circulation model climate model intercomparison project
(GCM CMIP5). However, the GCM produces large dimensions of data output that
enables multicollinearity in the precipitation data. Therefore, the statistical
downscaling model which can solve this problem is partial least squares
regression (PLSR) and principal component regression (PCR).
In general, the correlation between rainfall and precipitation data of GCM
should be strong enough to explain the local climate variability. Time shift (time
lag) determination was needed on the GCM precipitation data to produce strong
correlation between these two varibles. Time lag was determined based on the
highest cross-correlation between rainfall and GCM precipitation data. Crosscorrelation was calculated using the cross-correlation function (CCF). The
objectives of the research were to determine the time lag of precipitation GCM
data and build SD model using PCR method with time lag of the GCM

precipitation data. Rainfall data in Indramayu were used as response variable and
the GCM precipitation were used as predictor variables from 1979 to 2008. Data
from 1979 to 2008 were used to construct the model and data period 2008 were
used for model validation.
The modeling using the PLSR method on GCM-lag (GCM with time lag)
gave 71.7% of R2 and 57.93 of RMSE (root mean square error). Based on the
estimation of rainfall data in 2008, the correlation of the PLSR model was 0.93
and the root mean square error of prediction (RMSEP) was 75.26. In addition, the
PLSR method shown 5 groups on the rainfall data based on a score plot between
and scores. This grouping was used as a dummy variable in the PCR model.
PCR model can produce R2 ranged from 62% to 63% and RMSE ranged from
66.21 to 67.14. The resulting correlation ranged from 0.88 to 0.91 and the RMSEP
ranged from 71.91 to 77.29. It means that the PLSR model produced a better
result in explaining the variability of data than the PCR model. The error pattern
in PCR model shown heterogeneous variance. This can be solved by multiplying
weights into the PCR models (PCRW). Weighting was determined by the
variability in every month. Weighting increased the R2 of the PCR models
become 8.78% with RMSE, correlation, and RMSEP were relatively similar to
PCR model. However, these number are still considered as heterogeneous error.
This problem was solved by adding dummy variables in PCR models (PCRD).

The results indicated that the PCR models with dummy variables gave higher R 2

(ranged from 92.9% to 93.4%) and correlation (0.99) than PCR, PLSR, and
PCRW models. The RMSE ranged from 28.06 to 29.09 and RMSEP ranged from
28.48 to 31.04. The PCR models with weights and dummy variables (PCRWD)
gave similar results to PCRD. The addition of dummy variables in the PCRW
models can increase the R2 into 30.1% and decrease the RMSE become 37.83. The
addition of dummy variables in the PCR and PCRW models produced a model
with more homogeneous error. Generally, the PCRD models produce better
performance than PCR, PLSR, PCRW, and PCRWD models. As the R2 and the
correlation were relatively similar with the PCRWD models, PCRD were
considered as simpler models. In this study, the PCRD model with one component
was concluded as the best statistical downscaling model. The model had the
smallest RMSEP (28.48), highest correlation (0.99), and the error variance was
more homogeneous than the other models. Analyses were also conducted on the
GCM precipitation without the time lag. The statistical downscaling model with
lag-GCM predictors had higher R2, correlation, and lower RMSEP than statistical
downscaling with GCM without time lag.
Keywords: cross correlation function, global circulation model, dummy variable,
partial least square regression, principal component regression,

statistical downscaling

© Hak Cipta Milik IPB, Tahun 2014
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan
IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apa pun tanpa izin IPB

MODEL STATISTICAL DOWNSCALING DENGAN TIME LAG DATA
GLOBAL CIRCULATION MODEL UNTUK PERAMALAN CURAH
HUJAN

SITTI SAHRIMAN

Tesis
sebagai salah satu syarat untuk memperoleh gelar

Magister Sains
pada
Program Studi Statistika

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2014

Penguji pada Ujian Tertutup: Dr Ir Muhammad Nur Aidi, MS

Judul Tesis
Nama
NIM

: Model Statistical Downscaling dengan Time Lag Data Global
Circulation Model untuk Peramalan Curah Hujan
: Sitti Sahriman
: G152120231


Disetujui oleh
Komisi Pembimbing

Dr Ir Anik Djuraidah, MS
Ketua

Dr Ir Aji Hamim Wigena, MSc
Anggota

Diketahui oleh

Ketua Program Studi
Statistika Terapan

Dekan Sekolah Pascasarjana

Dr Ir Indahwati, MSi

Dr Ir Dahrul Syah, MScAgr


Tanggal Ujian: 17 Juli 2014

Tanggal Lulus:

PRAKATA
Bismillahirrohmanirrohim.
Puji dan syukur dipanjatkan kehadirat Allah subhanahu wa ta’ala atas
limpahan rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan karya
ilmiah ini. Shalawat serta salam semoga tetap tercurah kepada junjungan kita Nabi
besar Muhammad Shalallahu ‘Alaihi Wassallam beserta keluarga Beliau, para
Shahabat, para tabi’in, tabi’ut tabi’in dan para penerus perjuangan Beliau hingga
akhir zaman. Karya ilmiah ini berjudul “Model Statistical Downscaling dengan
Time Lag Data Global Circulation Global untuk Peramalan Curah Hujan”.
Keberhasilan penulisan karya ilmiah ini tidak lepas dari bantuan,
bimbingan, dan petunjuk dari berbagai pihak. Oleh karena itu, penulis
menyampaikan penghargaan dan ucapan terima kasih yang sebesar-besarnya
khususnya kepada:
1. Ibu Dr Ir Anik Djuraidah, MS selaku pembimbing I dan Bapak Dr Ir Aji
Hamim Wigena, MSc selaku pembimbing II yang dengan penuh kesabaran
telah memberikan bimbingan, arahan, saran dan motivasi kepada penulis
selama penyusunan karya ilmiah ini.
2. Bapak Dr Ir Muhammad Nur Aidi, MS selaku penguji luar komisi yang telah
banyak memberikan kritikan, masukan, dan arahan yang sangat membangun
dalam penyusunan karya ilmiah ini.
3. Seluruh staf pengajar pascasarjana Departemen Statistika IPB yang telah
banyak memberikan ilmu dan arahan selama perkuliahan sampai dengan
penyusunan karya ilmiah ini.
4. Teman-teman statistika angkatan 2012 atas kebersamaan, kekompakannya,
bantuan dan masukannya selama bersama-sama menempuh kuliah.
5. Teman-teman seperjuangan, Wirnancy Julia sari, Sitti Masyitah, dan Ade
Ayu Putrigati yang selalu menemani disaat senang maupun susah, terima
kasih atas perhatian, bantuan dan kerjasama, dan kekompakannya.
6. Tante Sitti Fatima dan Om Madisaeni yang dengan sabar dan ikhlas merawat
penulis, khususnya pada saat penulis beberapa kali mengalami sakit.
7. Kedua orangtua, Ayahanda H La Hamidi dan Ibunda Hj Wa Raeda, yang
telah banyak memberikan dukungan moril, materi, doa, dan kasih sayang
yang tulus kepada penulis.
8. Kakekku tersayang H ABD Salam, kakakku tercinta Sitti Darahlina, adikku
tercinta Sahmudin, dan seluruh keluarga besar atas dukungan semangatnya
serta doa yang tak henti-hentinya dipanjatkan buat penulis.
9. Seluruh pihak yang namanya tidak dapat disebutkan satu per satu, terima
kasih atas bantuannya.
Atas segala bantuan yang diberikan, penulis hanya bisa berdoa dengan
harapan semoga semua kebaikan yang penuh keikhlasan tersebut dicatat sebagai
amal ibadah dan mendapatkan balasan berupa pahala di sisi Allah Subhanahu wa
ta’ala, Aamiin Ya Rabbal Alamin. Penulis menyadari bahwa masih banyak
terdapat kekurangan dalam penulisan karya ilmiah ini. Namun, penulis berharap
karya ilmiah ini dapat bermanfaat bagi berbagai pihak yang membutuhkan.
Wassalam.
Bogor, September 2014
Sitti Sahriman

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

1 PENDAHULUAN
Latar Belakang
Tujuan Penelitian

1
1
2

2 TINJAUAN PUSTAKA
Statistical Downscaling
Regresi Kuadrat Terkecil Parsial
Regresi Komponen Utama

2
2
4
5

3 METODE PENELITIAN
Data
Metode Analisis

9
9
9

4 HASIL DAN PEMBAHASAN
Eksplorasi Data
Time Lag Data Presipitasi GCM
Variance Inflation Factors
Model Statistical Downscaling
Regresi Kuadrat Terkecil Parsial
Regresi Komponen Utama
RKU Terboboti
RKU dengan Peubah Boneka
RKU Terboboti dan Peubah Boneka
Peramalan Data Curah Hujan dan Pemilihan Model Terbaik

11
11
11
11
12
12
14
15
17
18
19

5 SIMPULAN

22

DAFTAR PUSTAKA

22

LAMPIRAN

25

RIWAYAT HIDUP

40

DAFTAR TABEL
1
2
3
4
5
6
7
8

Time lag data presipitasi

Komponen terekstrak pada model RKTP
Nilai akar ciri dan proporsi keragaman 5 KU pada data GCM-lag
Nilai R2 dan RMSE model awal RKU
Nilai R2 dan RMSE model RKUB
Nilai R2 dan RMSE model RKUK
Nilai R2 dan RMSE model RKUBK
Nilai korelasi dan RMSEP setiap model pada data GCM-lag dan GCM

12
13
15
15
16
17
18
20

DAFTAR GAMBAR
Statistical downscaling
Plot skor dan skor
Uji kehomogenan ragam data presipitasi GCM-lag
Plot sisaan model R1KU
Uji kehomogenan ragam kelompok bulan untuk data presipitasi GCM-lag
Plot sisaan model R1KUB
Plot sisaan model R1KUK
Plot sisaan model R4KUBK
Plot nilai curah hujan aktual dan curah hujan dugaan model RKTP dan
RKU periode 2008 dengan data GCM-lag
10 Plot nilai curah hujan aktual dan curah hujan dugaan model RKUB
periode 2008 dengan data GCM-lag
11 Plot nilai curah hujan aktual dan curah hujan dugaan model RKUK
periode 2008 dengan data GCM-lag
12 Plot nilai curah hujan aktual dan curah hujan dugaan model RKUBK
periode 2008 dengan data GCM-lag
1
2
3
4
5
6
7
8
9

3
13
14
15
16
16
17
18
21
21
21
22

DAFTAR LAMPIRAN
1 Tabulasi data curah hujan dan presipitasi GCM
periode 1979-2008
2 Diagram alir analisis data
3 Penentuan time lag data presipitasi , , dan
4 Korelasi antara curah hujan dengan presipitasi GCM dan GCM-lag
5 Nilai variance inflation factors data presipitasi GCM-lag
6 Koefisien regresi model RKU, RKUB, RKUK, dan RKUBK
7 Diagnostik sisaan model awal RKU
8 Uji kesamaan ragam tiap kelompok bulan data curah hujan
9 Diagnostik sisaan model RKUB
10 Diagnostik sisaan model RKUK
11 Diagnostik sisaan model RKUBK
12 Plot nilai curah hujan aktual dan curah hujan dugaan pada periode 2008
dengan data GCM

26
27
28
30
31
32
33
34
35
36
37
38

1

1 PENDAHULUAN
Latar Belakang
Indonesia terletak pada 6°LU − 11°LS dan beriklim tropis dengan curah
hujan tinggi pada setiap tahun. Indonesia juga merupakan negara kepulauan
terbesar di dunia dengan lebih dari 17000 pulau dan 80.000 km garis pantai.
Posisi geografis Indonesia rentan terhadap dampak perubahan iklim. Umumnya
perubahan iklim yang terjadi di Indonesia ditandai dengan adanya perubahan
temperatur rata-rata harian, pola curah hujan, tinggi permukaan laut, dan
variabilitas iklim (misalnya el-nino, la-nina, indian dipole). Perubahan ini
memberi dampak serius terhadap berbagai sektor, misalnya kesehatan, pertanian,
perekonomian (Supangat 2013).
Provinsi Jawa Barat adalah salah satu sentra produksi padi yang
memberikan kontribusi terbesar terhadap produksi beras nasional, yakni sebesar
17.6%. Dinas Pertanian Provinsi Jawa Barat mengharapkan Jawa Barat tetap
menjadi pemasok tertinggi untuk beras nasional. Namun, upaya pemerintah untuk
mempertahankan swasembada beras yang telah dicapai semakin sulit disebabkan
oleh dampak perubahan iklim (Raharjo 2011). Naiknya suhu permukaan bumi
menyebabkan terjadinya perubahan pola musim, yakni musim kemarau lebih
panjang dan musim hujan yang lebih intensif namun lebih pendek, meningkatnya
siklus anomali musim kering dan musim hujan, serta berkurangnya kelembaban
tanah. Hal ini berdampak pada menurunnya produktivitas pertanian. Pada skala
yang ekstrim, perubahan iklim berakibat pada kegagalan panen berkepanjangan
sehingga dapat mengancam ketahanan pangan nasional (Eduzon 2011).
Iklim mempunyai dua unsur utama, yakni suhu dan curah hujan. Indonesia
sebagai daerah tropis mempunyai keragaman suhu yang kecil, sementara
keragaman curah hujan cukup besar. Oleh karena itu, curah hujan merupakan
unsur iklim yang penting untuk diamati terkait dengan dampak perubahan iklim
(Hermawan 2010). Berkaitan dengan iklim di Indonesia, proses pembentukan
hujan di kawasan tropis merupakan proses yang paling sukar disimulasikan.
Hingga saat ini belum ada satu model iklim yang mampu mensimulasikan pola
curah hujan di Indonesia dengan baik. Topografi dan interaksi laut, darat, dan
atmosfir yang sangat kompleks menambah kerumitan simulasi dan prediksi curah
hujan di wilayah Indonesia. Oleh karena itu, model-model iklim resolusi tinggi
perlu dikembangkan dalam skala lokal dengan mempertimbangkan informasi dari
sirkulasi atmosfir global, seperti presipitasi yang dapat diperoleh dari global
circulation model (Notodiputro et al. 2005).
Global circulation model (GCM) adalah suatu model berbasis komputer
yang berorientasi spasial dan temporal. GCM mensimulasi peubah-peubah iklim
global pada setiap grid (berukuran ±2.5° atau ±300 km2) untuk setiap lapisan
atmosfir yang selanjutnya digunakan untuk memprediksi pola-pola iklim dalam
jangka waktu tahunan (Wigena 2006). Namun, informasi dari luaran GCM masih
berskala global dan tidak untuk fenomena skala lokal sehingga sulit untuk
memperoleh langsung informasi berskala lokal dari GCM. Resolusi GCM terlalu
rendah untuk memprediksi iklim lokal yang dipengaruhi oleh sirkulasi atmosfir
dan parameter lokal, seperti topografi dan tataguna lahan. Akan tetapi, statistical
downscaling dapat digunakan untuk memperoleh informasi iklim yang berskala
lokal dari luaran GCM. Statistical downscaling adalah model statistika yang dapat

2
menghubungkan peubah iklim luaran GCM yang berskala global (presipitasi)
dengan peubah iklim yang berskala lokal (curah hujan) (Fernandez 2005).
Data GCM umumnya berdimensi besar dan memiliki korelasi yang tinggi
antar gridnya. Oleh karena itu, metode yang sering digunakan dalam statistical
downscaling adalah regresi komponen utama (RKU) (Notodiputro et al. 2005).
Serupa dengan RKU, regresi kuadrat terkecil parsial (RKTP) juga dapat
digunakan untuk mengatasi korelasi yang tinggi antar peubah prediktor. Metode
ini telah digunakan oleh Bergant dan Kajfez-Bogataj (Wigena 2011). RKU
berdasarkan pada analisis komponen utama (AKU), sedangkan RKTP berdasarkan
pada kuadrat terkecil parsial (KTP). AKU berfokus pada keragaman dalam
peubah prediktor, sedangkan KTP berfokus pada keragaman antara peubah
prediktor dengan peubah respon (Sutikno et al. 2010).
Model statistical dowscaling membutuhkan korelasi yang kuat antara data
GCM dengan curah hujan untuk menjelaskan keragaman iklim lokal dengan baik
(Busuioc et al. 2001). Korelasi yang kuat menghasilkan pola yang sama antara
kedua peubah. Oleh karena itu, terlebih dahulu perlu dilakukan pemeriksaan
kemungkinan adanya pergeseran waktu (time lag) pada data presipitasi GCM
yang dapat mengakibatkan perbedaan pola dengan data curah hujan. Time lag
dapat ditentukan melalui korelasi silang tertinggi antara data curah hujan dengan
data GCM menggunakan fungsi korelasi silang (CCF).
Wigena (2011) menggunakan metode RKTP multi respon untuk statistical
dowscaling pada peramalan curah hujan di kabupaten Indramayu. Estiningtyas
dan Wigena (2011) menggunakan RKU dan RKTP untuk memprediksi curah
hujan pada kondisi el-nino, la-nina, dan normal di kabupaten Indramayu.
Warawati (2013) membandingkan antara metode RKTP, Regresi Kuadrat Terkecil
Terboboti (RKTT), dan RKU dalam peramalan curah hujan di stasiun Sukadana
dengan teknik statistical downscaling berdasarkan data satelit tropical rainfall
measuring mission.
Penelitian sebelumnya belum menentukan time lag data GCM. Oleh karena
itu, penelitian ini menggunakan CCF dalam menentukkan time lag data luaran
GCM. Metode yang digunakan dalam model SD adalah RKTP dan RKU.

Tujuan Penelitian
Tujuan dari penelitian ini adalah untuk:
1. Menentukan time lag data GCM.
2. Memodelkan statistical downscaling menggunakan metode RKTP dan RKU
dengan time lag data presipitasi luaran GCM.

2 TINJAUAN PUSTAKA
Statistical Downscaling
Menurut Zorita dan Storch (1999), GCM adalah salah satu alat yang
penting dalam studi keragaman iklim dan perubahan iklim. Model ini
menggambarkan sejumlah subsistem-subsistem dari iklim di bumi, seperti prosesproses di atmosfir, lautan, daratan, maupun mensimulasi kondisi iklim berskala
global. Meskipun GCM dapat mensimulasi dengan baik perubahan iklim berskala

3
global, GCM tidak dapat melakukan simulasi dengan baik untuk peubah iklim
yang berskala lokal (Huth dan Keysely 2000). Oleh karena itu, GCM tidak dapat
langsung digunakan untuk merepresentasikan keadaan iklim yang berskala lokal
(Zorita dan Storch 1999). Bergant et al. (2002) menyatakan bahwa statistical
downscaling (SD) dapat digunakan untuk mengatasi masalah perbedaan skala
antara peubah prediktor dan peubah respon.
SD merupakan suatu fungsi transfer yang menggambarkan hubungan
fungsional sirkulasi atmosfir global (luaran GCM) dengan unsur-unsur iklim lokal.
Ide dasar dari SD adalah mencari hubungan antara parameter iklim skala global
dengan parameter iklim skala lokal dan menggunakan hubungan ini untuk
proyeksi hasil simulasi GCM pada iklim masa lalu, sekarang, atau masa depan
yang berskala lokal. SD menggunakan model statistik dalam menggambarkan
hubungan antara data pada grid berskala global (prediktor) dengan data pada grid
berskala lokal (respon) untuk menterjemahkan anomali-anomali skala global
menjadi anomali dari beberapa peubah iklim lokal (Zorita dan Storch 1999).
Pendekatan ini mencari informasi skala lokal berdasarkan pada informasi skala
global melalui hubungan fungsional antara kedua skala tersebut. Namun, keadaan
skala lokal tersebut bisa beragam atau adanya regionalisasi untuk kondisi skala
global yang sama. Dengan kata lain, keadaan skala lokalnya bisa beragam untuk
keadaan skala global yang sama.
Persamaan umum SD adalah sebagai berikut (Sailor et al. 2000; Trigo dan
Palutikof 2001 dalam Wigena 2006):
=
(2.1)
dengan �× adalah peubah-peubah iklim lokal (misalnya: curah hujan), �×�
adalah peubah-peubah luaran GCM (misalnya: presipitasi), adalah banyaknya
waktu (misalnya: harian atau bulanan), adalah banyaknya grid domain GCM.
SD diilustrasikan dalam Gambar 1 yang menghubungkan data GCM berskala
global dengan data hasil observasi di permukaan bumi yang berskala lokal.

Gambar 1 Statistical downscaling (Sutikno 2008)
Model SD akan memberikan hasil yang baik jika memenuhi tiga syarat
utama, yakni hubungan antara respon dengan prediktor harus kuat untuk
menjelaskan keragaman iklim lokal dengan baik, peubah prediktor harus
disimulasikan dengan baik oleh GCM, dan hubungan antara respon dengan

4
prediktor tidak berubah dengan adanya perubahan waktu dan tetap sama meskipun
ada perubahan iklim di masa depan (Busuioc et al. 2001). Oleh karena itu,
penentuan time lag pada data presipitasi GCM membantu dalam meningkatkan
keeratan hubungan antara kedua peubah. Selain itu, pemilihan peubah-peubah
prediktor dan penentuan domain (lokasi dan jumlah grid) perlu dilakukan karena
kedua hal tersebut juga merupakan faktor kritis yang dapat mempengaruhi
kestabilan peramalan (Wilby dan Wigley 1997 dalam Wigena 2006). Dengan
demikian, pemilihan peubah prediktor (data GCM) sebaiknya berdasarkan pada
korelasi yang kuat antara peubah tersebut dengan curah hujan (Wigena 2006).
Metode yang umum digunakan dalam pemodelan SD untuk mengatasi
masalah dimensi data atau multikolinieritas antar peubah prediktor adalah RKU
yang berdasarkan AKU. Serupa dengan RKU, metode lain yang sering digunakan
adalah RKTP (Estiningtyas dan Wigena 2011; Huth dan Keysely 2000).

Regresi Kuadrat Terkecil Parsial
RKTP merupakan salah satu metode yang dapat digunakan untuk mengatasi
masalah multikolinearitas pada peubah prediktor. Metode RKTP
mengkombinasikan antara AKU dengan regresi linier. Hal ini dilakukan dengan
tujuan untuk memprediksi suatu gugus peubah respon
berdasarkan gugus
peubah prediktor
(Wigena 2011). Metode RKTP dapat diterapkan pada
pendugaan satu respon maupun multi respon.
Metode RKTP memproyeksikan data ke sejumlah faktor utama dan
kemudian memodelkan faktor-faktor tersebut dengan regresi linier (Djuraidah
2003). Faktor tersebut disebut sebagai skor. Skor dalam RKTP dihitung
berdasarkan kriteria memaksimalkan peragam antara peubah
dan
.
Perhitungan nilai skor dalam RKTP menggunakan metode kuadrat terkecil (MKT)
dan dilakukan secara parsial (Ismah et al. 2009).
Misalkan berukuran × , dengan adalah banyaknya pengamatan dan
adalah banyaknya peubah prediktor, terdiri dari vektor , = , , … , , dan
berukuran × , dengan adalah banyaknya peubah respon, terdiri dari vektor
, = , , … , . Metode RKTP menghasilkan sejumlah komponen baru yang
akan memodelkan terhadap sehingga diperoleh hubungan antara dan .
Komponen-komponen baru tersebut disebut sebagai skor dan dapat dituliskan
sebagai � dengan = , , … , �. Setiap skor � yang dihasilkan saling orthogonal
sehingga RKTP dapat mengatasi masalah multikolinieritas pada peubah prediktor.
Skor merupakan kombinasi linier peubah-peubah asal dengan koefisien
pembobot � . Proses tersebut dapat diformulasikan sebagai (Wold et al. 2001):
,
= , ,…,
� = ∑

=
(2.2)
Skor ( � ) digunakan sebagai prediktor untuk respon dan model dari .
Skor tersebut mempunyai sifat-sifat sebagai berikut:
1. Skor dikalikan dengan loading � sehingga sisaannya
kecil.

= ∑� � � +

= � +
Pada kondisi > , skor ( ) dikalikan dengan pembobot � sehingga
sisaannya ( ) kecil.

= ∑� � � +

=
+
(2.3)

5
2. Skor

adalah prediktor bagi , yakni:

= ∑� � � +

=
+
(2.4)
Sisaan ( ) merupakan simpangan antara respon pengamatan dengan
respon dugaan. Berdasarkan persamaan (2.2) dan persamaan (2.4) dapat dituliskan
sebagai model regresi ganda dengan formula sebagai berikut:
=∑
+
= ∑� � ∑ � +

=
+ =
+
Koefisien model RKTP,
, adalah sebagai berikut:

= ∑� � �

=
Prediksi bagi data pengamatan yang baru dapat diperoleh berdasarkan data dan
matriks koefisien .
Regresi Komponen Utama
Peubah-peubah data GCM umumnya memiliki dimensi yang besar sehingga
memungkinkan adanya multikolinieritas atau korelasi yang tinggi antar grid
GCM. Selain RKTP, metode lain yang dapat digunakan untuk mengatasi masalah
multikolinieritas adalah RKU. Metode RKU diawali dengan AKU untuk
mereduksi dimensi data atau mengatasi multikolinieritas.
AKU adalah suatu prosedur untuk mereduksi dimensi data dengan
mentransformasi peubah-peubah asal yang saling berkorelasi menjadi sekumpulan
peubah baru yang tidak berkorelasi dengan tetap mempertahankan sebanyak
mungkin keragaman data yang mampu dijelaskan. Peubah-peubah baru itu dikenal
sebagai komponen utama (KU) (Johnson dan Wichern 2007).
KU dapat diperoleh dari pasangan nilai akar ciri dan vektor ciri matriks
ragam-peragam atau matriks korelasi. Matrik ragam-peragam dari peubah
digunakan apabila tidak terdapat perbedaan satuan antar peubah prediktor.
Sebaliknya, matriks korelasi dari peubah
digunakan pada saat terdapat
perbedaan satuan antar peubah prediktor. Selain itu, matriks korelasi juga
digunakan jika terdapat keragaman yang besar dalam matriks peubah predictor.
Standardisasi data dilakukan terlebih dahulu jika menggunakan matriks korelasi.
Standardisasi data perlu dilakukan supaya dominansi satu atau lebih peubah
prediktor dalam KU dapat dihindari.
Jika ′ = [ , , … , � ] mempunyai matriks ragam-peragam � dengan nilai
akar ciri � ≥ � ≥ ≥ �� ≥ , maka diperoleh
yang merupakan kombinasi
linier peubah asal (Johnson dan Wichern 2007), yakni:
=�

=�







= �� ′

=

+

=
=

+



+

+

+

+

+

+



+

� �

� �

�� �

(2.5)

KU ( , , … , � ) merupakan kombinasi linear dari peubah asal yang
tidak berkorelasi dan mempunyai ragam maksimum. Syarat membentuk KU agar
mempunyai ragam maksimum adalah dengan memilih vektor ciri, �′ yang terdiri

6
dari � , � , … , �� sedemikian rupa sehingga
( ) = � ′ � � maksimum
dengan fungsi kendala � ′ � = .
 KU pertama adalah kombinasi linear � ′ yang memaksimumkan
� ′

dengan fungsi kendala � � = .
 KU kedua adalah kombinasi linear � ′ yang memaksimumkan
� ′




dengan fungsi kendala � � = dan
� ,�
=� �� = .

 KU ke-j adalah kombinasi linear �
yang memaksimumkan
�′
dengan fungsi kendala � ′ � = dan
(� ′ , � ′ ′ ) = � ′ � � ′ = untuk
′< .
KU mempunyai ragam yang sama dengan nilai akar ciri dari matriks �
sehingga untuk persamaan KU ke-j,
=�′ =
+
+ + � �
(2.6)

mempunyai nilai
( )=� �� =�
= , ,…,


( , ′) = � � � ′ =
≠ = , ,…,
Matriks ragam-peragam dari dapat dituliskan sebagai berikut:


�=[
]

… ��
Dengan demikian, total keragaman peubah asal sama dengan total keragaman
yang dijelaskan oleh KU dan dapat dituliskan sebagai berikut:


+�

+

∑�=

+ �� = � + � +
( )=

� = ∑�=

+ ��

(

)

(2.7)

Jika total keragaman populasi adalah � + � + + �� = � + � + + �� ,
maka kontribusi keragaman relatif yang mampu dijelaskan oleh KU ke-j adalah:


+� + +��

=

+

+ + �

(2.8)

Jika KU yang diambil sebanyak r komponen, dengan < , maka besarnya
keragaman kumulatif untuk r buah KU adalah sebagai berikut:
∑�=


∑ =

×

%

(2.9)

Selain menggunakan matriks ragam-peragam, KU juga dapat dibentuk
menggunakan matriks korelasi. Matriks korelasi digunakan ketika peubah-peubah
prediktor yang diamati memiliki perbedaan satuan atau memiliki keragaman yang
besar dalam matriks peubah prediktor. Penurunan KU menggunakan matriks
korelasi terlebih dahulu dilakukan dengan mentransformasi peubah asal
menjadi bentuk baku dengan formula sebagai berikut:
=

(� −
√�

)

(2.10)

7
Notasi matriksnya dapat dituliskan sebagai
=(

dengan
/

/

=

=

adalah matriks peubah asal
dituliskan sebagai berikut:

=(

)



−�

(2.11)

√� , √� , … , √��
yang telah dibakukan. Keragaman
/



) �(

/

+

+

)



=�

dapat

(2.12)

dengan � adalah matriks korelasi peubah asal . KU ke-j, yang dibentuk
berdasarkan peubah-peubah yang dibakukan ′ = [ , , … , � ], dapat ditentukan
dari vektor ciri yang diperoleh melalui matriks korelasi peubah asal dengan
formula KU sebagai berikut:
=�



=

+

� �

Proporsi total keragaman yang dapat dijelaskan oleh KU ke-j dari
ragam yang dapat dijelaskan oleh KU ke-j =



adalah:
(2.13)

dengan � adalah nilai akar ciri dari matriks � . Teras matriks korelasi sama
dengan p.
Metode yang digunakan untuk menentukan jumlah KU yang akan
digunakan dalam analisis RKU adalah sebagai berikut (Fekedulegn et al. 2002):
 Membuang komponen yang memiliki nilai akar ciri terkecil. Alasannya adalah
bahwa KU dengan nilai akar ciri terkecil mengandung sedikit informasi.
Dengan menggunakan prosedur ini, KU dieliminasi sampai komponen yang
tersisa menjelaskan beberapa persentase keragaman (yang dipilih sebelumnya)
dari total keragaman (misalnya 80% atau lebih).
 Beberapa peneliti menggunakan aturan memilih KU yang memiliki nilai akar
ciri lebih besar dari satu.
Setelah dilakukan AKU, langkah selanjutnya adalah meregresikan KU yang
terpilih terhadap peubah respon menggunakan RKU. Terdapat dua cara untuk
menentukan KU dalam RKU sehingga terdapat dua bentuk pendugaan koefisien
regresi, yakni berdasarkan matriks ragam-peragam dan matriks korelasi.
Misalkan mariks � adalah matriks ortogonal berisi vektor ciri dari � peubah
asal yang memenuhi persamaan �′ � = ��′ = �. Proses pembentukan RKU
dari regresi linier berganda dengan
= � dan = �′ adalah (Jollife 2002):
=

+�

= � +�

= ��′ + �

8
=

+�

=�

+

(2.14)

yang mengganti peubah prediktor dengan KU pada model regresi. Model RKU
hasil reduksi menjadi r komponen adalah sebagai berikut:




+�

(2.15)

dengan �~� , � � merupakan vektor sisaan berukuran × ,
merupakan
matriks peubah prediktor berukuran × + , merupakan vektor peubah
respon berukuran × , � adalah intersep,
adalah vektor bernilai satu
berukuran × , � adalah matriks KU berukuran × , dan � adalah vektor
berisi koefisien KU berukuran × .
Persamaan RKU yang dibentuk berdasarkan matriks korelasi hampir sama
dengan yang dibentuk berdasarkan matriks ragam-peragam, yakni cukup dengan
mengganti peubah-peubah
, , … , � menjadi peubah-peubah baku
, , … , � . Model RKU yang dibangun berdasarkan matriks korelasi sama
dengan persamaan (2.15) dengan
= �.
Pendugaan koefisien regresi pada RKU menggunakan metode kemungkinan
maksimum dengan koefisien �̂ , �̂ , … , �̂� merupakan penduga bagi koefisien
� , � , … , �� dalam model RKU. Fungsi kepekatan peluang bagi � ~� , �
dapat dirumuskan sebagai berikut:
� =

�√ �





(2.16)



Jika diambil contoh acak sebanyak , maka fungsi kepekatan peluang bersamanya
dapat dirumuskan sebagai,
� , � , … , �� ; � ,

= ∏�=

=



�⁄

�√ �
��




�′ �











(2.17)

dengan fungsi kemungkinan dapat dirumuskan seperti pada persamaan (2.18).

� ln











( ′− ′

′)





( ′ −





|� , � , … , �� = − ln � − ln � −



=

ln





|� , � , … , �� =

=

� �⁄ ��


�⁄

��



�⁄

��



|� , � , … , ��
=−







+



(2.18)

+ ′


̂ =



)







+ ′ ′

9
sehingga diperoleh,
̂=







(2.19)

Hasil yang sama dengan persamaan (2.19) juga dapat diperoleh dengan
menggunakan MKT. Jika ̂ � = [�̂ , �̂ , … , �̂� ] adalah penduga bagi koefisien
RKU dengan r komponen, maka persamaan (2.19) menjadi,
̂� =













(2.20)

dengan � = �� jika menggunakan matriks ragam peragam peubah
dan
=

jika
menggunakan
matriks
korelasi
peubah
.

adalah
matriks



berukuran × yang elemen-elemennya merupakan vektor ciri, dan � , � , … , ��
merupakan vektor ciri yang masing-masing berukuran × .

3 METODE PENELITIAN
Data
Data yang digunakan dalam penelitian ini adalah data presipitasi GCM
climate model intercomparison project (CMIP5) dalam satuan mm/bulan dan data
curah hujan di Kabupaten Indramayu pada periode 1979-2008. Tabulasi data
disajikan dalam Lampiran 1. Data curah hujan yang digunakan dalam penelitian
ini merupakan rata-rata curah hujan pada 15 stasiun di Kabupaten Indramayu
(Bangkir, Bulak, Cidempet, Cikedung, Losarang, Sukadana, Sumurwatu, Tugu,
Ujunggaris, Lohbener, Sudimampir, Juntinyuat, Kedokan Bunder, Krangkeng,
dan Bondan).
Data
GCM
CMIP5 diperoleh dari situs
web
http://www.climatexp.knmi.nl/ yang dikeluarkan oleh KNMI Belanda. Data
presipitasi luaran GCM yang berskala global digunakan sebagai peubah prediktor
dan data curah hujan stasiun di Kabupaten Indramayu digunakan sebagai peubah
respon. Musim hujan di Indonesia terjadi pada bulan Oktober hingga Maret dan
musim kemarau terjadi pada bulan April hingga September.
Domain GCM yang digunakan dalam penelitian ini adalah sejumah grid
berbentuk persegi berukuran 8 × 8 grid (2.5° × 2.5° untuk setiap grid) pada
98.75°BT s.d 116.25°BT dan −16.25°LS s.d 1.25°LU di atas sekitar wilayah
Indramayu. Penggunaan ukuran domain 8 ×8 grid di atas wilayah Indramayu
memberikan hasil yang lebih stabil atau konsisten serta tidak sensitif terhadap data
pencilan (Wigena 2006).

Metode Analisis
Metode analisis yang digunakan dalam penelitian ini adalah RKU dan
RKTP. RKU diawali dengan AKU untuk mereduksi dimensi data presipitasi dan
menghasilkan sejumlah KU. Selanjutnya, sejumlah KU dari hasil AKU digunakan
sebagai peubah prediktor dari data curah hujan. Pereduksian data pada metode
RKTP selain melibatkan data presipitasi juga melibatkan data curah hujan
sehingga diperoleh penduga model.

10
Tahapan analisis yang dilakukan dalam penelitian ini disajikan dalam
bentuk diagram alir pada Lampiran 2 dengan rincian sebagai berikut:
1. Menentukan time lag data GCM menggunakan CCF yang dapat dirumuskan
sebagai berikut:
⁄� �
=
adalah korelasi silang antara deret dan pada time lag ke-l,
dengan
adalah peragam antara dan pada time lag ke-l, � dan � berturutturut adalah simpangan baku deret dan .
2. Membagi data menjadi dua kelompok, yakni data pemodelan (periode 19792007) dan data validasi (periode 2008).
3. Mengidentifikasi multikolinearitas pada data presipitasi menggunakan variance
inflation factors (VIF).
4. Menerapkan teknik SD menggunakan metode RKTP dan RKU.
Algoritma pendugaan parameter RKTP yang digunakan dalam penelitian
ini adalah non-linear iterative partial least squares (NIPALS) dengan tahapan
sebagai berikut (Wold et al. 2001):
a) Mendapatkan nilai vektor awal . Pada umumnya nilai vektor awal
diperoleh dari nilai vektor tunggal , yakni =
dengan
merupakan
vektor peubah respon yang telah diskalakan.
b) Menghitung pembobot − ( ) menggunakan formula = ′ ⁄ ′ dan
mengortonormalkan vektor
dengan formula
= ⁄√ ′ sehingga
‖ ‖= .
merupakan matriks peubah prediktor yang telah diskalakan
c) Menghitung skor− , =
.
d) Menghitung pembobot− , � = ′ ⁄ ′ .
e) Memperbaharui skor− , = �⁄�′�.
f) Menghitung nilai
dan
dengan � = ′ ⁄ ′ merupakan loading
faktor dari peubah prediktor.
=
− �′
=
− �′
g) Melanjutkan ke komponen berikutnya (kembali ke langkah (b)) hingga
validasi silang mengindikasikan tidak ada lagi informasi yang nyata dari
terhadap .
h) Menduga vektor koefisien regresi pada analisis RKTP dengan formula
sebagai berikut:

=
Tahapan analisis metode RKU yang dilakukan dalam penelitian ini adalah
sebagai berikut (Mattjik dan Sumertajaya 2011):
a) Menguji kehomogenan ragam data presipitasi luaran GCM.
b) Jika ragam data presipitasi homogen, maka matriks ragam-peragam peubah
digunakan dalam AKU. Akan tetapi, jika ragam data presipitasi heterogen,
maka peubah prediktor
ditransformasi terlebih dahulu menjadi bentuk
baku . Selanjutnya, matriks ragam-peragam peubah (matriks korelasi
peubah ) digunakan dalam AKU.
c) Menghitung nilai akar ciri � dan vektor ciri � , serta skor KU ( ).
d) Meregresikan dengan
yang terpilih.
e) Mentransformasi persamaan regresi dari
ke
(jika menggunakan
matriks korelasi).
f) Mentransformasi persamaan regresi dari ke .

11
5. Pemeriksaan asumsi kehomogenan ragam sisaan menggunakan plot antara nilai
sisaan dengan curah hujan dugaan. Jika plot sisaan membentuk pola tertentu
maka mengindikasikan terjadi pelanggaran asumsi kehomogenan ragam sisaan.
6. Validasi model pada data periode 2008. Alat validasi model yang digunakan
adalah nilai korelasi dan root mean squared error of prediction (RMSEP).

4 HASIL DAN PEMBAHASAN
Eksplorasi Data
Time Lag Data Presipitasi GCM
Time lag data presipitasi luaran GCM ditentukan berdasarkan nilai korelasi
silang tertinggi antara data presipitasi dengan data curah hujan. Nilai korelasi
tersebut dihitung dengan menggunakan CCF. Berdasarkan Lampiran 3(a), plot
curah hujan di Kabupaten Indramayu menunjukkan bahwa curah hujan tertinggi
rata-rata terjadi pada bulan Januari dan Februari. Serupa dengan Lampiran 3(a),
plot presipitasi
juga menunjukkan presipitasi tertinggi rata-rata terjadi pada
bulan Januari dan Februari (Lampiran 3(f)). Hal ini berarti bahwa tidak terjadi
pergeseran waktu pada data presipitasi . Sebaliknya, terjadi pergeseran waktu
pada data presipitasi
dan
. Lampiran 3(c) dan 3(h) menunjukkan bahwa
presipitasi tertinggi rata-rata terjadi pada bulan Maret untuk presipitasi
dan
bulan Desember untuk presipitasi
. Hal ini mengakibatkan korelasi yang
rendah antara data curah hujan dengan data presipitasi
dan
. Oleh karena itu,
CCF digunakan untuk menentukan time lag data presipitasi.
Hasil pada Lampiran 3(b), 3(e), dan 3(g) menunjukkan bahwa presipitasi
, , dan
memiliki korelasi silang tertinggi (time lag) dengan curah hujan
berturut-turut pada time lag ke-2, ke-0, dan ke-(-1). Curah hujan bulan Januari
terjadi di bulan Maret pada data presipitasi
dan terjadi di bulan Desember pada
data presipitasi
. Oleh karena itu, data presipitasi
dilakukan penundaan 2
bulan, sedangkan data presipitasi
dilakukan pergeseran 1 bulan ke depan.
Presipitasi
tidak dilakukan penundaan maupun pergeseran karena mempunyai
korelasi silang tertinggi pada time lag ke-0. Pola tebaran data presipitasi
dan
dengan penundaan mengikuti pola curah hujan (Lampiran 3(d) dan 3(i)).
Pergeseran terjauh data presipitasi terjadi pada time lag ke-10. Namun, time lag
data presipitasi umumnya terjadi pada time lag ke-1 (Tabel 1).
Hasil perhitungan pada Lampiran 4 menunjukkan bahwa presipitasi GCM
dengan penundaan mempunyai korelasi yang lebih tinggi daripada presipitasi
GCM tanpa penundaan. Jumlah grid GCM dengan penundaan (GCM-lag) yang
memiliki korelasi lebih dari 0.7 dengan data curah hujan adalah sebanyak 73%.
Sementara itu, korelasi antara data curah hujan dengan data presipitasi tanpa
penundaan (GCM) yang lebih dari 0.7 hanya mencapai 9%.
Variance Inflation Factors
Multikolinieritas ditandai dengan adanya korelasi yang kuat antar peubah
prediktor dan nilai VIF yang besar. Hasil perhitungan pada Lampiran 5
menunjukkan bahwa data presipitasi GCM-lag memiliki nilai VIF berkisar
5.56−1252.11. Hal ini mengindikasikan adanya multikolinieritas atau hubungan
yang kuat antar grid data GCM-lag yang saling berdekatan.

12
Tabel 1 Time lag data presipitasi
Grid Time
GCM lag
2
2
2
2
1
0
-1
10
2
2
2
1
1
0
-1
10

Grid Time
GCM lag
2
2
2
1
1
0
-1
10
2
2
2
1
1
0
-1
10



Grid Time
GCM lag
2
2
1
1
1
0
-1
10
2
2
1
1
1
0
0
-1

Grid Time
GCM lag
2
1
1
1
1
1
1
1
1
1
1
1
1
1
0
10

Model Statistical Downscaling
Regresi Kuadrat Terkecil Parsial
RKTP merupakan salah satu pendekatan dalam model SD untuk mengatasi
masalah multikolinearitas pada data luaran GCM. Metode RKTP menghasilkan
sejumlah komponen baru yang memodelkan terhadap . Jumlah komponen
yang digunakan dalam RKTP ditentukan berdasarkan nilai statistik prediction
residual sum of squares (PRESS). PRESS merupakan suatu pendekatan yang
dipertimbangkan untuk prosedur kestabilan penduga koefisien regresi. Nilai
PRESS yang minimum memberikan kestabilan pendugaan yang lebih tinggi
terhadap model jika ada data baru. Berdasarkan Tabel 2, nilai PRESS
memperlihatkan bahwa cukup menggunakan satu komponen dalam model RKTP
meskipun terdapat dua komponen yang memiliki nilai akar rataan PRESS terkecil
(komponen yang memiliki nilai peluang>0.05). Satu komponen terekstrak dapat
menjelaskan sebesar 83.1% keragaman data presipitasi GCM-lag dan sebesar
62.1% keragaman data curah hujan (Gambar 2). Hasil perhitungan menunjukkan
bahwa metode RKTP dengan nilai R2 sebesar 71.7% cukup baik dalam
menjelaskan keragaman data dengan nilai root mean square error (RMSE) yang
dihasilkan sebesar 57.93.
Metode RKTP menghasilkan beberapa keluaran berupa plot antara nilai skor
dan skor . Gambar 2 merupakan plot antara skor dan skor yang dihasilkan
dari komponen pertama. Gambar 2 memberikan informasi bahwa amatan dengan
curah hujan tinggi cenderung lebih beragam dibandingkan dengan amatan dengan
curah hujan rendah. Amatan ke-25 merupakan amatan dengan nilai skor
tertinggi. Hal ini sesuai dengan kondisi sebenarnya, yakni amatan ke-25 adalah

13
amatan dengan curah hujan tertinggi. Amatan ke-25 merupakan curah hujan bulan
Januari 1981 dengan nilai sebesar 582.6 mm/bulan. Gambar 2 juga
menggambarkan kondisi sisaan dari model RKTP. Semakin tinggi nilai skor ,
maka nilai sisaan semakin besar yang mengindikasikan sisaan model RKTP tidak
homogen (membentuk pola divergen).
Gambar 2 menunjukkan 5 kelompok data curah hujan berdasarkan
kelompok warna dominan pada data curah hujan yang bersesuaian dengan nilai
skor . Kelompok 1 umumnya terjadi pada bulan Mei hingga Oktober dengan
intensitas 0−110.53 mm/bulan, kelompok 2 umumnya terjadi pada bulan Maret,
April, dan November dengan intensitas 110.54−235.07 mm/bulan, kelompok 3
umumnya terjadi pada bulan Desember dengan intensitas 235.08 − 353.73
mm/bulan, kelompok 4 umumnya terjadi pada bulan Februari dengan intensitas
353.74−454.73 mm/bulan, dan kelompok 5 umumnya terjadi pada bulan Januari
dengan intensitas lebih dari 454.73 mm/bulan. Pengelompokan ini dilakukan
secara subjektif dengan mempertimbangkan warna dominan yang terbentuk. Jika
menggunakan analisis diskriminan, maka diperoleh persentase ketepatan
pengelompokan sebesar 94.8%.
Tabel 2 Komponen terekstrak pada model RKTP
Jumlah komponen
terekstrak
0
1
2
3

Akar rataan PRESS

Gambar 2 Plot skor

Peluang > PRESS

1.02
0.63
0.63
0.64

dan skor