Pemodelan Statistical Downscaling dengan Regresi Kuantil Komponen Utama Fungsional untuk Prediksi Curah Hujan Ekstrim

i

PEMODELAN STATISTICAL DOWNSCALING DENGAN REGRESI
KUANTIL KOMPONEN UTAMA FUNGSIONAL UNTUK
PREDIKSI CURAH HUJAN EKSTRIM

WIRNANCY JULIA SARI

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015

ii

PERNYATAAN MENGENAI TESIS
DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul Pemodelan Statistical
Downscaling dengan Regresi Kuantil Komponen Utama Fungsional untuk Prediksi
Curah Hujan Ekstrim adalah benar karya saya dengan arahan dari komisi pembimbing
dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber

informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar
Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Januari 2015
Wirnancy Julia Sari
NRP G152120151

* Pelimpahan hak cipta atas karya tulis dari penelitian kerja sama dengan pihak luar IPB harus
didasarkan pada perjanjian kerja sama yang terkait

iii

RINGKASAN
WIRNANCY JULIA SARI. Pemodelan Statistical Downscaling dengan Regresi
Kuantil Komponen Utama Fungsional untuk Prediksi Curah Hujan Ekstrim. Dibimbing
oleh AJI HAMIM WIGENA dan ANIK DJURAIDAH.
Informasi curah hujan ekstrim merupakan salah satu kajian penting dalam bidang
pertanian untuk mengantisipasi kemungkinan terjadinya banjir dan kegagalan panen.

Informasi ini dapat diprediksi dengan menggunakan model statistical downscaling (SD)
yang merupakan hubungan fungsional peubah skala lokal sebagai peubah respon
dengan peubah skala global sebagai peubah penjelas. Dalam penelitian ini, data curah
hujan bulanan kabupaten Indramayu digunakan sebagai peubah respon sedangkan data
luaran GCM yang terletak pada 1.250 LU-16.250 LS digunakan sebagai peubah penjelas.
Periode data yang digunakan baik data curah hujan bulanan kabupaten Indramayu
maupun data luaran GCM adalah 30 tahun (1979-2008).
Data luaran GCM umumnya berdimensi besar dan mengandung multikolinieritas.
Kedua permasalahan ini diatasi dengan menggunakan analisis komponen utama
fungsional (AKUF). Metode ini merupakan pengembangan analisis komponen utama
(AKU) dengan pendekatan fungsional. Sebelum direduksi dengan mengunakan AKUF,
data terlebih dahulu ditransformasi dengan menggunakan transformasi deret fourier.
Pola data luaran GCM sebelum dan sesudah transformasi serupa hanya saja pola data
setelah tansformasi lebih halus dibanding sebelumnya. Data hasil transformasi tidak
mengabaikan masalah otokorelasi.
Pemilihan jumlah komponen ditentukan berdasarkan proporsi keragaman
kumulatif. Hasil penelitian menunjukkan bahwa pada tingkat keragaman 98%, jumlah
komponen dengan AKU adalah 4 komponen sedangkan AKUF adalah 2 komponen.
Pemodelah SD dengan regresi kuantil menunjukkan bahwa pada kuantil ke-90, dan ke95 pada bulan Januari hingga Desember 2008, pola prediksi curah hujan menggunakan
AKU dan AKUF mirip dengan curah hujan aktual. Model SD dengan prediktor KUF

memberikan prediksi curah hujan yang lebih akurat dan konsisten dibandingkan
menggunakan KU khususnya untuk bulan basah yang terjadi pada Oktober-Maret. Pada
kuantil ke-90 dan ke-95, RMSEP model SD dengan KUF adalah 100.45 dan 124.69,
sedangkan RMSEP model SD dengan KU adalah 104.80 dan 145.83.
Hasil penelitian menunjukkan bahwa model SD dengan prediktor KUF sangat
baik digunakan khususnya untuk prediksi curah hujan ekstrim. Pada bulan Februari
2008 sebagai titik ekstrim, model SD regresi kuantil dengan KUF dapat memprediksi
nilai aktual (439 mm/bulan) dengan lebih tepat dibanding dengan menggunakan KU.
Prediksi model SD dengan KUF adalah 460 mm/bulan sedangkan prediksi model SD
dengan KU adalah 512 mm/bulan (Overestimate).
Kata kunci : Analisis Komponen Utama Fungsional, Ekstrim, Regresi Kuantil,
Statistical Downscaling

iv

SUMMARY
WIRNANCY JULIA SARI. Modelling of Statistical Downscaling using Functional
Principal Component Analysis to Predict Extreme Rainfall. Supervised by AJI HAMIM
WIGENA and ANIK DJURAIDAH.
Information about extreme rainfall is one of the important studies in agriculture to

anticipate the possibility of flood and crop failure. This information can be predicted
using statistical downscaling (SD) model that is the functional relationship between
local scale variable as respon variable and global scale variable as predictor. In this
research, monthly rainfall data of Indramayu district used as respon variable and GCM
output data which is located at 1.250 S -16.250 E (latitude) as predictors. Both of rainfall
dataof Indramayu and GCM output data cover the period of 30 years (1979-2008).
GCM output data are generally high dimension and contain of multicollinearity.
Both of these problems be solved using functional principal component analysis
(FPCA). This method is the development of principal component analysis (PCA) with
functional approach. Before reduced with FPCA, GCM output data firstly transformed
using Fourier transformation. The patterns of GCM output data before and after
transformation are similar but the patterns after transformation are smoother than
before. The transformed data do not ignore autocorrelation in time series data.
Number of components is determined based on cumulative variances. The results
show that at 98% cumulative variance proportion the number of components with PCA
is 4 components while the number of components with FPCA is 2 components.
Modelling of SD with quantile regression show that at 90th quantile and at 95th quantile,
from January to Desember 2008, the patterns of predicted rainfall using PCA and FPCA
are similar to the actual rainfall but using FPCs gives the estimate rainfall more accurate
and consistent than using PCs especially in rainy season on October-March. At 90th

quantile and 95th quantile, RMSEP values of SD model using FPCS are 100.45 and
124.69 while RMSEP values of SD model using PCs are 104.80 and 145.83.
The results show that the SD model with FPCs as predictor are very good to used
especially to predict the extreme rainfall. In February 2008 which indicates the extreme
event, SD model with quantile regression using FPCs can predict the actual rainfall (439
mm/month) more precise than using PCs. The prediction of SD model using FPCs is
460 mm/month while the prediction of SD model using PCs is 512 mm/month
(Overestimate).
Key words: Extreme, Functional Principal Component Analysis, Quantile Regression,
Statistical Downscaling

v

© Hak Cipta Milik IPB, Tahun 2015
Hak Cipta Dilindungi Undang-Undang

Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau
menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian,
penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu
masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB

Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apa pun tanpa izin IPB

vi

PEMODELAN STATISTICAL DOWNSCALING DENGAN REGRESI
KUANTIL KOMPONEN UTAMA FUNGSIONAL UNTUK
PREDIKSI CURAH HUJAN EKSTRIM

WIRNANCY JULIA SARI

Tesis
Sebagai salah satu syarat untuk memperoleh gelar
Magister Sains
pada
Program Studi Statistika Terapan

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR

2015

vii

Penguji Luar Komisi pada Ujian Tesis: Dr Ir Hari Wijayanto, MSi

viii

Judul Tesis : Pemodelan Statistical Downscaling dengan Regresi Kuantil Komponen
Utama Fungsional untuk Prediksi Curah Hujan Ekstrim
Nama
: Wirnancy Julia Sari
NRP
: G152120151

Disetujui oleh
Komisi Pembimbing

Dr Ir Aji Hamim Wigena, MSc
Ketua


Dr Ir Anik Djuraidah, MS
Anggota

Diketahui oleh

Ketua Program Studi
Statistika Terapan

Dekan Sekolah Pascasarjana

Dr Ir Indahwati, MSi

Dr Ir Dahrul Syah, MScAgr

Tanggal Ujian :15 Desember 2014

Tanggal Lulus :

ix


PRAKATA
Puji dan Syukur penulis panjatkan kepada Tuhan yang Maha Kuasa karena atas
segala karunia dan berkatNya yang melimpah karya ilmiah yang berjudul “Pemodelan
Statistical Downscaling dengan Regresi Kuantil Komponen Utama Fungsional untuk
Prediksi Curah Hujan Ekstrim” ini dapat diselesaikan dengan baik.
Terima kasih penulis sampaikan kepada
1. Bapak Dr. Ir. Aji Hamim Wigena, M.Sc selaku pembimbing I dan Ibu Dr.Ir.
Anik Djuraidah, MS selaku pembimbing II yang telah membimbing penulis
dalam menyusun karya ilmiah ini.
2. Bapak Dr. Ir. Hari Wijayanto, M.Si selaku penguji luar komisi pada ujian tesis.
3. Kedua orangtua penulis, Bapak Semuel Sanda Toding dan Ibu Rosdiana
Mempun serta adik-adik (Warniancy Ariesty, S.E; Wasthy Novantri; Amsal
Anugrah; & Cherish Gracia Qwyneisha) yang selalu memberi dukungan dan
doa.
4. Kakak Nataniel Denda Silamba, S.T; teman-teman Statistika 2011 dan 2012;
tim work Downscaling dan seluruh staf Program Studi Statistika (Bapak
Heriawan dan Bapak Suherman) yang telah banyak membantu penulis selama
penyusunan karya ilmiah ini.
Penulis menyadari bahwa terdapat banyak kekurangan dalam penulisan karya

ilmiah ini. Oleh karena itu, penulis mengharap kritik dan saran yang dapat membangun
penulisan karya ilmiah selanjutnya.
Semoga karya ilmiah ini bermanfaat.

Bogor, Januari 2015
Wirnancy Julia Sari

x

DAFTAR ISI

DAFTAR TABEL
DAFTAR GAMBAR
DAFTAR LAMPIRAN
1 PENDAHULUAN
Latar Belakang
Tujuan Penelitian
2 TINJAUAN PUSTAKA
Global Circulation Model (GCM) dan Statistical Downscaling (SD)
Analisis Data Fungsional

Analisis Komponen Utama Fungsional (AKUF)
Regresi Kuantil
3 METODE PENELITIAN
Data
Prosedur Analisis Data
4 PEMBAHASAN
Deskripsi Data Curah Hujan
Reduksi Dimensi
Regresi Kuantil
Prediksi
Validasi
Konsistensi Model
5 SIMPULAN DAN SARAN
Simpulan
Saran
DAFTAR PUSTAKA
LAMPIRAN

ix
ix
ix
1
1
2
2
2
3
4
7
9
9
9
12
12
14
16
18
20
20
21
21
22
22
24

xi

DAFTAR TABEL

1
2
3
4
5
6

Perbedaan antara AKU dan AKUF
Statistika Deskriptif Curah Hujan Bulanan Indramayu
Proporsi Keragaman Komponen Utama (KU)
Proporsi Keragaman Komponen Utama Fungsional (KUF)
Perbandingan Regresi Kuantil dengan AKU dan AKUF
Nilai Korelasi Model SD untuk Prediksi Curah Hujan Satu Tahun

5
13
14
16
18
21

DAFTAR GAMBAR
1
2
3
4
5
6
7

Ilustrasi Downscaling
Diagram Alir Penelitian
Diagram Kotak Garis Curah Hujan Bulanan
Plot Data Fungsional sebelum Transformasi
Penentuan Basis AKUF berdasarkan RMSEP
Plot Data Fungsional GCM Setelah Transformasi
Prediksi Curah Hujan Bulanan Tahun 2008 pada Kuantil ke-75, ke-90
dan ke-95 dengan menggunakan KU sebagai Prediktor
8 Prediksi Curah Hujan Bulanan Tahun 2008 pada Kuantil ke-75, ke-90
dan ke-95 dengan menggunakan KUF sebagai Prediktor
9a Validasi RMSEP Model kuantil Komponen Utama berdasarkan Banyaknya
Data Prediksi
9b Validasi RMSEP Model kuantil Komponen Utama Fungsional
berdasarkan Banyaknya Data Prediksi

2
11
12
14
15
15
18
19
20
20

DAFTAR LAMPIRAN
1 Nilai VIF tiap Peubah GCM (Grid)
2 Uji Kehomogonen Ragam Data GCM
3 Plot Data GCM setelah Ditransformasi (berdasarkan Waktu)
4 Proporsi Keragaman Basis
5 Diagram Pencar KU vs Indramayu
6 Diagram Pencar KUF Basis m=13 vs Indramayu
7 Regresi Kuantil dengan KU
8 Regresi Kuantil dengan KUF
9a Uji Signifikansi Regresi Kuantil dengan AKU
9b Uji Signifikansi Regresi Kuantil dengan AKUF
10a Prediksi Regresi Kuantil dengan 4 KU
10b Prediksi Regresi Kuantil dengan 2 KUF
11 Validasi Model (RMSEP dan r)

25
25
26
27
28
28
29
31
33
33
34
34
35

1

1 PENDAHULUAN
Latar Belakang
Indonesia termasuk negara agraris dan pengembangan sektor pertaniannya
terpusat di pulau Jawa mencakup Indramayu sebagai daerah sentra pertanian.
Kabupaten Indramayu menyumbang sekitar 43% dari total PDRB-nya (Produk
Domestik Regional Bruto). Sumarni dan Susanti (2009 dalam Juaeni 2010)
menyebutkan bahwa terjadi pergeseran waktu tanam di 5-11% dari luas wilayah
sentra pangan di pulau Jawa pada tahun 2008 yang disebabkan oleh perubahan
pola dan intensitas curah hujan terutama curah hujan yang terlalu tinggi (ekstrim).
Intensitas curah hujan dikatakan ekstrim bila intensitas curah hujan lebih besar
dari 400mm/bulan (BMG 2008). Intensitas curah hujan yang terlalu tinggi
mengakibatkan sawah terlalu basah bahkan menggenangi air sawah dalam waktu
yang cukup lama. Keadaan ini beresiko terhadap peluang besar terjadinya
kegagalan panen. Oleh karena itu, informasi mengenai intensitas curah hujan
menjadi kajian penting sebagai penunjang keberhasilan panen khususnya di
daerah yang merupakan sentra pertanian.
Informasi tentang curah hujan dapat diperoleh dengan teknik downscaling
yang merupakan suatu proses transformasi informasi dari skala besar (global) ke
skala kecil (lokal). Downscaling umumnya menggunakan data GCM (Global
Circulation Model) sebagai peubah skala global. GCM merupakan alat prediksi
utama iklim dan cuaca secara numerik dan sebagai sumber informasi primer untuk
menilai pengaruh perubahan iklim. Salah satu teknik downscaling adalah
statistical downscaling (SD) yang bersifat statik. Data peubah grid-grid berskala
besar dalam periode dan jangka waktu tertentu digunakan sebagai dasar untuk
menentukan data pada grid berskala lebih kecil (Wigena 2006).
Data luaran GCM umumnya berdimensi besar dan mengandung
multikolinieritas. Pada umumnya, metode reduksi dimensi pada model SD
menggunakan analisis komponen utama (AKU). Namun teknik reduksi dimensi
tidak efektif bila data lebih sparse dan banyak noise (Ramsay & Silverman 2005).
Masalah ini dapat diselesaikan dengan analisis komponen utama fungsional
(AKUF) yang serupa dengan AKU, hanya saja berbeda dalam perlakuan datanya.
AKU menganalisis data diskrit atau data non-fungsional sedangkan AKUF
menganalisis data fungsional dalam prosesnya. Sebelum data direduksi dengan
AKUF, terlebih dahulu data ditransformasi menggunakan transformasi deret
Fourier yang membuat data menjadi lebih halus dan mereduksi noise. Kelebihan
data yang ditransformasi dengan deret fourier adalah data hasil transformasi tidak
mengabaikan masalah otokorelasi pada data deret waktu sehingga dapat
menjelaskan keragaman data yang lebih besar (Lestari 2014).
Pola perubahan dan intensitas curah hujan ekstrim dapat dimodelkan dengan
regresi kuantil. Metode ini dapat mengukur efek peubah penjelas tidak hanya di
pusat sebaran data, tetapi juga pada bagian atas atau bawah ekor sebaran. Hal ini
sangat berguna bila nilai ekstrim merupakan permasalahan penting (Djuraidah &
Wigena 2011). Regresi kuantil memberi perkiraan yang lebih akurat dan efisien
pada model non-gaussian (Buhai 2005).

2

2

Pemodelan SD untuk pendugaan kejadian ekstrim telah dilakukan antara lain:
Djuraidah dan Wigena (2011) menggunakan regresi kuantil untuk mengeksplorasi
curah hujan di kabupaten Indramayu pada data yang mengandung pencilan;
Mondiana (2012) melakukan pendugaan curah hujan ekstrim dengan regresi
kuantil menggunakan AKU sebagai metode reduksi dimensi; Lestari (2014)
melakukan pemodelan SD dengan analisis komponen utama fungsional untuk
prediksi curah hujan. Pada penelitian ini, pemodelan SD menggunakan regresi
kuantil dan AKUF.
Tujuan Penelitian

Penelitian ini bertujuan untuk:
1. Mereduksi dimensi data GCM dengan metode AKUF
2. Memodelkan statistical downscaling dengan regresi kuantil untuk
pendugaan curah hujan ekstrim

2 TINJAUAN PUSTAKA
Global Circulation Model (GCM) dan Statistical Downscaling (SD)
Downscaling didefinisikan sebagai upaya menghubungkan antara sirkulasi
peubah skala global (peubah penjelas) dan peubah skala lokal (peubah respon).
GCM (Global Circulation Model) merupakan peubah yang umum digunakan
sebagai peubah skala global. GCM membuat simulasi peubah-peubah iklim global
pada setiap grid (berukuran ±2,5°x2,5° atau ±300 km2) setiap lapisan (layer)
atmosfir, yang selanjutnya digunakan untuk memprediksi pola-pola iklim dalam
jangka waktu tahunan (Wigena 2006).
Downscaling lebih menunjukkan proses perpindahan dari peubah penjelas
ke peubah respon yaitu perpindahan dari skala besar ke skala kecil (regional/titik).
Ilustrasi pada Gambar 1. Sedangkan statistical downscaling (SD) merupakan
upaya mencari informasi skala lokal dari gkala global melalui hubungan inferensi
dengan fungsi acak atau deterministik (Sutikno 2008).

Gambar 1 Ilustrasi downscaling (Sutikno 2008)

3
Model SD adalah suatu fungsi transfer yang menggambarkan hubungan
fungsional sirkulasi atmosfir global (data luaran GCM) dengan unsur-unsur iklim
lokal SD menjelaskan hubungan antara skala global dan lokal dengan lebih
memperhatikan keakuratan model penduga untuk mempelajari dampak perubahan
iklim (Yarnal et al. 2001 dalam Wigena 2006). Pemilihan peubah-peubah penjelas
dan penentuan domain (lokasi dan jumlah grid) merupakan faktor kritis yang akan
mempengaruhi kestabilan prediksi (Wilby & Wigley 2000 dalam Wigena 2006).
Menurut Wilby dan Wigley (1999), asumsi dalam model SD adalah sebagai
berikut: (1) Peubah penjelas adalah peubah yang relevan dan realistis dimodelkan
oleh GCM (disimulasi baik oleh GCM); (2) Hubungan erat antara respon dengan
penjelas yang menjelaskan keragaman iklim lokal dengan baik; (3) hubungan
antara respon dengan penjelas tidak berubah dengan perubahan waktu dan tetap
sama meskipun ada perubahan iklim.
Bentuk umum model SD

=

1

dengan :
= peubah skala lokal
= peubah-peubah sirkulasi atmosfir global

= banyaknya waktu (bulan), t=1,2,…,n
= banyaknya grid domain GCM , = 1,2, … ,

Pada umumnya model SD melibatkan data deret waktu (t) dan data spasial
GCM (g). Kompleksitas model ini terjadi karena X berkorelasi dan pengamatan
peubah y berotokorelasi (Wigena 2006).
Analisis Data Fungsional

Analisis data fungsional (ADF) telah dikenal sejak tahun 1960, namun ADF
banyak digunakan setelah Ramsey dan Dalzel memperkenalkannya lebih dalam
pada tahun 1991. Data fungsional menunjuk pada data yang tiap pengamatannya
berupa kurva. Bila pengukuran yang dilakukan secara kontinu dari waktu ke
waktu, kumpulan titik-titik pengamatan cenderung membentuk kurva(Tran 2008).
Benko (2004) mengatakan bahwa implementasi data fungsional menggunakan
ekspansi basis fungsional. Langkah pertama dalam data fungsional adalah
mengkonversi matriks data non fungsional menjadi data fungsional yang
merupakan kombinasi linier dari basis fungsi. Basis fungsi yang dapat digunakan
dalam ADF adalah basis Fourier, basis polinomial, dan basis B-spline. Basis
polynomial dan basis B-Spline umumnya digunakan untuk data non periodik.
Sementara basis Fourier paling tepat digunakan pada deret waktu yang cukup
panjang dan bersifat periodik. Data fungsional
didefinisikan sebagai
berikut:
2
=
= basis fourier
dengan
=
,…,
Persamaan (2) kemudian dibentuk lagi oleh Wei (2006) menjadi sebuah
persamaan baru (Persamaan 3).

4

4
=∑

51 7
36
%

dengan
=

/
%

,
-

+ .

/0

cos "

#$

%

& + ( sin "

#$

%

& 3

29:
6
cos 8
; , untuk : = 0 dan : = jika 6 genap
6
2

42
6−1
29:
; , untuk : = 1,2, … , F
H
3 7 cos 8
2
6
26 /
%
29:
6−1
2
; , untuk : = 1,2, … F
H
( = 7 sin 8
6
2
6
/

Keterangan :
IJK
: bilangan bulat terbesar yang lebih kecil atau sama dengan u
: Output transformasi fourier
: data awal dalam domain waktu
:
: basis
Analisis Komponen Utama Fungsional

Analisis Komponen Utama (AKU) merupakan salah satu analisis statistik
tertua yang banyak digunakan untuk data peubah ganda. AKU dikenalkan oleh
Karl Pearson(1901) kemudian dikembangkan oleh Hotelling(1933). AKU
mentransformasi peubah-peubah asli yang masih saling berkorelasi satu dengan
yang lain menjadi satu himpunan peubah baru yang tidak berkorelasi lagi yang
disebut dengan komponen utama. Ide utama dari AKU adalah mereduksi dimensi
dari data yang punya banyak peubah yang saling berkorelasi dengan tetap
mempertahankan sebagian besar jumlah ragam data awal (Jolliffe 2002). Jadi
sekalipun data direduksi tapi tidak banyak kehilangan informasi. Tujuan dari
AKU adalah menjelaskan sebanyak mungkin jumlah ragam data asli dengan
sedikit mungkin komponen utama yang disebut faktor (Lindsay 2002)
AKU terfokus pada data non fungsional sehingga pada data sparse dan
banyak noise, AKU belum dapat menjelaskan struktur keragaman data dengan
lebih baik. Dengan menggunakan analisis data fungsional (ADF) yang berbasis
pada proses pemulusan, analisis komponen utama fungsional (AKUF)
menyelesaikan masalah ini dengan membuat data menjadi lebih smooth dan
mereduksi noise. AKUF merupakan perluasan dari AKU klasik untuk analisis
data fungsional (Dauxois et al. 1982 dalam Shang 2011). AKUF memanfaatkan
transformasi deret Fourier dalam proses pemulusan. Kelebihan data yang
ditransformasi dengan deret Fourier adalah data hasil transformasinya tidak
mengabaikan masalah otokorelasi pada data deret waktu sehingga dapat
menjelaskan keragaman data lebih besar (Lestari 2014). Tran (2008) mengatakan
bahwa AKUF dapat menjelaskan struktur keragaman data yang lebih baik
meskipun jumlah pengamatan lebih kecil dari jumlah peubah (n

Ú
-

" ;%Û\Û &

9

3 METODE PENELITIAN
Data
Data yang digunakan dalam penelitian ini adalah data curah hujan bulanan
dari stasiun curah hujan di Indramayu sebagai peubah respon dan data luaran
GCM (data presipitasi) sebagai peubah prediktor. Data curah hujan diperoleh dari
Badan Meteorologi, Klimatologi, dan Geofisika (BMKG) sedangkan data luaran
GCM berupa data presipitasi bulanan Climate Model Intercomparison Project
(CMIP5) diperoleh dari Koninklijk Nederlands Meteorologisch Instituut (KNMI)
yang merupakan badan meterologi Belanda. Data luaran GCM yang digunakan
diunduh dari situs web http://climexp.knmi.nl/start.cgi?id=someone@somewhere
(diakses 28 Desember 2013). Data yang diambil terletak pada 1.25°LU –
16.25°LS dan 98.75°BT – 116.25°BT dengan domain 8×8 grid. Setiap grid
berukuran 2.50x2.50. Jumlah peubah prediktor yang digunakan keseluruhan ada
64 peubah. Adapun panjang data yang digunakan untuk data curah hujan bulanan
Indramayu dan data luaran GCM adalah 360 bulan atau 30 tahun (1979-2008).
Prosedur Analisis Data
Tahapan penelitian ini adalah sebagai berikut:
1. Mengkonversi data GCM dari file netcdf ke excel dengan menggunakan software
R versi 3.0.2. Adapun package yang digunakan adalah RNetCDF.
2. Eksplorasi data dilakukan beberapa tahap yakni :
a. Melakukan analisis deskriptif pada data curah hujan di kabupaten Indramayu
untuk mendeskripsikan data curah hujan kabupaten Indramayu.
b. Eksplorasi pada data curah hujan di kabupaten Indramayu dengan
menggunakan diagram kotak garis untuk mengidentifikasi adanya curah hujan
ekstrim.
c. Mengecek multikolinieritas data dengan meregresikan data GCM untuk
memperoleh nilai VIF. Adapun formula nilai VIF adalah
1
VIF• =
1 − Þx#
#
dengan Þx adalah koefisien determinasi dari peubah penjelas yang diregresikan
terhadap peubah penjelas lainnya. Jika nilai VIF>10 berarti terdapat indikasi
multikolinier sehingga dilakukan reduksi dimensi.
3. Menyelesaikan masalah multikolinieritas pada data GCM dengan
a. Metode AKU dengan langkah-langkah sebagai berikut:
i. Mengecek asumsi kehomogenan ragam data GCM dengan uji Bartlet untuk
penentuan matriks pembentuk komponen utama. Bila data heterogen maka
matriks pembentuk KU adalah matriks korelasi. Bila data homogen maka
matriks pembentuk KU adalah matriks kovarian.Menentukan jumlah
komponen utama yang akan digunakan berdasarkan proporsi keragaman
kumulatif>80% dan akar ciri>1.
ii. Menghitung skor komponen utama.
iii. Membuat plot hubungan antara komponen utama yang terbentuk dan data
respon

11

10

b. Metode AKUF dengan langkah-langkah sebagai berikut:
i. Mentransformasi data GCM dengan menggunakan deret Fourier (sesuai
Persamaan 3).
ii. Menentukan jumlah komponen utama yang akan digunakan berdasarkan
proporsi keragaman kumulatif>80% dan komponen yang memiliki proporsi
keragaman tinggi.
iii. Menghitung skor komponen utama fungsional.
iv. Membuat plot hubungan antara komponen utama fungsional yang terbentuk
dan data respon.
4. Membagi data (data y dan X yang telah direduksi dimensinya baik dengan AKUF
maupun AKU) menjadi dua bagian yakni data training (data untuk menyusun
model) sebanyak 348 data dari tahun 1979-2007 dan data testing (data untuk
validasi model) sebanyak 12 data dari tahun 2008.
5. Memodelkan statistical downscaling dengan regresi kuantil linier dan non linier
(model kuadratik dan kubik) pada kuantil ke-75, ke-90, dan ke-95 menggunakan
komponen utama (KU) dan komponen utama fungsional (KUF) sebagai peubah
penjelas dan data presipitasi dari stasiun curah hujan di Indramayu sebagai
peubah respon.
6. Melakukan prediksi data curah hujan pada tahun 2008 dan mengukur kebaikan
model dengan menghitung nilai korelasi dan RMSEP (Root Mean Square Error
Prediction).
a) Nilai korelasi menunjukkan keeratan hubungan antara peubah respon dan
peubah prediktor. Model yang baik memiliki korelasi tertinggi. Nilai korelasi
dinyatakan dalam bilangan −1 ≤ ß ≤ 1. Nilai korelasi (r) dapat dihitung
dengan menggunakan rumus :
∑%/ ”x − ”â ”àx − ”âà
á¨à̈
ߨà̈ =
=
ᨠá à̈
#
ã∑%/ ”x − ”â # ∑%/ ”àx − ”âà

b) Nilai RMSEP menunjukkan kemiripan pola data aktual dan data dugaan.
Model yang akurat memiliki nilai RMSEP terkecil. RMSEP dihitung dengan
menggunakan rumus:
1
RMSEP = è 7 ”x − ”à #
6
%

/

7. Melakukan validasi model. Validasi adalah representasi keakuratan data aktual
dan data pendugaan (Law dan Kelton 1991). Validasi model ditinjau dari nilai
korelasi dan RMSEP.
8. Melakukan uji konsistensi model. Konsistensi model merupakan salah satu asumsi
dalam pemodelan (BIOCLIM 2004 dalam Wigena 2006). Konsistensi model
diukur berdasarkan nilai simpangan baku dari nilai korelasi (r) pada setiap tahun
pendugaan. Semakin kecil simpangan baku maka semakin konsisten modelnya
(Wigena 2006).
Diagram Alir penelitian dapat dilihat pada Gambar 2.

11

Mulai

Data GCM (X)
dan Data Stasiun
(y)

Eksplorasi

Transformasi Data
GCM dengan
Transformasi Fourier

Reduksi Data GCM
dengan Analisis
Komponen Utama

Analisis Komponen
Utama Fungsional

Pemodelan Statistical Downscaling dengan
Regresi Kuantil

Peramalan dan Pemilihan Model Terbaik
dengan RMSEP dan r

Validasi

Konsistensi

Selesai

Gambar 2 Diagram alir penelitian

11

12

4 HASIL DAN PEMBAHASAN
Eksplorasi data
Deskripsi Data Curah Hujan
Secara umum data curah hujan bulanan rata-rata dari 15 stasiun penakar
curah hujan di Indramayu menggambarkan bahwa curah hujan bulanan rata-rata di
Indramayu adalah 122.62 mm/bulan. Curah hujan bulanan terendah kota
Indramayu adalah 0 mm/bulan sementara curah hujan bulanan tertingginya adalah
583 mm/bulan. Curah hujan ini merupakan curah hujan bulanan yang sangat
tinggi. Adapun rata-rata jarak penyimpangan data curah hujan bulanan diukur
dari nilai rata-ratanya adalah 110.3269 mm/bulan. Nilai ini cukup besar sehingga
dapat dikatakan bahwa data curah hujan cukup bervariasi. Sementara nilai
variansi=12172.02 menyatakan bahwa nilai variansi ini cukup besar sehingga
dapat dikatakan bahwa curah hujan bulanan di Indramayu beragam (heterogen).
Berdasarkan Haryoko(2004), daerah perkiraan musim (DPM) adalah
musim hujan dimulai dari Oktober-Maret, dan musim kemarau dimulai dari AprilSeptember. Musim penghujan ditandai dengan curah hujan bulanan sebesar 150
mm/ bulan sedangkan musim kemarau ditandai dengan curah hujan bulanan
kurang dari 150 mm/bulan (BMKG dalam Pribadi 2012). Gambar 3 menunjukkan
bahwa terjadi pergeseran pada musim hujan dengan curah hujan bulanan
seharusnya ≥150mm/bulan berada pada bulan November-Maret baru dimulai
pada Desember-Maret. Begitupun dengan musim kemarau (curah hujan relatif
rendah) yang menurut DPM dimulai dari April-September dengan curah hujan
400 mm/bulan. Simpangan baku terbesar juga terjadi
di bulan Januari yakni 126.3 mm/bulan menandakan bahwa curah hujan yang
terjadi di bulan Januari pada tahun 1979-2008 cukup beragam. Sedangkan untuk
DPM yakni musim kemarau, pada bulan April-Oktober, curah hujan bulanan ratarata yang terjadi berkisar 14.6 mm/bulan – 141.2 mm/bulan. Curah hujan bulanan
terendah terjadi di bulan Juli - Oktober yakni 0 mm/bulan. Berdasarkan Tabel 2,
curah hujan tinggi sering terjadi pula untuk bulan-bulan ini karena kisaran nilai
maksimum untuk bulan-bulan ini adalah 58 mm/bulan-246 mm/bulan. Jadi
sekalipun menghadapi musim kemarau masih terdapat kemungkinan terjadinya
curah hujan tinggi dari biasanya. Sementara untuk nilai koefisien kemiringan
untuk semua bulan nilainya lebih dari nol menandakan bahwa sebaran data
pengamatan tidak normal dan cenderung menjulur ke kanan yang berarti bahwa
nilai rata-rata lebih besar dari median dan modus yang membuat distribusi data
tidak simetris secara grafis karena nilai median lebih kecil dari nilai rata-rata.
Tabel 2 Statistika deskriptif curah hujan bulanan Indramayu
Rata- Simpangan
Koefisien
Bulan
Minimum Maksimum
rata
baku
kemiringan
Januari
308.80
126.30
79
583
0.54
Februari
226.70
106.80
90
521
1.14
Maret
161.20
57.10
76
280
0.66
April
141.20
46.50
54
246
0.31
Mei
86.40
46.04
6
186
0.23
Juni
62.13
41.23
10
167
0.75
Juli
30.73
33.51
0
153
2.00
Agustus
14.60
16.46
0
58
1.42
September
16.97
21.74
0
66
1.32
Oktober
63.70
51.11
0
166
0.34
November 148.20
83.50
17
346
0.82
Desember 210.70
62.30
123
402
1.36
Deskripsi Data GCM
Data GCM sebagai data simulasi merupakan data yang bergerak sesuai
simulasi model. Nilai korelasi antara peubah curah hujan Indramayu dengan
peubah tiap grid berkisar antara -0.0695 hingga 0.745.
Data GCM masih merupakan data yang berdimensi besar sehingga
cenderung terjadi multikolinieritas. Hal ini ditunjukkan oleh nilai VIF pada
Lampiran 1. Nilai VIF untuk semua grid baik (Lampiran 1) lebih besar dari 10
(VIF>10). Hal ini berarti bahwa untuk semua grid terdapat multikolinieritas
sehingga data GCM tidak bisa langsung digunakan untuk pemodelan. Pemodelan
data yang mengandung multikolinieritas menyebabkan dugaan yang tidak tepat
sehingga perlu dilakukan pereduksian dimensi data.

14

14
Reduksi Dimensi

Adapun pembahasan reduksi dimensi data GCM dibagi menjadi dua
bagian yakni metode reduksi yang menggunakan AKU dan metode reduksi yang
menggunakan AKUF.
AKU
Hasil uji kehomogenan ragam pada Lampiran 2 bahwa nilai-p 1 dengan proporsi keragaman kumulatif >80%.
AKUF

8
6
4
2
0

GCM presipitasi

10

12

Pereduksian dimensi data GCM dengan metode AKUF akan terlebih
dahulu ditansformasi dengan menggunakan deret Fourier. Pemulusan dengan
transformasi deret fourier pada data GCM (data periodik) membuat KUF dapat
menyerap informasi dari variasi data sebanyak mungkin. Akan tetapi untuk
menggunakan transformasi deret waktu ini asumsi yang harus dipenuhi yakni pola
data cenderung tidak berubah dari waktu ke waktu (stasioner). Oleh karena itu
perlu dilakukan eksplorasi bentuk data fungsional GCM. Ditinjau dari segi grafis,
pola data GCM membentuk pola sinusoidal yang cenderung tidak terlalu banyak
berubah dari waktu ke waktu sehingga memungkinkan untuk menggunakan
transformasi deret fourier. Adapun pola awal data sebelum ditransformasi nampak
seperti pada Gambar 4. Secara grafik, polanya masih nampak agak kasar.

0

50

100

150

Waktu

200

250

300

Gambar 4 Plot data fungsional GCM sebelum transformasi

350

15

RMSEP

Penentuan basis transformasi awal dilakukan dengan melihat pola data
secara visual. Pola transformasi dari basis m=3 hingga ke basis m=15 pada
Lampiran 3 menunjukkan pola yang berubah-ubah seiring pertambahan basis dan
halus. Pada basis m=17 hingga basis ke m=31 pola basis konvergen, tidak halus,
dan mendekati lagi pola data asli sebelum ditransformasi (Gambar 4). Oleh karena
itu, basis m=17 dianggap mewakili basis yang lebih tinggi, maka basis yang akan
dieksplor lebih lanjut hanya sampai basis m=17. Berdasarkan Lampiran 4, basis
yang memiliki jumlah proporsi penuh (100%) hanya terdapat pada basis
m=5,9,11,13,17. Lestari (2014) menyatakan bahwa basis terbaik dapat ditentukan
berdasarkan RMSEP terkecil (dengan menggunakan regresi linier biasa). Gambar
5 menunjukkan bahwa basis terbaik adalah basis ke-13 karena memiliki RMSEP
terkecil yakni 84.58.
90
89
88
87
86
85
84
83
82
81
80
5

9

11
Basis

13

17

Gambar 5 Penentuan basis AKUF berdasarkan RMSEP

8
7
6
5
4
3
2

GCM presipitasi

9

Gambar 6 menunjukkan bahwa pola data setelah ditransformasi nampak lebih
halus dan tetap mempertahankan pola periodik dari waktu ke waktu serta tidak
mengubah pola data sebelum ditransformasi.

0

50

100

150

200

250

300

350

Waktu

Gambar 6 Plot data fungsional GCM setelah transformasi
Data hasil transformasi dengan menggunakan deret Fourier kemudian
direduksi dimensinya dengan menggunakan AKUF. Proporsi keragaman untuk
data GCM terdapat pada Tabel 4.

16

16
Tabel 4 Proporsi keragaman komponen utama fungsional (KUF)
AKUF pada data GCM
KUF
KUF
KUF
KUF
1
2
3
4
Proporsi keragaman (%)
96.54
1.85
0.79
0.58
Proporsi keragaman kumulatif (%)
96.54 98.39 99.18 99.76

KUF
5
0.09
99.85

Tabel 4 menunjukkan bahwa proporsi keragaman tertinggi pada data GCM
diberikan oleh KUF1 dengan nilai 96.54%. komponen yang akan digunakan untuk
penelitian adalah komponen utama fungsional yang memberi proporsi keragaman
yang tinggi. Pada tabel 4, nampak bahwa pada komponen utama ketiga, nilai
proporsi keragamannya cukup kecil sehingga komponen ini tidak akan digunakan
untuk pemodelan. Jadi, dalam penelitian ini akan dilakukan pemodelan dengan
melibatkan 2 komponen utama yang memberikan proporsi keragaman yang cukup
tinggi. Dibandingkan dengan AKU biasa, model dengan melibatkan data yang
direduksi dengan AKUF memiliki komponen yang lebih sedikit untuk tingkat
keragaman yang hampir setara.
Regresi Kuantil
Diagram pencar antara peubah komponen utama (baik yang direduksi
dengan AKU maupun AKUF pada data GCM terhadap data curah hujan di
Indramayu pada Lampiran 5-6 menunjukkan pola hubungan yang tidak linier
sehingga regresi biasa tidak baik untuk dilakukan. Oleh karena itu, pendugaan
dengan menggunakan regresi kuantil tepat untuk dilakukan karena diduga bahwa
kemungkinan terdapat perbedaan nilai dugaan di tiap kuantil tertentu. Selain
karena itu, nilai ektrim dapat diduga lebih baik dengan menggunakan regresi
kuantil. Pemodelan regresi kuantil akan dibahas adalah pemodelan regresi kuantil
dengan komponen utama fungsional yang memberikan proporsi keragaman yang
cukup tinggi sebagai prediktor. Selain itu karena pola yang tidak linier juga akan
ditunjukkan pola hubungan regresi kuantil dalam bentuk non linier dalam model
seperti model kuantil kuadratik dan model kuantil kubik.
Regresi Kuantil dengan KU
Berdasarkan Tabel 3, regresi kuantil akan melibatkan 4 KU. Lampiran 5
menunjukkan bahwa pola hubungan antara data curah hujan Indramayu dengan
KU cenderung tidak linier sehingga selain regresi kuantil linier biasa akan
dilakukan regresi kuantil dengan melibatkan model kuantil kuadratik dan model
kuantil kubik. Lampiran 7 menunjukkan bahwa nilai RMSEP kuantil ke-75,ke-90,
dan ke-95 regresi kuantil dengan 1 KU terdapat pada model
y = a + bKU + cKU ì , y = a + bKU # + cKU ì , dan y = a + bKU hanya saja
hubungan peubah respon dan peubah penjelas (KU) pada kuantil ke-75 dan ke-90
tidak nyata. Hal ini ditandai dengan parameter koefisien model yang tidak
signifikan. Oleh karena itu akan dipilih model yang hubungan peubah respon dan
peubah penjelasnya nyata. Adapun model yang baik berdasarkan RMSEP terkecil
dan korelasi (r) prediksi terbesar untuk semua kuantil (ke-75, ke-90 dan ke-95)
terdapat pada model y = a + bKU dan y = a + bKU ì. Model ini selanjutnya

17
akan dikombinasikan dengan KU2. Adapun model terbaik dengan RMSEP
terkecil, r terbesar dan hubungan peubah yang signifikan adalah model
y = a + bKU ì + cKU# + dKU#ì . Model ini kemudian dikombinasikan lagi dengan
KU3. Adapun model terbaik adalah y = a + bKU ì + cKU# + dKU#ì + eKUìì .
Bentuk akhir model terbaik diperoleh dengan mengkombinasikan 4 KU adalah
y = a + bKU ì + cKU# + dKU#ì + eKUìì + fKUí + gKUíì . Adapun RMSEP untuk
kuantil ke-75 adalah 69.20, kuantil ke-90 adalah 104.80, dan kuantil ke-95 adalah
145.83 dan korelasi prediksi r75=0.96, r90=0.97, dan r95=0.96. Adapun persamaan
yang terbentuk adalah :
yîÛïð = 159.598 + 0.160KU ì − 17.896KU# + 0.135KU#ì + 0.535KUìì
+ 19.617KUí − 4.360KUíì
yîÛñ0 = 216.243 + 0.191KU ì − 25.530KU# + 0.269KU#ì + 0.900KUìì
+ 26.072KUí − 3.551KUíì
yîÛñð = 258.528 + 0.205KU ì − 28.853KU# + 0.241KU#ì + 1.284KUìì
+ 45.953KUí − 9.990KUíì
Hasil pengujian signifikan parameter regresi kuantil terdapat pada Lampiran 9a.
Regresi Kuantil dengan KUF
Regresi kuantil dengan melibatkan data GCM yang direduksi dengan
AKUF sebagai prediktor menggunakan 2 KUF. Lampiran 6 menunjukkan bahwa
pola hubungan peubah respon (curah hujan Indramayu) dan peubah prediktor
(KUF) juga tidak linier. Regresi kuantil dengan KUF juga akan dilakukan regresi
kuantil yang tidak linier (regresi kuantil kuadratik ataupun kubik). Hasil regresi
pada Lampiran 8 menunjukkan bahwa model terbaik yang melibatkan 1 KUF
dengan RMSEP terkecil untuk semua kuantil dan hubungan yang nyata antara
prediktor dan peubah respon adalah terdapat pada model regresi kuantil kubik
y = a + bKUF + cKUF ì. Sedangkan berdasarkan r tertinggi terdapat pada model
y = a + bKUF ì. Kedua model ini memiliki hubungan peubah yang nyata. Oleh
karena itu kedua model ini kemudian dikombinasikan dengan KUF2. Hasil
kombinasi dengan KUF2 dengan menunjukkan bahwa model kuantil terbaik
(RMSEP terendah, r tertinggi dan hubungan peubah yang nyata antara peubah
respon dan prediktor) adalah model y = a + bKUF ì + cKUF# + dKUF## . Adapun
RMSEP untuk kuantil ke-75 adalah 72.17, kuantil ke-90 adalah 100.45, dan
kuantil ke-95 adalah 124.69 dan korelasi prediksi r75=0.93, r90=0.92, dan r95=0.92.
Adapun persamaan yang terbentuk adalah :
”îÛïð = 152.034 − 0.023KUF ì + 24.002KUF# + 4.750KUF##
yîÛñ0 = 198.124 − 0.026KUF ì + 34.060KUF# + 3.421KUF##
yîÛñð = 226.701 − 0.027KUF ì + 41.499KUF# + 3.112KUF##
Hasil pengujian signifikan parameter regresi kuantil terdapat pada Lampiran 9b.
Tabel 5 menunjukkan bahwa nilai korelasi antara data dugaan dan data
aktual dengan menggunakan KU dan KUF sebagai prediktor tidak terlalu
menunjukkan perbedaan yang signifikan. Nilai korelasinya hampir setara. Namun
nilai RMSEP pada model kuantil yang menggunakan GCM hasil reduksi dimensi
AKUF pada kuantil ke-90 dan ke-95 lebih kecil yang berarti bahwa model regresi
kuantil dengan waktu tunda lebih akurat dan polanya lebih mirip dengan data
aktual.

18

18

Tabel 5 Perbandingan regresi kuantil dengan AKU dan AKUF
AKU 1-4 (proporsi
AKUF 1-2 (proporsi
keragaman= 96.6 %)
keragaman =95 %)
r
RM