Regresi Kuantil dengan Kuadrat Terkecil Parsial dalam Statistical Downscaling untuk Pendugaan Curah Hujan Ekstrim

REGRESI KUANTIL DENGAN KUADRAT TERKECIL
PARSIAL DALAM STATISTICAL DOWNSCALING UNTUK
PENDUGAAN CURAH HUJAN EKSTRIM

ESTHER RIA MATULESSY

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa tesis berjudul Regresi Kuantil dengan
Kuadrat Terkecil Parsial dalam Statistical Downscaling untuk Pendugaan Curah
Hujan Ekstrim adalah benar karya saya dengan arahan dari komisi pembimbing
dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun.
Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun
tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan
dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.
Bogor, Juli 2015

Esther Ria Matulessy
NIM G151110021

RINGKASAN
ESTHER RIA MATULESSY. Regresi Kuantil dengan Kuadrat Terkecil Parsial
dalam Statistical Downscaling untuk Pendugaan Curah Hujan Ekstrim. Dibimbing
oleh AJI HAMIM WIGENA dan ANIK DJURAIDAH.
Curah hujan sebagai unsur iklim yang paling tinggi fluktuasinya dan paling
dominan mencirikan iklim di Indonesia sangat dipengaruhi oleh perubahan iklim
global seperti curah hujan ekstrim. Curah hujan ekstrim dapat mengakibatkan banjir
dan menimbulkan berbagai kerugian misalkan gagal panen pada bidang pertanian.
Analisis yang mengkaji kejadian-kejadian ekstrim dibutuhkan untuk memperkecil
dampak buruk karena adanya kejadian curah hujan ekstrim tersebut. Curah hujan
ekstrim dapat dianalisis antara lain dengan metode statistical downscaling (SD). SD
adalah proses transformasi informasi dari skala besar (global) sebagai peubah
penjelas ke skala kecil (lokal) sebagai peubah respon. Dalam penelitian ini, data curah
hujan bulanan kabupaten Indramayu digunakan sebagai peubah respon sedangkan

data luaran global circulation model (GCM) digunakan sebagai peubah penjelas.
Data luaran GCM umumnya berdimensi besar dan multikolinier. Untuk
mereduksi dimensi dan mengatasi masalah multikolinier digunakan analisis
komponen utama (AKU), analisis komponen utama fungsional (AKUF) dan
metode kuadrat terkecil parsial (KTP). AKU dan AKUF menitikberatkan pada
keragaman dalam peubah penjelas, sedangkan KTP menitikberatkan pada
keragaman antara peubah penjelas dengan peubah respon.
Model SD
membutuhkan korelasi yang kuat antara data GCM dengan curah hujan untuk
mendapatkan pendugaan yang lebih akurat. Korelasi yang kuat menghasilkan pola
data yang sejenis antara kedua peubah.
Salah satu metode yang dapat digunakan untuk memprediksi curah hujan
ekstrim dalam pemodelan SD adalah regresi kuantil, yang merupakan perluasan
dari regresi median pada berbagai nilai kuantil. Model yang dibentuk pada regresi
kuantil dapat digunakan untuk mengukur efek peubah penjelas di pusat sebaran
data pada bagian ekor kanan atau ekor kiri sebaran. Tujuan penelitian ini adalah
menggunakan metode regresi kuantil untuk memprediksi curah hujan ekstrim
menggunakan KTP sebagai metode reduksi dimensi dengan time lag data
presipitasi luaran GCM. Data curah hujan bulanan kabupaten Indramayu
digunakan sebagai peubah respon sedangkan data luaran GCM digunakan sebagai

peubah penjelas pada tahun 1979-2008. Data tahun 1979-2007 digunakan untuk
membangun model dan data tahun 2008 digunakan untuk validasi model.
Reduksi dimensi data presipitasi luaran GCM-lag menggunakan KTP
menghasilkan satu komponen yaitu skor pertama � dan skor pertama � .
Selanjutnya, pendugaan curah hujan ekstrim dilakukan dengan menggunakan
model regresi kuantil linier, kuadratik dan kubik pada kuantil ke-75, ke-90 dan
ke-95. Validasi model dan kekonsistenan akan dilakuan pada akhir penelitian ini.
Hasil menunjukkan pendugaan curah hujan dengan model regresi kuantil
linier, kuadratik dan kubik tidak dapat mengikuti pola curah hujan aktual. Model
tersebut dimodifikasi dengan menambahkan peubah boneka. Penambahan beubah
boneka menghasilkan pendugaan yang lebih baik.

Model terbaik adalah model regresi kuantil kubik dengan peubah boneka.
Pola curah hujan ekstrim menunjukkan kecenderungan yang sama dengan pola
aktual. Pada bulan Februari, nilai curah hujan aktual 439.33 mm diprediksi
dengan baik pada kuantil ke-95. Model regresi kuantil kubik dengan peubah
boneka memberikan hasil prediksi yang konsisten sampai dengan dua tahun ke
depan.
Kata kunci: global circulation model, regresi kuadrat terkecil parsial, regresi
kuantil, statistical downscaling


SUMMARY
ESTHER RIA MATULESSY. Statistical Downscaling Quantile Regression with
Partial Least Squares for Extreme Rainfall Prediction. Supervised by AJI HAMIM
WIGENA and ANIK DJURAIDAH.

Rainfall as a part of the highest climate fluctuation and characterize the most
dominant climate in Indonesia is strongly influenced by global climate change,
such as extreme rainfall. Extreme rainfall can cause flood and various
disadvantages like crop failure in agriculture. The analysis that examines the
extreme events is needed to minimize the bad impact due to the extreme rainfall
events. Extreme rainfall can be analyzed such as using statistical downscaling
(SD). SD is the process of transforming information from large-scale (global) as
an explanatory variables to small-scale (local) as a respon variable. In this
research, monthly raifall data from Indramayu district used as respon variable and
GCM output data used as explanatory variables.
The precipitation of GCM output is high dimension and there are
multicolinear between adjacent grids. To reduce the high dimension and solve the
multicolinearity problem usually uses principal component analysis (PCA),
functional principal component (FPCA) and partial least squares (PLS). PCA and

FPCA focus on variety in the explanatory variables, whereas PLS focuses on the
variety between the explanatory variables and the response variable. SD model
requires a strong correlation between the precipitation of GCM output and the
rainfall to obtain a more accurate estimate. Strong correlation delivers the same
pattern of the two variables.
A method to estimate the extreme rainfall in SD modeling is quantile
regression, which is an expansion from median regression on various quantile
value. The model that has been formed in quantile regression can be used to
measure the effect of explanatory variables at the centre, right or left tail of the
data distribution. The aim of this research is to estimate the extreme rainfall using
quantile regression and PLS as a dimension reduction method with time lag
precipitation of GCM output. The monthly rainfall of Indramayu and the
precipitation of GCM output from 1979 to 2008. Data from 1979 to 2007 for
developing the model and data 2008 for model validation.
Dimension reduction using PLS produces one component i.e the first score
of � and the first score of �. Then, the extreme was estimated by linier, quadratic
and cubic quantile regresssion with � score as explanatory variable and rainfall
data as respon variable at the 75th, 90th and 95th quantiles. Model validation and
consistency were implemented at the last step of this research.
The results show that the rainfall estimate using linier, quadratic and cubic

quantile regression model were not following the pattern of actual rainfall. The
model was modified by adding dummy variables. Using dummy variables resulted
better estimate.

The best model is cubic quantile regression with dummy variables. The
pattern of extreme rainfall was similar to the pattern actual rainfall. In February,
the actual rainfall is about 439.33 mm and well predicted by the 95 th quantile.
The cubic quantile regression with dummy variables can also result the consistent
prediction for next two years .
Keywords: global circulation model, partial least square regression, quantile
regression, statistical downscaling
servation time. As a consequence, the data may not completely observed
(censored).One of statistical analysis technique that can be used to handle the
problems of censored data is survival analysis.
There were some researches about students dropping out in IPB. Hutabarat
(2005) analyzed the students who drop-out from department of statistics in IPB
Graduate School using regression tree method. Rahmah (2013) conducted
research

© Hak Cipta Milik IPB, Tahun 2015

Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan
IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apa pun tanpa izin IPB

REGRESI KUANTIL DENGAN KUADRAT TERKECIL
PARSIAL DALAM STATISTICAL DOWNSCALING UNTUK
PENDUGAAN CURAH HUJAN EKSTRIM

ESTHER RIA MATULESSY

Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains
pada
Program Studi Statistika


SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015

2

Penguji Luar Komisi pada Ujian Tesis: Dr.Ir. Indahwati, M.Si

3

Judul Tesis : Regresi Kuantil dengan Kuadrat Terkecil Parsial dalam Statistical
Downscaling untuk Pendugaan Curah Hujan Ekstrim
Nama
: Esther Ria Matulessy
NIM
: G151110021

Disetujui oleh

Komisi Pembimbing

Dr Ir Aji Hamim Wigena, MSc
Ketua

Dr Ir Anik Djuraidah, MS
Anggota

Diketahui oleh

Ketua Program Studi
Statistika

Dekan Sekolah Pascasarjana

Dr Ir Anik Djuraidah, MS

Dr Ir Dahrul Syah, MScAgr

Tanggal Ujian:


Tanggal Lulus:

4

5

PRAKATA
Segala puji dan syukur kepada Tuhan Yesus Kristus karena atas segala kasih
setia dan pertolongan-Nya maka karya ilmiah yang berjudul “Regresi Kuantil
dengan Kuadrat Terkecil Parsial dalam Statistical Downscaling untuk Pendugaaan
Curah Hujan Ekstrim” ini dapat diselesaikan dengan baik. Jika selesainya karya
ilmiah ini bisa dianggap sebagai suatu keberhasilan maka itu adalah suatu realita
bahwa banyak pihak yang telah ikut dan berperan dalam keberhasilan
yang penulis peroleh.
Terima kasih dan penghargaan yang setulus-tulusnya penulis ucapkan
kepada
1.
Bapak Dr. Ir. Aji Hamim Wigena, MSc selaku pembimbing pertama yang
dengan senyum selalu memberikan semangat, masukan dan pemikiran bagi

penulis dalam proses penulisan karya ilmiah ini dan Ibu Dr. Ir. Anik
Djuraidah, MS selaku pembimbing kedua yang selalu dengan sabar telah
mencurahkan segala waktu, tenaga dan pemikiran untuk membantu penulis
menyelesaikan karya ilmiah ini.
2.
Ibu Dr. Ir. Indahwati, M.Si sebagai penguji luar komisi pada ujian tesis.
3.
Bapak/Ibu Dosen Statistika IPB yang telah memberikan ilmu, bimbingan
dan arahan bagi penulis selama mengikuti perkuliahan.
4.
Mama dan Papa tercinta untuk kasih sayang, doa dan semangat yang selalu
diberikan, Kakak Nus Noya sekeluarga dan Kakak Theos Matulessy
sekeluarga yang selalu memberikan doa dan dukungan bagi penulis.
5.
Billy Imbiri yang selalu memberikan doa, perhatian dan semangat
bagi penulis selama di Bogor, ILD.
6.
Teman-teman S2 STK & STT 2011 („Laskar Cespo‟) atas kebersamaan dan
dukungannya selama perkuliahan, teman-teman Statistika S1, S2, dan S3
(Aeb, Leny, Bodro, Vera, Mila, Bu Deby), tim work Downscaling 2014
(Sahriman & Wirnancy) atas bantuan serta kebersamaannya.
7.
Semua pihak yang tidak dapat disebutkan satu persatu atas segala perhatian,
bantuan dan doa yang diberikan bagi penulis dalam menyelesaikan karya
ilmiah ini. Kiranya Tuhan yang akan membalas setiap kebaikan yang telah
dilakukan bagi penulis.
Penulis menyadari bahwa terdapat banyak kekurangan dalam penulisan
karya ilmiah ini. Oleh karena itu, penulis mengharapkan kritik dan saran yang
membangun bagi penulisan karya ilmiah selanjutnya. Semoga karya ilmiah ini
dapat menambah wawasan dan bermanfaat.

Bogor,

Juli 2015

Esther Ria Matulessy

6

7

DAFTAR ISI
DAFTAR TABEL
DAFTAR GAMBAR
DAFTAR LAMPIRAN
1 PENDAHULUAN
Latar Belakang
Tujuan Penelitian
2 TINJAUAN PUSTAKA
Global Circulation Model (GCM) dan Statistical Downscaling (SD)
Regresi Kuadrat Terkecil Parsial (RKTP)
Regresi Kuantil
3 METODE PENELITIAN
Data
Metode Analisis
4 HASIL DAN PEMBAHASAN
Eksplorasi Data
Reduksi Dimensi
Pemodelan Regresi Kuantil
Prediksi
Validasi dan Konsistensi Model
5 SIMPULAN
Simpulan
DAFTAR PUSTAKA
LAMPIRAN
RIWAYAT HIDUP

xii
xii
xii
1
1
2
2
2
3
4
6
6
7
8
8
10
11
13
14
16
16
16
18
22

8

DAFTAR TABEL
1 Deskripsi curah hujan
2 Komponen terekstrak pada model KTP
3 Perbandingan nilai RMSEP dan korelasi model regresi kuantil linier
tanpa peubah boneka dan dengan peubah boneka
4 Perbandingan nilai RMSEP dan korelasi model regresi kuantil kuadratik
tanpa peubah boneka dan dengan peubah boneka
5 Perbandingan nilai RMSEP dan korelasi model regresi kuantil kubik
tanpa peubah boneka dan dengan peubah boneka
6 Perbandingan nilai RMSEP dan korelasi model regresi kuantil kuadratik
boneka dan kubik boneka
7 Prediksi curah hujan bulanan tahun 2008
8. Nilai korelasi untuk prediksi curah hujan dua tahun

9
10
12
12
13
13
14
15

DAFTAR GAMBAR
1
2
3
4

Statistical downscaling
Diagram kotak garis curah hujan bulanan
Plot skor y dan skor X
Prediksicurah hujan bulanan tahun 2008 menggunakan model regresi
kuantil kubik dengan peubah boneka pada kuantil ke-75, ke-90
dan ke-95
5 Nilai RMSEP regresi kuantil kubik berdasarkan
banyaknya data prediksi

3
9
11

14
15

DAFTAR LAMPIRAN
1 Nilai VIF data presipitasi GCM-lag
2 Pola prediksi curah hujan bulanan regresi kuantil linier tanpa peubah
boneka dan dengan peubah boneka
3 Diagram pencar komponen KTP dan curah hujan Indramayu

19
20
21

1

1 PENDAHULUAN
Latar Belakang
Iklim berperan besar dalam kehidupan manusia seperti pada bidang pertanian,
transportasi, telekomunikasi, dan pariwisata. Curah hujan sebagai unsur iklim yang
paling tinggi fluktuasinya dan paling dominan mencirikan iklim di Indonesia sangat
dipengaruhi oleh perubahan iklim global, seperti curah hujan ekstrim. Curah hujan
ekstrim dapat mengakibatkan banjir dan menimbulkan berbagai kerugian misalkan
gagal panen pada bidang pertanian. Analisis yang mengkaji kejadian-kejadian ekstrim
dibutuhkan untuk memperkecil dampak buruk karena adanya kejadian curah hujan
ekstrim tersebut (Prang 2006).
Curah hujan ekstrim dapat dianalisis antara lain dengan menggunakan
metode statistical downscaling (SD). SD merupakan proses transformasi
informasi dari skala besar (global) ke skala kecil (lokal). Downscaling umumnya
memanfaatkan data skala global yaitu global circulation model (GCM) untuk
memprediksi peubah skala lokal. GCM menghasilkan data skala global sebagai
sumber informasi primer untuk menilai perubahan iklim.
Kendala pada data presipitasi luaran GCM yaitu berdimensi tinggi dan
multikolinieritas antar grid yang saling berdekatan. Pemodelan SD umumnya
mereduksi dimensi dan mengatasi masalah multikolinieritas menggunakan
analisis komponen utama (AKU), analisis komponen utama fungsional (AKUF)
dan metode kuadrat terkecil parsial (KTP). AKU dan AKUF menitikberatkan pada
keragaman dalam peubah penjelas, sedangkan KTP menitikberatkan pada
keragaman antara peubah penjelas dengan peubah respon (Sutikno et al. 2010).
Model SD membutuhkan korelasi yang kuat antara data presipitasi luaran
GCM dengan curah hujan untuk mendapatkan pendugaan yang lebih akurat.
Korelasi yang kuat menghasilkan pola yang sama antara kedua peubah. Adanya
pergeseran waktu (time lag) pada data presipitasi luaran GCM dapat
mengakibatkan perbedaan pola dengan data curah hujan. Sahriman (2014), telah
melakukan pemeriksaan dan menentukan time lag data presipitasi luaran GCM
melalui korelasi silang tertinggi antara data curah hujan dengan data presipitasi
luaran GCM menggunakan cross-correlation function (CCF), serta memodelkan
SD menggunakan metode reduksi dimensi AKU dan KTP dengan time lag data
presipitasi luaran GCM.
Metode yang dapat digunakan untuk memprediksi curah hujan ekstrim
dalam pemodelan SD adalah regresi kuantil, yang merupakan perluasan dari
regresi median pada berbagai nilai kuantil. Model yang dibentuk pada regresi
kuantil dapat digunakan untuk mengukur efek peubah penjelas di pusat sebaran
data pada bagian atas atau bawah ekor sebaran. Penelitian terkait pemodelan SD
untuk curah hujan ekstrim antara lain telah dilakukan oleh Mondiana (2012)
menggunakan AKU sebagai metode reduksi dimensi dan regresi kuantil untuk
pendugaaan curah hujan ekstrim; Sari (2015) melakukan pendugaan curah hujan
ekstrim dengan regresi kuantil menggunakan AKUF sebagai metode reduksi
dimensi. Kedua penelitian tersebut tidak menggunakan time lag pada data
presipitasi luaran GCM. Penelitian ini akan menggunakan metode regresi kuantil
untuk memprediksi curah hujan ekstrim menggunakan KTP sebagai metode
reduksi dimensi dengan time lag data presipitasi luaran GCM.

2

Tujuan Penelitian
Penelitian ini bertujuan untuk :
1.
Mereduksi dimensi data presipitasi luaran GCM dengan metode KTP.
2.
Memodelkan statistical downscaling dengan regresi kuantil untuk
pendugaan curah hujan ekstrim.

2 TINJAUAN PUSTAKA
Global Circulation Model (GCM) dan Statistical Downscaling (SD)
Menurut Zorita dan Storch (1999), GCM adalah salah satu alat yang
penting dalam studi keragaman iklim dan perubahan iklim. Model ini
menggambarkan sejumlah subsistem dari iklim di bumi, seperti proses-proses di
atmosfer, lautan, daratan, maupun mensimulasi kondisi iklim berskala global.
Meskipun GCM dapat mensimulasi dengan baik perubahan iklim berskala global,
GCM tidak dapat melakukan simulasi dengan baik untuk peubah iklim yang
berskala lokal (Huth & Keysely 2000). Oleh karena itu, GCM tidak dapat
langsung digunakan untuk merepresentasikan keadaan iklim yang berskala lokal
(Zorita & Storch 1999). Masalah perbedaan skala antara peubah penjelas (skala
global) dan peubah respon (skala lokal) dapat diatasi dengan menggunakan
statistical downscaling (Bergant et al. 2002).
SD merupakan suatu fungsi transfer yang menggambarkan hubungan
fungsional sirkulasi atmosfer global (luaran GCM) dengan unsur-unsur iklim
lokal. Ide dasar dari SD adalah mencari hubungan antara parameter iklim skala
global dengan parameter iklim skala lokal dan menggunakan hubungan ini untuk
proyeksi hasil simulasi GCM pada iklim masa lalu, sekarang, atau masa depan
yang berskala lokal. SD menggunakan model statistik dalam menggambarkan
hubungan antara data pada grid berskala global (penjelas) dengan data pada grid
berskala lokal (respon) untuk menerjemahkan anomali-anomali skala global
menjadi anomali dari beberapa peubah iklim lokal (Zorita & Storch 1999).
Pendekatan ini mencari informasi skala lokal berdasarkan pada informasi skala
global melalui hubungan fungsional antara kedua skala tersebut. Namun, keadaan
skala lokal tersebut bisa beragam atau adanya regionalisasi untuk kondisi skala
global yang sama. Dengan kata lain, keadaan skala lokalnya bisa beragam untuk
keadaan skala global yang sama. Persamaan umum SD adalah sebagai berikut
(Sailor et al. 2000; Trigo & Palutikof 2001 dalam Wigena 2006):


(1)
dengan �
adalah peubah-peubah iklim lokal (misalnya: curah hujan), �
adalah peubah-peubah luaran GCM (misalnya: presipitasi), adalah banyaknya
waktu (misalnya: harian atau bulanan), adalah banyaknya grid domain GCM
atau peubah penjelas, adalah banyaknya peubah respon. SD diilustrasikan dalam
Gambar 1 yang menghubungkan data GCM berskala global dengan data hasil
observasi di permukaan bumi yang berskala lokal.

3

Model SD akan memberikan hasil yang baik jika memenuhi tiga syarat
utama, yakni hubungan antara peubah respon dengan peubah penjelas harus kuat
untuk menjelaskan keragaman iklim lokal dengan baik, peubah penjelas harus
disimulasikan dengan baik oleh GCM, dan hubungan antara respon dengan
peubah penjelas tidak berubah dengan adanya perubahan waktu dan tetap sama
meskipun ada perubahan iklim di masa depan (Busuioc et al. 2001). Oleh karena
itu, perlu dilakukan pemilihan peubah-peubah penjelas dan penentuan domain
(lokasi dan jumlah grid) karena kedua hal tersebut merupakan faktor kritis yang
dapat mempengaruhi kestabilan peramalan (Wilby & Wigley 1997 dalam Wigena
2006). Dengan demikian, pemilihan peubah penjelas (data GCM) sebaiknya
berdasarkan pada korelasi yang kuat antara peubah tersebut dengan curah hujan
(Wigena 2006).

Gambar 1 Statistical downscaling (Sutikno 2008)
Metode yang umum digunakan dalam pemodelan SD untuk mengatasi
masalah dimensi data atau multikolinieritas antar peubah penjelas adalah AKU.
Serupa dengan AKU, metode lain yang sering digunakan adalah KTP (Huth &
Keysely 2000; Estiningtyas & Wigena 2011).

Regresi Kuadrat Terkecil Parsial (RKTP)
RKTP merupakan salah satu metode yang dapat digunakan untuk mereduksi
dimensi dan mengatasi masalah multikolinieritas pada peubah penjelas. Metode
RKTP mengkombinasikan antara AKU dengan regresi linier. Hal ini dilakukan
dengan tujuan untuk memprediksi suatu gugus peubah respon � berdasarkan
gugus peubah penjelas � (Wigena 2011). Metode RKTP dapat diterapkan pada
pendugaan satu respon maupun multi respon.
Metode RKTP memproyeksikan data ke sejumlah faktor utama dan
kemudian memodelkan faktor-faktor tersebut dengan regresi linier (Djuraidah
2003). Faktor tersebut disebut sebagai skor. Skor dalam RKTP dihitung
berdasarkan kriteria memaksimalkan peragam antara peubah � dan � .
Perhitungan nilai skor dalam RKTP menggunakan metode kuadrat terkecil (MKT)
dan dilakukan secara parsial (Ismah et al. 2009).

4

Misalkan � berukuran
, dengan adalah banyaknya pengamatan dan
adalah banyaknya peubah penjelas, terdiri dari vektor
, dan �
berukuran
, dengan adalah banyaknya peubah respon terdiri dari vektor � ,
. Metode RKTP menghasilkan sejumlah komponen baru yang akan
memodelkan � terhadap � sehingga diperoleh hubungan antara � dan � .
Komponen-komponen baru tersebut disebut sebagai skor � dan dapat dituliskan
sebagai dengan
. Setiap skor yang dihasilkan saling orthogonal
sehingga RKTP dapat mengatasi masalah multikolinieritas pada peubah penjelas.
Skor � merupakan kombinasi linier peubah-peubah asal dengan koefisien
pembobot
. Proses tersebut dapat diformulasikan sebagai (Wold et al 2001):


(2)
Skor � ( ) digunakan sebagai peubah penjelas untuk respon � dan model dari �.
Skor tersebut mempunyai sifat-sifat sebagai berikut:
1.
Skor � dikalikan dengan loading
, sehingga sisaannya
kecil


Pada kondisi
, skor �
dikalikan dengan pembobot
sehingga
sisaannya
kecil.

(3)

2.
Skor � adalah peubah penjelas bagi �, yakni:


(4)
Sisaan � ( ) merupakan simpangan antara respon pengamatan dengan
respon dugaan. Berdasarkan persamaan (2) dan persamaan (4) dapat
dituliskan sebagai model regresi ganda dengan formula sebagai berikut:



� �

Koefisien model RKTP,
, adalah sebagai berikut:

Prediksi bagi data pengamatan yang baru dapat diperoleh berdasarkan data
� dan matriks koefisien .
Regresi Kuantil

Regresi kuantil pertama kali diperkenalkan oleh Roger Koenker dan Basset
pada tahun 1978. Regresi kuantil merupakan suatu pendekatan analisis regresi
untuk menduga fungsi regresi pada kuantil tertentu yang berguna jika distribusi
data tidak homogen (heterogenous), yang bila ditinjau dari segi kurva, kurva tidak
berbentuk standar atau tidak simetris, dan terdapat ekor pada sebaran (truncated
distribution). Metode ini merupakan suatu metode regresi dengan pendekatan
memisahkan atau membagi data menjadi kuantil-kuantil tertentu yang
kemungkinan memiliki nilai dugaan yang berbeda.
Regresi kuantil memberi perkiraan yang lebih akurat dan efisien pada model
non-gaussian dan kekar terhadap pencilan (Buhai 2005). Metode ini dapat
digunakan untuk mengukur efek peubah penjelas tidak hanya di pusat sebaran
data, tetapi juga pada bagian atas atau bawah ekor sebaran. Hal ini sangat berguna
dalam penerapan, khususnya untuk pendugaan nilai ekstrim (Djuraidah & Wigena
2011).

5

Untuk peubah acak Y diberikan fungsi distribusi sebagai berikut :
maka kuantil ke- � dari Y untuk

, dinotasikan dengan:
{

�}
(5)
Buhai (2005), Li dan Zhu (2008) dengan berdasar pada Koenker et.al (1978)
mendefinisikan regresi kuantil sebagai berikut: Misalkan data yang diperoleh dari
hasil reduksi dimensi KTP berupa faktor utama yang dapat dituliskan sebagai
dengan
(komponen) adalah peubah penjelas yang berisi nilai faktor
utama hasil reduksi dan � adalah peubah respon sehingga model linier regresi
kuantil dapat ditulis

̂

(6)
dengan merupakan parameter dari kuantil ke- � dari dengan
. Bila pada
̂
regresi linier diperoleh dengan meminimumkan jumlah kuadrat galat maka
untuk regresi kuantil, ̂ untuk kuantil ke- � , diduga dengan meminimumkan
jumlah kuadrat galat dengan pembobot � untuk galat positif dan
� untuk
galat negatif. Kasus khusus, jika �
ekuivalen dengan regresi median L1.
Nilai ̂ diduga dalam Persamaan 7, yaitu
{



}

�|

|

{



}

� |

|

atau dapat ditulis lagi menjadi
̂

(8)
, adalah check function yang biasa juga disebut
dengan
dengan loss function. Check function dapat didefinisikan

(9)
dengan

adalah fungsi indikator misalkan dari fungsi A,

{

Nilai dugaan dari persamaan ini tidak dapat diduga secara langsung, tetapi dapat
diselesaikan dengan metode numerik melalui pemrograman linier. Penerapan
metode yang populer digunakan adalah metode simpleks terutama bila jumlah
data kurang dari puluhan ribu pengamatan
. Secara teori, jumlah iterasi
dapat meningkat secara eksponensial tergantung dari jumlah pengamatannya.
Secara komputasi, metode simpleks menggunakan algoritma simpleks. Menurut
Chen (2005), algoritma simpleks adalah sebagai berikut: misalkan
dan
dengan
adalah
bagian yang tidak negatif dari z. Untuk regresi median atau regresi L1 pendekatan
algoritma simpleks menyelesaikan Persamaan 10, yaitu
∑ |
|
(10)
dengan merumuskan kembali bentuknya dengan batasan minimisasi seperti pada
Persamaan 11, yaitu
{
{
}
}
|
(11)
dengan merupakan vektor satu berukuran
Misalkan
, dan
,
dengan
. Formulasi ulang menghasilkan masalah program linier

6

baku
bergantung pada
bentuk (formulasi ganda) yakni
disederhanakan lagi menjadi
. Maka
Untuk
regresi
kuantil,

dan dengan
. bergantung pada
Pengujian parameter
untuk
hipotesis :


. Masalah ini memiliki dua
� bergantung pada
yang dapat
� bergantung pada
. Bila
.
� bergantung pada
masalah
minimisasi
adalah
langkah yang sama untuk formulasi ganda

.
setiap kuantil menggunakan uji dengan



dengan
Statistik uji dinyatakan dalam Persamaan 12, yaitu


̂



)

(12)
dengan ̂ �
= penduga untuk faktor utama ke- pada kuantil ke- �,
̂
( � ) simpangan baku dari ̂ pada kuantil ke- �.
.
Tolak
bila |
� |

3 METODE PENELITIAN
Data
Data yang digunakan dalam penelitian ini adalah data presipitasi luaran
GCM climate model intercomparison project (CMIP5) dalam satuan mm/bulan
dengan time lag dan data curah hujan di Kabupaten Indramayu pada tahun 19792008. Data GCM CMIP5 diperoleh dari situs web http://www.climatexp.knmi.nl/
yang dikeluarkan oleh badan meterologi Belanda koninklijk nederlands
meteorologisch institut (KNMI) (diakses 28 Desember 2013). Data presipitasi
luaran GCM-lag yang berskala global digunakan sebagai peubah penjelas �
dan data curah hujan stasiun di Kabupaten Indramayu digunakan sebagai peubah
respon � .
Penggunaan data presipitasi luaran GCM-lag memberikan
hasil pendugaan curah hujan yang lebih baik (Sahriman 2014). Domain GCM
yang digunakan dalam penelitian ini adalah sejumlah grid berbentuk persegi
berukuran 8 8 grid (2.5° 2.5° untuk setiap grid) pada 98.75°BT s.d 116.25°BT
dan 16.25°LS s.d 1.25°LU di atas sekitar wilayah Indramayu. Jumlah peubah
penjelas yang digunakan keseluruhan ada 64 peubah. Penggunaan ukuran domain
8 8 grid di atas wilayah Indramayu memberikan hasil yang lebih stabil atau
konsisten serta tidak terlalu sensitif terhadap data pencilan (Wigena 2006).

7

Metode Analisis
Metode analisis yang digunakan dalam penelitian ini adalah metode KTP.
Pereduksian data pada metode KTP selain melibatkan data presipitasi juga
melibatkan data curah hujan sehingga diperoleh penduga model.
Tahapan analisis yang dilakukan dalam penelitian ini sebagai berikut:
1. Mengidentifikasi adanya curah hujan ekstrim dengan diagram kotak garis.
2. Membagi data menjadi dua kelompok yakni data pemodelan (tahun 19792007) dan data validasi (tahun 2008).
3. Mengidentifikasi multikolinieritas pada data presipitasi luaran GCM
menggunakan variance inflation factors (VIF).
4. Mereduksi dimensi peubah penjelas dengan menggunakan metode KTP.
Jumlah komponen yang digunakan dalam KTP ditentukan berdasarkan nilai
statistik prediction residual sum of squares (PRESS). PRESS merupakan suatu
pendekatan yang dipertimbangkan untuk prosedur kestabilan penduga
koefisien regresi. Nilai PRESS yang minimum memberikan kestabilan
pendugaan yang lebih tinggi terhadap model jika ada data baru. Algoritma
pendugaan parameter KTP yang akan digunakan dalam penelitian ini adalah
non-linear iterative partial least squares (NIPALS) dengan tahapan sebagai
berikut (Wold et al. 2001):
a) Mendapatkan nilai vektor awal . Pada umumnya nilai vektor awal
diperoleh dari nilai vektor tunggal � yakni
� dengan � merupakan
vektor peubah respon yang telah diskalakan.
b) Menghitung pembobot �
menggunakan formula
� ⁄
dan
⁄√
mengortonormalkan vektor
dengan formula
sehingga
‖ ‖
. � merupakan matriks peubah penjelas yang telah diskalakan.
c) Menghitung skor �,
� .
d) Menghitung pembobot �,
� ⁄ .
e) Memperbaharui skor �,
� ⁄ .
f) Menghitung nilai � dan � dengan
� ⁄
merupakan loading
faktor dari peubah penjelas.




g) Melanjutkan ke komponen berikutnya (kembali ke langkah (b)) hingga
validasi silang mengindikasikan tidak ada lagi informasi yang nyata dari �
terhadap �.
5. Membangun model regresi kuantil pada kuantil ke-75, ke-90 dan ke-95 antara
� dengan komponen yang terpilih pada tahap 4.
6. Melakukan prediksi data curah hujan menggunakan data tahun 2008 dan
mengukur kebaikan model dengan menghitung nilai korelasi dan root mean
squared error of prediction (RMSEP).
7. Melakukan validasi model dan uji konsistensi model. Konsistensi model diukur
berdasarkan nilai simpangan baku dan nilai korelasi pada setiap tahun
pendugaan. Semakin kecil simpangan baku maka semakin konsisten
modelnya (Wigena 2006).

8

4 HASIL DAN PEMBAHASAN
Eksplorasi Data
Deskripsi Data Curah Hujan
Data penelitian merupakan data curah hujan bulanan kabupaten Indramayu
yang termasuk dalam daerah perkiraan musim 6 (DPM 6). Berdasarkan Haryoko
(2004), musim kemarau pada DPM 6 dimulai pada bulan April - September dan
musim hujan dimulai dari bulan Oktober - Maret. Musim kemarau ditandai
dengan curah hujan bulanan kurang dari 150 mm/bulan sedangkan musim
penghujan ditandai dengan curah hujan bulanan sebesar 150 mm/bulan (BMKG
dalam Pribadi 2012). Deskripsi data curah hujan bulanan rata-rata dari 15 stasiun
penakar curah hujan kabupaten Indramayu disajikan pada Tabel 1. Pada bulanbulan yang masuk dalam musim hujan, rata-rata curah hujan bulanannya relatif
tinggi seperti pada bulan Januari, Februari, Maret, November dan Desember. Nilai
curah hujan bulanan rata-rata pada musim hujan tersebut berkisar antara 148.24
mm/bulan sampai 308.85 mm/bulan. Berbeda pada bulan-bulan di musim hujan,
curah hujan pada bulan-bulan di musim kemarau relatif rendah. Nilainya berkisar
antara 14.62 mm/bulan sampai 141.24 mm/bulan. Curah hujan bulanan rata-rata
dari 15 stasiun penakar curah hujan di kabupaten Indramayu menunjukkan bahwa
curah hujan bulanan rata-rata adalah 122.62 mm//bulan.
Secara umum data curah hujan bulanan terendah adalah 0 mm/bulan
sementara curah hujan bulanan tinggi terjadi pada bulan Januari tahun 1981
yakni 583 mm/bulan. Curah hujan ini merupakan curah hujan bulanan yang sangat
tinggi dan berdasarkan kategori BMG (2008), intensitas tersebut dikategorikan
ekstrim karena lebih besar dari 400 mm/bulan. Simpangan baku terbesar berada
pada bulan Januari dengan 126.27 mm/bulan dan terendah pada bulan Agustus
yakni 16.52 mm/bulan. Simpangan baku yang tinggi pada bulan Januari
menunjukkan bahwa curah hujan pada bulan Januari di tahun 1979-2008 sangat
beragam.
Koefisien kemiringan untuk semua bulan lebih dari nol, dengan koefisien
kemiringan tertinggi berada pada bulan Juli sebesar 2.00 dan terendah pada bulan
Mei sebesar 0.23. Koefisien kemiringan yang lebih dari nol merupakan indikator
bahwa sebaran data pengamatan tidak normal dan menjulur ke kanan, artinya nilai
rata-rata lebih besar dari median dan modus. Dengan kata lain, terdapat curah
hujan ekstrim pada data pengamatan. Diagram kotak garis data curah hujan
bulanan disajikan pada Gambar 2.
Pada Gambar 2 tampak bahwa pada bulan Februari, Juli, Agustus,
September, November, dan Desember terdapat curah hujan bulanan yang lebih
tinggi dari kondisi normalnya. Selain curah hujan yang lebih tinggi dari kondisi
normalnya, pola curah hujan bulanan di kabupaten Indramayu tahun 1979-2008
menunjukkan bahwa pola data curah hujan di kabupaten Indramayu membentuk
huruf U atau dengan kata lain memiliki satu puncak musim hujan (unimodal).

9

Tabel 1 Deskripsi curah hujan
Bulan

Ratarata

Januari
Februari
Maret
April
Mei
Juni
Juli
Agustus
September
Oktober
November
Desember

308.85
226.84
161.17
141.24
86.43
62.11
30.66
14.62
16.94
63.76
148.24
210.62

Simpangan
Baku

Minimum

Maksimum

Koefisien
Kemiringan

126.27
106.86
57.20
46.49
46.09
41.24
33.55
16.52
21.76
51.07
83.51
62.42

79
90
76
54
6
10
0
0
0
0
17
123

583
521
280
246
186
167
153
58
66
166
346
402

0.54
1.14
0.66
0.31
0.23
0.75
2.00
1.42
1.32
0.34
0.82
1.36

600

Curah Hujan (mm)

500

400
300
200
100
0

i
ri
et
ar
r ua M ar
nu
b
a
J
Fe

ril
Ap

ei
M

ni
Ju

li
Ju

r
r
r
er
tus
be
be
be
ob
m
m
t
m
us
e
e
k
e
g
s
v
O
pt
A
De
No
Se

Bulan

Gambar 2 Diagram kotak garis curah hujan bulanan
Deskripsi Data Presipitasi GCM Lag
Time Lag data presipitasi luaran GCM ditentukan berdasarkan nilai korelasi
silang tertinggi antara data presipitasi dengan data curah hujan. Nilai korelasi
tersebut dihitung dengan menggunakan CCF. Berdasarkan Sahriman (2014), hasil
perhitungan korelasi pada presipitasi GCM dengan penundaan mempunyai
korelasi yang lebih tinggi daripada presipitasi GCM tanpa penundaan. Jumlah grid
GCM dengan penundaan (GCM-Lag) yang memiliki korelasi antara data curah
hujan dengan presipitasi tanpa penundaan (GCM) yang lebih dari 0.7 dengan data
curah hujan sebanyak 73%. Sementara itu, korelasi antara data curah hujan
dengan presipitasi tanpa penundaan (GCM) yang lebih dari 0.7 hanya mencapai
9%.

10

Data GCM-lag masih merupakan data yang berdimensi besar sehingga
cenderung terjadi multikolinieritas. Multikolinieritas ditandai dengan adanya
korelasi yang kuat antar peubah penjelas dan nilai VIF yang besar
(Lampiran 1). Nilai VIF data presipitasi GCM-lag memiliki nilai VIF berkisar
5.56-1252.11 atau VIF
10 yang mengindikasikan adanya multikolinieritas
sehingga data GCM-lag tidak bisa langsung digunakan untuk pemodelan.
Pemodelan data yang mengandung multikolinieritas menyebabkan dugaan yang
tidak tepat sehingga perlu dilakukan pereduksian dimensi data.
Reduksi Dimensi
Pereduksian dimensi data presipitasi luaran GCM-lag untuk mengatasi
adanya korelasi antar peubah penjelas, digunakan metode kuadrat terkecil parsial
(KTP). Metode KTP memodelkan � terhadap � melalui komponen baru.
Berdasarkan Tabel 2, nilai PRESS memperlihatkan bahwa cukup menggunakan
satu komponen dalam model KTP meskipun terdapat dua komponen yang
memiliki nilai akar rataan PRESS terkecil (komponen yang memiliki nilai peluang
lebih dari 0.05). Satu komponen terekstrak dapat menjelaskan sebesar 83.1%
keragaman data presipitasi luaran GCM-lag dan sebesar 62.1% keragaman data
curah hujan (Gambar 3).
Tabel 2 Komponen terekstrak pada model KTP
Jumlah komponen
Akar rataan PRESS Peluang > PRESS
terekstrak
0
1.02