digunakan dalam pemodelan ARIMA. Tahap identifikasi berkaitan dengan evaluasi stasioneritas
data dan identifikasi bentuk ACF Autocorrelation Function
dan PACF Partial Autocorrelation Function
dari data yang sudah stasioner. Inferensi transformasi Box-Cox adalah salah satu uji yang
dapat digunakan untuk mengevaluasi stasioneritas data dalam varians. Nilai
λ=1 pada hasil transformasi Box-Cox menunjukkan data sudah
stasioner dalam varians. Bentuk ACF dan PACF dari data yang sudah stasioner digunakan untuk
mendapatkan dugaan orde model ARIMA.
Tahap selanjutnya adalah estimasi parameter model ARIMA dugaan. Pada tahap ini dilakukan
evaluasi signifikansi parameter yang telah diestimasi melalui uji statistik t. Parameter model
adalah signifikan jika p-value dari uji t kurang dari level signifikansi pengujian misal 0,05. Tahap cek
diagnosa dilakukan untuk mengetahui kesesuaian model ARIMA yang telah diperoleh. Beberapa uji
yang digunakan pada tahap ini adalah uji Ljung- Box untuk evaluasi apakah residual sudah
memenuhi syarat white noise dan uji Kolmogorov- Smirnov untuk mengetahui normalitas data [5].
Penelitian ini akan menggunakan software SAS dalam pemodelan ARIMA dan deteksi outlier [6].
Pemodelan ARIMA mencakup tiga tahapan utama, yaitu identifikasi, estimasi, dan cek diagnosa.
Tahapan selanjutnya yang diuraikan dalam makalah ini adalah cara mendeteksi outlier dan implikasinya
terhadap akurasi ketepatan model. Secara umum, tujuan penulisan makalah ini adalah mendapatkan
suatu model curah hujan yang tepat dan handal. Ukuran ketepatan model ditunjukkan dengan
kriteria atau besaran statistik yang biasa digunakan dalam analisa statistik terhadap persoalan
pengukuran di lapangan, seperti hasil ukur curah hujan.
2. METODOLOGI
Sumber data yang digunakan untuk pemodelan mengacu pada makalah [7]. Untuk pemodelan
digunakan data curah hujan yang terjadi pada 1 Maret 2007.
Model yang akan digunakan seperti flowchart pada makalah [8]. Pada metode ini langkah-langkah
perbaikan sistem dilakukan dengan manual satu persatu memasukkan efek outlier dengan coba-
coba sehingga MSE menurun.
Seperti pada [8], pada tahap awal dilakukan transformasi log-natural pada data asli untuk
memenuhi stasioner data dalam varians. Selanjutnya dilakukan differencing pada data
transformasi agar memenuhi data yang stasioner dalam mean. Identifikasi ACF dan PACF dari data
yang sudah stasioner dalam mean dan varians digunakan untuk mendapatkan orde model ARIMA
dugaan. Tahap selanjutnya adalah identifikasi, estimasi
dan cek diagnosa model ARIMA, serta deteksi outlier. Pada tahap identifikasi menunjukkan data
hasil transformasi log-natural belum stasioner dalam mean, sehingga perlu dilakukan differencing.
Hasil differencing d=1 menunjukkan bahwa data telah stasioner. Model dugaan yang diperoleh pada
tahap ini adalah AR2, sehingga secara lengkap model yang diduga adalah ARIMA2,1,0.
Gambar 1: Alur model dengan efek outlier
Model lain yang disampaikan pada makalah ini seperti pada diagram pada gambar 1 disebut dengan
metode B. Metode ini memberikan fasilitas pemodelan ARIMA dan deteksi outlier secara
otomatis dengan jumlah outlier yang ditentukan terlebih dahulu. Penggunaan fasilitas pemodelan ini
dapat menghindari terjadinya ‘spurious outlier’, dan meminimalisasi terjadinya outlier yang terdeteksi
berulang-ulang.
3. HASIL ANALISA
Pada bagian ini studi kasus penelitian diambil satu contoh data, yaitu akan diberikan hasil
pemodelan dan analisis data. Sebagai data curah hujan yang terjadi pada 1 Maret 2007. Bentuk
grafik curah hujan pada 1 Maret 2007 seperti pada [8]. Berikut adalah hasil setiap tahapan pemodelan
ARIMA dan deteksi outlier.
64
a Output model ARIMA2,1,0 dan deteksi 4
outlier
Ada tiga output utama sebagai hasil dari pemodelan ARIMA dan deteksi outlier. Bagian
pertama adalah output tentang hasil estimasi MLE
Maximum Likehood Estimation model ARIMA dugaan, kedua adalah hasil cek diagnosa,
dan ketiga adalah hasil deteksi outlier. Output menunjukkan bahwa parameter model
ARIMA2,1,0 dugaan adalah signifikan, yang berarti sudah memenuhi syarat kebaikan model.
Hasil cek diagnosa melalui uji Ljung-Box menunjukkan bahwa model ARIMA2,1,0 telah
memenuhi syarat white noise, yang berarti bahwa model sudah sesuai.
Dari output deteksi outlier dapat dijelaskan bahwa ada kejadian outlier pada pengamatan t =
237, 153, 76, dan 192. Jenis outlier yang teridentifikasi ada dua macam, yaitu outlier additive
pada data t = 237, dan 192, dan outlier level shift pada pengamatan t = 153, dan 76. Tahap
selanjutnya adalah pemodelan ARIMA dengan memasukan efek outlier secara iteratif, yaitu efek
satu per satu dari keempat outlier yang terdeteksi tersebut.
b Model ARIMA2,1,0 dengan memasukkan
efek outlier additive di t = 237, dan deteksi 3 outlier lain
Berikut ini adalah hasil estimasi parameter model dengan memasukkan efek outlier di t = 237,
khususnya nilai MSE dan deteksi 3 outlier yang lain. Output menunjukkan bahwa MSE model
mengalami penurunan yang signifikan dibanding model ARIMA sebelumnya, yaitu dari 0,307514
menjadi 0,153795.
Dari output deteksi outlier dapat dijelaskan bahwa ada kejadian outlier pada pengamatan t =
153, 91, dan 76. Jenis outlier yang teridentifikasi ada dua macam, yaitu outlier additive pada data t =
91 dan outlier level shift pada pengamatan t = 153, dan 76. Tahap selanjutnya adalah pemodelan
ARIMA dengan memasukan efek outlier secara iteratif, yaitu efek satu per satu dari 3 outlier yang
terdeteksi tersebut.
c Model ARIMA2,1,0 dengan memasukkan
efek 2 outlier pertama, dan deteksi 2 outlier yang lain
Hasil estimasi parameter model ARIMA2,1,0 dengan memasukkan 2 efek outlier di t = 237, dan
153, khususnya nilai MSE serta deteksi 2 outlier yang lain. Output menunjukkan bahwa ada
penurunan nilai MSE dibanding model sebelumnya, yaitu dari 0,153795 menjadi 0,143494.
Dari output deteksi outlier dapat dijelaskan bahwa ada kejadian outlier pada pengamatan t = 76,
dan 194. Jenis outlier yang teridentifikasi ada satu macam, yaitu outlier shift pada pengamatan t = 76,
dan 194. Tahap selanjutnya adalah pemodelan ARIMA dengan memasukan efek outlier secara
iteratif, yaitu efek satu per satu dari 2 outlier yang terdeteksi tersebut.
d Model ARIMA2,1,0 dengan memasukkan
efek 3 outlier pertama, dan deteksi 1 outlier yang lain
Seperti pada bagian sebelumnya, berikut ini adalah hasil estimasi parameter model dengan
memasukkan efek 3 outlier di t = 237, 153 dan 76, khususnya nilai MSEMean square error dan
deteksi 1 outlier yang lain. Dari output MLE dapat dijelaskan bahwa ada penurunan nilai MSE
dibanding model sebelumnya, yaitu dari 0,143494 menjadi 0,137983.
Dari output deteksi outlier dapat dijelaskan bahwa ada kejadian outlier pada pengamatan t =
194. Jenis outlier yang teridentifikasi ada satu macam, yaitu outlier shift pada pengamatan t = 194.
Tahap selanjutnya adalah pemodelan ARIMA dengan memasukan efek outlier secara iteratif,
yaitu efek satu per satu dari 1 outlier yang terdeteksi tersebut.
e Model ARIMA2,1,0 dengan memasukkan
efek 4 outlier
Hasil estimasi parameter model ARIMA2,1,0 dengan memasukkan efek 4 outlier di t = 237, 153,
76, dan 194, khususnya nilai estimasi dan hasil pengujian signifikansi parameter tersebut.
Hasil ouput ini menunjukkan bahwa nilai estimasi ML Maximum Likehood untuk AR-2
adalah tidak signifikan, karena Pr. ⎜t⎜0,05. Model
ini juga menunjukkan adanya penurunan nilai MSE, yaitu dari 0,137983 menjadi 0,132305. Langkah
selanjutnya adalah mengeliminasi koefisien AR-2, karena koefisien tersebut tidak signifikan.
f Model ARIMA1,1,0 dan ARIMA0,1,1
dengan memasukkan efek 4 outlier.
Hasil estimasi parameter model ARIMA1,1,0 dengan memasukkan efek 4 outlier di t = 237, 153,
76, dan 194, adalah sebagai berikut. Hasil menunjukkan bahwa model ARIMA1,1,0 dengan
efek 4 outlier memberikan nilai estimasi parameter yang semuanya signifikan. Perbandingan nilai MSE
menunjukkan bahwa MSE model ini 0,132828 lebih besar dibanding model sebelumnya
0,132305.
Pada bagian selanjutnya akan dicobakan model ARIMA yang lain, yaitu model ARIMA0,1,1,
65
dengan memasukkan efek dari keempat outlier sebelumnya. Berikut ini adalah hasil estimasi dan
uji signifikansi parameter model. Hasil pada output MLE menunjukkan bahwa
model ARIMA0,1,1 dengan efek 4 outlier memberikan nilai estimasi parameter model yang
semuanya signifikan. Perbandingan nilai MSE menunjukkan bahwa MSE model ini 0,134258
lebih besar dibanding model sebelumnya 0,132305
Perbandingan lengkap berkaitan dengan akurasi prediksi yang ditunjukkan oleh nilai MSE
dari model-model yang telah dicobakan secara lengkap dapat dilihat pada tabel 1. Dari tabel 1
dapat dijelaskan bahwa model ARIMA2,1,0 menghasilkan nilai MSE yang paling kecil. Namun
karena ada parameter model yang tidak signifikan pada level pengujian 0,05, maka model ini tidak
dipilih sebagai model terbaik untuk prediksi data curah hujan. Dengan demikian, model yang dipilih
sebagai model terbaik untuk prediksi data curah hujan adalah model ARIMA 1,1,0 dengan
memasukkan efek 4 outlier yang telah teridentifikasi, dengan MSE sebesar 0,132828.
Pemilihan model ARIMA1,1,0 ini juga didukung oleh besaran SBC Schwarz Bayesian Criterion,
yang menunjukkan bahwa SBC terkecil pada model ARIMA1,1,0.
Nilai MSE pada ARIMA1,1,0 adalah sebesar 0,132828, sedangkan MSE pada ARIMA0,1,1
sebesar 0,134258. Jadi model ARIMA1,1,0 lebih baik jika dibandingkan model ARIMA0,1,1,
dengan perbaikan penurunan MSE sebesar 1,1. Hasil perbandingan di atas juga menunjukkan
bahwa MSE pada model ARIMA1,1,0 dengan SAS jika dibandingkan dengan nilai MSE dari
model ARIMA2,1,0 dengan metode A mengalami perbaikan penurunan MSE, yaitu sebesar 44.
Pada tabel 1 ditunjukkan hasil estimasi parameter dari beberapa model yang diperoleh.
Terlihat pada tabel 1 model dengan MSE paling kecil terjadi pada model 7. Dengan demikian,
model terbaik yang diperoleh pada data curah hujan ini adalah model ARIMA1,1,0 dengan deteksi 4
outlier, yang secara matematis dapat ditulis dalam bentuk :
LnYt =
–
0,3942 LnYt
–
1
–
5,10536 X
1
t + 1,61283 X
2
t + 1,09859 X
3
t + 1,06430 X
4
t.
4. KESIMPULAN