MODEL STATE SPACE PADA PENANGANAN DATA D
TUGAS UAS ANALISIS DERET WAKTU
“MODEL STATE SPACE”
Kelompok V
Leny Yuliani
Riwi Diah Pangesti
Vitri Aprilla Handayani
(G152140421)
(G152140121)
(G152140311)
PROGRAM STUDI STATISTIKA TERAPAN
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
2015
I PENDAHULUAN
Latar Belakang
Data series atau data deret waktu merupakan data yang mengGambar.kan
suatu kejadian dari waktu ke waktu atau periode yang saling berkorelasi. Data
deret waktu biasanya digunakan untuk melakukan analisis data dengan
memertimbangkan pengaruh waktu. Analisis deret waktu terbagi menjadi dua
yaitu analisis deret peubah tunggal dan analisis deret peubah ganda. Pada analisis
deret peubah tunggal metode yang digunakan antara lain metode dekomposisi,
pemulusan eksponensial tunggal (Single Exponential Smoothing/SES), dan
ARIMA. Pada analisis deret peubah ganda metode yang digunakan antara lain
model fungsi transfer, model intervensi, analisis fourier, analisis spectral, dan
Vektor Autoregresive (VAR). Sedangkan, model analisis yang dapat digunakan
untuk anaisis data deret waktu peubah tunggal dan analisis deret waktu peubah
ganda adalah model state space.
Model state space merupakan suatu pendekatan yang digunakan untuk
memodelkan dan memprediksi beberapa data deret waktu yang saling
berhubungan secara bersamaan, dimana peubah yang ada didalamnya mempunyai
interaksi yang dinamis dan untuk melihat peubah dalam data deret waktu yang
tidak terobservasi (state vector). Pada penulisan makalah ini akan dibahas lebih
lanjut penerapan model state space pada data deret waktu peubah ganda.
Tujuan Penulisan Makalah
Adapun tujuan dari penulisan makalah ini untuk memodelkan data deret
waktu peubah ganda dan melakukan peramalan menggunakan model state space
model.
2
II LANDASAN TEORI
Data Deret Waktu
Data deret waktu merupakan data yang dipengaruhi oleh periode waktu
sehingga ada korelasi antar pengamatan. Data ini umumnya berisi kumpulan dari
kejadian tertentu yang diperoleh dalam interval tertentu seperti dalam waktu
mingguan, bulanan atau tahunan (Montgomery, et. al., 1990).
Data Stasioner
Pemodelan data deret waktu X1, X2, ..., Xtdidasarkan pada syarat asumsi bahwa
data deret waktu harus stasioner. Secara teoritis dapat dituliskan sebagai berikut :
E ( X t )=E (X t −k )
Var ( X t ) =Var (X t−k )
Cov ( X t , X s ) =Cov ( X t −k , X s−k )
1.
2.
3.
Dengan :
X t : data deret waktuke-t
k
: waktu ketertinggalan (lag)
pemeriksaan kestasioneran dapat dilakukan dengan melihat plot korelasi
terhadap dirinya sendiri. Korelasi terhadap dirinya sendiri merupakan korelasi
antar anggota serangkaian pengamatan yang diurutkan berdasarkan waktu. Fungsi
korelasi terhadap dirinya sendiri dari data stasioner akan menurun cepat
mendekati nol setelah lag kedua atau ketiga. Sedangkan, untuk data yang tidak
stasioner akan cenderung lambat mendekati nol untuk beberapa periode waktu
(Bowerman & O’Connell, 1987).
Data deret waktu yang tidak stasioner dapat distasionerkan dengan cara
mentransformasi, antara lain dengan melakukan pembedaan (Differencing) pada
derajat d. Proses pembedaan biasanya dilakukan sampai dua kali karena data
aktual umumnya tidaklah stasioner hanya pada satu atau dua tahapan (Makridakis
et al.1983).
Unit Root Test
3
Unit root test merupakan uji formal untuk mendeteksi adanya
kestasioneran data. Salah satu uji yang sering digunakan yaitu Dickey-Fuller
(DF). Uji DF terbentuk dari persamaan dan AR(1), yaitu
X t =a1 X t −1+ et
dan
akan stasioner jika -1< a1 < 1. Untuk a1 =1 proses AR(1) tidak stasioner atau
mengandung unit root. Pengaruah kedua sisi persamaan AR(1) di atas dengan
X t −1
ekivalen dengan persamaan :
∇ X t=γX t −1+ et , dimana
γ =a1−1 .
Sehingga uji hipotesis a1=1 ekivalen dengan γ =0 .
Untuk menguji keberadaan intersep dan tren linear pada data, maka
persamaan AR(1) diatas akan berubah menjadi ∇ X t=a0 +a 2 t+ γX t −1+ e t . Untuk
orde yang lebih tinggi uji DF berkembang menjadi uji Augmented Dickey-Fuller
(ADF) yang diGambar.kan sebagai proses AR(p) sebagai berikut (Enders. 1995) :
p
∇ X t=a0 + γ X t −1 + ∑ β i ∇ X t −i+1 +e i
(2.1)
i=2
Dimana :
(
p
γ =− 1−∑ a i
i=1
)
p
β i =∑ a j
j=1
H0untuk uji ADF adalah data mengandung unit root atau data tidak stasioner.
Hipotesis :
H0 : γ =0
(data tidak stasioner)
H1 : γ 0, x 1,n+k∨n
pn . Dengan demikian komponen
x 1,n+k∨n
xn
pn
dan subset
ke
dalam
^
Γ 1 dilihat apakah
dimasukkan ke dalam state
j
f n tidak berkorelasi
vector. Jika sama dengan 0, maka kombinasi linear dari
dengan
dan
x 1,n+1∨n
dan beberapa komponen
dikeluarkan dari state vector. Pemilihan state vector selesai ketika
tidak ada lagi elemen dari
f n yang tersisa untuk ditambahkan atau dikeluarkan
dari state vector. Untuk setiapproses dari serangkaian analisis korelasi kanonik,
korelasi kanonik terkecil yang signifikan
( ρmin ) dihitung berdasarkan kriteria
informasi dari akaike (Wei. 1989).
C=−n ln ( 1−ρ2min ) −2 [ r ( p+1 ) −q+1 ]
(2.12)
Dimana :
q : dimensi dari f tj pada periode atau proses sekarang
r : orde pada state vector
p : orde dari proses VAR
jika C< 0, dan
ρmin sama dengan 0, atau
ρmin > 0. Jika
ρmin > 0,
x 1,n+1∨n
maka ditambahkan ke dalam state vector.
Untuk pengujian kesignifikanan korelasi kanonik
ρ
salah satu pendekatan
yang dapat digunakan adalah uji Chi-Square ( χ 2 ¿ dengan hipotesis :
H0 :
ρ=0
H1 :
ρ ≠0
Jika
χ 2hit > χ 2α (db ) maka
H 0 ditolak, artinya korelasi kanonik signifikan.
Pendugaan Parameter
Wei (1989), setelah model state space diidentifikasikan, salah satu
pendugaan parameter model state space dengan menggunakan pendekatan
12
maksimum likelihood. Prosedur ini dilakukan secara iteratif, dugaan yang
dilakukan diperoleh dari analisis kanonik dan digunakan untuk memperoleh
penduga yang efisien bagi F, G, dan ∑. Pada proses pendugaan ini, salah satu
elemen pada F dan G pasti ada yangbesar nilainya kostan seperti 0 dan 1.
Untuk serangkaian n observasi
B
x1 , x2 , ⋯ , xn
sebagai backshift operator maka diperoleh
−1
e t=[ H ( I −FB ) G ] x t
−1
karena
−1
x t=( I −FB ) ¿t .
−1
x t=H ( I −FB ) ¿ t
dan
sehingga diperoleh fungsi log likelihood sebagai
berikut :
ln L( F , G ,∑∨x 1 , x 2 ,⋯ , x n)∞−(n/2) ln∨∑∨−(1/2) tr ∑−1 S(F ,G)
(2.13)
Dimana :
n
S ( F , G )=∑ e t e 't
t=1
Kalman Filter
Kalman filter merupakan pendekatan yang paling umum terhadap
penaksiran dan pendugaan statistik. Hal ini telah ditunjukkan oleh Harrison dan
Stevens (1975a) yang menyatakan bahwa semua metode peramalan merupakan
kasus khusus kalman filter. Dalam hal ini, kalman filter dapat menangani
perubahan dalam model, parameter dan varians atau keragaman.
Kalman filter terdiri dari dua pendugaan bebas untuk membentuk
pendugaan terbobot. Pendugaan dapat didasarkan pada pengetahuan yang lalu
maupun didasarkan pada informasi (data) baru. Kalman filter bertujuan untuk
mengkombinasikan kedua informasi untuk memperoleh pendugaan yang
diperbaiki. Hal ini, sama dengan pendekatan bayes yang mengkombinasikan
informasi “prior” dan “penarikan contoh” untuk memperoleh distribusi posterior
(Makridakis et al, 1999).
13
Menurut Wei (1989), kalman filter merupakan prosedur rekursif yang
digunakan untuk melakukan dari state vector. Kalman filter merupakan prosedur
pembaharuan secara rekursif yang terdiri dari pembentukan dugaan awal dari
state kemudian merevisi dugaan dengan menambahkan koreksi pada dugaan awal.
Besarnya koreksi ditentukan oleh seberapa baik dugaan awal memprediksi
observasi baru.
Keakuratan peramalan
^x t (l)
bergantungpada kualitas pendugaan
^z t
dari state vector zt.Ketika sebuah informasi yang baru tersedia, harus dilakukan
pembaharuan state vector, hal yang sama dilakukan untuk peramalannya juga.
Melalui
pendekatan
teorema
p ( zt|x t−1 ) ∞ p ( x t−1|z t−1 , xt ) p ( y t−1∨x t )
bayes
diperoleh
p ( zt +1|x t )
sebaran posterior
sebaran prior untuk mengetahui sebaran posterior yang baru, yaitu
dimana observasi
x t+1
:
menjadi
p ( zt +1|x t +1 ) ,
tersedia. Dalam hal ini, anggap bahwa sebaran posterior
dari state vector zt pada waktu ke-t yaitu
p ( zt|x t )
mengiku sebaran normal
dengan rataan ztdan matriks kovarian Γ t p ( z t|x t ) N ( z^ t , Γ t ) .
Pada waktu t+1, ketika observasi
x t+1
tersedia, state vector dapat
diperbaharui dan diperoleh sebaran posterior baru
p ( zt +1|x t +1 ) .
ekuivalen dengan peramalan error e t+ 1 maka untuk memperoleh
hanya
perlu
menemukan
sebaran
posterior
dari
x t+1
p ( zt +1|x t +1 )
( z t +1|et +1 , xt ) , yaitu
p ( zt +1|e t +1 , x t ) N ( z^ t +1 , Γ t +1)
Dimana :
^z t+ 1=F ^x t + Rt +1 H ' ( Ω+ HRt +1 H ' )−1 et +1
¿ F ^x t + K t +1 (x t +1−^x t ( 1 ))
Γ t +1=Rt +1 −R t +1 H ' ( Ω+ HR t +1 H
' −1
)
(2.14)
HR t +1
¿ Rt +1−K t +1 HRt +1
¿( I −K t +1 H)(F Γ t F ' +G ∑G)
(2.15)
14
Dengan
K t +1=Rt +1 H ' ( Ω+ HR t+ 1 H
' −1
)
dan
Rt +1=F Γ t F ' +G∑G '
.
Persamaan (2.14) dan (2.15) merupakan formula rekursif dasar yang
digunakan untuk memperbaharui rataan dan matriks kovarian serta sebaran dari
state vector
z t+ 1 setelah observasi baru yaitu
yang telah diperbaharui yaitu ^z t+ 1
x t+1
tersedia.dugaan dari state
merupakan penjumlahan
F ^z t +1 , yaitu
dugaan dari observasi sampai periode waktu ke-t, dengan peramalan error 1
langkah kedepan yaitu
e t+ 1=x t+1 − ^xt (l) . Matriks
K t +1 disebut juga dengan
kalman gain, yang menentukan bobot untuk peramalan error.
Ketepatan Model Peramalan
Ketepatan peramalan dihitung dengan menggunaan rataan presentase kesalahan
absolut (Mean Absolute percentage Error, MAPE). Secara matematis MAPE
dapat dituliskan sebagai berikut :
n
∑
MAPE=
t=1
| |
x t− x^ t
xt
× 100
n
(2.16)
Dimana :
x t : nilai aktual
^x t : nilai hasil peramalan
Semakin kecil nilai MAPE maka dapat dikatakan data hasil peramalan
mendekati nilai aktualnya (Makridakis et al.1983).
15
III BAHAN DAN METODE
Bahan
Data yang digunakan dalam laporan ini adalah data sekunder yang diperoleh
dalam buku yang dikarang oleh Box dan Jenkins. Data ini berupa konsentrasi gas
u (t)
furnacesebagai
sebagai
y (t)
atau sering disebut peubah input dan persen CO2
atau peubah output.
Metode
1.
2.
Eksplorasi data gas furnace dan CO2 terhadap waktu.
Pemeriksaan kestasioneran data dengan melihat plot data terhadap waktu,
3.
plot ACF dan uji ADF.
Jika data tidak stasioner maka dilakukan pembedaan atau transformasi
4.
terhadap data asli sampai data bersifat stasioner.
Melakukan pemodelan ARIMA.
a. Ketika data sudah stasioner, maka identifikasi model dilakukan dengan
melihat karakteristik plot ACF dan PACF. Pada tahapan ini, akan
diperoleh model tentatif.
b. Selanjutnya akan dilakukan pendugaan parameter dengan proses trial
and error, yaitu dengan memperkecil ordo
mempunyai
memiliki nilai
p
t -hitung kecil atau menambah ordo
dan
p
dan
q
q
yang
yang
t -hitung besar sehingga diperoleh calon-calon model.
Parameter dipilih yang signifikan.
c. Uji Ljung-Box-Pierce dapat dilakukan untuk menguji kesesuaian model.
Model terbaik memiliki nilai AIC dan SBC terkecil. Pemeriksaan
kesesuaian model juga dapat dilakukan dengan melihat plot RACF dan
RPACF. Pemeriksaan asumsi, yaitu sisaan harus acak dan normal. Jika
tidak ada model yang layak, maka kembali ke langkah (3) untuk
5.
6.
kemudian dicobakan transformasi lain.
Pemodelan VAR dilakukan jika sudah diperoleh data yang stasioner, dan
menghitung nilai AIC untuk setiap model VAR.
Melakukan pemodelan state space.
a. Setelah pemodelan ARMA dan VAR diperoleh, model yang memiliki
b.
nilai AIC terkecil digunakan dalam analisis korelasi kanonik.
Unsur pada state vector disusun dari peubah dari korelasi kanonik yang
nyata.
16
c.
Ketika state space telah ditentukan, maka model state space dapat
diterapkan pada data tersebut. Parameter-parameter dalam state space (
7.
F , G dan Σ ) diduga dengan pendekatan maximum likelihood.
Peramalan beberapa periode kedepan dapat dilakukan setelah parameter-
parameter diduga. Peramalan berdasarkan model state space dapat
8.
dilakukan dengan teknik Kalman filter.
Pengolahan data tersebut dilakukan dengan menggunakan bantuan
perangkat lunak SAS 9.3.
17
IV APLIKASI MODEL STATE SPACE
Data
N
o
1
2
3
4
5
6
⋮
29⋮
4
29
5
29
6
InputGasR
ate
-0.109
0.000
0.178
0.339
0.373
0.441
⋮
⋮
0.017
CO2
53.8
53.6
53.5
53.5
53.4
53.1
⋮
⋮
57.8
-0.182
57.3
-0.262
57.0
Eksplorasi Data
Data diambil setiap interval 9 detik sekali dengan banyak pengambilan
sebanyak 296 kali. Terlihat bahwa rata-rata kecepatan masuk gas adalah -0.056
ft/menit. Sedangkan rata-rata % CO2 yang terdapat di dalam udara selama
pembakaran adalah sebesar 53.509. Hasil uji korelasi menghasilkan nilai-p < α
(0.05), sehingga terdapat hubungan antara tingkat masukan gas (Input Gas Rate)
dengan %CO2 di udara. Nilai korelasi yaitu sebesar -0.484, artinya semakin tinggi
tingkat masukan gas maka semakin rendah %CO2. Hasil uji korelasi dapat dilihat
pada Gambar. 2.
Analisis Menggunakan Software SAS
Gambar. 1. The Statespace Prosedure Box-jenkins
18
Correlations: InputGasRate, CO2
Pearson correlation of InputGasRate and CO2 = -0.484
P-Value = 0.000
Gambar. 2. Nilai korelasi Input Gas Rate dengan %CO2
Pemeriksaan Kestasioneran
Pemodelan state space didasarkan pada data yang stasioner. Sehingga
tahap awal adalah melakukan uji kestasioneran data. Plot data Input Gas Rate dan
CO2 dengan waktu dapat dilihat pada Gambar. 3 dan 4. Dari plot tersebut sekilas
data stasioner dalam rataan, namun perlu diuji formal untuk meyakinkan apakah
data telah stasioner baik rataan dan ragam.
Kestasioneran data dapat dilihat dari plot ACF yang cut off atau tidak
turun secara perlahan. Berdasarkan plot ACF data Gas rate dan CO2 terlihat
keduanya turun secara perlahan (Gambar. 5 dan 6). Hal ini mengindikasikan data
belum stasioner.
Time Series Plot of Gas Rate
3
2
Gas Rate
1
0
-1
-2
-3
1
30
60
90
120
150
Index
180
210
240
270
Gambar. 3 Plot data aktual Gas Rate
Time Series Plot of CO2
62.5
60.0
CO2
57.5
55.0
52.5
50.0
47.5
45.0
1
30
60
90
120
150
Index
180
210
240
270
19
Gambar. 4 Plot data aktual Gas Rate
Gambar. 5 Plot ACF dan PACF data Gas rate
20
Gambar. 6 Plot ACF dan PACF data CO2
Uji dengan melihat plot ACF dan PACF masih bersifat objektif maka
dilakukan uji formal Augmentif Dickey Fuller (ADF). Dengan hipotesis sebagai
berikut :
H0 : data tidak stasioner
H1 : data stasioner
21
Berdasarkan uji ADF data gas rate (Gambar. 7) dapat dilihat nilai-p pada
zero mean yang kurang dari α (0.05) sehingga hipotesis H o ditolak , artinya
data telah stasioner. Sedangakan untuk data CO2 uji ADF menunjukkan data tidak
stasioner darena nilai-p pada zero mean tidak nyata (
“MODEL STATE SPACE”
Kelompok V
Leny Yuliani
Riwi Diah Pangesti
Vitri Aprilla Handayani
(G152140421)
(G152140121)
(G152140311)
PROGRAM STUDI STATISTIKA TERAPAN
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
2015
I PENDAHULUAN
Latar Belakang
Data series atau data deret waktu merupakan data yang mengGambar.kan
suatu kejadian dari waktu ke waktu atau periode yang saling berkorelasi. Data
deret waktu biasanya digunakan untuk melakukan analisis data dengan
memertimbangkan pengaruh waktu. Analisis deret waktu terbagi menjadi dua
yaitu analisis deret peubah tunggal dan analisis deret peubah ganda. Pada analisis
deret peubah tunggal metode yang digunakan antara lain metode dekomposisi,
pemulusan eksponensial tunggal (Single Exponential Smoothing/SES), dan
ARIMA. Pada analisis deret peubah ganda metode yang digunakan antara lain
model fungsi transfer, model intervensi, analisis fourier, analisis spectral, dan
Vektor Autoregresive (VAR). Sedangkan, model analisis yang dapat digunakan
untuk anaisis data deret waktu peubah tunggal dan analisis deret waktu peubah
ganda adalah model state space.
Model state space merupakan suatu pendekatan yang digunakan untuk
memodelkan dan memprediksi beberapa data deret waktu yang saling
berhubungan secara bersamaan, dimana peubah yang ada didalamnya mempunyai
interaksi yang dinamis dan untuk melihat peubah dalam data deret waktu yang
tidak terobservasi (state vector). Pada penulisan makalah ini akan dibahas lebih
lanjut penerapan model state space pada data deret waktu peubah ganda.
Tujuan Penulisan Makalah
Adapun tujuan dari penulisan makalah ini untuk memodelkan data deret
waktu peubah ganda dan melakukan peramalan menggunakan model state space
model.
2
II LANDASAN TEORI
Data Deret Waktu
Data deret waktu merupakan data yang dipengaruhi oleh periode waktu
sehingga ada korelasi antar pengamatan. Data ini umumnya berisi kumpulan dari
kejadian tertentu yang diperoleh dalam interval tertentu seperti dalam waktu
mingguan, bulanan atau tahunan (Montgomery, et. al., 1990).
Data Stasioner
Pemodelan data deret waktu X1, X2, ..., Xtdidasarkan pada syarat asumsi bahwa
data deret waktu harus stasioner. Secara teoritis dapat dituliskan sebagai berikut :
E ( X t )=E (X t −k )
Var ( X t ) =Var (X t−k )
Cov ( X t , X s ) =Cov ( X t −k , X s−k )
1.
2.
3.
Dengan :
X t : data deret waktuke-t
k
: waktu ketertinggalan (lag)
pemeriksaan kestasioneran dapat dilakukan dengan melihat plot korelasi
terhadap dirinya sendiri. Korelasi terhadap dirinya sendiri merupakan korelasi
antar anggota serangkaian pengamatan yang diurutkan berdasarkan waktu. Fungsi
korelasi terhadap dirinya sendiri dari data stasioner akan menurun cepat
mendekati nol setelah lag kedua atau ketiga. Sedangkan, untuk data yang tidak
stasioner akan cenderung lambat mendekati nol untuk beberapa periode waktu
(Bowerman & O’Connell, 1987).
Data deret waktu yang tidak stasioner dapat distasionerkan dengan cara
mentransformasi, antara lain dengan melakukan pembedaan (Differencing) pada
derajat d. Proses pembedaan biasanya dilakukan sampai dua kali karena data
aktual umumnya tidaklah stasioner hanya pada satu atau dua tahapan (Makridakis
et al.1983).
Unit Root Test
3
Unit root test merupakan uji formal untuk mendeteksi adanya
kestasioneran data. Salah satu uji yang sering digunakan yaitu Dickey-Fuller
(DF). Uji DF terbentuk dari persamaan dan AR(1), yaitu
X t =a1 X t −1+ et
dan
akan stasioner jika -1< a1 < 1. Untuk a1 =1 proses AR(1) tidak stasioner atau
mengandung unit root. Pengaruah kedua sisi persamaan AR(1) di atas dengan
X t −1
ekivalen dengan persamaan :
∇ X t=γX t −1+ et , dimana
γ =a1−1 .
Sehingga uji hipotesis a1=1 ekivalen dengan γ =0 .
Untuk menguji keberadaan intersep dan tren linear pada data, maka
persamaan AR(1) diatas akan berubah menjadi ∇ X t=a0 +a 2 t+ γX t −1+ e t . Untuk
orde yang lebih tinggi uji DF berkembang menjadi uji Augmented Dickey-Fuller
(ADF) yang diGambar.kan sebagai proses AR(p) sebagai berikut (Enders. 1995) :
p
∇ X t=a0 + γ X t −1 + ∑ β i ∇ X t −i+1 +e i
(2.1)
i=2
Dimana :
(
p
γ =− 1−∑ a i
i=1
)
p
β i =∑ a j
j=1
H0untuk uji ADF adalah data mengandung unit root atau data tidak stasioner.
Hipotesis :
H0 : γ =0
(data tidak stasioner)
H1 : γ 0, x 1,n+k∨n
pn . Dengan demikian komponen
x 1,n+k∨n
xn
pn
dan subset
ke
dalam
^
Γ 1 dilihat apakah
dimasukkan ke dalam state
j
f n tidak berkorelasi
vector. Jika sama dengan 0, maka kombinasi linear dari
dengan
dan
x 1,n+1∨n
dan beberapa komponen
dikeluarkan dari state vector. Pemilihan state vector selesai ketika
tidak ada lagi elemen dari
f n yang tersisa untuk ditambahkan atau dikeluarkan
dari state vector. Untuk setiapproses dari serangkaian analisis korelasi kanonik,
korelasi kanonik terkecil yang signifikan
( ρmin ) dihitung berdasarkan kriteria
informasi dari akaike (Wei. 1989).
C=−n ln ( 1−ρ2min ) −2 [ r ( p+1 ) −q+1 ]
(2.12)
Dimana :
q : dimensi dari f tj pada periode atau proses sekarang
r : orde pada state vector
p : orde dari proses VAR
jika C< 0, dan
ρmin sama dengan 0, atau
ρmin > 0. Jika
ρmin > 0,
x 1,n+1∨n
maka ditambahkan ke dalam state vector.
Untuk pengujian kesignifikanan korelasi kanonik
ρ
salah satu pendekatan
yang dapat digunakan adalah uji Chi-Square ( χ 2 ¿ dengan hipotesis :
H0 :
ρ=0
H1 :
ρ ≠0
Jika
χ 2hit > χ 2α (db ) maka
H 0 ditolak, artinya korelasi kanonik signifikan.
Pendugaan Parameter
Wei (1989), setelah model state space diidentifikasikan, salah satu
pendugaan parameter model state space dengan menggunakan pendekatan
12
maksimum likelihood. Prosedur ini dilakukan secara iteratif, dugaan yang
dilakukan diperoleh dari analisis kanonik dan digunakan untuk memperoleh
penduga yang efisien bagi F, G, dan ∑. Pada proses pendugaan ini, salah satu
elemen pada F dan G pasti ada yangbesar nilainya kostan seperti 0 dan 1.
Untuk serangkaian n observasi
B
x1 , x2 , ⋯ , xn
sebagai backshift operator maka diperoleh
−1
e t=[ H ( I −FB ) G ] x t
−1
karena
−1
x t=( I −FB ) ¿t .
−1
x t=H ( I −FB ) ¿ t
dan
sehingga diperoleh fungsi log likelihood sebagai
berikut :
ln L( F , G ,∑∨x 1 , x 2 ,⋯ , x n)∞−(n/2) ln∨∑∨−(1/2) tr ∑−1 S(F ,G)
(2.13)
Dimana :
n
S ( F , G )=∑ e t e 't
t=1
Kalman Filter
Kalman filter merupakan pendekatan yang paling umum terhadap
penaksiran dan pendugaan statistik. Hal ini telah ditunjukkan oleh Harrison dan
Stevens (1975a) yang menyatakan bahwa semua metode peramalan merupakan
kasus khusus kalman filter. Dalam hal ini, kalman filter dapat menangani
perubahan dalam model, parameter dan varians atau keragaman.
Kalman filter terdiri dari dua pendugaan bebas untuk membentuk
pendugaan terbobot. Pendugaan dapat didasarkan pada pengetahuan yang lalu
maupun didasarkan pada informasi (data) baru. Kalman filter bertujuan untuk
mengkombinasikan kedua informasi untuk memperoleh pendugaan yang
diperbaiki. Hal ini, sama dengan pendekatan bayes yang mengkombinasikan
informasi “prior” dan “penarikan contoh” untuk memperoleh distribusi posterior
(Makridakis et al, 1999).
13
Menurut Wei (1989), kalman filter merupakan prosedur rekursif yang
digunakan untuk melakukan dari state vector. Kalman filter merupakan prosedur
pembaharuan secara rekursif yang terdiri dari pembentukan dugaan awal dari
state kemudian merevisi dugaan dengan menambahkan koreksi pada dugaan awal.
Besarnya koreksi ditentukan oleh seberapa baik dugaan awal memprediksi
observasi baru.
Keakuratan peramalan
^x t (l)
bergantungpada kualitas pendugaan
^z t
dari state vector zt.Ketika sebuah informasi yang baru tersedia, harus dilakukan
pembaharuan state vector, hal yang sama dilakukan untuk peramalannya juga.
Melalui
pendekatan
teorema
p ( zt|x t−1 ) ∞ p ( x t−1|z t−1 , xt ) p ( y t−1∨x t )
bayes
diperoleh
p ( zt +1|x t )
sebaran posterior
sebaran prior untuk mengetahui sebaran posterior yang baru, yaitu
dimana observasi
x t+1
:
menjadi
p ( zt +1|x t +1 ) ,
tersedia. Dalam hal ini, anggap bahwa sebaran posterior
dari state vector zt pada waktu ke-t yaitu
p ( zt|x t )
mengiku sebaran normal
dengan rataan ztdan matriks kovarian Γ t p ( z t|x t ) N ( z^ t , Γ t ) .
Pada waktu t+1, ketika observasi
x t+1
tersedia, state vector dapat
diperbaharui dan diperoleh sebaran posterior baru
p ( zt +1|x t +1 ) .
ekuivalen dengan peramalan error e t+ 1 maka untuk memperoleh
hanya
perlu
menemukan
sebaran
posterior
dari
x t+1
p ( zt +1|x t +1 )
( z t +1|et +1 , xt ) , yaitu
p ( zt +1|e t +1 , x t ) N ( z^ t +1 , Γ t +1)
Dimana :
^z t+ 1=F ^x t + Rt +1 H ' ( Ω+ HRt +1 H ' )−1 et +1
¿ F ^x t + K t +1 (x t +1−^x t ( 1 ))
Γ t +1=Rt +1 −R t +1 H ' ( Ω+ HR t +1 H
' −1
)
(2.14)
HR t +1
¿ Rt +1−K t +1 HRt +1
¿( I −K t +1 H)(F Γ t F ' +G ∑G)
(2.15)
14
Dengan
K t +1=Rt +1 H ' ( Ω+ HR t+ 1 H
' −1
)
dan
Rt +1=F Γ t F ' +G∑G '
.
Persamaan (2.14) dan (2.15) merupakan formula rekursif dasar yang
digunakan untuk memperbaharui rataan dan matriks kovarian serta sebaran dari
state vector
z t+ 1 setelah observasi baru yaitu
yang telah diperbaharui yaitu ^z t+ 1
x t+1
tersedia.dugaan dari state
merupakan penjumlahan
F ^z t +1 , yaitu
dugaan dari observasi sampai periode waktu ke-t, dengan peramalan error 1
langkah kedepan yaitu
e t+ 1=x t+1 − ^xt (l) . Matriks
K t +1 disebut juga dengan
kalman gain, yang menentukan bobot untuk peramalan error.
Ketepatan Model Peramalan
Ketepatan peramalan dihitung dengan menggunaan rataan presentase kesalahan
absolut (Mean Absolute percentage Error, MAPE). Secara matematis MAPE
dapat dituliskan sebagai berikut :
n
∑
MAPE=
t=1
| |
x t− x^ t
xt
× 100
n
(2.16)
Dimana :
x t : nilai aktual
^x t : nilai hasil peramalan
Semakin kecil nilai MAPE maka dapat dikatakan data hasil peramalan
mendekati nilai aktualnya (Makridakis et al.1983).
15
III BAHAN DAN METODE
Bahan
Data yang digunakan dalam laporan ini adalah data sekunder yang diperoleh
dalam buku yang dikarang oleh Box dan Jenkins. Data ini berupa konsentrasi gas
u (t)
furnacesebagai
sebagai
y (t)
atau sering disebut peubah input dan persen CO2
atau peubah output.
Metode
1.
2.
Eksplorasi data gas furnace dan CO2 terhadap waktu.
Pemeriksaan kestasioneran data dengan melihat plot data terhadap waktu,
3.
plot ACF dan uji ADF.
Jika data tidak stasioner maka dilakukan pembedaan atau transformasi
4.
terhadap data asli sampai data bersifat stasioner.
Melakukan pemodelan ARIMA.
a. Ketika data sudah stasioner, maka identifikasi model dilakukan dengan
melihat karakteristik plot ACF dan PACF. Pada tahapan ini, akan
diperoleh model tentatif.
b. Selanjutnya akan dilakukan pendugaan parameter dengan proses trial
and error, yaitu dengan memperkecil ordo
mempunyai
memiliki nilai
p
t -hitung kecil atau menambah ordo
dan
p
dan
q
q
yang
yang
t -hitung besar sehingga diperoleh calon-calon model.
Parameter dipilih yang signifikan.
c. Uji Ljung-Box-Pierce dapat dilakukan untuk menguji kesesuaian model.
Model terbaik memiliki nilai AIC dan SBC terkecil. Pemeriksaan
kesesuaian model juga dapat dilakukan dengan melihat plot RACF dan
RPACF. Pemeriksaan asumsi, yaitu sisaan harus acak dan normal. Jika
tidak ada model yang layak, maka kembali ke langkah (3) untuk
5.
6.
kemudian dicobakan transformasi lain.
Pemodelan VAR dilakukan jika sudah diperoleh data yang stasioner, dan
menghitung nilai AIC untuk setiap model VAR.
Melakukan pemodelan state space.
a. Setelah pemodelan ARMA dan VAR diperoleh, model yang memiliki
b.
nilai AIC terkecil digunakan dalam analisis korelasi kanonik.
Unsur pada state vector disusun dari peubah dari korelasi kanonik yang
nyata.
16
c.
Ketika state space telah ditentukan, maka model state space dapat
diterapkan pada data tersebut. Parameter-parameter dalam state space (
7.
F , G dan Σ ) diduga dengan pendekatan maximum likelihood.
Peramalan beberapa periode kedepan dapat dilakukan setelah parameter-
parameter diduga. Peramalan berdasarkan model state space dapat
8.
dilakukan dengan teknik Kalman filter.
Pengolahan data tersebut dilakukan dengan menggunakan bantuan
perangkat lunak SAS 9.3.
17
IV APLIKASI MODEL STATE SPACE
Data
N
o
1
2
3
4
5
6
⋮
29⋮
4
29
5
29
6
InputGasR
ate
-0.109
0.000
0.178
0.339
0.373
0.441
⋮
⋮
0.017
CO2
53.8
53.6
53.5
53.5
53.4
53.1
⋮
⋮
57.8
-0.182
57.3
-0.262
57.0
Eksplorasi Data
Data diambil setiap interval 9 detik sekali dengan banyak pengambilan
sebanyak 296 kali. Terlihat bahwa rata-rata kecepatan masuk gas adalah -0.056
ft/menit. Sedangkan rata-rata % CO2 yang terdapat di dalam udara selama
pembakaran adalah sebesar 53.509. Hasil uji korelasi menghasilkan nilai-p < α
(0.05), sehingga terdapat hubungan antara tingkat masukan gas (Input Gas Rate)
dengan %CO2 di udara. Nilai korelasi yaitu sebesar -0.484, artinya semakin tinggi
tingkat masukan gas maka semakin rendah %CO2. Hasil uji korelasi dapat dilihat
pada Gambar. 2.
Analisis Menggunakan Software SAS
Gambar. 1. The Statespace Prosedure Box-jenkins
18
Correlations: InputGasRate, CO2
Pearson correlation of InputGasRate and CO2 = -0.484
P-Value = 0.000
Gambar. 2. Nilai korelasi Input Gas Rate dengan %CO2
Pemeriksaan Kestasioneran
Pemodelan state space didasarkan pada data yang stasioner. Sehingga
tahap awal adalah melakukan uji kestasioneran data. Plot data Input Gas Rate dan
CO2 dengan waktu dapat dilihat pada Gambar. 3 dan 4. Dari plot tersebut sekilas
data stasioner dalam rataan, namun perlu diuji formal untuk meyakinkan apakah
data telah stasioner baik rataan dan ragam.
Kestasioneran data dapat dilihat dari plot ACF yang cut off atau tidak
turun secara perlahan. Berdasarkan plot ACF data Gas rate dan CO2 terlihat
keduanya turun secara perlahan (Gambar. 5 dan 6). Hal ini mengindikasikan data
belum stasioner.
Time Series Plot of Gas Rate
3
2
Gas Rate
1
0
-1
-2
-3
1
30
60
90
120
150
Index
180
210
240
270
Gambar. 3 Plot data aktual Gas Rate
Time Series Plot of CO2
62.5
60.0
CO2
57.5
55.0
52.5
50.0
47.5
45.0
1
30
60
90
120
150
Index
180
210
240
270
19
Gambar. 4 Plot data aktual Gas Rate
Gambar. 5 Plot ACF dan PACF data Gas rate
20
Gambar. 6 Plot ACF dan PACF data CO2
Uji dengan melihat plot ACF dan PACF masih bersifat objektif maka
dilakukan uji formal Augmentif Dickey Fuller (ADF). Dengan hipotesis sebagai
berikut :
H0 : data tidak stasioner
H1 : data stasioner
21
Berdasarkan uji ADF data gas rate (Gambar. 7) dapat dilihat nilai-p pada
zero mean yang kurang dari α (0.05) sehingga hipotesis H o ditolak , artinya
data telah stasioner. Sedangakan untuk data CO2 uji ADF menunjukkan data tidak
stasioner darena nilai-p pada zero mean tidak nyata (