MODEL STATE SPACE PADA PENANGANAN DATA D

TUGAS UAS ANALISIS DERET WAKTU
“MODEL STATE SPACE”

Kelompok V
Leny Yuliani
Riwi Diah Pangesti
Vitri Aprilla Handayani

(G152140421)
(G152140121)
(G152140311)

PROGRAM STUDI STATISTIKA TERAPAN
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
2015

I PENDAHULUAN
Latar Belakang
Data series atau data deret waktu merupakan data yang mengGambar.kan
suatu kejadian dari waktu ke waktu atau periode yang saling berkorelasi. Data

deret waktu biasanya digunakan untuk melakukan analisis data dengan
memertimbangkan pengaruh waktu. Analisis deret waktu terbagi menjadi dua
yaitu analisis deret peubah tunggal dan analisis deret peubah ganda. Pada analisis
deret peubah tunggal metode yang digunakan antara lain metode dekomposisi,
pemulusan eksponensial tunggal (Single Exponential Smoothing/SES), dan
ARIMA. Pada analisis deret peubah ganda metode yang digunakan antara lain
model fungsi transfer, model intervensi, analisis fourier, analisis spectral, dan
Vektor Autoregresive (VAR). Sedangkan, model analisis yang dapat digunakan
untuk anaisis data deret waktu peubah tunggal dan analisis deret waktu peubah
ganda adalah model state space.
Model state space merupakan suatu pendekatan yang digunakan untuk
memodelkan dan memprediksi beberapa data deret waktu yang saling
berhubungan secara bersamaan, dimana peubah yang ada didalamnya mempunyai
interaksi yang dinamis dan untuk melihat peubah dalam data deret waktu yang
tidak terobservasi (state vector). Pada penulisan makalah ini akan dibahas lebih
lanjut penerapan model state space pada data deret waktu peubah ganda.
Tujuan Penulisan Makalah
Adapun tujuan dari penulisan makalah ini untuk memodelkan data deret
waktu peubah ganda dan melakukan peramalan menggunakan model state space
model.


2

II LANDASAN TEORI
Data Deret Waktu
Data deret waktu merupakan data yang dipengaruhi oleh periode waktu
sehingga ada korelasi antar pengamatan. Data ini umumnya berisi kumpulan dari
kejadian tertentu yang diperoleh dalam interval tertentu seperti dalam waktu
mingguan, bulanan atau tahunan (Montgomery, et. al., 1990).
Data Stasioner
Pemodelan data deret waktu X1, X2, ..., Xtdidasarkan pada syarat asumsi bahwa
data deret waktu harus stasioner. Secara teoritis dapat dituliskan sebagai berikut :
E ( X t )=E (X t −k )
Var ( X t ) =Var (X t−k )
Cov ( X t , X s ) =Cov ( X t −k , X s−k )

1.
2.
3.


Dengan :
X t : data deret waktuke-t
k

: waktu ketertinggalan (lag)

pemeriksaan kestasioneran dapat dilakukan dengan melihat plot korelasi
terhadap dirinya sendiri. Korelasi terhadap dirinya sendiri merupakan korelasi
antar anggota serangkaian pengamatan yang diurutkan berdasarkan waktu. Fungsi
korelasi terhadap dirinya sendiri dari data stasioner akan menurun cepat
mendekati nol setelah lag kedua atau ketiga. Sedangkan, untuk data yang tidak
stasioner akan cenderung lambat mendekati nol untuk beberapa periode waktu
(Bowerman & O’Connell, 1987).
Data deret waktu yang tidak stasioner dapat distasionerkan dengan cara
mentransformasi, antara lain dengan melakukan pembedaan (Differencing) pada
derajat d. Proses pembedaan biasanya dilakukan sampai dua kali karena data
aktual umumnya tidaklah stasioner hanya pada satu atau dua tahapan (Makridakis
et al.1983).

Unit Root Test

3

Unit root test merupakan uji formal untuk mendeteksi adanya
kestasioneran data. Salah satu uji yang sering digunakan yaitu Dickey-Fuller
(DF). Uji DF terbentuk dari persamaan dan AR(1), yaitu

X t =a1 X t −1+ et

dan

akan stasioner jika -1< a1 < 1. Untuk a1 =1 proses AR(1) tidak stasioner atau
mengandung unit root. Pengaruah kedua sisi persamaan AR(1) di atas dengan
X t −1

ekivalen dengan persamaan :

∇ X t=γX t −1+ et , dimana

γ =a1−1 .


Sehingga uji hipotesis a1=1 ekivalen dengan γ =0 .
Untuk menguji keberadaan intersep dan tren linear pada data, maka
persamaan AR(1) diatas akan berubah menjadi ∇ X t=a0 +a 2 t+ γX t −1+ e t . Untuk
orde yang lebih tinggi uji DF berkembang menjadi uji Augmented Dickey-Fuller
(ADF) yang diGambar.kan sebagai proses AR(p) sebagai berikut (Enders. 1995) :
p

∇ X t=a0 + γ X t −1 + ∑ β i ∇ X t −i+1 +e i

(2.1)

i=2

Dimana :

(

p

γ =− 1−∑ a i

i=1

)

p

β i =∑ a j
j=1

H0untuk uji ADF adalah data mengandung unit root atau data tidak stasioner.
Hipotesis :
H0 : γ =0

(data tidak stasioner)

H1 : γ 0, x 1,n+k∨n

pn . Dengan demikian komponen

x 1,n+k∨n


xn

pn

dan subset

ke

dalam

^
Γ 1 dilihat apakah

dimasukkan ke dalam state
j
f n tidak berkorelasi

vector. Jika sama dengan 0, maka kombinasi linear dari
dengan


dan

x 1,n+1∨n

dan beberapa komponen

dikeluarkan dari state vector. Pemilihan state vector selesai ketika

tidak ada lagi elemen dari

f n yang tersisa untuk ditambahkan atau dikeluarkan

dari state vector. Untuk setiapproses dari serangkaian analisis korelasi kanonik,
korelasi kanonik terkecil yang signifikan

( ρmin ) dihitung berdasarkan kriteria

informasi dari akaike (Wei. 1989).
C=−n ln ( 1−ρ2min ) −2 [ r ( p+1 ) −q+1 ]


(2.12)

Dimana :
q : dimensi dari f tj pada periode atau proses sekarang
r : orde pada state vector
p : orde dari proses VAR
jika C< 0, dan

ρmin sama dengan 0, atau

ρmin > 0. Jika

ρmin > 0,

x 1,n+1∨n

maka ditambahkan ke dalam state vector.
Untuk pengujian kesignifikanan korelasi kanonik


ρ

salah satu pendekatan

yang dapat digunakan adalah uji Chi-Square ( χ 2 ¿ dengan hipotesis :
H0 :

ρ=0

H1 :

ρ ≠0

Jika

χ 2hit > χ 2α (db ) maka

H 0 ditolak, artinya korelasi kanonik signifikan.

Pendugaan Parameter

Wei (1989), setelah model state space diidentifikasikan, salah satu
pendugaan parameter model state space dengan menggunakan pendekatan

12

maksimum likelihood. Prosedur ini dilakukan secara iteratif, dugaan yang
dilakukan diperoleh dari analisis kanonik dan digunakan untuk memperoleh
penduga yang efisien bagi F, G, dan ∑. Pada proses pendugaan ini, salah satu
elemen pada F dan G pasti ada yangbesar nilainya kostan seperti 0 dan 1.
Untuk serangkaian n observasi
B

x1 , x2 , ⋯ , xn

sebagai backshift operator maka diperoleh
−1

e t=[ H ( I −FB ) G ] x t
−1

karena

−1

x t=( I −FB ) ¿t .
−1

x t=H ( I −FB ) ¿ t

dan

sehingga diperoleh fungsi log likelihood sebagai

berikut :
ln L( F , G ,∑∨x 1 , x 2 ,⋯ , x n)∞−(n/2) ln∨∑∨−(1/2) tr ∑−1 S(F ,G)

(2.13)

Dimana :
n

S ( F , G )=∑ e t e 't
t=1

Kalman Filter
Kalman filter merupakan pendekatan yang paling umum terhadap
penaksiran dan pendugaan statistik. Hal ini telah ditunjukkan oleh Harrison dan
Stevens (1975a) yang menyatakan bahwa semua metode peramalan merupakan
kasus khusus kalman filter. Dalam hal ini, kalman filter dapat menangani
perubahan dalam model, parameter dan varians atau keragaman.
Kalman filter terdiri dari dua pendugaan bebas untuk membentuk
pendugaan terbobot. Pendugaan dapat didasarkan pada pengetahuan yang lalu
maupun didasarkan pada informasi (data) baru. Kalman filter bertujuan untuk
mengkombinasikan kedua informasi untuk memperoleh pendugaan yang
diperbaiki. Hal ini, sama dengan pendekatan bayes yang mengkombinasikan
informasi “prior” dan “penarikan contoh” untuk memperoleh distribusi posterior
(Makridakis et al, 1999).

13

Menurut Wei (1989), kalman filter merupakan prosedur rekursif yang
digunakan untuk melakukan dari state vector. Kalman filter merupakan prosedur
pembaharuan secara rekursif yang terdiri dari pembentukan dugaan awal dari
state kemudian merevisi dugaan dengan menambahkan koreksi pada dugaan awal.
Besarnya koreksi ditentukan oleh seberapa baik dugaan awal memprediksi
observasi baru.
Keakuratan peramalan

^x t (l)

bergantungpada kualitas pendugaan

^z t

dari state vector zt.Ketika sebuah informasi yang baru tersedia, harus dilakukan
pembaharuan state vector, hal yang sama dilakukan untuk peramalannya juga.
Melalui

pendekatan

teorema

p ( zt|x t−1 ) ∞ p ( x t−1|z t−1 , xt ) p ( y t−1∨x t )

bayes

diperoleh
p ( zt +1|x t )

sebaran posterior

sebaran prior untuk mengetahui sebaran posterior yang baru, yaitu
dimana observasi

x t+1

:
menjadi

p ( zt +1|x t +1 ) ,

tersedia. Dalam hal ini, anggap bahwa sebaran posterior

dari state vector zt pada waktu ke-t yaitu

p ( zt|x t )

mengiku sebaran normal

dengan rataan ztdan matriks kovarian Γ t p ( z t|x t ) N ( z^ t , Γ t ) .
Pada waktu t+1, ketika observasi

x t+1

tersedia, state vector dapat

diperbaharui dan diperoleh sebaran posterior baru

p ( zt +1|x t +1 ) .

ekuivalen dengan peramalan error e t+ 1 maka untuk memperoleh
hanya

perlu

menemukan

sebaran

posterior

dari

x t+1

p ( zt +1|x t +1 )

( z t +1|et +1 , xt ) , yaitu

p ( zt +1|e t +1 , x t ) N ( z^ t +1 , Γ t +1)
Dimana :
^z t+ 1=F ^x t + Rt +1 H ' ( Ω+ HRt +1 H ' )−1 et +1
¿ F ^x t + K t +1 (x t +1−^x t ( 1 ))
Γ t +1=Rt +1 −R t +1 H ' ( Ω+ HR t +1 H

' −1

)

(2.14)

HR t +1

¿ Rt +1−K t +1 HRt +1

¿( I −K t +1 H)(F Γ t F ' +G ∑G)

(2.15)

14

Dengan

K t +1=Rt +1 H ' ( Ω+ HR t+ 1 H

' −1

)

dan

Rt +1=F Γ t F ' +G∑G '

.

Persamaan (2.14) dan (2.15) merupakan formula rekursif dasar yang
digunakan untuk memperbaharui rataan dan matriks kovarian serta sebaran dari
state vector

z t+ 1 setelah observasi baru yaitu

yang telah diperbaharui yaitu ^z t+ 1

x t+1

tersedia.dugaan dari state

merupakan penjumlahan

F ^z t +1 , yaitu

dugaan dari observasi sampai periode waktu ke-t, dengan peramalan error 1
langkah kedepan yaitu

e t+ 1=x t+1 − ^xt (l) . Matriks

K t +1 disebut juga dengan

kalman gain, yang menentukan bobot untuk peramalan error.
Ketepatan Model Peramalan
Ketepatan peramalan dihitung dengan menggunaan rataan presentase kesalahan
absolut (Mean Absolute percentage Error, MAPE). Secara matematis MAPE
dapat dituliskan sebagai berikut :
n


MAPE=

t=1

| |

x t− x^ t
xt
× 100
n

(2.16)

Dimana :
x t : nilai aktual
^x t : nilai hasil peramalan

Semakin kecil nilai MAPE maka dapat dikatakan data hasil peramalan
mendekati nilai aktualnya (Makridakis et al.1983).

15

III BAHAN DAN METODE
Bahan
Data yang digunakan dalam laporan ini adalah data sekunder yang diperoleh
dalam buku yang dikarang oleh Box dan Jenkins. Data ini berupa konsentrasi gas
u (t)

furnacesebagai
sebagai

y (t)

atau sering disebut peubah input dan persen CO2

atau peubah output.
Metode

1.
2.

Eksplorasi data gas furnace dan CO2 terhadap waktu.
Pemeriksaan kestasioneran data dengan melihat plot data terhadap waktu,

3.

plot ACF dan uji ADF.
Jika data tidak stasioner maka dilakukan pembedaan atau transformasi

4.

terhadap data asli sampai data bersifat stasioner.
Melakukan pemodelan ARIMA.
a. Ketika data sudah stasioner, maka identifikasi model dilakukan dengan
melihat karakteristik plot ACF dan PACF. Pada tahapan ini, akan
diperoleh model tentatif.
b. Selanjutnya akan dilakukan pendugaan parameter dengan proses trial
and error, yaitu dengan memperkecil ordo
mempunyai
memiliki nilai

p

t -hitung kecil atau menambah ordo

dan
p

dan

q
q

yang
yang

t -hitung besar sehingga diperoleh calon-calon model.

Parameter dipilih yang signifikan.
c. Uji Ljung-Box-Pierce dapat dilakukan untuk menguji kesesuaian model.
Model terbaik memiliki nilai AIC dan SBC terkecil. Pemeriksaan
kesesuaian model juga dapat dilakukan dengan melihat plot RACF dan
RPACF. Pemeriksaan asumsi, yaitu sisaan harus acak dan normal. Jika
tidak ada model yang layak, maka kembali ke langkah (3) untuk
5.
6.

kemudian dicobakan transformasi lain.
Pemodelan VAR dilakukan jika sudah diperoleh data yang stasioner, dan
menghitung nilai AIC untuk setiap model VAR.
Melakukan pemodelan state space.
a. Setelah pemodelan ARMA dan VAR diperoleh, model yang memiliki
b.

nilai AIC terkecil digunakan dalam analisis korelasi kanonik.
Unsur pada state vector disusun dari peubah dari korelasi kanonik yang
nyata.

16

c.

Ketika state space telah ditentukan, maka model state space dapat
diterapkan pada data tersebut. Parameter-parameter dalam state space (

7.

F , G dan Σ ) diduga dengan pendekatan maximum likelihood.
Peramalan beberapa periode kedepan dapat dilakukan setelah parameter-

parameter diduga. Peramalan berdasarkan model state space dapat
8.

dilakukan dengan teknik Kalman filter.
Pengolahan data tersebut dilakukan dengan menggunakan bantuan
perangkat lunak SAS 9.3.

17

IV APLIKASI MODEL STATE SPACE
Data
N
o
1
2
3
4
5
6

29⋮
4
29
5
29
6

InputGasR
ate
-0.109
0.000
0.178
0.339
0.373
0.441


0.017

CO2
53.8
53.6
53.5
53.5
53.4
53.1


57.8

-0.182

57.3

-0.262

57.0

Eksplorasi Data
Data diambil setiap interval 9 detik sekali dengan banyak pengambilan
sebanyak 296 kali. Terlihat bahwa rata-rata kecepatan masuk gas adalah -0.056
ft/menit. Sedangkan rata-rata % CO2 yang terdapat di dalam udara selama
pembakaran adalah sebesar 53.509. Hasil uji korelasi menghasilkan nilai-p < α
(0.05), sehingga terdapat hubungan antara tingkat masukan gas (Input Gas Rate)
dengan %CO2 di udara. Nilai korelasi yaitu sebesar -0.484, artinya semakin tinggi
tingkat masukan gas maka semakin rendah %CO2. Hasil uji korelasi dapat dilihat
pada Gambar. 2.
Analisis Menggunakan Software SAS

Gambar. 1. The Statespace Prosedure Box-jenkins

18

Correlations: InputGasRate, CO2
Pearson correlation of InputGasRate and CO2 = -0.484
P-Value = 0.000

Gambar. 2. Nilai korelasi Input Gas Rate dengan %CO2

Pemeriksaan Kestasioneran
Pemodelan state space didasarkan pada data yang stasioner. Sehingga
tahap awal adalah melakukan uji kestasioneran data. Plot data Input Gas Rate dan
CO2 dengan waktu dapat dilihat pada Gambar. 3 dan 4. Dari plot tersebut sekilas
data stasioner dalam rataan, namun perlu diuji formal untuk meyakinkan apakah
data telah stasioner baik rataan dan ragam.
Kestasioneran data dapat dilihat dari plot ACF yang cut off atau tidak
turun secara perlahan. Berdasarkan plot ACF data Gas rate dan CO2 terlihat
keduanya turun secara perlahan (Gambar. 5 dan 6). Hal ini mengindikasikan data
belum stasioner.
Time Series Plot of Gas Rate
3
2

Gas Rate

1
0
-1
-2
-3
1

30

60

90

120

150
Index

180

210

240

270

Gambar. 3 Plot data aktual Gas Rate
Time Series Plot of CO2
62.5
60.0

CO2

57.5
55.0
52.5
50.0
47.5
45.0
1

30

60

90

120

150
Index

180

210

240

270

19

Gambar. 4 Plot data aktual Gas Rate

Gambar. 5 Plot ACF dan PACF data Gas rate

20

Gambar. 6 Plot ACF dan PACF data CO2

Uji dengan melihat plot ACF dan PACF masih bersifat objektif maka
dilakukan uji formal Augmentif Dickey Fuller (ADF). Dengan hipotesis sebagai
berikut :
H0 : data tidak stasioner
H1 : data stasioner

21

Berdasarkan uji ADF data gas rate (Gambar. 7) dapat dilihat nilai-p pada
zero mean yang kurang dari α (0.05) sehingga hipotesis H o ditolak , artinya
data telah stasioner. Sedangakan untuk data CO2 uji ADF menunjukkan data tidak
stasioner darena nilai-p pada zero mean tidak nyata (

Dokumen yang terkait

PENGARUH PEMBERIAN SEDUHAN BIJI PEPAYA (Carica Papaya L) TERHADAP PENURUNAN BERAT BADAN PADA TIKUS PUTIH JANTAN (Rattus norvegicus strain wistar) YANG DIBERI DIET TINGGI LEMAK

23 199 21

KEPEKAAN ESCHERICHIA COLI UROPATOGENIK TERHADAP ANTIBIOTIK PADA PASIEN INFEKSI SALURAN KEMIH DI RSU Dr. SAIFUL ANWAR MALANG (PERIODE JANUARI-DESEMBER 2008)

2 106 1

FREKUENSI KEMUNCULAN TOKOH KARAKTER ANTAGONIS DAN PROTAGONIS PADA SINETRON (Analisis Isi Pada Sinetron Munajah Cinta di RCTI dan Sinetron Cinta Fitri di SCTV)

27 310 2

MANAJEMEN PEMROGRAMAN PADA STASIUN RADIO SWASTA (Studi Deskriptif Program Acara Garus di Radio VIS FM Banyuwangi)

29 282 2

ANALISIS PROSPEKTIF SEBAGAI ALAT PERENCANAAN LABA PADA PT MUSTIKA RATU Tbk

273 1263 22

PENERIMAAN ATLET SILAT TENTANG ADEGAN PENCAK SILAT INDONESIA PADA FILM THE RAID REDEMPTION (STUDI RESEPSI PADA IKATAN PENCAK SILAT INDONESIA MALANG)

43 322 21

KONSTRUKSI MEDIA TENTANG KETERLIBATAN POLITISI PARTAI DEMOKRAT ANAS URBANINGRUM PADA KASUS KORUPSI PROYEK PEMBANGUNAN KOMPLEK OLAHRAGA DI BUKIT HAMBALANG (Analisis Wacana Koran Harian Pagi Surya edisi 9-12, 16, 18 dan 23 Februari 2013 )

64 565 20

PEMAKNAAN BERITA PERKEMBANGAN KOMODITI BERJANGKA PADA PROGRAM ACARA KABAR PASAR DI TV ONE (Analisis Resepsi Pada Karyawan PT Victory International Futures Malang)

18 209 45

STRATEGI KOMUNIKASI POLITIK PARTAI POLITIK PADA PEMILIHAN KEPALA DAERAH TAHUN 2012 DI KOTA BATU (Studi Kasus Tim Pemenangan Pemilu Eddy Rumpoko-Punjul Santoso)

119 459 25

PENGARUH BIG FIVE PERSONALITY TERHADAP SIKAP TENTANG KORUPSI PADA MAHASISWA

11 131 124