Analisis Deret Waktu Time Series Analysi
P
Pengenalan
l
Analisis Deret Waktu
(Time Series Analysis)
MA 2081 Statistika Dasar
29 November 2012
Utriweni Mukhaiyar
2
Ilust rasi
• Berikut adalah data rata-rata curah hujan
bulanan yang diam ati dari Stasiun Padaherang
pada tahun 20 0 1 – 20 0 4.
Sum ber : Modul 3 Praktikum Mekanika Medium Kontinu “ Medan Gravitasi”
Tah u n
Jan
Fe b
Mar
Ap r
Me i
2 0 0 1 278.59 279.78 355.29 241.34 115.9
Ju n
Ju l
Agu s t Se p
Okt
Nop
Des
176.9 55.32 29.0 8 43.82 313.68 50 8.49 267.82
2 0 0 2 299.78 245.88 266.64 185.27 122.22 133.1 76.78
32.4
26.0 9 169.0 5 461.62 415.73
2 0 0 3 425.21 370 .8 30 0 .23 157.43 184.96 69.93 23.28 14.39
17.86 275.23 433.23 456.0 2
20 0 4
547.8 30 8.2
388
93
297
128
47
5
87
10 5
389
Apabila
A bil nilai
il i curah
h hhujan
j saatt ini
i i di
dianggap
dipengaruhi oleh rata-rata curah hujan kem arin dst,
m aka data rata-rata curah hujan di atas dapat
dikategorikan sebagai suatu deret waktu (tim e series).
series)
371.6
3
@ UM
Plot Dat a
berdasarkan wakt u
Rata-rata cu rah h u jan bu lan an 2 0 0 1 - 2 0 0 4 d i Stas iu n
Pad ah e ran g
60 0
n ilai cu r ah h u jan
550 0
40 0
30 0
20 0
10 0
0
0
5
10
15
20
25
30
w aktu ( bu lan ke -)
35
40
45
4
P
Proses
St okast
k t ik
•
Proses stokastik adalah barisan peubah acak {Yt , t T }
•
Setiap proses stokastik memuat ruang keadaan S dan
indeks parameterT
S : semua nilai yang mungkin dari Yt
S danT
d T dapat
d
t bernilai
b
il i diskrit
di k it atau
t kontinu
k ti
•
Contoh proses stokastik:
g
a. Cuaca harian kota Bandung
b. Banyaknya trombosit/hari pasien demam berdarah
sejak ia terinfeksi
c. Laju pertumbuhan populasi orang utan (% per tahun)
d Waktu antara mekarnya bunga bangkai yang ke-n
d.
ke n
dengan bunga bangkai yang ke n+1
•
Misal yt nilai dari Yt maka barisan nilai {yt , t T } disebut
realisasi dari {Yt , t T }
5
Ti
Time
Ser
S ies
i
•
•
•
•
Jika T : waktu, maka {Yt , t T } disebut time series
Realisasinya disebut data TS
Studi berkaitan dengan TS disebut analisis TS
Permasalahan dalam analisis TS :
“Bagaimana
Bagaimana menentukan model Yt sehingga model
tersebut dapat digunakan untuk forecasting (prakiraan
di waktu mendatang)?? ”
• Secara umum, model TS dapat ditulis
Yt = f (.) + et
(1)
Asumsi galat: et ~ N (0, 2) dan tidak berkorelasi
• Jika f linier dalam parameter-parameternya maka
persamaan (1) disebut model linier TS
• Koleksi semua model linier TS dinamakan model
ARIMA(p,d,q) (Box-Jenkins, 1976)
6
C t oh
Cont
h Time
Ti
Ser
S ies
i
Produksi Tembakau di AS
1500
10
000
Miliar pounds
M
6
5
500
4
3
0
20
40
60
80
100
120
1880
1900
1920
Kuartal
1940
1960
1980
Tahun
Data Penjualan lynx pelts di Canada
Ukuran partikel setelah
penyemprotan pengharum ruangan
110
112
114
116
118
20
0000 40000 6000
00 80000
Persen
7
8
2000
9
Tingkat Pengangguran di AS
1850
1860
1870
1880
Tahun
1890
1900
0
100
200
300
Menit
400
500
7
Manf aat dan Tuj uan TS
• Mem odelkan
d lk ddata TS sehingga
hi
ddapat dilih
dilihat
perilaku data lebih lanjut
• Melakukan prediksi ke depan atau prakiraan
jangka pendek (short-tim e forecasting)
8
Beberapa Konsep Dasar dalam TS
Kestasioneran
• TS {Yt , t T
T } stasioner
t i
jik untuk
jika
t k setiap
ti t,
t
1. E[Yt] = (konstan)
2 kov(Yt , Yt –k) = k (tidak tergantung t )
2.
• Secara visual,
visual data TS {Yt , t T } stasioner
jika data TS berfluktuasi di sekitar rataannya
dengan
g variansi konstan
9
Beberapa Konsep Dasar dalam TS
ACF fungsi autokorelasi
ACF,
•
ACF (fungsi autokorelasi) : fungsi antara lag
k dan k dengan,
dengan k = corr (Yt ,Y
Yt –k).
)
n
ACF sampel:
(Y Y )(Y Y )
rk t k 1
t
t k
n
2
Y
Y
(
)
t
t 1
rk = 0 (secara signifikan) jika
1
1
1,96
1 96
rk 11,96
96
n
n
10
Beberapa Konsep Dasar dalam TS
PACF fungsi parsial autokorelasi
PACF,
• PACF (fs. autokorelasi parsial) : fungsi antara lag k
dengan
g kk di mana kk = corr ((Yt , Yt –kk) setelah p
pengaruh
g
Y1 , Y2, …, Yk-1 ditiadakan.
• PACF dapat didefinisikan juga sebagai koefiesien suku
terakhir dari regresi Yt dengan Y1 , Y2, …, Yk.
Artinya, jika Yt = +1Yt-1 + 2Yt-2 + … + kYt-kk maka PACF
Artinya
sampel untuk lag k = taksiran dari k.
atau ˆkk ˆk
1
1
ˆ
ˆkk = 0 (secara
(
signifikan)
i ifik ) jika
jik 1,96
1 96
kk 1,96
1 96
n
n
11
C t oh
Cont
h ACF d
dan PACF d
dengan
g SPSS
number of blowfly
8000
Coefficient
1.0
Upper Confidence Limit
0.5
6000
ACF
numb
ber of blowfly
Lower Confidence
Limit
0.0
4000
-0.5
-1.0
2000
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Lag Number
number of blowfly
1 3 5 7 9 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5 6 6 6 6 6 7 7 7 7 7 8
1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1
Sequence number
Coefficient
1.0
Upper Confidence Limit
Lower Confidence
Limit
0.5
Partial ACF
Dari menu SPSS, pilih
Graphs
p
Time Series
Autocorrelations...
pilih variabel yang akan
dihit
dihitung
ACF dan
d PACF-nya
PACF
OK
0.0
-0.5
-1.0
1
2
3
4
5
6
7
8
9
10
Lag Number
11
12
13
14
15
16
12
Model-model
Model
model Time Ser ies
Untuk TS Stasioner
1. Autoregresi (AR) : “regresi terhadap TS yg lalu & galat
sekarang
sekarang”
AR(1): Yt = +1Yt-1 +et , di mana 1
Pengenalan
l
Analisis Deret Waktu
(Time Series Analysis)
MA 2081 Statistika Dasar
29 November 2012
Utriweni Mukhaiyar
2
Ilust rasi
• Berikut adalah data rata-rata curah hujan
bulanan yang diam ati dari Stasiun Padaherang
pada tahun 20 0 1 – 20 0 4.
Sum ber : Modul 3 Praktikum Mekanika Medium Kontinu “ Medan Gravitasi”
Tah u n
Jan
Fe b
Mar
Ap r
Me i
2 0 0 1 278.59 279.78 355.29 241.34 115.9
Ju n
Ju l
Agu s t Se p
Okt
Nop
Des
176.9 55.32 29.0 8 43.82 313.68 50 8.49 267.82
2 0 0 2 299.78 245.88 266.64 185.27 122.22 133.1 76.78
32.4
26.0 9 169.0 5 461.62 415.73
2 0 0 3 425.21 370 .8 30 0 .23 157.43 184.96 69.93 23.28 14.39
17.86 275.23 433.23 456.0 2
20 0 4
547.8 30 8.2
388
93
297
128
47
5
87
10 5
389
Apabila
A bil nilai
il i curah
h hhujan
j saatt ini
i i di
dianggap
dipengaruhi oleh rata-rata curah hujan kem arin dst,
m aka data rata-rata curah hujan di atas dapat
dikategorikan sebagai suatu deret waktu (tim e series).
series)
371.6
3
@ UM
Plot Dat a
berdasarkan wakt u
Rata-rata cu rah h u jan bu lan an 2 0 0 1 - 2 0 0 4 d i Stas iu n
Pad ah e ran g
60 0
n ilai cu r ah h u jan
550 0
40 0
30 0
20 0
10 0
0
0
5
10
15
20
25
30
w aktu ( bu lan ke -)
35
40
45
4
P
Proses
St okast
k t ik
•
Proses stokastik adalah barisan peubah acak {Yt , t T }
•
Setiap proses stokastik memuat ruang keadaan S dan
indeks parameterT
S : semua nilai yang mungkin dari Yt
S danT
d T dapat
d
t bernilai
b
il i diskrit
di k it atau
t kontinu
k ti
•
Contoh proses stokastik:
g
a. Cuaca harian kota Bandung
b. Banyaknya trombosit/hari pasien demam berdarah
sejak ia terinfeksi
c. Laju pertumbuhan populasi orang utan (% per tahun)
d Waktu antara mekarnya bunga bangkai yang ke-n
d.
ke n
dengan bunga bangkai yang ke n+1
•
Misal yt nilai dari Yt maka barisan nilai {yt , t T } disebut
realisasi dari {Yt , t T }
5
Ti
Time
Ser
S ies
i
•
•
•
•
Jika T : waktu, maka {Yt , t T } disebut time series
Realisasinya disebut data TS
Studi berkaitan dengan TS disebut analisis TS
Permasalahan dalam analisis TS :
“Bagaimana
Bagaimana menentukan model Yt sehingga model
tersebut dapat digunakan untuk forecasting (prakiraan
di waktu mendatang)?? ”
• Secara umum, model TS dapat ditulis
Yt = f (.) + et
(1)
Asumsi galat: et ~ N (0, 2) dan tidak berkorelasi
• Jika f linier dalam parameter-parameternya maka
persamaan (1) disebut model linier TS
• Koleksi semua model linier TS dinamakan model
ARIMA(p,d,q) (Box-Jenkins, 1976)
6
C t oh
Cont
h Time
Ti
Ser
S ies
i
Produksi Tembakau di AS
1500
10
000
Miliar pounds
M
6
5
500
4
3
0
20
40
60
80
100
120
1880
1900
1920
Kuartal
1940
1960
1980
Tahun
Data Penjualan lynx pelts di Canada
Ukuran partikel setelah
penyemprotan pengharum ruangan
110
112
114
116
118
20
0000 40000 6000
00 80000
Persen
7
8
2000
9
Tingkat Pengangguran di AS
1850
1860
1870
1880
Tahun
1890
1900
0
100
200
300
Menit
400
500
7
Manf aat dan Tuj uan TS
• Mem odelkan
d lk ddata TS sehingga
hi
ddapat dilih
dilihat
perilaku data lebih lanjut
• Melakukan prediksi ke depan atau prakiraan
jangka pendek (short-tim e forecasting)
8
Beberapa Konsep Dasar dalam TS
Kestasioneran
• TS {Yt , t T
T } stasioner
t i
jik untuk
jika
t k setiap
ti t,
t
1. E[Yt] = (konstan)
2 kov(Yt , Yt –k) = k (tidak tergantung t )
2.
• Secara visual,
visual data TS {Yt , t T } stasioner
jika data TS berfluktuasi di sekitar rataannya
dengan
g variansi konstan
9
Beberapa Konsep Dasar dalam TS
ACF fungsi autokorelasi
ACF,
•
ACF (fungsi autokorelasi) : fungsi antara lag
k dan k dengan,
dengan k = corr (Yt ,Y
Yt –k).
)
n
ACF sampel:
(Y Y )(Y Y )
rk t k 1
t
t k
n
2
Y
Y
(
)
t
t 1
rk = 0 (secara signifikan) jika
1
1
1,96
1 96
rk 11,96
96
n
n
10
Beberapa Konsep Dasar dalam TS
PACF fungsi parsial autokorelasi
PACF,
• PACF (fs. autokorelasi parsial) : fungsi antara lag k
dengan
g kk di mana kk = corr ((Yt , Yt –kk) setelah p
pengaruh
g
Y1 , Y2, …, Yk-1 ditiadakan.
• PACF dapat didefinisikan juga sebagai koefiesien suku
terakhir dari regresi Yt dengan Y1 , Y2, …, Yk.
Artinya, jika Yt = +1Yt-1 + 2Yt-2 + … + kYt-kk maka PACF
Artinya
sampel untuk lag k = taksiran dari k.
atau ˆkk ˆk
1
1
ˆ
ˆkk = 0 (secara
(
signifikan)
i ifik ) jika
jik 1,96
1 96
kk 1,96
1 96
n
n
11
C t oh
Cont
h ACF d
dan PACF d
dengan
g SPSS
number of blowfly
8000
Coefficient
1.0
Upper Confidence Limit
0.5
6000
ACF
numb
ber of blowfly
Lower Confidence
Limit
0.0
4000
-0.5
-1.0
2000
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Lag Number
number of blowfly
1 3 5 7 9 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5 6 6 6 6 6 7 7 7 7 7 8
1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1
Sequence number
Coefficient
1.0
Upper Confidence Limit
Lower Confidence
Limit
0.5
Partial ACF
Dari menu SPSS, pilih
Graphs
p
Time Series
Autocorrelations...
pilih variabel yang akan
dihit
dihitung
ACF dan
d PACF-nya
PACF
OK
0.0
-0.5
-1.0
1
2
3
4
5
6
7
8
9
10
Lag Number
11
12
13
14
15
16
12
Model-model
Model
model Time Ser ies
Untuk TS Stasioner
1. Autoregresi (AR) : “regresi terhadap TS yg lalu & galat
sekarang
sekarang”
AR(1): Yt = +1Yt-1 +et , di mana 1