41
4.1 Pengolahan Data Menggunakan Metode SARIMA
Beberapa tahapan yang akan dilakukan pada bagian ini adalah dimulai dengan pemeriksaan kestasioneran data, kemudian jika data telah stasioner maka
dilanjutkan dengan proses mengidentifikasi model- model yang cocok untuk data input, dan terakhir, menentukan model terbaik dari beberapa model yang ada
untuk digunakan dalam peramalan.
4.1.1 Pemeriksaan Kestasioneran Data
Pemeriksaan kestasioneran data dapat dilakukan secara visual dengan
melihat plot data input sebagai berikut menggunakan software:
Gambar 4.1 Plot Data Siswa
Index s
is w
a
70 63
56 49
42 35
28 21
14 7
1 140
120 100
80 60
40 20
Time Series Plot of siswa
42
Gambar 4.2 Plot ACF Data Siswa
Berdasarkan Gambar 4.1 terlihat plot data telah stasioner pada rata-rata namun tidak dengan variansnya. Sedangkan gambar 4.2 menunjukkan adanya
bentuk musiman pada data sehingga metode SARIMA memang tepat d igunakan untuk menganalisis data. Untuk memastikan kestasioneran secara statistik maka
dilakukan uji Augmented Dickey Fuller. Dengan bantuan software, diperoleh hasil uji Augmented Dickey Fuller sebagai berikut:
Tabel 4.2 Hasil Uji Augmented Dickey Fuller Data Siswa
t-statistics Prob.
Augmeted Dickey Fuller Test Statistics −1.767974
0.7337 Test Critical values
1 level −3.544063
5 level −2.910860
10 level −2.593090
Lag A
u to
c o
rr e
la ti
o n
70 65
60 55
50 45
40 35
30 25
20 15
10 5
1 1.0
0.8 0.6
0.4 0.2
0.0 -0.2
-0.4 -0.6
-0.8 -1.0
Autocorrelation Function for siswa
with 5 significance limits for the autocorrelations
43
Tabel 4.2 memperlihatkan bahwa dengan taraf signifikansi sebesar 5 diperoleh
�
�
�
�,�
atau
1.767974 2.910860
, maka tidak ditolak. Jadi
data input model belum stasioner. Karena data belum stasioner secara varians maka akan dilakukan proses
transformasi. Untuk menentukan transformasi yang cocok dengan data input model dengan melihat Plot Box-Cox, adapun outputnya adalah sebagai berikut:
Gambar 4.3
Plot Box-Cox data siswa Berdasarkan Gambar 4.3 diperoleh
� = 0.0. Maka transformasi yang digunakan adalah transformasi
�
�
= ��
�
. Transformasi ini akan menyebabkan data stasioner secara varians. Plot data hasil transformasi dapat dilihat pada
gambar di bawah ini:
Lambda S
tD e
v
3 2
1 -1
180 160
140 120
100 80
60 40
20
Lower C L Upper C L
Limit
Lambda
0.00 using 95.0 confidence
Estimate 0.02
Lower C L -0.18
Upper C L 0.25
Rounded Value
Box-Cox Plot of C1
44
Gambar 4.4 Plot data hasil transformasi
Berdasarkan Gambar 4.4 terlihat bahwa data telah stasioner baik secara rata-rata maupun varians karena pola data bergerak secara fluktuatif di sekitar
nilai rata-rata. Untuk memastikan data tersebut sudah stasioner dilakukan kembali Uji Augmented Dickey Fuller. Dengan menggunak an software, hasil uji
Augmented Dickey Fuller untuk data setelah ditransformasi adalah sebagai berikut:
Tabel 4.3 Hasil Uji Augmented Dickey Fuller data hasil transformasi
t-statistics Prob.
Augmeted Dickey Fuller Test Statistics −6.860109
0.000 Test Critical values
1 level −3.525618
5 level −2.902953
10 level −2.588902
Index D
a ta
I n
p u
t M
o d
e l
70 63
56 49
42 35
28 21
14 7
1 5
4 3
2 1
Time Series Plot of Data Input Model
45
Tabel 4.3 memperlihatkan bahwa dengan taraf signifikansi sebesar 5 diperoleh
�
�
�
�,�
atau
6.860109 2.902953
, maka ditolak. Jadi data input
model sudah stasioner. Untuk selanjutnya data input yang telah ditransformasi ini
akan disebut sebagai data input model. 4.1.2
Identifikasi Model
Setelah diperoleh
data stasioner,
langkah selanjutnya
adalah mengidentifikasi model berdasarkan plot fungsi autokorelasi dan fungsi
autokorelasi parsial. Berikut ini adalah plot ACF dan plot PACF data input model:
Gambar 4.5 Plot ACF data input model
Lag A
u to
c o
rr e
la ti
o n
70 65
60 55
50 45
40 35
30 25
20 15
10 5
1 1.0
0.8 0.6
0.4 0.2
0.0 -0.2
-0.4 -0.6
-0.8 -1.0
Autocorrelation Function for Data Input Model
with 5 significance limits for the autocorrelations
46
Gambar 4.6 Plot PACF data input model
Secara keseluruhan terlihat bahwa plot ACF berbentuk eksponensial sedangkan plot PACF menunjukkan cut off pada lag musiman. Hal ini
mengindikasikan secara kuat adanya proses SAR Seasonal Autoregressive. Sebagai perbandingan maka terdapat beberapa model yang ikut
dimunculkan. Berdasarkan gambar 4.5 dan gambar 4.6, dapat dilihat bahwa beberapa kriteria berikut ini terpenuhi, yakni:
a. Plot ACF lag musiman menunjukkan bentuk eksponensial sedangkan
plot PACF lag musiman menunjukkan cut off pada lag musiman pertama. Hal ini mengindikasikan adanya proses SAR1.
b. Plot ACF lag non musiman menunjukkan cut off pada lag ke 2
sedangkan plot PACF lag non musiman menunjukkan cut off pada lag
Lag P
a rt
ia l
A u
to c
o rr
e la
ti o
n
70 65
60 55
50 45
40 35
30 25
20 15
10 5
1 1.0
0.8 0.6
0.4 0.2
0.0 -0.2
-0.4 -0.6
-0.8 -1.0
Partial Autocorrelation Function for Data Input Model
with 5 significance limits for the partial autocorrelations
47
ke 2. Hal ini mengindikasikan adanya proses MA2 atau proses AR2 atau gabungan keduanya yakni ARMA2,2.
Berdasarkan dua kriteria yang dipenuhi di atas maka dapat diperoleh beberapa model yang dinyatakan dalam notasi model ARIMA
�, , , �, �
�
sebagai berikut:
12
1. ARIMA 0,0,0 1,0,0
12
2. ARIMA 2,0,0 1,0,0
12
3. ARIMA 0,0,2 1,0,0
12
4. ARIMA 2,0,2 1,0,0
12
4.1.3 Penaksiran Parameter dan Diagnosis Model
Setelah beberapa model sementara diperoleh, maka langkah selanjutnya adalah mencari penaksir terbaik untuk parameter model tersebut. Parameter hasil
penaksiran kemudian dilakukan uji diagnosis yang terdiri dari uji asumsi keberartian koefisien, uji asumsi white noise, dan diakhiri dengan memilih model
dengan nilai MSE terkecil. Hasil penaksiran parameter beserta nilai p-value untuk menguji
keberartian koefisien model adalah sebagai parameter berikut:
48
1. Model ARIMA 0,0,0 1,0,0
12
Tabel 4.4 Penaksiran Parameter ARIMA
0,0,0 1,0,0
12
Type Coef.
SE Coef. T
P SAR 1
0.9258 0.0832
11.13 0.000
Constant 0.18450
0.08000 2.31
0.024 Berdasarkan Tabel 4.4 diperoleh hasil penaksiran model ARIMA
0,0,0 1,0,0
12
yakni, �
1
= 0.9258 dan
� = 0.18450. Dengan menggunakan operator backshift, model umum ARIMA
0,0,0 1,0,0
12
dapat dinyatakan oleh: 1 − �
1
�
9
�
�
= � + �
�
Dengan mensubtitusikan nilai- nilai parameter yang telah ditaksir pada bentuk tersebut maka diperoleh:
1 − 0.9258�
12
�
�
= 0.18450 + �
�
Berdasarkan Tabel 4.4 dapat dilihat bahwa nilai �- � untuk
parameter SAR 1 lebih kecil dari � sehingga
ditolak, artinya model ARIMA
0,0,0 1,0,0
12
telah memenuhi asumsi keberartian koefisien.
49
2. Model ARIMA 2,0,0 1,0,0
12
Tabel 4.5 Penaksiran Parameter ARIMA
2,0,0 1,0,0
12
Type Coef.
SE Coef. T
P AR 1
0.0323 0.1193
0.27 0.788
AR 2 0.1845
0.1196 1.54
0.128 SAR 1
0.9281 0.0848
10.94 0.000
Constant 0.14052
0.07988 1.76
0.083 Berdasarkan Tabel 4.5, diperoleh hasil penaksiran model ARIMA
2,0,0 1,0,0
12
yakni, ∅
1
= 0.0323, ∅
2
= 0.1845, �
1
= 0.9281 dan � = 0.14052. Dengan menggunakan operator backshift, model umum
ARIMA 2,0,0 1,0,0
12
dapat dinyatakan oleh: 1 − ∅
1
� − ∅
2
�
2
1 − �
1
�
12
�
�
= � + �
�
Dengan mensubtitusikan nilai- nilai parameter yang telah ditaksir pada bentuk tersebut maka diperoleh:
1 − 0.0323� − 0.1845�
2
1− 0.9281�
12
�
�
= 0.14052 + �
�
Berdasarkan Tabel 4.5 dapat dilihat bahwa nilai �- � untuk
parameter AR 1 dan AR 2 lebih besar dari � sehingga
diterima, artinya model ARIMA
2,0,0 1,0,0
12
tidak memenuhi asumsi keberartian koefisien.
50
3. ARIMA 0,0,2 1,0,0
12
Tabel 4.6 Penaksiran Parameter ARIMA
0,0,2 1,0,0
12
Type Coef.
SE Coef. T
P SAR 1
0.9266 0.0855
10.84 0.000
MA 1 −0.0147
0.1198 −0.12
0.903 MA 2
−0.1541 0.1201
−1.28 0.204
Constant 0.18268
0.09363 1.95
0.055 Berdasarkan Tabel 4.6, diperoleh hasil penaksiran model ARIMA
0,0,2 1,0,0
12
yakni, �
1
=0.9266, �
1
= −0.0147, �
2
= −0.1541, dan
� = 0.18268. Dengan menggunakan operator backshift, model umum ARIMA
0,0,2 1,0,0
12
dapat dinyatakan oleh: 1 − �
1
�
12
�
�
= � + 1 − �
1
� − �
2
�
2
�
�
Dengan mensubtitusikan nilai- nilai parameter yang telah ditaksir pada bentuk tersebut maka diperoleh:
1 − 0.9266�
12
�
�
= 0.18268 + 1 + 0.0147� + 0.1541�
2
�
�
Berdasarkan Tabel 4.6 dapat dilihat bahwa nilai �- � untuk
parameter MA 1 dan MA 2 lebih besar dari � sehingga
diterima, artinya model ARIMA
0,0,2 1,0,0
12
tidak memenuhi asumsi keberartian koefisien.
51
4. ARIMA 2,0,2 1,0,0
12
Tabel 4.7 Penaksiran Parameter ARIMA
2,0,2 1,0,0
12
Type Coef.
SE Coef. T
P AR 1
1.0293 0.2980
3.45 0.001
AR 2 −0.6972
0.2670 −2.61
0.011 SAR 1
0.9466 0.0731
12.95 0.000
MA 1 1.0284
0.2542 4.05
0.000 MA2
−0.8513 0.2093
−4.07 0.000
Constant 0.08912
0.06595 1.35
0.181 Berdasarkan Tabel 4.7, diperoleh hasil penaksiran model ARIMA
2,0,2 1,0,0
12
yakni, ∅
1
= 1.0293, ∅
2
= −0.6972, �
1
= 0.9466, �
1
= 1.0284,
�
2
= −0.8513, dan � = 0.08912. Dengan menggunakan operator
backshift, model umum ARIMA 2,0,2 1,0,0
12
dapat dinyatakan oleh: 1 − ∅
1
� − ∅
2
�
2
1 − �
1
�
12
�
�
= � + 1 − �
1
� − �
2
�
2
�
�
Dengan mensubtitusikan nilai- nilai parameter yang telah ditaksir pada bentuk tersebut maka diperoleh:
1 − 1.0293� + 0.6972�
2
1 − 0.9466�
12
�
�
= 0.08912 + 1 − 1.0284� + 0.8513�
2
�
�
Berdasarkan Tabel 4.7 dapat dilihat bahwa nilai �- � untuk semua
parameter lebih kecil dari � sehingga
ditolak, artinya model ARIMA 2,0,2 1,0,0
12
telah memenuhi asumsi keberartian koefisien.
52
Pengujian asumsi ℎ�� � � terdiri dari 2 tahap yakni, uji keacakan
residu dan uji kenormalan residu. Berikut ini adalah disajikan plot ACF residu dan nilai statistik Ljung-Box masing- masing model untuk menguji keacakan residu
serta plot probabilitas residu masing- masing model untuk menguji kenormalan residu:
1. Model ARIMA 0,0,0 1,0,0
12
Gambar 4.7
Plot ACF Residu ARIMA 0,0,0 1,0,0
12
Berdasarkan Gambar 4.7 terlihat bahwa tidak terdapat lag yang keluar dari garis merah yang menunjukkan bahwa residu bersifat acak. Untuk
memastikan hal ini maka digunakan statistik Q Box-Pierce yang terdapat pada tabel berikut:
Lag A
u to
c o
rr e
la ti
o n
70 65
60 55
50 45
40 35
30 25
20 15
10 5
1 1.0
0.8 0.6
0.4 0.2
0.0 -0.2
-0.4 -0.6
-0.8 -1.0
Autocorrelation Function for RESI1
with 5 significance limits for the autocorrelations
53
Tabel 4.8 Nilai Q Box-Pierce ARIMA
0,0,0 1,0,0
12
Modified Box-Pierce Ljung-Box Chi-Square Statistic Lag
12 24
36 48
Chi-Square 10.4
16.6 28.6
35.1 DF
10 22
34 46
P-Value 0.407
0.787 0.731
0.879 Berdasarkan tabel 4.8 terlihat bahwa nilai p-value untuk setiap lag
yang diuji lebih besar dari � maka
diterima sehingga dapat dikatakan bahwa residu model ARIMA
0,0,0 1,0,0
12
bersifat acak.
Gambar 4.8 Plot Probabilitas Residu ARIMA
0,0,0 1,0,0
12
RESI1 P
e rc
e n
t
2 1
-1 -2
99.9 99
95 90
80 70
60 50
40 30
20
10 5
1 0.1
Mean 0.150
0.01632 StDev
0.6733 N
72 KS
0.073 P-Value
Probability Plot of RESI1
Normal
54
Berdasarkan Gambar 4.8 diketahui nilai �- � 0.05, maka
diterima artinya residu model ARIMA 2,1,00,1,0
9
berdistribusi normal.
2. Model ARIMA 2,0,0 1,0,0
12
Gambar 4.9
Plot ACF Residu ARIMA 2,0,0 1,0,0
12
Berdasarkan Gambar 4.9 terlihat bahwa tidak terdapat lag yang keluar dari garis merah yang menunjukkan bahwa residu bersifat acak. Untuk
memastikan hal ini maka digunakan statistik Q Box-Pierce yang terdapat pada tabel berikut:
Lag A
u to
c o
rr e
la ti
o n
70 65
60 55
50 45
40 35
30 25
20 15
10 5
1 1.0
0.8 0.6
0.4 0.2
0.0 -0.2
-0.4 -0.6
-0.8 -1.0
Autocorrelation Function for RESI2
with 5 significance limits for the autocorrelations
55
Tabel 4.9 Nilai Q Box-Pierce ARIMA
2,0,0 1,0,0
12
Modified Box-Pierce Ljung-Box Chi-Square Statistic Lag
12 24
36 48
Chi-Square 6.1
12.8 20.6
26.4 DF
8 20
32 44
P-Value 0.632
0.886 0.939
0.984 Berdasarkan tabel 4.9 terlihat bahwa nilai p-value untuk setiap lag
yang diuji lebih besar dari � maka
diterima sehingga dapat dikatakan bahwa residu model ARIMA
2,0,0 1,0,0
12
bersifat acak.
Gambar 4.10 Plot Probabilitas Residu ARIMA
2,0,0 1,0,0
12
Berdasarkan Gambar 4.10 terlihat bahwa nilai �- � 0.05, maka
diterima artinya residu model ARIMA 2,0,0 1,0,0
12
berdistribusi normal
RESI2 P
e rc
e n
t
2 1
-1 -2
99.9 99
95 90
80 70
60 50
40 30
20
10 5
1 0.1
Mean 0.057
0.01070 StDev
0.6627 N
72 KS
0.103 P-Value
Probability Plot of RESI2
Normal
56
3. Model ARIMA 0,0,2 1,0,0
12
Gambar 4.11 Plot ACF Residu ARIMA
0,0,2 1,0,0
12
Berdasarkan Gambar 4.11 terlihat bahwa tidak terdapat lag yang keluar dari garis merah yang menunjukkan bahwa residu bersifat acak. Untuk
memastikan hal ini maka digunakan statistik Q Box-Pierce yang terdapat pada tabel berikut:
Tabel 4.10 Nilai Q Box-Pierce ARIMA
0,0,2 1,0,0
12
Modified Box-Pierce Ljung-Box Chi-Square Statistic Lag
12 24
36 48
Chi-Square 7.1
13.8 22.2
28.2 DF
8 20
32 44
P-Value 0.526
0.841 0.901
0.969
Lag A
u to
c o
rr e
la ti
o n
70 65
60 55
50 45
40 35
30 25
20 15
10 5
1 1.0
0.8 0.6
0.4 0.2
0.0 -0.2
-0.4 -0.6
-0.8 -1.0
Autocorrelation Function for RESI3
with 5 significance limits for the autocorrelations
57
Berdasarkan tabel 4.10 tersebut terlihat bahwa nilai p-value untuk setiap lag yang diuji lebih besar dari
� maka diterima sehingga dapat
dikatakan bahwa residu model ARIMA 0,0,2 1,0,0
12
bersifat acak.
Gambar 4.12 Plot Probabilitas Residu ARIMA
0,0,2 1,0,0
12
Berdasarkan Gambar 4.12 terlihat bahwa nilai �- � 0.05, maka
diterima artinya residu model ARIMA 0,0,2 1,0,0
12
berdistribusi normal.
RESI3 P
e rc
e n
t
2 1
-1 -2
99.9 99
95 90
80 70
60 50
40 30
20
10 5
1 0.1
Mean 0.127
0.01264 StDev
0.6646 N
72 KS
0.093 P-Value
Probability Plot of RESI3
Normal
58
4. Model ARIMA 2,0,2 1,0,0
12
Gambar 4.13 Plot ACF Residu ARIMA
2,0,2 1,0,0
12
Berdasarkan Gambar 4.13 terlihat bahwa tidak terdapat lag yang keluar dari garis merah yang menunjukkan bahwa residu bersifat acak. Namun
untuk memastikan hal ini maka digunakan statistik Q Box-Pierce yang terdapat pada tabel berikut:
Tabel 4.11 Nilai Q Box-Pierce ARIMA
2,0,2 1,0,0
12
Modified Box-Pierce Ljung-Box Chi-Square Statistic Lag
12 24
36 48
Chi-Square 5.1
11.4 22.0
28.1 DF
6 18
30 42
P-Value 0.536
0.874 0.854
0.950
Lag A
u to
c o
rr e
la ti
o n
70 65
60 55
50 45
40 35
30 25
20 15
10 5
1 1.0
0.8 0.6
0.4 0.2
0.0 -0.2
-0.4 -0.6
-0.8 -1.0
Autocorrelation Function for RESI4
with 5 significance limits for the autocorrelations
59
Berdasarkan tabel tersebut terlihat bahwa nilai p-value untuk setiap lag yang diuji lebih besar dari
� maka diterima sehingga dapat dikatakan
bahwa residu model ARIMA 2,0,2 1,0,0
12
bersifat acak.
Gambar 4.14 Plot Probabilitas Residu ARIMA
2,0,2 1,0,0
12
Berdasarkan Gambar 4.14 terlihat bahwa nilai �- � 0.05, maka
diterima artinya residu model ARIMA 2,0,2 1,0,0
12
berdistribusi normal.
Langkah terakhir adalah membandingkan nilai MSE setiap model untuk menentukan model terbaik untuk digunakan dalam peramalan.
Berikut ini adalah tabel nilai MSE dari setiap model yang teridentifikasi:
RESI4 P
e rc
e n
t
2 1
-1 -2
99.9 99
95 90
80 70
60 50
40 30
20
10 5
1 0.1
Mean 0.092
0.008519 StDev
0.6542 N
72 KS
0.097 P-Value
Probability Plot of RESI4
Normal
60
Tabel 4.12 Nilai MSE Model ARIMA
Model Nilai
DF SSE
MSE ARIMA
0,0,0 1,0,0
12
70 32.2018
0.4600 ARIMA
2,0,0 1,0,0
12
68 31.1921
0.4587 ARIMA
0,0,2 1,0,0
12
68 31.3693
0.4613 ARIMA
2,0,2 1,0,0
12
66 30.3884
0.4604 Berdasarkan Tabel 4.12, nilai MSE terkecil dimiliki oleh model ARIMA
2,0,0 1,0,0
12
yakni sebesar 0.4587. Berikut ini adalah rangkuman diagnosis model SARIMA yang terindikasi:
Tabel 4.13 Rangkuman Diagnosis Model ARIMA
Model Keberartian
Koefisien White Noise
MSE Acak
Normal ARIMA
0,0,0 1,0,0
12
Ya Ya
Ya 0.4600
ARIMA 2,0,0 1,0,0
12
Tidak Ya
Ya 0.4587
ARIMA 0,0,2 1,0,0
12
Tidak Ya
Ya 0.4613
ARIMA 2,0,2 1,0,0
12
Ya Ya
Ya 0.4604
Berdasarkan Tabel 4.13, model yang memenuhi tahapan diagnosis model, yakni memenuhi asumsi keberartian koefisien, bersifat white noise, serta memiliki
nilai MSE terkecil di antara semua model yang teridentifikasi adalah model ARIMA
0,0,0 1,0,0
12
. Oleh karena itu model ARIMA 0,0,0 1,0,0
12
dipilih sebagai model yang akan digunakan pada tahapan evaluasi.
61
4.2 Pengolahan Data Menggunakan Metode Dekomposisi