Pengolahan Data Menggunakan Metode SARIMA

41

4.1 Pengolahan Data Menggunakan Metode SARIMA

Beberapa tahapan yang akan dilakukan pada bagian ini adalah dimulai dengan pemeriksaan kestasioneran data, kemudian jika data telah stasioner maka dilanjutkan dengan proses mengidentifikasi model- model yang cocok untuk data input, dan terakhir, menentukan model terbaik dari beberapa model yang ada untuk digunakan dalam peramalan.

4.1.1 Pemeriksaan Kestasioneran Data

Pemeriksaan kestasioneran data dapat dilakukan secara visual dengan melihat plot data input sebagai berikut menggunakan software: Gambar 4.1 Plot Data Siswa Index s is w a 70 63 56 49 42 35 28 21 14 7 1 140 120 100 80 60 40 20 Time Series Plot of siswa 42 Gambar 4.2 Plot ACF Data Siswa Berdasarkan Gambar 4.1 terlihat plot data telah stasioner pada rata-rata namun tidak dengan variansnya. Sedangkan gambar 4.2 menunjukkan adanya bentuk musiman pada data sehingga metode SARIMA memang tepat d igunakan untuk menganalisis data. Untuk memastikan kestasioneran secara statistik maka dilakukan uji Augmented Dickey Fuller. Dengan bantuan software, diperoleh hasil uji Augmented Dickey Fuller sebagai berikut: Tabel 4.2 Hasil Uji Augmented Dickey Fuller Data Siswa t-statistics Prob. Augmeted Dickey Fuller Test Statistics −1.767974 0.7337 Test Critical values 1 level −3.544063 5 level −2.910860 10 level −2.593090 Lag A u to c o rr e la ti o n 70 65 60 55 50 45 40 35 30 25 20 15 10 5 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 Autocorrelation Function for siswa with 5 significance limits for the autocorrelations 43 Tabel 4.2 memperlihatkan bahwa dengan taraf signifikansi sebesar 5 diperoleh � � � �,� atau 1.767974 2.910860 , maka tidak ditolak. Jadi data input model belum stasioner. Karena data belum stasioner secara varians maka akan dilakukan proses transformasi. Untuk menentukan transformasi yang cocok dengan data input model dengan melihat Plot Box-Cox, adapun outputnya adalah sebagai berikut: Gambar 4.3 Plot Box-Cox data siswa Berdasarkan Gambar 4.3 diperoleh � = 0.0. Maka transformasi yang digunakan adalah transformasi � � = �� � . Transformasi ini akan menyebabkan data stasioner secara varians. Plot data hasil transformasi dapat dilihat pada gambar di bawah ini: Lambda S tD e v 3 2 1 -1 180 160 140 120 100 80 60 40 20 Lower C L Upper C L Limit Lambda 0.00 using 95.0 confidence Estimate 0.02 Lower C L -0.18 Upper C L 0.25 Rounded Value Box-Cox Plot of C1 44 Gambar 4.4 Plot data hasil transformasi Berdasarkan Gambar 4.4 terlihat bahwa data telah stasioner baik secara rata-rata maupun varians karena pola data bergerak secara fluktuatif di sekitar nilai rata-rata. Untuk memastikan data tersebut sudah stasioner dilakukan kembali Uji Augmented Dickey Fuller. Dengan menggunak an software, hasil uji Augmented Dickey Fuller untuk data setelah ditransformasi adalah sebagai berikut: Tabel 4.3 Hasil Uji Augmented Dickey Fuller data hasil transformasi t-statistics Prob. Augmeted Dickey Fuller Test Statistics −6.860109 0.000 Test Critical values 1 level −3.525618 5 level −2.902953 10 level −2.588902 Index D a ta I n p u t M o d e l 70 63 56 49 42 35 28 21 14 7 1 5 4 3 2 1 Time Series Plot of Data Input Model 45 Tabel 4.3 memperlihatkan bahwa dengan taraf signifikansi sebesar 5 diperoleh � � � �,� atau 6.860109 2.902953 , maka ditolak. Jadi data input model sudah stasioner. Untuk selanjutnya data input yang telah ditransformasi ini akan disebut sebagai data input model. 4.1.2 Identifikasi Model Setelah diperoleh data stasioner, langkah selanjutnya adalah mengidentifikasi model berdasarkan plot fungsi autokorelasi dan fungsi autokorelasi parsial. Berikut ini adalah plot ACF dan plot PACF data input model: Gambar 4.5 Plot ACF data input model Lag A u to c o rr e la ti o n 70 65 60 55 50 45 40 35 30 25 20 15 10 5 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 Autocorrelation Function for Data Input Model with 5 significance limits for the autocorrelations 46 Gambar 4.6 Plot PACF data input model Secara keseluruhan terlihat bahwa plot ACF berbentuk eksponensial sedangkan plot PACF menunjukkan cut off pada lag musiman. Hal ini mengindikasikan secara kuat adanya proses SAR Seasonal Autoregressive. Sebagai perbandingan maka terdapat beberapa model yang ikut dimunculkan. Berdasarkan gambar 4.5 dan gambar 4.6, dapat dilihat bahwa beberapa kriteria berikut ini terpenuhi, yakni: a. Plot ACF lag musiman menunjukkan bentuk eksponensial sedangkan plot PACF lag musiman menunjukkan cut off pada lag musiman pertama. Hal ini mengindikasikan adanya proses SAR1. b. Plot ACF lag non musiman menunjukkan cut off pada lag ke 2 sedangkan plot PACF lag non musiman menunjukkan cut off pada lag Lag P a rt ia l A u to c o rr e la ti o n 70 65 60 55 50 45 40 35 30 25 20 15 10 5 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 Partial Autocorrelation Function for Data Input Model with 5 significance limits for the partial autocorrelations 47 ke 2. Hal ini mengindikasikan adanya proses MA2 atau proses AR2 atau gabungan keduanya yakni ARMA2,2. Berdasarkan dua kriteria yang dipenuhi di atas maka dapat diperoleh beberapa model yang dinyatakan dalam notasi model ARIMA �, , , �, � � sebagai berikut: 12 1. ARIMA 0,0,0 1,0,0 12 2. ARIMA 2,0,0 1,0,0 12 3. ARIMA 0,0,2 1,0,0 12 4. ARIMA 2,0,2 1,0,0 12

4.1.3 Penaksiran Parameter dan Diagnosis Model

Setelah beberapa model sementara diperoleh, maka langkah selanjutnya adalah mencari penaksir terbaik untuk parameter model tersebut. Parameter hasil penaksiran kemudian dilakukan uji diagnosis yang terdiri dari uji asumsi keberartian koefisien, uji asumsi white noise, dan diakhiri dengan memilih model dengan nilai MSE terkecil. Hasil penaksiran parameter beserta nilai p-value untuk menguji keberartian koefisien model adalah sebagai parameter berikut: 48 1. Model ARIMA 0,0,0 1,0,0 12 Tabel 4.4 Penaksiran Parameter ARIMA 0,0,0 1,0,0 12 Type Coef. SE Coef. T P SAR 1 0.9258 0.0832 11.13 0.000 Constant 0.18450 0.08000 2.31 0.024 Berdasarkan Tabel 4.4 diperoleh hasil penaksiran model ARIMA 0,0,0 1,0,0 12 yakni, � 1 = 0.9258 dan � = 0.18450. Dengan menggunakan operator backshift, model umum ARIMA 0,0,0 1,0,0 12 dapat dinyatakan oleh: 1 − � 1 � 9 � � = � + � � Dengan mensubtitusikan nilai- nilai parameter yang telah ditaksir pada bentuk tersebut maka diperoleh: 1 − 0.9258� 12 � � = 0.18450 + � � Berdasarkan Tabel 4.4 dapat dilihat bahwa nilai �- � untuk parameter SAR 1 lebih kecil dari � sehingga ditolak, artinya model ARIMA 0,0,0 1,0,0 12 telah memenuhi asumsi keberartian koefisien. 49 2. Model ARIMA 2,0,0 1,0,0 12 Tabel 4.5 Penaksiran Parameter ARIMA 2,0,0 1,0,0 12 Type Coef. SE Coef. T P AR 1 0.0323 0.1193 0.27 0.788 AR 2 0.1845 0.1196 1.54 0.128 SAR 1 0.9281 0.0848 10.94 0.000 Constant 0.14052 0.07988 1.76 0.083 Berdasarkan Tabel 4.5, diperoleh hasil penaksiran model ARIMA 2,0,0 1,0,0 12 yakni, ∅ 1 = 0.0323, ∅ 2 = 0.1845, � 1 = 0.9281 dan � = 0.14052. Dengan menggunakan operator backshift, model umum ARIMA 2,0,0 1,0,0 12 dapat dinyatakan oleh: 1 − ∅ 1 � − ∅ 2 � 2 1 − � 1 � 12 � � = � + � � Dengan mensubtitusikan nilai- nilai parameter yang telah ditaksir pada bentuk tersebut maka diperoleh: 1 − 0.0323� − 0.1845� 2 1− 0.9281� 12 � � = 0.14052 + � � Berdasarkan Tabel 4.5 dapat dilihat bahwa nilai �- � untuk parameter AR 1 dan AR 2 lebih besar dari � sehingga diterima, artinya model ARIMA 2,0,0 1,0,0 12 tidak memenuhi asumsi keberartian koefisien. 50 3. ARIMA 0,0,2 1,0,0 12 Tabel 4.6 Penaksiran Parameter ARIMA 0,0,2 1,0,0 12 Type Coef. SE Coef. T P SAR 1 0.9266 0.0855 10.84 0.000 MA 1 −0.0147 0.1198 −0.12 0.903 MA 2 −0.1541 0.1201 −1.28 0.204 Constant 0.18268 0.09363 1.95 0.055 Berdasarkan Tabel 4.6, diperoleh hasil penaksiran model ARIMA 0,0,2 1,0,0 12 yakni, � 1 =0.9266, � 1 = −0.0147, � 2 = −0.1541, dan � = 0.18268. Dengan menggunakan operator backshift, model umum ARIMA 0,0,2 1,0,0 12 dapat dinyatakan oleh: 1 − � 1 � 12 � � = � + 1 − � 1 � − � 2 � 2 � � Dengan mensubtitusikan nilai- nilai parameter yang telah ditaksir pada bentuk tersebut maka diperoleh: 1 − 0.9266� 12 � � = 0.18268 + 1 + 0.0147� + 0.1541� 2 � � Berdasarkan Tabel 4.6 dapat dilihat bahwa nilai �- � untuk parameter MA 1 dan MA 2 lebih besar dari � sehingga diterima, artinya model ARIMA 0,0,2 1,0,0 12 tidak memenuhi asumsi keberartian koefisien. 51 4. ARIMA 2,0,2 1,0,0 12 Tabel 4.7 Penaksiran Parameter ARIMA 2,0,2 1,0,0 12 Type Coef. SE Coef. T P AR 1 1.0293 0.2980 3.45 0.001 AR 2 −0.6972 0.2670 −2.61 0.011 SAR 1 0.9466 0.0731 12.95 0.000 MA 1 1.0284 0.2542 4.05 0.000 MA2 −0.8513 0.2093 −4.07 0.000 Constant 0.08912 0.06595 1.35 0.181 Berdasarkan Tabel 4.7, diperoleh hasil penaksiran model ARIMA 2,0,2 1,0,0 12 yakni, ∅ 1 = 1.0293, ∅ 2 = −0.6972, � 1 = 0.9466, � 1 = 1.0284, � 2 = −0.8513, dan � = 0.08912. Dengan menggunakan operator backshift, model umum ARIMA 2,0,2 1,0,0 12 dapat dinyatakan oleh: 1 − ∅ 1 � − ∅ 2 � 2 1 − � 1 � 12 � � = � + 1 − � 1 � − � 2 � 2 � � Dengan mensubtitusikan nilai- nilai parameter yang telah ditaksir pada bentuk tersebut maka diperoleh: 1 − 1.0293� + 0.6972� 2 1 − 0.9466� 12 � � = 0.08912 + 1 − 1.0284� + 0.8513� 2 � � Berdasarkan Tabel 4.7 dapat dilihat bahwa nilai �- � untuk semua parameter lebih kecil dari � sehingga ditolak, artinya model ARIMA 2,0,2 1,0,0 12 telah memenuhi asumsi keberartian koefisien. 52 Pengujian asumsi ℎ�� � � terdiri dari 2 tahap yakni, uji keacakan residu dan uji kenormalan residu. Berikut ini adalah disajikan plot ACF residu dan nilai statistik Ljung-Box masing- masing model untuk menguji keacakan residu serta plot probabilitas residu masing- masing model untuk menguji kenormalan residu: 1. Model ARIMA 0,0,0 1,0,0 12 Gambar 4.7 Plot ACF Residu ARIMA 0,0,0 1,0,0 12 Berdasarkan Gambar 4.7 terlihat bahwa tidak terdapat lag yang keluar dari garis merah yang menunjukkan bahwa residu bersifat acak. Untuk memastikan hal ini maka digunakan statistik Q Box-Pierce yang terdapat pada tabel berikut: Lag A u to c o rr e la ti o n 70 65 60 55 50 45 40 35 30 25 20 15 10 5 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 Autocorrelation Function for RESI1 with 5 significance limits for the autocorrelations 53 Tabel 4.8 Nilai Q Box-Pierce ARIMA 0,0,0 1,0,0 12 Modified Box-Pierce Ljung-Box Chi-Square Statistic Lag 12 24 36 48 Chi-Square 10.4 16.6 28.6 35.1 DF 10 22 34 46 P-Value 0.407 0.787 0.731 0.879 Berdasarkan tabel 4.8 terlihat bahwa nilai p-value untuk setiap lag yang diuji lebih besar dari � maka diterima sehingga dapat dikatakan bahwa residu model ARIMA 0,0,0 1,0,0 12 bersifat acak. Gambar 4.8 Plot Probabilitas Residu ARIMA 0,0,0 1,0,0 12 RESI1 P e rc e n t 2 1 -1 -2 99.9 99 95 90 80 70 60 50 40 30 20 10 5 1 0.1 Mean 0.150 0.01632 StDev 0.6733 N 72 KS 0.073 P-Value Probability Plot of RESI1 Normal 54 Berdasarkan Gambar 4.8 diketahui nilai �- � 0.05, maka diterima artinya residu model ARIMA 2,1,00,1,0 9 berdistribusi normal. 2. Model ARIMA 2,0,0 1,0,0 12 Gambar 4.9 Plot ACF Residu ARIMA 2,0,0 1,0,0 12 Berdasarkan Gambar 4.9 terlihat bahwa tidak terdapat lag yang keluar dari garis merah yang menunjukkan bahwa residu bersifat acak. Untuk memastikan hal ini maka digunakan statistik Q Box-Pierce yang terdapat pada tabel berikut: Lag A u to c o rr e la ti o n 70 65 60 55 50 45 40 35 30 25 20 15 10 5 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 Autocorrelation Function for RESI2 with 5 significance limits for the autocorrelations 55 Tabel 4.9 Nilai Q Box-Pierce ARIMA 2,0,0 1,0,0 12 Modified Box-Pierce Ljung-Box Chi-Square Statistic Lag 12 24 36 48 Chi-Square 6.1 12.8 20.6 26.4 DF 8 20 32 44 P-Value 0.632 0.886 0.939 0.984 Berdasarkan tabel 4.9 terlihat bahwa nilai p-value untuk setiap lag yang diuji lebih besar dari � maka diterima sehingga dapat dikatakan bahwa residu model ARIMA 2,0,0 1,0,0 12 bersifat acak. Gambar 4.10 Plot Probabilitas Residu ARIMA 2,0,0 1,0,0 12 Berdasarkan Gambar 4.10 terlihat bahwa nilai �- � 0.05, maka diterima artinya residu model ARIMA 2,0,0 1,0,0 12 berdistribusi normal RESI2 P e rc e n t 2 1 -1 -2 99.9 99 95 90 80 70 60 50 40 30 20 10 5 1 0.1 Mean 0.057 0.01070 StDev 0.6627 N 72 KS 0.103 P-Value Probability Plot of RESI2 Normal 56 3. Model ARIMA 0,0,2 1,0,0 12 Gambar 4.11 Plot ACF Residu ARIMA 0,0,2 1,0,0 12 Berdasarkan Gambar 4.11 terlihat bahwa tidak terdapat lag yang keluar dari garis merah yang menunjukkan bahwa residu bersifat acak. Untuk memastikan hal ini maka digunakan statistik Q Box-Pierce yang terdapat pada tabel berikut: Tabel 4.10 Nilai Q Box-Pierce ARIMA 0,0,2 1,0,0 12 Modified Box-Pierce Ljung-Box Chi-Square Statistic Lag 12 24 36 48 Chi-Square 7.1 13.8 22.2 28.2 DF 8 20 32 44 P-Value 0.526 0.841 0.901 0.969 Lag A u to c o rr e la ti o n 70 65 60 55 50 45 40 35 30 25 20 15 10 5 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 Autocorrelation Function for RESI3 with 5 significance limits for the autocorrelations 57 Berdasarkan tabel 4.10 tersebut terlihat bahwa nilai p-value untuk setiap lag yang diuji lebih besar dari � maka diterima sehingga dapat dikatakan bahwa residu model ARIMA 0,0,2 1,0,0 12 bersifat acak. Gambar 4.12 Plot Probabilitas Residu ARIMA 0,0,2 1,0,0 12 Berdasarkan Gambar 4.12 terlihat bahwa nilai �- � 0.05, maka diterima artinya residu model ARIMA 0,0,2 1,0,0 12 berdistribusi normal. RESI3 P e rc e n t 2 1 -1 -2 99.9 99 95 90 80 70 60 50 40 30 20 10 5 1 0.1 Mean 0.127 0.01264 StDev 0.6646 N 72 KS 0.093 P-Value Probability Plot of RESI3 Normal 58 4. Model ARIMA 2,0,2 1,0,0 12 Gambar 4.13 Plot ACF Residu ARIMA 2,0,2 1,0,0 12 Berdasarkan Gambar 4.13 terlihat bahwa tidak terdapat lag yang keluar dari garis merah yang menunjukkan bahwa residu bersifat acak. Namun untuk memastikan hal ini maka digunakan statistik Q Box-Pierce yang terdapat pada tabel berikut: Tabel 4.11 Nilai Q Box-Pierce ARIMA 2,0,2 1,0,0 12 Modified Box-Pierce Ljung-Box Chi-Square Statistic Lag 12 24 36 48 Chi-Square 5.1 11.4 22.0 28.1 DF 6 18 30 42 P-Value 0.536 0.874 0.854 0.950 Lag A u to c o rr e la ti o n 70 65 60 55 50 45 40 35 30 25 20 15 10 5 1 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 Autocorrelation Function for RESI4 with 5 significance limits for the autocorrelations 59 Berdasarkan tabel tersebut terlihat bahwa nilai p-value untuk setiap lag yang diuji lebih besar dari � maka diterima sehingga dapat dikatakan bahwa residu model ARIMA 2,0,2 1,0,0 12 bersifat acak. Gambar 4.14 Plot Probabilitas Residu ARIMA 2,0,2 1,0,0 12 Berdasarkan Gambar 4.14 terlihat bahwa nilai �- � 0.05, maka diterima artinya residu model ARIMA 2,0,2 1,0,0 12 berdistribusi normal. Langkah terakhir adalah membandingkan nilai MSE setiap model untuk menentukan model terbaik untuk digunakan dalam peramalan. Berikut ini adalah tabel nilai MSE dari setiap model yang teridentifikasi: RESI4 P e rc e n t 2 1 -1 -2 99.9 99 95 90 80 70 60 50 40 30 20 10 5 1 0.1 Mean 0.092 0.008519 StDev 0.6542 N 72 KS 0.097 P-Value Probability Plot of RESI4 Normal 60 Tabel 4.12 Nilai MSE Model ARIMA Model Nilai DF SSE MSE ARIMA 0,0,0 1,0,0 12 70 32.2018 0.4600 ARIMA 2,0,0 1,0,0 12 68 31.1921 0.4587 ARIMA 0,0,2 1,0,0 12 68 31.3693 0.4613 ARIMA 2,0,2 1,0,0 12 66 30.3884 0.4604 Berdasarkan Tabel 4.12, nilai MSE terkecil dimiliki oleh model ARIMA 2,0,0 1,0,0 12 yakni sebesar 0.4587. Berikut ini adalah rangkuman diagnosis model SARIMA yang terindikasi: Tabel 4.13 Rangkuman Diagnosis Model ARIMA Model Keberartian Koefisien White Noise MSE Acak Normal ARIMA 0,0,0 1,0,0 12 Ya Ya Ya 0.4600 ARIMA 2,0,0 1,0,0 12 Tidak Ya Ya 0.4587 ARIMA 0,0,2 1,0,0 12 Tidak Ya Ya 0.4613 ARIMA 2,0,2 1,0,0 12 Ya Ya Ya 0.4604 Berdasarkan Tabel 4.13, model yang memenuhi tahapan diagnosis model, yakni memenuhi asumsi keberartian koefisien, bersifat white noise, serta memiliki nilai MSE terkecil di antara semua model yang teridentifikasi adalah model ARIMA 0,0,0 1,0,0 12 . Oleh karena itu model ARIMA 0,0,0 1,0,0 12 dipilih sebagai model yang akan digunakan pada tahapan evaluasi. 61

4.2 Pengolahan Data Menggunakan Metode Dekomposisi