Implementasi Gabungan Metode Bayesian dan Backpropagation untuk Peramalan Jumlah Pengangguran Terbuka di Indonesia
Vol. 1, No. 4, April 2017, hlm. 330-340 http://j-ptiik.ub.ac.id
Implementasi Gabungan Metode Bayesian dan Backpropagation untuk
Peramalan Jumlah Pengangguran Terbuka di Indonesia
1 2 3 Yure Firdaus Arifin , Dian Eka Ratnawati , Putra Pandu AdikaraProgram Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya 3 Email: adikara.putra@ub.ac.id
Abstrak
Salah satu masalah pokok yang dihadapi negara Indonesia adalah pengangguran. Penyebab terjadinya pengangguran antara lain adalah jumlah lapangan kerja yang tersedia lebih kecil dari jumlah lulusan/pencari kerja. Tidak sebandingnya jumlah lapangan kerja dengan jumlah lulusan/pencari kerja tersebut yang menyebabkan tingginnya tingkat pengangguran di Indonesia. Tingkat pengangguran yang tinggi berdampak langsung maupun tidak langsung terhadap kemiskinan, kriminalitas, dan masalah- masalah sosial. Akan tetapi pada kenyataannya berdasarkan hasil survei BPS dari tahun 2014 ke 2015 tingkat pengangguran terbuka di Indonesia justru menunjukkan peningkatan. Dengan meramalkan/memprediksi jumlah pengangguran, dapat membantu pemerintah Indonesia dalam membuat perencanaan program pemerintah ataupun kebijakan-kebijakan yang terkait tentang lapangan pekerjaan. Selain itu, data hasil prediksi dapat digunakan untuk mengukur seberapa berhasilkah program pemerintah yang telah dilaksanakan pada tahun sebelumnya.
Metode Backpropagation adalah salah satu metode yang dapat digunakan untuk memprediksi. Pada penelitian ini dilakukan optimasi nilai inisialisasi bobot pada Backpropagation menggunakan metode Bayesian yang merupakan modifikasi dari Kalman Filter. Berdasarkan hasil pengujian yang telah dilakukan dalam penelitian ini nilai Average Forecasing Error Rate (AFER) yang terendah adalah 2,1003%. Dari hasil pengujian tersebut metode gabungan Bayesian dan Backpropagation memiliki tingkat akurasi yang lebih baik dari pada metode Backpropagation dengan inisialisasi random yang memiliki nilai AFER terendah 2,5793% tetapi membutuhkan jumlah iterasi yang lebih banyak. Sistem prediksi jumlah pengangguran terbuka di Indonesia dengan metode gabungan Bayesian dan
Backpropagation pada penelitian ini dapat melakukan prediksi beberapa tahun kedepan secara langsung
tetapi hasil yang paling optimal adalah prediksi pada tahun pertama sedangkan pada tahun-tahun berikutnya hasil prediksi semakin tidak akurat.
Kata kunci: backpropagation, bayesian, kalman filter, time series
Abstract
One of the major problems that Indonesia has is unemployment. It happens because of the lownumber of the job vacancy meets the high number of the graduate and job seeker. The unbalanced
number of the job vacancy to the graduate and job seeker causes an increasing in the unemployment
rate in Indonesia. The high rate of unemployment will inevitably give a direct or indirect impact to the
poverty, crime, and other social issues. However, according to the survey conducted by BPS,
Indonesia’s unemployment rate was even increasing from the year of 2014 to 2015. It would really help
the Indonesian government to make planning, program, or policy related to the job vacancy by being
able to predict the number of unemployment. In addition, the data result from the prediction could be
us ed as the measurement of the success of government’s previous programs.Backpropagation is one of the methods that used to predict. This research works on the
optimation of weights initialization in Backpropagation using Bayesian method that is a modification of
the Kalman filter. According to the test result done in this research, the lowest value of Average
Forecasting Error Rate (AFER) is 2,1003%. From that result, the combination method between
Backpropagation and Bayesian has better accuracy rate than Backpropagation method with random
initialization that has 2,5793% lowest value of AFER, but need a lot of iterasion. The sistem of this
research can predict some future of years immediately but the most optimal result is the first year while
in subsequent years the result of the prediction is more inaccurate.Fakultas Ilmu Komputer Universitas Brawijaya
330
Keywords: backpropagation, bayesian, kalman filter, time series 1.
Kalman filter yang dilakukan pada saat proses
unit/neuron yang berada pada lapisan input
Pada jaringan Backpropagation , setiap
neuron-neuron yang ada pada lapisan tersembunyinya (K. S. Kusumadewi, 2004).
algoritma pembelajaran terawasi dan digunakan oleh perceptron dengan banyak lapisan untuk merubah bobot-bobot yang terhubung dengan
2.1. Backpropagation Backpropagation (runut balik) adalah
2. DASAR TEORI
pengangguran terbuka di Indonesia serta untuk mengetahui bagaimana hasil dari gabungan kedua metode tersebut berdasarkan hasil pengujian.
Backpropagation dalam memprediksi jumlah
inisialisasi bobot. Penelitian ini mempunyai tujuan pencapaian yaitu untuk mengimplementasikan metode Bayesian dan
Pada penelitian ini dilakukan prediksi jumlah pengangguran terbuka di Indonesia menggunakan gabungan metode Bayesian dan Backpropagation. Metode Bayesian pada penelitian ini merupakan modifikasi dari
PENDAHULUAN
menggunakan Random Weights Initialization (RI) dan Bayesian Weights Initialization (BI). Hasilnya metode BI menghasilkan persentasi tingkat akurasi yang lebih tinggi dibandingkan dengan RI. Mereka juga membandingkan metode BI dengan beberapa motode lain yang telah dilakukan oleh peneliti lainnya. Hasilnya metode BI adalah yang paling optimal untuk menyelesaikan masalah yang kompleks (Murru & Rossini, 2016).
Bayesian dan Backpropagation yaitu
teori kondisi probabilitas yang memperhitungkan probabilitas suatu kejadian bergantung pada kejadian lain (Yahdin, 2008). Pada penelitian tersebut mereka membandingkan hasil metode gabungan
Backpropagation. Bayesian merupakan sebuah
(character recognition). Pendekatan Bayesian yang menerapkan Kalman filter modifikasi digunakan untuk inisialisasi bobot pada
Backpropagation untuk pengenalan karakter
Pada penelitian sebelumnya yang telah dilakukan oleh Nadir Murru dan Rosaria Rossini yaitu menerapkan metode Bayesian untuk inisialisasi bobot pada algoritma
Salah satu metode yang dapat digunakan untuk memprediksi yaitu jaringan saraf tiruan. Jaringan saraf tiruan adalah sistem pemrosesan informasi yang didesain seperti cara kerja otak manusia dalam menyelesaikan masalah dengan melakukan proses belajar melalui perubahan bobot sinapsisnya. Jaringan saraf tiruan dapat melakukan pengenalan terhadap kegiatan berbasis data masa lalu. Data masa lalu dapat dipelajari oleh jaringan saraf tiruan sehingga memiliki kemampuan untuk memberikan keputusan terhadap data yang belum pernah dipelajari. Salah satu algoritma pada jaringan saraf tiruan yang dapat diterapkan dengan baik untuk peramalan adalah Backpropagation (K. S. Kusumadewi, 2004).
Prediksi merupakan proses memperkirakan sesuatu secara sistematis yang akan terjadi pada masa depan berdasarkan data informasi dari masa lalu dan sekarang yang dimiliki, sehingga mendapatkan hasil perkiraan yang mendekati hasil nyatanya. Terdapat dua teknik dalam memprediksi yaitu teknik prediksi kualitatif dan teknik prediksi kuantitatif. Teknik prediksi kualitatif merupakan prediksi yang hasilnya ditentukan pada individu yang menyusunnya berdasarkan pemikiran yang bersifat opini, pengetahuan dan pengalaman dari penyusunnya. Teknik kuantitatif merupakan prediksi yang hasilnya berdasarkan metode yang dipergunakan dalam prediksi tersebut (Berutu, 2013).
Tingginya tingkat pengangguran akan berdampak langsung maupun tidak langsung terhadap kemiskinan, kriminalitas, dan masalah- masalah sosial. Akan tetapi pada kenyataannya berdasarkan hasil survei BPS dari tahun 2014 ke 2015 tingkat pengangguran terbuka di Indonesia justru menunjukkan peningkatan. Jumlah pengangguran terbuka pada Agustus 2014 yaitu 7,24 juta orang, pada Agustus 2015 mencapai 7,56 juta orang. Dengan meramalkan/memprediksi jumlah pengangguran, dapat membantu pemerintah Indonesia dalam membuat perencanaan program pemerintah ataupun kebijakan-kebijakan yang terkait tentang lapangan pekerjaan. Selain itu, data hasil dari prediksi nantinya dapat digunakan untuk mengukur seberapa berhasilkah program pemerintah yang telah dilaksanakan pada tahun sebelumnya.
terhubung dengan setiap unit/neuron yang ada di lapisan tersembunyi (hidden layer). Setiap
unit/neuron yang ada pada lapisan tersembunyi
) antara lapisan input dan lapisan tersembunyi. Langkah 8 : [Tahap III: Update bobot dan bias]. Setiiap unit output (y k ,
δ j ).
δ j
kemudian digunakan untuk menghitung besar koreksi bobot dan bias (
∆V ji
dan
∆V jo
k =1,
tersembunyi dengan lapisan output . Langkah 7 : Setiap unit pada lapisan tersembunyi (dari unit ke-1 hingga ke-p; i
2,3,…,m) dilakukan update bias dan bobotnya (j=0,1,2,...p) sehingga menghasilkan bobot dan bias baru, demikian juga untuk setiap unit tersembunyi mulai dari unit ke-1 sampai dengan unit ke-
p .
Langkah 9 : Uji kondisi berhenti (akhir iterasi).
Gambar 2.1. Arsitektur jaringanBackpropagation
2.2. Bayesian
=1…n; k=1…m) dilakukan perhitungan kesalahan/error untuk lapisan tersembunyi (
(∆W jk dan ∆W ok ) antara lapisan
(hidden layer) terhubung dengan setiap unit yang ada pada lapisan output. Jaringan ini memiliki banyak lapisan (multilayer network).
k =1,2,3,...m) dikalikan dengan
Saat jaringan Backpropagation diberikan pola input sebagai pola pelatihan (training), maka pola tersebut menuju unit-unit pada lapisan tersembunyi untuk selanjutnya diteruskan pada unit-unit pada lapisan output. Unit-unit pada lapisan output akan memberikan respon sebagai output jaringan saraf tiruan. Ketika hasil output tidak sesuai dengan yang diharapkan atau target, maka output akan disebarkan mundur (backward) pada lapisan tersembunyi (hidden layer) kemudian dari lapisan tersembunyi (hidden layer) dilanjutnya menuju ke lapisan input. Arsitektur jaringan
Backpropagation ditunjukkan pada Gambar 2.1 (Agustin & Prahasto, 2012).
Pelatihan jaringan Backpropagation terdiri dari 3 tahapan yaitu Umpan maju (feedforward), Umpan mundur (Backpropagation), dan update bobot. Secara rinci proses algoritma pelatihan pada jaringan Backpropagation dapat diuraikan sebagai berikut: Langkah0 : Inisialisasi nilai bobot, menentukan konstanta laju pelatihan (
α/alpha), menentukan
teleransi/target error atau jumlah maksimum iterasi/epoch. Langkah 1 : Ketika kondisi berhenti belum dicapai, maka dilakukan langkah ke-2 hingga langkah ke-9. Langkah 2 : Untuk setiap pasangan pola pelatihan, dilakukan langkah ke-3 sampai langkah ke-8. Langkah 3 : [Tahap I: Umpan maju
(feedforwand)]. Setiap unit input menerima sinyal dan meneruskannya ke unit tersembunyi di atasnya. Langkah 4 : Masing-masing unit pada lapisan tersembunyi dikalikan dengan bobotnya dan dijumlahkan serta ditambahkan dengan biasnya. Langkah 5 : Masing-masing unit output (yk,
bobot dan dijumlahkan serta ditambahkan dengan biasnya. Langkah 6 : [Tahap II: Umpan mundur
lapisan di bawahnya dan digunakan untuk menghitung besarnya koreksi bobot dan bias
(backpropagation)]. Setiap unit
output (y k , k=1,2,3,...m) menerima
pola target t k sesuai dengan pola
input
pada saat pelatihan dan kemudian kesalahan/error lapisan
output ( δ k ) dihitung. δ k dikirim ke
Teori Bayesian merupakan sebuah teori kondisi probabilitas yang memperhitungkan probabilitas suatu kejadian bergantung pada kejadian lain. Pada dasarnya, teorema tersebut mengatakan bahwa kejadian di masa depan dapat diprediksi dengan syarat kejadian sebelumnya telah terjadi. Statement teori Bayes ditunjukkan pada Persamaan 2.1. P(A/B) adalah probabilitas gabungan kejadian A dan B. Dengan membagi kedua sisi dengan P(B), maka akan didapat persamaan yang ditunjukkan pada Persamaan 2.2. Secara umum teorema Bayes dapat dituliskan dalam bentuk yang ditunjukkan pada Persamaan 2.3. (Lukman, 2013). P(A|B)P(B) = P(A, B) = P(B|A)P(A) (2.1) ( | ) =
( | ) ( ) ( )
(2.2) P(Ai|B) =
( │ ) ( ) ∑ ( │ ) ( )
(2.3)
untuk pengenalan karakter (character recognition). Pendekatan Bayesian yang menerapkan Kalman filter modifikasi digunakan untuk inisialisasi bobot pada Backpropagation (Murru & Rossini, 2016).
Backpropagation
Pada penelitian sebelumnya yang telah dilakukan oleh Nadir Murru dan Rosaria Rossini yaitu menerapkan metode Bayesian untuk inisialisasi bobot pada algoritma
2.3. Gabungan Bayesian dan Backpropagation
2.3. Kalman Filter
sistem yang linear. Dalam perkembangannya, untuk sistem yang lebih kompleks dengan persamaan matematis yang linier, Kalman filter dapat dimodifikasi agar dapat mengestimasi sistem yang non-linier. Ada beberapa contoh modifikasi Kalman filter yaitu Extended Kalman
Pada penelitian tersebut mereka membandingkan hasil metode gabungan
measurement (m ) dilakukan secara random
adalah matrik simetris berordo 9 karena pada penelitian ini menggunakan unit sebanyak 9 baik pada lapisan input (input layer) maupun lapisan tersembunyi (hidden layer). Pada penelitian ini inisialisasi nilai matrik prior estimation (w ) dan
Prior estimation (w t ) dan measurement (m t )
Backpropagation w t : prior estimation m t : measurement Q t : matrik kovarian dari w t R t : matrik kovarian dari m t
Keterangan: W t : bobot teroptimasi untuk
W t = (Q t -1 + R t -1 ) -1 (Q t -1 w t + R t -1 m t ) (2.4) w t+1 = W t (2.5) m t+1 = random(-1,1) (2.6) Q t+1 = (Q t -1 + R t -1 ) -1 (2.7) R t+1 = random(-1,1) (2.8)
penelitian ini ditunjukkan pada Persamaan 2.4, 2.5, 2.6, 2.7, dan 2,8 (Murru & Rossini, 2016).
Bayesian dan modifikasi Kalman filter pada
menggunakan Random Weights Initialization (RI) dan Bayesian Weights Initialization (BI). Hasilnya metode BI menghasilkan persentasi tingkat akurasi yang lebih tinggi dibandingkan dengan RI. Mereka juga membandingkan metode BI dengan beberapa motode lain yang telah dilakukan oleh peneliti lainnya. Hasilnya metode BI adalah yang paling optimal untuk menyelesaikan masalah yang kompleks. Inisialisasi bobot menggunakan pendekatan
Bayesian dan Backpropagation yaitu
Metode Kalman filter merupakan suatu metode yang dapat dipergunakan untuk mengestimasi variabel state dari sistem dinamik stokastik linier yang terkorupsi oleh white noise Gaussian. Variabel state dari suatu sistem dapat diestimasi oleh Kalman filter dengan memodelkan sistem tersebut terlebih dahulu (Palega, Wardoyo, & Wiryadinata, 2013).
Filter (EKF), Uncented Kalman Filter (UCF),
Kalman filter banyak diterapkan dalam
berbagai aplikasi. Fungsi dari Kalman filter adalah sebagai estimator dalam berbagai sistem yang digunakan. Kalman filter memiliki model yang sederhana sehingga mudah diterapkan pada berbagai sistem. Kalman filter memperhitungkan noise yang diestimasi pada seluruh cangkupan frekuensi sehingga Kalman
filter dapat digunakan sebagai estimator tanpa
perlu memperhitungkan noise yang terjadi pada sistem secara detail terlebih dahulu. Kalman
filter dapat digunakan untuk melakukan estimasi
linear (Welch & Bishop, 2006). Kalman filter
E. Kalman pada tahun 1960 melalui papernya yang terkenal tentang suatu penyelesaian rekursif pada masalah filtering data diskrit yang
filter pertama kali diperkenalkan oleh Rudolph
estimasi variabel keadaan dari sistem dinamik stokastik linear diskrit yang meminimumkan nilai kovariansi error estimasi. Metode Kalman
Kalman Filter merupakan suatu metode
dan Franctional Kalman Filter (FKF) (Murru & Rossini, 2016).
merupakan suatu pendekatan teknis untuk menaksir fungsi parameter dalam peramalan deret berkala (time series). Keunggulan dari metode Kalman filter adalah kemampuannya dalam mengestimasi suatu keadaan berdasarkan data yang minim. Data minim yang dimaksudkan merupakan data pengukuran (alat ukur) karena Kalman filter adalah suatu metode yang menggabungkan model dan pengukuran. Data pengukuran terbaru menjadi bagian yang penting dari algoritma Kalman filter karena data terbaru akan digunakan untuk mengoreksi hasil prediksi sehingga hasil estimasinya selalu mendekati kondisi yang sebenarnya (Masduqi & Apriliani, 2008). dengan range (-h,h). Nadir Murru dan Rosaria
3.1. Normalisasi Data
Rossini pada penelitiannya membatasi nilai t Data yang digunakan dalam penelitian ini untuk mempercepat proses komputasi dan untuk adalah data dari Badan Pusat Statistik tentang mencegah nilai bobot yang dihasilkan mendekati jumlah pengangguran terbuka di Indonesia dari
0. Mereka menentukan t max = 2, pada penelitian tahun 1986 sampai 2016. Pada penelitian ini data ini diterapkan hal yang sama sehingga hasil dari 2 adalah nilai bobot yang telah teroptimasi dinormalisasi ke range 0,1 sampai 0,9 dengan
W rumus yang ditunjukkan pada Persamaan 3.1 (S.
untuk digunakan pada algoritma Kusumadewi, 2003).
Backpropagation pada lapisan input ke hidden 0,8( − ) (V).
′ = + 0,1
−
(3.1) 3.
METODE Keterangan:
a : nilai minimum
Penelitian ini menggunakan metode b : nilai maksimum gabungan Bayesian dan Backpropagation dimana metode Bayesian digunakan untuk
3.2. Inisialisasi Bobot Menggunakan
inisialisasi bobot
V pada jaringan Bayesian
Backpropagation. Diagram alir metode
gabungan ditunjukkan pada Gambar 3.1 Pada penelitian ini nilai bobot
V
sedangkan arsitektur jaringan yang digunakan diinisialisasi menggunakan metode Bayesian pada penelitian ini ditunjukkan pada Gambar dengan langkah-langkah yang ditunjukkan pada 3.2. Gambar 3.3.
Gambar 3.1 Diagram alir sistemGambar 3.3 Diagram alir metode BayesianKeterangan: max 1. pada sistem, pada
Menentukan t penelitian ini t max = 2. 2. dan m dengan
Inisialisasi matrik w nilai random antara -h sampai h.
Gambar 3.2 Arsitektur jaringan3. t yang merupakan matrik 3.
Menghitung Q Mengambil data latih dari database kovarian dari w t dan R t yang merupakan yang telah dinormalisasi. matrik kovarian dari m t .
4. Melakukan propagasi maju kemudian 4. t menggunakan menghitung MSE. Menghitung bobot W Persamaan 2.4.
5. max t Jika nilai MSE kurang dari sama dengan 5. maka simpan bobot W , jika MSE target atau jumlah iterasi sama
Jika t = t tidak maka update nilai w t t t dan dengan jumlah maksimum iterasi maka
, m , Q , R t berturut-turut menggunakan simpan bobot, jika tidak maka lakukan
Persamaan 2.5, 2.6, 2.7, dan 2.8, propagasi mundur. kemudian t = t+1 dan kembali ke proses 6.
Mengitung perubahan bobot lalu ke-3.
update bobot.
7. Iterasi bertambah 1 kemudian kembali 3.3. Metode Backpropagation ke langkah ke-4. Metode Backpropagation digunakan untuk 4.
HASIL PENGUJIAN DAN ANALISIS
proses training data. Langkah-langkah pada metode Backpropagation ditunjukkan pada
4.1. Pengujian Learning Rate (alpha) Gambar 3.4. Terhadap Nilai AFER
Pengujian ini bertujuan untuk mengetahui bagaimana pengaruh nilai learning rate (alpha) terhadap nilai AFER. Learning rate adalah parameter jaringan dalam mengendalikan proses penyesuaian bobot. Untuk pengujian ini variabel yang diberi nilai tetap adalah t max = 2 dan h = 1, uji coba dilakukan sebanyak 5 kali dengan jumlah maksimum iterasi 20000, training menggunakan 10 pola data dan prediksi pada tahun 2016a. Tabel hasil pengujian ditunjukkan pada Tabel 4.1 dan grafik hasil pengujian ditunjukkan pada Gambar 4.1.
Tabel 4.1 Hasil pengujian learning rate (alpha) terhadap nilai AFERalpha AFER (%)
0,1 6,9332 0,2 6,2637 0,3 5,5869 0,4 5,0245 0,5 4,6543 0,6 4,4691 0,7 4,4107 0,8 4,4177 0,9 4,4504
Gambar 3.4 Diagram alir metodeBackpropagation
Keterangan: 1.
Menentukan maksimum iterasi dan target MSE. 2. bobot dan bias
Inisialisasi menggunakan bilangan acak kecil.
Gambar 4.1 Grafik hasil pengujian LearningGambar 4.2 Grafik hasil pengujian variabel t max terhadap nilai AFERinisialisasi bobot V menggunakan metode Bayesian. Untuk pengujian ini variabel yang diberi nilai tetap adalah alpha= 0,7 dan t max = 2, uji coba dilakukan sebanyak 5 kali dengan jumlah maksimum iterasi 20000, training menggunakan 10 pola data dan prediksi pada tahun 2016a. Tabel hasil pengujian ditunjukkan
(w) dan measurement (m) ketika proses
Pengujian ini bertujuan untuk mengetahui bagaimana pengaruh nilai variabel h terhadap nilai AFER. Variabel h adalah batas nilai (range) random pada inisialisasi nilai prior estimation
4.3. Pengujian Variabel h Terhadap Nilai AFER
nilai AFER tertinggi adalah ketika nilai t max = 18, tetapi perbedaan rata-rata nilai AFER dari pengujian ini sangat kecil. Berdasarkan hasil tersebut maka dapat dikatakan pada penelitian ini pengaruh nilai variabel t max tidak terlalu besar terhadap hasil prediksi karena pada inisialisasi bobot V menggunakan metode Bayesian proses iterasi selanjutnya tetap akan dilakukan perhitungan matrik kovarian sehingga perbedaan hasil inisialisasi bobot pada satu iterasi dengan iterasi lainnya tidak terlalu besar. Jadi dapat disimpulkan pada pengujian ini nilai variabel t max yang optimal adalah 2, maka untuk skenario pengujian selanjutnya akan digunakan nilai t max = 2.
AFER terendah adalah ketika nilai t max = 2 dan
Berdasarkan grafik hasil skenario pengujian 3 pada Gambar 4.2 menunjukkan bahwa nilai
12 4,6688 14 4,6733 16 4,6843 18 4,6993
Rate (alpha) Terhadap Nilai AFER
t max AFER (%)
10 4,6683
2 4,6662 4 4,6731 6 4,6981 8 4,6932
t max AFER (%)
Terhadap Nilai AFER
Tabel 4.2 Hasil pengujian variabel T maxPengujian ini bertujuan untuk mengetahui bagaimana pengaruh nilai variabel t max terhadap nilai AFER. Variabel t max digunakan untuk menentukan batas iterasi pada saat inisialisasi bobot V menggunakan metode Bayesian. Untuk pengujian ini variabel yang diberi nilai tetap adalah alpha= 0,7 dan h = 1, uji coba dilakukan sebanyak 5 kali dengan jumlah maksimum iterasi 20000, training menggunakan 10 pola data dan prediksi pada tahun 2016a. Tabel hasil pengujian ditunjukkan pada Tabel 4.2 dan grafik hasil pengujian ditunjukkan pada Gambar 4.2.
Berdasarkan grafik hasil skenario pengujian 2 pada Gambar 4.1 menunjukkan nilai AFER terendah terjadi ketika alpha = 0,7 sedangkan nilai AFER tertinggi terjadi ketika alpha = 0,1, grafik tersebut menunjukkan bahwa pada penelitian ini semakin kecil nilai alpha maka semakin besar hasil nilai AFER. Nilai alpha berfungsi sebagai pengendali pada proses penyesuaian bobot. Hasil dari pengujian ini menunjukkan bahwa nilai alpha sangat mempengaruhi tingkat akurasi dari hasil prediksi. Pada pengujian ini dengan jumlah iterasi 20000 dan 10 pola data latih, nilai alpha yang paling optimal adalah 0,7, maka untuk skenario pengujian berikutnya nilai alpha akan digunakan 0,7.
4.2. Pengujian Variabel T max Terhadap Nilai AFER
- – 2015b
- – 2015b
- – 2015b
- – 2015b
adalah ketika jumlah pola data training = 30. Pola data yang digunakan untuk training pada pengujian ini adalah data terdekat dari tahun yang akan diprediksi. Jadi dapat disimpulkan pada pengujian ini bentuk distribusi data yang dilatih sangat berpengaruh terhadap hasil prediksi, semakin banyak variasi data maka tingkat akurasi semakin rendah. Pada pengujian ini jumlah pola data training yang optimal adalah 15, maka untuk skenario pengujian selanjutnya jumlah pola data training menggunakan 15 pola data.
8,2191
7,8518 30 1997
7.0553 25 2002
2.2448 20 2006a
3.2216 15 2008b
Data Training AFER (%) 10 2011a
Jumlah Pola Data
Tabel 4.4 Hasil pengujian pengaruh jumlah pola data training terhadap nilai AFER- – 2015b
AFER terendah adalah ketika jumlah pola data training = 15 dan nilai rata-rata AFER tertinggi
4.5. Pengujian Jumlah Iterasi dan Perbandingan Inisialisasi Random dengan Inisialisasi Bayesian
Berdasarkan grafik hasil skenario pengujian 5 pada Gambar 4.4 menunjukkan bahwa nilai
pengujian ini sangat kecil. Hal tersebut terjadi karena semakin besar nilai h maka variasi akan semakin besar sehingga menghasilkan nilai bobot yang semakin besar pula dan menyebabkan nilai AFER semakin besar. Pada pengujian ini nilai h yang optimal adalah 0,6, maka untuk skenario pengujian selanjutnya akan digunakan nilai h = 0,6.
h = 1,6, tetapi perbedaan nilai AFER dari
nilai rata-rata AFER tertinggi adalah ketika nilai
AFER terendah adalah ketika nilai h = 0,6 dan
Berdasarkan grafik hasil skenario pengujian 4 pada Gambar 4.3 menunjukkan bahwa nilai
Gambar 4.3 Grafik hasil pengujian variabel h terhadap nilai AFER0,6 4,6949 0,8 4,7114 1 4,7212 1,2 4,7345 1,4 4,7412 1,6 4,7497
h AFER (%)
Tabel 4.3 Hasil pengujian variabel h terhadap nilai AFERpada Tabel 4.3 dan grafik hasil pengujian ditunjukkan pada Gambar 4.3.
Gambar 4.4 Grafik hasil pengujian pengaruh jumlah pola data training terhadap nilai AFER4.4. Pengujian Pengaruh Jumlah Pola Data
alpha = 0.7, t max = 2, h = 0,6, maksimum iterasi prediksi adalah 2016a. Hasil pengujian dengan inisialisasi Bayesian terhadap waktu dintunjukkan pada Tabel 4.5 serta grafik pada training Gambar 4.5.
Pengujian ini bertujuan untuk mengetahui apakah jumlah pola data training dan bentuk distribusi data mempengaruhi nilai AFER. Untuk pengujian ini nilai variabel yang tetap adalah
Training Terhadap Nilai AFER
Pengujian ini bertujuan untuk mengetahui pengaruh jumlah iterasi serta membandingkan kecepatan dan tingkat akurasi sistem antara inisialisasi bobot secara random dengan inisialisasi Bayesian. Hasil perbandingan waktu diambil pada saat training sedangkan AFER diambil pada saat testing. Nilai variabel yang digunakan dalam pengujian ini adalah alpha = 0.7, t max = 2, dan jumlah pola data = 15. Data yang digunakan untuk training adalah tahun 2008b sampai 2015b sedangkan untuk tahun
= 20000, dan tahun prediksi adalah 2016a. Hasil pengujian ini ditunjukkan pada Tabel 4.4 dan grafik hasil pengujian ditunjukkan pada Gambar 4.4.
Tabel 4.5 Hasil pengujian jumlah iterasi dan perbandingan inisialisasi Random denganinisialisasi Bayesian (Random)
Random
Jumlah Waktu
Iterasi
AFER (%)
(milidetik) 1000 609 4,2596 2000 1266 3,2063 Gambar 4.6 Grafik hasil pengujian jumlah iterasi dan perbandingan inisialisasi random 5000 3078 2,6209 dengan inisialisasi Bayesian terhadap nilai
10000 6141 2,5793
AFER
15000 9156 2,7336 20000 12266 2,9056 Berdasarkan Grafik hasil pengujian jumlah iterasi dan perbandingan inisialisasi random
50000 30813 3,5636 dengan inisialisasi Bayesian terhadap waktu 75000 45937 3,8270
training pada Gambar 4.5 menujukkan bahwa
100000 61125 4,0144 semakin besar jumlah iterasi maka waktu proses
training akan semakin besar. Selisih waktu
Tabel 4.6 Hasil pengujian jumlah iterasi dan proses training pada sistem antara inisialisasiperbandingan inisialisasi Random dengan
random dengan inisialisasi menggunakan
inisialisasi Bayesian (Bayesian) metode Bayesian sangat kecil. Dari 9 uji coba,
Bayesian
inisialisasi random selalu lebih cepat dari pada Jumlah inisialisasi Bayesian meskipun selisihnya sangat
Waktu Iterasi
AFER (%) kecil.
(milidetik) Berdasarkan hasil pengujian jumlah iterasi 1000 703 6,1292 dan perbandingan inisialisasi random dengan 2000 1719 4,2450 inisialisasi Bayesian terhadap nilai AFER pada
Gambar 4.6 menujukkan bahwa hasil prediksi 5000 4234 2,4509pada jumlah iterasi 1000 dan 2000 inisialisasi 10000 7516 2,1003
random lebih akurat dari pada inisialisasi
15000 9250 2,1197
Bayesian, tetapi pada iterasi 5000 sampai
20000 15438 2,2448 100000 inisialisasi Bayesian lebih akurat, hal tersebut terjadi karena nilai inisialisasi bobot 50000 37312 3,0517
random lebih besar dari pada inisialisasi
75000 46094 3,6718
Bayesian sehingga proses pelatihan inisialisasi
100000 76828 3,8609
random lebih cepat tetapi tingkat ketelitian
inisialisasi Bayesian lebih tinggi dan memerlukan jumlah iterasi yang lebih banyak untuk mencapai hasil optimal. Jumlah iterasi yang paling optimal adalah 10000 karena nilai
AFER terendah dari kedua metode adalah pada
saat iterasi ke 10000. Jadi dapat disimpulkan pada pengujian ini inisialisasi Bayesian mempunyai tingkat akurasi lebih tinggi dari pada inisialisasi random dengan jumlah iterasi diatas 5000..
Gambar 4.5 Grafik hasil pengujian jumlah iterasi dan perbandingan inisialisasi random4.6. Pengujian Prediksi Beberapa Jangka Waktu Ke Depan
Berdasarkan grafik hasil pengujian prediksi beberapa jangka waktu ke depan pada Gambar 4.7 dan 4.8 menunjukkan bahwa sistem prediksi pada penelitian ini dapat digunakan untuk memprediksi 5 tahun ke depan secara langsung tetapi tingkat akurasi dari hasil prediksi lebih rendah dibandingkan dengan prediksi jangka waktu 1 tahun, hal tersebut terjadi karena data hasil prediksi pada tahun pertama digunakan untuk memprediksi tahun berikutnya. Dari hasil pengujian ini dapat disimpulkan bahwa sistem prediksi pada penelitian ini dapat digunakan untuk memprediksi beberapa tahun ke depan secara langsung tetapi hasil yang paling optimal adalah pada tahun pertama sedangkan tahun- tahun berikutnya akan semakin tidak akurat.
mendapatkan bobot optimum, bobot tersebut digunakan untuk memprediksi dengan cara
update bobot. Dari proses training akan
Sistem prediksi jumlah pengangguran terbuka di Indonesia dapat diimplementasikan menggunakan gabungan metode Bayesian dan Backpropagation dengan melalui beberapa proses. Proses yang pertama adalah inisialisasi bobot menggunakan metode Bayesian yang merupakan modifikasi Kalman filter. Setelah diperoleh bobot untuk inisialisasi maka dilakukan proses training menggunakan metode Backpropagation yang meliputi 3 tahap yaitu propagasi maju (Feedforward), propagasi mundur (Backpropagation), dan
sebagai berikut: 1.
Backpropagation , dapat diambil kesimpulan
Berdasarkan hasil dari penelitian yang telah dilakukan tentang sistem prediksi jumlah pengangguran terbuka di Indonesia menggunakan gabungan metode Bayesian dan
5. KESIMPULAN
Pengujian ini melakukan prediksi dengan jangka waktu 5 tahun sekaligus yaitu tahun 2016a dengan 3 macam data latih yaitu 15 pola adalah tahun 2006b sampai 2013b, 20 pola adalah tahun 2003 sampai 2013b, dan 25 pola adalah tahun 1998 sampai 2013b. Pengujian ini dilakukan dengan cara data hasil prediksi pada tahun pertama digunakan untuk memprediksi tahun kedua begitu juga seterusnya. Hasil dari prediksi 5 tahun ke depan akan dibandingkan dengan hasil prediksi jangka waktu 1 tahun ke depan. Pengujian ini dilakukan sampai iterasi ke 10000 dengan menggunakan variabel alpha = 0,7, t max = 2, dan h = 0,6. Pengujian ini bertujuan untuk mengetahui apakah sistem ini dapat digunakan untuk memprediksi beberapa jangka waktu ke depan. Pada pengujian ini hasil prediksi akan dibandingkan dengan data asli yang ditunjukkan pada Tabel 4.7 serta grafik yang ditunjukkan pada Gambar 4.7 dan 4.8.
Tabel 4.7 Hasil pengujian prediksi beberapa jangka waktu ke depanGambar 4.7 Grafik hasil pengujian prediksi beberapa jangka waktu ke depan25 Hasil Prediksi 7593353 8078095 AFER (%) 7,4958 13,0467
20 Hasil Prediksi 7543560 8023116 AFER (%) 6,8852 12,4508
15 Hasil Prediksi 7174869 7587810 AFER (%) 2,1003 7,4282
5 Tahun Ke depan
1 Tahun Kedepan
Hasil
Jumlah Pola
Gambar 4.7 Grafik hasil pengujian prediksi beberapa jangka waktu ke depan (AFER)(Teknik dan Aplikasinya)
menerapkan tahap propagasi maju (Feedforward).
2. Berdasarkan hasil pengujian yang telah dilakukan dalam penelitian ini nilai Average
Forecasing Error Rate (AFER) yang
terendah adalah 2,1003%. Sistem prediksi jumlah pengangguran terbuka di Indonesia pada penelitian ini dapat melakukan prediksi beberapa jangka waktu tahun kedepan secara langsung, tetapi hasil yang paling optimal adalah pada tahun pertama sedangkan pada tahun-tahun berikutnya hasil prediksi akan semakin tidak akurat.
3. Berdasarkan hasil pengujian pada penelitian ini, perbandingan antara inisialisasi random dengan inisialisasi Bayesian adalah waktu komputasi lebih cepat inisialisasi random tetapi dari kedua metode tersebut memiliki rata-rata selisih yang sangat kecil yaitu sekitar 500 milidetik, sedangkan untuk tingkat akurasi pada jumlah iterasi diatas 5000 inisialisasi Bayesian lebih akurat dari pada inisialisasi random sehingga proses komputasi lebih lama.
Journal for Technology and Science , 19 (3), 87
Masduqi, A., & Apriliani, E. (2008). Estimation of Surabaya River Water Quality Using Kalman Filter Algorithm. IPTEK, The
Network Untuk Simulasi Prediksi Pemenang PILKADA Menggunakan MSBNx. Jurnal Informatika Multimedia (JIM) STIMED NUSA PALAPA , 2(1).
. Yogyakarta: Graha Ilmu. Lukman, A. (2013). Algoritma Bayesian
Kusumadewi, K. S. (2004). Analisis Jaringan Saraf Tiruan dengan Metode Backpropagation Untuk Mendeteksi Gangguan Psikologi. Media Informatika,
2 , 1 –14.
Kusumadewi, S. (2003). Artificial Intelligence
- –91. Murru, N., & Rossini, R. (2016).
Dengan Metode Fuzzy Time Series Ruey Chyn Tsaur . Universitas Diponegoro.
Berutu, S. S. (2013). Peramalan Penjualan
Bisnis , 2, 89 –97.
Penggunaan Jaringan Syaraf Tiruan Backpropagation Untuk Seleksi Penerimaan Mahasiswa Baru Pada Jurusan Teknik Komputer Di Politeknik Negeri Sriwijaya. Jurnal Sistem Informasi
Neurocomputing A Bayesian approach for initialization of weights in backpropagation neural net with application to character recognition.
Neurocomputing , 193, 92 –105.
https://doi.org/10.1016/j.neucom.2016.01. 063 Palega, O., Wardoyo, S., & Wiryadinata, R.
6. DAFTAR PUSTAKA Agustin, M., & Prahasto, T. (2012).
(2013). Estimasi Kecepatan Kendaraan Menggunakan Kalman Filter. SETRUM,
2 (2), 60 –65.
Welch, G., & Bishop, G. (2006). An Introduction to the Kalman Filter.
Department of Computer Science University of North Carolina at Chapel Hill , 1 –16.