Prediksi Harga Batu Bara Menggunakan Support Vector Regression (SVR)

  

Vol. 2, No. 12, Desember 2018, hlm. 6603-6609 http://j-ptiik.ub.ac.id

Prediksi Harga Batu Bara Menggunakan Support Vector Regression (SVR)

1 2 3 Olivia Bonita , Lailil Muflikhah , Ratih Kartika Dewi

  Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya 1 2 3 Email: oliviabnta@gmail.com, lailil@ub.ac.id, ratihkartikad@ub.ac.id

  

Abstrak

  Prediksi terhadap harga batu bara diperlukan sebagai penunjang bagi industri pemakai batu bara ketika pembelian batu bara. Hasil prediksi dapat digunakan untuk penyusunan anggaran

  

berikutnya. Penelitian ini menggunakan Support Vector Regression (SVR) untuk memprediksi harga

  batu bara. SVR diterapkan melalui tahapan normalisasi data, menghitung matriks hessian, pencarian nilai

  α dengan sequential learning, dan perhitungan fungsi regresi. Kernel yang digunakan pada tahap

  matriks hessian mampu menentukan akurasi hasil prediksi, maka pada penelitian ini kernel Gaussian RBF dan kernel ANOVA diterapkan supaya dapat dianalisis pengaruhnya. Untuk memperoleh hasil prediksi dengan akurasi yang baik, dilakukan pengujian terhadap setiap parameter dan dievaluasi menggunakan mean absolute percentage error (MAPE). Pengujian memberikan rata-rata nilai MAPE sebesar 9,64% dengan kernel Gaussian RBF dan 8,38% dengan kernel ANOVA, dimana ini dikategorikan sangat baik pada 48 data latih untuk menguji 12 data uji dan parameter optimal sebesar

  ε

  0,00001; cLR 0,01; C 0,5;

  λ 0,5 pada kernel Gaussian dan 1 pada ANOVA. SVR memberikan hasil

  paling optimal saat memprediksi harga 1 bulan berikutnya. Hasil prediksi dari kedua kernel memiliki perbedaan yang tidak terlalu besar, tetapi kernel ANOVA bekerja lebih baik pada data harga batu bara.

  

Kata kunci: harga batu bara, prediksi, support vector regression, gaussian RBF, ANOVA, mean absolute

percentage error

  

Abstract

Coal price prediction is needed as support for coal user industrial to buy coal. Prediction result

can be used to make next budgeting. This research uses Support Vector Regression (SVR) method to

predict coal price. SVR is applied through data normalization, hessian matr ix calculation, α searching

through sequential learning, and regression function calculation. Kernel for hessian matrix stage can

determine accuracy of prediction, so in this research Gaussian RBF kernel and ANOVA kernel are

used and analyzed the effects. To obtain predictive results with good accuracy, testing of each

parameter is performed and evaluated by mean absolute percentage error (MAPE). The average of

MAPE for testing are 9,64% with Gaussian RBF kernel and 8,38% with ANOVA kernel, which are

categorized good, on 48 training data for 12 testing dat a and optimal parameters are ε 0,00001; cLR

0.01; C 0.5; λ 0.5 with Gaussian RBF kernel and 1 with ANOVA kernel. SVR gives the most optimal

result when predicting the next month price. The predicted results of the two kernels are not too

different, but the ANOVA kernel works better on this coal price data.

  

Keywords: coal price, prediction, support vector regression, gaussian RBF, ANOVA, mean absolute percentage

error

  dipenuhi dengan melakukan prediksi yang 1. mampu menghasilkan nilai sedekat mungkin

   PENDAHULUAN

  dengan harga berikutnya. Di sisi lain, Suatu perusahaan pasti akan menyusun pergerakan harga batu bara yang terkadang rencana pengeluaran berikutnya agar anggaran tidak menentu dan cenderung dinamis karena perusahaan yang tersedia dapat dipakai dengan mengalami perubahan signifikan yang maksimal (Chatfield, 2001). Demikian pula disebabkan oleh beberapa peristiwa seperti naik dengan perusahaan atau industri yang akan turunnya ekspor, menyebabkan pola menggunakan batu bara. Kebutuhan akan pergerakannya sulit untuk ditentukan. perkiraan harga pada daftar rencana dapat

  Fakultas Ilmu Komputer Universitas Brawijaya

6603

  = − ∑ ( ∗ =1

  Pada setiap data latih, lakukan perhitungan nilai error (Ei) dengan Persamaan 3, perubahan nilai Lagrange multiplier dengan Persamaan 4 dan 5, dan nilai Lagrange

  2 ) (1)

  Keluaran dari matriks hessian kemudian dimasukkan pada Persamaan 2 untuk mencari nilai

  γ yang berfungsi mengontrol

  kecepatan proses learning, dimana cLR adalah konstanta learning rate .

  = ⁡( )

  (2) 3.

  multiplier yang baru dengan Persamaan 6 dan 7.

  λ adalah variabel skalar.

  Penelitian sebelumnya oleh Bo Zhang dan Junhai Ma (2011) tentang prediksi indeks harga batu bara menggunakan teknik partial least-

  − ) (3)

  δα i ∗

  = min⁡⁡{max(γ(E i − ε), −α i ∗

  ) , C − α i ∗

  }

  (4)

  = ( ( , ) +

  2. Hitung matriks hessian (Rij) dengan Persamaan 1, dimana K(x i ,x j ) adalah fungsi kernel dan

  = min⁡⁡{max(γ(−E i

  data untuk regresi yang mampu menyelesaikan data nonlinear. SVR menghasilkan akurasi yang baik jika dibandingkan dengan Artificial Neural Network (ANN) (Balabin & Lomakina, 2011). Hal ini dijabarkan pada penelitian oleh Mustakim yang melakukan prediksi terhadap produksi minyak kelapa sawit. Dari penelitian tersebut menghasilkan nilai MSE sebesar 6% dengan kernel Radial Basis Function (RBF) pada metode SVR dan 9% pada ANN dengan hidden neuron 20 (Mustakim, et al., 2016).

  square

  memberikan hasil prediksi dengan kesalahan minimum sebesar 0.3% dan maksimum sebesar 9.7% pada sampel harga selama 20 hari sebelumnya dan memprediksi harga hari selanjutnya. Tetapi partial least-

  square biasanya digunakan untuk permasalahan

  linear dan berdasarkan penelitian yang dilakukan oleh Saluza (2016), data time series yang melibatkan waktu beberapa tahun cenderung bersifat tidak statis karena kemungkinan adanya fluktuasi.

  Pada penelitian ini, metode machine

  learning yang diusung adalah Support Vector Regression (SVR). SVR adalah model analisis

  Hasil performa SVR diperoleh berdasarkan penentuan nilai parameter dan kernel yang digunakan. Terdapat beberapa kernel untuk kasus regresi nonlinear dan masing-masing kernel akan memberikan akurasi yang berbeda (Nurunnahar, et al., 2017). Penelitian ini akan menganalisis dua kernel Radial Basis Function (RBF), yaitu Gaussian dan ANOVA supaya didapatkan hasil performa yang lebih optimal. Pemilihan kernel ANOVA untuk prediksi harga batu bara dilakukan karena pada penelitian SVR sebelumnya untuk meramalkan cuaca oleh Rasel (2017), ANOVA memberikan hasil lebih baik dari pada kernel Gaussian dan polinomial.

  αi dan αi* sebesar 0.

  ∗ ( ) =

  (5)

  }

  − ε), −α i ) , C − α i

  sequential

  SVR dengan langkah-langkah sebagai berikut (Vijayakumar & Wu, 1999).

  1. Inisialisasi parameter SVR, iterasi maksimum, dan nilai awal

  δα i

  kesalahan antara nilai hasil prediksi dari masukan dan nilai yang keluar sebenarnya dan mempengaruhi jumlah support vector (Awad & Khanna, 2015). Proses pelatihan dan pengujian SVR dapat dilakukan menggunakan

  multiplier terakhir yang dihasilkan dan matriks hessian.

  Kernel yang digunakan pada SVR merupakan fungsi yang mampu memetakan data ke ruang fitur berdimensi tinggi agar data dapat diproses dengan lebih terstruktur dengan komputasi efisien. Pada penelitian ini akan menggunakan kernel Gaussian RBF dan kernel ANOVA untuk dianalisis (Berk, et al., 2014).

  (8) 3.

  )

  2

  − )( ( , ) +

  ∗ =1

  ( ) = ∑ (

  5. Hitung fungsi regresi untuk memberikan hasil prediksi seperti pada Persamaan 8 dengan perkalian antara nilai Lagrange

  ε-insensitive sebagai fungsi symmetrical loss . Besarnya nilai ԑ menentukan toleransi

  |) < dan (| |) < .

  ∗

  4. Ulangi langkah ketiga sampai iterasi maksimum yang ditentukan atau telah mencapai konvergensi dengan syarat (|

  Pada Persamaan 3 hingga Persamaan 7, adalah nilai aktual ke-i, ε adalah epsilon, dan C adalah nilai kompleksitas.

  (6) ( ) = + (7)

  ∗

2. SUPPORT VECTOR REGRESSION

  Support Vector Regression (SVR)

FUNGSI KERNEL

  merupakan metode dari machine learning yang diterapkan pada permasalahan regresi dan memberikan keluaran bernilai kontinu. Metode SVR ini dapat bekerja pada permasalahan linear dan nonlinear dengan menggunakan konsep daerah

  1. Kernel Gaussian RBF ( , ) = (−

  Pengujian parameter SVR dilakukan pada parameter

  αi* dan αi terbaru, fungsi regresi dihitung

  terhadap data uji supaya didapatkan hasil nilai prediksi harga. Hasil prediksi tiap penggunaan kernel kemudian dievaluasi dan dibandingkan menggunakan Mean Absolute Percentage Error

  (MAPE) . Secara garis besar, perancangan alur SVR ditampilkan pada Gambar 1.

  Gambar 1 Diagram Alir SVR 5.

  Setelah SVR diterapkan, dilakukan pengujian untuk mengetahui akurasi hasil prediksi. Terdapat 6 pengujian yang dilakukan, yaitu pengujian nilai parameter SVR, pengujian nilai parameter kernel, pengujian jumlah iterasi

  sequential learning , pengujian jumlah data

  latih, pengujian jumlah fitur, dan pengujian fungsi kedua kernel. Pengujian nilai parameter dan jumlah iterasi menggunakan 84 data latih dan 12 data uji berfitur 3. Fitur diisi dengan harga 3 bulan sebelumnya yang disusun secara sekuensial. Nilai parameter, jumlah iterasi, jumlah fitur, dan jumlah data latih optimal yang telah diperoleh kemudian diiuji pada pengujian fungsi kernel.

  5.1 Pengujian Nilai Parameter SVR

  λ (lambda), ԑ (epsilon), cLR (learning rate), dan C (kompleksitas). Nilai

  sequential learning selesai dan memberikan

  yang diuji pada tiap parameter telah ditentukan. Pada pengujian nilai

  λ, nilai 0,5 (kernel RBF)

  dan 1 (kernel ANOVA) memberikan nilai MAPE terkecil dan jika nilai

  λ bertambah maka

  nilai MAPE akan semakin besar karena proses pembelajaran yang terlalu cepat seperti pada

  Normalisasi Data Pelatihan SVR Mulai Inisialisasi data latih, data uji, parameter SVR&kernel

  Pengujian Fungsi Regresi Hasil prediksi, Nilai MAPE Selesai

  Hitung MAPE Denormalisasi Data

  nilai

  Perancangan sistem untuk memprediksi harga batu bara dengan Support Vector Regression (SVR) dimulai dengan menginisialisasi nilai-nilai parameter SVR dan kernel serta data latih dan data uji. Fitur data latih dan uji adalah harga batu bara acuan yang disusun secara sekuensial berurutan. Data latih dan data uji dinormalisasi untuk mempermudah perhitungan. Selanjutnya proses pelatihan menggunakan sequential learning terhadap data latih. Sequential learning dilakukan hingga iterasi maksimum. Pada tahap pemetaan matriks hessian, kernel Gaussian RBF dan kernel ANOVA diimplementasikan. Setelah

  ‖ −⁡ ‖

  ))

  2

  2

  2

  ), ⁡ > 0

  (9)

  2. Kernel ANOVA

  ( , ) = (∑ (− ( − )

  2

   (10)

  4.2 Pemodelan SVR

  Keterangan :

  σ = kovarian γ = gamma

  d = degree

  x

  = data 4.

   PERANCANGAN

  4.1 Data Penelitian

  Data pada penelitian ini adalah data harga batu bara acuan yang dikeluarkan pemerintah setiap bulannya melalui situs Kementrian ESDM. Data harga yang digunakan sebanyak 108 data yang diambil pada rentang waktu bulan Januari 2009 hingga Desember 2017. Harga batu bara ini memiliki satuan USD.

PENGUJIAN DAN ANALISIS

  grafik Gambar 2. Pengujian

  ԑ dilakukan dari Hasil Pengujian Parameter cLR nilai 0,0000001 hingga 0,1 dengan kelipatan 10.

  30 Nilai 0,00001 pada kernel RBF dan 0,001

  memberikan nilai MAPE terkecil seperti yang

  20 E P ditunjukan pada Gambar 3.

  ԑ yang kecil akan MA

  10

  menambah jumlah support vector dan membuat pembelajaran dilakukan lebih seksama (Chen, et al., 2013). Pengujian cLR menggunakan nilai

  0,00001 0,0001 0,001 0,01

  sebesar 0,00001 hingga 0,01 dengan kelipatan 10 seperti pada Gambar 4. Nilai cLR optimal

  Nilai Parameter cLR untuk memprediksi harga batu bara adalah 0,01.

RBF ANOVA

  Pada pengujian C, didapatkan nilai optimal untuk memprediksi harga batu bara sebesar 0,5.

  Gambar 4 Grafik Hasil Pengujian Parameter cLR

  Nilai parameter C yang terlalu kecil akan membuat nilai pinalti kecil sehingga kesalahan yang ditoleransi akan semakin banyak dan

  Hasil Pengujian Parameter C

  akurasi berkurang seperti pada grafik yang ditampilkan pada Gambar 5 (Awad & Khanna,

  25 2015).

  20 E

  15 P

  10 MA Hasil Pengujian Parameter λ

  5

  25

  20 E P

  15 MA Nilai Parameter C

  10 RBF ANOVA

  5 0,01 0,05 0,1 0,5

  1

  5

  10 Gambar 5 Grafik Hasil Pengujian Parameter C Nilai Parameter λ

RBF ANOVA

  5.2 Pengujian Nilai Parameter Kernel

  Selain parameter SVR, parameter σ pada kernel RBF, degree dan

  γ pada kernel ANOVA

  Gambar 2 Grafik Hasil Pengujian Parameter λ memberikan pengaruh terhadap pemetaan data.

  Pada pengujian σ nilai 0,3 memberikan nilai

  MAPE terkecil seperti ditunjukkan pada

  Hasil Pengujian Parameter

  Gambar 7. Nilai

  ε σ yang terlalu besar atau

  terlalu kecil akan membuat persebaran data

  11

  10

  tidak merata atau terlalu banyak noise sehingga

  E

  9 P kesalahan semakin besar (Chen, et al., 2013).

  8 MA

  7 Hasil Pengujian Parameter σ

  6

  60

  50

  40 E Nilai Parameter P ε

  30 MA RBF ANOVA

  20

  10 Gambar 3 Grafik Hasil Pengujian Parameter ε

  0,1 0,2 0,3 0,4 0,5 0,6 Nilai Parameter σ

  Gambar 6 Grafik Hasil Pengujian σ Selanjutnya pada kernel ANOVA,

  Hasil Pengujian Jumlah Iterasi

  pengujian degree memberikan nilai optimal

  20 sebesar 3 dengan MAPE sebesar 7,97%.

  Sedangkan pada pengujian γ diperoleh nilai

  15

  optimal sebesar 5. Nilai γ yang terlalu kecil E

  P

  10

  akan membuat pemetaan terlalu halus sehingga

  MA

  tidak menangkap pola yang penting (Berk, et

  5 al., 2014).

  1

  5

  10 50 100 500 1000 Jumlah Iterasi Hasil Pengujian Parameter Degree

  RBF ANOVA 10,1 9,6

  Gambar 9 Grafik Hasil Pengujian Jumlah Iterasi 9,1

  E 8,6

  P

  5.4 Pengujian Jumlah Fitur Data 8,1

  MA

  Pada pengujian jumlah fitur, jumlah yang

  7,6

  diuji sebesar 2 hingga 7. Fitur berjumlah 3

  7,1

  memberikan hasil MAPE terkecil. Pada

  6,6

  1

  2

  3

  4 5 prediksi harga batu bara, jumlah fitur yang

  besar tidak memberikan error rate yang kecil,

  Nilai Parameter Degree

  hal ini dikarenakan terjadi curse of dimension, dimana semakin banyak fitur atau dimensi

  Gambar 7 Grafik Hasil Pengujian degree

  membuat nilai kesalahan semakin besar (Awad & Khanna, 2015).

  Hasil Pengujian Parameter γ Hasil Pengujian Jumlah Fitur 9,8

  6 9,6 5,5 9,4

  E 5 9,2

  E P P

  4,5

9 MA

  MA

  4 8,8 3,5 8,6

  3 8,4

  2

  3

  4

  5

  6

  7

  1

  2

  3

  4

  5

  6

7 Jumlah Fitur

  Nilai Parameter γ

RBF ANOVA

  Gambar 8 Grafik Hasil Pengujian γ Gambar 10 Grafik Hasil Pengujian Jumlah Fitur

5.3 Pengujian Jumlah Iterasi

  Pengujian jumlah iterasi memberikan hasil Pengujian ini bertujuan untuk menentukan iterasi optimal sebesar 1000. Semakin banyak jumlah data latih optimal. Jumlah yang diuji iterasi yang dilakukan maka error rate adalah 24, 48, 72, dan 84 untuk 12 data uji. cenderung semakin kecil karena proses

  5.5 Pengujian Jumlah Data Latih

  Berdasarkan pengujian yang telah dilakukan pembelajaran data semakin baik. melalui 10 kali percobaan pada tiap jumlah, data latih sebesar 48 memberikan rata-rata MAPE yang kecil pada kedua kernel. Data latih yang banyak belum tentu membuat nilai MAPE semakin kecil seperti pada Gambar 11, hal ini disebabkan SVR mengalami curse of dimension (Awad & Khanna, 2015).

  • r a ta M AP E

  4

  Jumlah Data Latih Hasil Pengujian Jumlah Data Latih

  84 R a ta

  72

  48

  24

  12

  10

  8

  λ sebesar 0,5 untuk kernel Gaussian

  RBF dan 1 untuk kernel ANOVA ,

  ε sebesar

  0,00001, cLR sebesar 0,01, dan C sebesar 0,5 dengan 48 data latih berfitur 3. Hasil MAPE rata-rata yang diperoleh pada penggunaan nilai parameter optimal sebesar 9,64% untuk penggunaan kernel Gaussian RBF dan 8,38% untuk penggunaan kernel ANOVA yang dikategorikan sangat baik. Hasil prediksi SVR dengan kernel Gaussian RBF atau pun kernel ANOVA memberikan nilai MAPE yang cukup berragam tetapi kernel ANOVA cenderung bekerja lebih baik pada data harga batu bara.

  6

RBF ANOVA

5.6 Pengujian Fungsi Kernel

  Learning Machine: Theories, Concepts, Applications for Engineers and System Designer. s.l.:Apress Media.

  Awad, M. & Khanna, R., 2015. Efficient

  Pengujian fungsi kernel dilakukan dengan menggunakan nilai parameter optimal. Pengujian tiap kernel dilakukan sebanyak 10 kali percobaan dengan data yang diambil acak. Rata-rata MAPE yang diperoleh saat menggunakan 48 data latih untuk pengujian 12 data ditampilkan pada Tabel 1.

  Tabel 1 Hasil Pengujian Fungsi Kernel Kernel Rata MAPE

  Gaussian 9,64 ANOVA 8,38

  Selain itu dilakukan pula pengujian rentang waktu prediksi. Waktu prediksi yang diuji adalah 1, 3, 6, 9, dan 12 bulan ke depan. Masing-masing bulan dilakukan 5 kali percobaan. Berikut hasil rata-rata MAPE pengujian rentang waktu prediksi pada Tabel 2.

  Tabel 2 Hasil Pengujian Rentang Waktu Prediksi Prediksi Bulan ke Rata MAPE RBF ANOVA 1 5,359 4,967 3 6,672 8,371 6 6,779 5,723 9 9,204 8,12 12 10,979 10,565

  Berdasarkan pengujian fungsi kernel dan pengujian rentang waktu prediksi, kernel ANOVA cenderung memberikan hasil prediksi lebih baik pada data harga batu bara dan semakin lama waktu prediksi maka error rate cenderung lebih besar.

  6. KESIMPULAN

  Berdasarkan hasil pengujian dan analisis yang dilakukan pada penelitian prediksi harga batu bara menggunakan SVR ini, diperoleh kesimpulan bahwa permasalahan prediksi harga batu bara dapat diselesaikan dengan menerapkan metode Support Vector Regression (SVR), baik dengan kernel Gaussian RBF dan kernel ANOVA pada tahap pemetaan. Selain itu, pengujian parameter memberikan nilai optimal

  7. DAFTAR PUSTAKA

  Nurunnahar, S., Talukdar, D. B., Rasel, R. I. & Sultana, N., 2017. A Short Term Wind

  Balabin, R. M. & Lomakina, E. I., 2011.

  Jurnal Ilmu Komputer dan Informasi (Journal of Computer Science and Information), 9(1), pp. 1-8.

  Performance Comparison Between Support Vector Regression and Artificial Neural Network for Prediction of Oil Palm Prediction.

  Mustakim, Buono, A. & Hermadi, I., 2016.

  Mechanics and Material, Volume 344, pp. 219-225.

  2013. Research on Parameter Selection of Support Vector Regression. Applied

  London: CRC Press. Chen, W., Hong, Y., Jun, D. & Jiulong, J.,

  Pennsylvania. Chatfield, C., 2001. Time-Series Forecasting.

  Gambar 11 Grafik Hasil Pengujian Jumlah Data Latih

  —an alternative to neural networks (ANN) for analytical chemistry? Comparison of nonlinear methods on near infrared (NIR) spectroscopy data. Analyst, Issue 8, pp. 1703-1712. Berk, R. et al., 2014. Using Regression Kernels

  Support vector machine regression (SVR/LS-SVM)

  to Forecast A Failure to Appear in Court. Pennsylvania: uNiversity of

  Speed Forecasting Using SVR and BP- ANN: A Comparative Analysis.

  Bangladesh, s.n. Rasel, R. I., Sultana, N. & Meesad, P., 2017. An

  Application of Data Mining and Machine Learning for Weather

  Cham, Springer.

  Forecasting.

  Saluza, I., 2016. Peramalan Kunjungan Wisatawan ke Palembang: Pemodelan Data Time Series Linear vs Nonliniear.

  Konferensi Nasional Teknologi Informasi dan Aplikasinya, Volume 4.

  Vijayakumar, S. & Wu, S., 1999. Sequential Support Vector Classifier and Regression.

  Zhang, B. & Ma, J., 2011. Coal Price Index Forecast by a New Partial Least- Squares Regression. Procedia

  Engineering, Volume 15, pp. 5025- 5029.