BAB I
PENDAHULUAN
1.1 Latar Belakang
Pengolahan data dalam jumlah yang besar tentu saja tidak bisa menggunakan cara manual atau konvensional, ada beberapa teknik dan metode dalam data mining untuk mengolah
data tersebut. Setiap teknik tentunya mempunyai kelebihan dan kekurangan dalam mengolah data tersebut.
Teknik Support Vector Regression SVR dan klasifikasi dengan metode Decision Tree Pohon Keputusan algoritma C4.5 adalah teknik-teknik dalam data mining yang
sering digunakan oleh para peneliti, diantaranya yaitu: Dalam bidang pengembangan ilmu pengetahuan: Basak et al. 2007, Gangrade
2009, Grbovic 2006; Dalam bidang kesehatan: Gupta et al. 2011; Dalam bidang Internet: Bermolen et al. 2008, Rastegari et al. 2010; Dalam bidang musik: Han et al.
2009; Dalam bidang pemasaran: Kim 2006; Dalam bidang time series: Cao 2002; Dalam bidang jaringan komputer: Amershi dan Conati 2009.
Ringkasan lengkap penelitian-penelitian tersebut, dapat dilihat pada tabel 1.1
Tabel 1.1 Daftar judul dan penulis penelitian yang akan dianalisis No
Bidang Judul Penelitian
Tahun Penulis
Metode 1
Pengembangan Ilmu
Pengetahuan Support Vector
Regression 2007
Basak, D., Pal, S., Patranabis
SVR
2 Pengembangan
Ilmu Pengetahuan
Building Privacy- Preserving C4.5
Decision Tree Classifier on Multi Parties
2009 Gangrade, A.,
Patel, R C4.5
3 Pengembangan
Ilmu Pengetahuan
Decision Trees and MPI Collective Algorithm
Selection Problem 2006
Grbovic, J.P., Fagg, G. E.,
Angskun, T., Bosilca, G.,
Dongarra, J. J C4.5
4 Kesehatan
Data Mining 2011
Gupta, S., C4.5
Universitas Sumatera Utara
Classification Techniques Applied For
Breast Cancer Diagnosis And Prognosis
Kumar, D., Sharma, A
5 Internet
Support Vector Regression for Link Load
Prediction 2008
Bermolen, P., Rossi
SVR
6 Internet
Defending Denial of Service Attacks against
Domain Name System with Machine Learning
Techniques 2010
Rastegari, S., Saripan, M.I.,
Rasid, M. F. SVM
7 Music
Smers: Music Emotion Recognition Using
Support Vector Regression
2009 Han, B.,
Dannenberg, R., Hwang, E
SVR
8 Time Series
Support vector machines experts for time series
forecasting 2002
Lijuan Cao SVM
9 Jaringan
Komputer Combining Unsupervised
and Supervised
Classification to Build User Models for
Exploratory Learning Environments
2009 Amershi,
Saleema, Conati, Cristina
Data Mining
10 Pemasaran
Response Modeling with Support Vector
Regression 2006
Kim, D., Lee, H., Cho
SVR
Dari uraian di atas terlihat bahwa metode SVR dan Decision Tree C4.5 banyak digunakan dalam penelitian-penelitian di berbagai bidang.
Dalam penelitian ini, penulis akan menganalisis metode Support Vector Regression dan akan membandingkannya dengan teknik data mining yang lain yaitu
metode klasifikasi decision tree pohon keputusan menggunakan algoritma C4.5, kemudian mengidentifikasi kelebihan dan kekurangan dari kedua metode tersebut.
Dengan melakukan analisis perbandingan metode Support Vector Regression dan metode klasifikasi decision tree algoritma C4.5, akan diketahui kelebihan-kelebihan dan
Universitas Sumatera Utara
kekurangan-kekurangan kemudian akan didapat metode mana yang lebih baik dari kedua metode tersebut.
Dari uraian di atas, penulis tertarik untuk membuat penelitian dengan judul ”ANALISIS PERBANDINGAN TEKNIK SUPPORT VECTOR REGRESSION DAN
DECISION TREE C4.5 DALAM DATA MINING”
1.2 Penelitian Terdahulu