Gambar 2. 1 Bidang Ilmu Data Minning
2.2 Tahap – tahap pada Penambangan Data
Secara sistematis, ada tiga langkah utama dalam data mining Gonunseca,
2011 :
1. Eksplorasipemrosesan awal data
Eksplorasi pemrosesan awal data terdiri dari pembersihan data, normalisasi data, transformasi data, penanganan data yang salah, reduksi
dimensi,pemilihan subset fitur, dan sebagainya. 2.
Membangun model dan melakukan validasi terhadapnya 3.
Penerapan
2.3 Teknik Klasifikasi
Klasifikasi merupakan proses pembelajaran suatu fungsi tujuan target f yang memetakan tiap himpunan atribut x ke satu dari label kelas y. Fungsi target
disebut juga model klasifikasi. Blok diagram model klasifikasi dapat dilihat
seperti pada Gambar 2.2.
Input Output
Atribute set x Class
Tabel y Gambar 2. 2 Blok Diagram Model Klasifikasi
Ada 2 jenis model Klasifikasi, yaitu : Pemodelan Deskriptif descriptive modelling
Model klasifikasi yang dapat berfungsi sebgai suatu alat penjelasan untuk membedakan objek
– objek dalam kelas – kelas yang berbeda. Pemodelan Prediktif predictive modeling
Model klasifikasi yang dapat digunakan untuk memprediksi label kelas recod yang tidak diketahui.
Teknik klasifikasi classifier merupakan suatu pendekatan sistematis untuk membangun model klasifikasi dari suatu himpunan data masukan. Tiap
Classification Model
teknik menggunakan suatu algoritma pembelajaran learning algorithm untuk mendapatkan suatu model yang paling memenuhi hubungan antara himpunan
atribut dan label kelas dalam data masukan. Masukan dari model klasifikasi merupakan sekumpulan record training set. Tiap record meliputi himpunan
attributes, yang salah satu atributnya merupakan class. Model untuk atribut kelas merupakan suatu fungsi dari nilai
– nilai atribut lainnya. Suatu test set digunakan untuk menentukan keakuratan model tersebut. Biasanya data
– set yang diberikan dibagi menjadi training dan test sets, dimana training set digunakan untuk
membangun model dan test set digunakan untuk memvalidasi.
2.4 Decision Tree Pohon Keputusan