2.5. Teori Penambangan Data
2.5.1. Definisi Data Mining
Data mining
adalah suatu proses untuk mencari informasi dari
database
atau KDD
Knowledge Discovery in Database
. Dari proses pengolahan data tersebut akan menemukan korelasi penuh arti, pola
dan informasi yang dapat digunakan sebagai pengambilan keputusan atau
decision making
Han and Kamber, 2006.
Data mining
adalah mengenai pemecahan masalah dengan menganalisa data yang ada di dalam
database
dan sering juga didefinisikan sebagai proses menemukan pola dalam data, dimana
proses tersebut harus otomatis atau semi-otomatis dan pola yang ditemukan harus bermakna Chakrabarti,
et al
., 2009.
2.5.2. Proses Penambangan Data
Di bawah ini adalah gambar alur kerja
data mining
untuk menentukan suatu
knowledge :
Gambar 2. 1 Data Mining dan proses KDD Source: Fayyad, et.al., 1996
1.
Selection
: 2.
Data Selection
merupakan penyeleksian data dimana data yang relevan dikembalikan ke dalam
database
yang memiliki tugas untuk analisis data Fadli,2011.
3.
Cleaning
:
Data Cleaning
merupakan pembersihan atau penghilangan
missing value
pada data. Pembersihan data ini akan mempengaruhi performasi dari teknik
mining
sendiri karena data yang ditangani akan diberikan nilai untuk setiap data yang
kosong yang mengacu pada
mean
tiap atributnya.
Mean
adalah rata-rata dari data yang diperoleh berupa angka yang didapat
dari nilai-nilai dibagi dengan jumlah individu Sutrisno Hadi, 1998, dengan rumusan :
� =
∑ �
...............................................................................2.1 �
� =
∑
4.
Transformation
:
Data Transformation
merupakan cara
untuk mentransformasikan data yang diubah ke bentuk yang tepat
untuk diproses pada proses
mining
. 5.
Data mining
:
Data mining
merupakan langkah terpenting dimana akan diaplikasikannya metode kerja yang paling tepat untuk
mengekstrasi data. 6.
Interpretation Evalution
: Proses ini yang nantinya kana berguna untuk mengidentifikasi
dan mengevaluasi pola yang benar dan menarik. Pola inilah yang akan mewakili pengetahuan berdasarkan atas beberapa
tindakan
mining
yang menarik. 7.
Knowledge Presentation
: Dalam tahap ini hasil dari
mining
yang berupa pola-pola tersebut direpresentasikan kepada pengguna
user
dan dari langkah ini akan ditemukannya sebuah pengetahuan yang akan
dijadikan acuan guna pengambilan keputusan. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2.6. Generalisasi Data