2.5. Teori Penambangan Data
2.5.1. Definisi Data Mining
Data mining adalah suatu proses untuk mencari informasi dari
database atau KDD Knowledge Discovery in Database. Dari proses
pengolahan data tersebut akan menemukan korelasi penuh arti, pola dan informasi yang dapat digunakan sebagai pengambilan keputusan
atau decision making Han and Kamber, 2006. Data mining
adalah mengenai pemecahan masalah dengan menganalisa data yang ada di dalam database dan sering juga
didefinisikan sebagai proses menemukan pola dalam data, dimana proses tersebut harus otomatis atau semi-otomatis dan pola yang
ditemukan harus bermakna Chakrabarti, et al., 2009.
2.5.2. Proses Penambangan Data
Di bawah ini adalah gambar alur kerja data mining untuk menentukan suatu knowledge :
Gambar 2. 1 Data Mining dan proses KDD Source: Fayyad, et.al., 1996
1. Selection
: 2.
Data Selection merupakan penyeleksian data dimana data yang
relevan dikembalikan ke dalam database yang memiliki tugas untuk analisis data Fadli,2011.
3. Cleaning
: Data Cleaning
merupakan pembersihan atau penghilangan missing value
pada data. Pembersihan data ini akan mempengaruhi performasi dari teknik mining sendiri karena
data yang ditangani akan diberikan nilai untuk setiap data yang kosong yang mengacu pada mean tiap atributnya. Mean adalah
rata-rata dari data yang diperoleh berupa angka yang didapat dari nilai-nilai dibagi dengan jumlah individu Sutrisno Hadi,
1998, dengan rumusan : � =
∑ �
...............................................................................2.1 �
� =
∑
4. Transformation
: Data
Transformation merupakan
cara untuk
mentransformasikan data yang diubah ke bentuk yang tepat untuk diproses pada proses mining.
5. Data mining
: Data mining
merupakan langkah terpenting dimana akan diaplikasikannya metode kerja yang paling tepat untuk
mengekstrasi data. 6.
Interpretation Evalution :
Proses ini yang nantinya kana berguna untuk mengidentifikasi dan mengevaluasi pola yang benar dan menarik. Pola inilah
yang akan mewakili pengetahuan berdasarkan atas beberapa tindakan mining yang menarik.
7. Knowledge Presentation
: Dalam tahap ini hasil dari mining yang berupa pola-pola
tersebut direpresentasikan kepada penggunauser dan dari langkah ini akan ditemukannya sebuah pengetahuan yang akan
dijadikan acuan guna pengambilan keputusan. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2.6. Generalisasi Data