Definisi Data Mining Proses Penambangan Data

2.5. Teori Penambangan Data

2.5.1. Definisi Data Mining

Data mining adalah suatu proses untuk mencari informasi dari database atau KDD Knowledge Discovery in Database. Dari proses pengolahan data tersebut akan menemukan korelasi penuh arti, pola dan informasi yang dapat digunakan sebagai pengambilan keputusan atau decision making Han and Kamber, 2006. Data mining adalah mengenai pemecahan masalah dengan menganalisa data yang ada di dalam database dan sering juga didefinisikan sebagai proses menemukan pola dalam data, dimana proses tersebut harus otomatis atau semi-otomatis dan pola yang ditemukan harus bermakna Chakrabarti, et al., 2009.

2.5.2. Proses Penambangan Data

Di bawah ini adalah gambar alur kerja data mining untuk menentukan suatu knowledge : Gambar 2. 1 Data Mining dan proses KDD Source: Fayyad, et.al., 1996 1. Selection : 2. Data Selection merupakan penyeleksian data dimana data yang relevan dikembalikan ke dalam database yang memiliki tugas untuk analisis data Fadli,2011. 3. Cleaning : Data Cleaning merupakan pembersihan atau penghilangan missing value pada data. Pembersihan data ini akan mempengaruhi performasi dari teknik mining sendiri karena data yang ditangani akan diberikan nilai untuk setiap data yang kosong yang mengacu pada mean tiap atributnya. Mean adalah rata-rata dari data yang diperoleh berupa angka yang didapat dari nilai-nilai dibagi dengan jumlah individu Sutrisno Hadi, 1998, dengan rumusan : � = ∑ � ...............................................................................2.1 � � = ∑ 4. Transformation : Data Transformation merupakan cara untuk mentransformasikan data yang diubah ke bentuk yang tepat untuk diproses pada proses mining. 5. Data mining : Data mining merupakan langkah terpenting dimana akan diaplikasikannya metode kerja yang paling tepat untuk mengekstrasi data. 6. Interpretation Evalution : Proses ini yang nantinya kana berguna untuk mengidentifikasi dan mengevaluasi pola yang benar dan menarik. Pola inilah yang akan mewakili pengetahuan berdasarkan atas beberapa tindakan mining yang menarik. 7. Knowledge Presentation : Dalam tahap ini hasil dari mining yang berupa pola-pola tersebut direpresentasikan kepada penggunauser dan dari langkah ini akan ditemukannya sebuah pengetahuan yang akan dijadikan acuan guna pengambilan keputusan. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

2.6. Generalisasi Data