BAB II LANDASAN TEORI
A. Pengertian
Data Mining
Data mining dapat didefinisikan sebagai suatu metode
pencarian informasi yang tersembunyi dan merupakan bagian yang penting dalam suatu basis data berukuran besar yang sulit diperoleh
dengan hanya menggunakan kueri basis data biasa atau analisis statistik biasa Djunaidy dan Soelaiman, 2001. Data mining
berhubungan dekat dengan sub area Knowledge Discovery in Databases
KDD. Karakteristik yang membedakan data mining adalah volume data yang sangat besar.
B. Proses
Data Mining
Proses-proses yang terjadi dalam data mining adalah : a.
Seleksi dan penarikan contoh Seleksi segmentasi data sesuai dengan kriteria tertentu sehingga
subset dari data dapat ditentukan.
b. Pengolahan
Merupakan tahap pembersihan data dengan membuang data yang dianggap tidak perlu sehingga dapat memperlambat proses kueri.
Pembersihan juga dapat dilakukan dengan rekonfigurasi data agar format data tetap konsisten.
8 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
c. Transformasi
Data diubah menjadi data yang berguna dan terarah. d.
Data mining Tahap ini dilakukan penyaringan pola data.
e. Evaluasi
Pola yang diperoleh sistem diinterpretasi ke dalam bentuk pengetahuan yang mendukung pengguna untuk mengambil
keputusan, misalnya prediksi dan klasifikasi. Proses-proses
di atas diilustrasikan pada gambar 2.1 di
bawah ini:
Gambar 2.1 Diagram Tahapan Proses Data Mining
Sumber : http:www.directing.grfilesimagesase.jpg
Diantara bermacam-macam teknologi basis data yang ada, data mining sering disejajarkan dengan data warehouse gudang
data. Data warehouse digunakan untuk melakukan OLAP On-Line Analytical Processing
, sedangkan data mining digunakan untuk melakukan information discovery yang ditujukan bagi data analyst
dan business analyst. OLAP adalah istilah yang menggambarkan suatu teknologi yang memproses data di dalam struktur multi-
dimensional agar dapat menyediakan akses yang cepat untuk kueri analisis yang kompleks.
Gambar 2.2 Data Mining dan Teknologi Basis Data Lainnya
Sumber http:ilmukomputer.com20060829mengenal-data-mining PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI