Metodologi Tujuan Manfaat PENDAHULUAN

BAB II LANDASAN TEORI

A. Pengertian

Data Mining Data mining dapat didefinisikan sebagai suatu metode pencarian informasi yang tersembunyi dan merupakan bagian yang penting dalam suatu basis data berukuran besar yang sulit diperoleh dengan hanya menggunakan kueri basis data biasa atau analisis statistik biasa Djunaidy dan Soelaiman, 2001. Data mining berhubungan dekat dengan sub area Knowledge Discovery in Databases KDD. Karakteristik yang membedakan data mining adalah volume data yang sangat besar.

B. Proses

Data Mining Proses-proses yang terjadi dalam data mining adalah : a. Seleksi dan penarikan contoh Seleksi segmentasi data sesuai dengan kriteria tertentu sehingga subset dari data dapat ditentukan. b. Pengolahan Merupakan tahap pembersihan data dengan membuang data yang dianggap tidak perlu sehingga dapat memperlambat proses kueri. Pembersihan juga dapat dilakukan dengan rekonfigurasi data agar format data tetap konsisten. 8 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI c. Transformasi Data diubah menjadi data yang berguna dan terarah. d. Data mining Tahap ini dilakukan penyaringan pola data. e. Evaluasi Pola yang diperoleh sistem diinterpretasi ke dalam bentuk pengetahuan yang mendukung pengguna untuk mengambil keputusan, misalnya prediksi dan klasifikasi. Proses-proses di atas diilustrasikan pada gambar 2.1 di bawah ini: Gambar 2.1 Diagram Tahapan Proses Data Mining Sumber : http:www.directing.grfilesimagesase.jpg Diantara bermacam-macam teknologi basis data yang ada, data mining sering disejajarkan dengan data warehouse gudang data. Data warehouse digunakan untuk melakukan OLAP On-Line Analytical Processing , sedangkan data mining digunakan untuk melakukan information discovery yang ditujukan bagi data analyst dan business analyst. OLAP adalah istilah yang menggambarkan suatu teknologi yang memproses data di dalam struktur multi- dimensional agar dapat menyediakan akses yang cepat untuk kueri analisis yang kompleks. Gambar 2.2 Data Mining dan Teknologi Basis Data Lainnya Sumber http:ilmukomputer.com20060829mengenal-data-mining PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI