Faktor Pengertian Pola Belanja Konsumen

baru yang disebut data mining. Ada beberapa definisi data mining yang dikenal dari berbagai sumber, diantaranya adalah : 1. Data mining adalah pencarian dan teknik analisa data yang besar untuk menemukan pola dan aturan yang berarti Berry Linoff, 2004. 2. Data mining adalah teknik untuk menganalisa sekumpulan data yang besar guna menemukan hubungan yang tidak diduga dan berguna bagi pemilik data Hand, 2001. 3. Data mining adalah proses untuk menemukan pola dan hubungan dalam suatu data Hornick, 2007. 4. Data mining adalah perangkat lunak untuk menemukan pola- pola tersembunyi dalam database yang besar dan menghasilkan aturan-aturan yang digunakan untuk memperkirakan perilaku dimasa depan Kadir, 2003. 5. Data mining adalah suatu proses otomatis atau semi otomatis untuk menemukan informasi knowledge baru dan berpotensi dari sekumpulan data Tang Jamie, 2005. Berdasarkan beberapa definisi tersebut, dapat disimpulkan bahwa data mining berkaitan erat dengan penemuan informasi atau pengetahuan yang baru, berpotensi dan tidak terduga dalam suatu database , baik itu secara otomatis maupun semi otomatis.

2.18 Tahapan Data mining

Terdapat enam tahapan dalam proses data mining Han and Kamer, 2006. Enam tahapan data mining tersebut adalah sebagai berikut :

1. Pembersihan data data cleaning

Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan. Pada umumnya data yang diperoleh, baik dari database suatu perusahaan maupun hasil eksperimen, memiliki isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid atau juga hanya sekedar salah ketik. Selain itu, ada juga atribut-atribut data yang tidak relevan dengan hipotesa data mining yang dimiliki. Data-data yang tidak relevan itu juga lebih baik dibuang. Pembersihan data juga akan mempengaruhi performasi dari teknik data mining karena data yang ditangani akan berkurang jumlah dan kompleksitasnya.

2. Integrasi data data integration