Inti dari semua penelitan-penelitian terdahulu mengenai optimasi terhadap algoritma apriori yang tercantum dalam tabel diatas adalah membatasi calon kandidat
frequent itemset yang dimunculkan
.
Pembatasan tersebut dilakukan dengan cara memangkas item, kombinasi dan transaksi serta pembatasan iterasi yang tidak
diinginkan sehingga tidak terjadi perulangan scanning database yang berlebihan, dengan begitu akan menghasilkan aturan asosiasi secara tepat dan dalam waktu yang
lebih cepat
.
2.2 Pengertian Data mining
Secara harfiah
,
data mining sebenarnya adalah kesalahan penamaan atau penyebutan
.
Jika mengacu kepada kegiatan penambangan emas dari sekumpulan batu atau pasir
,
aktivitas itu lebih disebut dengan penggalian emas daripada penggalian batu atau pasir
.
Jadi data mining seharusnya lebih pantas atau lebih cocok disebut dengan penggalian pengetahuan dari data yang ada knowledge mining from data
.
Tetapi penggalian pengetahuan knowledge mining mempunyai pengertian yang dangkal yang mungkin tidak mencerminkan kegiatan penggalian dari data yang
berjumlah besar dengan menggunakan pola atau metode yang diterapkan
.
Mining penggalian sendiri diartikan sebagai proses untuk menemukan sebagian kecil
sesuatu yang sangat berharga dari sekumpulan material yang besar
.
Han dan Kamber 2006 dalam bukunya yang berjudul “Data mining Concepts and Techniques
” mengatakan
,
secara singkat data mining dapat diartikan sebagai mengekstraksi atau menggali pengetahuan dari data yang berjumlah besar
.
Sedangkan menurut Daniel T
.
Larose 2005 ada beberapa definisi dari Data mining yang diambil dari beberapa sumber
.
Secara umum data mining dapat didefinisikan sebagai berikut :
-
Data mining adalah proses menemukan sesuatu yang bermakna dari suatu korelasi
baru
,
pola dan tren yang ada dengan cara memilah-milah data berukuran besar yang disimpan dalam repositori
,
menggunakan teknologi pengenalan pola serta teknik matematika dan statistik
.
-
Data mining adalah analisis pengamatan database untuk menemukan hubungan
yang tidak terduga dan untuk meringkas data dengan cara atau metode baru yang dapat dimengerti dan bermanfaat kepada pemilik data
.
-
Data mining merupakan bidang ilmu interdisipliner yang menyatukan teknik
pembelajaran dari mesin machine learning
,
pengenalan pola pattern recognition
,
statistik
,
database
,
dan visualisasi untuk mengatasi masalah ekstraksi informasi dari basis data yang besar
.
-
Data mining diartikan sebagai suatu proses ekstraksi informasi berguna dan
potensial dari sekumpulan data yang terdapat secara implisit dalam suatu basis data
.
Analisa data mining berjalan pada data yang cenderung terus membesar dan teknik terbaik yang digunakan kemudian beorientasi kepada data berukuran sangat
besar untuk mendapatkan kesimpulan dan keputusan paling layak
.
Data mining memiliki beberapa sebutan atau nama lain yaitu : Knowledge discovery in databases
KDD
,
ekstraksi pengetahuan knowledge extraction
,
Analisa datapola datapattern analysis
,
kecerdasan bisnis business intelligence
,
data archaeology dan data dredging Daniel T
.
Larose
,
2005
.
2.3 Tahapan Data mining