2.1.2 Teknik dalam Penambangan Data
Teknik dalam penambangan data terbagi atas dua kategori utama, yaitu prediktif dan deskriptif. Kategori prediktif bertujuan untuk
memprediksi nilai dari atribut tertentu berdasarka pada nilai dari atribut- atribut lain. Sedangkan kategori deskriptif bertujuan untuk menurunkan
pola-polakorelasi, trend, cluster, trayektori dan anomali yang meringkas hubungan yang pokok dalam data. Berikut adalah teknik dalam
penambangan data : 1.
Asosiasi Asosiasi adalah pencarian aturan-aturan asosiasi yang menunjukkan
kondisi-kondisi nilai atribut yang sering terjadi bersama-sama dalam sekumpulan data. Asosiasi sering digunakan untuk menganalisa
market basket dan data transaksi. 2.
Klasifikasi Klasifikasi adalah proses menemukan model fungsi yang
menjelaskan dan membedakan kelas-kelas atau konsep, dengan tujuan agar model yang diperoleh dapat digunakan untuk
memprediksikan kelas atau objek yang memiliki label kelas yang tidak diketahui.
3. Clustering
Berbeda dengan klasifikasi, clustering dapat digunakan untuk menentukan atau menganalisis objek data dimana label kelas tidak
diketahui dengan cara mengelompokkan data untuk membentuk kelas baru.
4. Outlier
Outlier merupakan objek data yang tidak mengikuti perilaku umum dari data. Outlier dapat dianggap sebagai noise atau pengecualian.
Analisis data outlier dinamakan outlier mining. Teknik ini berguna dalam fraud detection dan rare events analysis.
2.1.3 Tujuan Penambangan Data
Tujuan dari data mining Hoffer et.al, 2007adalah :
1. Explanatory
Untuk menjelaskan beberapa kondisi penelitian, seperti mengapa penjualan truk pick-up meningkat di Colorado.
2. Confirmatory
Untuk mempertegas hipotesis, seperti halnya dua kali pendapatan keluarga lebih suka dipakai untuk membeli peralatan keluarga
dibandingkan dengan satu kali pendapatan keluarga. 3.
Exploratory Untuk menganalisa data yang memiliki hubungan yang baru.
Misalnya, pola apa yang cocok untuk kasus penggelapan kartu kredit.
2.1.4 Knowledge Discovery in Databases KDD