Teknik dalam Penambangan Data Tujuan Penambangan Data

2.1.2 Teknik dalam Penambangan Data

Teknik dalam penambangan data terbagi atas dua kategori utama, yaitu prediktif dan deskriptif. Kategori prediktif bertujuan untuk memprediksi nilai dari atribut tertentu berdasarka pada nilai dari atribut- atribut lain. Sedangkan kategori deskriptif bertujuan untuk menurunkan pola-polakorelasi, trend, cluster, trayektori dan anomali yang meringkas hubungan yang pokok dalam data. Berikut adalah teknik dalam penambangan data : 1. Asosiasi Asosiasi adalah pencarian aturan-aturan asosiasi yang menunjukkan kondisi-kondisi nilai atribut yang sering terjadi bersama-sama dalam sekumpulan data. Asosiasi sering digunakan untuk menganalisa market basket dan data transaksi. 2. Klasifikasi Klasifikasi adalah proses menemukan model fungsi yang menjelaskan dan membedakan kelas-kelas atau konsep, dengan tujuan agar model yang diperoleh dapat digunakan untuk memprediksikan kelas atau objek yang memiliki label kelas yang tidak diketahui. 3. Clustering Berbeda dengan klasifikasi, clustering dapat digunakan untuk menentukan atau menganalisis objek data dimana label kelas tidak diketahui dengan cara mengelompokkan data untuk membentuk kelas baru. 4. Outlier Outlier merupakan objek data yang tidak mengikuti perilaku umum dari data. Outlier dapat dianggap sebagai noise atau pengecualian. Analisis data outlier dinamakan outlier mining. Teknik ini berguna dalam fraud detection dan rare events analysis.

2.1.3 Tujuan Penambangan Data

Tujuan dari data mining Hoffer et.al, 2007adalah : 1. Explanatory Untuk menjelaskan beberapa kondisi penelitian, seperti mengapa penjualan truk pick-up meningkat di Colorado. 2. Confirmatory Untuk mempertegas hipotesis, seperti halnya dua kali pendapatan keluarga lebih suka dipakai untuk membeli peralatan keluarga dibandingkan dengan satu kali pendapatan keluarga. 3. Exploratory Untuk menganalisa data yang memiliki hubungan yang baru. Misalnya, pola apa yang cocok untuk kasus penggelapan kartu kredit.

2.1.4 Knowledge Discovery in Databases KDD