8 primitif atau data level rendah menjadi data level tinggi,
normalisasi normalization yaitu mengemas data atribut ke dalam skala yang kecil, sebagai contoh -1.0 sampai 1.0, dan konstruksi
atribut atau fitur attribute construction atau feature construction yaitu mengkonstruksi dan menambahkan atribut baru untuk
membantu proses penambangan.
5. Penambangan data data mining
Langkah ini adalah langkah yang penting di mana akan diaplikasikan metode yang tepat untuk mengekstrak pola data.
6. Evaluasi pola pattern evaluation
Langkah ini berguna untuk mengidentifikasi pola yang benar dan menarik. Pola tersebut akan direpresentasikan dalam bentuk
pengetahuan berdasarkan beberapa pengukuran yang penting.
7. Presentasi pengetahuan knowledge presentation
Pada langkah ini informasi yang sudah ditambang akan divisualisasikan dan direpresentasikan kepada pengguna. Langkah
1 sampai dengan langkah 4 merupakan langkah praproses data di mana data akan disiapkan terlebih dahulu untuk selanjutnya
dilakukan penambangan.
Pada langkah penambangan data, pengguna atau basis pengetahuan bisa dilibatkan. Kemudian pola yang menarik akan
direpresentasikan kepada pengguna dan akan disimpan sebagai pengetahuan yang baru.
2.1.2. Pengelompokan Penambangan Data
Penambangan data dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu Larose, 2005:
1. Deskripsi
Terkadang peneliti dan analisis secara sederhana ingin mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat
dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menemukan keterangan atau fakta bahwa siapa yang
9 tidak cukup profesional akan sedikit didukung dalam pemilihan
presiden. Deskripsi dari pola dan kecenderungan sering memberikan kemungkinan penjelasan untuk suatu pola atau
kecenderungan.
2. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali atribut target lebih ke arah numerik daripada ke arah kategori. Model dibangun
menggunakan record lengkap yang menyediakan nilai dari atribut target sebagai nilai prediksi. Selanjutnya, pada peninjauan
berikutnya estimasi nilai dari atribut target dibuat berdasarkan atribut prediksi.
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada di masa mendatang.
4. Klasifikasi
Dalam klasifikasi, terdapat target atribut kategori. Sebagai contoh, menentukan apakah suatu transaksi kartu kredit merupakan
transaksi yang curang atau bukan.
5. Pengklusteran
Pengklusteran merupakan pengelompokkan record, pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang
memiliki kemiripan. Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainnya dan memiliki
ketidakmiripan dengan record-record dalam kluster lain. Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya
atribut target dalam pengklusteran. Algoritma ini mencoba untuk melakukan pembagian terhadap keseluruhan data menjadi
kelompok-kelompok yang memiliki kemiripan homogeny, yang mana kemiripan record dalam satu kelompok akan bernilai
maksimal, sedangkan kemiripan dengan record dalam kelompok lain akan bernilai minimal.
10 6.
Asosiasi Tugas asosiasi dalam penambangan data adalah menemukan
atribut yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis market basket.
2.1.3. Klasifikasi