4. Transformasi data Data Transformation
Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining. Beberapa metode data
mining membutuhkan format data yang khusus sebelum bisa
diaplikasikan. Sebagai contoh beberapa metode standar seperti analisis asosiasi dan clustering hanya bisa menerima
input data kategorikal. Karenanya data berupa angka numerik yang berlanjut perlu dibagi-bagi menjadi beberapa interval.
Proses ini sering disebut transformasi data.
5. Proses Mining
Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi
dari data.
6. Evaluasi Pola Pattern Evaluation,
Untuk mengidentifikasi pola-pola menarik kedalam knowledge based
yang ditemukan. Dalam tahap ini hasil dari teknik data mining
berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada memang
tercapai. Bila ternyata hasil yang diperoleh tidak sesuai hipotesa ada beberapa alternatif yang dapat diambil seperti
menjadikannya umpan balik untuk memperbaiki proses data mining
, mencoba metode data mining lain yang lebih sesuai, atau menerima hasil ini sebagai suatu hasil yang di luar
dugaan yang mungkin bermanfaat. Ilustrasi dari tahapan- tahapan data mining adalah seperti gambar dibawah ini.
Gambar 2.2 Tahapan-tahapan Data mining Han and Kamber, 2006
2.4 Model Data mining 2.4.1 Model Prediksi
Model ini adalah model yang menggunakan beberapa variabel untuk menentukan nilai data yang belum diketahui
dari variabel lain. Contoh model prediksi adalah metode classification
dan metode regression. Contoh aplikasi model ini adalah metode classification
untuk memprediksi atau memperkirakan kasus penggelapan transaksi kartu kredit. Pendekatan yang dilakukan adalah
dengan menggunakan informasi transaksi dan informasi dari kartu kredit sebagai atribut atau variabelnya. Misalnya apa
yang dibeli oleh konsumen, kapan membelinya dan seberapa sering konsumen membayar tepat waktu.
Sifat model prediksi dalam data mining adalah bahwa model dihasilkan dari atribut atau variabel dari data yang
sudah tersedia
kemudian bisa
digunakan untuk
memperkirakan hasil seperti konsumen mana yang loyal dan konsumen mana yang tidak loyal.
2.4.2 Model Deskripsi
Model ini adalah model yang mencari suatu pola yang dapat ditafsirkan oleh manusia sehingga data dapat diuraikan.
Contoh model deskripsi adalah metode clustering dan metode association rules.
Contoh aplikasi model ini adalah metode clustering untuk segmentasi pasar. Pendekatan yang dilakukan adalah dengan
mengumpulkan atribut-atribut yang berbeda dari konsumen seperti berdasarkan informasi yang berhubungan dengan
geographical atau gaya hidup konsumen dan mencari cluster
yang sama kemudian mengamati pola pembelian dari para konsumen dalam cluster yang sama dengan cluster yang
berbeda. Sifat model deskripsi dalam data mining adalah bahwa model itu sendiri yang diamati untuk mendapatkan
pengetahuan atau pola yang berharga dari sekumpulan data.
2.5 Jenis Pembelajaran Data mining
Dalam data mining dikenal dua jenis pembelajaran yaitu supervised learning
dan unsupervised learning. Supervised learning digunakan untuk memperkirakan nilai target yang belum diketahui
dari input dan output sample Hornick, 2006. Supervised learning mengasumsikan beberapa atribut prediktor untuk memperkirakan
atribut target. Atribut prediktor diumpamakan sebagai pengetahuan dari lingkungan yang tersedia, sedangkan atribut target adalah
model yang akan dihasilkan. Contoh metode ini adalah metode classification
dan metode regression. Pada unsupervised learning tidak menggunakan atribut
prediktor dan atribut target, karena tujuan unsupervised learning adalah untuk menemukan struktur atau hubungan yang ada dalam
sekumpulan data Hornick, 2006. Contoh metode yang termasuk dalam unsupervised learning adalah metode clustering dan metode
association rule.
2.6 Metode Data mining