Tahapan Data mining PEMBAHASAN

4. Transformasi data Data Transformation

Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining. Beberapa metode data mining membutuhkan format data yang khusus sebelum bisa diaplikasikan. Sebagai contoh beberapa metode standar seperti analisis asosiasi dan clustering hanya bisa menerima input data kategorikal. Karenanya data berupa angka numerik yang berlanjut perlu dibagi-bagi menjadi beberapa interval. Proses ini sering disebut transformasi data.

5. Proses Mining

Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data.

6. Evaluasi Pola Pattern Evaluation,

Untuk mengidentifikasi pola-pola menarik kedalam knowledge based yang ditemukan. Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai. Bila ternyata hasil yang diperoleh tidak sesuai hipotesa ada beberapa alternatif yang dapat diambil seperti menjadikannya umpan balik untuk memperbaiki proses data mining , mencoba metode data mining lain yang lebih sesuai, atau menerima hasil ini sebagai suatu hasil yang di luar dugaan yang mungkin bermanfaat. Ilustrasi dari tahapan- tahapan data mining adalah seperti gambar dibawah ini. Gambar 2.2 Tahapan-tahapan Data mining Han and Kamber, 2006 2.4 Model Data mining 2.4.1 Model Prediksi Model ini adalah model yang menggunakan beberapa variabel untuk menentukan nilai data yang belum diketahui dari variabel lain. Contoh model prediksi adalah metode classification dan metode regression. Contoh aplikasi model ini adalah metode classification untuk memprediksi atau memperkirakan kasus penggelapan transaksi kartu kredit. Pendekatan yang dilakukan adalah dengan menggunakan informasi transaksi dan informasi dari kartu kredit sebagai atribut atau variabelnya. Misalnya apa yang dibeli oleh konsumen, kapan membelinya dan seberapa sering konsumen membayar tepat waktu. Sifat model prediksi dalam data mining adalah bahwa model dihasilkan dari atribut atau variabel dari data yang sudah tersedia kemudian bisa digunakan untuk memperkirakan hasil seperti konsumen mana yang loyal dan konsumen mana yang tidak loyal.

2.4.2 Model Deskripsi

Model ini adalah model yang mencari suatu pola yang dapat ditafsirkan oleh manusia sehingga data dapat diuraikan. Contoh model deskripsi adalah metode clustering dan metode association rules. Contoh aplikasi model ini adalah metode clustering untuk segmentasi pasar. Pendekatan yang dilakukan adalah dengan mengumpulkan atribut-atribut yang berbeda dari konsumen seperti berdasarkan informasi yang berhubungan dengan geographical atau gaya hidup konsumen dan mencari cluster yang sama kemudian mengamati pola pembelian dari para konsumen dalam cluster yang sama dengan cluster yang berbeda. Sifat model deskripsi dalam data mining adalah bahwa model itu sendiri yang diamati untuk mendapatkan pengetahuan atau pola yang berharga dari sekumpulan data.

2.5 Jenis Pembelajaran Data mining

Dalam data mining dikenal dua jenis pembelajaran yaitu supervised learning dan unsupervised learning. Supervised learning digunakan untuk memperkirakan nilai target yang belum diketahui dari input dan output sample Hornick, 2006. Supervised learning mengasumsikan beberapa atribut prediktor untuk memperkirakan atribut target. Atribut prediktor diumpamakan sebagai pengetahuan dari lingkungan yang tersedia, sedangkan atribut target adalah model yang akan dihasilkan. Contoh metode ini adalah metode classification dan metode regression. Pada unsupervised learning tidak menggunakan atribut prediktor dan atribut target, karena tujuan unsupervised learning adalah untuk menemukan struktur atau hubungan yang ada dalam sekumpulan data Hornick, 2006. Contoh metode yang termasuk dalam unsupervised learning adalah metode clustering dan metode association rule.

2.6 Metode Data mining