5. Proses Mining
Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data.
6. Evaluasi Pola Pattern Evaluation
Hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai. Bila ternyata
hasil yang diperoleh tidak sesuai hipotesa maka ada beberapa alternatif yang dapat diambil seperti menjadikannya umpan balik untuk memperbaiki proses data mining,
mencoba metode data mining lain yang lebih sesuai, atau menerima hasil ini sebagai suatu hasil yang di luar dugaan yang mungkin bermanfaat.
7. Presentasi Pengetahuan Knowledge Presentation,
Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan dengan tahapan bagaimana memformulasikan
keputusan atau aksi dari hasil analisis yang didapat. Ada kalanya hal ini harus melibatkan orang-orang yang tidak memahami data mining. Karenanya presentasi
hasil data mining dalam bentuk pengetahuan yang bisa dipahami semua orang adalah satu tahapan yang diperlukan dalam proses data mining.
2.2 Pengelompokan Data mining
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu :
1. Klasifikasi Classification
Klasisfikasi adalah proses menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan
kelas dari suatu objek yang labelnya tidak diketahui. Model itu sendiri bisa berupa aturan “jika-maka”, berupa decision tree, formula matematis atau neural
network. Proses klasifikasi biasanya dibagi menjadi dua fase yaitu learning dan test. Fase learning,sebagian data yang telah diketahui kelas datanya diumpankan
Universitas Sumatera Utara
untuk membentuk model perkiraan. Kemudian pada fase test model yang sudah terbentuk diuji dengan sebagian data lainnya untuk mengetahui akurasi dari
model tersebut. Bila akurasinya mencukupi model ini dapat dipakai untuk prediksi kelas data yang belum diketahui. Dalam klasifikasi, terdapat target
variable kategori. Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori yaitu pendapatan tinggi, pendapatan sedang dan pendapatan
rendah. Metode-metode klasifikasi adalah C4.5, Bayesian, Neural network, Genetic algorithm, Fuzzy, Case-based reasoning, danK-nearest neighbor.
2. Klasterisasi Clustering
Klasterisasi melakukan pengelompokan data tanpa berdasarkan kelas data tertentu, berbeda dengan asosiasi dan klasifikasi dimana kelas data telah
ditentukan sebelumnya. Klasterisasi dapat dipakai untuk memberikan label pada kelas data yang belum diketahui. Prinsip dari klasterisasi adalah memaksimalkan
kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar kelascluster. Beberapa kategori algoritma clustering yang banyak dikenal adalah
metode partisi dimana pemakai harus menentukan jumlah k partisi yang diinginkan lalu setiap data dites untuk dimasukkan pada salah satu partisi,
metode lain yang telah lama dikenal adalah metode hierarki.
3. Association Rule Mining
Association Rule Mining adalah teknik mining untuk menemukan aturan asosiatif antara suatu kombinasi item. Analisis asosiasi dikenal juga sebagai
salah satu teknik data mining yang menjadi dasar dari berbagai teknik datamining khususnya salah satu tahap dari analisis asosiasi yang disebut
analisis pola frekuensi tinggi. Penting tidaknya suatu aturan asosiatif dapat diketahui dengan dua parameter, yaitu support dan confidence. Algoritma yang
paling populer dikenal sebagai Apriori yaitu pembuatan kandidat kombinasi item yang mungkin berdasar pada aturan tertentu lalu diuji apakah kombinasi
item tersebut memenuhi syarat support minimum.
Universitas Sumatera Utara
2.3 Aturan Asosiasi Assosiation Rule