Pengelompokan Data mining CT-Pro Ekspor

5. Proses Mining Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data. 6. Evaluasi Pola Pattern Evaluation Hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai. Bila ternyata hasil yang diperoleh tidak sesuai hipotesa maka ada beberapa alternatif yang dapat diambil seperti menjadikannya umpan balik untuk memperbaiki proses data mining, mencoba metode data mining lain yang lebih sesuai, atau menerima hasil ini sebagai suatu hasil yang di luar dugaan yang mungkin bermanfaat. 7. Presentasi Pengetahuan Knowledge Presentation, Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan dengan tahapan bagaimana memformulasikan keputusan atau aksi dari hasil analisis yang didapat. Ada kalanya hal ini harus melibatkan orang-orang yang tidak memahami data mining. Karenanya presentasi hasil data mining dalam bentuk pengetahuan yang bisa dipahami semua orang adalah satu tahapan yang diperlukan dalam proses data mining.

2.2 Pengelompokan Data mining

Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu : 1. Klasifikasi Classification Klasisfikasi adalah proses menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Model itu sendiri bisa berupa aturan “jika-maka”, berupa decision tree, formula matematis atau neural network. Proses klasifikasi biasanya dibagi menjadi dua fase yaitu learning dan test. Fase learning,sebagian data yang telah diketahui kelas datanya diumpankan Universitas Sumatera Utara untuk membentuk model perkiraan. Kemudian pada fase test model yang sudah terbentuk diuji dengan sebagian data lainnya untuk mengetahui akurasi dari model tersebut. Bila akurasinya mencukupi model ini dapat dipakai untuk prediksi kelas data yang belum diketahui. Dalam klasifikasi, terdapat target variable kategori. Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori yaitu pendapatan tinggi, pendapatan sedang dan pendapatan rendah. Metode-metode klasifikasi adalah C4.5, Bayesian, Neural network, Genetic algorithm, Fuzzy, Case-based reasoning, danK-nearest neighbor. 2. Klasterisasi Clustering Klasterisasi melakukan pengelompokan data tanpa berdasarkan kelas data tertentu, berbeda dengan asosiasi dan klasifikasi dimana kelas data telah ditentukan sebelumnya. Klasterisasi dapat dipakai untuk memberikan label pada kelas data yang belum diketahui. Prinsip dari klasterisasi adalah memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar kelascluster. Beberapa kategori algoritma clustering yang banyak dikenal adalah metode partisi dimana pemakai harus menentukan jumlah k partisi yang diinginkan lalu setiap data dites untuk dimasukkan pada salah satu partisi, metode lain yang telah lama dikenal adalah metode hierarki. 3. Association Rule Mining Association Rule Mining adalah teknik mining untuk menemukan aturan asosiatif antara suatu kombinasi item. Analisis asosiasi dikenal juga sebagai salah satu teknik data mining yang menjadi dasar dari berbagai teknik datamining khususnya salah satu tahap dari analisis asosiasi yang disebut analisis pola frekuensi tinggi. Penting tidaknya suatu aturan asosiatif dapat diketahui dengan dua parameter, yaitu support dan confidence. Algoritma yang paling populer dikenal sebagai Apriori yaitu pembuatan kandidat kombinasi item yang mungkin berdasar pada aturan tertentu lalu diuji apakah kombinasi item tersebut memenuhi syarat support minimum. Universitas Sumatera Utara

2.3 Aturan Asosiasi Assosiation Rule