Jenis-Jenis Metode Data mining

2.2 Jenis-Jenis Metode Data mining

Pada model data mining dibuat dari metode pembelajaran dengan supervised dan unsupervised. Fungsi pembelajaran supervised digunakan untuk memprediksi suatu nilai dan mempunyai keluaran berupa label dari setiap data. Pada supervised memiliki proses training dan testing terhadap data yang ada. Setelah dilakukan proses tersebut, maka dapat diketahui parameter yang digunakan untuk menentukan model. Model ini yang akan melakukan tugas prediksi atau peramalan. Contoh dari algoritma dengan pembelajaran supervised, yaitu naïve Bayesian. Fungsi pembelajaran unsupervised tidak memerlukan label dan datanya tidak perlu dilakukan proses training dan testing. Label yang ada pada unsupervised adalah label dari data yang akan dikelompokkan sehingga dengan label tersebut dapat diketahui bahwa data tersebut masuk ke dalam kelompok tertentu. Contoh algoritma unsupervised, yaitu k-means clustering dan agglomerative hierarchical clustering. Data mining memiliki beberapa metode yang sering dibahas, antara lain classification, association danclustering. Setiap metode memiliki berbagai macam algoritma sesuai dengan karakteristiknya masing-masing. a. Classification mining adalah sebuah pengekstraksi pola pengelompokan atau pengklasi fikasian sebuah himpunan obyek atau data ke dalam kelas tertentu berdasarkan atribut-atributnya. Contoh algoritma klasifikasi adalah naïve bayesian, decision tree dan support vector machine. Berikut ini merupakan contoh kasus data penyakit hipertensi untuk classification. Tabel 2.1 Ali, 2006 contoh data klasifikasi Pada contoh tersebut terdapat label pada setiap obyek data yang menjadi kesimpulan bahwa orang tersebut terkena hipertensi atau tidak. b. Association mining adalah sebuah cara untuk menemukan pola asosiasi dalam data. Contoh pada association, mempunyai algoritma apriori, FPTree. Berikut ini merupakan contoh kasus pada association. Gambar 2.3 HanKamber,2011 ilustrasi algoritma apriori Contohnya pada saat menganalisa keranjang belanja dengan menghitung support dan confidence pada masing-masing item set, maka dapat diketahui pola asosiasinya seperti barang-barang yang dibeli secara bersamaan pada suatu transaksi pembelian. Pola tersebut berguna untuk keperluan promosi, segmentasi pembeli, pembuatan catalog produk dan melihat pola belanja pembeli. c. Clustering mining adalah proses mencari cluster atau kelompok dari sekumpulan obyek sehingga obyek-obyek di dalam sebuah cluster mirip satu dengan lainnya, dan berbeda dengan obyek di luar cluster-nya. Ada 2 jenis clusteringyang biasa digunakan, yaitu hierarchical clustering dan partition clustering. Contoh algoritma yang ada pada clustering adalah K- Means dan agglomerative. Berikut ini contoh data pada clustering. Tabel 2.2 Ali, 2006 contoh data clustering Pada gambar tersebut tidak terdapat label yang menyertakan orang tersebut terkena hipertensi atau tidak. Pada clustering, ditentukan labelnya berdasarkan tingkat kemiripan data. Seperti pada gambar dibawah ini terdapat 2 buah cluster,cluster pertama berada pada tingkat gemuk dan sangat gemuk serta terletak pada usia muda dan paruh baya. Sedangkan cluster kedua pada tingkat terlalu gemuk dan usia paruh baya dan tua, maka dari hal tersebut dapat disimpulkan bahwa pada cluster kedua merupakan pasien yang terkena hipertensi. Sedangkan pada cluster pertama tidak. Gambar 2.4 Ali, 2006 hasil clusteringpada data hipertensi

2.3 Metode Clustering