2.2 Jenis-Jenis Metode Data mining
Pada model data mining dibuat dari metode pembelajaran dengan supervised dan unsupervised. Fungsi pembelajaran supervised digunakan untuk
memprediksi suatu nilai dan mempunyai keluaran berupa label dari setiap data. Pada supervised memiliki proses training dan testing terhadap data yang ada.
Setelah dilakukan proses tersebut, maka dapat diketahui parameter yang digunakan untuk menentukan model. Model ini yang akan melakukan tugas
prediksi atau peramalan. Contoh dari algoritma dengan pembelajaran supervised, yaitu naïve Bayesian. Fungsi pembelajaran unsupervised tidak memerlukan label
dan datanya tidak perlu dilakukan proses training dan testing. Label yang ada pada unsupervised adalah label dari data yang akan dikelompokkan sehingga
dengan label tersebut dapat diketahui bahwa data tersebut masuk ke dalam kelompok tertentu. Contoh algoritma unsupervised, yaitu k-means clustering dan
agglomerative hierarchical clustering. Data mining memiliki beberapa metode yang sering dibahas, antara lain
classification, association danclustering. Setiap metode memiliki berbagai macam algoritma sesuai dengan karakteristiknya masing-masing.
a. Classification mining adalah sebuah pengekstraksi pola pengelompokan
atau pengklasi fikasian sebuah himpunan obyek atau data ke dalam kelas
tertentu berdasarkan atribut-atributnya. Contoh algoritma klasifikasi adalah naïve bayesian, decision tree dan support vector machine. Berikut
ini merupakan contoh kasus data penyakit hipertensi untuk classification.
Tabel 2.1 Ali, 2006 contoh data klasifikasi
Pada contoh tersebut terdapat label pada setiap obyek data yang menjadi kesimpulan bahwa orang tersebut terkena hipertensi atau tidak.
b. Association mining adalah sebuah cara untuk menemukan pola asosiasi
dalam data. Contoh pada association, mempunyai algoritma apriori, FPTree. Berikut ini merupakan contoh kasus pada association.
Gambar 2.3 HanKamber,2011 ilustrasi algoritma apriori
Contohnya pada saat menganalisa keranjang belanja dengan menghitung support dan confidence pada masing-masing item set, maka dapat
diketahui pola asosiasinya seperti barang-barang yang dibeli secara bersamaan pada suatu transaksi pembelian. Pola tersebut berguna untuk
keperluan promosi, segmentasi pembeli, pembuatan catalog produk dan melihat pola belanja pembeli.
c. Clustering mining adalah proses mencari cluster atau kelompok dari
sekumpulan obyek sehingga obyek-obyek di dalam sebuah cluster mirip satu dengan lainnya, dan berbeda dengan obyek di luar cluster-nya. Ada 2
jenis clusteringyang biasa digunakan, yaitu hierarchical clustering dan partition clustering. Contoh algoritma yang ada pada clustering adalah K-
Means dan agglomerative. Berikut ini contoh data pada clustering.
Tabel 2.2 Ali, 2006 contoh data clustering
Pada gambar tersebut tidak terdapat label yang menyertakan orang tersebut terkena hipertensi atau tidak. Pada clustering, ditentukan labelnya
berdasarkan tingkat kemiripan data. Seperti pada gambar dibawah ini terdapat 2 buah cluster,cluster pertama berada pada tingkat gemuk dan
sangat gemuk serta terletak pada usia muda dan paruh baya. Sedangkan cluster kedua pada tingkat terlalu gemuk dan usia paruh baya dan tua,
maka dari hal tersebut dapat disimpulkan bahwa pada cluster kedua merupakan pasien yang terkena hipertensi. Sedangkan pada cluster
pertama tidak.
Gambar 2.4 Ali, 2006 hasil clusteringpada data hipertensi
2.3 Metode Clustering