11 atas dua macam, yaitu Agglomerative yang menggunakan stratedi bottom-
up dan Divisive yang menggunakan strategi top-down. Metode ini meliputi
algoritma BIRCH,
AGNES, DIANA,
CURE, dan
CHAMALEON. 3.
Density-based Method : Metode ini berdasarkan konektivitas dan fungsi densitas. Metode ini meliputi algoritma DBSCAN, OPTICS, dan
DENCLU. 4.
Grid-base Method : Metode ini berdasarkan suatu struktur granularitas multi-level. Metode klasterisasi ini meliputi algoritma STING,
WaveCluster, dan CLIQUE. 5.
Model-base Method : Suatu model dihipotesiskan untuk masing-masing klaster dan ide untuk mencari best fit dari model tersebut untuk masing-
masing yang lain. Metode klasterisasi ini meliputi pendekatan statistic, yaitu algoritma COBWEB dan jaringan syaraf tiruan, yaitu SOM.
2.4. Hierarchical Clustering
Metode hierarchical clustering mengelmpokan objek kedalam sebuah pohon klaster. Hierarchical clustering dapat diklasifikasikan sebagai
agglomerative atau divisive, tergantung pada komposisi hirarki yang di tampilkan dalam pendekatan bottom-up atau top down split. Han Kamber, 2006.
Pada umumya terdapat dua metode hierarchical clustering: 1.
Agglomerative, metode ini dimulai dari menempatkan objek ke dalam satu cluster dan selanjutnya digabungkan ke dalam cluster yang lebih besar
12 hingga sebua objek terhubung dalam satu buah cluster atau hingga
mencapai jumlah cluster yang diinginkan. 2.
Divisive, kebalikan dari metode agglomerative. Metode ini dimulai dari satu cluster dengan seluruh objek data di dalamnya, selanjutnya cluster
tersebut dipecah kedalam cluster yang lebih kecil hingga setiap cluster memiliki dua atau satu buah objek atau hingga mencapai jumlah cluster
yang diinginkan. Sebelum pembentukan sebuah cluster perlu dihitung jarak kemiripan
antara obyek data. Ada beberapa cara untuk mengetahui kemiripan data. Satu di antara cara yang ada adalah similarity matrix dengan perhitungan euclidean
distance. Euclidean distance didefinisikan sebagai berikut: √ |
| |
| |
| |
| 2.1
Atau dapat disingkat dengan: √∑
2.2 Keterangan:
adalah jumlah atribut atau dimensi
dan adalah data
13
2.5. Definisi Metode Divisive
Teknik divisive clustering termasuk kedalam analisis hierarchical clustering. Pada setiap langkahnya, metode divisive terjadi penambahan kelompok
kedalam dua nilai terkecil. Sampai akhirnya semua element terkelompokan. Teknik divisive merupakan proses pengklasteran yang didasarkan pada
persamaan nilai rata-rata antar objek. Jika sebuah objek memiliki persamaan nilai rata-rata terbesar maka objek tersebut akan terpisah dan berubah menjadi splinter
group. Pada teknik divisive ini perhitungan juga di lihat dari perbedaan atau selisih anatara persamaan nilai rata-rata dengan nilai elemen matrik yang telah
menjadi splinter group. Jika selisih nilai antara persamaan nilai rata-rata dengan nilai elemen matrik splinter group bernilai negatif, maka perhitungan terhenti
sehingga harus dibuat matrik baru untuk mendapatkan klaster yang lain. Perhitungan ini terus dilakukan sedemikian sehingga semua objek terpisah.
2.6. Algoritma Metode Divisive