15 Metode pengelompokan yang paling baik digunakan adalah metode yang
menghasilkan heterogenitas maksimum antar cluster relatif terhadap variasi dalam kelompok.
e. Tahap Interpretasi Pada tahap ini yang perlu diperhatikan adalah karakteristik apa yang
membedakan masing-masing kelompok. Masing-masing kelompok tersebut diberikan penulisan label berdasarkan karakteristik kelompok tersebut.
Disamping itu, interpretasi dari hasil pengelompokan baik berupa grafik dendogram maupun analisis koefisien pada agglomeration schedule. Apabila
melihat jarak antar pengelompokan sebenarnya itu merupakan interpretasi dari beberapa nilai kedekatan dalam menggabungkan obyek dalam
kelompok. f.
Tahap Validasi Pada tahap ini dilakukan pengujian terhadap kelompok yang telah dibentuk.
Uji yang dapat dilakukan seperti membandingkan hasil yang diperoleh dengan algoritma yang berbeda. Misalnya bila hasil pertama menggunakan
algoritma hirarki, maka dicoba menggunakan algoritma nonhirarki apakah hasil pengelompokan berbeda atau tidak. Apabila hasil pengelompokan
berbeda secara signifikan maka hasil pengelompokan belum valid karena tidak dapat diterapkan secara umum. Pada prosedur pengelompokan
dengan melihat tingkat perubahan koefisien aglomerasi pada algoritma hierarkikal
sebenarnya juga
merupakan langkah
uji terhadap
pengelompokan yang dibentuk.
2.2.3. Pengukuran Similaritas
Similaritas inter-obyek dapat diukur dengan tiga metode sebagai berikut. a. Correlational measure
Pada pengukuran jarak dengan metode ini, obyek-obyek dikelompokkan bersama dengan satu kelompk jika memiliki korelasi yang tinggi di antara
variabel-variabel yang diukur. Metode ini jarang digunakan karena umunya similaritas didasarkan pada kedekatan jarak antar obyek, bukan kesamaan
pola antar variabel. b. Distance measure
Pengukuran berdasarkan jarak ini adalah metode yang paling umum digunakan dalam analisis cluster. Semakin kecil jarak antar obyek
16 mengindikasikan semakin similar obyek-obyek tersebut, begitu juga
sebaliknya. Jadi obyek-obyek dalam satu kelompok memiliki kedekatan jarak, namun bisa memiliki pola yang sangat berbeda pada variabel-variabel
yang diukur. c. Association measure
Metode ini digunakan untuk membandingkan obyek dengan karakteristik data nonmetrik nominal atau ordinal.
Ketiga metode tersebut dipilih berdasarkan tujuan penelitian dan tipe data. Correlational Measure dan Distance Measure digunakan untuk tipe data metrik,
sedangkan Association Measure digunakan untuk tipe data nonmetrik.
2.2.4. Teknik Pengelompokan Hirarki Hierarchical Methods
Teknik hirarki adalah teknik pengelompokan membentuk konstruksi hirarki atau berdasarkan tingkatan tertentu seperti struktur pohon. Sehingga proses
pengelompokan dilakukan secara bertingkat dan bertahap. Terdapat dua metode dalam teknik hirarki ini, yaitu :
a. Metode agglomerative Metode ini dimulai dengan kenyataan bahwa setiap obyek membentuk
kelompoknya masing-masing. Kemudian, dua obyek dengan jarak terdekat bergabung. Selanjutnya obyek ketiga akan bergabung dengan kelompok
yang ada atau bersama obyek yang lain, membentuk kelompok baru. Hal ini tetap memperhitungkan jarak kedekatan antar obyek. Proses akan terus
berlanjut hingga akhirnya terbentuk satu kelompok yang terdiri dari keseluruhan obyek. Metode agglomerative dibagi menjadi beberapa metode,
yaitu : i.
Single linkage Nearest neighbor methods Metode ini menggunakan prinsip jarak minimum yang diawali dengan
mencari dua obyek yang memiliki jarak terdekat. Keduanya membentuk kelompok yang pertama. Pada langkah selanjutnya terdapat dua
kemungkinan yaitu, obyek ketiga akan bergabung dengan kelompok yang terbentuk dan dua obyek lain akan membentuk kelompok baru.
Proses ini akan berlanjut sampai akhirnya terbentuk kelompok tunggal pada metode ini, jarak antar kelompok didefinisikan sebagai jarak
terdekat antar anggotanya.
17 ii.
Complete linkage furthest neighbor methods Metode ini merupakan kebalikan dari pendekatan yang digunakan pada
single linkage. Prinsip jarak yang digunakan adalah jarak terjauh antar obyek.
iii. Average linkage methods between-groups method Metode ini mengikuti prosedur yang sama dengan kedua metode
sebelumnya. Prinsip ukuran jarak yang digunakan adalah jarak rata-rata antar tiap pasangan obyek yang mungkin.
iv. Ward’s
methods Ward mengajukan suatu metode pembentukan kelompok yang didasari
oleh hilangnya informasi akibat penggabungan obyek menjadi kelompok. Hal ini diukur dengan jumlah total dari deviasi kuadrat pada
rata-rata kelompok untuk tiap observasi. b. Metode divisie
Metode divisie berlawanan dengan metode agglomerative, mulai dengan satu kelompok besar mencakup semua obyek. Selanjutnya obyek yang tidak
memiliki kemiripan besar dipisahkan sehingga membentuk kelompok yang lebih kecil. Pemisahan ini dilanjutkan hingga mencapai sejumlah kelompok
yang diinginkan. Metode divisie dapat menggunakan splinter-average distance methods yang didasarkan pada perhitungan jarak rata-rata tiap
obyek dengan obyek pada grup splinter dan jarak rata-rata obyek tersebut dengan obyek lain pada grupnya. Proses dimulai dengan memisahkan obyek
dengan jarak terjauh sehingga terbentuklah dua grup. Kemudian bandingkan jarak rata-rata tiap obyek dengan grup splinter dan grupnya sendiri. Apabila
suatu obyek memiliki jarak yang lebih dekat ke grup splinter daripada grupnya sendiri, maka obyek itu harus dikeluarkan dari grupnya dan
dipindahkan ke grup splinter. Apabila komposisinya sudah stabil yaitu jarak suatu obyek ke grupnya elalu lebih kecil daripada jarak obyek itu ke grup
splinter, maka proses berhenti dan dilanjutkan dengan tahap pemisahan dalam grup.
2.2.5. Teknik Non-Hirarki K-Means Clustering