Pengukuran Similaritas Teknik Pengelompokan Hirarki Hierarchical Methods

15 Metode pengelompokan yang paling baik digunakan adalah metode yang menghasilkan heterogenitas maksimum antar cluster relatif terhadap variasi dalam kelompok. e. Tahap Interpretasi Pada tahap ini yang perlu diperhatikan adalah karakteristik apa yang membedakan masing-masing kelompok. Masing-masing kelompok tersebut diberikan penulisan label berdasarkan karakteristik kelompok tersebut. Disamping itu, interpretasi dari hasil pengelompokan baik berupa grafik dendogram maupun analisis koefisien pada agglomeration schedule. Apabila melihat jarak antar pengelompokan sebenarnya itu merupakan interpretasi dari beberapa nilai kedekatan dalam menggabungkan obyek dalam kelompok. f. Tahap Validasi Pada tahap ini dilakukan pengujian terhadap kelompok yang telah dibentuk. Uji yang dapat dilakukan seperti membandingkan hasil yang diperoleh dengan algoritma yang berbeda. Misalnya bila hasil pertama menggunakan algoritma hirarki, maka dicoba menggunakan algoritma nonhirarki apakah hasil pengelompokan berbeda atau tidak. Apabila hasil pengelompokan berbeda secara signifikan maka hasil pengelompokan belum valid karena tidak dapat diterapkan secara umum. Pada prosedur pengelompokan dengan melihat tingkat perubahan koefisien aglomerasi pada algoritma hierarkikal sebenarnya juga merupakan langkah uji terhadap pengelompokan yang dibentuk.

2.2.3. Pengukuran Similaritas

Similaritas inter-obyek dapat diukur dengan tiga metode sebagai berikut. a. Correlational measure Pada pengukuran jarak dengan metode ini, obyek-obyek dikelompokkan bersama dengan satu kelompk jika memiliki korelasi yang tinggi di antara variabel-variabel yang diukur. Metode ini jarang digunakan karena umunya similaritas didasarkan pada kedekatan jarak antar obyek, bukan kesamaan pola antar variabel. b. Distance measure Pengukuran berdasarkan jarak ini adalah metode yang paling umum digunakan dalam analisis cluster. Semakin kecil jarak antar obyek 16 mengindikasikan semakin similar obyek-obyek tersebut, begitu juga sebaliknya. Jadi obyek-obyek dalam satu kelompok memiliki kedekatan jarak, namun bisa memiliki pola yang sangat berbeda pada variabel-variabel yang diukur. c. Association measure Metode ini digunakan untuk membandingkan obyek dengan karakteristik data nonmetrik nominal atau ordinal. Ketiga metode tersebut dipilih berdasarkan tujuan penelitian dan tipe data. Correlational Measure dan Distance Measure digunakan untuk tipe data metrik, sedangkan Association Measure digunakan untuk tipe data nonmetrik.

2.2.4. Teknik Pengelompokan Hirarki Hierarchical Methods

Teknik hirarki adalah teknik pengelompokan membentuk konstruksi hirarki atau berdasarkan tingkatan tertentu seperti struktur pohon. Sehingga proses pengelompokan dilakukan secara bertingkat dan bertahap. Terdapat dua metode dalam teknik hirarki ini, yaitu : a. Metode agglomerative Metode ini dimulai dengan kenyataan bahwa setiap obyek membentuk kelompoknya masing-masing. Kemudian, dua obyek dengan jarak terdekat bergabung. Selanjutnya obyek ketiga akan bergabung dengan kelompok yang ada atau bersama obyek yang lain, membentuk kelompok baru. Hal ini tetap memperhitungkan jarak kedekatan antar obyek. Proses akan terus berlanjut hingga akhirnya terbentuk satu kelompok yang terdiri dari keseluruhan obyek. Metode agglomerative dibagi menjadi beberapa metode, yaitu : i. Single linkage Nearest neighbor methods Metode ini menggunakan prinsip jarak minimum yang diawali dengan mencari dua obyek yang memiliki jarak terdekat. Keduanya membentuk kelompok yang pertama. Pada langkah selanjutnya terdapat dua kemungkinan yaitu, obyek ketiga akan bergabung dengan kelompok yang terbentuk dan dua obyek lain akan membentuk kelompok baru. Proses ini akan berlanjut sampai akhirnya terbentuk kelompok tunggal pada metode ini, jarak antar kelompok didefinisikan sebagai jarak terdekat antar anggotanya. 17 ii. Complete linkage furthest neighbor methods Metode ini merupakan kebalikan dari pendekatan yang digunakan pada single linkage. Prinsip jarak yang digunakan adalah jarak terjauh antar obyek. iii. Average linkage methods between-groups method Metode ini mengikuti prosedur yang sama dengan kedua metode sebelumnya. Prinsip ukuran jarak yang digunakan adalah jarak rata-rata antar tiap pasangan obyek yang mungkin. iv. Ward’s methods Ward mengajukan suatu metode pembentukan kelompok yang didasari oleh hilangnya informasi akibat penggabungan obyek menjadi kelompok. Hal ini diukur dengan jumlah total dari deviasi kuadrat pada rata-rata kelompok untuk tiap observasi. b. Metode divisie Metode divisie berlawanan dengan metode agglomerative, mulai dengan satu kelompok besar mencakup semua obyek. Selanjutnya obyek yang tidak memiliki kemiripan besar dipisahkan sehingga membentuk kelompok yang lebih kecil. Pemisahan ini dilanjutkan hingga mencapai sejumlah kelompok yang diinginkan. Metode divisie dapat menggunakan splinter-average distance methods yang didasarkan pada perhitungan jarak rata-rata tiap obyek dengan obyek pada grup splinter dan jarak rata-rata obyek tersebut dengan obyek lain pada grupnya. Proses dimulai dengan memisahkan obyek dengan jarak terjauh sehingga terbentuklah dua grup. Kemudian bandingkan jarak rata-rata tiap obyek dengan grup splinter dan grupnya sendiri. Apabila suatu obyek memiliki jarak yang lebih dekat ke grup splinter daripada grupnya sendiri, maka obyek itu harus dikeluarkan dari grupnya dan dipindahkan ke grup splinter. Apabila komposisinya sudah stabil yaitu jarak suatu obyek ke grupnya elalu lebih kecil daripada jarak obyek itu ke grup splinter, maka proses berhenti dan dilanjutkan dengan tahap pemisahan dalam grup.

2.2.5. Teknik Non-Hirarki K-Means Clustering