Ujian Nasional UN LANDASAN TEORI

Sementara nilai SI global didapatkan dengan menghitung rata-rata nilai SI dari semua Cluster seperti pada persamaan berikut : �� = 1 ∑ �� =1 ......................................2.6 di mana : j : cluster k : jumlah cluster �� : Silhouette Index cluster SI : Silhouette Index global Untuk memvalidasi seberapa baik sebuah cluster digunakan metode Silhouette Coefficient SC. Nilai SC didapatkan dengan mencari nilai maksimum SI Global dari jumlah cluster 2 sampai jumlah cluster n-1, seperti persamaan berikut: �� = � �� � ..................................2.7 di mana : SC : Silhouette Coefficient SI : Nilai Silhouette Global k : jumlah cluster Kriteria subjektif pengukuran baik atau tidaknya pengelompokan berdasarkan Silhouette Coefficient SC menurut Kauffman dan Roesseeuw 1990 disajikan dalam Tabel 3.1 Tabel 3. 1 Kriteria subjetif pengukuran pengelompokan berdasarkan Silhouette Coefficient SC Nilai SC Interpretasi SC 0,71 - 1,00 Struktur kuat 0,51 - 0,70 Struktur baik 0,26 - 0,50 Struktur Lemah ≤0,25 Struktur buruk

2.4 Algoritma Agglomerative Hierarchical Clustering AHC

Agglomerative Hierarchical Clustering AHC adalah metode pengelompokan berbasis hirarki dengan pendekatan bottom up, yaitu proses pengelompokan dimulai dari masing-masing data sebagai satu buah cluster, kemudian secara rekursif mencari cluster terdekat sebagai pasangan untuk bergabung sebagai satu cluster yang lebih besar. Prasetyo, 2014 Algoritma Agglomerative Hierarchical Clustering AHC dapat dijelaskan sebagai berikut Prasetyo, 2014 : 1. Hitung matriks kedekatan berdasarkan jenis jarak yang digunakan 2. Ulangi langkah 3 sampai 4, hingga hanya satu cluster yang tersisa 3. Gabungkan dua cluster terdekat berdasarkan parameter kedekatan yang ditentukan 4. Perbarui matriks kedekatan untuk merefleksikan kedekatan diantara cluster- cluster baru dan cluster yang tersisa Pengelompokan berbasis hirarki sering ditampilkan dalam bentuk grafis menggunakan diagram yang mirip pohon tree yang disebut dengan dendogram. Dendogram merupakan diagram yang menampilkan hubungan cluster dan subcluster-nya dalam urutan yang mana cluster yang digabung agglomerative view atau dipecah divisive view. Ada tiga teknik kedekatan yang digunakan Agglomerative Hierarchical Clustering AHC yaitu: 1. Single linkage jarak terdekat Single linkage memberikan hasil bila cluster-cluster digabungkan menurut jarak antara anggota-anggota yang paling dekat diantara dua cluster. Pengukuran jarak cluster dalam single linkage menggunakan formula jarak minimal. Teknik ini bagus untuk menangani set data yang distribusi datanya non-elips, tapi sangat sensitif terhadap noise dan outlier. dU,V = min {dU,V}; dU,V ϵ D .......................... 2.6 di mana: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI