Clustering Implementasi algoritma Partitioning Around Medoids (PAM) untuk pengelompokan Sekolah Menengah Atas di DIY berdasarkan nilai daya serap Ujian Nasional

17

2.4 Partitioning Around Medoids

PAM Algoritma Partitioning Around Medoids PAM atau dikenal juga dengan K- Medoids adalah algoritma pengelompokan yang berkaitan dengan algoritma K-Means dan algoritma medoidshift. Algoritma K-Medoids ini diusulkan pada tahun 1987. Algoritma Partitioning Around Medoids PAM dikembangkan oleh Leonard Kaufman dan Peter J. Rousseeuw. Algoritma ini sangat mirip dengan algoritma K- Means, terutama karena kedua algoritma ini partitional. Dengan kata lain, kedua algoritma ini memecah dataset menjadi kelompok-kelompok dan kedua algoritma ini berusaha untuk meminimalkan kesalahan. Tetapi algoritma Partitioning Around Medoids PAM bekerja dengan menggunakan Medoids, yang merupakan entitas dari dataset yang mewakili kelompok dimana ia dimasukkan. Algoritma Partitioning Around Medoids PAM menggunakan metode partisi clustering untuk mengelompokkan sekumpulan n obyek menjadi sejumlah kcluster . Algoritma ini menggunakan obyek pada kumpulan obyek untuk mewakili sebuah cluster . Obyek yang terpilih untuk mewakili sebuah cluster disebut dengan medoid. Cluster dibangun dengan menghitung kedekatan yang dimiliki antara medoid dengan obyek non-medoid .

2.4.1 Algoritma Partitioning Around Medoids PAM

Algoritma dari Partitioning Around Medoids PAM atau K-Medoids adalah sebagai berikut Han Kamber, 2006: 1. Secara acak pilih k obyek pada sekumpulan n obyek sebagai medoid . 2. Ulangi langkah 3 hingga langkah 6. 3. Tempatkan obyek non-medoid ke dalam cluster yang paling dekat dengan medoid. 4. Secara acak pilih o random : sebuah obyek non-medoid . PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 18 5. Hitung total biaya, S , dari pertukaran medoid o j dengan o random . 6. Jika S 0 maka tukar o j dengan o random untuk membentuk sekumpulan k obyek baru sebagai medoid. 7. Hingga tidak ada perubahan. Nilai total biaya cost dinyatakan dengan persamaan: Total = ∑ � …………………………………….2.2 Dimana : dist = merujuk pada rumus 2.1 Nilai S dinyatakan dengan persamaan: S = Total baru − Total lama ………………………….2.3 Dimana : Total cost baru = jumlah biaya cost non-medoids. Total cost baru = jumlah biaya cost medoids. K-medoids sangat mirip dengan K-means, perbedaan utama diantara dua algoritma tersebut adalah jika pada K-Means cluster diwakili dengan pusat dari cluster , sedangkan pada K-Medoids cluster diwakili oleh obyek terdekat dari pusat cluster .

2.4.2 Contoh Penerapan Algoritma Partitioning Around Medoids PAM

Berikut adalah contoh penerapan algoritma PAM atau K-Medoids pada kasus nilai daya serap ujian nasional di provinsi DIY, dengan data sampel yang digunakan adalah mata pelajaran matematika pada tahun ajaran 20132014. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 19 Tabel 2.1 Data Contoh Nama Sekolah MAT1 MAT2 MAT3 MAT4 MAT5 MAT6 MAT7 SMA NEGERI 3 YOGYAKARTA 54.55 74.33 76.87 92.51 74.87 66.84 88.23 SMA NEGERI 4 YOGYAKARTA

36.42 70.37

58.03 79.63

60.49 50.62

75.52 SMA NEGERI 6 YOGYAKARTA 31.35 61.08 67.43 81.62 64.32 50.81 82.70 SMA NEGERI 9 YOGYAKARTA 42.75 68.12 64.49 92.75 67.39 48.55 79.47 SMA NEGERI 11 YOGYAKARTA 34.39 60.85 51.98 79.37 48.15 38.10 70.55 SMA STELLA DUCE 1 YOGYAKARTA 36.59 73.98 64.63 83.74 69.92 47.97 84.55 SMA BOPKRI 1 YOGYAKARTA 37.21 81.40 60.75 89.53 37.21 39.53 77.13 Contoh perhitungan penerapan algoritma Partitioning Around Medoids