17
2.4 Partitioning Around Medoids
PAM
Algoritma
Partitioning Around Medoids
PAM atau dikenal juga dengan K- Medoids adalah algoritma pengelompokan yang berkaitan dengan algoritma K-Means
dan algoritma medoidshift. Algoritma K-Medoids ini diusulkan pada tahun 1987. Algoritma
Partitioning Around Medoids
PAM dikembangkan oleh Leonard Kaufman dan Peter J. Rousseeuw. Algoritma ini sangat mirip dengan algoritma K-
Means, terutama karena kedua algoritma ini partitional. Dengan kata lain, kedua algoritma ini memecah dataset menjadi kelompok-kelompok dan kedua algoritma ini
berusaha untuk meminimalkan kesalahan. Tetapi algoritma
Partitioning Around Medoids
PAM bekerja dengan menggunakan Medoids, yang merupakan entitas dari dataset yang mewakili kelompok dimana ia dimasukkan.
Algoritma
Partitioning Around Medoids
PAM menggunakan metode partisi
clustering
untuk mengelompokkan sekumpulan
n
obyek menjadi sejumlah
kcluster
. Algoritma ini menggunakan obyek pada kumpulan obyek untuk mewakili sebuah
cluster
. Obyek yang terpilih untuk mewakili sebuah
cluster
disebut dengan
medoid. Cluster
dibangun dengan menghitung kedekatan yang dimiliki antara
medoid
dengan obyek
non-medoid
.
2.4.1 Algoritma Partitioning Around Medoids PAM
Algoritma dari
Partitioning Around Medoids
PAM atau K-Medoids adalah
sebagai berikut Han Kamber, 2006: 1.
Secara acak pilih
k
obyek pada sekumpulan
n
obyek sebagai
medoid
. 2.
Ulangi langkah 3 hingga langkah 6. 3.
Tempatkan obyek
non-medoid
ke dalam
cluster
yang paling dekat dengan medoid.
4. Secara acak pilih o
random
: sebuah obyek
non-medoid
. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
18 5.
Hitung total biaya,
S
, dari pertukaran
medoid
o
j
dengan o
random
. 6.
Jika S 0 maka tukar o
j
dengan o
random
untuk membentuk sekumpulan
k
obyek baru sebagai medoid.
7. Hingga tidak ada perubahan.
Nilai total biaya
cost
dinyatakan dengan persamaan: Total
= ∑ � …………………………………….2.2 Dimana :
dist = merujuk pada rumus 2.1
Nilai S dinyatakan dengan persamaan: S = Total
baru − Total lama ………………………….2.3
Dimana : Total
cost
baru = jumlah biaya
cost
non-medoids. Total
cost
baru = jumlah biaya
cost
medoids. K-medoids sangat mirip dengan K-means, perbedaan utama diantara dua
algoritma tersebut adalah jika pada K-Means
cluster
diwakili dengan pusat dari
cluster
, sedangkan pada K-Medoids
cluster
diwakili oleh obyek terdekat dari pusat
cluster
.
2.4.2 Contoh Penerapan Algoritma Partitioning Around Medoids PAM
Berikut adalah contoh penerapan algoritma PAM atau K-Medoids pada kasus nilai daya serap ujian nasional di provinsi DIY, dengan data sampel yang digunakan
adalah mata pelajaran matematika pada tahun ajaran 20132014. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
19
Tabel 2.1 Data Contoh
Nama Sekolah MAT1
MAT2 MAT3 MAT4 MAT5 MAT6 MAT7 SMA NEGERI 3 YOGYAKARTA
54.55 74.33
76.87 92.51
74.87 66.84
88.23 SMA NEGERI 4 YOGYAKARTA
36.42 70.37
58.03 79.63
60.49 50.62
75.52 SMA NEGERI 6 YOGYAKARTA
31.35 61.08
67.43 81.62
64.32 50.81
82.70 SMA NEGERI 9 YOGYAKARTA
42.75 68.12
64.49 92.75
67.39 48.55
79.47 SMA NEGERI 11 YOGYAKARTA
34.39 60.85
51.98 79.37
48.15 38.10
70.55 SMA STELLA DUCE 1
YOGYAKARTA 36.59
73.98 64.63
83.74 69.92
47.97 84.55
SMA BOPKRI 1 YOGYAKARTA 37.21
81.40 60.75
89.53 37.21
39.53 77.13
Contoh perhitungan penerapan algoritma
Partitioning Around Medoids