Studi Kasus

5.3 Studi Kasus

Diketahui data 2 dimensi yang ditunjukkan oleh Tabel 3.1 berikut:

Tabel 5.1 Contoh Data 2 Dimensi

No. X Y Cluster

No.

Cluster

No. X Y Cluster

1 0.50 0.00 1 37 8.60 12.29 2 71 -10.59 -10.62 2 2 0.48 0.13 2 38 7.49 12.99 1 72 -9.62 -11.51

1 3 0.43 0.25 2 73 -8.58 -12.30

4 0.35 0.35 2 74 -7.48 -13.00 2

5 0.25 0.43 1 75 -6.32 -13.61 1

6 0.13 0.48 1 76 -5.11 -14.10 1 7 0.00 0.50 2 42 2.60 14.77 1 77 -3.86 -14.50

1 8 -0.13

0.48 2 43 1.30 14.94 2 78 -2.58 -14.78 2

15.00 1 79 -1.28 -14.95 1 9 -0.25

0.43 1 80 0.03 -15.00 1 10 -0.35

81 1.34 -14.94 1 11 -0.43

14.77 2 82 2.63 -14.77 1 12 -0.48

0.25 1 46 -2.62

14.49 1 83 3.91 -14.48 2 13 -0.50

0.13 2 47 -3.89

14.09 1 84 5.16 -14.08 2 14 -0.48 -0.13

0.00 2 48 -5.14

13.59 1 85 6.37 -13.58 2 15 -0.43 -0.25

2 49 -6.35

12.98 2 86 7.53 -12.97 2 16 -0.35 -0.35

2 50 -7.51

12.28 1 87 8.63 -12.27 2 17 -0.25 -0.43

1 51 -8.61

11.48 1 88 9.67 -11.47 1 18 -0.13 -0.48

2 52 -9.65

2 89 10.63 -10.58 2

19 0.00 -0.50 1 90 11.51 -9.62 1 20 0.13

53 -10.62 10.60

9.63 1 91 12.31 -8.58 1 21 0.25

1 54 -11.50

8.59 2 92 13.01 -7.47 1 22 0.35

1 55 -12.30

7.49 2 93 13.61 -6.31 2 23 0.43

1 56 -13.00

6.32 2 94 14.11 -5.10 2 24 0.48

2 57 -13.60

5.11 1 95 14.50 -3.85 1 25 0.50

2 58 -14.10

0.00 2 59 -14.49

3.87 2 96 14.78 -2.57 1

2 62 -15.00 -0.02

1 63 -14.94 -1.33

1 64 -14.77 -2.62

65 -14.48 -3.90

2 66 -14.09 -5.15

1 67 -13.59 -6.36

10.61 2 68 -12.98 -7.52

69 -12.27 -8.62

36 9.64 11.49 2 70 -11.48 -9.66

Visualisasi Data 2 DImensi No. X

Y Cluster

1 Gambar 5.6 Visualisasi Data 2 Dimensi Keterangan:

Langkah-langkah penyelesaian dengan Kernel K-Means: Misal dengan kernel Polynomial d k

 x i , x j  x i  x j  c 

1. Tentukan jumlah cluster k = 2. Iterasi maksimum (t max ) = 5, dan nilai threshold = 0.05.

2. Inisialisasi k pusat cluster. Misal dilakukan inisialisasi secara random nilai indek clusternya (1 atau 2, pada kolom cluster) dari semua data.

3. Alokasikan semua data atau obyek ke cluster terdekat berdasarkan jarak yang dihitung menggunakan rumus fungsi pemetaan Φ dari fungsi kernel.

Mulai masuk pada iterasi ke-1 (t = 1). Sebelum dilakukan pengalokasian data ke cluster terdekat, lakukan perhitungan centroid masing-masing cluster dari hasil pemetaan Φ.

Menghitung Centroid Cluster

c j   u ij  ( x i )

 x i , x j  x i  x j  c 

2 fungsi pemetaan Φ = (X 2 , √2XY, Y )

Contoh hasil perhitungan dari fungsi pemetaan Φ ditunjukan pada Tabel 3.2.

x Tabel 5.3  ( x i )

Tabel 5.2 i

Y Cluster

X √2.X.Y Y

Menghitung Centroid Setiap Cluster

Untuk melakukan perhitungan centroid setiap cluster ke- lompokan data berdasarkan clusternya dan hitung fungsi pemetaannya seperti yang ditunjukkan oleh Tabel berikut:

Tabel 5.4 Fungsi Pemetaan Cluster 1

2 X Y Cluster X 2 √2XY Y

Data

4 -0.25 0.43 1 0.06 -0.15 0.19 . . . . . . .

48 14.78 -2.57 1 218.40 -53.68 6.60

49 15.00 0.04 1 225.00 0.80 0.00 Total 49 4312.54 1.63 4240.21

Tabel 5.5 Fungsi Pemetaan Cluster 2

2 Data 2 X Y Cluster X √2XY Y 1 0.48 0.13 2 0.23 0.09 0.02

Setelah diperoleh fungsi pemetaan dari seluruh data pada setiap clus- ter langkah selanjutnya adalah menghitung centroid cluster dengan menggunakan persamaan 3.6.

centroid cluster 1 pada iterasi 1:

centroid cluster 2 pada iterasi 1:

c 1   - 1.22 / 49    - 0.02   3859.54 / 49   78.77 

Setelah diperoleh centroid dari setiap cluster alokasikan semua data atau obyek ke cluster terdekat menggunakan persamaan

3.5 yang telah dijabarkan sebagai berikut:

nm

 l  lj K ( x l , x i ) 

min  u ij   K ( x i , x i )   2  1   1 u 2

  u lj K ( x l , x p )  

 n j l  1 p  1     

Untuk memudahkan dalam perhitungan, persamaan di atas dibagi menjadi 3 bagian yaitu a, b, dan c. Sebagai contoh, berikut ini ditampilkan perhitungan jarak antara data 1 terhadap cluster 1.

Diketahui : i=1 j=1 x i = (0.50, 0.00)

Untuk menghitung bagian a: K(x i ,x i ) = (x i .x i + c) d

2 = (((0.50 x 0.50)+(0.00 x 0.00)) + 0) = 0.0625

Setelah diperoleh nilai a langkah selanjutnya adalah menghi- tung fungsi kernel antara data i terhadap seluruh data pada cluster j untuk dapat dilakukan perhitungan terhadap nilai b. untuk contoh perhitungan ini perhitungan dilakukan antara data 1 terhadap seluruh data yang terdapat pada cluster. Sebagai contoh diambil satu data pada cluster j yaitu data 2:

x l = (0.25, 0.43) K(x i ,x l ) = (x i .x l + c) d

= (((0.50 x 0.25)+(0.00 x 0.43)) + 0) 2

= 0.016 Hasil perhitungan fungsi kernel antara data i terhadap seluruh

data pada cluster 1 ditunjukkan oleh Tabel 3.6 berikut: Tabel 5.6 Nilai Kernel data i terhadap semua data cluster 1 iterasi 1

No. x l K(x i ,x l )

4 -0.25, 0.43 0.015625

48 14.78, -2.57 54.6121

49 15, 0.04 56.25 Total 1078.15

Setelah diperoleh total nilai fungsi kernel antara data i terhadap seluruh data pada cluster j untuk dapat dilakukan perhi- tungan nilai b.

b = -2(baris (Total)) / jumlah data pada cluster j = -2(1078.15) / 49 = -44.006

Setelah diperoleh nilai b selanjutnya yaitu menghitung c. Untuk memperoleh c terlebih dahulu dilakukan penjumlahan nilai fungsi kernel antar data pada cluster j. Sebagai contoh diambil satu data pada cluster j yaitu:

x l = (0.25, 0.43) K(x l ,x l ) = (x l .x l + c) d

= (((0.25 x 0.25)+(0.43 x 0.43)) + 0) 2

= 0.66 Contoh hasil perhitungan nilai fungsi kernel antar data pada

cluster j untuk iterasi 1 ditunjukkan oleh Tabel 3.7.

Tabel 5.7 Nilai Kernel Antar Data Pada Cluster j untuk iterasi 1

. 50625.72 Asumsikan total nilai tersebut dengan T. Untuk memperoleh

nilai c dengan cara: nilai c dengan cara:

= 15234.24 Setelah diperoleh nilai a,b dan c selanjutnya Jumlahkan nilai a,

b, dan c. Hasil jumlah a, b, dan c adalah :

a + b + c = 0.625 + (-44.006) + 15234.24

Untuk jarak dari setiap data i terhadap cluster j ditunjukkan oleh Tabel 3.8.

Tabel 5.8 Jarak dan alokasi data untuk centroid terdekat iterasi 1

Data X Y

Jarak ke C1 Jarak ke C2

K baru K lama

Fbaru = 1177274.15 + 1138242.98 = 2315517.13 Visualisasi data hasil update keanggotaan cluster iterasi 1:

Gambar 5.7 Visualisasi data hasil update anggota cluster iterasi 1

4. Setelah mendapat jarak titik data terhadap masing-masing cluster pada langkah 3, jarak terdekat titik data dengan suatu cluster berarti titik data tersebut termasuk dalam cluster tersebut seperti dapat dilihat pada Tabel 3.8. Selanjutnya lakukan perhitungan nilai delta untuk menentukan apakah perlu dilanjutkan ke iterasi selan- jutnya atau tidak dimana jika delta ≥ threshold, maka iterasi berlanjut. Jika delta < threshold, maka iterasi berhenti. Berikut perhitungan delta:

Delta = |Fbaru - Flama| = |2315517.13 - 0| > 0.05 (threshold) dan iterasi < t max = 5, maka lanjutkan ke iterasi 2 (Kembali ke langkah 3).