Tabel 4.1 Data Awal
No Nama Wilayah
Pekerjaan Umur
Daniel Medan Perjuangan
TKI 33
1 Hendrik
Medan Selayang Peg. Swasta
25 2
Rinaldi Belawan
Pedagang 44
3 Marusaha
Medan Perjuangan TKI
31 4
Ana Medan Perjuangan
TKI 37
5 Linda
Medan Selayang Peg. Swasta
40 6
Keanu Medan Kota
Peg. Swasta 24
7 Abadi
Belawan PNS
42 8
Zefri Medan Kota
PNS 38
9 Susan
Medan Kota Therapys
28 10 Ilham
Medan Selayang TKI
27 11 Titin
Medan Selayang TKI
22 12 Roma
Medan Perjuangan TKI
27 13 Pidia
Medan Perjuangan Theraphys
30 14 Arki
Medan Kota Peg. Swasta
44 15 Asima
Belawan Pedagang
41 16 Darleny
Belawan Pedagang
24 17 Arif
Belawan TKI
22 18 Indah
Belawan Pedagang
27 19 Humala
Medan Selayang Peg. Swasta
26
4.4. Transformasi Data
Agar data diatas dapat diolah dengan menggunakan metode K-Means Clustering, maka data yang berjenis data nominal seperti wilayah dan pekerjaan harus
diinisialisasikan terlebih dahulu dalam bentuk angka. Untuk melakukan inisialisasi wilayah dilakukan dengan cara mengurutkan dari
yang terbesar berdasarkan frekuensi pasien yang berasal dari wilayah tersebut. Setelah itu wilayah yang memiliki frekuensi terbesar diberi inisial dengan angka 1 dan
wilayah yang memiliki frekuensi terbesar kedua diberi inisial dengan angka 2. Hasil dari inisialisasi wilayah dapat dilihat pada table 4.2.
Tabel 4.2 Inisialisasi Data Wilayah Kota Asal
No Wilayah
Frekuensi Inisialisasi
1 Belawan
6 1
2 Medan Perjuangan
5 2
3 Medan Selayang
5 3
4 Medan Kota
4 4
Universitas Sumatera Utara
Selain wilayah, pekerjaan juga termasuk ke dalam jenis data nominal, sehingga perlu diinisialisasikan ke dalam bentuk angka. Seperti pada wilayah, pada pekerjaanjuga
diberikan inisialisasi berdasarkan frekuensi pekerjaan pasien tersebut. Hasil dari inisialisasi pekerjaan tersebut dapat dilihat pada table 4.3
Tabel 4.3 Inisialisasi Data Pekerjaan
No Pekerjaan
Frekuensi Inisialisasi
1 TKI
7 1
2 Peg. Swasta
5 2
3 Pedagang
4 3
4 PNS
2 4
5 Therapys
2 5
Tabel 4.4 Keseluruhan Data yang telah diinisialisasikan
No Nama
Wilayah Pekerjaan
Umur
Daniel 2
1 33
1 Hendrik
3 2
25 2
Rinaldi 1
3 44
3 Marusaha
2 1
31 4
Ana 2
1 37
5 Linda
3 2
40 6
Keanu 4
2 24
7 Abadi
1 4
42 8
Zefri 4
4 38
9 Susan
4 5
28 10
Ilham 3
1 27
11 Titin
3 1
22 12
Roma 2
1 27
13 Pidia
2 5
30 14
Arki 4
2 44
15 Asima
1 3
41 16
Darleny 1
3 24
17 Arif
1 1
22 18
Indah 1
3 27
19 Humala
3 2
26 Setelah semua data pasien ditransformasi ke dalam bentuk angka, maka data tersebut
telah dapat dikelompokkan dengan menggunakan metode K-MeanClustering. Untuk dapat melakukan pengelompokan data tersebut menjadi beberapa cluster perlu
dilakukan beberapa langkah yaitu: 1.
Tentukan telebih dahulu jumlah cluster yang diinginkan. Dalam penelitian ini data yang ada akan dikelompokan menjadi tiga cluster.
Universitas Sumatera Utara
2. Tentukan titik pusat awal dari setiap cluster. Dalam penelitian ini titik pusat
awal dibangkitkan secara random. Pusat cluster pada solusi awal dapat dilihat pada table 4.5
4.5. Hasil Uji Algoritma Modified K-MeanClustering berbasis Sum of Squared Error SSE diawali