Transformasi Data HASIL DAN PEMBAHASAN

Tabel 4.1 Data Awal No Nama Wilayah Pekerjaan Umur Daniel Medan Perjuangan TKI 33 1 Hendrik Medan Selayang Peg. Swasta 25 2 Rinaldi Belawan Pedagang 44 3 Marusaha Medan Perjuangan TKI 31 4 Ana Medan Perjuangan TKI 37 5 Linda Medan Selayang Peg. Swasta 40 6 Keanu Medan Kota Peg. Swasta 24 7 Abadi Belawan PNS 42 8 Zefri Medan Kota PNS 38 9 Susan Medan Kota Therapys 28 10 Ilham Medan Selayang TKI 27 11 Titin Medan Selayang TKI 22 12 Roma Medan Perjuangan TKI 27 13 Pidia Medan Perjuangan Theraphys 30 14 Arki Medan Kota Peg. Swasta 44 15 Asima Belawan Pedagang 41 16 Darleny Belawan Pedagang 24 17 Arif Belawan TKI 22 18 Indah Belawan Pedagang 27 19 Humala Medan Selayang Peg. Swasta 26

4.4. Transformasi Data

Agar data diatas dapat diolah dengan menggunakan metode K-Means Clustering, maka data yang berjenis data nominal seperti wilayah dan pekerjaan harus diinisialisasikan terlebih dahulu dalam bentuk angka. Untuk melakukan inisialisasi wilayah dilakukan dengan cara mengurutkan dari yang terbesar berdasarkan frekuensi pasien yang berasal dari wilayah tersebut. Setelah itu wilayah yang memiliki frekuensi terbesar diberi inisial dengan angka 1 dan wilayah yang memiliki frekuensi terbesar kedua diberi inisial dengan angka 2. Hasil dari inisialisasi wilayah dapat dilihat pada table 4.2. Tabel 4.2 Inisialisasi Data Wilayah Kota Asal No Wilayah Frekuensi Inisialisasi 1 Belawan 6 1 2 Medan Perjuangan 5 2 3 Medan Selayang 5 3 4 Medan Kota 4 4 Universitas Sumatera Utara Selain wilayah, pekerjaan juga termasuk ke dalam jenis data nominal, sehingga perlu diinisialisasikan ke dalam bentuk angka. Seperti pada wilayah, pada pekerjaanjuga diberikan inisialisasi berdasarkan frekuensi pekerjaan pasien tersebut. Hasil dari inisialisasi pekerjaan tersebut dapat dilihat pada table 4.3 Tabel 4.3 Inisialisasi Data Pekerjaan No Pekerjaan Frekuensi Inisialisasi 1 TKI 7 1 2 Peg. Swasta 5 2 3 Pedagang 4 3 4 PNS 2 4 5 Therapys 2 5 Tabel 4.4 Keseluruhan Data yang telah diinisialisasikan No Nama Wilayah Pekerjaan Umur Daniel 2 1 33 1 Hendrik 3 2 25 2 Rinaldi 1 3 44 3 Marusaha 2 1 31 4 Ana 2 1 37 5 Linda 3 2 40 6 Keanu 4 2 24 7 Abadi 1 4 42 8 Zefri 4 4 38 9 Susan 4 5 28 10 Ilham 3 1 27 11 Titin 3 1 22 12 Roma 2 1 27 13 Pidia 2 5 30 14 Arki 4 2 44 15 Asima 1 3 41 16 Darleny 1 3 24 17 Arif 1 1 22 18 Indah 1 3 27 19 Humala 3 2 26 Setelah semua data pasien ditransformasi ke dalam bentuk angka, maka data tersebut telah dapat dikelompokkan dengan menggunakan metode K-MeanClustering. Untuk dapat melakukan pengelompokan data tersebut menjadi beberapa cluster perlu dilakukan beberapa langkah yaitu: 1. Tentukan telebih dahulu jumlah cluster yang diinginkan. Dalam penelitian ini data yang ada akan dikelompokan menjadi tiga cluster. Universitas Sumatera Utara 2. Tentukan titik pusat awal dari setiap cluster. Dalam penelitian ini titik pusat awal dibangkitkan secara random. Pusat cluster pada solusi awal dapat dilihat pada table 4.5

4.5. Hasil Uji Algoritma Modified K-MeanClustering berbasis Sum of Squared Error SSE diawali