Data yang Digunakan Pemrosesan Data

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

Bab ini secara garis besar membahas analisis algoritma hierarchical clustering dan k- means pada sistem dan tahap-tahap yang dilakukan dalam perancangan sistem yang akan dibangun.

3.1. Data yang Digunakan

Data yang digunakan dalam penelitian ini adalah data desa yang bersumber dari data desa pada pendataan Potensi Desa PODES tahun 2011 di provinsi Sumatera Utara. Setelah pengumpulan data lalu dilakukan analisa data sesuai dengan kebutuhan sistem. Analisis data dilakukan menggunakan algoritma hierarchical dan algoritma k- means. Total data yang digunakan 5797 data desa. Pada saat petugas lapangan melakukan pendataan Podes, petugas mengisi data potensi desa yang merupakan data umum yang memberikan indikasi keberadaan potensi yang dimiliki oleh suatu wilayah. Yang mana data yang dikumpulkan berupa : 1. Potensi DesaKelurahan: kondisi sosial ekonomi penduduk, ketersediaan infrastruktur, dan pembangunan desakelurahan di seluruh Indonesia. 2. Potensi Kecamatan: fasilitas perlindungan sosial, situsbangunan bersejarah, obyek wisata, prasarana transportasi, serta aparatur kecamatan. 3. Potensi KabupatenKota: keberadaan pertambangan, industri, perhubungan, politik dan keamanan, serta aparatur kabupatenkota. 4. Kualitas Infrastruktur Pendidikan: keberadaan dan kualitas sekolah negeri termasuk jumlah siswa, guru, kondisi ruangan dan sanitasi yang ada di sekolah tersebut. 5. Kualitas Infrastruktur Kesehatan PuskesmasPustu, Polindes, Posyandu: keberadaan dan kualitas fasilitas kesehatan termasuk: kondisi ruangan dan sanitasi yang ada di setiap fasilitas tersebut. Universitas Sumatera Utara Dari data umum tersebut terdapat 9 Sembilan variabel yang digunakan dalam penelitian. Gambar 3.1 merupakan contoh data Podes yang akan digunakan untuk pengelompokan desa tertinggal. Gambar 3.1. Print Screen Data Podes Sumatera Utara Tahun 2011

3.2. Pemrosesan Data

Dalam mengolah data mining terdapat beberapa tahapan yang harus dilakukan sehingga data dapat digunakan secara maksimal. Tahapan tersebut merupakan bagian dari Knowledge Discovery in Database KDD. Pada tahap ini dilakukan pembersihan data, yaitu membuang dan mengisi data missing values, sehingga dihasilkan data yang layak diperlukan pada proses pengelompokan desa.

3.3. Uji Coba dengan Algoritma Hierarchical Clustering dan K-means Clustering