Berbasis Arc View ” yang mana pada pada hasil penelitian tersebut perwilayahan di
provinsi Sumatera Selatan dibagi menjadi 7 kluster dan menghasilkan hasil klusterisasi dan analisis yang baik. Penelitian lain dilakukan oleh Tahta Alfina, dkk
pada tahun 2012 dengan judul “Analisa Perbandingan Algoritma Hierarchical Clustering, K-means dan Gabungan Keduanya dalam Cluster Data Studi kasus:
Problem Kerja Praktek Jurusan Teknik Industri ITS” yang mana hasil dari penelitian
ini menghasilkan pengelompokan data yang lebih baik jika dibandingkan dengan K- Means dalam semua pengujian. Dalam studi kasus Problem Kerja Praktek Jurusan
Teknik Industri ITS, dari kombinasi hierarchical clustering dan K-means yang ada, kombinasi single linkage clustering dan K-means menghasilkan pengelompokan data
yang terbaik dibandingkan dengan algoritma hierarki yang lainnya. Rendy Handoyo pada tahun 2014 juga melakukan penelitian dengan judul “Perbandingan Algoritma
Clustering Menggunakan Algoritma Single Linkage Dan K - Means Pada Pengelompokan Dokumen
” yang mana hasil dari penelitian ini adalah Algoritma Single Linkage memilliki performansi yang lebih baik dibandingkan dengan algoritma
K-means. Jumlah cluster memberikan pengaruh terhadap nilai silhouette dan Purity.
Dan jumlah dokumen memberikan pengaruh terhadap nilai Silhouette Coefficient. Dan pada tahun 2007 Kohei Arai dan Ali Ridho Barakbah melakukan penelitian dengan
judul “Hierarchical K-means: an algorithm for centroids initialization for K-means” yang mana penggunaan algoritma hierarchical k-means menghasilkan waktu
komputasi yang lebih singkat dibandingkan dengan algoritma lain yang digunakan seperti Single Linkage, Centroid Linkage, Complete Linkage, Average Linkage, Fuzzy
c-means,dan K-means using random init. Berdasarkan latar belakang diatas, maka judul penelitian ini adalah
“ALGORITMA HIERARCHICAL K-MEANS UNTUK PENGELOMPOKAN DESA TERTINGGAL DI
PROVINSI SUMATERA UTARA”.
1.2. Rumusan Masalah
Salah satu masalah utama saat ini di setiap negara adalah kemiskinan. Beragam kebijakan pemerintah terkait dengan kemiskinan tentunya akan efektif jika kebijakan
tepat mengarah pada faktor-faktor yang mempengaruhi kemiskinan itu sendiri. Bagaimana mengelompokkan desa - desa tertinggal di provinsi Sumatera Utara
Universitas Sumatera Utara
sehingga mempermudah pemerintah memberi kebijakan untuk menanggulangi masalah kemiskinan agar lebih tepat sasaran ?
1.3. Tujuan Penelitian
Mengelompokkan desa-desa tertinggal yang ada di provinsi Sumatera Utara dengan menggunakan algoritma hierarchical k-means sehingga dapat membantu pemerintah
untuk memberi kebijakan untuk menanggulangi masalah kemiskinan di daerah tersebut.
1.4. Ruang Lingkup Penelitian
Ruang lingkup pada penelitian adalah : 1. Desa yang dikluster adalah desa-desa yang ada di provinsi Sumatera Utara.
2. Parameter yang digunakan variabel yang digunakan dalam penelitian ini hanya 9 variabel bertipe data kontinu dan pemilihan variabel diperoleh dari penelitian
Husna 2011 yaitu : 1. Jarak kantor desa terhadap kantor bupati
2. Rasio jumlah sarana pendidikan per 100 penduduk. 3. Rasio jumlah sarana kesehatan per 100 penduduk.
4. Rasio jumlah tenaga kesehatan per 100 penduduk. 5. Jumlah minimarket.
6. Persentase keluarga pertanian. 7. Persentase keluarga pengguna listrik.
8. Persentase keluarga yang tinggal dibantaran sungai 9. Rasio penderita gizi buruk per 1000 penduduk
1.5. Manfaat Penelitian
Manfaat dari penelitian ini adalah : 1. Menambah pengetahuan penulis dalam bidang data mining khusunya clustering.
2. Membantu pengambilan keputusan oleh pemerintah terkait masalah kemiskinan dalam suatu wilayahdesa.
Universitas Sumatera Utara
1.6. Metodologi Penelitian
Metodologi penelitian yang digunakan pada penelitian ini adalah sebagai berikut. 1. Studi Literatur
Pada tahap ini dilakukan studi kepustakaan yaitu proses mengumpulkan bahan referensi mengenai hierarchical clustering, k-means, data mining, dan daerah
tertinggal dari berbagai buku, jurnal, artikel, dan beberapa sumber referensi lainnya.
2. Analisis Pada tahap ini dilakukan analisis terhadap studi literatur untuk mendapatkan
pemahaman mengenai algoritma hierarchical clustering dan k-means untuk menyelesaikan masalah pengelompokan desa tertinggal di Provinsi Sumatera
Utara. 3. Perancangan
Pada tahap ini dilakukan perancangan arsitektur, pengumpulan data, pelatihan, dan perancangan antarmuka. Proses perancangan dilakukan berdasarkan hasil
analisis studi literatur yang telah didapatkan. 4. Implementasi
Pada tahap ini dilakukan pengkodean program menggunakan PHP, javascript, dan MySQL
5. Pengujian Pada tahap ini dilakukan pengujian aplikasi pengelompokan desa tertinggal yang
telah dibuat guna memastikan aplikasi telah berjalan sesuai dengan yang diharapkan.
6. Dokumentasi dan Penyusunan Laporan Pada tahap ini dilakukan dokumentasi hasil analisis dan implementasi algoritma
hierarchical clustering dan k-means untuk melakukan pengelompokan desa tertinggal.
Universitas Sumatera Utara
1.7. Sistematika Penulisan