Latar Belakang Analisis Perbandingan Proses Cluster Menggunakan K- Means Clustering dan K-Nearest Neighbor pada Penyakit Diabetes Mellitus

BAB I PENDAHULUAN

1.1. Latar Belakang

World Health Organization WHO menempatkan Diabetes Mellitus sebagai salah satu penyakit yang paling banyak menyebabkan kematian penduduk dunia, pada penelitian J. W. Smith tahun 1988 menggunakan ADAP learning algorithm untuk menciptakan sebuah software cerdas yang digunakan untuk memprediksi apakah sebuah sample terindikasi Diabetes Mellitus, penelitian ini mampu memprediksi dengan tingkat ketelitian hingga 76. Sehingga penulis tertarik untuk melakukan penelitian mengenai penggunaan data mining algorithm dalam pengelompokan cluster pada Diabetes Mellitus menggunakan K- Means Clustering dan K-Nearest Neighbor. K-Means Clustering dan K-Nearest Neighbor adalah algoritma dalam data mining yang tergolong dalam unsupervised algorithm yang digunakan dalam proses pengelompokan cluster sebuah dataset tanpa label, metoda ini dapat digunakan pada dataset Diabetes Mellitus dikarenakan proses pengelompokan dapat dilakukan berdasarkan ciri-ciri khusus pada masing-masing kelompok cluster. K-Means Clustering dan K-Nearest Neighbor memiliki beberapa persamaan dalam cara pengelompokan yaitu sama-sama menghitung perbedaan dan persamaan pada masing- masing sample, perbedaan algoritma ini terdapat pada penggunaan Euclidean distance pada K-Means Clustering untuk menghitung perbedaan masing- masing sample sedangkan penggunaan Gaussian kernel pada K-Nearest Neighbor untuk menghitung persamaan pada masing-masing sample. Penulis merasa tertarik untuk memahami pengaruh perbedaan ini, apakah Diabetes Mellitus dapat dikelompokkan dengan cara menghitung perbedaan masing-masing sample menggunakan K-Means Clustering atau dapat dikelompokkan dengan cara menghitung persamaan masing-masing sample menggunakan K-Nearest Neighbor. Universitas Sumatera Utara Diharapkan berdasarkan penelitian ini penulis berharap dapat memberikan rekomendasi algoritma yang lebih ideal yang dapat digunakan dalam pengelompokan Diabetes Mellitus.

1.2. Rumusan Masalah