BAB I
PENDAHULUAN
1.1. Latar Belakang
World Health Organization WHO menempatkan Diabetes Mellitus sebagai
salah satu penyakit yang paling banyak menyebabkan kematian penduduk dunia, pada penelitian J. W. Smith tahun 1988 menggunakan ADAP learning algorithm
untuk menciptakan sebuah software cerdas yang digunakan untuk memprediksi apakah sebuah sample terindikasi Diabetes Mellitus, penelitian ini mampu
memprediksi dengan tingkat ketelitian hingga 76. Sehingga penulis tertarik untuk melakukan penelitian mengenai penggunaan data mining algorithm dalam
pengelompokan cluster pada Diabetes Mellitus menggunakan K- Means Clustering dan K-Nearest Neighbor.
K-Means Clustering dan K-Nearest Neighbor adalah algoritma dalam data
mining yang tergolong dalam unsupervised algorithm yang digunakan dalam proses
pengelompokan cluster sebuah dataset tanpa label, metoda ini dapat digunakan pada dataset Diabetes Mellitus dikarenakan proses pengelompokan dapat dilakukan
berdasarkan ciri-ciri khusus pada masing-masing kelompok cluster. K-Means Clustering
dan K-Nearest Neighbor memiliki beberapa persamaan dalam cara pengelompokan yaitu sama-sama menghitung perbedaan dan persamaan pada
masing- masing sample, perbedaan algoritma ini terdapat pada penggunaan Euclidean distance
pada K-Means Clustering untuk menghitung perbedaan masing- masing sample sedangkan penggunaan Gaussian kernel pada K-Nearest Neighbor
untuk menghitung persamaan pada masing-masing sample. Penulis merasa tertarik untuk memahami pengaruh perbedaan ini, apakah Diabetes Mellitus dapat
dikelompokkan dengan cara menghitung perbedaan masing-masing sample menggunakan K-Means Clustering atau dapat dikelompokkan dengan cara
menghitung persamaan masing-masing sample menggunakan K-Nearest Neighbor.
Universitas Sumatera Utara
Diharapkan berdasarkan penelitian ini penulis berharap dapat memberikan rekomendasi algoritma yang lebih ideal yang dapat digunakan dalam pengelompokan
Diabetes Mellitus.
1.2. Rumusan Masalah