Diharapkan berdasarkan penelitian ini penulis berharap dapat memberikan rekomendasi algoritma yang lebih ideal yang dapat digunakan dalam pengelompokan
Diabetes Mellitus.
1.2. Rumusan Masalah
Rumusan masalah dalam penulisan tugas akhir ini adalah bagaimana perbandingan kinerja dari proses clustering menggunakan algoritma K-Means Clustering dan
K- Nearest Neighbor pada Penyakit Diabetes Mellitus.
1.3.Batasan Masalah
Batasan masalah dalam penelitian ini adalah: 1.
Perbandingan kinerja algoritma hanyalah antara algoritma K-Means Clustering dan K-Nearest Neighbor .
2. Penelitian ini hanya membandingkan hanya membandingkan running time
dan Akurasi. 3.
Penelitian ini hanya berfokus pada proses pengelompokan clustering berdasarkan dataset yang telah tersedia.
4 . Penelitian ini menggunakan dataset yang telah tersedia dalam UCI
5. Machine Learning Repository, yaitu: PIMA Indians Diabetes Dataset atau dataset
yang didapat dari National Institute of Diabetes and Digestive and Kidney Diseases.
6. Penelitian ini menggunakan dataset yang telah mengalami preprocessing
terlebih dahulu yang pertama kali digunakan oleh Smith,~J.~W., Everhart,~J.~E., Dickson,~W.~C., Knowler,~W.~C., \ Johannes,~R.~S pada tahun 1988.
6. XAMPP 1.7.1 dimana terdapat Apache sebagai web server, PHP sebagai bahasa pemrograman yang digunakan, dan MySQL sebagai software untuk
server database .
1.4.Tujuan Penelitian
Tujuan penelitian ini adalah memahami perbandingan kinerja algoritma K-Means Clustering
dan K-Nearest
Neighbor dalam
melakukan pengelompokan
clustering pada penyakit Diabetes Melitus.
Universitas Sumatera Utara
1.5. Manfaat Penelitian
Manfaat penelitian ini adalah sebagai alternatif pemilihan algoritma yang paling ideal dalam melakukan pengelompokan clustering pada penyakit Diabetes Melitus.
1.6. Metodelogi Penelitian
Metode penelitian yang digunakan dalam penulisan tugas akhir ini adalah sebagai berikut:
1. Studi Literatur Metode ini dilaksanakan dengan melakukan studi kepustakaan melalui membaca
buku-buku, skripsi, dan jurnal yang dapat mendukung penulisan Tugas Akhir yang relevan mengenai K-Means Clustering dan K-Nearest Neighbor.
2. Analisis Analisis masalah yang dimulai dengan tahap mengindentifikasi masalah, dilakukan
pengumpulan data, memahami cara kerja algoritma, menganalisis dan membaut laporan tentang hasil analisis algoritma, menggambarkan sistem dengan
menggunakan flowchart. 3. Perancangan
Pada tahap ini dilakukan perancangan data mining untuk clustering data. Termasuk didalamnya yaitu perancangan flowchart, dan perancangan sistem.
4. Implementasi Metode ini dilaksanakan dengan mengimplementasi rancangan sistem yang telah
dibuat pada impelementasi menggunakan PHP sebagai bahasa pemrograman yang digunakan, dan MySQL sebagai software untuk server database.
5. Pengujian Setelah proses pengkodean selesai maka akan dilakukan proses pengujian terhadap
program yang dihasilkan untuk mengetahui apakah program sudah berjalan dengan benar dan sesuai dengan perancangan yang dilakukan.
6. Penyusunan laporan dan kesimpulan akhir Membuat laporan hasil analisa dan perancangan ke dalam format penulisan tugas
akhir yang disertai dengan kesimpulan.
Universitas Sumatera Utara
1.7. Sistematika Penulisan