Gambar 5.5 Screenshot KNN dengan 10-fold cross validation dengan menggunakan program weka.
Gambar 5.6 Screenshot KNN dengan 15-fold cross validation dengan menggunakan sistem
Gambar 5.7 Screenshot Naive bayes dengan 15-fold cross validation dengan menggunakan program weka
Gambar 5.8 ScreenshotKNN dengan 20-fold cross validation dengan menggunakan sistem
Gambar 5.9 Screenshot KNN dengan 20-fold cross validation dengan menggunakan program weka
Gambar 5.10 Screenshot KNN dengan 3-fold cross validation dengan menggunakan sistem
Gambar 5.11 Screenshot Naive bayes dengan 3-fold cross validation dengan menggunakan program weka
Gambar 5.12 Screenshot Naive bayes dengan 5-fold cross validation dengan menggunakan sistem
Gambar 5.13 Screenshot Naive bayes dengan 5-fold cross validation dengan menggunakan program weka
Gambar 5.14 Screenshot Naive bayes dengan 10-fold cross validation dengan menggunakan sistem
Gambar 5.15 Screenshot Naive bayes dengan 10-fold cross validation dengan menggunakan program weka.
Gambar 5.16 Screenshot KNN dengan 15-fold cross validation dengan menggunakan sistem
Gambar 5.18 Screenshot Naive bayes dengan 15-fold cross validation dengan menggunakan program weka.
Gambar 5.19 Screenshot Naive bayes dengan 20-fold cross validation dengan menggunakan sistem
Gambar 5.20 Screenshot Naive bayes dengan 20-fold cross validation dengan menggunakan program weka.
Setelah dilakukan percobaan dengan sistem dan weka menggunakan 3, 5, 10, 15 dan 20 fold cross validation maka dapat dihasilkan tabel 5.1.
Tabel 5.1 Tabel akurasi sistem dan weka Algoritma
Fold Akurasi Sistem
Waktu Proses Akurasi Weka
KNN 3-fold
95.5 324 ms
95.4 5-fold
96.2 340 ms
95.7 10-fold
95.8 385 ms
95.7 15-fold 95.6
391 ms 95.6
20-fold 95.8
409 ms 95.3
Naive Bayes
3-fold 97.5
58 ms 96.1
5-fold 97.5
77 ms 96.3
10-fold 97.7
142 ms 96.3
15-fold 97.5 192 ms
96.1 20-fold
97.5 265 ms
96.1
Dari tabel diatas dapat diketahui bahwa jumlah fold dapat mempengaruhi hasil akurasi, dan dari tabel diatas hasil akurasi sistem dapat terbukti sama dengan weka
dengan tingkat kecocokan kurang lebih 99.
5.2 Analisa Hasil
Pada subbab ini akan dibahas tiga hal yaitu 1 analisa akurasi, dan 2 analisa waktu proses, dan 3 analisa dengan penelitian terdahulu.
5.2.1 Analisa Akurasi
Pada penelitian ini evaluasi klasifikasi dilakukan sebanyak lima kali, yaitu dengan 1 3-fold cross validation, 2 5-fold cross validation, 3 10-fold cross
validation, 4 15-fold cross validation, dan 5 20-fold cross validation dengan menggunakan data wisconsin diagnosis breast cancer.
Pada percobaan pertama penulis menguji akurasi perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 3-fold cross validation,
pada k-nearest neighbor akurasi yang dihasilkan adalah sebesar 95.5, dan pada naïve bayes akurasi yang dihasilkan adalah sebesar 97.5. Maka pada percobaan dengan
menggunakan 3-fold cross validation naïve bayes terbukti akurasinya lebih tinggi bila dibandingkan k-nearest neighbor.
Pada percobaan kedua penulis menguji akurasi perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 5-fold cross validation,
pada k-nearest neighbor akurasi yang dihasilkan adalah sebesar 96.2, dan pada naïve bayes akurasi yang dihasilkan adalah sebesar 97.5. Maka pada percobaan dengan
menggunakan 5-fold cross validation naïve bayes terbukti akurasinya lebih tinggi bila dibandingkan k-nearest neighbor.
Pada percobaan ketiga penulis menguji akurasi perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 10-fold cross validation,
pada k-nearest neighbor akurasi yang dihasilkan adalah sebesar 95.8, dan pada naïve bayes akurasi yang dihasilkan adalah sebesar 97.7. Maka pada percobaan dengan
menggunakan 10-fold cross validation naïve bayes terbukti akurasinya lebih tinggi bila dibandingkan k-nearest neighbor.
Pada percobaan keempat penulis menguji perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 15-fold cross validation, pada k-
nearest neighbor akurasi yang dihasilkan adalah sebesar 95.6, dan pada naïve bayes akurasi yang dihasilkan adalah sebesar 97.5. Maka pada percobaan dengan
menggunakan 15-fold cross validation naïve bayes terbukti akurasinya lebih tinggi bila dibandingkan k-nearest neighbor.
Pada percobaan kelima penulis menguji perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 20-fold cross validation, pada k-
nearest neighbor akurasi yang dihasilkan adalah sebesar 95.8, dan pada naïve bayes akurasi yang dihasilkan adalah sebesar 97.5. Maka pada percobaan dengan
menggunakan 20-fold cross validation naïve bayes terbukti akurasinya lebih tinggi bila dibandingkan k-nearest neighbor.
Maka dari kelima percobaan yang telah dilakukan penulis dapat disimpulkan bahwa akurasi perhitungan klasifikasi naïve bayes lebih tinggi bila dibandingkan
klasifikasi k-nearest neighbor untuk studi data wisconsin diagnosis breast cancer. Hal ini dapat dikarenakan oleh data wisconsin diagnosis breast cancer memiliki
atribut yang beberapa tidak saling berhubungan, sehingga pada proses perhitungan algoritma naïve bayes lebih unggul karena perhitungan klasifikasi naïve bayes bersifat
independen sedangan k-nearest neighbor bersifat dependen.
5.2.2 Analisa Waktu Proses
Pada penelitian ini evaluasi waktu proses dilakukan sebanyak lima kali, yaitu dengan 1 3-fold cross validation, 2 5-fold cross validation, 3 10-fold cross
validation, 4 15-fold cross validation, dan 5 20-fold cross validation dengan menggunakan data wisconsin diagnosis breast cancer.
Pada percobaan pertama penulis menguji akurasi perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 3-fold cross validation,
pada k-nearest neighbor waktu proses yang diperlukan untuk melakukan klasifikasi ini adalah 324 ms, dan pada naïve bayes waktu proses yang diperlukan adalah 58 ms. Maka
pada percobaan dengan menggunakan 3-fold cross validation naïve bayes terbukti bahwa waktu prosesnya lebih cepat bila dibandingkan k-nearest neighbor.
Pada percobaan kedua penulis menguji akurasi perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 5-fold cross validation,
pada k-nearest neighbor waktu proses yang diperlukan untuk melakukan klasifikasi ini adalah 340 ms, dan pada naïve bayes waktu proses yang diperlukan adalah 77 ms. Maka
pada percobaan dengan menggunakan 5-fold cross validation naïve bayes terbukti bahwa waktu prosesnya lebih cepat bila dibandingkan k-nearest neighbor.
Pada percobaan ketiga penulis menguji akurasi perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 10-fold cross validation,
pada k-nearest neighbor waktu proses yang diperlukan untuk melakukan klasifikasi ini adalah 385 ms, dan pada naïve bayes waktu proses yang diperlukan adalah 142 ms.
Maka pada percobaan dengan menggunakan 10-fold cross validation naïve bayes terbukti bahwa waktu prosesnya lebih cepat bila dibandingkan k-nearest neighbor.
Pada percobaan keempat penulis menguji akurasi perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 15-fold cross validation,
pada k-nearest neighbor waktu proses yang diperlukan untuk melakukan klasifikasi ini adalah 391 ms, dan pada naïve bayes waktu proses yang diperlukan adalah 192 ms.
Maka pada percobaan dengan menggunakan 15-fold cross validation naïve bayes terbukti bahwa waktu prosesnya lebih cepat bila dibandingkan k-nearest neighbor.
Pada percobaan kelima penulis menguji akurasi perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 20-fold cross validation,
pada k-nearest neighbor waktu proses yang diperlukan untuk melakukan klasifikasi ini adalah 409 ms, dan pada naïve bayes waktu proses yang diperlukan adalah 265 ms.
Maka pada percobaan dengan menggunakan 20-fold cross validation naïve bayes terbukti bahwa waktu prosesnya lebih cepat bila dibandingkan k-nearest neighbor.
Maka dari kelima percobaan yang telah dilakukan penulis dapat disimpulkan bahwa kecepatan perhitungan klasifikasi naïve bayes lebih tinggi bila dibandingkan
klasifikasi k-nearest neighbor untuk studi data wisconsin diagnosis breast cancer. Hal ini dikarenakan oleh kompleksitas algoritma KNN lebih kompleks bila
dibandingkan Naïve Bayes. Berikut merupakan tabel operasi dasar dari kedua algoritma dengan N adalah jumlah data keseluruhan.
Tabel 5.2 Tabel perhitungan jumlah operasi dasar algoritma K-Nearest Neighbor No.
Operasi Dasar KNN Jumlah iterasi
1. Penghitungan tingkat kemiripan dengan euclidean distance
N kali 2
Pembandingan tingkat kemiripan untuk menentukan jarak terdekat
N kali
3. Mengambil nilai jarak terdekat untuk menjadi nilai
klasifikasi 1 kali
Total 2N + 1 kali
Tabel 5.3 Tabel perhitungan jumlah operasi dasar algoritma Naïve Bayes No.
Operasi Dasar NB Naïve Bayes Jumlah iterasi
1. Menghitung probabilitas kelas yang dibandingkan
1 kali 2
Menghitung probabilitas kelas pembanding 1 kali
3. Menghitung likelihood dengan mengkalikan probabilitas
kelas yang dibandingkan dengan nilai kelas pembanding 1 kali
4. Menormalisasikan ke dalam bentuk probabilitas
1 kali Total
4 kali
Dari tabel diatas dapat dilihat dan diambil kesimpulan bahwa operasi dasar algoritma KNN lebih kompleks jika dibandingkan dengan algoritma Naïve Bayes dan
berdampak pada waktu proses kedua algoritma, sehingga menyebabkan algorima KNN membutuhkan waktu proses lebih lama dibandingkan algoritma K-Nearest Neighbor.
5.3.3 Analisa dengan Penelitian Terdahulu yang Relevan
Penelitian perbandingan algoritma antara k-nearest neighbor sebelumnya telah diteliti dengan data yang berbeda
– beda dan menghasilkan hasil yang berbeda – beda juga.
Beberapa antara lain pada penelitian oleh Riyan Eko Putri dkk 2014 dalam jurnal berjudul „Perbandingan Metode Klasifikasi Naïve Bayes dan K-Nearest Neighbor
pada Analisis Data Status Kerja di Kabupaten Demak tahun 2012‟ berdasarkan hasil
perhitungan dengan menggunakan data status kerja di Kabupaten Demak tahun 2012
ditemukan bahwa akurasi K-Nearest Neighbor lebih unggul bila dibandingkan Naïve Bayes dengan akurasi K-Nearest Neighbor sebesar 96 dan Naïve Bayes sebesar 94.
Raviya dan Gajjar 2013 melakukan perbandingan tiga metode klasifikasi yaitu Decision Tree, Naïve Bayes dan KNN dan menemukan bahwa hasil akurasi metode
Decision Tree dan KNN memperoleh nilai yang sama yaitu 63.7 sedangkan Naïve Bayes memperoleh nilai 37.1.
Dedy Santoso dkk 2013 melakukan penelitian membandingkan kinerja metode Naïve Bayes, K-Nearest Neighbor dan metode gabungan K-Means dan LVQ dalam
pengkategorian buku komputer bahasa Indonesia berdasarkan judul dan sinopsis. Pada penelitian ini ditemukan bahwa hasil akurasi Naïve Bayes lebih unggul dibandingkan
KNN dengan akurasi untuk Naïve Bayes sebesar 98 dan untuk KNN sebesar 96. Cahyo Darujati 2010 dalam jurnalnya berjudul Perbandingan Klasifikasi
Dokumen Teks menggunakan Metode Naïve Bayes dengan K-Nearest Neigtbor menemukan bahwa Naïve Bayes kinerjanya lebih baik dari K-Nearest Neighbor dalam
pengklasifikasian dokumen teks. Dari penelitian yang dilakukan sebelumnya dapat disimpulkan bahwa
perbandingan algoritma KNN dengan Naïve Bayes dapat menghasilkan hasil yang berbeda
– beda tergantung masukan yang diberikan dan pada penelitian ini penulis melakukan penelitian dengan masukan data wisconsin diagnosis breast cancer dan
menemukan bahwa untuk data tersebut terbukti bahwa Naïve Bayes lebih baik dibandingkan KNN.
5.3 Kelebihan dan Kekurangan Sistem
Pada subbab ini penulis akan membahas tentang kelebihan dan kekurangan dari sistem yang dibangun oleh penulis.
5.3.1 Kelebihan Sistem
Kelebihan dari sistem yang dibangun adalah sebagai berikut: 1. Pengguna dapat memasukkan jumlah fold secara manual.
2. Bagi pengguna yang masih awam sistem yang dibangun sangat mudah untuk digunakan.
3. Sistem yang dibangun tidak menggunakan database atau media penyimpanan lain. Data yang dimasukkandi-input oleh pengguna disimpan dalam memori RAM,
sehingga sistem akan bekerja lebih cepat dan lebih hemat memori. 4. Sistem mudah untuk diperbarui atau di update.
5. Menggunakan java sehingga dapat digunakan dengan mudah.
5.3.2 Kekurangan Sistem
Kekurangan dari sistem yang dibangun adalah sebagai berikut: 1.Hanya dapat mengklasifikasi data dengan algoritma KNN dan Naive Bayes,
2.Hanya dapat memproses data wisconsin breast cancer.