Analisis Hasil Penambangan Data

Gambar 5.5 Screenshot KNN dengan 10-fold cross validation dengan menggunakan program weka. Gambar 5.6 Screenshot KNN dengan 15-fold cross validation dengan menggunakan sistem Gambar 5.7 Screenshot Naive bayes dengan 15-fold cross validation dengan menggunakan program weka Gambar 5.8 ScreenshotKNN dengan 20-fold cross validation dengan menggunakan sistem Gambar 5.9 Screenshot KNN dengan 20-fold cross validation dengan menggunakan program weka Gambar 5.10 Screenshot KNN dengan 3-fold cross validation dengan menggunakan sistem Gambar 5.11 Screenshot Naive bayes dengan 3-fold cross validation dengan menggunakan program weka Gambar 5.12 Screenshot Naive bayes dengan 5-fold cross validation dengan menggunakan sistem Gambar 5.13 Screenshot Naive bayes dengan 5-fold cross validation dengan menggunakan program weka Gambar 5.14 Screenshot Naive bayes dengan 10-fold cross validation dengan menggunakan sistem Gambar 5.15 Screenshot Naive bayes dengan 10-fold cross validation dengan menggunakan program weka. Gambar 5.16 Screenshot KNN dengan 15-fold cross validation dengan menggunakan sistem Gambar 5.18 Screenshot Naive bayes dengan 15-fold cross validation dengan menggunakan program weka. Gambar 5.19 Screenshot Naive bayes dengan 20-fold cross validation dengan menggunakan sistem Gambar 5.20 Screenshot Naive bayes dengan 20-fold cross validation dengan menggunakan program weka. Setelah dilakukan percobaan dengan sistem dan weka menggunakan 3, 5, 10, 15 dan 20 fold cross validation maka dapat dihasilkan tabel 5.1. Tabel 5.1 Tabel akurasi sistem dan weka Algoritma Fold Akurasi Sistem Waktu Proses Akurasi Weka KNN 3-fold 95.5 324 ms 95.4 5-fold 96.2 340 ms 95.7 10-fold 95.8 385 ms 95.7 15-fold 95.6 391 ms 95.6 20-fold 95.8 409 ms 95.3 Naive Bayes 3-fold 97.5 58 ms 96.1 5-fold 97.5 77 ms 96.3 10-fold 97.7 142 ms 96.3 15-fold 97.5 192 ms 96.1 20-fold 97.5 265 ms 96.1 Dari tabel diatas dapat diketahui bahwa jumlah fold dapat mempengaruhi hasil akurasi, dan dari tabel diatas hasil akurasi sistem dapat terbukti sama dengan weka dengan tingkat kecocokan kurang lebih 99.

5.2 Analisa Hasil

Pada subbab ini akan dibahas tiga hal yaitu 1 analisa akurasi, dan 2 analisa waktu proses, dan 3 analisa dengan penelitian terdahulu.

5.2.1 Analisa Akurasi

Pada penelitian ini evaluasi klasifikasi dilakukan sebanyak lima kali, yaitu dengan 1 3-fold cross validation, 2 5-fold cross validation, 3 10-fold cross validation, 4 15-fold cross validation, dan 5 20-fold cross validation dengan menggunakan data wisconsin diagnosis breast cancer. Pada percobaan pertama penulis menguji akurasi perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 3-fold cross validation, pada k-nearest neighbor akurasi yang dihasilkan adalah sebesar 95.5, dan pada naïve bayes akurasi yang dihasilkan adalah sebesar 97.5. Maka pada percobaan dengan menggunakan 3-fold cross validation naïve bayes terbukti akurasinya lebih tinggi bila dibandingkan k-nearest neighbor. Pada percobaan kedua penulis menguji akurasi perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 5-fold cross validation, pada k-nearest neighbor akurasi yang dihasilkan adalah sebesar 96.2, dan pada naïve bayes akurasi yang dihasilkan adalah sebesar 97.5. Maka pada percobaan dengan menggunakan 5-fold cross validation naïve bayes terbukti akurasinya lebih tinggi bila dibandingkan k-nearest neighbor. Pada percobaan ketiga penulis menguji akurasi perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 10-fold cross validation, pada k-nearest neighbor akurasi yang dihasilkan adalah sebesar 95.8, dan pada naïve bayes akurasi yang dihasilkan adalah sebesar 97.7. Maka pada percobaan dengan menggunakan 10-fold cross validation naïve bayes terbukti akurasinya lebih tinggi bila dibandingkan k-nearest neighbor. Pada percobaan keempat penulis menguji perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 15-fold cross validation, pada k- nearest neighbor akurasi yang dihasilkan adalah sebesar 95.6, dan pada naïve bayes akurasi yang dihasilkan adalah sebesar 97.5. Maka pada percobaan dengan menggunakan 15-fold cross validation naïve bayes terbukti akurasinya lebih tinggi bila dibandingkan k-nearest neighbor. Pada percobaan kelima penulis menguji perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 20-fold cross validation, pada k- nearest neighbor akurasi yang dihasilkan adalah sebesar 95.8, dan pada naïve bayes akurasi yang dihasilkan adalah sebesar 97.5. Maka pada percobaan dengan menggunakan 20-fold cross validation naïve bayes terbukti akurasinya lebih tinggi bila dibandingkan k-nearest neighbor. Maka dari kelima percobaan yang telah dilakukan penulis dapat disimpulkan bahwa akurasi perhitungan klasifikasi naïve bayes lebih tinggi bila dibandingkan klasifikasi k-nearest neighbor untuk studi data wisconsin diagnosis breast cancer. Hal ini dapat dikarenakan oleh data wisconsin diagnosis breast cancer memiliki atribut yang beberapa tidak saling berhubungan, sehingga pada proses perhitungan algoritma naïve bayes lebih unggul karena perhitungan klasifikasi naïve bayes bersifat independen sedangan k-nearest neighbor bersifat dependen.

5.2.2 Analisa Waktu Proses

Pada penelitian ini evaluasi waktu proses dilakukan sebanyak lima kali, yaitu dengan 1 3-fold cross validation, 2 5-fold cross validation, 3 10-fold cross validation, 4 15-fold cross validation, dan 5 20-fold cross validation dengan menggunakan data wisconsin diagnosis breast cancer. Pada percobaan pertama penulis menguji akurasi perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 3-fold cross validation, pada k-nearest neighbor waktu proses yang diperlukan untuk melakukan klasifikasi ini adalah 324 ms, dan pada naïve bayes waktu proses yang diperlukan adalah 58 ms. Maka pada percobaan dengan menggunakan 3-fold cross validation naïve bayes terbukti bahwa waktu prosesnya lebih cepat bila dibandingkan k-nearest neighbor. Pada percobaan kedua penulis menguji akurasi perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 5-fold cross validation, pada k-nearest neighbor waktu proses yang diperlukan untuk melakukan klasifikasi ini adalah 340 ms, dan pada naïve bayes waktu proses yang diperlukan adalah 77 ms. Maka pada percobaan dengan menggunakan 5-fold cross validation naïve bayes terbukti bahwa waktu prosesnya lebih cepat bila dibandingkan k-nearest neighbor. Pada percobaan ketiga penulis menguji akurasi perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 10-fold cross validation, pada k-nearest neighbor waktu proses yang diperlukan untuk melakukan klasifikasi ini adalah 385 ms, dan pada naïve bayes waktu proses yang diperlukan adalah 142 ms. Maka pada percobaan dengan menggunakan 10-fold cross validation naïve bayes terbukti bahwa waktu prosesnya lebih cepat bila dibandingkan k-nearest neighbor. Pada percobaan keempat penulis menguji akurasi perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 15-fold cross validation, pada k-nearest neighbor waktu proses yang diperlukan untuk melakukan klasifikasi ini adalah 391 ms, dan pada naïve bayes waktu proses yang diperlukan adalah 192 ms. Maka pada percobaan dengan menggunakan 15-fold cross validation naïve bayes terbukti bahwa waktu prosesnya lebih cepat bila dibandingkan k-nearest neighbor. Pada percobaan kelima penulis menguji akurasi perhitungan klasifikasi naïve bayes dan k-nearest neighbor dengan menggunakan evaluasi 20-fold cross validation, pada k-nearest neighbor waktu proses yang diperlukan untuk melakukan klasifikasi ini adalah 409 ms, dan pada naïve bayes waktu proses yang diperlukan adalah 265 ms. Maka pada percobaan dengan menggunakan 20-fold cross validation naïve bayes terbukti bahwa waktu prosesnya lebih cepat bila dibandingkan k-nearest neighbor. Maka dari kelima percobaan yang telah dilakukan penulis dapat disimpulkan bahwa kecepatan perhitungan klasifikasi naïve bayes lebih tinggi bila dibandingkan klasifikasi k-nearest neighbor untuk studi data wisconsin diagnosis breast cancer. Hal ini dikarenakan oleh kompleksitas algoritma KNN lebih kompleks bila dibandingkan Naïve Bayes. Berikut merupakan tabel operasi dasar dari kedua algoritma dengan N adalah jumlah data keseluruhan. Tabel 5.2 Tabel perhitungan jumlah operasi dasar algoritma K-Nearest Neighbor No. Operasi Dasar KNN Jumlah iterasi 1. Penghitungan tingkat kemiripan dengan euclidean distance N kali 2 Pembandingan tingkat kemiripan untuk menentukan jarak terdekat N kali 3. Mengambil nilai jarak terdekat untuk menjadi nilai klasifikasi 1 kali Total 2N + 1 kali Tabel 5.3 Tabel perhitungan jumlah operasi dasar algoritma Naïve Bayes No. Operasi Dasar NB Naïve Bayes Jumlah iterasi 1. Menghitung probabilitas kelas yang dibandingkan 1 kali 2 Menghitung probabilitas kelas pembanding 1 kali 3. Menghitung likelihood dengan mengkalikan probabilitas kelas yang dibandingkan dengan nilai kelas pembanding 1 kali 4. Menormalisasikan ke dalam bentuk probabilitas 1 kali Total 4 kali Dari tabel diatas dapat dilihat dan diambil kesimpulan bahwa operasi dasar algoritma KNN lebih kompleks jika dibandingkan dengan algoritma Naïve Bayes dan berdampak pada waktu proses kedua algoritma, sehingga menyebabkan algorima KNN membutuhkan waktu proses lebih lama dibandingkan algoritma K-Nearest Neighbor.

5.3.3 Analisa dengan Penelitian Terdahulu yang Relevan

Penelitian perbandingan algoritma antara k-nearest neighbor sebelumnya telah diteliti dengan data yang berbeda – beda dan menghasilkan hasil yang berbeda – beda juga. Beberapa antara lain pada penelitian oleh Riyan Eko Putri dkk 2014 dalam jurnal berjudul „Perbandingan Metode Klasifikasi Naïve Bayes dan K-Nearest Neighbor pada Analisis Data Status Kerja di Kabupaten Demak tahun 2012‟ berdasarkan hasil perhitungan dengan menggunakan data status kerja di Kabupaten Demak tahun 2012 ditemukan bahwa akurasi K-Nearest Neighbor lebih unggul bila dibandingkan Naïve Bayes dengan akurasi K-Nearest Neighbor sebesar 96 dan Naïve Bayes sebesar 94. Raviya dan Gajjar 2013 melakukan perbandingan tiga metode klasifikasi yaitu Decision Tree, Naïve Bayes dan KNN dan menemukan bahwa hasil akurasi metode Decision Tree dan KNN memperoleh nilai yang sama yaitu 63.7 sedangkan Naïve Bayes memperoleh nilai 37.1. Dedy Santoso dkk 2013 melakukan penelitian membandingkan kinerja metode Naïve Bayes, K-Nearest Neighbor dan metode gabungan K-Means dan LVQ dalam pengkategorian buku komputer bahasa Indonesia berdasarkan judul dan sinopsis. Pada penelitian ini ditemukan bahwa hasil akurasi Naïve Bayes lebih unggul dibandingkan KNN dengan akurasi untuk Naïve Bayes sebesar 98 dan untuk KNN sebesar 96. Cahyo Darujati 2010 dalam jurnalnya berjudul Perbandingan Klasifikasi Dokumen Teks menggunakan Metode Naïve Bayes dengan K-Nearest Neigtbor menemukan bahwa Naïve Bayes kinerjanya lebih baik dari K-Nearest Neighbor dalam pengklasifikasian dokumen teks. Dari penelitian yang dilakukan sebelumnya dapat disimpulkan bahwa perbandingan algoritma KNN dengan Naïve Bayes dapat menghasilkan hasil yang berbeda – beda tergantung masukan yang diberikan dan pada penelitian ini penulis melakukan penelitian dengan masukan data wisconsin diagnosis breast cancer dan menemukan bahwa untuk data tersebut terbukti bahwa Naïve Bayes lebih baik dibandingkan KNN.

5.3 Kelebihan dan Kekurangan Sistem

Pada subbab ini penulis akan membahas tentang kelebihan dan kekurangan dari sistem yang dibangun oleh penulis.

5.3.1 Kelebihan Sistem

Kelebihan dari sistem yang dibangun adalah sebagai berikut: 1. Pengguna dapat memasukkan jumlah fold secara manual. 2. Bagi pengguna yang masih awam sistem yang dibangun sangat mudah untuk digunakan. 3. Sistem yang dibangun tidak menggunakan database atau media penyimpanan lain. Data yang dimasukkandi-input oleh pengguna disimpan dalam memori RAM, sehingga sistem akan bekerja lebih cepat dan lebih hemat memori. 4. Sistem mudah untuk diperbarui atau di update. 5. Menggunakan java sehingga dapat digunakan dengan mudah.

5.3.2 Kekurangan Sistem

Kekurangan dari sistem yang dibangun adalah sebagai berikut: 1.Hanya dapat mengklasifikasi data dengan algoritma KNN dan Naive Bayes, 2.Hanya dapat memproses data wisconsin breast cancer.