Latar Belakang Masalah PENDAHULUAN
Cahyo Darujati 2010 dalam jurnalnya berjudul Perbandingan Klasifikasi Dokumen Teks menggunakan Metode Naïve Bayes dengan K-Nearest Neigtbor
menemukan bahwa Naïve Bayes kinerjanya lebih baik dari K-Nearest Neighbordalam pengklasifikasian dokumen teks.
Meskipun penelitian tentang perbandingan algoritma pernah dilakukan, penelitian tersebut masih layak dilakukan. Masih banyak algoritma yang perlu
dibandingkan untuk mengetahui algoritma mana yang paling akurat. Oleh karena itu, penulis akan membandingkan algoritma yang berbeda dari
penelitian-penelitian sebelumnya yaitu 1 Naive Bayes dan 2 K-nearest Neighbor.
2.2 Kajian Teori 2.2.1 Penambangan Data
Penambangan Data adalah proses pengumpulan informasi penting dari sejumlah data besar yang tersimpan di basis data, gudang data, atau tempat penyimpanan lainnya
Han Kamber, 2006. Penambangan data merupakan proses yang tidak dapat dipisahkan dengan Knowledge Discovery in Database KDD, karena penambangan
data adalah salah satu tahap dalam proses KDD seperti yang ditunjukkan oleh gambar 2.1.
Gambar 2.1 Tahapan Dalam KDD Han Kamber, 2006
Menurut Han dan Kamber 2006, tahapan-tahapan dalam proses KDD adalah sebagai berikut:
1. Pembersihan data Data Cleaning
Pembersihan data merupakan proses untuk menghilangkan data yang mengandung noise, atau data yang tidak konsisten.
2. Integritas data Data Integration Pada tahap ini akan dilakukan penggabungan data yang berasal dari berbagai
sumber. 3. Seleksi data Data Selection
Pada tahap ini akan dilakukan pemilihan data yang relevan dari database. 4. Transformasi data Data Transformation
Pada tahap ini data akan ditransformasikan kedalam format yang sesuai untuk diproses dalam penambangan data.
5. Penambangan data Data Mining Penambangan data merupakan proses penting dimana metode akan
disistemkan untuk mengekstrak pola data. 6. Evaluasi pola Pattern Evaluation
Pada tahap ini, polamodel yang dihasilkan dari teknik data mining akan mengidentifikasi pola-pola yang menarik berdasarkan ukuran tertentu
7. Presentasi pengetahuan Knowledge Presentation Pada tahap ini akan dilakukan teknik visualisasi yang digunakan untuk
menampilkan pengetahuan hasil proses mining kepada pengguna.