Latar Belakang Masalah PENDAHULUAN
                                                                                Cahyo  Darujati  2010  dalam  jurnalnya  berjudul  Perbandingan  Klasifikasi Dokumen  Teks  menggunakan  Metode  Naïve  Bayes  dengan  K-Nearest  Neigtbor
menemukan  bahwa  Naïve  Bayes  kinerjanya  lebih  baik  dari  K-Nearest  Neighbordalam pengklasifikasian dokumen teks.
Meskipun  penelitian  tentang  perbandingan  algoritma  pernah  dilakukan, penelitian  tersebut  masih  layak  dilakukan.  Masih  banyak  algoritma  yang  perlu
dibandingkan untuk mengetahui algoritma mana yang paling akurat. Oleh  karena  itu,  penulis  akan  membandingkan  algoritma  yang  berbeda  dari
penelitian-penelitian  sebelumnya  yaitu  1  Naive  Bayes  dan  2  K-nearest  Neighbor.
2.2  Kajian Teori 2.2.1 Penambangan Data
Penambangan Data adalah proses pengumpulan informasi penting dari sejumlah data besar yang tersimpan di basis data, gudang data, atau tempat penyimpanan lainnya
Han    Kamber,  2006.  Penambangan  data  merupakan  proses  yang  tidak  dapat dipisahkan  dengan  Knowledge  Discovery  in  Database  KDD,  karena  penambangan
data adalah salah satu  tahap dalam proses KDD  seperti  yang ditunjukkan oleh gambar 2.1.
Gambar 2.1 Tahapan Dalam KDD Han  Kamber, 2006
Menurut  Han  dan  Kamber  2006,  tahapan-tahapan  dalam  proses  KDD  adalah sebagai berikut:
1. Pembersihan data Data Cleaning
Pembersihan  data  merupakan  proses  untuk  menghilangkan  data  yang mengandung noise, atau data yang tidak konsisten.
2.  Integritas data Data Integration Pada tahap ini akan dilakukan penggabungan data yang berasal dari berbagai
sumber. 3.  Seleksi data Data Selection
Pada tahap ini akan dilakukan pemilihan data yang relevan dari database. 4.  Transformasi data Data Transformation
Pada  tahap  ini  data  akan  ditransformasikan  kedalam  format  yang  sesuai untuk diproses dalam penambangan data.
5.  Penambangan data Data Mining Penambangan  data  merupakan  proses  penting  dimana  metode  akan
disistemkan untuk mengekstrak pola data. 6.  Evaluasi pola Pattern Evaluation
Pada  tahap  ini,  polamodel  yang  dihasilkan  dari  teknik  data  mining  akan mengidentifikasi pola-pola yang menarik berdasarkan ukuran tertentu
7.  Presentasi pengetahuan Knowledge Presentation Pada  tahap  ini  akan  dilakukan  teknik  visualisasi  yang  digunakan  untuk
menampilkan pengetahuan hasil proses mining kepada pengguna.