Preprocessing untuk proses training Preprocessing untuk proses testing Hitung Prior Probabilities Hitung Conditional Probabilities Training Matching Testing

3.5.2. Algoritma Proses Klasifikasi

Algoritma yang akan dijabarkan dalam sub bab ini adalah algoritma yang berhubungan dengan proses klasifikasi. Sedangkan proses pencarian tidak ikut dijelaskan karena bukan merupakan bahasan utama dalam penelitian.

3.5.2.1 Preprocessing untuk proses training

input: file surat yang terbagi dalam 8 folder yang mewakili masing – masing kelas, stopword, synonym loop: semua folder n...i dari data training { loop: semua file surat dari folder n { read: satu per satu file surat dari folder n loop - tokenization: setiap term j...k dalam file surat { normalization: term j check_stopwords: term j stemming: term j count: jumlah kemunculan term j } } }

3.5.2.2 Preprocessing untuk proses testing

input: file surat, stopword, synonym read: file surat loop - tokenization: setiap term j...k dalam file surat { normalization: term j check_stopwords: term j stemming: term j } }

3.5.2.3 Hitung Prior Probabilities

input: file surat yang terbagi dalam 8 folder yang mewakili masing – masing kelas loop: semua folder n...i dari data training { loop: semua file surat dari folder n { count: file surat yang ada dalam folder n } count: file surat yang ada dalam semua folder } calculate: nilai prior probabilities dari tiap – tiap kelas folder

3.5.2.4 Hitung Conditional Probabilities

input: hasil preprocessing, jumlah term dalam keseluruhan kelas, jumlah term unik dari keseluruhan kelas loop: semua folder n...i dari hasil preprocessing { read: satu per satu file hasil preprocessing dari folder n calculate: nilai conditional probabilities dari masing – masing kelas }

3.5.2.5 Training

execute: preprocessing method execute: prior probabilities method execute: conditional probabilities method

3.5.2.6 Matching

input: indeks term hasil preprocessing data testing, indeks term dari model loop – read: indeks term data testing{ tt = term data testing loop: indeks term dari model{ tm = term dari model compare: tt with: tm store: match term, term frequency } }

3.5.2.7 Testing

get: prior probabilities, conditional probabilities, hasil proses matching loop: indeks matching{ m = term frequency dalam indeks hasil matching loop: conditional prob{ c = term frequency dalam conditional prob{ calculate: n = c m } } calculate: n prior probabilities return: probabilitas data testing 56

BAB 4 IMPLEMENTASI

Pada sub bab ini akan dijabarkan hasil implementasi berupa antarmuka interface beserta dengan method – method utama yang digunakannya.

4.1. Antarmuka Menu Utama Pencarian Surat

Gambar 4.1 Antarmuka untuk menu utama juga pencarian. 1. Method: createIndexString filesToIndex Analyzer analyzer = new StandardAnalyzerVersion.LUCENE_41; File dir = new FilefilesToIndex; FileInputStream fis = null; FieldType type1 = new FieldType; type1.setIndexedtrue; type1.setTokenizedtrue;