3.5.2. Algoritma Proses Klasifikasi
Algoritma yang akan dijabarkan dalam sub bab ini adalah algoritma yang berhubungan dengan proses klasifikasi. Sedangkan proses pencarian tidak ikut
dijelaskan karena bukan merupakan bahasan utama dalam penelitian.
3.5.2.1 Preprocessing untuk proses training
input: file surat yang terbagi dalam 8 folder yang mewakili masing – masing
kelas, stopword, synonym loop:
semua folder n...i dari data training {
loop: semua file surat dari folder n {
read: satu per satu file surat dari folder n
loop - tokenization: setiap term j...k dalam file surat {
normalization: term j
check_stopwords:
term j
stemming: term j
count: jumlah kemunculan term j
} }
}
3.5.2.2 Preprocessing untuk proses testing
input: file surat, stopword, synonym
read: file surat
loop - tokenization: setiap term j...k dalam file surat {
normalization: term j
check_stopwords: term j
stemming:
term j }
}
3.5.2.3 Hitung Prior Probabilities
input:
file surat yang terbagi dalam 8 folder yang mewakili masing – masing kelas
loop:
semua folder n...i dari data training {
loop: semua file surat dari folder n {
count: file surat yang ada dalam folder n
}
count: file surat yang ada dalam semua folder
} calculate:
nilai prior probabilities dari tiap – tiap kelas folder
3.5.2.4 Hitung Conditional Probabilities
input: hasil preprocessing, jumlah term dalam keseluruhan kelas, jumlah term
unik dari keseluruhan kelas loop:
semua folder n...i dari hasil preprocessing {
read:
satu per satu file hasil preprocessing dari folder n
calculate: nilai conditional probabilities dari masing – masing kelas
}
3.5.2.5 Training
execute: preprocessing method
execute:
prior probabilities method
execute: conditional probabilities method
3.5.2.6 Matching
input: indeks term hasil preprocessing data testing, indeks term dari model
loop – read: indeks term data testing{
tt = term data testing
loop: indeks term dari model{
tm = term dari model
compare: tt with: tm
store: match term, term frequency
} }
3.5.2.7 Testing
get:
prior probabilities, conditional probabilities, hasil proses matching
loop: indeks matching{
m = term frequency dalam indeks hasil matching
loop: conditional prob{
c = term frequency dalam conditional prob{
calculate: n = c
m
} }
calculate:
n prior probabilities
return: probabilitas data testing
56
BAB 4 IMPLEMENTASI
Pada sub bab ini akan dijabarkan hasil implementasi berupa antarmuka interface beserta dengan method – method utama yang digunakannya.
4.1. Antarmuka Menu Utama Pencarian Surat
Gambar 4.1 Antarmuka untuk menu utama juga pencarian.
1.
Method: createIndexString filesToIndex
Analyzer analyzer = new StandardAnalyzerVersion.LUCENE_41; File dir = new FilefilesToIndex;
FileInputStream fis = null; FieldType type1 = new FieldType;
type1.setIndexedtrue; type1.setTokenizedtrue;