76
4.2.4 Implementasi Term Frequency TF
Setelah text preprocessing selesai, akan dilakukan perhitungan jumlah frekuensui kemunculan kata t pada kalimat D. Pada tahap ini akan dibuat
tabelTF dalam array 2 dimensi dengan baris merupakan list kata teks_lengkap
dan kolom merupakan list kalimat tempKalimat. Jika kata t yang terkandung dalam kalimat D maka bernilai 1, sedangkan kata t yang tidak terkandung
dalam kalimat D maka bernilai 0. Berikut adalah Implementasi Term Frequency TF
,
Listing Program 4.7.
int[ ][ ] tabelTF = new int[tempKalimat.length][teks_lengkap.size]; for int i = 0; i tempKalimat.length; i++ {
if tempKalimat[i].startsWith { tempKalimat[i] = tempKalimat[i].substring1;
} String[] tempKata = tempKalimat[i].split ;
for int j = 0; j tempKata.length; j++ { tempKata[j] = tempKata[j].replaceAll[,_?\\n;:-=], ;
if stopword.isStopwordtempKata[j].toLowerCase { continue;
} stemming.setWordtempKata[j].toLowerCase;
tempKata[j] = stemming.getWord; int index = teks_lengkap.indexOftempKata[j];
tabelTF[i][index] = 1; }
}
Listing Program 4.7 Implementasi Term Frequency TF
77
4.2.5 Implementasi Document Frequency df
Pada tahap ini akan dilakukan perhitungan jumlah frekuensi kalimat D yang mengandung kata t dengan cara membuat tabelDF dalam array. Berikut
adalah Implementasi Document Frequency, Listing Program 4.8.
int[ ] tabelDF = new int[teks_lengkap.size]; for int i = 0; i teks_lengkap.size; i++ {
for int j = 0; j tempKalimat.length; j++ { tabelDF[i] += tabelTF[j][i];
} }
Listing Program 4.8
Implementasi Document Frequency df
4.2.6 Implementasi Inverse Document Frequency IDF
Pada tahap ini akan dilakukan perhitungan IDF dengan membuat tabelIDF
dalam array. Dengan cara Log dari jumlah total kalimat D dibagi hasil perhitungan df yang sudah dilakukan sebelumnya
.
Berikut adalah Implementasi Inverse Document Frequency
, Listing Program 4.9.
float[ ] tabelIDF = new float[teks_lengkap.size]; for int i = 0; i teks_lengkap.size; i++ {
tabelIDF[i] = float tempKalimat.length tabelDF[i]; tabelIDF[i] = float Math.log10tabelIDF[i];
}
Listing Program 4.9 Implementasi Inverse Document Frequency IDF
78
4.2.7 Implementasi Bobot Kata W