67
ArrayListString
4.2. Implementasi Program
4.2.1 Implementasi Text Preprocessing
Text Preprocessing memiliki 3 tahap yaitu pemisahan kata tokenizing
atau split, penghapusan kata umum stopword, dan pengembalian kata dasar stemming. Setiap dokumen yang dimasukkan pengguna akan melalui proses ini
untuk mendapatkan full text yang dimiliki. Hasil full text tersebut akan disimpan dalam bentuk ArrayListString. Pada Gambar 4.1 adalah rangkaian bagaimana
proses text preprocessing dilakukan oleh sistem. Berikut Implementasi Text Preprocessing
, Listing Program 4.1.
TokenizingSplit Stopword
Stemming
Gambar 4.1 Rangkaian Proses Text Preprocessing
public String summarizationString teksAsli { String[] kalimatAsli = teksAsli.split\\.;
String[] tempKalimat = teksAsli.split\\.; ArrayListString teks_lengkap = new ArrayListString;
StopWord stopword = new StopWord; StemWord stemming = new StemWord;
for int i = 0; i tempKalimat.length; i++ { if tempKalimat[i].startsWith {
tempKalimat[i] = tempKalimat[i].substring1; }
68 String[] tempKata = tempKalimat[i].split ;
for int j = 0; j tempKata.length; j++ { tempKata[j] = tempKata[j].replaceAll[,_?\\n;:-=], ;
if stopword.isStopwordtempKata[j].toLowerCase { continue;
} stemming.setWordtempKata[j].toLowerCase;
tempKata[j] = stemming.getWord; if teks_lengkap.containstempKata[j] {
teks_lengkap.addtempKata[j]; }
} }
}
Listing Program 4.1 Implementasi Text Preprocessing
69
4.2.2 Implementasi Penghapusan Kata Umum Stopword
Setelah proses pemisahan kata tokenizing atau split, akan dilakukan proses penghapusan kata umum stopword. Kata umum adalah kata yang tidak
memiliki maka berarti dalam sebuah kalimat. Dalam sistem ini daftar kata umum disimpan dalam bentuk file .txt, kemudian akan dipanggil dalam sistem. Hasil dari
penghapusan kata akan disimpan sementara dalam bentuk ListString. Berikut adalah Implementasi Penghapusan Kata Umum, Listing Program 4.2.
public class StopWord { ListString stopword;
public StopWord { try {
Scanner file = new Scannernew Filee:stopword.txt; stopword = new LinkedListString;
while file.hasNext { stopword.addfile.nextLine;
} } catch FileNotFoundException ex {
Logger.getLoggerStopWord.class.getName.logLevel.SEVERE, null, ex; }
} public boolean isStopwordString word {
return stopword.containsword; }
}
Listing Program 4.2
Implementasi Penghapusan Kata Umum Stopword
70
4.2.3 Implementasi Pengembalian Kata Dasar Stemming