Implementasi Text Preprocessing Implementasi Penghapusan Kata Umum Stopword

67 ArrayListString

4.2. Implementasi Program

4.2.1 Implementasi Text Preprocessing

Text Preprocessing memiliki 3 tahap yaitu pemisahan kata tokenizing atau split, penghapusan kata umum stopword, dan pengembalian kata dasar stemming. Setiap dokumen yang dimasukkan pengguna akan melalui proses ini untuk mendapatkan full text yang dimiliki. Hasil full text tersebut akan disimpan dalam bentuk ArrayListString. Pada Gambar 4.1 adalah rangkaian bagaimana proses text preprocessing dilakukan oleh sistem. Berikut Implementasi Text Preprocessing , Listing Program 4.1. TokenizingSplit Stopword Stemming Gambar 4.1 Rangkaian Proses Text Preprocessing public String summarizationString teksAsli { String[] kalimatAsli = teksAsli.split\\.; String[] tempKalimat = teksAsli.split\\.; ArrayListString teks_lengkap = new ArrayListString; StopWord stopword = new StopWord; StemWord stemming = new StemWord; for int i = 0; i tempKalimat.length; i++ { if tempKalimat[i].startsWith { tempKalimat[i] = tempKalimat[i].substring1; } 68 String[] tempKata = tempKalimat[i].split ; for int j = 0; j tempKata.length; j++ { tempKata[j] = tempKata[j].replaceAll[,_?\\n;:-=], ; if stopword.isStopwordtempKata[j].toLowerCase { continue; } stemming.setWordtempKata[j].toLowerCase; tempKata[j] = stemming.getWord; if teks_lengkap.containstempKata[j] { teks_lengkap.addtempKata[j]; } } } } Listing Program 4.1 Implementasi Text Preprocessing 69

4.2.2 Implementasi Penghapusan Kata Umum Stopword

Setelah proses pemisahan kata tokenizing atau split, akan dilakukan proses penghapusan kata umum stopword. Kata umum adalah kata yang tidak memiliki maka berarti dalam sebuah kalimat. Dalam sistem ini daftar kata umum disimpan dalam bentuk file .txt, kemudian akan dipanggil dalam sistem. Hasil dari penghapusan kata akan disimpan sementara dalam bentuk ListString. Berikut adalah Implementasi Penghapusan Kata Umum, Listing Program 4.2. public class StopWord { ListString stopword; public StopWord { try { Scanner file = new Scannernew Filee:stopword.txt; stopword = new LinkedListString; while file.hasNext { stopword.addfile.nextLine; } } catch FileNotFoundException ex { Logger.getLoggerStopWord.class.getName.logLevel.SEVERE, null, ex; } } public boolean isStopwordString word { return stopword.containsword; } } Listing Program 4.2 Implementasi Penghapusan Kata Umum Stopword 70

4.2.3 Implementasi Pengembalian Kata Dasar Stemming