openFile Implementasi Tokenisasi, Menghapus Tanda Baca, Tokenisasi, Menghapus Tanda Baca, Implementasi

4.2. Implementasi

Preprocessing Dokumen 4.2.1. Implementasi Pembacaan Isi Dokumen Pada langkah pembacaan file dokumen ini sistem akan membaca isi dokumen. Dengan parameter method path merupakan lokasi dimana folder lokasi jawaban disimpan dan fileName merupakan nama dokumen. berikut ini merupakan list code openFile 4.2.1. public static String openFileString path, String fileName throws FileNotFoundException, IOException { String text = , teks = ; FileReader fr = new FileReaderpath + + fileName; BufferedReader br = new BufferedReaderfr; while teks = br.readLine = null { text = text + teks + \n; } br.close; fr.close; return text; } List Code

4.2.1 openFile

4.2.2. Implementasi Tokenisasi, Menghapus Tanda Baca,

Case Folding Pada langkah ini sistem akan menghapus tanda baca filterTandaBaca, melakukan tokenisasi tokenisasi, dan case folding caseFolding public static String filterTandaBacaString doc throws FileNotFoundException, IOException { String cek = ; String tandaBaca = openFilesrcaplikasi, tanda baca.txt; for int i = 0; i tandaBaca.length; i++ { cek = tandaBaca.substringi, i + 1; doc = replacedoc, cek, ; doc = replacedoc, , ; doc = replacedoc, , ; doc = replacedoc, , ; } return doc ; } public static String tokenisasiString doc { doc = replacedoc, , \n; return doc; } public static String caseFoldingString doc { doc = doc.toLowerCase; return doc; } List Code

4.2.2 Tokenisasi, Menghapus Tanda Baca,

Case Folding

4.2.3. Implementasi

Stopword Pada tahap ini sistem melakukan proses penghilangan kata yang termasuk stopword kata yang tidak mempengaruhi proses pemerolehan informasi. Kata yang dihilangkan merupakan kata - kata yang tidak layak dijadikan sebagai kata kunci. Berikut langkah penghilangan kata umum stopword pada list code proses Stopword public static String stopWordString doc throws FileNotFoundException, IOException { String stoplist = openFilesrcaplikasi, stoplist.txt; StringTokenizer stop = new StringTokenizerstoplist; String[] stopA = new String[stop.countTokens]; for int i = 0; i stopA.length; i++ { stopA[i] = stop.nextToken; } StringTokenizer token = new StringTokenizerdoc; String[] tokenA = new String[token.countTokens]; for int i = 0; i tokenA.length; i++ { tokenA[i] = token.nextToken; } String kataPenting = ; for int i = 0; i tokenA.length; i++ { String t = ; for int j = 0; j stopA.length; j++ { if tokenA[i].equalsIgnoreCasestopA[j] { tokenA[i] = ; } } } for int i = 0; i tokenA.length; i++ { if tokenA[i].isEmpty { do nothing } else { kataPenting = kataPenting + tokenA[i] + \n; } } return kataPenting; } List Code 4.2.3 Stopword

4.2.4. Implementasi