Stopword Removal Analisis Proses Preprocessing
Adapun contoh proses preprocessing untuk stemming dapat dilihat pada Tabel 3.6 berikut:
Tabel 3.6 Contoh Stemming Algoritma Porter Stemmer Bahasa Indonesia
No Tahap
Kata Keterangan
1 Menghapus partikel particle
mempersiapkan Tidak ada di kamus dan tidak ada partikel.
2 Menghapus kata ganti possesive
pronoun mempersiapkan Tidak ada di kamus dan tidak
ada possesive pronoun. 3
Menghapus awalan pertama first order prefix, jika ditemukan maka
lanjutkan ke langkah 4a, jika tidak maka lanjutkan ke langkah 4b
persiapkan Tidak ada di kamus tetapi
terdapat first order prefix “mem-” dihapus.
4a Menghapus awalan kedua second
order prefix kemudian lanjutkan ke langkah 5a
siapkan Tidak ada di kamus tetapi
terdapat second order prefix “per-” dihapus
4b Menghapus akhiran suffix, jika
ditemukan lanjutkan ke langkah 5b, jika tidak maka kata tersebut
diasumsikan sebagai kata dasar 5a
Menghapus akhiran suffix dan kata akhir diasumsikan sebagai kata
dasar siap
Tidak ada di kamus tetapi terdapat suffix
“-kan” dihapus dan kata akhir diasumsikan
sebagai kata dasar 5b
Menghapus awalan kedua second order prefix dan kata akhir
diasumsikan sebagai kata dasar
Hasil proses stemming tersebut digunakan dalam melakukan pembobotan tf-idf dan perhitungan cosine similarity untuk similarity kalimat. Similarity kalimat
merupakan bobot hasil perbandingan kemiripan antar kalimat.