40 - Kata “sababaraha” tidak menghasilkan hasil stemming yang diharapkan
yaitu “sabaraha”.
4.2. Analisis Terhadap Pengujian Stemming
Setelah dilakukan pengujian terhadap kata uji ternyata ada beberapa kata yang tidak memberikan hasil sesuai dengan yang diharapkan. Berikut ini adalah
analisis terhadap kegagalan hasil proses stemming.
4.2.1. Analisis Terhadap Kata yang Overstemming
Kata “ cari-cari” dan “cina” didapat kata “ci”.
Pada saat membaca kata ulang “cari-cari”, yang diambil adalah kata paling akhir setelah karakter “-“, didapat kata “cari”. Kata “cari” bukan kata dalam
bahasa Sunda, maka pada saat dicari dalam kamus tidak ditemukan. Proses berikutnya adalah penghilangan imbuhan. Kata “cari” menghasilkan kata “ci”,
disebabkan karena modulfungsi Hilangkan_Sisipan, akan menghilangkan suku kata “ar” dalam kata “cari”, sehingga didapat kata “ci”. Dan jika kata “ci” ini
dicari dalam kamus maka akan kata tersebut ada dalam kamus. Untuk kata “cina”, modulfungsi Hilangkan_Sisipan juga akan dihilangkan suku kata “in”,
sehingga didapat kata “ci”.
Kata “siti”, “nian”, “tini”, didapat kata “ti”.
Kata “siti” karena merupakan nama seseorang maka ketika dicari dalam kamus bahasa Sunda tidak ditemukan, sehingga proses berikutnya yang dijalankan
adalah penghilangkan awalan. Kata “siti” dianggap mempunyai awalan “si”, sehingga oleh modulfungsi Hilangkan_Awalan suku kata “si” ini akan
dihilangkan dan didapat kata “ti”. Kata “nian” juga bukan merupakan kata dalam bahasa Sunda, sehingga
pada saat dicari dalam kamus pertama kali tidak ditemukan. Selanjutnya modulfungsi Hilangkan_Bareng akan menghilangkan suku kata “an” dan
mengganti huruf “n” menjadi “t” karena dianggap sebagai bentuk kata nasal, sehingga didapat kata “ti”. Kata “tini” yang merupakan nama orang, dianggap
41 mempunyai suku kata “in”, sehingga suku kata tersebut akan dihilangkan dan
didapat kata “ti”.
Kata “diari”, didapat kata “ari”
Kata “ari” dalam bahasa Sunda mempunyai arti sedangkan, kalau atau jika. Kata “diari” yang bukan merupakan kata dalam bahasa Sunda ketika dicari dalam
kamus tidak ditemukan. Proses berikutnya pada algoritme stemming adalah penghilangan awalan oleh modulfungsi Hilangkan_Awalan. Suku kata “di”
pada kata “diari” dianggap merupakan awalan, sehingga akan dihilangkan oleh modulfungsi tersebut, dan didapat kata “ari”.
Kata “pamar”, “dibabarkeun”, didapat kata “bar”.
Kata “bar” dalam bahasa Sunda mempunya arti yaitu: kata antar untuk menghamparkan tikar, karpet, dan lain-lain. Pada saat algoritme stemming
bekerja untuk kata “pamar”, maka fungsi Hilangkan_Bareng akan menghilangkan suku kata “pa” dan didapat kata “mar”. Kata “mar” ini dianggap
bentuk kata nasal sehingga huruf “m” pada kata tersebut diganti dengan huruf “b”, dan didapat kata “bar”.
Untuk kata “dibabarkeun”, akan dianggap sebagai kata ulang dan modulfungsi Cek_Kata_Ulang akan menghilangkan awalan dan akhiran “di- +
-keun” maka didapat kata “babar”. Karena dianggap kata ulang maka suku kata “ba” akan dihilangkan dari kata tersebut dan didapat kata “bar”.
Kata “tikang”, “bakang”, didapat kata “kang”
Kata “kang” dalam bahasa Sunda mempunyai arti panggilan untuk lelaki yang lebih tua atau kakak. Pada saat mencari kata “tikang” dan “bakang” dalam
kamus kata tersebut ditemukan. Kedua kata tersebut dianggap mempunyai awalan “ti”
dan “ba”,
sehingga akan
dihilangkan oleh
modulfungsi Hilangkan_Awalan dan didapat kata “kang”.
42
Kata “simana”, didapat kata “sim”
Kata “sim” dalam bahasa Sunda mempunyai arti saya. Sedangkan kata “simana” merupakan kata “sima” dan diberi akhiran “na”. Pada saat algoritme
stemming bekerja, kata “simana” ini diangap mempunyai akhiran “ana”, sehingga akan dipotong menjadi “sim”.
Kata “maran”, “perman”, “minan” didapat kata “man”
Kata “man” mempunyai arti sebagai kata antar untuk menyuruh berjalan terlebih dahulu. Kata “maran” dan “minan” dianggap mempunyai sisipan “ar”
dan “in” sehingga oleh modulfungsi Hilangkan_Sisipan kedua suku kata tersebut akan dihilangkan dan didapat kata “man”. Sedangkan untuk kata
“perman” dianggap mempunyai awalan “per” dan akan dihilangkan oleh modulfungsi Hilangkan_Awalan.
Kata “kuning”, “tiku” didapat kata “ku”
Kata “ku” mempunyai arti alangkah atau jangankan. Kata “kuning” dianggap mempunyai akhiran “ning” sehingga akhiran tersebut dihilangkan oleh
modulfungsi Hilangkan_Akhiran sehingga didapat kata “ku”. Sedangkan kata “tiku” dianggap mempunyai awalan “ti” dan oleh modul Hilangkan_Awalan
sehingga didapat kata “ku”.
Kata “pama” di dapat kata “ba”
Kata “ba” merupakan salah satu bentuk awalan yang berarti “ber”. Kata “pama” setelah di-stem berubah menjadi kata “ba” disebabkan oleh
modulfungsi Hilangkan_Bareng menganggap kata tersebut memiliki bentuk pa- N-. Modul Hilangkan_Bareng akan menghilangkan awalan pa- dan huruf “m”
pada suku kata “ma” diganti menjadi “b” oleh modul ModulNasal_N karena dianggap memiliki bentuk nasal. Kata tersebut setelang di-stem didapat kata “ba”.
Kata “perda”, “dana”, “dakeunana” di dapat kata “da”
Kata “da” memiliki arti “karena”. Kata “perda” dan “dana” yang merupakan kata dalam bahasa Indonesia dianggap memiliki awalan “per” pada
43 kata “perda” dan akhiran “na” pada kata “dana”. Pada proses stemming kata
“perda” akan dihilangkan awalan “per”-nya oleh modul Hilangkan_Awalan, sedangkan kata “dana” akan dihilangkan akhiran “na”-nya oleh modul
Hilangkan_Awalan.
Kata “ diracik” didapat kata “cik”, “dipilah”, “silah” didapat kata “lah” dan
“pekan”,” peking” didapat kata “pek”
Kata “diracik” dianggap memiliki bentuk rarangken bareng di- -ar- sehingga oleh modul Hilangkan_Bareng dihilangkan awalan “di” dan sisipan
“ar” sehingga didapat kata “cik”. Sedangkan untuk kata “dipilah” dan “silah” masing-masing
dianggap memiliki
bentuk rarangken
bareng “di-pi-” dan awalan “si” sehingga bentuk “di-pi-“ dan awalan “si” dihilangkan
pada kedua kata tersebut dan didapat kata “lah”. Untuk kata “pekan” dan “peking” keduanya dianggap memiliki bentuk akhiran “an” dan “ing” sehingga
oleh modul Hilangkan_Akhiran kedua akhiran tersebut dihilangkan dan didapat kata “pek”.
4.2.2. Analisis terhadap kata hasil stemming yang tidak sesuai harapan