43 kata “perda” dan akhiran “na” pada kata “dana”. Pada proses stemming kata
“perda” akan dihilangkan awalan “per”-nya oleh modul Hilangkan_Awalan, sedangkan kata “dana” akan dihilangkan akhiran “na”-nya oleh modul
Hilangkan_Awalan.
Kata “ diracik” didapat kata “cik”, “dipilah”, “silah” didapat kata “lah” dan
“pekan”,” peking” didapat kata “pek”
Kata “diracik” dianggap memiliki bentuk rarangken bareng di- -ar- sehingga oleh modul Hilangkan_Bareng dihilangkan awalan “di” dan sisipan
“ar” sehingga didapat kata “cik”. Sedangkan untuk kata “dipilah” dan “silah” masing-masing
dianggap memiliki
bentuk rarangken
bareng “di-pi-” dan awalan “si” sehingga bentuk “di-pi-“ dan awalan “si” dihilangkan
pada kedua kata tersebut dan didapat kata “lah”. Untuk kata “pekan” dan “peking” keduanya dianggap memiliki bentuk akhiran “an” dan “ing” sehingga
oleh modul Hilangkan_Akhiran kedua akhiran tersebut dihilangkan dan didapat kata “pek”.
4.2.2. Analisis terhadap kata hasil stemming yang tidak sesuai harapan
Kata “mentang-mentang”, “made” dan “masa” bukan merupakan kata dalam bahasa Sunda, sehingga ketika dicari dalam kamus, kata tersebut tidak
ditemukan. Kata “mentang-mentang” dianggap sebagai kata ulang dan diambil hanya kata terakhir setelah kata “-“ dan didapat kata “mentang”. Kata tersebut
dianggap sebagai bentuk nasal sehingga huruf “m” akan diganti oleh huruf “b” sehingga didapat kata “bentang” bintang. Demikian juga untuk kata “made”
dan “masa”, dianggap sebagai bentuk nasal dan hasil stemmingnya adalah “bade” akan dan “basa” bahasa.
Hasil stemming yang diharapkan untuk kata nyarapu, marere, malayar adalah kata sapu, bere dan bayar. Namun algoritme stemming yang dirancang
tidak dapat menghasilkan kata yang diharapkan. Kesalahannya terletak pada modulfungsi Hilangkan_Bareng, yaitu pada penggalan program seperti yang
terlihat pada Gambar 22.
44
If Hilangkan_Sisipankata Then If modulNasal_Nkata Then
Hilangkan_Bareng = True Else
Hilangkan_Bareng = False End If
Else .......
End if
Gambar 22 Bagian algoritme Hilangkan_Sisipan yang menghasilkan kata yang tidak diharapkan.
Pada penggalan program tersebut, baris perintah If Hilangkan_Sisipankata Then diharapkan menghilangkan sisipan dari kata tersebut, akan tetapi karena isi
program dari Hilangkan_Sisipankata yang menangani masalah sisipan “ar” ini berbentuk seperti Gambar 23 maka fungsi
Hilangkan_Sisipan menghasilkan hasil kata “nyapu”.
If In_Str_Arkata, ar Then kata = dummy
kata = Replacekata, ar, , 1, 1, vbTextCompare If ReadKamuskata Then
Hilangkan_Sisipan = True Else
...... End if
...... End if
Gambar 23 Bagian algoritme Hilangkan_Sisipan yang menguji sisipan “ar”. Proses berikutnya adalah pencarian kata tersebut dalam kamus dan ternyata
hasilnya tidak ditemukan. Proses berikutnya dari Hilangkan_Bareng yaitu proses penghilangan nasal modulNasal_Nkata tidak pernah diproses. Hal inilah yang
menyebabkan algoritme stemming ini tidak mampu menghasilkan kata dasar yang diharapkan.
Untuk kata uji “malayar” pada saat pengujian menghasilkan kata dasar “balayar”, kata tersebut ada dalam kamus. Namun sebenarnya kata dasar yang
diharapkan dari hasil stemming kata “malayar” bukan kata tersebut, kata yang diharapkan adalah kata “bayar”. Hal ini dsebabkan karena kata “malayar”
dianggap sebagai nasal yang diproses pada saat menjalankan modulfungsi Hilangkan_Awalan. Dan kata hasil stemming setelah dicari dalam kamus
45 ternyata menemukan hasil “balayar”. Potensi kesalahan yang sama akan muncul
jika kata yang di-stem mempunyai bentuk N- + -ar,. Algoritme stemming untuk kata ulang dwipurwa adalah dengan mengambil
suku kata pertama lalu dibandingkan dengan suku kata berikutnya. Untuk kata sababaraha adalah kata ulang yang mempunyai aturan jika kata dasar memiliki
tiga suku kata atau lebih maka yang diulang adalah suku kata kedua. Hasil stemming yang diharapkan dari kata sababaraha adalah sabaraha berapa.
Kegagalan stemming untuk kata sababaraha adalah sulitnya menentukan jumlah suku kata dari kata yang akan di-stem. Agoritme yang diracang belum
mampu untuk menangani masalah tersebut. Hasil kata lainnya yang tidak sesuai dengan harapan, yang berjumlah 443
kata disebabkan oleh ketidaksempurnaan algoritme dan disebabkan pula ketidaklengkapan data kamus. Untuk penelitian berikutnya diharapkan dapat lebih
menyempurnakan algoritme yang dirancang ini serta melengkapi data kamus.
5. KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan hasil pengujian dan pembahasan yang telah dilakukan dapat ditarik kesimpulan sebagai berikut:
1. Algoritme stemming yang dirancang mampu memberikan hasil kata yang diharapkan sebesar 91.38 dan mengurangi jumlah kata pada indeks sebesar
49.31. 2. Algoritme stemming yang dirancang mempunyai bentuk heavy stemming. Hal
ini disebabkan oleh hasil kesalahan stemming seluruhnya menghasilkan kata yang overstemming dan tidak ada yang understemming.
3. Algoritme stemming yang dirancang sebagian besar memberikan hasil yang cukup baik, meskipun masih ada beberapa kata yang overstemming. Selain itu
ada beberapa kata hasil stemming tidak menghasilkan kata seperti yang diharapkan. Potensi kegagalan masih dapat terjadi jika kata yang akan di-stem
memiliki pola yang sama dengan kata yang gagal di-stem. 4. Kegagalan dari proses stemming untuk menghasilkan kata dasar yang
diharapkan disebabkan ada beberapa ketidaksempurnaan pada algoritme dan belum lengkapnya data kamus.
5.2 Saran
Berikut ini adalah saran-saran untuk penelitian lebih lanjut: 1. Kurang sempurnanya algoritme dapat diperbaiki pada penelitian berikutnya.
Selain itu, algoritme stemming yang diteliti masih belum mampu mengatasi bentuk kata yang mengalami morfofonemis, yaitu kata yang memiliki bentuk
rarangken barung ka- -an yang merupakan kata dasar awal atau akhir adalah huruf vokal, yang lalu mengalami perubahan bentuk. Contoh untuk kata
mofofonemis adalah kabudayaan menjadi kabudayan, kabupatian manjadi