Analisis terhadap kata hasil stemming yang tidak sesuai harapan

43 kata “perda” dan akhiran “na” pada kata “dana”. Pada proses stemming kata “perda” akan dihilangkan awalan “per”-nya oleh modul Hilangkan_Awalan, sedangkan kata “dana” akan dihilangkan akhiran “na”-nya oleh modul Hilangkan_Awalan. Kata “ diracik” didapat kata “cik”, “dipilah”, “silah” didapat kata “lah” dan “pekan”,” peking” didapat kata “pek” Kata “diracik” dianggap memiliki bentuk rarangken bareng di- -ar- sehingga oleh modul Hilangkan_Bareng dihilangkan awalan “di” dan sisipan “ar” sehingga didapat kata “cik”. Sedangkan untuk kata “dipilah” dan “silah” masing-masing dianggap memiliki bentuk rarangken bareng “di-pi-” dan awalan “si” sehingga bentuk “di-pi-“ dan awalan “si” dihilangkan pada kedua kata tersebut dan didapat kata “lah”. Untuk kata “pekan” dan “peking” keduanya dianggap memiliki bentuk akhiran “an” dan “ing” sehingga oleh modul Hilangkan_Akhiran kedua akhiran tersebut dihilangkan dan didapat kata “pek”.

4.2.2. Analisis terhadap kata hasil stemming yang tidak sesuai harapan

Kata “mentang-mentang”, “made” dan “masa” bukan merupakan kata dalam bahasa Sunda, sehingga ketika dicari dalam kamus, kata tersebut tidak ditemukan. Kata “mentang-mentang” dianggap sebagai kata ulang dan diambil hanya kata terakhir setelah kata “-“ dan didapat kata “mentang”. Kata tersebut dianggap sebagai bentuk nasal sehingga huruf “m” akan diganti oleh huruf “b” sehingga didapat kata “bentang” bintang. Demikian juga untuk kata “made” dan “masa”, dianggap sebagai bentuk nasal dan hasil stemmingnya adalah “bade” akan dan “basa” bahasa. Hasil stemming yang diharapkan untuk kata nyarapu, marere, malayar adalah kata sapu, bere dan bayar. Namun algoritme stemming yang dirancang tidak dapat menghasilkan kata yang diharapkan. Kesalahannya terletak pada modulfungsi Hilangkan_Bareng, yaitu pada penggalan program seperti yang terlihat pada Gambar 22. 44 If Hilangkan_Sisipankata Then If modulNasal_Nkata Then Hilangkan_Bareng = True Else Hilangkan_Bareng = False End If Else ....... End if Gambar 22 Bagian algoritme Hilangkan_Sisipan yang menghasilkan kata yang tidak diharapkan. Pada penggalan program tersebut, baris perintah If Hilangkan_Sisipankata Then diharapkan menghilangkan sisipan dari kata tersebut, akan tetapi karena isi program dari Hilangkan_Sisipankata yang menangani masalah sisipan “ar” ini berbentuk seperti Gambar 23 maka fungsi Hilangkan_Sisipan menghasilkan hasil kata “nyapu”. If In_Str_Arkata, ar Then kata = dummy kata = Replacekata, ar, , 1, 1, vbTextCompare If ReadKamuskata Then Hilangkan_Sisipan = True Else ...... End if ...... End if Gambar 23 Bagian algoritme Hilangkan_Sisipan yang menguji sisipan “ar”. Proses berikutnya adalah pencarian kata tersebut dalam kamus dan ternyata hasilnya tidak ditemukan. Proses berikutnya dari Hilangkan_Bareng yaitu proses penghilangan nasal modulNasal_Nkata tidak pernah diproses. Hal inilah yang menyebabkan algoritme stemming ini tidak mampu menghasilkan kata dasar yang diharapkan. Untuk kata uji “malayar” pada saat pengujian menghasilkan kata dasar “balayar”, kata tersebut ada dalam kamus. Namun sebenarnya kata dasar yang diharapkan dari hasil stemming kata “malayar” bukan kata tersebut, kata yang diharapkan adalah kata “bayar”. Hal ini dsebabkan karena kata “malayar” dianggap sebagai nasal yang diproses pada saat menjalankan modulfungsi Hilangkan_Awalan. Dan kata hasil stemming setelah dicari dalam kamus 45 ternyata menemukan hasil “balayar”. Potensi kesalahan yang sama akan muncul jika kata yang di-stem mempunyai bentuk N- + -ar,. Algoritme stemming untuk kata ulang dwipurwa adalah dengan mengambil suku kata pertama lalu dibandingkan dengan suku kata berikutnya. Untuk kata sababaraha adalah kata ulang yang mempunyai aturan jika kata dasar memiliki tiga suku kata atau lebih maka yang diulang adalah suku kata kedua. Hasil stemming yang diharapkan dari kata sababaraha adalah sabaraha berapa. Kegagalan stemming untuk kata sababaraha adalah sulitnya menentukan jumlah suku kata dari kata yang akan di-stem. Agoritme yang diracang belum mampu untuk menangani masalah tersebut. Hasil kata lainnya yang tidak sesuai dengan harapan, yang berjumlah 443 kata disebabkan oleh ketidaksempurnaan algoritme dan disebabkan pula ketidaklengkapan data kamus. Untuk penelitian berikutnya diharapkan dapat lebih menyempurnakan algoritme yang dirancang ini serta melengkapi data kamus.

5. KESIMPULAN DAN SARAN

5.1 Kesimpulan

Berdasarkan hasil pengujian dan pembahasan yang telah dilakukan dapat ditarik kesimpulan sebagai berikut: 1. Algoritme stemming yang dirancang mampu memberikan hasil kata yang diharapkan sebesar 91.38 dan mengurangi jumlah kata pada indeks sebesar 49.31. 2. Algoritme stemming yang dirancang mempunyai bentuk heavy stemming. Hal ini disebabkan oleh hasil kesalahan stemming seluruhnya menghasilkan kata yang overstemming dan tidak ada yang understemming. 3. Algoritme stemming yang dirancang sebagian besar memberikan hasil yang cukup baik, meskipun masih ada beberapa kata yang overstemming. Selain itu ada beberapa kata hasil stemming tidak menghasilkan kata seperti yang diharapkan. Potensi kegagalan masih dapat terjadi jika kata yang akan di-stem memiliki pola yang sama dengan kata yang gagal di-stem. 4. Kegagalan dari proses stemming untuk menghasilkan kata dasar yang diharapkan disebabkan ada beberapa ketidaksempurnaan pada algoritme dan belum lengkapnya data kamus.

5.2 Saran

Berikut ini adalah saran-saran untuk penelitian lebih lanjut: 1. Kurang sempurnanya algoritme dapat diperbaiki pada penelitian berikutnya. Selain itu, algoritme stemming yang diteliti masih belum mampu mengatasi bentuk kata yang mengalami morfofonemis, yaitu kata yang memiliki bentuk rarangken barung ka- -an yang merupakan kata dasar awal atau akhir adalah huruf vokal, yang lalu mengalami perubahan bentuk. Contoh untuk kata mofofonemis adalah kabudayaan menjadi kabudayan, kabupatian manjadi