Praproses Stemming The development of adjective word graph dictionary module in BogorDelftConstruct

7 x100 diuji yang kata benar yang kata akurasi ∑ ∑ = HASIL DAN PEMBAHASAN

1. Hasil Pemahaman Bidang Kajian dan

Identifikasi Masalah Pengkajian mengenai pembentukan kamus word graph kata sifat dan sistem aplikasi BogorDelftConstruct didapat dari penelitian sebelumnya, tesis Usep Rahmat 2009 dan skripsi Deni Romadoni 2009. Identifikasi masalah dalam penelitian ini mencakup keseluruhan yang dijelaskan bab metode penelitian antara lain, pembatasan penelitian berdasarkan ruang lingkup, proses stemming , penggunaan KBBI dalam penelitian, pembentukan pola word graph, pengujian pola word graph , dan analisis hasil pengujian. Pola pembentukan word graph kata sifat berdasarkan aturan yang telah dibuat oleh Rahmat 2009 antara lain se-Kata Sifat, ter- Kata Sifat dengan kualitas paling tinggi, ter- Kata Sifat dengan kualitas paling rendah, ber- Kata Bilangan, me-Kata Benda, Kata Benda-an, Kata Benda-al, Kata Benda-il, Kata Benda-ik, Kata Benda-is, Kata Benda-if, Kata Benda-istis, Kata Benda-i, Kata Benda-iah, Kata Benda-em-, ke-Kata Sifat-an, me-Kata Dasar-kan, dan me- Kata Benda-kan.

2. Praproses

Praproses merupakan tahap awal pengembangan modul Kamus Word Graph Kata Sifat. Praproses dilakukan untuk membatasi nilai masukan pada sistem. Tahap praproses didokumentasikan pada fungsi checkInput dalam sistem. Pada fungsi checkInput terdiri atas fungsi checkString dan checkNum. Fungsi checkString digunakan untuk memeriksa apakah masukan terdiri atas satu kata atau lebih. Jika kata masukan lebih dari satu maka tidak akan diproses ke tahap selanjutnya. Selain itu, fungsi checkNum digunakan untuk membatasi nilai masukan yang berupa numerik, sehingga sistem akan menampilkan peringatan kepada user untuk memasukkan nilai berupa kata bukan numerik ataupun karakter.

3. Stemming

Stemming dibuat sesuai kebutuhan penelitian yaitu mampu membuang awalan, akhiran, sisipan ataupun konfiks gabungan antara awalan dan akhiran. Selain itu, stemming yang dibuat akan menyimpan imbuhan yang terkandung dalam kata masukan. Proses stemming yang digunakan pada penelitian ini mengadopsi proses stemming yang telah dilakukan Iqbal 2010. Proses stemming yang dilakukan Iqbal 2010 mampu menangani masalah overstem dan understem dengan baik. Selain menggunakan KBBI proses stemming yang dilakukan Iqbal 2010 juga menggunakan tabel Fixations untuk menampung imbuhan-imbuhan penyusun kata turunan yang tidak terdapat pada KBBI, seperti ‘di-‘ dan ‘-kan’. Dalam penelitian ini, pada tabel Fixations ditambah dengan beberapa imbuhan asing yang proses pembentukan kata dasarnya tidak mengalami peluruhan. Untuk imbuhan asing yang mengalami peluruhan dilakukan proses stemming terpisah. Untuk imbuhan yang mengalami peluruhan huruf awal kata dasar ‘meng’ dan ‘peng’ sudah tercakup dalam KBBI Iqbal 2010. Proses stemming dengan KBBI yang disajikan dalam Gambar 6 dan dilakukan dengan langkah-langkah berikut: 1. Kata masukan dicari apakah terdapat pada KBBI atau tidak. Jika masukan berupa kata ulang, maka kata masukan terdiri atas dua kata yang akan diproses. Kata pertama adalah kata sebelum tanda hubung - dan kata kedua adalah kata setelah tanda hubung. 2. Jika ada pada KBBI, kata masukan diperiksa apakah mengandung imbuhan yang terdapat pada tabel Fixations atau tidak. Jika ya, dilakukan proses pemotongan berurut sesuai imbuhan- imbuhan yang dikenali pada tabel Fixations . Jika tidak, untuk imbuhan asing maka kata dilakukan proses stemming. Selainnya, kata masukan yang dikenali pada KBBI dikembalikan kata dasarnya dan langsung dicari sifat kata dasarnya dalam KBBI. Jika kata masukan berupa kata ulang maka kata dasarnya langsung diambil dari KBBI tanpa proses stemming. 3. Jika tidak terdapat pada KBBI maka dilakukan proses stemming. Jika kata masukan berupa kata ulang, maka kedua kata yang telah dipisah dilakukan stemming untuk masing-masingnya. 4. Kata masukan dilakukan proses pemotongan bertahap untuk setiap kondisinya. Setiap tahap yang menghasilkan hasil stemming dimasukkan ke dalam daftar kandidat kata. Setiap kata 8 yang terdapat dalam kandidat kata diperiksa apakah terdapat pada KBBI atau tidak. Jika tidak ada satupun kata ditemukan maka dikembalikan kata masukan sebelum di-stem. Jika terdapat lebih dari satu kata, maka dikembalikan semua kata yang ditemukan. Pengembalian kata juga disertai pengambilan sifat kata yang ditemukan. Gambar 6 Proses Stemming. Program stemming terdokumentasi dalam fungsi getStem yang terdiri dari fungsi stemFix untuk kata masukan yang mengandung imbuhan yang terdapat dalam tabel Fixations dan fungsi stemm untuk imbuhan asing dan untuk menanggulangi kata yang tidak terdapat dalam KBBI.

4. Penggunaan KBBI