Data Yang Digunakan Algoritma Enhanced Confix StrippingStemmer ECS

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

Pada bab ini, akan dibahas beberapa hal diantaranya data yang digunakan, penerapan algoritma dan analisa perancangan sistem dalam mengimplementasikan algoritmaconfix stripping stemmer pada proses stemming untuk penerjemahan bahasa Indonesia ke dalam bentuk bahasa isyarat Indonesia.

3.1 Data Yang Digunakan

Data yang digunakan merujuk pada buku Yaquti 2005 dimana kata-kata tersebut sering digunakan masyarakat dalam percakapan sehari-hari dan untuk kata dalam bahasa isyarat Indonesianya merujuk kepada kamus dari Departemen Pendidikan Nasional 2008.

3.2 Algoritma Enhanced Confix StrippingStemmer ECS

Algoritma enhanced confix stripping stemmer adalah algoritma stemming yang akurat untuk mencari kata dasar dari suatu kata dalam bentuk bahasa Indonesia Sholihin, 2013. Penerapan algoritma ECS dinilai efektif Sholihin, 2013 karena struktur kata bahasa isyarat Indonesia mengacu pada tata bahasa Indonesia yang memiliki sedikit perbedaan pada kata yang berbentuk imbuhan di mana imbuhan yang ditemukan pada proses stemming tidak mengalami peluruhan melainkan disimpan sehingga hasil stemming yang akan didapat berupa kata imbuhan dan kata dasarnya. Pada tahap pertama dilakukan proses parsing terhadap kalimat yang diinputkan oleh user. Kemudian tiap kata hasil parsing yang tersimpan di dalam array akan di- stemming menggunakan algoritma ECS yang sudah dimodifikasi. Jika kata tersebut terdapat dalam kamus kata, maka kata merupakan kata dasar. Jika kata tidak terdapat di dalam kamus kata, maka kata tersebut akan mengalami proses stemming dan jika kata tersebut tidak dapat di-stemming, maka kata tersebut akan diurai menjadi huruf per huruf. Universitas Sumatera Utara Proses penerjemahan bahasa Indonesia ke dalam bentuk bahasa isyarat Indonesia dapat direpresentasikan dengan diagram pada gambar 3.1 berikut ini : Kalimat di-parsing menjadi kata per kata Kata yang telah diparsing di- stemming menggunakan algoritma ECS Kata yang telah di- stemming, di-parsing kembali Kata yang tidak terdapat pada database diurai menjadi huruf per huruf Input kalimat oleh user Menampilkan kata sesuai dengan gambar yang ada pada database 1 2 3 4 5 6 Gambar 3.1 Diagram Sistem Diagram tersebut juga dapat dijelaskan dengan contoh sebagai berikut: 1. Input kalimat : Ayah membaca koran 2. Kalimat diparsing menjadi :[ayah][membaca][koran] 3. Kata yang telah diparsing, di-stemming menggunakan algoritma ECS Enhanced Confix stripping - jika [ayah] pada saat di-stemming, ditemukan ada pada kamus kata maka [ayah] dikembalikan sebagai kata dasar - jika [membaca] pada saat di-stemming mengalami tahap berikut 1 kata yang di-stemming dicari di kamus, karena tidak dtemukan maka lakukan langkah 2. 2 Cek kombinasi awalan dan akhiran yang dilarang sesuai Tabel 2.1 pasangan awalan dan akhiran yang tidak diperbolehkan, karena bernilai salah, maka algoritma berjalan normal sesuai langkah 3, 4, 5, 6, 7. 3 Hilangkan partikel “-lah”, “-kah”, “-tah” atau “-pun” 4 hilangkan kata ganti kepemilikan possessive pronoun “-ku”, “-mu”, “- nya”. Universitas Sumatera Utara 5 Hilangkan derivation suffixes akhiran “-i”, “-kan”, “-an”, “-man”, “- wati ”, “-wan”. 6 Hilangkan derivation prefixes awalan “me-“, “ber-“, “di-“, “ke-“, “pe-“, “ter-“, dan “se-“. Pemenggalan awalan sesuai dengan Tabel 2.2 dimana mem{baca} menjadi mem-baca. 7 Kata baca dicari di kamus kata, karena ditemukan maka hasil stemming adalah mem sebagai awalan dan baca sebagai kata dasar. - untuk [koran] karena tidak terdapat pada kamus kata dan setelah mengalami proses stemming dikembalikan sebagaimana bentuk semula, maka [koran] dianggap sebagai kata dasar. 4. Kata yang telah di-stemming akan diparsing kembali. - untuk [ayah] menjadi [ayah] - untuk [mem-baca] menjadi [mem][baca] 5. Untuk [koran] harus mengalami proses penguraian menjadi huruf per huruf karena tidak dapat di-stemming dan tidak terdapat di dalam kamus kata. Maka [koran] menjadi [k][o][r][a][n]. 6. Hasil gambar yang ditampilkan adalah sebagai berikut ayah mem baca k o r a n Untuk flowchart system dapat dilihat pada Gambar 3.2 Universitas Sumatera Utara Mulai Input kalimat oleh user Kalimat di-parsing menjadi kata per kata Kata yang telah diparsing di- stemming Kata yang telah di- stemming, di-parsing kembali Menampilkan kata sesuai dengan gambar yang ada pada database Sesuai Membandingkan kata hasil parsing dengan kata yang ada pada database Kata diurai menjadi huruf per huruf Tabel kata Ya Tidak Selesai P1 P2 Cari gambar pada database yang sesuai dengan huruf Tabel kata Gambar 3.2 Flow Chart Sistem Universitas Sumatera Utara Pada penelitian ini algoritma ECS perlu dimodifikasi agar sesuai dengan aturan tata bahasa isyarat Indonesia. Pada penelitian ini, aturan mereduksi imbuhan akan diganti dengan aturan menyimpan imbuhan. Berikut adalah algoritma ECS yang telah dimodifikasi untuk tata bahasa isyarat Indonesia. 1. Kata yang di-stemming dicari di kamus, jika ada maka algoritma berhenti, jika tidak maka lakukan langkah 2. 2. Cek rule precedence sesuai Tabel 2.1 pasangan awalan dan akhiran yang tidak diperbolehkan, apabila bernilai benar maka lakukan langkah 6, 5, 7. Apabila bernilai salah, maka algoritma berjalan normal sesuai langkah 3, 4, 5, 6, 7. 3. Hilangkan partikel “-lah”, “-kah”, “-tah” atau “-pun” 4. Hilangkan kata ganti kepemilikan possessive pronoun “-ku”, “-mu”, “-nya” 5. Hilangkan derivation suffixes akhiran “-i”, “-kan”, “-an”, “-man”, “-wati”, “- wan ” 6 . Hilangkan derivation prefixes awalan “me-“, “ber-“, “di-“, “ke-“, “pe-“, “ter-“, dan “se-“ a. langkah 5 berhenti jika: i terjadi imbuhan terlarang rule precedence ii awalan yang terdeteksi saat ini sama dengan yang dihilangkan sebelumnya. iii tiga awalan telah dihilangkan b. identifikasikan tipe awalan dan hilangkan, awalan ada 2 tipe: i standar yang dapat langsung dihilangkan ii kompleks adalah tipe-tipe awalan yang dapat bermorfologi sesuai kata dasar yang mengikutinya. Gunakan tabel aturan pemenggalan awalan Tabel 2.2. iii cari kata yang telah dihilangkan awalannya ini dalam kamus. Jika tidak ada maka ulangi langkah 5 ini. 7. Jika setelah 6 langkah sebelumnya dilakukan tetapi kata dasar tidak ditemukan pada database, maka kata awal yang dimasukkan dalam proses stemming dianggap sebagai kata dasar. Pada setiap langkah, dilakukan proses pengecekan output stemming ke kamus. Apabila ditemukan, maka proses ini berhenti. Flowchart untuk proses stemming dapat dilihat pada Gambar 3.3. Universitas Sumatera Utara Cek database Cek kombinasi awalan dan akhiran yang tidak diperbolehkan Hapus awalan Cek database Tidak ada Ya Hapus akhiran Cek database Tidak Tidak ada Ada Kata mengandung partikel Tidak Hapus partikel Cek database Kata mengandung kata ganti kepunyaan Tidak Tidak ada Hapus kata ganti kepunyaan Cek database Kata mengandung akhiran Hapus akhiran Cek database Tidak Tidak ada Tidak Tidak ada Hapus awalan Cek database Kata dasar Ada Ada Ada Ada Ada Ada Kata mengandung awalan Ya P1 P2 Gambar 3.3 Flowchart Proses Stemming Universitas Sumatera Utara

3.3 Analisis Sistem