BAB 3 ANALISIS DAN PERANCANGAN SISTEM
Pada bab ini, akan dibahas beberapa hal diantaranya data yang digunakan, penerapan algoritma
dan analisa
perancangan sistem
dalam mengimplementasikan
algoritmaconfix stripping stemmer pada proses stemming untuk penerjemahan bahasa Indonesia ke dalam bentuk bahasa isyarat Indonesia.
3.1 Data Yang Digunakan
Data yang digunakan merujuk pada buku Yaquti 2005 dimana kata-kata tersebut sering digunakan masyarakat dalam percakapan sehari-hari dan untuk kata dalam
bahasa isyarat Indonesianya merujuk kepada kamus dari Departemen Pendidikan Nasional 2008.
3.2 Algoritma Enhanced Confix StrippingStemmer ECS
Algoritma enhanced confix stripping stemmer adalah algoritma stemming yang akurat untuk mencari kata dasar dari suatu kata dalam bentuk bahasa Indonesia Sholihin,
2013. Penerapan algoritma ECS dinilai efektif Sholihin, 2013 karena struktur kata bahasa isyarat Indonesia mengacu pada tata bahasa Indonesia yang memiliki sedikit
perbedaan pada kata yang berbentuk imbuhan di mana imbuhan yang ditemukan pada proses stemming tidak mengalami peluruhan melainkan disimpan sehingga hasil
stemming yang akan didapat berupa kata imbuhan dan kata dasarnya. Pada tahap pertama dilakukan proses parsing terhadap kalimat yang diinputkan
oleh user. Kemudian tiap kata hasil parsing yang tersimpan di dalam array akan di- stemming menggunakan algoritma ECS yang sudah dimodifikasi. Jika kata tersebut
terdapat dalam kamus kata, maka kata merupakan kata dasar. Jika kata tidak terdapat di dalam kamus kata, maka kata tersebut akan mengalami proses stemming dan jika
kata tersebut tidak dapat di-stemming, maka kata tersebut akan diurai menjadi huruf per huruf.
Universitas Sumatera Utara
Proses penerjemahan bahasa Indonesia ke dalam bentuk bahasa isyarat Indonesia dapat direpresentasikan dengan diagram pada gambar 3.1 berikut ini :
Kalimat di-parsing menjadi kata per
kata
Kata yang telah diparsing di-
stemming menggunakan
algoritma ECS Kata yang telah di-
stemming, di-parsing kembali
Kata yang tidak terdapat pada database
diurai menjadi huruf per huruf
Input kalimat oleh user
Menampilkan kata sesuai dengan
gambar yang ada pada database
1
2
3 4
5
6
Gambar 3.1 Diagram Sistem
Diagram tersebut juga dapat dijelaskan dengan contoh sebagai berikut: 1.
Input kalimat : Ayah membaca koran 2.
Kalimat diparsing menjadi :[ayah][membaca][koran] 3.
Kata yang telah diparsing, di-stemming menggunakan algoritma ECS Enhanced Confix stripping
- jika [ayah] pada saat di-stemming, ditemukan ada pada kamus kata maka [ayah] dikembalikan sebagai kata dasar
- jika [membaca] pada saat di-stemming mengalami tahap berikut 1 kata yang di-stemming dicari di kamus, karena tidak dtemukan maka
lakukan langkah 2. 2 Cek kombinasi awalan dan akhiran yang dilarang sesuai Tabel 2.1
pasangan awalan dan akhiran yang tidak diperbolehkan, karena bernilai salah, maka algoritma berjalan normal sesuai langkah 3, 4, 5, 6, 7.
3 Hilangkan partikel “-lah”, “-kah”, “-tah” atau “-pun”
4 hilangkan kata ganti kepemilikan possessive pronoun “-ku”, “-mu”, “-
nya”.
Universitas Sumatera Utara
5 Hilangkan derivation suffixes akhiran “-i”, “-kan”, “-an”, “-man”, “-
wati ”, “-wan”.
6 Hilangkan derivation prefixes awalan “me-“, “ber-“, “di-“, “ke-“, “pe-“,
“ter-“, dan “se-“. Pemenggalan awalan sesuai dengan Tabel 2.2 dimana mem{baca} menjadi mem-baca.
7 Kata baca dicari di kamus kata, karena ditemukan maka hasil stemming adalah mem sebagai awalan dan baca sebagai kata dasar.
- untuk [koran] karena tidak terdapat pada kamus kata dan setelah mengalami proses stemming dikembalikan sebagaimana bentuk semula, maka [koran]
dianggap sebagai kata dasar. 4. Kata yang telah di-stemming akan diparsing kembali.
- untuk [ayah] menjadi [ayah] - untuk [mem-baca] menjadi [mem][baca]
5. Untuk [koran] harus mengalami proses penguraian menjadi huruf per huruf karena tidak dapat di-stemming dan tidak terdapat di dalam kamus kata. Maka [koran]
menjadi [k][o][r][a][n]. 6. Hasil gambar yang ditampilkan adalah sebagai berikut
ayah mem
baca k
o r
a n
Untuk flowchart system dapat dilihat pada Gambar 3.2
Universitas Sumatera Utara
Mulai
Input kalimat oleh user
Kalimat di-parsing menjadi kata per
kata Kata yang telah
diparsing di- stemming
Kata yang telah di- stemming, di-parsing
kembali
Menampilkan kata sesuai
dengan gambar yang
ada pada database
Sesuai Membandingkan
kata hasil parsing dengan kata yang
ada pada database
Kata diurai menjadi huruf per huruf
Tabel kata
Ya Tidak
Selesai
P1
P2
Cari gambar pada database yang sesuai
dengan huruf Tabel kata
Gambar 3.2 Flow Chart Sistem
Universitas Sumatera Utara
Pada penelitian ini algoritma ECS perlu dimodifikasi agar sesuai dengan aturan tata bahasa isyarat Indonesia. Pada penelitian ini, aturan mereduksi imbuhan
akan diganti dengan aturan menyimpan imbuhan. Berikut adalah algoritma ECS yang telah dimodifikasi untuk tata bahasa isyarat Indonesia.
1. Kata yang di-stemming dicari di kamus, jika ada maka algoritma berhenti, jika tidak maka lakukan langkah 2.
2. Cek rule precedence sesuai Tabel 2.1 pasangan awalan dan akhiran yang tidak diperbolehkan, apabila bernilai benar maka lakukan langkah 6, 5, 7. Apabila
bernilai salah, maka algoritma berjalan normal sesuai langkah 3, 4, 5, 6, 7. 3. Hilangkan partikel
“-lah”, “-kah”, “-tah” atau “-pun” 4.
Hilangkan kata ganti kepemilikan possessive pronoun “-ku”, “-mu”, “-nya” 5. Hilangkan derivation suffixes akhiran
“-i”, “-kan”, “-an”, “-man”, “-wati”, “- wan
” 6
. Hilangkan derivation prefixes awalan “me-“, “ber-“, “di-“, “ke-“, “pe-“, “ter-“, dan
“se-“ a. langkah 5 berhenti jika:
i terjadi imbuhan terlarang rule precedence ii awalan yang terdeteksi saat ini sama dengan yang dihilangkan sebelumnya.
iii tiga awalan telah dihilangkan b. identifikasikan tipe awalan dan hilangkan, awalan ada 2 tipe:
i standar yang dapat langsung dihilangkan ii kompleks adalah tipe-tipe awalan yang dapat bermorfologi sesuai kata
dasar yang mengikutinya. Gunakan tabel aturan pemenggalan awalan Tabel 2.2.
iii cari kata yang telah dihilangkan awalannya ini dalam kamus. Jika tidak ada maka ulangi langkah 5 ini.
7. Jika setelah 6 langkah sebelumnya dilakukan tetapi kata dasar tidak ditemukan pada database, maka kata awal yang dimasukkan dalam proses stemming dianggap
sebagai kata dasar. Pada setiap langkah, dilakukan proses pengecekan output stemming ke kamus.
Apabila ditemukan, maka proses ini berhenti. Flowchart untuk proses stemming dapat dilihat pada Gambar 3.3.
Universitas Sumatera Utara
Cek database
Cek kombinasi awalan dan akhiran
yang tidak diperbolehkan
Hapus awalan Cek database
Tidak ada
Ya
Hapus akhiran
Cek database Tidak
Tidak ada Ada
Kata mengandung
partikel Tidak
Hapus partikel
Cek database
Kata mengandung
kata ganti kepunyaan
Tidak Tidak ada
Hapus kata ganti kepunyaan
Cek database
Kata mengandung
akhiran Hapus
akhiran Cek database
Tidak Tidak ada
Tidak Tidak ada
Hapus awalan Cek database
Kata dasar
Ada
Ada
Ada
Ada
Ada
Ada Kata
mengandung awalan
Ya
P1
P2
Gambar 3.3 Flowchart Proses Stemming
Universitas Sumatera Utara
3.3 Analisis Sistem