108
4.2. Fase Perancangan 4.2.1. Perancangan Proses
4.2.1.1. Perancangan Proses Aplikasi
Analisis pembuatan aplikasi Tashrif Istilahi pada Ilmu Sharaf ini dapat digambarkan secara konseptual sebagai berikut :
Gambar 4.1. Gambar Stemmer Fi’il
Berdasarkan Gambar di atas, maka masukan sistem berupa Input kata. Input kata ini akan dicek dalam database, apabila Inputan dikenali di
dalam database maka akan menghasilkan output, tetapi apabila tidak dikenali di dalam database , maka akan dilakukan pemotongan imbuhan
stemming. Kemudian hasil pemotongan stem akan dicek kembali di dalam database. jika ada, maka akan menghasilkan output.
Gambar 4.1. jika digambarkan dalam bentuk flowchart adalah sebagai berikut :
Aplikasi Stemmer Untuk Fi‟il-fi‟il Pada Al-Qur‟an Surat Al-Baqarah
DB
Proses Stemming
Output Input
109
START
Input Kata
Cek DB
Proses Pemotongan Imbuhan Stemming
Cek DB
Output di Layar
END Ya
Tidak
Tidak
Ya
Gambar 4.2. Flowchart Stemmer Fi’il
4.2.1.2. Algoritma Stemming
Dalam perancangan aplikasi ini algoritma stemmer yang penulis gunakan adalah algoritma porter stemmer. Algoritma porter stemmer pada
fi’il didasarkan pada sekelompok aturan bersyarat seperti berikut ini :
110
1.
Personal Pronoun Dhamir
عف
عف
عف
عف
عف
عف
عف َ
عف
عف
عف
عف
عف
عف َ
عف
عف ت
ت عف
عف ت
ت عف
عف َ ت
ت عف
عف ي
ي عف
عف
عف
عف
2.
Suffix
عف ا
اعف
عف
عف
عف ا
ا عف
عف ي
ي عف
عف
3.
Prefix
عف ت ف
ع ت ف
عف ف
ع ف
عف ت ا
ع ت ا
عف ت
ع ت
عف ا
ع ا
عف ف
عف ف
عف تف
ع تف
عف
111
يف
ع يف
عف ف
ع ف
عف
عف
عف
ع
عف ي
ع ي
عف ت
ع ت
عف ا
عفا
عف
4.
Huruf Mudhori
عف
عف
عف
ع
عف ي
ع ي
عف ت
ع ت
عف
5.
Infix
عفا
عفا
عف
عف
عف ا
ع ف
عف
6.
Wawu dan 1 huruf setelahnya
عفا +
1
ع عفا
عف
7.
Exception
عف
عف
عف
عف
عف
عف
عف ف
ع ف
عف
1 huruf terakhir
عف
عف
112
4.2.1.3. Teknik Stemming Imbuhan
Dalam Ilmu Sharaf untuk mengetahui wazan yang sesuai dengan suatu kata dalam bahasa arab, terlebih dahulu harus mengetahui kata dasar
dari fi’il yang berimbuhan kata dasar tersebut dalam bahasa arab disebut
dengan fi’il madhi. Fi’il Madhi merupakan bentuk dasar dari berbagai
kata jadian yang diperlukan sebagai entri tersendiri, sehingga bentuk- bentuk turunannya diperlukan sebagai subentri dan subkata. Oleh karena
itu, pencarian informasi tentang suatu kata, baik itu berupa kata maupun subkata selalu dimulai dengan entrikata Nurlailah, 2009 : 67.
Dalam hal ini seseorang yang ingin mengetahui wazan suatu kata dalam bahasa Arab terlebih dahulu harus mengetahui jenis-jenis kata,
apakah termasuk fi’il madhi, fi’il mudhori’ atau fi‟il amr. Jika seseorang
sudah mengetahui jenis kata tersebut maka dia harus bisa menentukan kata dasar
fi’il madhi dari kata tersebut, kemudian dari fi’il madhi bisa dibentuk
fi’il mudlori’, dan dari kedua kata tersebutlah bisa diketahui wazan dan dikembangkan untuk mengetahui tashrif perubahan kata dalam
bahasa Arab secara lengkap. Untuk lebih mudahnya, bisa dilihat pada skema berikut :
113
Gambar 4.3. Skema Jalannya Aplikasi Stemmer
Dalam Information Retrieval, untuk mempercepat pencarian informasi dari sekumpulan data, biasanya orang menyusun data
berdasarkan key tertentu, sehingga dengan adanya key tersebut data akan lebih mudah dicari kembali. Misalkan dalam kamus, data disusun urut
berdasarkan kata secara alphabetic, contoh lain adalah informasi buku pada perpustakaan dapat dilihat berdasarkan kelompok indeks tertentu
seperti, indeks katalog, indeks judul, indeks pengarang, indeks tahun terbit, dan sebagainya.
Kata
Identifikasi
- Fi‟il Madhi
- Fi‟il Mudhori
- Fi‟il Amr
Fi‟il Madhi dari kata tersebut
Fi‟il Mudhori asli dari kata tersebut
Bisa menentukan wazan dari fi‟il madhi dan mudhori
Dari wazan bisa diketahui tashrif perubahan kata lengkapnya
Tentukan
Tentukan
114
Dalam upaya pengkomputerisasian, cara yang termudah untuk menyusun urutan kata adalah dengan mengindeks seluruh kata berikut
urutannya dalam satu berkas indeks. Hal ini akan mengakibatakan ukuran berkas indeks yang semakin besar setiap kali terjadi penambahan kata atau
subkata baru, akibatnya dapat mempengaruhi kinerja pencarian kata, seiring dengan perkembangan bahasa itu sendiri dari waktu ke waktu
Nurlailah, 2009 : 68-69. Salah satu cara untuk meningkatkan kinerja sistem pencarian kata
adalah memperkecil ukuran berkas indeks dengan menyimpan urutan katanya saja. Pencarian variasi turunannya dilakukan dengan menyimpan
urutan katanya saja. Pencarian variasi turunannya dilakukan dengan cara menentukan kata yang membentuk turunan tersebut terlebih dahulu,
kemudian berdasarkan kata tersebut, dan turunanya dilakukan dengan menggunakan algoritma stemming.
Keuntungan penggunaan algoritma ini adalah dimungkinkannya penyimpanan indeks berdasarkan kata, agar dapat memperkecil ukuran
berkas indeks dan meningkatkan kinerja pencarian data. Terdapat dua kesalahan fatal yang dimungkinkan terjadi dari
pemotongan imbuhan:
pemotongan yang
terlalu berlebihan
overstemming dan pemotongan yang terlalu sedikit understemming. Pemotongan imbuhan yang berlebihan akan mengakibatkan gagalnya
pencarian kata didatabase. Misalnya, pemotongan prefix . Pada kata
َ َظَن
proses stem akan memotong kata tersebut menjadi
َ َظ
dan kata seperti itu
115
tidak mungkin dijumpai dalam database, karena huruf dan kata
ظ
adalah satu kesatuan kata yang tidak bisa dipisahkan. Demikian juga
pemotongan imbuhan yang terlalu sedikit, seperti pemotongan kata
ت .
Pemotongan prefix akan menghasilkan kata
به ت.
Hasil pemotongan kata ini juga tidak mungkin akan ditemui di database karena
kata tersebut bukan merupakan katadasar,
به ت
masih mempunyai prefix
ت
yang belum dipisahkan. Dan bisa dikatakan sistem akan gagal dalam mencari data. Aplikasi ini akan memperkecil tingkat kesalahan dalam
overstemming pemotongan terlalu banyak maupun understemming pemotongan terlalu sedikit.
4.2.1.4. Algoritma Stemmer Fi’il
a. Pseudocode