Fase Perancangan 1. Perancangan Proses

108 4.2. Fase Perancangan 4.2.1. Perancangan Proses

4.2.1.1. Perancangan Proses Aplikasi

Analisis pembuatan aplikasi Tashrif Istilahi pada Ilmu Sharaf ini dapat digambarkan secara konseptual sebagai berikut : Gambar 4.1. Gambar Stemmer Fi’il Berdasarkan Gambar di atas, maka masukan sistem berupa Input kata. Input kata ini akan dicek dalam database, apabila Inputan dikenali di dalam database maka akan menghasilkan output, tetapi apabila tidak dikenali di dalam database , maka akan dilakukan pemotongan imbuhan stemming. Kemudian hasil pemotongan stem akan dicek kembali di dalam database. jika ada, maka akan menghasilkan output. Gambar 4.1. jika digambarkan dalam bentuk flowchart adalah sebagai berikut : Aplikasi Stemmer Untuk Fi‟il-fi‟il Pada Al-Qur‟an Surat Al-Baqarah DB Proses Stemming Output Input 109 START Input Kata Cek DB Proses Pemotongan Imbuhan Stemming Cek DB Output di Layar END Ya Tidak Tidak Ya Gambar 4.2. Flowchart Stemmer Fi’il

4.2.1.2. Algoritma Stemming

Dalam perancangan aplikasi ini algoritma stemmer yang penulis gunakan adalah algoritma porter stemmer. Algoritma porter stemmer pada fi’il didasarkan pada sekelompok aturan bersyarat seperti berikut ini : 110 1. Personal Pronoun Dhamir  عف  عف  عف  عف  عف  عف  عف َ  عف  عف  عف  عف  عف  عف َ  عف  عف ت  ت عف  عف ت  ت عف  عف َ ت  ت عف  عف ي  ي عف  عف  عف  عف 2. Suffix  عف ا  اعف  عف  عف  عف ا  ا عف  عف ي  ي عف  عف 3. Prefix  عف ت ف  ع ت ف  عف ف  ع ف  عف ت ا  ع ت ا  عف ت  ع ت  عف ا  ع ا  عف ف  عف ف  عف تف  ع تف  عف 111 يف  ع يف  عف ف  ع ف  عف  عف  عف  ع  عف ي  ع ي  عف ت  ع ت  عف ا  عفا  عف 4. Huruf Mudhori  عف  عف  عف  ع  عف ي  ع ي  عف ت  ع ت  عف 5. Infix  عفا  عفا  عف  عف  عف ا  ع ف  عف 6. Wawu dan 1 huruf setelahnya  عفا + 1  ع عفا  عف 7. Exception  عف  عف  عف  عف  عف  عف  عف ف  ع ف  عف 1 huruf terakhir  عف  عف 112

4.2.1.3. Teknik Stemming Imbuhan

Dalam Ilmu Sharaf untuk mengetahui wazan yang sesuai dengan suatu kata dalam bahasa arab, terlebih dahulu harus mengetahui kata dasar dari fi’il yang berimbuhan kata dasar tersebut dalam bahasa arab disebut dengan fi’il madhi. Fi’il Madhi merupakan bentuk dasar dari berbagai kata jadian yang diperlukan sebagai entri tersendiri, sehingga bentuk- bentuk turunannya diperlukan sebagai subentri dan subkata. Oleh karena itu, pencarian informasi tentang suatu kata, baik itu berupa kata maupun subkata selalu dimulai dengan entrikata Nurlailah, 2009 : 67. Dalam hal ini seseorang yang ingin mengetahui wazan suatu kata dalam bahasa Arab terlebih dahulu harus mengetahui jenis-jenis kata, apakah termasuk fi’il madhi, fi’il mudhori’ atau fi‟il amr. Jika seseorang sudah mengetahui jenis kata tersebut maka dia harus bisa menentukan kata dasar fi’il madhi dari kata tersebut, kemudian dari fi’il madhi bisa dibentuk fi’il mudlori’, dan dari kedua kata tersebutlah bisa diketahui wazan dan dikembangkan untuk mengetahui tashrif perubahan kata dalam bahasa Arab secara lengkap. Untuk lebih mudahnya, bisa dilihat pada skema berikut : 113 Gambar 4.3. Skema Jalannya Aplikasi Stemmer Dalam Information Retrieval, untuk mempercepat pencarian informasi dari sekumpulan data, biasanya orang menyusun data berdasarkan key tertentu, sehingga dengan adanya key tersebut data akan lebih mudah dicari kembali. Misalkan dalam kamus, data disusun urut berdasarkan kata secara alphabetic, contoh lain adalah informasi buku pada perpustakaan dapat dilihat berdasarkan kelompok indeks tertentu seperti, indeks katalog, indeks judul, indeks pengarang, indeks tahun terbit, dan sebagainya. Kata Identifikasi - Fi‟il Madhi - Fi‟il Mudhori - Fi‟il Amr Fi‟il Madhi dari kata tersebut Fi‟il Mudhori asli dari kata tersebut Bisa menentukan wazan dari fi‟il madhi dan mudhori Dari wazan bisa diketahui tashrif perubahan kata lengkapnya Tentukan Tentukan 114 Dalam upaya pengkomputerisasian, cara yang termudah untuk menyusun urutan kata adalah dengan mengindeks seluruh kata berikut urutannya dalam satu berkas indeks. Hal ini akan mengakibatakan ukuran berkas indeks yang semakin besar setiap kali terjadi penambahan kata atau subkata baru, akibatnya dapat mempengaruhi kinerja pencarian kata, seiring dengan perkembangan bahasa itu sendiri dari waktu ke waktu Nurlailah, 2009 : 68-69. Salah satu cara untuk meningkatkan kinerja sistem pencarian kata adalah memperkecil ukuran berkas indeks dengan menyimpan urutan katanya saja. Pencarian variasi turunannya dilakukan dengan menyimpan urutan katanya saja. Pencarian variasi turunannya dilakukan dengan cara menentukan kata yang membentuk turunan tersebut terlebih dahulu, kemudian berdasarkan kata tersebut, dan turunanya dilakukan dengan menggunakan algoritma stemming. Keuntungan penggunaan algoritma ini adalah dimungkinkannya penyimpanan indeks berdasarkan kata, agar dapat memperkecil ukuran berkas indeks dan meningkatkan kinerja pencarian data. Terdapat dua kesalahan fatal yang dimungkinkan terjadi dari pemotongan imbuhan: pemotongan yang terlalu berlebihan overstemming dan pemotongan yang terlalu sedikit understemming. Pemotongan imbuhan yang berlebihan akan mengakibatkan gagalnya pencarian kata didatabase. Misalnya, pemotongan prefix . Pada kata َ َظَن proses stem akan memotong kata tersebut menjadi َ َظ dan kata seperti itu 115 tidak mungkin dijumpai dalam database, karena huruf dan kata ظ adalah satu kesatuan kata yang tidak bisa dipisahkan. Demikian juga pemotongan imbuhan yang terlalu sedikit, seperti pemotongan kata ت . Pemotongan prefix akan menghasilkan kata به ت. Hasil pemotongan kata ini juga tidak mungkin akan ditemui di database karena kata tersebut bukan merupakan katadasar, به ت masih mempunyai prefix ت yang belum dipisahkan. Dan bisa dikatakan sistem akan gagal dalam mencari data. Aplikasi ini akan memperkecil tingkat kesalahan dalam overstemming pemotongan terlalu banyak maupun understemming pemotongan terlalu sedikit.

4.2.1.4. Algoritma Stemmer Fi’il

a. Pseudocode