Binary weighting Pembobotan term

Jurnal Elektronik Ilmu Komputer - Universitas Udayana JELIKU Vol 2 No. 3 Agustus 2013 46 entitas term, entitas kata dasar, dan entitas stopword. Seperti yang terlihat pada gambar 2, pada entitas dokumen taerdiri dari atribut id_dokumen, judul, isi_dokumen, dan lokasi. Untuk entitas term terdiri atribut id_term dan term. Entitas dokumen dan term memuliki relasi many to many. Pada entitas kata dasar memiliki atribut id_katadasar dan kata_dasar. Pada entitas memiliki atribut id_stopword dan stopword. 2. Flowchart mesin pencari Flowchat mesin pencari dapat dilihat pada gambar 3, dimana prosesnya meliputi. 1. Penginputan query kata kunci yang akan dicari. 2. Proses tokenizing, proses dimana string inputan dibaca, dan dipecah kedalam bagian perkata. 3. Filtering, proses dimana tanda baca dan kata hubung dihilangkan. 4. Stemming, proses pencarian kata dasar dari suatu kata. 5. Dari hasil stemming akan dilakukan perbandingan dengan kamus bahasa, untuk memastikan ketepatan hasil stemming. 6. Proses sugesti kata dilakukan bila kata query tidak terdapat dalam kamus. 7. Kemudian dilakukan proses pembobotan untuk mengeetahui bobot term-term pada query 8. Dilakukan perhitungan nilai similarity, untuk menentukan dokumen mana sajakah yang sesuai dengan kata kunci pencarian. 9. Sorting berdasarkan nilai similarity secara descending. 10. Tampilkan hasil pencarian. Mulai query Tokenizing Filtering Stemming Ada dalam kamus Penghitungan bobot Similarity Damereu Levenshtein Kata Usulan Sorting Hasil Sorting Kamus kata dasar Inverted Indexs Daftar stop words N Y Akhir Gambar 3. Flowchart aplikasi pencarian Jurnal Elektronik Ilmu Komputer - Universitas Udayana JELIKU Vol 2 No. 3 Agustus 2013 47

3. Diagram Konteks

Diagram konteks ditunjukan pada gambar 4. Pada gambar tersebut menunjukan bahwa sistem menerima masukan dari 2 entitas yaitu use r dan aplikasi client. Entitas user, menginputkan index dokumen yang dijadikan dasar pencarian. Sedangkan perintah pelaksanaan pencarian datang dari aplikasi client . Data flow doagram dari aplikas mesin pencari ini dapat dilihat dari gambar 5. Terdapat 11 proses dalam aplikasi ini, dimana proses 1 sampai dengan 4 adalah proses pengunggahan index dokumen pencarian. Sedangkan proses pencarian dokumen berdasarkan kata kunci dilakukan dari proses 5 sampai dengan proses 11. User Web service mesin pencari Aplikasi client Upload Dokumen Laporan dokumen terupload Hasil Pencarian Input query Gambar 4. Diagram konteks pencarian referensi

4. DFD

User 1 Tokenizing 2 Filtering 3 Stemming 4 Pembentukan Index dokumen Db dokumen 9 Pembobotan User 5 Tokenizing 6 Filtering 7 Stemming 8 Perbaikan Kata 10 Hitung cosine similarity 11 Sorting Hasil Kamus Kata Dasar Term Index Kamus Stopword Upload dokumen Isi dokumen Isi dokumen Term Dokumen Term Isi Query Laporan upload Query Isi query Term Term Frequensi term Bobot dokumen query Nilai Cosine similarity Hasil sorting Data stopword Data kata dasar Data kata dasar Data stopword Db dokumen Data dokumen Data kata dasar Gambar 5. DFD level 0 sistem pencari