Binary weighting Pembobotan term
Jurnal Elektronik Ilmu Komputer - Universitas Udayana JELIKU Vol 2 No. 3 Agustus 2013
46
entitas term, entitas kata dasar, dan entitas stopword.
Seperti yang terlihat pada gambar 2, pada entitas dokumen taerdiri dari atribut
id_dokumen, judul, isi_dokumen, dan lokasi. Untuk entitas term terdiri atribut id_term dan
term. Entitas dokumen dan term memuliki relasi many to many.
Pada entitas kata dasar memiliki atribut id_katadasar dan kata_dasar. Pada entitas
memiliki atribut id_stopword dan stopword. 2.
Flowchart mesin pencari
Flowchat mesin pencari dapat dilihat pada gambar 3, dimana prosesnya meliputi.
1. Penginputan query kata kunci yang
akan dicari. 2.
Proses tokenizing, proses dimana string inputan dibaca, dan dipecah
kedalam bagian perkata. 3.
Filtering, proses dimana tanda baca dan kata hubung dihilangkan.
4. Stemming, proses pencarian kata dasar
dari suatu kata. 5.
Dari hasil stemming akan dilakukan perbandingan dengan kamus bahasa,
untuk memastikan ketepatan hasil stemming.
6. Proses sugesti kata dilakukan bila kata
query tidak terdapat dalam kamus. 7.
Kemudian dilakukan
proses pembobotan untuk mengeetahui bobot
term-term pada query 8.
Dilakukan perhitungan nilai similarity, untuk menentukan dokumen mana
sajakah yang sesuai dengan kata kunci pencarian.
9. Sorting berdasarkan nilai similarity
secara descending. 10.
Tampilkan hasil pencarian.
Mulai
query Tokenizing
Filtering Stemming
Ada dalam kamus
Penghitungan bobot Similarity
Damereu Levenshtein
Kata Usulan
Sorting Hasil
Sorting Kamus kata
dasar Inverted
Indexs Daftar stop
words
N Y
Akhir
Gambar 3. Flowchart aplikasi pencarian
Jurnal Elektronik Ilmu Komputer - Universitas Udayana JELIKU Vol 2 No. 3 Agustus 2013
47