log
6 1
=0,778151 log
6 1
=0,778151 log
6 1
=0,778151 log
6 1
=0,778151 log
6 1
=0,778151 log
6 1
=0,778151 log
6 1
=0,778151
Perhitungan bobot kata menggunakan persamaan w = tf
ij
idf
i
. Penggunaan metode binary tf menyebabkan penyederhanaan persamaan
menjadi � =
1 1
× ���
�
= ���
�
untuk tf
ij
= 1, karena nilai tf
ij
1 atau 0.
3.5.1 Vector Space Model
Tabel 3. 22 Perhitungan w dokumen dan query contoh kasus VSM Term
wD1 wD2
wD3 wD4
wD5 wD6
wQ asbes
0,7782 batuk
0 0,3010 0,3010 0 0,3010
0 0,3010 dahak
0 0,7782 0 0,7782
darah 0 0,7782
kering 0 0,4771
0 0,4771 keringat
0 0,7782 kontak
0,7782 malam
0 0,7782 napas
0 0,7782
riwayat 0,7782 0 0,7782
serak 0 0,7782
sesak 0 0,7782
Berdasarkan pada tabel 3.22, perhitungan kemiripan antara masing – masing dokumen dengan query pencarian dapat dituliskan
sebagai berikut: cos
����1, � = 0,7782 × 0,7782
� 0,7782
2
+ 0,7782
2
+ 0,7782
2
× 0,3010
2
+ 0,7782
2
+ 0,7782
2
= 0,393781 cos
����2, � = 0,3010 × 0,3010
� 0,3010
2
+ 0,4771
2
+ 0,7782
2
× 0,3010
2
+ 0,7782
2
+ 0,7782
2
= 0,082639 cos
����3, � = �0,3010 × 0,3010 + 0,7782 × 0,7782�
� 0,3010
2
+ 0,7782
2
× 0,3010
2
+ 0,7782
2
+ 0,7782
2
= 0,731306 cos
����5, � = 0,3010 × 0,3010
� 0,3010
2
+ 0,7782
2
+ 0,4771
2
× 0,3010
2
+ 0,7782
2
+ 0,7782
2
= 0,082639 Dokumen D4 dan D6 tidak dihitung karena tidak ada term pada
D4 dan D6 yang terdapat pada query q. Dari perhitungan, dokumen relevan dapat diurutkan berdasarkan nilai kemiripannya. Semakin besar
nilai kemiripan, semakin tinggi urutan dokumen. Dokumen yang mempunyai nilai kemiripan yang sama, urutan akan berdasar pada abjad
nama dokumen, sehingga urutan dokumen akan menjadi D3, D1, D2, D5.
3.5.2 Extended Boolean Model
Pada EBM, query akan diberikan operator boolean “and”. Dengan demikian query q akan menjadi “riwayat and batuk and dahak”.
Perhitungan bobot kata pada EBM menggunakan persamaan 13, sehingga bobot kata pada EBM dapat dituliskan pada tabel berikut:
Tabel 3. 23 Perhitungan w dokumen dan query contoh kasus EBM Term
wD1 wD2 wD3
wD4 wD5 wD6
asbes batuk
0 0,3869 0,3869 0 0,3869
dahak 1
darah kering
keringat kontak
malam napas
riwayat 1
serak sesak
Perhitungan kemiripan dengan operator and dihitung
menggunakan persamaan pada tabel 3.23. Hasil perhitungan kemiripan adalah sebagai berikut:
����1, � = 1 − � 1
− 0
2
+ 1 − 0
2
+ 1 − 1
2
3
2
= 0,183503
����2, � = 1 − � 1
− 0
2
+ 1 −
0,3869
2
+ 1 − 0
2
3
2
= 0,110076
����3, � = 1 − � 1
− 0
2
+ 1 −
0,3869
2
+ 1 − 1
2
3
2
= 0,322777
����5, � = 1 − � 1
− 0
2
+ 1 −
0,3869
2
+ 1 − 0
2
3
2
= 0,110076
Dari perhitungan, dokumen relevan dapat diurutkan berdasarkan nilai kemiripannya. Semakin besar nilai kemiripan, semakin tinggi urutan
dokumen. Dokumen yang mempunyai nilai kemiripan yang sama, urutan akan berdasar pada abjad nama dokumen, sehingga urutan dokumen akan
menjadi D3, D1, D2, D5.
3.5.3 Probabilistic Model