Vector Space Model Extended Boolean Model

log 6 1 =0,778151 log 6 1 =0,778151 log 6 1 =0,778151 log 6 1 =0,778151 log 6 1 =0,778151 log 6 1 =0,778151 log 6 1 =0,778151 Perhitungan bobot kata menggunakan persamaan w = tf ij idf i . Penggunaan metode binary tf menyebabkan penyederhanaan persamaan menjadi � = 1 1 × ��� � = ��� � untuk tf ij = 1, karena nilai tf ij 1 atau 0.

3.5.1 Vector Space Model

Tabel 3. 22 Perhitungan w dokumen dan query contoh kasus VSM Term wD1 wD2 wD3 wD4 wD5 wD6 wQ asbes 0,7782 batuk 0 0,3010 0,3010 0 0,3010 0 0,3010 dahak 0 0,7782 0 0,7782 darah 0 0,7782 kering 0 0,4771 0 0,4771 keringat 0 0,7782 kontak 0,7782 malam 0 0,7782 napas 0 0,7782 riwayat 0,7782 0 0,7782 serak 0 0,7782 sesak 0 0,7782 Berdasarkan pada tabel 3.22, perhitungan kemiripan antara masing – masing dokumen dengan query pencarian dapat dituliskan sebagai berikut: cos ����1, � = 0,7782 × 0,7782 � 0,7782 2 + 0,7782 2 + 0,7782 2 × 0,3010 2 + 0,7782 2 + 0,7782 2 = 0,393781 cos ����2, � = 0,3010 × 0,3010 � 0,3010 2 + 0,4771 2 + 0,7782 2 × 0,3010 2 + 0,7782 2 + 0,7782 2 = 0,082639 cos ����3, � = �0,3010 × 0,3010 + 0,7782 × 0,7782� � 0,3010 2 + 0,7782 2 × 0,3010 2 + 0,7782 2 + 0,7782 2 = 0,731306 cos ����5, � = 0,3010 × 0,3010 � 0,3010 2 + 0,7782 2 + 0,4771 2 × 0,3010 2 + 0,7782 2 + 0,7782 2 = 0,082639 Dokumen D4 dan D6 tidak dihitung karena tidak ada term pada D4 dan D6 yang terdapat pada query q. Dari perhitungan, dokumen relevan dapat diurutkan berdasarkan nilai kemiripannya. Semakin besar nilai kemiripan, semakin tinggi urutan dokumen. Dokumen yang mempunyai nilai kemiripan yang sama, urutan akan berdasar pada abjad nama dokumen, sehingga urutan dokumen akan menjadi D3, D1, D2, D5.

3.5.2 Extended Boolean Model

Pada EBM, query akan diberikan operator boolean “and”. Dengan demikian query q akan menjadi “riwayat and batuk and dahak”. Perhitungan bobot kata pada EBM menggunakan persamaan 13, sehingga bobot kata pada EBM dapat dituliskan pada tabel berikut: Tabel 3. 23 Perhitungan w dokumen dan query contoh kasus EBM Term wD1 wD2 wD3 wD4 wD5 wD6 asbes batuk 0 0,3869 0,3869 0 0,3869 dahak 1 darah kering keringat kontak malam napas riwayat 1 serak sesak Perhitungan kemiripan dengan operator and dihitung menggunakan persamaan pada tabel 3.23. Hasil perhitungan kemiripan adalah sebagai berikut: ����1, � = 1 − � 1 − 0 2 + 1 − 0 2 + 1 − 1 2 3 2 = 0,183503 ����2, � = 1 − � 1 − 0 2 + 1 − 0,3869 2 + 1 − 0 2 3 2 = 0,110076 ����3, � = 1 − � 1 − 0 2 + 1 − 0,3869 2 + 1 − 1 2 3 2 = 0,322777 ����5, � = 1 − � 1 − 0 2 + 1 − 0,3869 2 + 1 − 0 2 3 2 = 0,110076 Dari perhitungan, dokumen relevan dapat diurutkan berdasarkan nilai kemiripannya. Semakin besar nilai kemiripan, semakin tinggi urutan dokumen. Dokumen yang mempunyai nilai kemiripan yang sama, urutan akan berdasar pada abjad nama dokumen, sehingga urutan dokumen akan menjadi D3, D1, D2, D5.

3.5.3 Probabilistic Model