Recall Dan Precision TINJAUAN PUSTAKA

1. Satu set node, setiap node merepresentasikan setiap variabel yang ada di sistem 2. Link antara dua node yang merepresentasikan hubungan sebab dari satu node ke node lain. 3. Distribusi bersyarat. Hubungan antara n variabel dapat dibangun dengan bantuan pakar, dari data observasi atau dari gabungan keduanya. Jika diberikan n variabel dan satu set data observasi, maka semua hubungan relationship yang mungkin harus ditentukan. Telah dibangun sebuah model bayesian network yang digunakan untuk CBIR Content Based Image Retrieval seperti pada Gambar 2.7. Gambar 2.7. Model Umum Bayesian Network untuk CBIR Pada Gambar 2.7, C 1 ..C n merupakan karakteristik citra, sedangkan I 1 ..I j adalah citra-citra yang terdapat di dalam database. Garis berarah menunjukkan peluang sebuah citra I j memiliki karakteristik C i . Nilai peluang kemiripan antara citra query Q dan citra I di database dapat dihitung menggunakan formula Bayes pada Persamaan 2.28. | Q P Q I P Q I P j j ∧ = 2.28

2.7 Recall Dan Precision

Recall dan precision merupakan parameter yang digunakan untuk mengukur keefektifan algoritma temu kembali informasi Information Retrieval. Misalkan sebuah informasi query Q yang akan dicari dari kumpulan dokumen Collection C 1 C 2 C j C n I 1 I 2 I j I n Citra Basis Data Universita Sumatera Utara Docs. Himpunan R menyatakan dokumen-dokumen yang relevan Relevant Docs dengan query. |R| adalah jumlah elemen himpunan dokumen yang relevan. Anggaplah sebuah algoritma pencarian diterapkan dan menghasilkan himpunan dokumen jawaban Answer Set, A. Dokumen-dokumen di dalam himpunan A diurutkan berdasarkan derajat relevansinya dengan query. Ranking yang dihasilkan dimulai dari derajat relevansi tertinggi. |A| adalah jumlah elemen dari himpunan jawaban A. |Ra| adalah jumlah dokumen yang merupakan irisan himpunan R dan himpunan A. Hubungan antara himpunan-himpunan ini diperlihatkan pada Gambar 2.8 Baeza- Yates, R. dan Ribeiro-Neto, B., 1999. Gambar 2.8 Diagram Himpunan Dokumen Sumber: Baeza-Yates, R. dan Ribeiro-Neto, B., 1999 Recall menyatakan proporsi dari dokumen relevan himpunan R yang diterima sebagai hasil temu kembali, dapat ditentukan dengan Persamaan 2.29. Sementara itu, precision menyatakan proporsi dari dokumen himpunan jawaban A yang relevan, dapat ditentukan dengan Persamaan 2.30. R Ra Recall = 2.29 A Ra recision P = 2.30 Anggaplah himpunan dokumen-dokumen yang relevan dengan informasi Q telah diketahui sebelumnya, yakni Rq={d3, d5, d9, d25, d39, d44, d56, d71, d89, d123}; dalam hal ini terdapat sepuluh dokumen yang relevan. Setelah penerapan Relevant Docs |R| Answer Set |A| Collection Docs Relevant Docs in Answer Set |Ra| Universita Sumatera Utara algoritma pencarian, diperoleh himpunan dokumen jawaban A yang telah diranking dengan hasil sebagai berikut. Ranking himpunan jawaban A untuk query Q: 1. d123 • 6. d9 • 11. d38 2. d84 7. d5 12. d48 3. d56 • 8. d129 13. d250 4. d6 9. d187 14. d113 5. d8 10. d25 • 15. d3 • Dokumen-dokumen yang relevan dengan query q ditandai dengan sebuah bullet setelah nomor dokumen. Dengan memperhatikan ranking ini, mulai dari dokumen paling atas, dapat dijelaskan sebagai berikut. Pertama, dokumen d123 dengan ranking nomor 1 adalah relevan. Selanjutnya, dokumen ini bersesuaian dengan 10 dari seluruh dokumen yang relevan di dalam himpunan Rq. Sehingga dikatakan memiliki precision 100 pada recall 10 precision = 11 atau satu dari satu dokumen yang relevan; recall=110 atau satu dari sepuluh dokumen yang telah dilihat. Kedua, dokumen d56 dengan ranking nomor 3 adalah dokumen yang relevan berikutnya, memiliki precision 66 dua dari tiga dokumen yang relevan pada recall 20 dua dari sepuluh dokumen yang telah dilihat. Nilai recall dan precision selengkapnya diperlihatkan pada Tabel 2.1. Grafik Recall dan Precision diperlihatkan pada Gambar 2.9. Tabel 2.1 Recall dan Precision Recall Precision 10 100 20 66 30 50 40 40 50 33 60 70 80 90 100 Universita Sumatera Utara Gambar 2.9 Grafik Recall - Precision

2.8 Riset-Riset Terkait