1. Satu set node, setiap node merepresentasikan setiap variabel yang ada di sistem
2. Link antara dua node yang merepresentasikan hubungan sebab dari satu node ke
node lain. 3.
Distribusi bersyarat.
Hubungan antara n variabel dapat dibangun dengan bantuan pakar, dari data observasi atau dari gabungan keduanya. Jika diberikan n variabel dan satu set data
observasi, maka semua hubungan relationship yang mungkin harus ditentukan. Telah dibangun sebuah model bayesian network yang digunakan untuk CBIR
Content Based Image Retrieval seperti pada Gambar 2.7.
Gambar 2.7. Model Umum Bayesian Network untuk CBIR
Pada Gambar 2.7, C
1
..C
n
merupakan karakteristik citra, sedangkan I
1
..I
j
adalah citra-citra yang terdapat di dalam database. Garis berarah menunjukkan peluang sebuah citra I
j
memiliki karakteristik C
i
. Nilai peluang kemiripan antara citra query Q dan citra I di database dapat dihitung menggunakan formula Bayes pada
Persamaan 2.28.
| Q
P Q
I P
Q I
P
j j
∧ =
2.28
2.7 Recall Dan Precision
Recall dan precision merupakan parameter yang digunakan untuk mengukur
keefektifan algoritma temu kembali informasi Information Retrieval. Misalkan
sebuah informasi query Q yang akan dicari dari kumpulan dokumen Collection C
1
C
2
C
j
C
n
I
1
I
2
I
j
I
n
Citra
Basis Data
Universita Sumatera Utara
Docs. Himpunan R menyatakan dokumen-dokumen yang relevan Relevant Docs dengan query. |R| adalah jumlah elemen himpunan dokumen yang relevan. Anggaplah
sebuah algoritma pencarian diterapkan dan menghasilkan himpunan dokumen jawaban Answer Set, A. Dokumen-dokumen di dalam himpunan A diurutkan
berdasarkan derajat relevansinya dengan query. Ranking yang dihasilkan dimulai dari derajat relevansi tertinggi. |A| adalah jumlah elemen dari himpunan jawaban A. |Ra|
adalah jumlah dokumen yang merupakan irisan himpunan R dan himpunan A. Hubungan antara himpunan-himpunan ini diperlihatkan pada Gambar 2.8 Baeza-
Yates, R. dan Ribeiro-Neto, B., 1999.
Gambar 2.8 Diagram Himpunan Dokumen
Sumber: Baeza-Yates, R. dan Ribeiro-Neto, B., 1999 Recall menyatakan proporsi dari dokumen relevan himpunan R yang
diterima sebagai hasil temu kembali, dapat ditentukan dengan Persamaan 2.29. Sementara itu, precision menyatakan proporsi dari dokumen himpunan jawaban A
yang relevan, dapat ditentukan dengan Persamaan 2.30.
R Ra
Recall =
2.29
A Ra
recision P
=
2.30
Anggaplah himpunan dokumen-dokumen yang relevan dengan informasi Q telah diketahui sebelumnya, yakni Rq={d3, d5, d9, d25, d39, d44, d56, d71, d89,
d123}; dalam hal ini terdapat sepuluh dokumen yang relevan. Setelah penerapan
Relevant Docs
|R|
Answer Set
|A|
Collection Docs
Relevant Docs
in Answer Set |Ra|
Universita Sumatera Utara
algoritma pencarian, diperoleh himpunan dokumen jawaban A yang telah diranking dengan hasil sebagai berikut.
Ranking himpunan jawaban A untuk query Q: 1. d123
• 6. d9
• 11. d38
2. d84 7. d5
12. d48 3. d56
• 8. d129
13. d250 4. d6
9. d187 14. d113
5. d8 10. d25
• 15. d3
• Dokumen-dokumen yang relevan dengan query q ditandai dengan sebuah
bullet setelah nomor dokumen. Dengan memperhatikan ranking ini, mulai dari dokumen paling atas, dapat dijelaskan sebagai berikut. Pertama, dokumen d123
dengan ranking nomor 1 adalah relevan. Selanjutnya, dokumen ini bersesuaian dengan 10 dari seluruh dokumen yang relevan di dalam himpunan Rq. Sehingga dikatakan
memiliki precision 100 pada recall 10 precision = 11 atau satu dari satu dokumen yang relevan; recall=110 atau satu dari sepuluh dokumen yang telah
dilihat. Kedua, dokumen d56 dengan ranking nomor 3 adalah dokumen yang relevan berikutnya, memiliki precision 66 dua dari tiga dokumen yang relevan pada recall
20 dua dari sepuluh dokumen yang telah dilihat. Nilai recall dan precision selengkapnya diperlihatkan pada Tabel 2.1. Grafik Recall dan Precision diperlihatkan
pada Gambar 2.9.
Tabel 2.1 Recall dan Precision
Recall Precision
10 100
20 66
30 50
40 40
50 33
60 70
80 90
100
Universita Sumatera Utara
Gambar 2.9 Grafik Recall - Precision
2.8 Riset-Riset Terkait