Temu Kembali Informasi Dokumen XML dengan Pembobotan per Konteks

TEMU KEMBALI INFORMASI DOKUMEN XML
DENGAN PEMBOBOTAN PER KONTEKS

RINA KURNIAWATI

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Temu Kembali
Informasi Dokumen XML dengan pembobotan per konteks adalah benar karya
saya denganarahan dari komisi pembimbing dan belum diajukan dalam bentuk
apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau
dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah
disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir
skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.

Bogor, Januari 2014
Rina Kurniawati
NIM G64096053

ABSTRAK
RINA KURNIAWATI. Temu Kembali Informasi Dokumen XML dengan
Pembobotan per Konteks. Dibimbing oleh JULIO ADISANTOSO.
Penelitian temu kembali informasi menggunakan dokumen XML sudah
banyak dilakukan, namun sistem yang dikembangkan belum memperhatikan
struktur atau tag dari dokumen XML. Penelitian ini mengembangkan sistem temu
kembali informasi dengan menggunakan pembobotan per konteks atau tag. Setiap
bobot yang dikenakan terhadap masing-masing konteks didapat dari hasil
pencarian keterhubungan antara kemiripan tiap konteks pada dokumen terhadap
kueri dengan kemiripan dokumen secara keseluruhan terhadap kueri dengan
menggunakan metode regresi linier. Pada penelitian ini sistem temu kembali
informasi yang telah dibangun dengan menggunakan pembobotan per konteks
dievaluasi dengan menggunakan 30 pasang kueri. Percobaan ini menghasilkan
penurunan nilai rata-rata mean average precision(MAP)sebesar 1.15% jika

dibandingkan dengan sistem temu kembali informasi tanpa menggunakan
pembobotan per konteks.
Kata kunci:pembobotan tag XML, temu kembali informasi

ABSTRACT
RINA KURNIAWATI. XML Document Information Retrieval using Context
Weighting. Supervised by JULIO ADISANTOSO
Various research in the field of information retrieval using XML documents
have been conducted.However, those systems didnot consider the structure or tags
of the XML documents. To improve the performance of the information retrieval
system, we develop an information retrieval system using context weighting. Each
weight which is implemented on each context is obtained from the result of
correlation between the similarity of each context of the document to the queries
and the similarity of the whole document to the queries using linear regression
method. The information retrieval system that has been developed using the
context weighting is evaluated by using 30 queries. It is found that this experiment
decreases the average Mean Average Precision (MAP) value by 1.15% if
compared with the information retrieval system without context.
Keywords :information retrieval, XMLtag weighting


TEMU KEMBALI INFORMASI DOKUMEN XML
DENGAN PEMBOBOTAN PER KONTEKS

RINA KURNIAWATI

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

Penguji:
1 Mushthofa, SKom MSc
2 Toto Haryanto, SKom MSi


Judul Skripsi
Nama
NIM

: Temu Kembali Informasi Dokumen XML dengan Pembobotan
per Konteks
: Rina Kurniawati
: G64096053

Disetujui oleh

Ir Julio Adisantoso, MKom
Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi MKom
Ketua Departemen


Tanggal Lulus:

Judul Skripsi
Nama
NIM

Temu Kembali Informasi Dokumen XML dengan Pembobotan
per Konteks
Rina Kurniawati
G64096053

Disetujui oleh

Pembimbing

.:.:
]Zセ@

Tanggal Lulus:


2 7 JA N 20 14

PRAKATA
Puji dan syukur penulis panjatkan ke hadirat Allah subhanahu
wata’alayang telah melimpahkan rahmat sehingga penulis dapat menyelesaikan
penelitian dan tulisan yang berjudul Temu Kembali Informasi Dokumen XML
dengan Pembobotan per Konteks ini.
Terima kasih penulis ucapkan kepada Bapak Ir Julio Adisantoso M. Kom
selaku pembimbing yang telah memberikan arahan, dan saran selama penelitian
ini berlangsung. Ungkapan terima kasih juga disampaikan kepada orang tua serta
seluruh pihak yang turut membantu baik secara langsung maupun tidak langsung
atas doa dan dukungannya.
Penulis menyadari bahwa dalam penulisan tugas akhir ini masih terdapat
banyak kekurangan dan kelemahan dalam berbagai hal karena keterbatasan
kemampuan penulis. Penulis berharap adanya masukan berupa saran dan kritik
yang bersifat membangun dari pembaca demi kesempurnaan tugas akhir ini,
sehingga dapat bermanfaat.

Bogor, Januari 2014
Rina Kurniawati


DAFTAR ISI
DAFTAR TABEL

iv

DAFTAR GAMBAR

iv

DAFTAR LAMPIRAN

iv

PENDAHULUAN

1

Latar Belakang


1

Tujuan Penelitian

1

Ruang Lingkup Penelitian

1

METODE PENELITIAN

2

Perolehan Dokumen

3

Praproses


3

Perhitungan Koefisien

4

Perhitungan Kedekatan

4

Evaluasi Sistem

5

Lingkungan Penelitian

6

HASIL DAN PEMBAHASAN


6

Perolehan koleksi dokumen

6

Praproses

7

Perhitungan Koefisien

7

Perhitungan Kemiripan

8

Evaluasi


9

SIMPULAN DAN SARAN

10

Simpulan

10

Saran

11

DAFTAR PUSTAKA

11

LAMPIRAN

13

RIWAYAT HIDUP

27

DAFTAR TABEL
1 Kemiripan dokumen terhadap kueri
2 Ilustrasi inverted index yang ditambahkan dengan bobot per konteks
3 Ilustrasi recall dan precision
4 Nilai kemiripan dokumen terhadap kueri ‘gagal panen’
5 Perbandingan nilai AVP dan MAP

4
5
5
8
9

DAFTAR GAMBAR
1 Flowchart penelitian secara umum
2 Persamaan regresi
3 Grafik perbandingan antara masing-masing AVP

2
8
10

DAFTAR LAMPIRAN
1
2
3
4
5
6
7
8
9
10
11
12

Contoh dokumen pengujian
12
Daftar kueri dan jumlah dokumen relevan
13
Daftarstopword
14
Interpolasi precision dan recall pada sistem temu kembali informasi tanpa
memperhatikan konteks
18
Interpolasi precision dan recall pada sistem temu kembali informasi dengan
pembobotan pada konteks title, author dan text
19
Interpolasi precision dan recall pada sistem temu kembali informasi dengan
pembobotan pada konteks title dan author
20
Interpolasi precision dan recall pada sistem temu kembali informasi dengan
pembobotan pada konteks author dan text
21
Interpolasi precision dan recall pada sistem temu kembali informasi dengan
pembobotan pada konteks title dan text
22
Interpolasi precision dan recall pada sistem temu kembali informasi dengan
pembobotan pada konteks author
23
Interpolasi precision dan recall pada sistem temu kembali informasi dengan
pembobotan pada konteks text
24
Interpolasi precision dan recall pada sistem temu kembali informasi dengan
pembobotan pada konteks title
25
Tampilan antarmuka sistem temu kembali informasi
26

1

PENDAHULUAN
Latar Belakang
Kebutuhan terhadap informasi yang semakin tinggi mengakibatkan
munculnya permasalahan bagaimana teknik memperoleh informasi yang efektif
dan efisien.Tujuan dari sistem temu kembali informasi adalah mengembalikan
informasi yang relevan dengan kueri dan informasi yang tidak relevan sesedikit
mungkin (Baeza-Yates dan Ribeiro-Neto 1999).
Terdapat dua pendekatan yang mungkin dalam temu kembali informasi pada
dokumen extensible markup language (XML) (Kamps et al. 2003):
1 Full document retrieval system, sistem ini menggunakan dokumen standar
sebagai indexing unit dan dokumen secara keseluruhan dianggap sebagai
retrieval unit
2 XML element retrieval system, sistem ini menggunakan elemen XML sebagai
indexing unit dan setiap elemen yang membentuk struktur dokumen
dipertimbangkan sebagai retrieval unit (Rahman 2006).
Sistem temu kembali informasi menggunakan dokumen XML dapat
digunakan untuk menjawab permasalahan tersebut. Teknologi XML yang
dikembangkan sejak tahun 1996, selain dapat digunakan untuk menampilkan
informasi juga memiliki kemampuan untuk menyimpan data secara terstruktur
serta sebagai format pertukaran data.
Penelitian dibidang temu kembali informasi menggunakan dokumen XML
sudah banyak dilakukan, akan tetapi sistem temu kembali informasi dokumen
XML yang dikembangkan belum memperhatikan struktur atau tag dari dokumen.
Karena hal tersebut, maka penelitian ini akan mengembangkan sistem temu
kembali informasi pada dokumen terstruktur XML dengan memperhatikan
struktur dokumen yaitu dengan memberikan bobot pada setiap konteks (tag) yang
ada pada dokumen XML. Penelitian ini diharapkan dapat memperbaiki nilai
average precision danmean average precision pada temu kembali informasi
dokumen XML.
Tujuan Penelitian
Penelitian ini bertujuan mengimplementasikan sistem temu kembali
informasi menggunakan dokumen XML dengan memperhatikan struktur
dokumen.
Ruang Lingkup Penelitian
Penelitian menggunakan dokumen XML berbahasa Indonesia yang masingmasing memiliki struktur yang seragam.

2

METODE PENELITIAN
Suatu penelitian yang baik diperlukan perencanaan yang matang atas
metode yang telah ditetapkan. Secara garis besar penelitian dilakukan dalam
beberapa tahap, yaitu perolehan dokumen, praproses, perhitungan koefisien perkonteks, perhitungan kedekatan, dan evaluasi.Flowchart penelitian secara garis
besar dapat dilihat pada Gambar 1.
Korpus

Perolehan
dokumen

Parsing

Kueri

Penghapusan
stopwords

Inverted
index

Hitung kemiripan

Hitung koefisien

Persamaan
regresi

Hitung kemiripan
baru

Top n
dokumen

Evaluasi

Gambar 1 Flowchart penelitian secara umum

3
Perolehan Dokumen
Penelitian ini menggunakan dokumen berbahasa Indonesia yang memiliki
struktur XML seragam yang terdiri atas 1000 dokumen berita di bidang pertanian
yang bersumber dari Laboratorium Temu Kembali Informasi di Institut Pertanian
Bogor.
Kumpulan dokumen tersebut memiliki struktur sebagai berikut:

…………………………....
……………………………........
……………………………
…………………………………

Praproses
Tahap praproses terdiri atas parsing yaitu proses yang mengubah dokumen
menjadi unit-unit kecil berupa kata, frasa, atau kalimat dengan menggunakan
algoritme tokenizer. Unit-unit ini disebut sebagai token. Proses parsing
dilanjutkan dengan proses pembuangan kata yang dianggap tidak relevan dan
tidak bermakna terhadap dokumen sesuai dengan stoplist.
Daftar term yang dihasilkan dari proses parsing kemudian mengalami
pembobotan term (weighting) dengan menggunakan metode BM25 secara
otomatis oleh Sphinx sehingga menghasilkan inverted index yang berisi informasi
seperti frekuensi kemunculan dan posisi term tertentu.
Pembobotan BM25 menggabungkan bobot idf dengan koleksi pengskalan
khusus untuk dokumen dan kueri (Kontostathis et al. 2008). Pembobotan ini
digunakan untuk membuat peringkat antardokumen dan mengukur kesamaan
antara kueri dengan dokumen pada korpus. Perhitungan yang digunakan untuk
mengukur kemiripan dokumen terhadap kueri menggunakan pembobotan BM25
yang sudah disediakan Sphinx dengan rumussebagai berikut:
w
TF i 1+k

BM25 =

TF i +k(1-b+b
i=1

DL
)
avgDL

IDF(i)

dengan
log

IDF(i) =

N-n+1
n

log N

Keterangan:
w
: jumlah kata pada kueri
TF(i) : frekuensi kata pada kueri yang ditemukan pada dokumen
IDF(i): invers dari frekuensi dokumen yang terdapat kemunculan kata pada kueri
N
: jumlah dokumen pada korpus
n
: jumlah dokumen yang relevan dengan kueri
b
: konstanta bernilai 0.75
k
: konstanta bernilai 1.2
DL
: panjang dokumen.
avgDL : rata-rata panjang dokumen pada korpus.

4
Perhitungan Koefisien
Pengukuran kemiripan antara dokumen terhadap kueri dilakukan pada
masing-masing konteks dan juga dilakukan pada dokumen secara keseluruhan,
sehingga didapat tabel ukuran kemiripan dokumen untuk masing-masing kueri
yang diujikan seperti yang ditunjukkan pada Tabel 1.
Doc
1
2
3

Tabel 1 Kemiripan dokumen terhadap kueri
Sim(flat)
Sim(title)
Sim(author)
w1
w11
w12
w2
w21
w22
w3
w31
w32

Sim(text)
w13
w23
w33

Pada Tabel 1, kolom Doc menunjukan nomor dokumen, kolom Sim(flat)
menunjukkan nilai kemiripan dokumen terhadap kueri tanpa memperhatikan
konteks, sedangkan kolom Sim(title), Sim(author) dan Sim(text) menunjukkan
nilai kemiripan dokumen terhadap kueri pada masing-masing konteks.
Perhitungan koefisien sebagai pembobot masing-masing konteks pada
dokumen dicari dengan menggunakan Tabel 1, yakni dengan cara mencari
hubungan antara kemiripan dokumen terhadap kueri per-konteks dengan
kemiripan dokumen terhadap kueri yang tidak memperhatikan konteks(flat)
menggunakan regresi linier sehingga didapat persamaan seperti berikut:
y = a + bx1 + c x2 + d x3
Keterangan:
y : kemiripan dokumen terhadap kueri sebagai variabel terikat.
a : konstanta intersep.
x1 : kemiripan konteks title terhadap kueri sebagai variabel bebas.
b : koefisien bobot konteks title.
x2 : bobot konteks author terhadap kueri sebagai variabel bebas.
c : koefisien bobot konteks author.
x3 : bobot konteks text terhadap kueri sebagai variabel bebas.
d : koefisien bobot konteks text.
Perhitungan Kedekatan
Koefisien masing-masing konteks pada persamaan regresi dijadikan bobot
terhadap nilai kemiripan dokumen terhadap kueri dengan cara mengembalikan
nilai koefisien ke dalam persamaan regresi linier yang didapat dari tahap
sebelumnya sehingga didapat nilai kemiripan yang baru.
Ilustrasi perhitungan nilai kemiripan antara dokumen dan kueri pada
pembobotan per konteks dapat diwakilkan dengan tabel seperti pada Tabel 2.
Setelah user melakukan input kueri (q), didapat nilai kemiripan antara
masing-masing dokumen dengan kueri (q) pada tiap konteks (ci) secara otomatis
menggunakan Sphinx dengan menggunakan pengukuran BM25.
Masing-masing nilai kemiripan dokumen terhadap kueri secara per konteks
dikembalikan ke dalam persamaan regresi linier sehingga menghasilkan nilai

5
kemiripan dokumen terhadap kueri baru yang sudah memperhatikan bobot per
konteks, yang disusun berdasarkan nilai yang paling besar sampai terkecil.
Tabel 2 Ilustrasi inverted index yang ditambahkan dengan bobot per konteks
Konteks
Term
Dokumen-i
Koefisien
Title(c1)
gagal
d1
k1
panen
d2
Author(c2)
gagal
d1
k2
panen
d2
Text (c3)
gagal
d1
k3
panen
d2
Keterangan:
Konteks
:konteks pada dokumen.
Term
:term/kata pada kueri.
Dokumen :nomor dokumen.
Koefisien : koefisien yang diimplementasikan pada masing-masing konteks.

Evaluasi Sistem
Dua ukuran yang sering dipakai untuk mengukur efektifitas suatu sistem
temu kembali informasi adalah recall dan precision (Manning et al. 2008). Recall
menyatakan jumlah dokumen relevan yang dapat dibangkitkan oleh sistem temu
kembali informasi yang merupakan proporsi antara jumlah dokumen relevan yang
ditemukembalikan dengan jumlah semua dokumen relevan yang terdapat pada
koleksi dokumen. Sedangkan precision adalah perbandingan antara jumlah
dokumen relevan yang ditemukembalikan dengan jumlah seluruh dokumen yang
ditemukembalikan. Nilai recall dan precision dapat diilustrasikan seperti tertera
pada Tabel 3.
Tabel 3 Ilustrasi recall dan precision
Document
Relevant
Nonrelevant
Retrieved
True positives (tp)
False positive (fp)
Not retrieved False negatives (fn)
True negatives (tn)
Keterangan:
��
Recall =

�� +��

Precision =

��

�� +��

Sistem diuji dengan menggunakan average precision danmean average
precision. Setiap hasil temu kembali informasi dilakukan penghitungan nilai
precision pada 11 tingkat nilai recall, yaitu 0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8,
0.9, dan 1.0 . Nilai precision kemudian dirata-ratakan untuk mendapatkan nilai
average precision (AP).
Sebuah sistem temu kembali informasi dianggap baik jika nilai average
precision dan mean average precision-nya tinggi.

6
Lingkungan Penelitian
Lingkungan yang digunakan untuk penelitian ini memiliki spesifikasi
sebagai berikut:
Perangkat keras:
1 Processor Intel U4100 @1.30GHz,
2 RAM kapasitas 2 GB,
3 Harddisk kapasitas 100GB,
Perangkat lunak:
1 Windows 7 Ultimate sebagai sistem operasi
2 Apache XAMPP 1.8.1 sebagai web server
3 Sphinx search 2.0.1
4 Notepad++ v6.1.3 sebagai script editor
5 Minitab 16 statistical software sebagai aplikasi untuk membantu penentuan
persamaan regresi linier
6 Microsoft Excel 2007 sebagai aplikasi untuk membantu evaluasi sistem.

HASIL DAN PEMBAHASAN
Perolehan Koleksi Dokumen
Koleksi dokumen yang digunakan dalam penelitian ini bersumber dari
korpus yang sudah tersedia di laboratorium Temu Kembali Informasi Departemen
Ilmu Komputer Institut Pertanian Bogor. Koleksi terdiri atas 1000 dokumen
dengan format spreadsheet(.xml) dengan struktur tag XML yang seragam pada
masing-masing dokumen. Contoh dokumen pengujian yang digunakan dapat
dilihat pada Lampiran 1. Tag XML pada koleksi dokumen uji yang digunakan
adalah sebagai berikut:
 yang mewakili keseluruhan dokumen, di dalamnya
terdapat tag lain yang mendeskripsikan isi dokumen secara lebih detail.
 yang mewakili ID dokumen. ID yang dipakai merupakan
kombinasi nama sumber berita, tanggal berita atau urutan berita pada tanggal
yang sama.
 yang mewakili judul dokumen.
 yang mewakili penulis dokumen.
 yang mewakili isi dokumen.
Selain itu, untuk mengevaluasi sistem yang dihasilkan dari penelitian ini
digunakan pasangan kueri-dokumen relevan yang dapat dilihat pada Lampiran 2.
Kueri yang digunakan pada penelitian ini terdiri atas 30 kueri dengan 10 kueri
yang mewakili konteks title, 10 kueri yang mewakili konteks author dan 10 kueri
yang mewakili konteks text.

7
Praproses
Praproses dokumen terdiri atas proses parsing atau tokenisasi, serta proses
pembuangan stopwords dan pembobotan. Proses ini dilakukan secara otomatis
dengan menggunakan fungsi indexing yang ada pada Sphinx. Proses parsing
dilakukan untuk mendapatkan kata unik atau term dari seluruh koleksi dokumen
dengan cara memisahkan tiap-tiap kata dengan karakter pemisah seperti titik,
koma dan whitespace.
Proses parsing kemudian diikuti dengan proses pembuangan stopwords,
yaitu membuang kata yang dianggap tidak memiliki arti seperti kata sambung,
kata depan. Kata-kata yang termasuk dalam stopwords (Lampiran 3) diperoleh
dari laboratorium Temu Kembali Informasi. Proses pembuangan stopwords
dilakukan dengan mencocokan term yang terdapat pada hasil parsing dengan term
pada stoplist yang berisi daftar term yang akan dihapus. Hasil proses parsing dan
pembuangan stopwords berupa tabel yang terdiri atas daftar term beserta frekuensi
kemunculan pada tiap dokumen dan jumlah dokumen yang mengandung term
tersebut. Tahap terakhir dari praproses yaitu pembobotan. Proses pembobotan
menggunakan metode BM25 dilakukan secara otomatis dengan menggunakan
Sphinx. Praproses untuk sistem temu kembali yang belum memperhatikan konteks
dilakukan pada tag , , , sedangkan untuk penelitian
ini proses indexing berlaku pada tag, , dan saja .
Perhitungan Koefisien
Koefisien bobot merupakan koefisien yang berperan sebagai bobot baru
yang digunakan untuk mendapatkan nilai kemiripan dokumen dengan kueri pada
uji coba sistem temu kembali informasi dengan pembobotan per konteks, maka
dari itu digunakan nilai kemiripan dokumen dengan kueri pada sistem temu
kembali informasi tanpa pembobotan sebagai variabel dalam penentuan koefisien.
Metode yang digunakan dalam menentukan koefisien bobot yaitu regresi linier,
dimana pada proses perhitungan regresi, penulis menggunakan Minitab 16.
Karena nilai kemiripan antara dokumen dan kueri pada sistem temu kembali
informasi tanpa menggunakan pembobotan diperlukan sebagai variabel pada
perhitungan koefisien, maka tahap pertama pada proses ini yaitu melakukan temu
kembali informasi seperti yang biasa dilakukan, dengan beberapa kondisi. Yang
pertama, temu kembali pada konteks secara keseluruhan, yaitu text, title dan
author, kemudian melakukan temu kembali informasi pada masing-masing
konteks tersebut, sehingga didapat nilai kemiripan per kueri per dokumen
sebanyak 4 buah untuk masing-masing konteks. Proses temu kembali informasi
ini menggunakan library yang ada pada Sphinx dengan ranker
SPH_RANK_PROXIMITY_BM25. Sebagai contoh, nilai kemiripan dokumen
terhadap kueri 2, yaitu ‘gagal panen’, ditunjukkan pada Tabel 4.
Pada Tabel 4 terlihat bahwa nilai kemiripan antara kueri ‘gagal panen’
dengan dokumen nomor 979 bernilai 2597 pada konteks keseluruhan, bernilai
1597 pada konteks title, dan bernilai 1597 pada konteks text.
Data yang didapat dari proses temu kembali ini dipilah berdasarkan
dokumen yang relevan saja. Data ini kemudian diolah dengan menggunakan
metode regresi linier untuk dicari keterhubungan antara nilai kemiripan yang
didapat dari temu kembali per konteks dengan nilai kemiripan yang didapat dari

8
temu kembali secara keseluruhan, dimana nilai kemiripan yang didapat dari hasil
temu kembali per konteks berlaku sebagai variabel bebas dan nilai kemiripan yang
didapat dari hasil temu kembali secara keseluruhan berlaku sebagai variabel
terikat. Dari proses ini didapat persamaan regresi berikut.
Tabel 4 Nilai kemiripan dokumen terhadap kueri ‘gagal panen’
Doc
Sim(Flat) Sim(Title) Sim(Author) Sim(Text)
896
1569
0
0
1569
960
1591
0
0
1591
979
2597
1597
0
1597
980
1604
0
0
1604

y = 966 + 0.532 x1 + 0.390 x2 + 0.503 x3
Gambar 2 Persamaan regresi
Keterangan:
y : nilai kemiripan dokumen secara utuh terhadap kueri.
x1 : nilai kemiripan konteks title pada dokumen terhadap kueri.
x2 : nilai kemiripan konteks author pada dokumen terhadap kueri.
x3 : nilai kemiripan konteks text pada dokumen terhadap kueri.
Persamaan regresi pada Gambar 2 menunjukkan bahwa title memiliki bobot
lebih tinggi disbanding text dan author. Dari persamaan regresi pada Gambar 2
dapat diambil kesimpulan bahwa konteks title memiliki pengaruh sebesar 0.532,
konteks title memiliki pengaruh sebesar 0.39,dan konteks text memiliki pengaruh
sebesar 0.503.
Perhitungan Kemiripan
Koefisien regresi dari masing-masing konteks yang didapat dari persamaan
regresi linier kemudian diimplementasikan kedalam sistem temu kembali, dimana
koefisien regresi masing-masing konteks dikalikan dengan bobot dokumen sesuai
konteks masing-masing sehingga didapat nilai kemiripan baru untuk masingmasing dokumen terhadap kueri yang diujikan.
Sebagai contoh pada Tabel 4 yang menunjukkan nilai kemiripan kueri
‘gagal panen’ terhadap dokumen secara keseluruhan maupun per konteks.
Dokumen nomor 979 yang relevan terhadap kueri ‘gagal panen’ dan memiliki
nilai kemiripan sebesar 2597 terhadap keseluruhan dokumen tanpa
memperhatikan konteks, dan memiliki nilai kemiripan sebesar 1597 pada konteks
title dan 1597 pada konteks text.
Untuk mendapatkan nilai kemiripan baru maka setiap nilai kemiripan yang
sebelumnya didapat masing-masing dikalikan dengan koefisien regresi sesuai
masing-masing konteks.
y adalah nilai kemiripan yang baru
y = 0.532 x1 + 0.390 x2 + 0.503 x3
y = (0.532 x 1597) + (0.390 x 0 ) + (0.503 x 1597)
y = 1652.895

9
Nilai kemiripan yang baru ini kemudian diurutkan dari nilai yang terbesar
hingga nilai yang terkecil, semakin besar nilai kemiripan dokumen terhadap kueri
maka dianggap relevansinya semakin tinggi.
Evaluasi
Proses evaluasi dilakukan setelah hasil temu kembali informasi diperoleh.
Sistem dievaluasi dengan membandingkan nilai average precision (AVP) dan
mean average precision(MAP) dari sistem temu kembali informasi yang belum
memperhatikan konteks dengan sistem yang menggunakan pembobotan per
konteks.
Tahap pertama pada pengujian dilakukan dengan melakukan kegiatan temu
kembali dengan menggunakan 30 kueri (Lampiran 2). Kegiatan temu kembali
informasi dilakukan pembobotan dan sistem temu kembali informasi dengan
pembobotan per konteks dengan 6 kombinasi yaitu dengan memperhatikan
konteks title, author dan text , konteks title dan author, konteks author dan text,
konteks title dan text, konteks author saja, konteks text saja, dan konteks title saja.
Untuk ujicoba sistem temu kembali informasi dengan pembobotan pada konteks
tertentudilakukan dengan menggunakan hanya bobot konteks tertentusaja yang
digunakan, sedangkan bobot pada konteks lainnyatidak digunakan dan
koefisiennya dianggap sama dengan 0.
Tahap selanjutnya yaitu menghitung nilai recall dan precision pada masingmasing hasil sistem temu kembali informasi. Untuk mengetahui kinerja sistem
secara keseluruhan,MAP dan AVP digunakan. MAP dihitung dengan
menggunakan nilai precision yang sudah dihitung sebelumnya yang kemudian
dicari rata-ratanya. AVP didapatkan dengan melakukan interpolasi terhadap nilai
precision pada sebelas tingkat nilai recall yaitu 0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7,
0.8, 0.9, dan 1.0 . Nilai perbandingan AVP dan MAP pada masing-masing uji
coba ditunjukkan pada Tabel 5.
Tabel 5Perbandingan nilai AVP dan MAP
Sistem
Tanpa pembobotan
Pembobotan pada konteks title, author dan text
Pembobotan pada konteks title dan author
Pembobotan pada konteks author dan text
Pembobotan pada konteks title dan text
Pembobotan pada konteks author
Pembobotan pada konteks text
Pembobotan pada konteks title

AVP
0.783
0.765
0.830
0.760
0.597
0.333
0.591
0.497

MAP
0.789
0.674
0.674
0.674
0.674
0.674
0.674
0.674

Grafik perbandingan hasil interpolasi antara precision dan recall pada
masing-masing sistem temu kembali informasi yang diujicobakan dapat dilihat
pada Gambar 3. Sedangkan nilai AVP dan MAP pada keempat sistem temu
kembali informasi ini secara rinci dapat dilihat pada Lampiran 4 sampai 11.

10
1
0,9
0,8

precision

0,7
0,6
0,5
0,4
0,3
0,2
0,1

0
0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

recall
AVP reguler
AVP regresi title.author
AVP regresi title.text
AVP regresi text

AVP regresi title.author.text
AVP regresi author.text
AVP regresi author
AVP regresi title

Gambar 3 Grafik perbandingan antara masing-masing AVP

SIMPULAN DAN SARAN
Simpulan
Berdasarkan perbandingan nilai mean average precision(MAP) dari hasil
evaluasi diketahui bahwa terjadi penurunan nilai rata-rata MAP sebesar 1.15%
pada sistem temu kembali informasi tanpa pembobotan dengan pembobotan per
konteks. Adapun dengan membandingkan nilai rata-rata AVP dan MAP pada
masing-masing sistem temu kembali informasi dengan pembobotan per konteks
dan dengan melihat grafik perbandingan antara masing-masing nilai Average
Precision diketahui bahwa sistem temu kembali informasi dengan pembobotan
pada konteks title dan author menghasilkan kinerja yang paling baik dibanding
percobaan lainnya.
Dari penurunan nilai rata-rata AVP dan MAP yang dihasilkan dari evaluasi,
dapat disimpulkan bahwa sistem temu kembali informasi dengan menggunakan
regresi linier dengan menggunakan kueri yang digunakan belum dapat
meningkatkan kinerja sistem temu kembali informasi.

1.0

11
Saran
Beberapa hal yang perlu dikembangkan lebih lanjut dari penelitian ini antara
lain sebagai berikut:
1 Menggunakan jumlah koleksi dokumen yang lebih banyak
2 Menggunakan kueri uji selain yang digunakan dalam penelitian ini
3 Melakukan analisa perbandingan dengan metode pencarian koefisien bobot per
konteks yang lain.

DAFTAR PUSTAKA
Baeza-Yates R, Ribeiro-Neto B. 1999. Modern Information Retrieval.Wokingham
(UK) : Addison Wesley.
Kamps J, Marx M, de-Rijke M, Sigurbjornsson B. 2003. XML:What to Retrieve ?.
Di dalam: Proceedings of the 26th annual international ACM SIGIR
conference on Research and development in information retrieval; 2003 July
28 – august 1. Toronto (CAD) : ACM. Hlm 1.
Kontostathis A,Lilly A, Spiteri RJ. 2008. Distributed EDLSI, BM25, and power
normat TREC 2008. Di dalam: Proceedings of The Seventeenth Text
Retrieval Conference; 2008 Nov 18-21.Maryland (US) : National Institute
of Standards and Technology. Hlm 4.
Manning CD, Raghavan P, Schutze H. 2008. Introduction to Information
Retrieval.New York(US) : Cambridge University.
Rahman A. 2006. Perbandingan kinerja beberapa ukuran kesamaan pada
temukembali informasi dokumen XML.[Skripsi].Bogor(ID) : Institut
Pertanian Bogor.

12
Lampiran 1Contoh dokumen pengujian

balaipenelitian000000-001
produktivitas som jawa (talinum paniculatum gaertn.)
pada beberapa komposisi bahan organik

ireng darwati, mono rahardjo, dan rosita smd

som jawa merupakan tanaman yang menghasilkan umbi.
untuk menghasilkan umbi yang optimal, diperlukan tanah yang
sifat-sifat fisik dan kesuburannya baik. kondisi tersebut dapat dicapai
dengan penggunaan bahan organik (kasting, kompos daun bambu dan pupuk kandang).
penelitian ini bertujuan mempelajari pengaruh beberapa macam komposisi bahan organik
sebagai media tanam dalam pot (polybag) terhadap produksi umbi som jawa.
pot diisi 20 kg media tanam, ditempatkan di lapangan terbuka ip cimanggu di balittro.
percobaan berlangsung mulai bulan september 1996 sampai september 1997.
rancangan yang digunakan adalah rancangan acak kelompok dengan empat ulangan.
perlakuan komposisi media bahan organik yang diuji adalah
(1) tanah;
(2) tanah + pupuk kandang (3:1);
(3) tanah + kasting (3:1);
(4) tanah + kompos daun bambu (3:1);
(5) tanah + kasting + kompos daun bambu (6:1:1);
(6) tanah + pupuk kandang + kompos daun bambu (6:1:1);
(7) tanah + pupuk kandang + kasting (6:1:1).
tanaman diberi pupuk dasar 1 g urea, 3 g tsp, dan 3 g kcl,
serta 2 g urea sebagai pupuk susulan pada 3 bulan setelah tanam.
tanaman dipanen pada umur 1 tahun setelah tanam.
hasil penelitian menunjukkan bahwa ketiga macam bahan organik yang
diuji dapat meningkatkan ukuran umbi, jumlah umbi, bobot segar,
dan bobot kering umbi som jawa.
produksi umbi segar tertinggi 165.40 g/ tanaman dan umbi kering 26.75 g/tanaman
diperoleh
pada perlakuan bahan organik terdiri atas campuran tanah dan kasting dengan
perbandingan 3:1.



13
Lampiran 2 Daftar kueri dan jumlah dokumen relevan
Kueri
gagal panen
petani tebu
industri gula
perdagangan hasil pertanian
penerapan teknologi pertanian
pupuk organik
penyakit hewan ternak
penerapan teknologi bioteknologi di indonesia
laboratorium pertanian
riset pertanian
harga komoditas pertanian
tanaman pangan
Utami
Mar
tanaman obat
Evy
impor beras indonesia
pertanian organik
Kerusakan lingkungan
Hutan kota
Musim kemarau
Ant
Tma
flu burung
Eliza
Damar
tom
Ahmad
kelangkaan pupuk
idh

Jumlah dokumen relevan
32
20
15
22
24
20
13
6
21
26
30
42
4
18
28
3
33
22
19
13
32
181
39
21
2
3
13
19
19
28

14
Lampiran 3Daftar stopword
acapkali
ada
adakah
adakan
adalah
adanya
adapun
aduh
agak
agaknya
agar
aja
akalan
akan
akankah
akhir
akhirnya
akibat
akibatkan
akibatnya
aku
ala
alangkah
alasan
alasannya
alih
alihkan
amat
amatlah
ambil
anda
andai
anggap
anggapan
antar
antara
antaranya
apa
apabila
apakah
apalagi

bicarakan
bicaranya
bila
bilamana
bilang
bisa
bisakah
bisanya
boleh
boro
buat
buatnya
bukan
bukankah
bukanlah
bukannya
buktikan
cara
cerita
ceritanya
contoh
contohkan
contohnya
cukup
cuma
daerah
dahulu
dalam
dan
dapat
dapatkah
dapatkan
dapatlah
dari
darinya
daripada
dekat
dekatnya
demi
demikian
demikianlah

iya
jadi
jadikan
jadilah
jadinya
jangan
jarang
jauh
jelaskan
jika
jikalau
juga
jumlah
jumlahnya
justru
juta
kabupaten
kadang
kalau
kalaupun
kali
kalian
kami
kamu
kan
kapan
karena
karenanya
kata
katakan
katakanlah
katanya
kau
kayak
kayaknya
kebanyakan
kebetulan
kebiasaan
kecil
kecuali
kemana

menurutnya
menuturkan
menyatakan
menyebabkan
menyebutkan
menyia
mereka
merupakan
meski
meskipun
mesti
mestinya
misal
misalkan
misalnya
mudah
mula
mulai
mulainya
mulanya
muncul
mungkin
mungkinkah
namun
nanti
negara
nilai
nyaris
nyiakan
oleh
orang
pada
padahal
padanannya
paling
panjangnya
papar
paparan
paparkan
paparnya
para

semakin
semampunya
semenjak
sementara
semestinya
semisal
semoga
semua
semuanya
semula
seolah
seorang
seorangpun
sepadan
sepanjang
separah
sepasang
sepele
sependapat
seperti
sepertinya
seputar
seraya
serba
serentak
sering
seringkali
seringkalinya
seringlah
seringnya
serta
sertanya
sesaat
sesama
sesamamu
sesedikit
seseorang
sesuai
sesuatu
sesuatunya
sesudah

15
Lampiran 3 Lanjutan
apalah
apanya
apapun
arti
artian
artinya
asalan
asalkan
asumsi
asumsinya
atas
atasnya
atau
ataukah
ataupun
awal
bagai
bagaikan
bagaimana
bagaimanakah
bagaimanapun
bagi
baginya
bagus
bagusnya
bahkan
bahwa
baik
baiknya
balik
banding
bandingkan
banyak
banyaknya
barangkali
baru
bawah
bawahnya
beberapa
begini
beginilah

dengan
dengannya
depan
depannya
dia
dialah
dialami
dialihkan
diambil
diambilkan
diambilnya
dianggap
diantara
diantaranya
diapakan
dibagi
dibagikan
dibeberapa
diberbagai
diberi
diberikan
diberinya
dibiarkan
dibiasakan
dibilang
dicontoh
dicontohkan
dicontohkannya
didapat
didapati
didapatkan
didapatnya
didasarkan
digolongkan
digunakan
diharapkan
dijadikan
dijadikannya
dikarenakan
dikasih
dikata

kemanakah
kembali
kemudian
kemungkinan
kemungkinannya
kenapa
kenapakah
kepada
kepadanya
kepala
ketika
ketimbang
khususnya
kini
kita
kondisi
kurang
lagi
lagian
lagipula
lain
lainnya
laksana
lakukan
lalu
lalui
lama
lanjut
lantaran
lantas
lebih
lepas
lewat
lokasi
maka
makin
mampu
mampukah
mampunya
mana
manakala

pasti
pastilah
pastinya
pelak
pelbagai
pemaparan
pembagian
pembagiannnya
pendapat
pengalihan
pengambil
pengambilan
pengandaian
per
peralihan
percuma
peri
perihal
perlahan
perlu
pernah
persen
pertamanya
pertanian
petani
pinggir
pula
pulalah
pun
rata
relevankah
rendah
saat
saatnya
saatnyalah
saja
salah
sama
sambil
sambutannya
sampai

sesudahnya
sesukanya
sesungguhnya
setelah
setelahnya
seterusnya
setiap
setidak
setidaknya
seusai
sewaktu
seyogyanya
sia
sialnya
siap
siapa
siapakah
siapapun
silahkan
singkatnya
sini
sinilah
situ
sosok
sosoknya
suatu
sudah
sulit
sungguh
sungguhpun
supaya
tak
tambahnya
tanggapan
tanggapannya
tanggapnya
tanpa
tapi
tatkala
telah
tempat

16
Lampiran 3 Lanjutan
begitu
begitulah
begitupula
begitupun
belakang
belakangan
belum
belumlah
benar
benarkah
benarnya
berada
berakhir
berakhirnya
berakibat
berakibatkan
beralasan
beralih
beralihnya
beranggapan
berapa
berapanya
berapapun
berarti
berasumsi
berbagai
berbagi
berbanding
berbeda
berdampak
berdasarkan
berhadapan
berharap
berhubung
berhubungan
beri
berikan
berikanlah
berikut
berikutnya
berjumlah

dikatakan
dikatakannya
dikategorikan
dikembangkan
diketahui
diketahuinya
dilaksanakan
dilakukan
dimana
dimulai
dimulailah
dimulainya
dimungkinkan
dipaparkan
dipersilahkan
disaat
disebabkan
disejumlah
diseluruh
disertai
disertakan
disimpulkan
disitulah
ditanggapi
ditanya
ditanyakan
dituturkan
diucapkan
dkk
dll
dsb
dua
dulu
dulunya
empat
enggak
engkau
esok
gimana
habis
habisan

manalagi
manapun
masa
masih
masihkah
masing
masuk
masyarakat
mau
maupun
melainkan
melakukan
melalui
melihat
memang
memaparkan
membagi
membagikan
memberi
memberikan
memberinya
membiarkan
membolehkan
membuat
memeperoleh
memiliki
meminta
memperbolehkannya
mempersilahkan
mempunyai
memungkinkan
menanggapi
menanggapinya
menanyakan
mencapai
mencontohkan
mendapat
mendapati
mendapatkan
mendapatkannya
menerus

sana
sang
sangat
sangatlah
satunya
saya
sayangnya
seakan
seandainya
seantero
sebab
sebabkan
sebabnya
sebagai
sebagaimana
sebagainya
sebagian
sebaik
sebaiknya
sebaliknya
sebanyak
sebelum
sebelumnya
sebenarnya
seberapa
seberat
sebesar
sebetulnya
sebuah
secara
sedalam
sedang
sedangkan
sedapat
sedemikian
sedikit
sedikitnya
segera
sehabis
seharusnya
seharusnyalah

tengah
tentang
tentu
tentunya
tepatnya
terbagi
terbalik
terbiasa
terbilang
terdapat
tergolong
terhadap
terjadi
terjadilah
terjadinya
terkadang
terkait
terkecuali
terlalu
terlebih
termasuk
ternyata
tersebut
tertentu
terus
tetap
tetapi
tiap
tiba
tidak
tidaklah
tidaknya
tiga
tinggi
tutur
tuturnya
ucap
ucapan
ucapannya
ucapkan
ucapnya

17
Lampiran 3 Lanjutan
berkat
berkenaan
berkesan
berkesempatan
berkesimpulan
berlalu
berlalunya
berlama
berlangsung
bermula
bersama
bersamaan
bertepatan
beruntun
berupa
besarnya
beserta
besok
besoknya
betapa
biar
biarlah
biasa
biasanya

habiskan
habisnya
hal
hampir
hanya
hanyalah
hari
harus
haruskah
haruslah
harusnya
hendak
hendaklah
hendaknya
hingga
how
ialah
ingin
ini
inilah
inipun
itu
itulah
itupun

mengada
mengaku
mengalami
mengalihkan
mengambil
mengambilnya
menganggap
menganggapnya
mengapa
mengatakan
mengembangkan
mengenai
menggunakan
mengungkapkan
meningkat
meningkatkan
menjadi
menjadikan
menjadikannya
menjelang
menjelaskan
menuju
menunjukkan
menurut

sehingga
sehubungan
sejak
sejauhmana
sejumlah
sekalian
sekaligus
sekalipun
sekarang
sekata
sekedar
sekeliling
seketika
sekian
sekitar
selagi
selain
selalu
selama
selanjutnya
selesai
selesaikah
seluruh
seluruhnya

ujar
ujarnya
umpamanya
umum
umumnya
ungkap
ungkapan
ungkapkan
ungkapnya
untuk
usah
usahlah
usai
usianya
waktu
waktulah
waktunya
walau
walaupun
warga
well
yaitu
yakni
yang

18
Lampiran 4 Interpolasi precision dan recall pada sistem temu kembali informasi
tanpa memperhatikan konteks
p1

p2

p3

p4

p5

p6

p7

p8

p9

p10

p11

p12

p13

p14

p15

MAP

0.890

0.574

0.864

0.461

0.825

0.631

0.698

0.915

0.604

0.708

0.659

0.299

1.000

0.939

0.672

0.0
0.1

1.000
1.000

0.333
0.550

1.000
1.000

0.833
0.708

1.000
1.000

1.000
1.000

1.000
0.667

1.000
1.000

0.833
0.775

1.000
0.944

1.000
1.000

0.338
0.346

1.000
1.000

1.000
1.000

1.000
1.000

0.2
0.3

1.000
1.000

0.690
0.652

1.000
1.000

0.500
0.517

1.000
1.000

0.598
0.625

0.600
0.690

1.000
1.000

0.792
0.683

0.779
0.659

0.874
0.885

0.358
0.381

1.000
1.000

1.000
0.938

0.909
0.652

0.4
0.5

0.939
0.787

0.655
0.608

0.857
0.882

0.475
0.438

0.847
0.812

0.548
0.569

0.667
0.700

1.000
1.000

0.634
0.574

0.697
0.736

0.744
0.632

0.326
0.286

1.000
1.000

0.889
0.905

0.625
0.577

0.6
0.7

0.808
0.809

0.555
0.592

0.900
0.913

0.392
0.315

0.721
0.705

0.581
0.604

0.679
0.667

0.800
0.833

0.510
0.477

0.646
0.601

0.498
0.387

0.255
0.242

1.000
1.000

0.920
0.931

0.620
0.561

0.8
0.9

0.818
0.804

0.591
0.452

0.750
0.732

0.270
0.268

0.631
0.634

0.565
0.496

0.688
0.667

0.833
0.857

0.422
0.434

0.562
0.539

0.397
0.390

0.244
0.231

1.000
1.000

0.939
0.895

0.463
0.402

1.0

0.800

0.455

0.395

0.265

0.585

0.444

0.684

0.857

0.420

0.531

0.349

0.231

1.000

0.857

0.400

p16

p17

p18

p19

p20

p21

p22

p23

p24

p25

p26

p27

p28

p29

p30

ave

MAP

0.639

0.779

0.658

0.481

0.855

0.828

1.000

0.916

0.919

1.000

0.917

1.000

1.000

0.929

1.000

0.789

0.0

0.500

1.000

0.583

0.500

1.000

1.000

1.000

0.639

1.000

1.000

1.000

1.000

1.000

1.000

1.000

0.885

0.1

0.500

1.000

0.775

0.381

1.000

1.000

1.000

0.841

1.000

1.000

1.000

1.000

1.000

1.000

1.000

0.883

0.2

0.500

1.000

0.750

0.528

1.000

1.000

1.000

0.904

0.929

1.000

1.000

1.000

1.000

1.000

1.000

0.857

0.3
0.4

0.500
0.667

0.927
0.778

0.626
0.655

0.564
0.629

1.000
1.000

1.000
1.000

1.000
1.000

0.931
0.946

0.882
0.905

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
0.894

1.000
1.000

0.837
0.813

0.5
0.6

0.667
0.667

0.723
0.688

0.681
0.631

0.513
0.428

0.875
0.854

0.910
0.812

1.000
1.000

0.955
0.962

0.920
0.871

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

0.913
0.862

1.000
1.000

0.789
0.755

0.7
0.8

0.667
0.750

0.671
0.562

0.647
0.661

0.403
0.428

0.833
0.579

0.670
0.516

1.000
1.000

0.967
0.971

0.886
0.897

1.000
1.000

0.750
0.750

1.000
1.000

1.000
1.000

0.879
0.892

1.000
1.000

0.734
0.706

0.9
1.0

0.750
0.750

0.527
0.465

0.625
0.524

0.450
0.442

0.600
0.520

0.471
0.464

1.000
1.000

0.973
0.975

0.907
0.913

1.000
1.000

0.750
0.750

1.000
1.000

1.000
1.000

0.900
0.864

1.000
1.000

0.692
0.665

19
Lampiran 5Interpolasi precision dan recall pada sistem temu kembali informasi
dengan pembobotan pada konteks title, author dan text
p1

p2

p3

p4

p5

p6

p7

p8

p9

p10

p11

p12

p13

p14

p15

MAP

0.868

0.574

0.755

0.413

0.798

0.677

0.784

0.915

0.577

0.706

0.641

0.324

1.000

0.698

0.727

0.0
0.1

1.000
1.000

0.333
0.550

1.000
1.000

0.833
0.410

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

0.833
0.775

1.000
0.944

1.000
1.000

0.471
0.365

1.000
1.000

0.250
0.450

1.000
1.000

0.2
0.3

1.000
1.000

0.690
0.652

1.000
0.714

0.523
0.469

0.958
0.819

1.000
0.564

1.000
0.857

1.000
1.000

0.690
0.683

0.817
0.677

0.812
0.791

0.423
0.410

1.000
1.000

0.598
0.683

1.000
0.822

0.4
0.5

0.957
0.777

0.655
0.567

0.764
0.667

0.423
0.389

0.777
0.753

0.608
0.600

0.667
0.700

1.000
1.000

0.659
0.609

0.621
0.646

0.674
0.695

0.359
0.286

1.000
1.000

0.727
0.760

0.675
0.714

0.6
0.7

0.808
0.809

0.610
0.569

0.659
0.647

0.329
0.296

0.721
0.731

0.611
0.604

0.679
0.714

0.800
0.833

0.501
0.458

0.654
0.639

0.474
0.396

0.262
0.243

1.000
1.000

0.793
0.818

0.701
0.597

0.8
0.9

0.705
0.714

0.541
0.502

0.675
0.700

0.277
0.268

0.663
0.643

0.554
0.508

0.688
0.667

0.833
0.857

0.351
0.328

0.609
0.545

0.399
0.392

0.233
0.223

1.000
1.000

0.838
0.850

0.433
0.398

1.0

0.696

0.465

0.395

0.268

0.571

0.435

0.684

0.857

0.344

0.531

0.333

0.218

1.000

0.857

0.412

p16

p17

p18

p19

p20

p21

p22

p23

p24

p25

p26

p27

p28

p29

p30

ave

MAP

0.639

0.764

0.654

0.579

0.817

0.832

1.000

0.856

0.908

1.000

0.756

0.827

1.000

0.949

1.000

0.674

0.0

0.500

1.000

0.583

1.000

1.000

1.000

1.000

0.478

1.000

1.000

1.000

0.500

1.000

1.000

1.000

0.859

0.1

0.500

1.000

0.775

0.708

1.000

1.000

1.000

0.727

1.000

1.000

1.000

0.667

1.000

1.000

1.000

0.862

0.2

0.500

0.939

0.750

0.757

1.000

1.000

1.000

0.824

0.845

1.000

1.000

0.750

1.000

1.000

1.000

0.863

0.3
0.4

0.500
0.667

0.851
0.789

0.626
0.655

0.764
0.589

1.000
0.857

1.000
1.000

1.000
1.000

0.870
0.897

0.882
0.905

1.000
1.000

1.000
1.000

0.817
0.857

1.000
1.000

1.000
1.000

1.000
1.000

0.815
0.793

0.5
0.6

0.667
0.667

0.782
0.737

0.681
0.631

0.500
0.431

0.875
0.775

0.923
0.827

1.000
1.000

0.915
0.927

0.887
0.871

1.000
1.000

1.000
0.667

0.875
0.894

1.000
1.000

0.958
0.926

1.000
1.000

0.774
0.732

0.7
0.8

0.750
0.750

0.603
0.534

0.647
0.673

0.392
0.418

0.714
0.579

0.674
0.558

1.000
1.000

0.936
0.943

0.886
0.897

1.000
1.000

0.667
0.667

0.909
0.917

1.000
1.000

0.879
0.892

1.000
1.000

0.714
0.687

0.9
1.0

0.750
0.750

0.492
0.458

0.596
0.468

0.439
0.442

0.600
0.448

0.439
0.438

1.000
1.000

0.948
0.951

0.907
0.913

1.000
1.000

0.667
0.600

0.923
0.929

1.000
1.000

0.857
0.864

1.000
1.000

0.674
0.644

20
Lampiran 6Interpolasi precision dan recall pada sistem temu kembali informasi
dengan pembobotan pada konteks title dan author
p1

p2

p3

p4

p5

p6

p7

p8

p9

p10

p11

p12

p13

p14

p15

MAP

1.000

0.333

1.000

0.000

1.000

1.000

0.000

0.000

0.000

1.000

1.000

1.000

1.000

1.000

1.000

0.0
0.1

1.000
1.000

0.333
0.333

1.000
1.000

0.000
0.000

1.000
1.000

1.000
1.000

0.000
0.000

0.000
0.000

0.000
0.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

0.2
0.3

1.000
1.000

0.333
0.333

1.000
1.000

0.000
0.000

1.000
1.000

1.000
1.000

0.000
0.000

0.000
0.000

0.000
0.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

0.4
0.5

1.000
1.000

0.333
0.333

1.000
1.000

0.000
0.000

1.000
1.000

1.000
1.000

0.000
0.000

0.000
0.000

0.000
0.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

0.6
0.7

1.000
1.000

0.333
0.333

1.000
1.000

0.000
0.000

1.000
1.000

1.000
1.000

0.000
0.000

0.000
0.000

0.000
0.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

0.8
0.9

1.000
1.000

0.333
0.333

1.000
1.000

0.000
0.000

1.000
1.000

1.000
1.000

0.000
0.000

0.000
0.000

0.000
0.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.0

1.000

0.333

1.000

0.000

1.000

1.000

0.000

0.000

0.000

1.000

1.000

1.000

1.000

1.000

1.000

p16

p17

p18

p19

p20

p21

p22

p23

p24

p25

p26

p27

p28

p29

p30

ave

MAP

1.000

1.000

0.658

1.000

1.000

1.000

1.000

1.000

0.925

1.000

1.000

1.000

1.000

1.000

1.000

0.674

0.0

1.000

1.000

0.500

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

0.828

0.1

1.000

1.000

0.667

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

0.833

0.2

1.000

1.000

0.775

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

1.000

0.837

0.3
0.4

1.000
1.000

1.000
1.000

0.625
0.652

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
0.833

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

0.832
0.827

0.5
0.6

1.000
1.000

1.000
1.000

0.615
0.655

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

0.857
0.875

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

0.827
0.829

0.7
0.8

1.000
1.000

1.000
1.000

0.688
0.678

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

0.889
0.900

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

0.830
0.830

0.9
1.0

1.000
1.000

1.000
1.000

0.636
0.625

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

0.909
0.917

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

0.829
0.829

21
Lampiran 7Interpolasi precision dan recall pada sistem temu kembali informasi
dengan pembobotan pada konteks author dan text
p1

p2

p3

p4

p5

p6

p7

p8

p9

p10

p11

p12

p13

p14

p15

MAP

0.868

0.586

0.719

0.413

0.798

0.632

0.784

0.915

0.577

0.698

0.637

0.296

1.000

0.698

0.727

0.0
0.1

1.000
1.000

0.500
0.708

1.000
1.000

0.833
0.410

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

0.833
0.775

1.000
0.944

1.000
1.000

0.259
0.331

1.000
1.000

0.250
0.450

1.000
1.000

0.2
0.3

1.000
1.000

0.611
0.618

0.833
0.714

0.523
0.469

0.958
0.819

0.528
0.592

1.000
0.857

1.000
1.000

0.690
0.683

0.725
0.665

0.776
0.791

0.404
0.374

1.000
1.000

0.598
0.683

1.000
0.822

0.4
0.5

0.957
0.777

0.655
0.567

0.618
0.667

0.423
0.389

0.777
0.753

0.608
0.600

0.667
0.700

1.000
1.000

0.659
0.609

0.621
0.646

0.674
0.695

0.363
0.286

1.000
1.000

0.727
0.760

0.675
0.714

0.6
0.7

0.808
0.809

0.610
0.569

0.703
0.647

0.329
0.296

0.721
0.731

0.611
0.604

0.679
0.714

0.800
0.833

0.501
0.458

0.654
0.639

0.474
0.396

0.262
0.243

1.000
1.000

0.793
0.818

0.701
0.597

0.8
0.9

0.705
0.714

0.541
0.502

0.675
0.700

0.277
0.268

0.663
0.643

0.554
0.508

0.688
0.667

0.833
0.857

0.351
0.328

0.609
0.545

0.402
0.392

0.233
0.223

1.000
1.000

0.838
0.850

0.433
0.398

1.0

0.696

0.465

0.395

0.268

0.571

0.435

0.684

0.857

0.344

0.531

0.333

0.218

1.000

0.857

0.412

p16

p17

p18

p19

p20

p21

p22

p23

p24

p25

p26

p27

p28

p29

p30

ave

MAP

0.639

0.735

0.677

0.517

0.817

0.822

1.000

0.856

0.939

1.000

0.756

0.827

1.000

0.926

1.000

0.674

0.0

0.500

1.000

0.583

0.500

1.000

1.000

1.000

0.478

1.000

1.000

1.000

0.500

1.000

1.000

1.000

0.841

0.1

0.500

1.000

0.775

0.708

1.000

1.000

1.000

0.727

1.000

1.000

1.000

0.667

1.000

1.000

1.000

0.867

0.2

0.500

0.799

0.845

0.690

1.000

1.000

1.000

0.824

0.929

1.000

1.000

0.750

1.000

1.000

1.000

0.833

0.3
0.4

0.500
0.667

0.790
0.764

0.683
0.655

0.644
0.533

1.000
0.857

1.000
0.957

1.000
1.000

0.870
0.897

0.882
0.905

1.000
1.000

1.000
1.000

0.817
0.857

1.000
1.000

1.000
0.894

1.000
1.000

0.809
0.780

0.5
0.6

0.667
0.667

0.762
0.726

0.705
0.674

0.475
0.427

0.875
0.775

0.900
0.791

1.000
1.000

0.915
0.927

0.920
0.931

1.000
1.000

1.000
0.667

0.875
0.894

1.000
1.000

0.913
0.862

1.000
1.000

0.772
0.733

0.7
0.8

0.750
0.750

0.599
0.512

0.688
0.674

0.370
0.402

0.714
0.579

0.674
0.558

1.000
1.000

0.936
0.943

0.939
0.946

1.000
1.000

0.667
0.667

0.909
0.917

1.000
1.000

0.879
0.892

1.000
1.000

0.716
0.688

0.9
1.0

0.750
0.750

0.481
0.451

0.575
0.468

0.415
0.429

0.600
0.448

0.439
0.438

1.000
1.000

0.948
0.951

0.951
0.913

1.000
1.000

0.667
0.600

0.923
0.929

1.000
1.000

0.857
0.864

1.000
1.000

0.673
0.644

22
Lampiran 8Interpolasi precision dan recall pada sistem temu kembali informasi
dengan pembobotan pada konteks title dan text
p1

p2

p3

p4

p5

p6

p7

p8

p9

p10

p11

p12

p13

p14

p15

MAP

0.868

0.574

0.797

0.413

0.798

0.677

0.784

0.915

0.577

0.706

0.641

0.324

1.000

0.000

0.727

0.0
0.1

1.000
1.000

0.333
0.550

1.000
1.000

0.833
0.410

1.000
1.000

1.000
1.000

1.000
1.000

1.000
1.000

0.833
0.775

1.000
0.944

1.000
1.000

0.471
0.365

1.000
1.000

0.000
0.000

1.000
1.000

0.2
0.3

1.000
1.000

0.690
0.652

1.000
0.714

0.523
0.469

0.958
0.819

1.000
0.564

1.000
0.857

1.000
1.000

0.690
0.683

0.817
0.677

0.812
0.791

0.423
0.410

1.000
1.000

0.000
0.000

1.000
0.822

0.4
0.5

0.957
0.777

0.655
0.567

0.764
0.667

0.423
0.389

0.777
0.753

0.608
0.600

0.667
0.700

1.000
1.000

0.659
0.609

0.621
0.646

0.674
0.695

0.359
0.286

1.000
1.000

0.000
0.000

0.675
0.714

0.6
0.7

0.808
0.809

0.610
0.569

0.653
0.647

0.329
0.296

0.721
0.731

0.611
0.604

0.679
0.714

0.800
0.833

0.501
0.458

0.654
0.639

0.474
0.396

0.262
0.243

1.000
1.000

0.000
0.000

0.701
0.597

0.8
0.9

0.705
0.714

0.541
0.502

0.675
0.700

0.277
0.268

0.663
0.643

0.554
0.508

0.688
0.667

0.833
0.857

0.351
0.328

0.609
0.545

0.402
0.392

0.233
0.223

1.000
1.000

0.000
0.000

0.433
0.398

1.0

0.696

0.465

0.395

0.268

0.571

0.435

0.684

0.857

0.344

0.531

0.333

0.218

1.000

0.000

0.412

p16

p17

p18

p19

p20

p21

p22

p23

p24

p25

p26

p27

p28

p29

p30

ave

MAP

0.000

0.764

0.654

0.579

0.817

0.832

1.000

0.000

0.908

0.000

0.833

0.000

1.000

0.949

0.000

0.674

0.0

0.000

1.000

0.583

1.000

1.000

1.000

1.000

0.000

1.000

0.000

1.000

0.000

1.000

1.000

0.000

0.735

0.1

0.000

1.000

0.775

0.708

1.000

1.000

1.000

0.000

1.000

0.000

1.000

0.000

1.000

1.000

0.000

0.718

0.2

0.000

0.939

0.750

0.757

1.000

1.000

1.000

0.000

0.845

0.000

1.000

0.000

1.000

1.000

0.000

0.707

0.3
0.4

0.000
0.000

0.851
0.789

0.626
0.655

0.764
0.589

1.000
0.857

1.000
1.000

1.000
1.000

0.000
0.000

0.882
0.905

0.000
0.000

1.000
1.000

0.000
0.000