SEMANTIC SEARCH PADA DIGITAL LIBRARY ONLINE PUBLIC ACCESS CATALOG

1

SEMANTIC SEARCH PADA DIGITAL LIBRARY ONLINE PUBLIC
ACCESS CATALOG
Adhie Tri Wahyudi
Teknik Industri, Universitas Setia Budi Surakarta
e-mail: adhie.wahyudi@gmail.com
Abstract
Searching facility on the Digital library Online Public Access Catalog (DigilibOPAC) is a basic requirement for each user accessesing it; therefore it plays an important
role. The observations on behaviour of the users when using Digilib-OPAC obtained a
fact: the user want search result that are relevant to the user whises. This means, the user
requires the search engine should be able to understand the meaning of the
word/phrase/sentences entered as relevant and effective.
Therefor, searching facility with ontology and semantic search technology is applied
in order to solve problems of relevance of search results and the words meaning between
system and users. The ontology model formed is expressed by using OWL language which
contains semantic entities such as three main class i.e: Student class, Lecturer class and
Publication class and three helper class i.e: Kalimat class, Stopword class and Keyword
class. The rules of semantic search builts are Language processing rules using Natural
Language Processing so that the system is able to understand the meaning of keyword or
search sentence which are input by the users and the query SWRL rule to search the

information stored in the knowledge base.
The results of system testing on a number of searching phrase, for every each
keyword, show providing both the precision ratio and recall ratio of 100% or 1 : 1. Thus
the facility search system developed on Digilib-OPAC is considered to be effective.
Keywords : semantic search, NLP, precision ratio, recall ratio, OPAC
PENDAHULUAN
Digital library Online Public Access Catalog (Digilib-OPAC) merupakan fasilitas yang
selalu tersedia pada sistem digital library. Tujuan dari pemanfaatan fasilitas ini adalah untuk
mempermudah proses penemukembalian dokumen digital yang tersimpan berdasarkan kata
kunci yang diinputkan. Namun demikian, peningkatan volume informasi yang disimpan
menyebabkan terjadinya kesulitan untuk menemukan, mengelola, mengakses dan
memelihara informasi yang diperlukan. Hal ini mengakibatkan banyaknya kata kunci yang
tersimpan dan menjadi penyebab utama timbulnya kesulitan tersebut. Terutama karena
makna informasi yang disimpan hanya mampu dipahami oleh manusia, sedangkan mesin
tidak [1]. Akibatnya mesin tidak mampu menginterpretasikan secara tepat informasi apa
yang dibutuhkan atau dicari oleh manusia. Hal ini yang mengakibatkan hasil-hasil pencarian
yang tidak relevan justru terindeks dan ditampilkan sebagai hasil pencarian.
Dari hasil pengamatan terhadap perilaku user ketika sedang menggunakan DigilibOPAC sewaktu mencari dokumen pada sebuah digital library, diperoleh suatu fakta bahwa
user menginginkan hasil pencarian yang sesuai dan relevan dengan keinginan user. Sebagai
contoh, ketika user menginputkan keyword sistem informasi, user menginginkan informasi

penelitian yang terkait tentang sistem informasi, begitupun ketika user menginputkan
keyword sistem informasi keuangan, maka user menghendaki output mengenai sistem
informasi keuangan bukan penelitian sistem informasi secara umum. User menganggap
bahwa keyword yang inputkan tersebut merupakan satu kesatuan meaning, bukan suatu

keyword yang terpecah-pecah dan diartikan sendiri-sendiri. Berikutnya ketika user
menginputkan keyword Analisa Keputusan dan Analisis Keputusan pada kolom pencarian,
user menginginkan hasil pencarian yang identik, karena menganggap kedua keyword yang
diinputkan tersebut memiliki makna yang sama. Namun ternyata sistem pencarian pada
digital library memberikan output yang berbeda dengan interpretasi user. Mesin menganggap
kedua keyword tersebut mempunyai makna yang tidak identik. Permasalahan berikutnya,
ketika user mengetikkan singkatan kata/singkatan istilah sebagai input pencarian, sistem
justru menampilkan hasil pencarian yang sama sekali tidak relevan. Artinya, sistem tidak
dapat memahami persamaan makna keyword yang tersimpan dengan singkatan
kata/singkatan istilah yang diinputkan.
Untuk mengatasi permasalahan pemaknaan, Davies dkk. mengatakan bahwa
pemanfaatan teknologi semantic web mampu memberikan kemampuan pada mesin
memahami makna kata sama seperti yang dipahami oleh manusia [2]. Sedangkan, BernersLee mengatakan content atau informasi menjadi basis pengetahuan dapat direpresentasikan
dalam bentuk ontologi dalam bentuk-bentuk yang dapat dipahami dan diproses oleh mesin
[3]. Berdasarkan kedua penjelasan semantic web yang dikemukakan tersebut, maka pada

dasarnya Semantic Web bertujuan agar isi Web yang diekpresikan di dalam bahasa alami yang
dimengerti manusia, dapat juga dimengerti, diinterpretasi dan digunakan oleh perangkat
lunak (software agents). Terkait dengan tema kustomasi mesin pencari, ada beberapa
penelitian sejenis, seperti yang dilakukan oleh Wibisono membuat suatu aplikasi
pemrosesan dengan menggunakan bahasa alami (natural language processing) [4]. Pemrosesan
dilakukan pada basis data akademik dengan menggunakan format data XML. Aplikasi yang
dihasilkan mampu memberikan informasi akademik dari sebuah permintaan berupa
masukkan dalam bahasa Indonesia. Hasil dari penelitian ini adalah menguji tujuh aturan
produksi bahasa alami yang dapat diimplementasikan dalam query bahasa Indonesia untuk
menghasilkan informasi yang diinginkan. Dengan demikian, basis data digital library yang
tersimpan dapat dimodifikasi menjadi sebuah metadata berbasis ontologi, dengan harapan
agar content atau informasi yang tersimpan dapat dipahami serupa, baik oleh mesin maupun
oleh user (manusia).
Penelitian yang terkait dengan digital library, antara lain menyebutkan bahwa salah
satu karakteristik perpustakaan digital yang paling penting adalah fasilitas information retrieval
untuk memudahkan para pembaca dalam mencari data atau pun dokumen digital seperti
judul buku, pengarang, keyword dan lain-lain [5]. Namun demikian, penelitian lain
mengatakan bahwa banyak tantangan bagi pengelola digital library untuk mengelola, sharing
dan querying informasi yang tersimpan karena faktor penyimpanan yang terdistribusi dan
bersifat heterogeneous [6]. Namun, penerapan teknologi semantic web dapat memberikan

peningkatan usability dari digital library karena keunggulan-keunggulannya.
Kemudian, dalam penelitian yang dilakukan Sloni, disajikan desain penggunaan
semantik web dalam mesin pencari untuk memecahkan masalah dalam menemukan
kembali informasi secara cerdas [7]. Dan penggabungan teknik crawler, preprocessor, searcher
dan modul peringkat diyakini akan meningkatkan hasil pencarian informasi pada halaman
web. Sedangkan penerapan semantic search memiliki tujuan untuk memunculkan penemuan
kembali informasi secara lebih relevan dengan keinginan user, dengan mencocokkan konsep
atau arti [8]. Dalam hal ini, semantic search tidak bertujuan untuk menggantikan web
konvensional tetapi mempunyai kekuatan untuk meningkatkan hasil pencarian.

3
METODE PENELITIAN
Adapun alur penelitian yang dilakukan, mengikuti kerangka seperti yang
ditampilkan pada Gambar 1.

Gambar 1. Kerangka Penelitian
Setelah dilakukan analisis dan desain requirement untuk mendefinisikan kelemahan
atau kekurangan dari sistem yang sudah ada, dan data yang diperlukan juga telah diperoleh,
maka tahapan pengembangan perangkat lunak yang dilalui adalah:


1. Pembuatan prototipe
a. Perancangan user interface prototype
Dilakukan rancang bangun tampilan (interface) aplikasi, seperti menu, dialog,
input dan output.
b. Desain arsitektur
Dilakukan rancang bangun tampilan (interface) aplikasi, seperti menu, dialog,
input dan output.
c. Desain ontologi, desain aturan pengolahan bahasa dan desain aturan SWRL
Pada tahapan dilakukan designing proses-proses yang terjadi pada sistem,
seperti desain ontologi, desain aturan pengolahan bahasa dan desain aturan SWRL.
2. Implementasi
Pada tahap ini dibangun aplikasi semantic search dengan berbasiskan ontologi dan
aturan. Untuk pembangunan basis pengetahuan ontologi menggunakan bahasa OWL
dengan bantuan tools Protégé, untuk pembuatan antarmuka ETD menggunakan bahasa
PHP, sedangkan untuk pengembangan proses pencarian menggunakan bahasa
programming JAVA dengan bantuan JENA Library untuk koneksi ke basis pengetahuan
dan bantuan JESS API untuk mengeksekusi rule pencarian.
3. Pengujian sistem
Testing atau pengujian sistem dilakukan dengan dua metode, yaitu pengujian
sistem pencarian karena unsur semantic dan pengujian sistem karena unsur informasi

yang dikembalikan kepada user.
HASIL DAN PEMBAHASAN
Analisis Permasalahan
Seperti yang telah dipaparkan, inti permasalahan yang mendasari untuk dilakukan
penelitian ini adalah kurang relevannya hasil pencarian yang dikembalikan oleh sistem
pencarian. Hasil pengamatan menunjukkan bahwa nilai precision ratio penemukembalian
informasi dengan kata kunci analisa keputusan adalah sebesar 1/90 atau 0,0001%.
Rendahnya nilai precision ratio dikarenakan, sistem melakukan proses pencarian dengan
keyword analisa dan keyword keputusan. Karenanya dari 90 dokumen yang
ditemukembalikan, hanya 1 dokumen saya yang relevan dengan keinginan user, yaitu
dokumen dengan subyek analisa keputusan. Sedangkan, untuk kata kunci analisis keputusan
nilai precision ratio atas hasil pencarian adalah sebesar 0/121 atau 0%. Yang menarik adalah
satu dokumen yang relevan dengan kata analisa keputusan tidak tertampil pada hasil
pencarian kali ini. Melihat kedua hasil pengamatan tersebut, terlihat bahwa mesin tidak
mampu memahami persamaan makna antara kata kunci analisa keputusan dengan analisis
keputusan, sementara user menginginkan hasil pencarian yang sama antara kedua kata kunci
tersebut, karena secara makna kedua kata kunci tersebut adalah identik.
Sementara itu ketika sistem diberi inputan singkatan, yaitu sim, dengan tujuan ingin
mencari penelitian tentang sistem informasi manajemen, maka sistem akan memberikan
hasil dengan precision ratio 10/1659 atau sekitar 0.6% atau dengan keyword lan dengan tujuan

ingin mencari penelitian yang serupa dengan tema jaringan komputer, maka sistem akan
memberikan hasil dengan precision ratio 10/10133 atau sekitar 0.009%. Tabel 1
memperlihatkan sebagian hasil analisis pencarian. Kesimpulan yang diperoleh adalah hasil
pencarian yang terlalu melebar yang menyebabkan nilai precision ratio rendah, tidak mampu
mengenali keyword yang berbeda namun memiliki persamaan makna dan tidak mampu
mengenali keyword berupa singkatan.

5
Tabel 1 Analisis hasil pencarian pada digital library
No
Kata kunci
∑ Dokumen ∑ Dokumen
Keterangan
pencarian
yang
relevan yang
dikembalikan dikembalikan
1
Analisa
21

21
2
Analisis
52
52
3
Keputusan
69
69
4 Analisa keputusan
90
1
Sistem melakukan retrieved pada
kata kunci analisa dan keputusan
5 Analisis keputusan
121
0
Sistem melakukan retrieved pada
kata kunci analisis dan keputusan
Perancangan Sistem

Pengembangan sistem pencarian usulan dilakukan dengan memanfaatkan ontologi
dan teknologi semantic search. Ontologi (owl) digunakan sebagai basis pengetahuan yang
digunakan untuk menyimpan semua koleksi digital yang dimiliki system digilital library.
Sedangkan teknologi semantic search diterapkan dengan tujuan untuk memunculkan
penemuan kembali informasi secara lebih relevan dengan keinginan user, dengan
mencocokkan konsep atau arti.
Metode pencarian pada pengembangan sistem pencarian yang diusulkan dibagi
menjadi dua bagian, yaitu simple search dan semantic search. Ketika metode pencarian simple
search dipilih, sistem menerima parameter pencarian yang diinputkan oleh user, lalu
mengecek kategori pencarian (apakah meminta pencarian pada kategori buku, artikel
penelitian, Tugas Akhir atau ketiganya) kemudian menyusun representasi query berdasarkan
parameter yang diterima untuk kemudian dieksekusi secara rule based dengan menggunakan
konsep SWRL. Sedangkan pada metode pencarian semantic search, sistem dapat menerima
parameter pencarian yang lebih human friendly, yaitu berupa kalimat pencarian. Kalimat yang
diinputkan kemudian mengalami serangkaian proses pengolahan bahasa untuk
penemukembalian informasi (information retrieval; IR). Strzalkowski pada publikasinya
mengatakan bahwa, pengolahan bahasa sebagai bagian proses IR terdiri dari beberapa
tahap, yaitu tokenizing, filtering, stemming dan validation [9]. Output dari proses tersebut
kemudian dieksekusi secara rule based dengan menggunakan konsep SWRL.
Proses pembangunan basis pengetahuan atau building ontologi merupakan bagian

proses yang sangat penting karena pada bagian inilah terletak penyimpanan seluruh data
yang nantinya akan digunakan memberikan solusi. Dalam hal perancangan ontologi,
penelitian ini menerapkan prinsip re-usage atau memanfaatkan ontologi yang dibuat oleh
Nurkhamid yang bersesuaian [10]. Sedangkan untuk penggunaan istilah dan terminology,
digunakan standar Dublin Core, sehingga semua istilah dan terminology yang digunakan
sesuai dengan standar internasional yang mendukung prinsip interoperabilitas. Dengan
demikian, sharing data dan informasi tidak lagi terkendala oleh rigidnya istilah yang
digunakan antara satu database dengan database lainnya. Pada publikasinya, Noy dkk.
menjelaskan bahwa langkah-langkah dalam merancang suatu ontologi adalah : menentukan
konsep, istilah dan domain, mendefinisikan kelas dan hirarkinya, mendefinisikan property,
constraint, dan slot, serta mendefinisikan instance [11].
Ada dua kelas utama dan tiga kelas pembantu yang didefinisikan pada
pembangunan ontologi untuk meyimpan semua dokumen yang ada pada digital library. Dua
kelas utama tersebut adalah: kelas Person dan kelas Publication. Kelas Person terdiri dari
dua sub-kelas, yaitu Student dan Lecturer sedangkan kelas Publication terdiri dari tiga subkelas, yaitu finalProject, Book, dan lecturerPublication. Kelas finalProject dan kelas

lecturerPublication memiliki sub-kelas lagi, yaitu undergraduateThesis, masterThesis dan
phdDissertation merupakan sub-kelas dari finalProject dan Article serta Journal yang
merupakan sub-kelas dari lecturerPublication. Gambar 2 memperlihatkan rancangan
struktur dan hirarki kelas ontologi yang akan dibangun. Rancangan ontology tersebut

kemudian diimplementasikan dengan menggunakan bahasa OWL (Web Ontologi Language).
OWL merupakan suatu bahasa yang digunakan untuk mendeskripsikan kelas, properti dan
relasi antar objek dalam suatu cara yang dapat diinterpretasikan oleh mesin [12]. OWL
merupakan sebuah vocabulary namun dengan tingkatan semantik yang lebih tinggi
dibandingkan dengan RDF dan RDF Schema. Gambar 3 memperlihatkan implementasi
rancangan ontologi dalam bahasa OWL.
Kemudian untuk dapat menemukembalikan dokumen (IR) yang tersimpan pada
ontologi, terdapat dua aturan yang akan dibangun, yaitu aturan pengolahan kalimat perintah
secara linguistik/bahasa dan aturan query SWRL.
Aturan pengolahan kalimat perintah secara bahasa mengatur bagaimana produksi
kalimat perintah yang dibuat dan menentukan keteraturan kalimat untuk mengakses
informasi pada basis pengetahuan [13] dan [14]. Kemudian [9] pada publikasinya,
menyebutkan bahwa pengolahan bahasa sebagai bagian proses IR terdiri dari beberapa
tahap, yaitu (1) validation, (2) tokenizing atau parsing kalimat pencarian menjadi kata-kata
(token), (3) filtering atau menghilangkan kata-kata yang menjadi kategori stopword ataupun
kata-kata yang dianggap tidak penting seperti kata sambung dan (4) stemming atau proses
mencari root dari token-token [9]. Output dari proses stemming kemudian divalidasi menjadi
representasi kalimat dengan aturan-aturan Natural Language Processing (NLP) dan kemudian
disusun sebuah representasi query untuk kemudian dieksekusi secara rule based dengan
menggunakan konsep SWRL.

7

Gambar 2 Struktur dan Hirarki Kelas Sistem ETD

Gambar 3 Implementasi Ontologi dalam bahasa OWL

Mandala pada publikasinya juga menyatakan bahwa linguistik untuk sistem temu
kembali informasi dapat diidentifikasi dengan lima unsur, yaitu : (1). Kata perintah
pencarian (kp), (2). Kata kunci yang mewakili category objek pencarian (ctg), (3). Kata kunci
yang mewakili datatype property (dtp), (4). Kata kunci yang mewakili object property (obp) dan
(5). Nilai dari sebuah datatype property (value) [14]. Berdasarkan kelima unsur tersebut, dapat
diidentifikasi pola kalimat (K) sebagai berikut [14]:
K  kp + ctg + [dtp | obp] + value
Pada publikasinya, Mandala juga mengatakan bahwa unsur minimal kalimat yang
bernilai valid untuk sistem temu kembali informasi terdiri dari: (1). Kalimat minimal harus
terdiri dari kata perintah (cari, carikan, atau tampilkan), kategori pencarian (atau ctg : tesis,
disertasi atau penelitian) dan nilai yang akan dicari; (2). Kalimat yang memiliki datatype
properties (dtp) atau object properties (obp) lebih dari satu akan dinyatakan valid jika dtp atau
obp tidak mempunyai makna yang sama [14]. Selain pengukuran validitas, Mandala juga
melakukan identifikasi pola kalimat pencarian untuk sistem temu kembali informasi. Pola
kalimat pencarian tersebut, terdiri dari [14] :
1. Tipe 1 : K  kp + ctg + value.
Kalimat tipe 1 terdiri dari kata pencari + kata yang mengandung unsur category
pencarian + value pencarian.
2. Tipe 2 : K  kp + ctg + dtp + value.
Kalimat tipe 2 terdiri dari kata pencari + kata yang mengandung unsur category
pencarian + kata yang mengandung unsur datatype pencarian + value pencarian;
3. Tipe 3 : K  kp + ctg +obp +value.
Kalimat tipe 3 terdiri dari kata pencari + kata yang mengandung unsur category
pencarian + kata yang mengandung unsur object property pencarian + value pencarian.
4. Tipe 4 : K  kp + ctg + dtp + value + obp + value
Kalimat tipe 4 terdiri dari kata pencari + kata yang mengandung unsur category
pencarian + kata yang mengandung unsur data property pencarian + value pencarian +
kata yang mengandung unsur object property pencarian + value pencarian.
5. Tipe 5 : K  kp + ctg + dtp + value + dtp + value
Kalimat tipe 5 terdiri dari kata pencari + kata yang mengandung unsur category
pencarian + kata yang mengandung unsur data property pencarian + value pencarian +
kata yang mengandung unsur data property pencarian + value pencarian.
6. Tipe 6 : K  kp + ctg + obp + value + obp + value.
Kalimat tipe 3 terdiri dari kata pencari + kata yang mengandung unsur category
pencarian + kata yang mengandung unsur object property pencarian + value pencarian +
kata yang mengandung unsur object property pencarian + value pencarian.
Proses pengolahan bahasa yang dilakukan terhadap kalimat yang diinputkan adalah:
(1) proses tokenizing, yaitu memecah setiap kata yang menyusun suatu kalimat pencarian
yang diterima oleh sistem. Proses ini dilakukan dengan menggunakan algoritma yang
dipublikasikan [15] yang mengandalkan karakter spasi pada kalimat untuk melakukan
pemisahan kata. (2) Berbarengan dengan proses tokenizing, juga dilakukan proses filtering,
atau proses menghilangkan kata yang tidak memiliki arti pada kalimat masukan. Term yang
diperoleh dari tahap tokenisasi akan dicek terhadap daftar stopword yang tersimpan pada
ontologi. Apabila sebuah kata termasuk dalam daftar stopword maka kata tersebut akan

9
diabaikan oleh sistem dan tidak akan diproses lebih lanjut. Sebaliknya jika terdapat kata
yang tidak termasuk didalam daftar stopword maka kata tersebut akan masuk pada proses
berikutnya. (3) Selanjutnya adalah Proses stemming yang pada dasarnya adalah proses untuk
mencari root dari sebuah kata. Pencarian root sebuah kata atau biasa disebut dengan kata
dasar dapat memperkecil hasil indeks tanpa harus menghilangkan makna. Beberapa term
hasil stemming bisa jadi berupa kata standar pencarian. Kata standar pencarian (keyword)
merupakan kata-kata yang digunakan sebagai standar acuan dalam pembentukan sebuah
kalimat dan disimpan dalam sebuah kelas pada ontologi. Karenanya pada proses ini
dilakukan pengecekan term terhadap sebuah daftar keyword yang tersimpan pada ontologi.
(4) Setelah kalimat terpotong-potong dan dirubah menjadi kata dasarnya, maka kalimat
tersebut dapat dicek validitas dan tipe kalimatnya berdasarkan skema yang dipublikasikan
oleh [14]. Kalimat yang invalid akan ditolak oleh sistem dan ditampilkan sebagai kalimat
yang tidak valid.
Hasil dari keempat proses pengolahan kalimat perintah secara linguistik/bahasa di
atas, dilanjutkan dengan proses pembentukan representasi query dengan menggunakan
SWRL. Aturan SWRL yang dibentuk adalah aturan dasar dalam format query SWRL untuk
retrieve informasi sesuai dengan parameter yang diberikan.
ctg OntologyETD:title(?f, ?t) ∧ OntologyETD:author(?f, ?a) ∧
OntologyETD:department(?a, ?d) ∧ OntologyETD:programmeName(?d, ?dp) ∧
OntologyETD:sinopsis(?f, ?s) ∧ OntologyETD:fullName(?a, ?af) ∧
OntologyETD:hasKeyword(?f, ?kw) ∧ OntologyETD:keyword(?kw, ?k) ∧
OntologyETD:adviser(?f, ?adv) ∧ OntologyETD:fullName(?adv, ?advf)
filter → sqwrl:select(?f, ?t, ?af, ?dp, ?s, ?k, ?advf)

Gambar 4. Aturan dasar query SWRL
Aturan dasar query SWRL yang ditunjukkan pada Gambar 4, pada prinsipnya
adalah template untuk inisiasi semua properti ontologi yang kemudian di-generate
berdasarkan parameter yang diinputkan oleh user. Query SWRL yang telah di-generate,
kemudian dieksekusi oleh mesin SWRL untuk selanjutnya melakukan pencarian pada file
ontologi ETD.
Perancangan Sistem
Pengujian dilakukan dengan tujuan untuk mengetahui tingkat keberhasilan sistem
yang dibangun. Menurut Mandala [14] pengujian dilakukan dengan cara memberikan
penilaian terhadap komponen berikut: a) Apakah sistem mampu mengenali validitas
kalimat dengan tepat dan mampu merubah kalimat pencarian menjadi representasi
kalimat sebelum query? (b) Apakah sistem mampu mengenali value kunci dengan tepat? (c)
Apakah sistem mampu menentukan statement query dengan tepat? (d) Apakah sistem
mampu menghasilkan informasi yang tepat untuk setiap kalimat pencarian yang
dimasukkan?
Dari keempat parameter pengujian tersebut, tingkat keberhasilan sistem pencarian
diukur dengan dua cara, yaitu: pengujian kalimat perintah semantic search dan pengujian
informasi yang ditemukembalikan. Untuk pengujian kalimat perintah, sistem diujikan
terhadap sejumlah kalimat perintah pencarian kepada sistem dan menghitung seberapa
banyak yang dapat diproses secara tepat oleh sistem. Kalimat yang digunakan untuk
pengujian sistem adalah pengembangan dari pola-pola kalimat pencarian seperti yang
dipublikasikan oleh Mandala [14]. Gambar 4 memperlihatkan output dari pengujian kalimat

pencarian pada metode semantic search. Sedangkan Tabel 2 memperlihatkan hasil pengujian
kalimat pencarian pada metode semantic search.

Gambar 5. Pengujian semantic search dengan pola kalimat a.1
Tabel 2. Pengujian kalimat pencarian pada metode semantic search
No

Kalimat pencarian

a1
a2

Cari buku sistem
Tampilkan tugas akhir
analisa keputusan
Carikan tugas akhir
analisis keputusan
Cari buku dengan tema
semantic web
Cari publikasi dosen
dengan topik semantik
web
Cari tugas akhir dengan
bahasan web semantik
Cari tugas akhir dengan
judul web semantic
Cari buku yang
membahas semantic web
Cari tugas akhir yang
berhubungan dengan
semantic web
Cari tugas akhir yang
berjudul semantic web
Cari tugas akhir tentang

a3
b1
b2
b3
b4
b5
b6
b7
b8

Komponen pengujian : Apakah sistem mampu
Mengenali Mengenali Menentukan Menghasilkan
validitas
value
statement
informasi
kalimat
kunci
query
yang tepat
















































































11

No

b9
c1
c2
c3
c4
c5
c6
c7
c8
d1

d2

d3
d4
d5

d6

e1

f1

Kalimat pencarian
semantic web
Cari tugas akhir
mengenai semantic web
Cari tugas akhir yang
dibimbing oleh Dr. Ely
Susanto
Cari tugas akhir yang
pembimbingnya Dr. Ely
Susanto
Cari tugas akhir yang
bimbingan dengan Dr.
Ely Susanto
Cari buku buatan Yunita
Cari tugas akhir karangan
Yunita
Cari publikasi dosen yang
dikarang oleh Yunita
Cari tugas akhir yang
disusun oleh Yunita
Cari semua yang dibuat
oleh Yunita
Cari tugas akhir yang
judulnya analisis
keputusan yang
dibimbing oleh Dr. Ely
Cari tugas akhir yang
judulnya analisis
keputusan yang
pembimbingnya Dr. Ely
Cari tugas akhir yang
berhubungan analisis
keputusan karangan agus
Cari tugas akhir yang
topiknya analisis
keputusan buatan agus
Cari tugas akhir yang
membahas analisis
keputusan dan dibuat
agus
Tampilkan semua yang
berjudul analisa
keputusan dan dibuat
agus
Cari tugas akhir yang
dibimbing Dr. Ely dan
disusun oleh Muhammad
Nasikh tahun 2012
Cari tugas akhir yang
pembimbingnya Dr. Ely

Komponen pengujian : Apakah sistem mampu
Mengenali Mengenali Menentukan Menghasilkan
validitas
value
statement
informasi
kalimat
kunci
query
yang tepat




































































































































No

f2

f3

f4

Kalimat pencarian
dan dibuat oleh
Muhammad Nasikh
Cari tugas akhir yang
bimbingan dengan Dr.
Ely dan karangan
Muhammad Nasikh
Cari tugas akhir yang
bimbingan dengan Dr.
Ely dan buatan
Muhammad Nasikh
Cari tugas akhir yang
pembimbingnya Dr. Ely
dan disusun oleh
Muhammad Nasikh

Komponen pengujian : Apakah sistem mampu
Mengenali Mengenali Menentukan Menghasilkan
validitas
value
statement
informasi
kalimat
kunci
query
yang tepat
























Hasil pengujian menunjukkan bahwa sistem mampu: (1) mengenali validitas kalimat
dengan tepat, (2) mampu merubah kalimat pencarian menjadi representasi kalimat sebelum
query, (3) mampu mengenali value kunci dengan tepat, (4) mampu menentukan statement
query dengan tepat dan (5) mampu menghasilkan informasi yang tepat untuk setiap kalimat
pencarian yang dimasukkan.
Pengujian sistem temu kembali informasi
[16] mengatakan bahwa untuk mengukur efektifitas sistem temu kembali informasi
terdapat dua rasio umum yang biasa dipergunakan, yaitu precision (ukuran kemampuan
sebuah sistem untuk menampilkan hanya dokumen yang relevan) dan recall (ukuran
kemampuan sistem untuk menampilkan seluruh dokumen yang relevan). Untuk mengukur
rasio precision dan recall, maka perlu mengetahui jumlah dokumen relevan terhadap suatu
kata kunci (keyword) yang tersimpan pada ontologi. Kemudian dilakukan pengujian
berdasarkan kata kunci tersebut dan dihitung jumlah dokumen yang dikembalikan dan
jumlah dokumen yang dikembalikan yang relevan terhadap kata kunci yang dicari. Tabel 3
memperlihatkan hasil pengujian tersebut.
Tabel 3. Inisiasi kata kunci (keyword) pada dokumen yang tersimpan
No
Kata kunci
∑ dokumen
∑ Dokumen ∑ Dokumen
relevan tersimpan
yang
relevan yang
pada database
dikembalikan dikembalikan
1
Analisa keputusan
1
1
1
2
Analisis keputusan
1
1
1
3
Semantic
3
3
3
4
Semantik
5
5
5
5
Semantic web
2
2
2
6
Semantik web
2
2
2
7
Web semantik
2
2
2
8
Web
7
7
7

13
Dari Tabel 3 tersebut, maka dapat dihitung rasio precision dan rasio recall untuk
setiap kata kunci, seperti:

Selanjutnya hasil perhitungan rasio precision dan recall ditampilkan pada Tabel 4.
No
1
2
3
4
5
6
7
8

Tabel 4 Tabel perhitungan rasio precision dan recall
Kata kunci pencarian
rasio precision
Rasio recall
Analisa keputusan
100%
100%
Analisis keputusan
100%
100%
Semantic
100%
100%
Semantik
100%
100%
Semantic web
100%
100%
Semantik web
100%
100%
Web semantik
100%
100%
Web
100%
100%

Pada tabel 4 terlihat bahwa hasil perhitungan rasio precision untuk setiap kata kunci
adalah 100%. Begitupun untuk hasil perhitungan rasio recall. Dengan demikian, merujuk
pada pernyataan Harrod dan Prytherch dalam [17] yang mengatakan “bahwa suatu sistem
temu balik informasi dapat dikatakan efektif apabila rasio recall dan precision sama besarnya
(1:1)”, maka sistem semantic search yang dikembangkan pada penelitian ini dapat dikatakan
efektif.
KESIMPULAN
Berdasarkan hasil penelitian yang telah dilakukan dapat disimpulkan:
1. Model ontologi dapat digunakan untuk menyimpan data dan metadata dokumen digital
library dan membantu meningkatkan efektivitas hasil pencarian.
2. Dari hasil pengujian dengan menginputkan sejumlah kalimat perintah pencarian, sistem
mengenali kalimat perintah yang diinputkan dan memberikan informasi yang relevan
maknanya terhadap yang diinginkan user.
3. Aturan pengolahan bahasa dan aturan query yang diimplementasikan memberikan
hasil perhitungan rasio precision dan rasio recall pada setiap pengujian kata kunci yang
sama besar yaitu 100%, yang berarti sistem dapat dikatakan efektif.
SARAN
Penelitian ini berkonsentrasi untuk meningkatkan hasil pencarian dari sistem
pencarian digital library, dan karenanya pada penelitian selanjutnya diharapkan dapat

ditambahkan suatu metode/mekanisme berupa koreksi otomatis sebagai alternatif
perbaikan kesalahan, jika kalimat yang dimasukkan tidak valid.
DAFTAR PUSTAKA
[1] Al-Kalani, F., Awad, M.G., dan Hani, N.B., 2010, Semantic Web: Improving Search
Using RDF Instead of XML, Global Journal of Computer Science and Technology, Vol. 10
Issue 15, Hal 23-26.
[2] Davies, J., Fensel, D., dan van Harmelen, F., 2002, Towards the Semantic web -OntologyDriven Knowledge Management, John Wiles and Sons, Ltd, Chichester.
[3] Berners-Lee, T., 2001., The Semantic web., The Scientific American.
[4] Wibisono, S., 2010, Aplikasi Pengolah Bahasa Alami untuk query Basisdata Akademik
dengan format data XML, Tesis, Universitas Gadjah Mada.
[5] Hui-fang, Q., 2009, Construction of University Digital library Resources under the
Network Environment, IEEE Computer Society Proceedings of International Conference on
Networking and Digital Society, hlm. 12-15.
[6] Kruk, S.R., Zimmerman, K., dan Sapkota, B., No Date, Semantically Enhanced Search
Services in Digital Libraries, Digital Enterprise Research Institute, Deri Galway, Ireland.
[7] Sloni, D.K., dan Mahawar, N.K., 2010, Design a Customize Search Engine: Semantic
Web, International Journal of Soft Computing and Engineering (IJSCE), Vol. I.
[8] Unni, M., dan Baskaran, K., 2011, Overview of Approaches to Semantic Web Search,
International Journal of Computer Science and Communication (IJCSC), No. 2, Vol. 2, Hal 345349.
[9] Strzalkowski, T., Carballo, J.P., Karlgren, J., Hulth, A., Tapanainen, P., dan Lahtinen, T.,
1999,
Natural
Language
Information
Retrieval,
http://trec.nist.gov/pubs/trec8/papers/ge8adhoc2.pdf, diakses tanggal 26 Maret 2012.
[10] Nurkhamid, 2009, Aplikasi bibliografi perpustakaan berbasis teknologi semantic web,
Tesis, Universitas Gadjah Mada.
[11] Noy, N.F., dan McGuinness, D.L., 2001, Ontologi Development 101 : A Guide to
Creating Your First Ontologi, http://protege.stanford.edu/publications/ontologi_development/ ,
diakses pada tanggal 7 Februari 2012.
[12] Breitman, K. K., Casanova, M. A., dan Truszkowski, W., 2007, Semantic Web : Concepts,
Technologies and Applications, Springer, London.

15
[13] Liddy, E.D., 2001, Natural Language Processing, In Enclopedia of Library and Information
Science-2nd Edition, Marcel Decker Inc., NY., USA.
[14] Mandala, R., 1999, Temu Kembali Informasi dengan Bantuan Analisis Linguistik,
Proceeding of Information Processing and Management.
[15] Tala, Z., 2003, A Study of Stemming Effect on Information Retrieval in Bahasa
Indonesia, Theses, Institute for Logic, Language and Computation, Universiteit van
Amsterdam, The Nedherlands.
[16] Grossman, D. A. dan Frieder, O., 2004, Information Retrieval : Algorithms and Heuristics,
Springer.
[17] Mustangimah, 1998, Efektifitas system temu kembali informasi dan analisis
bibliometrik: aplikasi pada dokumen bidang nuklir berbahasa Indonesia, Tesis,
Universitas Indonesia

Dokumen yang terkait

PENGARUH PEMBERIAN SEDUHAN BIJI PEPAYA (Carica Papaya L) TERHADAP PENURUNAN BERAT BADAN PADA TIKUS PUTIH JANTAN (Rattus norvegicus strain wistar) YANG DIBERI DIET TINGGI LEMAK

23 199 21

KEPEKAAN ESCHERICHIA COLI UROPATOGENIK TERHADAP ANTIBIOTIK PADA PASIEN INFEKSI SALURAN KEMIH DI RSU Dr. SAIFUL ANWAR MALANG (PERIODE JANUARI-DESEMBER 2008)

2 106 1

FREKUENSI KEMUNCULAN TOKOH KARAKTER ANTAGONIS DAN PROTAGONIS PADA SINETRON (Analisis Isi Pada Sinetron Munajah Cinta di RCTI dan Sinetron Cinta Fitri di SCTV)

27 310 2

MANAJEMEN PEMROGRAMAN PADA STASIUN RADIO SWASTA (Studi Deskriptif Program Acara Garus di Radio VIS FM Banyuwangi)

29 282 2

ANALISIS PROSPEKTIF SEBAGAI ALAT PERENCANAAN LABA PADA PT MUSTIKA RATU Tbk

273 1263 22

PENERIMAAN ATLET SILAT TENTANG ADEGAN PENCAK SILAT INDONESIA PADA FILM THE RAID REDEMPTION (STUDI RESEPSI PADA IKATAN PENCAK SILAT INDONESIA MALANG)

43 322 21

KONSTRUKSI MEDIA TENTANG KETERLIBATAN POLITISI PARTAI DEMOKRAT ANAS URBANINGRUM PADA KASUS KORUPSI PROYEK PEMBANGUNAN KOMPLEK OLAHRAGA DI BUKIT HAMBALANG (Analisis Wacana Koran Harian Pagi Surya edisi 9-12, 16, 18 dan 23 Februari 2013 )

64 565 20

PEMAKNAAN BERITA PERKEMBANGAN KOMODITI BERJANGKA PADA PROGRAM ACARA KABAR PASAR DI TV ONE (Analisis Resepsi Pada Karyawan PT Victory International Futures Malang)

18 209 45

STRATEGI KOMUNIKASI POLITIK PARTAI POLITIK PADA PEMILIHAN KEPALA DAERAH TAHUN 2012 DI KOTA BATU (Studi Kasus Tim Pemenangan Pemilu Eddy Rumpoko-Punjul Santoso)

119 459 25

STRATEGI PUBLIC RELATIONS DALAM MENANGANI KELUHAN PELANGGAN SPEEDY ( Studi Pada Public Relations PT Telkom Madiun)

32 284 52