Mesin pencari koleksi perpustakaan menggunakan binary independence model dan vector space model : studi kasus Perpustakaan Universitas Sanata Dharma - USD Repository
MESIN PENCARI KOLEKSI PERPUSTAKAAN MENGGUNAKAN
BINARY INDEPENDENCE MODEL DAN VECTOR SPACE MODEL STUDI KASUS : PERPUSTAKAAN UNIVERSITAS SANATA DHARMA SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Teknik Komputer (S.Kom.) Program Studi Teknik Informatika
Oleh: Roy Syahputra NIM : 085314107
PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA
SEARCH ENGINE FOR LIBRARY COLLECTION WITH
BINARY INDEPENDENCE MODEL AND VECTOR SPACE
MODEL CASE STUDY :
LIBRARY OF SANATA DHARMA UNIVERSITY
THESIS
Presented as Partial Fullfilment of the Requirements
To Obtain the Computer Bachelor Degree
In Informatics Engineering
By:
Roy Syahputra
NIM : 085314107
DEPARTMENT OF INFORMATICS ENGINEERING
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2012
HALAMAN PERSETUJUAN
HALAMAN PENGESAHAN
PERNYATAAN KEASLIAN KARYA
HALAMAN PERSEMBAHAN
a humble present for you…
ABSTRAKSI
Vector Space Model dan Binary Independence Model adalah 2 metode yangdipakai untuk memodelkan hasil Pemerolehan Informasi. Pada metode Vector Space
Model, setiap potongan kata (token) dalam dokumen dilambangkan sebagai vektor
dan dihitung jarak kedekatannya dengan kata pencarian menggunakan Cosine
Similarity. Metode Binary Independence Model menghitung peluang munculnya kata
pencarian pada dokumen dengan menggunakan prinsip peluang Naïve Bayes.Pada tugas akhir ini dibuat mesin pencari untuk membandingkan kedua
metode tersebut. Perbandingan dilakukan dalam hal unjuk kerja dan lama waktu
pencarian. Unjuk kerja diukur dari nilai precision dan recall untuk masing-masing
metode. Lama waktu pencarian diukur dengan menghitung waktu setiap metode
mulai dilakukan sampai metode selesai dilakukan. Koleksi yang digunakan berupa 72
buah ebook dan 34 buah Tugas Akhir dengan 2 bahasa, yaitu bahasa Inggris dan
bahasa Indonesia.Hasil percobaan menunjukan bahwa rata-rata lama waktu pencarian untuk
metode Vector Space Model lebih cepat dibandingkan dengan lama waktu pencarian
metode Binary Independence Model. Akan tetapi hasil perhitungan average precision
pada 11 titik untuk metode Binary Independence Model lebih baik dibandingkan
dengan metode Vector Space Model dalam menangani pencarian pada koleksi
Perpustakaan Universitas Sanata Dharma.
ABSTRACT
Vector Space Model and Binary Independence Model are two methods thatbeen used to modelize retrieval result in Information Retrieval. In Vector Space
Model, every word in a document represented as vector, and the similarities compare
to search keyword’s vector measured using Cosine Similarity. Binary Independence
Model count the search keyword probabilistic shown up in a document using Naïve
Bayes’s principal.In this thesis, a search engine were built to compare thus two methods.
Comparison will be made in terms of performance and searching time. The
performance will be measured by the value of precision and recall for each method.
The searching time will be measured as the method starts to search until it has done
the searching process. The collection that used in this thesis were 72 ebooks and 34
thesises within 2 languages, Bahasa Indonesia and English.The result says that the average searching time for Vector Space Model is
faster than Binary Independence Model’s average searching time. However, result for
measuring average of the precision within 11-point for Binary Independence Model is
better than Vector Space Model’s handling in the Sanata Dharma University Library
collection search.LEMBAR PERNYATAAN PERSETUJUAN
KATA PENGANTAR
Puji dan syukur saya panjatkan kepada Tuhan Yang Maha Esa karena segala
berkat dan rahmat yang telah diberikan sehingga saya dapat menyelesaikan tugas
akhir dengan judul “Mesin Pencari Koleksi Perpustakaan Menggunakan Binary
Independence Model dan Vector Space Model Studi Kasus: Perpustakaan Universitas
Sanata Dharma”.Pada kesempatan ini saya ingin mengucapkan terima kasih kepada pihak-
pihak yang telah mendukung saya selama pengerjaan tugas akhir ini. Ucapan terima
kasih ini saya tujukan kepada:1. Ibu Paulina Heruningsih Prima Rosa, S.Si., M.Sc. selaku dekan Fakultas Sains dan Teknologi Universitas Sanata Dharma.
2. Ibu Ridowati Gunawan, S.kom., M.T. selaku ketua jurusan Teknik Informatika Universitas Sanata Dharma.
3. Ibu Sri Hartati Wijono, S.Si., M.Kom. selaku Dosen Pendamping Akademik dan Dosen Pembimbing TA, atas kesabaran dan perhatian dalam mendampingi saya selama melewati proses penyelesaian studi.
4. Bapak JB. Budi Darmawan, S.T., M.Sc. dan Bapak Puspaningtyas Sanjaya Adi, S.T., M.T. selaku Penguji TA, atas saran dan kritik yang diberikan untuk menunjang Tugas Akhir ini.
5. Ayah, Ibu, dan adik-adik saya atas dukungan tanpa henti yang menjadikan perjuangan ini berarti.
6. Cameroon dan teman-teman dekatnya, atas seluruh bantuan dan dukungan yang diberikan selama pengerjaan Tugas Akhir ini.
7. Responden Kuisioner, atas kerjasama dalam menilai Tugas Akhir ini.
8. Teman-teman Teknik Informatika angkatan 2008, atas dukungan dan persahabatan.
9. Seluruh pihak yang membantu kelancaran dalam penulisan Tugas Akhir ini, secara langsung dan tidak langsung, yang tidak dapat saya sebutkan satu persatu. Saya menyadari masih banyak terdapat kekurangan dalam penelitian ini.
Saran dan kritik akan selalu saya nantikan untuk perbaikan-perbaikan di masa yang
akan datang.Akhir kata, saya berharap tulisan ini dapat bermanfaat bagi kemajuan dan perkembangan ilmu pengetahuan serta para pembaca sekalian.
Yogyakarta, 27 Agustus 2012 penulis
DAFTAR ISI
HALAMAN JUDUL INDONESIA............................................................................... i
HALAMAN JUDUL INGGRIS ...................................................................................ii
HALAMAN PERSETUJUAN.....................................................................................iii
HALAMAN PENGESAHAN...................................................................................... iv
PERNYATAAN KEASLIAN KARYA ....................................................................... v
HALAMAN PERSEMBAHAN .................................................................................. vi
ABSTRAKSI ..............................................................................................................vii
ABSTRACT...............................................................................................................viii
LEMBAR PERNYATAAN PERSETUJUAN ............................................................ ix
PUBLIKASI KARYA ILMIAH ................................. Error! Bookmark not defined.
KATA PENGANTAR .................................................................................................ix
DAFTAR ISI...............................................................................................................xii
DAFTAR GAMBAR ................................................................................................xvii
DAFTAR LIST CODE ................................................................................................ xx
DAFTAR TABEL.....................................................................................................xxii
DAFTAR LAMPIRAN ............................................................................................. xxv
BAB I PENGANTAR ................................................................................................ 1
1.1. Latar Belakang ................................................................................................ 1
2.2. Information Retrieval...................................................................................... 8
2.4.1. Inverted Index ........................................................................................... 17
2.4. Document Indexing ....................................................................................... 17
2.3.3. Stemming................................................................................................... 10
2.3.2. Stop-word Removal..................................................................................... 9
2.3.1. Tokenizing................................................................................................... 9
2.3. Document Processing ..................................................................................... 9
2.1.1. Perpustakaan Universitas Sanata Dharma .................................................. 7
1.2. Rumusan Masalah ........................................................................................... 3
2.1. Perpustakaan ................................................................................................... 7
BAB II LANDASAN TEORI ...................................................................................... 7
1.7. Sistematika Penulisan ..................................................................................... 6
1.6. Metodologi Penelitian ..................................................................................... 5
1.5. Luaran ............................................................................................................. 5
1.4. Batasan Permasalahan..................................................................................... 4
1.3. Tujuan Penelitian ............................................................................................ 4
2.5. Document Searching ..................................................................................... 17
2.5.1. Hash Table................................................................................................ 18
3.1.1. Fase Definisi Ruang Lingkup (Scope Definition Phase) .......................... 46
3.1.3.2. Narasi Use Case................................................................................. 48
3.1.3.1. Diagram Use Case ............................................................................. 48
3.1.3. Fase Analisis Kebutuhan (Requirement Analysis Phase) ......................... 48
3.1.2.2. Analisa Kebutuhan Sistem Baru........................................................ 47
3.1.2.1. Analisa Sistem Saat Ini...................................................................... 47
3.1.2. Fase Analisis Masalah (Problem Analysis Phase).................................... 47
3.1. Analisa Sistem .............................................................................................. 46
2.6. Bayesian Model............................................................................................. 18
BAB III ANALISIS DAN PERANCANGAN .......................................................... 46
2.10. Metodologi FAST ......................................................................................... 43
2.9. Recall and Precission ................................................................................... 42
2.8. Perhitungan Contoh Kasus............................................................................ 26
2.7. Vector Space Model ...................................................................................... 24
2.6.2. BM25 ........................................................................................................ 22
2.6.1. Binary Independence Model ..................................................................... 18
3.2. Perancangan Sistem ...................................................................................... 49
3.2.1. Langkah Penelitian ................................................................................... 50
4.4.1. Tokenizing................................................................................................. 63
4.7.1. Vector Space Model .................................................................................. 92
4.7. Modeling ....................................................................................................... 91
4.6. Document Searching ..................................................................................... 91
4.5. Document Indexing ....................................................................................... 82
4.4.3. Stemming................................................................................................... 66
4.4.2. Stop-word Removal................................................................................... 65
4.4. Documet Processing ..................................................................................... 63
3.2.2. Disain Fisikal ............................................................................................ 51
BAB IV IMPLEMENTASI ...................................................................................... 63
3.2.5. Diagram Kelas .......................................................................................... 61
3.2.4. Analisa Hasil............................................................................................. 61
3.2.3. Flowchart.................................................................................................. 56
3.2.2.3. Antarmuka ......................................................................................... 55
3.2.2.2. Physical Design Database.................................................................. 53
3.2.2.1. Entity Relational Diagram ................................................................. 51
4.7.2. BM25 ...................................................................................................... 101
4.8. Implementasi Use Case............................................................................... 119
4.8.1. Halaman Pencarian ................................................................................. 119
BAB V HASIL DAN PEMBAHASAN.................................................................. 121
5.1. Hasil Penelitian ........................................................................................... 121
5.1.1. Hasil Pengukuran (kuesioner)................................................................. 121
5.1.2. Hasil Pengukuran (waktu pencarian) ...................................................... 134
5.2. Analisa Hasil Penelitian .............................................................................. 137
5.2.1. Unjuk Kerja Vector Space Model (VSM)............................................... 137
5.2.2. Unjuk Kerja BM25 ................................................................................. 139
5.2.3. Perbandingan Unjuk Kerja VSM dan BM25 .......................................... 142
5.2.4. Perbandingan Lama Waktu Pencarian VSM dan BM25 ........................ 144
BAB VI KESIMPULAN DAN SARAN ................................................................. 146
6.1. Kesimpulan ................................................................................................. 146
6.2. Saran ........................................................................................................... 146
DAFTAR PUSTAKA ............................................................................................... 148
LAMPIRAN.............................................................................................................. 150
DAFTAR GAMBAR
Gambar 2.1. Proses tokenizing ...................................................................................... 9Gambar 2.2. Flowchart algoritma stemming Bahasa Indonesia Nazief & Adriani .... 13Gambar 2.3. Flowchart Porter Stemmer ..................................................................... 16Gambar 2.4. Inverted Index......................................................................................... 17Gambar 2.5. Vector Space Model ............................................................................... 24Gambar 3.1. Diagram Use Case.................................................................................. 48Gambar 3.2. Diagram blok (indexing) ........................................................................ 50Gambar 3.3. Diagram blok (searching) ...................................................................... 50Gambar 3.4. ER Diagram Perpustakaan Sanata Dharma............................................ 51Gambar 3.5. ER Diagram penelitian........................................................................... 52Gambar 3.6. ER Diagram ........................................................................................... 53Gambar 3.7. Rancangan Antarmuka ........................................................................... 55Gambar 3.8. Flowchart Tokenizing............................................................................. 56Gambar 3.9. Flowchart Stop-word Removal .............................................................. 56Gambar 3.10. Flowchart Stemming ............................................................................ 57 Gambar3.11. Flowchart Nazief & Adriani (Nazief, 1996) ......................................... 58Gambar 3.12. Flowchart Porter Stemmer (Porter, 1980) ........................................... 59Gambar 3.13. Flowchart Document Indexing............................................................. 60Gambar 3.14. Flowchart Document Searching .......................................................... 60Gambar 3.15. Diagram kelas....................................................................................... 62Gambar 4.1. Halaman Pencarian............................................................................... 120Gambar 4.2. Halaman Tunggu .................................................................................. 120Gambar 5.1. Hasil pencarian VSM skenario 1.......................................................... 125Gambar 5.2. Grafik Unjuk Kerja VSM pada pencarian seluruh isi dokumen .......... 138Gambar 5.3. Grafik Unjuk Kerja VSM pada pencarian judul dokumen................... 139Gambar 5.4. Grafik Unjuk Kerja BM25 pada pencarian seluruh isi dokumen ......... 140Gambar 5.5. Grafik Unjuk Kerja BM25 pada pencarian judul dokumen ................. 141Gambar 5.4. Grafik Perbandingan Unjuk Kerja VSM dan BM25 pada pencarian seluruh isi dokumen .................................................................................................. 142Gambar 5.5. Grafik Perbandingan Unjuk Kerja VSM dan BM25 pada pencarian judul dokumen.................................................................................................................... 143
Gambar L.2.1. Screenshoot Skenario 1 VSM ........................................................... 173
Gambar L.2.2. Screenshoot Skenario 1 BM25 ......................................................... 173
Gambar L.2.3. Screenshoot Skenario 2 VSM ........................................................... 174
Gambar L.2.5. Screenshoot Skenario 3 VSM ........................................................... 175
Gambar L.2.6. Screenshoot Skenario 3 BM25 ......................................................... 175
Gambar L.2.7. Screenshoot Skenario 4 VSM ........................................................... 176
Gambar L.2.8. Screenshoot Skenario 4 BM25 ......................................................... 176
Gambar L.2.9. Screenshoot Skenario 5 VSM ........................................................... 176
Gambar L.2.10. Screenshoot Skenario 5 BM25 ....................................................... 176
Gambar L.2.11. Screenshoot Skenario 6 VSM ......................................................... 177
Gambar L.2.12. Screenshoot Skenario 6 BM25 ....................................................... 177
Gambar L.2.13. Screenshoot Skenario 7 VSM ......................................................... 177
Gambar L.2.14. Screenshoot Skenario 7 BM25 ....................................................... 178
Gambar L.2.15. Screenshoot Skenario 8 VSM ......................................................... 178
Gambar L.2.16. Screenshoot Skenario 8 BM25 ....................................................... 179
Gambar L.2.17. Screenshoot Skenario 9 VSM ......................................................... 179
Gambar L.2.18. Screenshoot Skenario 9 BM25 ....................................................... 179
DAFTAR LIST CODE
List 4.1.Tokenizing ...................................................................................................... 64
List 4.2.Stop-word Removal ....................................................................................... 66
List 4.2.Stemming........................................................................................................ 67
Listing 4.3. Mencari kata dasar (root word) ............................................................... 74
Listing 4.4. Penghapusan awalan kata (prefix) ........................................................... 81
List 4.3. Table ............................................................................................................. 82
List 4.5.memasukan obyek ke dalam table ................................................................. 82
List 4.6. Word ............................................................................................................. 83
List 4.7. WriteTableToText......................................................................................... 85
List 4.8. TableConfiguration.txt.................................................................................. 86
List 4.9. Pembacaan kamus-kamus ............................................................................. 86
List 4.10. Pembacaan informasi koleksi dari database............................................... 88
List 4.11. Document Processing untuk setiap koleksi ................................................ 89
List 4.12. Pengisian table dari hasil stemming koleksi ............................................... 89
List 4.13. Penyimpanan table ke dokumen teks.......................................................... 89
List 4.14. writeTableToTxt ......................................................................................... 91
List 4.15. Search.......................................................................................................... 91
List 4.16. Idf ................................................................................................................ 92
List 4.17. Smoothing Idf.............................................................................................. 93
List 4.18. Idf kata pencarian........................................................................................ 93
List 4.19. Pencarian dokumen relevan ........................................................................ 94
List 4.20. Penambahan opsi status kata pada pencarian ............................................. 96
List 4.21. Document .................................................................................................... 99
List 4.22. Tf_idf ........................................................................................................ 100
List 4.23. Similarity .................................................................................................. 101
List 4.24. Selection sort............................................................................................. 101
List 4.25. Pencarian dokumen relevan ...................................................................... 104
List 4.25. lookUpWordAtDocument......................................................................... 108
List 4.26. getRelevanDocumentFromDocAccList .................................................... 111
List 4.27. getAvdl...................................................................................................... 113
List 4.28. hitungBobotDokumen............................................................................... 116
List 4.29. hitungBobotPeluangKata .......................................................................... 117
List.4.30. Waktu Pencarian BM25 ............................................................................ 118
List 4.31. Waktu Pencarian VSM ............................................................................. 118
DAFTAR TABEL
Tabel 2.1.Kombinasi awalan akhiran yang tidak diijinkan. ........................................ 12
Tabel 2.2.Cara menentukan tipe awalan untuk awalan “te-”. ..................................... 14
Tabel 2.3. Jenis Awalan Berdasarkan Tipe Awalannya.............................................. 14 Tabel. 2.6.1 Contingency Table .................................................................................. 21Tabel 3.1. Struktur tabel ebook_db ............................................................................. 53Tabel 3.2. Struktur tabel ta_ti...................................................................................... 54Tabel 3.3. Struktur tabel pengarang ............................................................................ 54Tabel 3.4. Struktur tabel penerbit................................................................................ 54Tabel 5.1. Rekap Skenario 1 ..................................................................................... 122Tabel 5.2. Rekap Skenario 2 ..................................................................................... 123Tabel 5.3. Rekap Skenario 3 ..................................................................................... 123Tabel 5.4. Rekap Skenario 4 ..................................................................................... 123Tabel 5.5. Rekap Skenario 5 ..................................................................................... 123Tabel 5.6. Rekap Skenario 6 ..................................................................................... 124Tabel 5.7. Rekap Skenario 7 ..................................................................................... 124Tabel 5.8. Rekap Skenario 8 ..................................................................................... 124Tabel 5.9. Rekap Skenario 9 ..................................................................................... 124Tabel 5.10. Precision-Recall responden 1 pada skenario 1 (VSM) .......................... 126Tabel 5.11. Perhitungan interpolasi skenario 1 responden 1 (VSM) ........................ 127Tabel 5.12. Precision-Recall responden 1 pada skenario 1 (BM25) ......................... 128Tabel 5.13. Perhitungan interpolasi skenario 1 responden 1 (BM25) ...................... 128Tabel 5.14. Perhitungan rerata interpolasi (VSM) pada pencarian seluruh isi dokumen ................................................................................................................................... 130Tabel 5.15. Perhitungan rerata interpolasi (VSM) pada pencarian judul dokumen .. 131Tabel 5.16. Rerata interpolasi (VSM) pada pencarian seluruh isi dokumen ............ 131Tabel 5.17. Rerata interpolasi (VSM) pada pencarian judul dokumen ..................... 132Tabel 5.18. Rerata interpolasi (BM25) pada pencarian seluruh isi dokumen ........... 133Tabel 5.19. Rerata interpolasi (BM25) pada pencarian judul dokumen ................... 133Tabel 5.20. Waktu Pencarian VSM........................................................................... 135Tabel 5.21. Waktu Pencarian BM25 ......................................................................... 135Tabel 5.22. Lama Waktu Pencarian VSM ................................................................ 136Tabel 5.23. Lama Waktu Pencarian BM25 ............................................................... 136Tabel 5.24. Perbandingan Lama Waktu Pencarian VSM dan BM25 ....................... 144 Tabel L.3.1. Interpolasi Skenario 1 VSM ................................................................. 180
Tabel L.3.2. Interpolasi Skenario 1 BM25................................................................ 180
Tabel L.3.3. Interpolasi Skenario 2 VSM ................................................................. 181
Tabel L.3.4. Interpolasi Skenario 2 BM25................................................................ 181
Tabel L.3.5. Interpolasi Skenario 3 VSM ................................................................. 182
Tabel L.3.6. Interpolasi Skenario 3 BM25................................................................ 182
Tabel L.3.7. Interpolasi Skenario 4 VSM ................................................................. 183
Tabel L.3.8. Interpolasi Skenario 4 BM25................................................................ 183
Tabel L.3.9. Interpolasi Skenario 5 VSM ................................................................. 184
Tabel L.3.10. Interpolasi Skenario 5 BM25.............................................................. 184
Tabel L.3.11. Interpolasi Skenario 6 VSM ............................................................... 185
Tabel L.3.12. Interpolasi Skenario 6 BM25.............................................................. 185
Tabel L.3.13. Interpolasi Skenario 7 VSM ............................................................... 186
Tabel L.3.14. Interpolasi Skenario 7 BM25.............................................................. 186
Tabel L.3.15. Interpolasi Skenario 8 VSM ............................................................... 187
Tabel L.3.16. Interpolasi Skenario 8 BM25.............................................................. 187
Tabel L.3.17. Interpolasi Skenario 9 VSM ............................................................... 188
Tabel L.3.18. Interpolasi Skenario 9 BM25.............................................................. 188
DAFTAR LAMPIRAN
Lampiran 1 Contoh Kesioner ................................................................................ 150
Lampiran 2 Screenshoot Hasil Pencarian ............................................................. 172
Lampiran 3 Tabel Perhitungan Interpolasi Precision dan Recall ...................... 180
Lampiran 4 Source Code Program ....................................................................... 189
BAB I PENGANTAR
1.1. Latar Belakang
Perpustakaan Universitas Sanata Dharma Yogyakarta merupakan
perpustakaan yang berada di Universitas Sanata Dharma (USD) Yogyakarta.
Perpustakaan terdiri dari 2 (dua) unit perpustakaan yaitu Perpustakaan Kampus
Mrican dan Perpustakaan Kampus Paingan yang dikelola secara sentralisasi.
Perpustakaan kampus Mrican merupakan perpustakaan Pusat, yang terdiri dari 4
(empat) lantai, sedangkan Perpustakaan Kampus Paingan merupakan perpustakaan
cabang, yang terdiri dari 2 (dua) lantai dan berkonsentrasi pada pelayanan pengguna
bagi civitas akademika USD yang berada di Kampus Paingan. Perpustakaan Mrican
dan Paingan dihubungkan dengan jaringan komputer untuk dapat melayani
penggunanya secara online.Perpustakaan Universitas Sanata Dharma Yogyakarta tercatat memiliki
jumlah koleksi sebanyak 355.567 judul sampai pada tulisan ini dibuat. Koleksi yang
dimiliki dibagi berdasarkan beberapa jenisnya, yaitu koleksi buku, tugas akhir, Non-
Book Material (NBM), majalah, artikel majalah, suara (audio), gambar (image),
gambar bergerak (video), dan e-book. Pada penelitian ini jenis koleksi yang akan
digunakan adalah tugas akhir dan e-book.Untuk membantu pemustaka melakukan pencarian koleksi, Perpustakaan
Universitas Sanata Dharma menyediakan sebuah sistem pencarian koleksi. Sistem
pencarian koleksi ini dapat diakses oleh pemustaka untuk menemukan sendiri koleksi
yang diinginkan. Sistem akan mencari setiap koleksi berdasarkan jenis kata kunci
berupa judul, pengarang, subjek, penerbit, tahun terbit, dan lainnya yang dimasukkan
oleh pemustaka. Dengan demikian, pemustaka harus memasukan kata kunci yang
rinci mengenai informasi koleksi yang diinginkan. Pemustaka akan mengalami
kesulitan dalam pencarian jika hanya mengetahui beberapa potongan informasi
mengenai koleksi yang diinginkan. Hal ini mengakibatkan hasil pencarian yang
ditampilkan oleh sistem akan sangat terbatas dan memiliki perbedaan dengan
keinginan pemustaka.Sebagai contoh pemustaka yang ingin mencari tugas akhir berjudul
“Penipisan Citra huruf Jawa Menggunakan metode Zhang Suen” yang ditulis oleh
Margareta Ratna Kurnianita, harus memilih menu tugas akhir dan memilih jenis kata
kunci yang akan dicari. Jika pemustaka memilih jenis kata kunci judul, kata kunci
yang dimasukan harus berupa kata-kata yang terkandung di dalam judul, seperti
“penipisan citra”, “huruf Jawa”, atau “metode Zhang Suen”. Sistem akan mencari
diantara koleksi tugas akhir yang memiliki judul yang mengandung kata kunci yang
dimasukan pengguna. Memasukan kata kunci nama penulis “Margareta Ratna
Kurnianita” pada jenis kata kunci judul akan menyebabkan sistem tidak dapat
menampilkan hasil pencarian. Hal ini disebabkan kata “Margareta Ratna Kurnianita”
Dari contoh yang telah disebutkan, pemustaka harus mengetahui jenis dari
potongan informasi yang dimilikinya. Potongan informasi yang tidak diketahui
jenisnya akan mengakibatkan hasil pencarian yang tidak diharapkan. Proses
pencarian yang dilakukan oleh pemustaka akan terbantu dengan adanya sistem yang
memiliki kemampuan untuk menelusuri informasi isi buku dan menemukannya dari
potongan informasi yang dimiliki. Salah satu cara yang dapat digunakan dalam
membangun sistem tersebut adalah menggunakan metode Pemerolehan Informasi
(Information Retrieval). Di dalam Pemerolehan Informasi, terdapat metode-metode
untuk mengurutkan hasil pencarian. Binary Independence Model dan Vector Space
Model merupakan contoh pendekatan yang dapat digunakan untuk membangun
tampilan hasil urut pencarian.1.2. Rumusan Masalah
Berikut ini merupakan masalah-masalah yang dirumuskan di dalam penelitian:
1. Bagaimana membangun mesin pencari koleksi Perpustakaan Unversitas Sanata Dharma?
2. Bagaimana unjuk kerja dari metode Binary Independence Model dan Vector
Space Model dalam membangun mesin pencari untuk Perpustakaan Universitas Sanata Dharma?
3. Bagaimana kecepatan pencarian dari metode Binary Independence Model dan Vector Space Model dalam menangani koleksi Perpustakaan Universitas Sanata Dharma?
1.3. Tujuan Penelitian
Berikut ini merupakan tujuan yang ingin dicapai melalui penelitian:
1. Membangun mesin pencari koleksi Perpustakaan Unversitas Sanata Dharma.2. Mengukur unjuk kerja dari metode Binary Independence Model dan Vector Space Model dalam membangun mesin pencari untuk Perpustakaan Universitas Sanata Dharma.
3. Mengukur kecepatan pencarian dari metode Binary Independence Model dan Vector Space Model dalam menangani koleksi Perpustakaan Universitas Sanata Dharma.
1.4. Batasan Permasalahan
Berikut ini merupakan batasan masalah dari penelitian:
1. Penelitian ini mengacu pada studi kasus di Perpustakaan Universitas Sanata Dharma, dengan mengambil sampel berupa koleksi digital tugas akhir dan e- book.
2. Teknik stemming yang digunakan di dalam penelitian ini adalah teknik stemming Bahasa Indonesia dan Bahasa Inggris.
3. Teknik stemming Bahasa Indonesia menggunakan algoritma Nazief & Adriani dan teknik stemming Bahasa Inggris menggunakan Porter Stemmer Algorithm.
4. Bahasa pemrograman yang digunakan dalam penelitian ini menggunakan bahasa JAVA.
5. Model yang akan digunakan adalah Binary Independence Model dan Vector Space Model.
1.5. Luaran Luaran dari penelitian ini adalah terciptanya sebuah mesin pencari koleksi
perpustakaan yang menggunakan metode Binary Independence Model dan Vector
Space Model untuk digunakan pada Perpustakaan Universitas Sanata Dharma.
1.6. Metodologi Penelitian Metode yang digunakan untuk melakukan penelitian ini adalah metode
FAST (Framework for the Application of Sistem Thinking). Metode FAST memiliki
langkah-langkah sebagai berikut:1. Analisa Ruang Lingkup Melakukan analisa terhadap ruang lingkup sistem yang sedang berjalan dan pengembangan sistem baru.
2. Analisa Masalah Melakukan analisa terhadap sistem yang sedang berjalan dan menemukan masalah yang dihadapi.
3. Perancangan sistem Melakukan perancangan sistem pada penelitian ini dengan diagram use case, diagram proses, dan flowchart.
4. Implementasi sistem
Melakukan pembangunan sistem sesuai tahap perancangan.
5. Pengujian Melakukan pengujian hasil sistem dengan metode recall dan precision.
6. Pelaporan Melakukan pelaporan hasil pengujian dan analisa.
1.7. Sistematika Penulisan
BAB I : berisi mengenai pendahuluan dan latar belakang masalah yang ingin diselesaikan. BAB II : berisi tentang landasan teori yang digunakan dalam penyusunan dokumen dan pembangunan sistem. BAB III : berisi tentang analisis dan perancangan yang akan digunakan dalam pembangunan sistem
BAB IV : berisi mengenai implementasi dan bentuk pengujian sistem BAB V : berisi mengenai analisa dan kesimpulan
BAB II LANDASAN TEORI Pada bagian ini, penulis akan membahas mengenai dasar-dasar teori yang
digunakan dalam penulisan penelitian. Dasar-dasar teori tersebut dapat dipaparkan
sebagai berikut :2.1. Perpustakaan
Menurut Undang-undang Republik Indonesia Nomor 47 Tahun 2007,
Perpustakaan adalah institusi pengelola karya tulis, karya cetak, dan/atau karya rekam
secara professional dengan sistem yang baku guna memenuhi kebutuhan pendidikan,
penelitian, pelestarian informasi, dan rekreasi para pemustaka. Berdasarkan jenisnya,
Perpustakaan dapat dibedakan menjadi 5, yaitu Perpustakaan Nasional, Umum,
Sekolah/Madrasah, Perguruan Tinggi, dan Khusus (Indonesia, 2007).Perpustakaan