Mesin pencari koleksi perpustakaan menggunakan binary independence model dan vector space model : studi kasus Perpustakaan Universitas Sanata Dharma - USD Repository

MESIN PENCARI KOLEKSI PERPUSTAKAAN MENGGUNAKAN

  BINARY INDEPENDENCE MODEL DAN VECTOR SPACE MODEL STUDI KASUS : PERPUSTAKAAN UNIVERSITAS SANATA DHARMA SKRIPSI

  Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Teknik Komputer (S.Kom.) Program Studi Teknik Informatika

  Oleh: Roy Syahputra NIM : 085314107

PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA

  

SEARCH ENGINE FOR LIBRARY COLLECTION WITH

BINARY INDEPENDENCE MODEL AND VECTOR SPACE

MODEL CASE STUDY :

LIBRARY OF SANATA DHARMA UNIVERSITY

  

THESIS

Presented as Partial Fullfilment of the Requirements

To Obtain the Computer Bachelor Degree

  

In Informatics Engineering

By:

Roy Syahputra

  

NIM : 085314107

DEPARTMENT OF INFORMATICS ENGINEERING

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

  

2012

HALAMAN PERSETUJUAN

  HALAMAN PENGESAHAN

PERNYATAAN KEASLIAN KARYA

HALAMAN PERSEMBAHAN

  a humble present for you…

  

ABSTRAKSI

Vector Space Model dan Binary Independence Model adalah 2 metode yang

dipakai untuk memodelkan hasil Pemerolehan Informasi. Pada metode Vector Space

Model, setiap potongan kata (token) dalam dokumen dilambangkan sebagai vektor

dan dihitung jarak kedekatannya dengan kata pencarian menggunakan Cosine

Similarity. Metode Binary Independence Model menghitung peluang munculnya kata

pencarian pada dokumen dengan menggunakan prinsip peluang Naïve Bayes.

  Pada tugas akhir ini dibuat mesin pencari untuk membandingkan kedua

metode tersebut. Perbandingan dilakukan dalam hal unjuk kerja dan lama waktu

pencarian. Unjuk kerja diukur dari nilai precision dan recall untuk masing-masing

metode. Lama waktu pencarian diukur dengan menghitung waktu setiap metode

mulai dilakukan sampai metode selesai dilakukan. Koleksi yang digunakan berupa 72

buah ebook dan 34 buah Tugas Akhir dengan 2 bahasa, yaitu bahasa Inggris dan

bahasa Indonesia.

  Hasil percobaan menunjukan bahwa rata-rata lama waktu pencarian untuk

metode Vector Space Model lebih cepat dibandingkan dengan lama waktu pencarian

metode Binary Independence Model. Akan tetapi hasil perhitungan average precision

pada 11 titik untuk metode Binary Independence Model lebih baik dibandingkan

dengan metode Vector Space Model dalam menangani pencarian pada koleksi

Perpustakaan Universitas Sanata Dharma.

  

ABSTRACT

Vector Space Model and Binary Independence Model are two methods that

been used to modelize retrieval result in Information Retrieval. In Vector Space

  

Model, every word in a document represented as vector, and the similarities compare

to search keyword’s vector measured using Cosine Similarity. Binary Independence

Model count the search keyword probabilistic shown up in a document using Naïve

Bayes’s principal.

  In this thesis, a search engine were built to compare thus two methods.

Comparison will be made in terms of performance and searching time. The

performance will be measured by the value of precision and recall for each method.

  

The searching time will be measured as the method starts to search until it has done

the searching process. The collection that used in this thesis were 72 ebooks and 34

thesises within 2 languages, Bahasa Indonesia and English.

  The result says that the average searching time for Vector Space Model is

faster than Binary Independence Model’s average searching time. However, result for

measuring average of the precision within 11-point for Binary Independence Model is

better than Vector Space Model’s handling in the Sanata Dharma University Library

collection search.

LEMBAR PERNYATAAN PERSETUJUAN

KATA PENGANTAR

  Puji dan syukur saya panjatkan kepada Tuhan Yang Maha Esa karena segala

berkat dan rahmat yang telah diberikan sehingga saya dapat menyelesaikan tugas

akhir dengan judul “Mesin Pencari Koleksi Perpustakaan Menggunakan Binary

Independence Model dan Vector Space Model Studi Kasus: Perpustakaan Universitas

Sanata Dharma”.

  Pada kesempatan ini saya ingin mengucapkan terima kasih kepada pihak-

pihak yang telah mendukung saya selama pengerjaan tugas akhir ini. Ucapan terima

kasih ini saya tujukan kepada:

  1. Ibu Paulina Heruningsih Prima Rosa, S.Si., M.Sc. selaku dekan Fakultas Sains dan Teknologi Universitas Sanata Dharma.

  2. Ibu Ridowati Gunawan, S.kom., M.T. selaku ketua jurusan Teknik Informatika Universitas Sanata Dharma.

  3. Ibu Sri Hartati Wijono, S.Si., M.Kom. selaku Dosen Pendamping Akademik dan Dosen Pembimbing TA, atas kesabaran dan perhatian dalam mendampingi saya selama melewati proses penyelesaian studi.

  4. Bapak JB. Budi Darmawan, S.T., M.Sc. dan Bapak Puspaningtyas Sanjaya Adi, S.T., M.T. selaku Penguji TA, atas saran dan kritik yang diberikan untuk menunjang Tugas Akhir ini.

  5. Ayah, Ibu, dan adik-adik saya atas dukungan tanpa henti yang menjadikan perjuangan ini berarti.

  6. Cameroon dan teman-teman dekatnya, atas seluruh bantuan dan dukungan yang diberikan selama pengerjaan Tugas Akhir ini.

  7. Responden Kuisioner, atas kerjasama dalam menilai Tugas Akhir ini.

  8. Teman-teman Teknik Informatika angkatan 2008, atas dukungan dan persahabatan.

  9. Seluruh pihak yang membantu kelancaran dalam penulisan Tugas Akhir ini, secara langsung dan tidak langsung, yang tidak dapat saya sebutkan satu persatu. Saya menyadari masih banyak terdapat kekurangan dalam penelitian ini.

Saran dan kritik akan selalu saya nantikan untuk perbaikan-perbaikan di masa yang

akan datang.

  Akhir kata, saya berharap tulisan ini dapat bermanfaat bagi kemajuan dan perkembangan ilmu pengetahuan serta para pembaca sekalian.

  Yogyakarta, 27 Agustus 2012 penulis

  

DAFTAR ISI

HALAMAN JUDUL INDONESIA............................................................................... i

HALAMAN JUDUL INGGRIS ...................................................................................ii

HALAMAN PERSETUJUAN.....................................................................................iii

HALAMAN PENGESAHAN...................................................................................... iv

PERNYATAAN KEASLIAN KARYA ....................................................................... v

HALAMAN PERSEMBAHAN .................................................................................. vi

ABSTRAKSI ..............................................................................................................vii

ABSTRACT...............................................................................................................viii

LEMBAR PERNYATAAN PERSETUJUAN ............................................................ ix

PUBLIKASI KARYA ILMIAH ................................. Error! Bookmark not defined.

  

KATA PENGANTAR .................................................................................................ix

DAFTAR ISI...............................................................................................................xii

DAFTAR GAMBAR ................................................................................................xvii

DAFTAR LIST CODE ................................................................................................ xx

DAFTAR TABEL.....................................................................................................xxii

DAFTAR LAMPIRAN ............................................................................................. xxv

BAB I PENGANTAR ................................................................................................ 1

  

1.1. Latar Belakang ................................................................................................ 1

  

2.2. Information Retrieval...................................................................................... 8

  2.4.1. Inverted Index ........................................................................................... 17

  

2.4. Document Indexing ....................................................................................... 17

  2.3.3. Stemming................................................................................................... 10

  2.3.2. Stop-word Removal..................................................................................... 9

  2.3.1. Tokenizing................................................................................................... 9

  

2.3. Document Processing ..................................................................................... 9

  2.1.1. Perpustakaan Universitas Sanata Dharma .................................................. 7

  

1.2. Rumusan Masalah ........................................................................................... 3

  

2.1. Perpustakaan ................................................................................................... 7

  

BAB II LANDASAN TEORI ...................................................................................... 7

  

1.7. Sistematika Penulisan ..................................................................................... 6

  

1.6. Metodologi Penelitian ..................................................................................... 5

  

1.5. Luaran ............................................................................................................. 5

  

1.4. Batasan Permasalahan..................................................................................... 4

  

1.3. Tujuan Penelitian ............................................................................................ 4

  

2.5. Document Searching ..................................................................................... 17

  2.5.1. Hash Table................................................................................................ 18

  3.1.1. Fase Definisi Ruang Lingkup (Scope Definition Phase) .......................... 46

  3.1.3.2. Narasi Use Case................................................................................. 48

  3.1.3.1. Diagram Use Case ............................................................................. 48

  3.1.3. Fase Analisis Kebutuhan (Requirement Analysis Phase) ......................... 48

  3.1.2.2. Analisa Kebutuhan Sistem Baru........................................................ 47

  3.1.2.1. Analisa Sistem Saat Ini...................................................................... 47

  3.1.2. Fase Analisis Masalah (Problem Analysis Phase).................................... 47

  

3.1. Analisa Sistem .............................................................................................. 46

  

2.6. Bayesian Model............................................................................................. 18

  

BAB III ANALISIS DAN PERANCANGAN .......................................................... 46

  

2.10. Metodologi FAST ......................................................................................... 43

  

2.9. Recall and Precission ................................................................................... 42

  

2.8. Perhitungan Contoh Kasus............................................................................ 26

  

2.7. Vector Space Model ...................................................................................... 24

  2.6.2. BM25 ........................................................................................................ 22

  2.6.1. Binary Independence Model ..................................................................... 18

  

3.2. Perancangan Sistem ...................................................................................... 49

  3.2.1. Langkah Penelitian ................................................................................... 50

  4.4.1. Tokenizing................................................................................................. 63

  4.7.1. Vector Space Model .................................................................................. 92

  

4.7. Modeling ....................................................................................................... 91

  

4.6. Document Searching ..................................................................................... 91

  

4.5. Document Indexing ....................................................................................... 82

  4.4.3. Stemming................................................................................................... 66

  4.4.2. Stop-word Removal................................................................................... 65

  

4.4. Documet Processing ..................................................................................... 63

  3.2.2. Disain Fisikal ............................................................................................ 51

  

BAB IV IMPLEMENTASI ...................................................................................... 63

  3.2.5. Diagram Kelas .......................................................................................... 61

  3.2.4. Analisa Hasil............................................................................................. 61

  3.2.3. Flowchart.................................................................................................. 56

  3.2.2.3. Antarmuka ......................................................................................... 55

  3.2.2.2. Physical Design Database.................................................................. 53

  3.2.2.1. Entity Relational Diagram ................................................................. 51

  4.7.2. BM25 ...................................................................................................... 101

  

4.8. Implementasi Use Case............................................................................... 119

  4.8.1. Halaman Pencarian ................................................................................. 119

  

BAB V HASIL DAN PEMBAHASAN.................................................................. 121

  

5.1. Hasil Penelitian ........................................................................................... 121

  5.1.1. Hasil Pengukuran (kuesioner)................................................................. 121

  5.1.2. Hasil Pengukuran (waktu pencarian) ...................................................... 134

  

5.2. Analisa Hasil Penelitian .............................................................................. 137

  5.2.1. Unjuk Kerja Vector Space Model (VSM)............................................... 137

  5.2.2. Unjuk Kerja BM25 ................................................................................. 139

  5.2.3. Perbandingan Unjuk Kerja VSM dan BM25 .......................................... 142

  5.2.4. Perbandingan Lama Waktu Pencarian VSM dan BM25 ........................ 144

  

BAB VI KESIMPULAN DAN SARAN ................................................................. 146

  

6.1. Kesimpulan ................................................................................................. 146

  

6.2. Saran ........................................................................................................... 146

DAFTAR PUSTAKA ............................................................................................... 148

LAMPIRAN.............................................................................................................. 150

  

DAFTAR GAMBAR

Gambar 2.1. Proses tokenizing ...................................................................................... 9Gambar 2.2. Flowchart algoritma stemming Bahasa Indonesia Nazief & Adriani .... 13Gambar 2.3. Flowchart Porter Stemmer ..................................................................... 16Gambar 2.4. Inverted Index......................................................................................... 17Gambar 2.5. Vector Space Model ............................................................................... 24Gambar 3.1. Diagram Use Case.................................................................................. 48Gambar 3.2. Diagram blok (indexing) ........................................................................ 50Gambar 3.3. Diagram blok (searching) ...................................................................... 50Gambar 3.4. ER Diagram Perpustakaan Sanata Dharma............................................ 51Gambar 3.5. ER Diagram penelitian........................................................................... 52Gambar 3.6. ER Diagram ........................................................................................... 53Gambar 3.7. Rancangan Antarmuka ........................................................................... 55Gambar 3.8. Flowchart Tokenizing............................................................................. 56Gambar 3.9. Flowchart Stop-word Removal .............................................................. 56Gambar 3.10. Flowchart Stemming ............................................................................ 57 Gambar3.11. Flowchart Nazief & Adriani (Nazief, 1996) ......................................... 58Gambar 3.12. Flowchart Porter Stemmer (Porter, 1980) ........................................... 59Gambar 3.13. Flowchart Document Indexing............................................................. 60Gambar 3.14. Flowchart Document Searching .......................................................... 60Gambar 3.15. Diagram kelas....................................................................................... 62Gambar 4.1. Halaman Pencarian............................................................................... 120Gambar 4.2. Halaman Tunggu .................................................................................. 120Gambar 5.1. Hasil pencarian VSM skenario 1.......................................................... 125Gambar 5.2. Grafik Unjuk Kerja VSM pada pencarian seluruh isi dokumen .......... 138Gambar 5.3. Grafik Unjuk Kerja VSM pada pencarian judul dokumen................... 139Gambar 5.4. Grafik Unjuk Kerja BM25 pada pencarian seluruh isi dokumen ......... 140Gambar 5.5. Grafik Unjuk Kerja BM25 pada pencarian judul dokumen ................. 141Gambar 5.4. Grafik Perbandingan Unjuk Kerja VSM dan BM25 pada pencarian seluruh isi dokumen .................................................................................................. 142Gambar 5.5. Grafik Perbandingan Unjuk Kerja VSM dan BM25 pada pencarian judul dokumen.................................................................................................................... 143

  

Gambar L.2.1. Screenshoot Skenario 1 VSM ........................................................... 173

Gambar L.2.2. Screenshoot Skenario 1 BM25 ......................................................... 173

Gambar L.2.3. Screenshoot Skenario 2 VSM ........................................................... 174

  

Gambar L.2.5. Screenshoot Skenario 3 VSM ........................................................... 175

Gambar L.2.6. Screenshoot Skenario 3 BM25 ......................................................... 175

Gambar L.2.7. Screenshoot Skenario 4 VSM ........................................................... 176

Gambar L.2.8. Screenshoot Skenario 4 BM25 ......................................................... 176

Gambar L.2.9. Screenshoot Skenario 5 VSM ........................................................... 176

Gambar L.2.10. Screenshoot Skenario 5 BM25 ....................................................... 176

Gambar L.2.11. Screenshoot Skenario 6 VSM ......................................................... 177

Gambar L.2.12. Screenshoot Skenario 6 BM25 ....................................................... 177

Gambar L.2.13. Screenshoot Skenario 7 VSM ......................................................... 177

Gambar L.2.14. Screenshoot Skenario 7 BM25 ....................................................... 178

Gambar L.2.15. Screenshoot Skenario 8 VSM ......................................................... 178

Gambar L.2.16. Screenshoot Skenario 8 BM25 ....................................................... 179

Gambar L.2.17. Screenshoot Skenario 9 VSM ......................................................... 179

Gambar L.2.18. Screenshoot Skenario 9 BM25 ....................................................... 179

  

DAFTAR LIST CODE

List 4.1.Tokenizing ...................................................................................................... 64

List 4.2.Stop-word Removal ....................................................................................... 66

List 4.2.Stemming........................................................................................................ 67

Listing 4.3. Mencari kata dasar (root word) ............................................................... 74

Listing 4.4. Penghapusan awalan kata (prefix) ........................................................... 81

List 4.3. Table ............................................................................................................. 82

List 4.5.memasukan obyek ke dalam table ................................................................. 82

List 4.6. Word ............................................................................................................. 83

List 4.7. WriteTableToText......................................................................................... 85

List 4.8. TableConfiguration.txt.................................................................................. 86

List 4.9. Pembacaan kamus-kamus ............................................................................. 86

List 4.10. Pembacaan informasi koleksi dari database............................................... 88

List 4.11. Document Processing untuk setiap koleksi ................................................ 89

List 4.12. Pengisian table dari hasil stemming koleksi ............................................... 89

List 4.13. Penyimpanan table ke dokumen teks.......................................................... 89

List 4.14. writeTableToTxt ......................................................................................... 91

List 4.15. Search.......................................................................................................... 91

  

List 4.16. Idf ................................................................................................................ 92

List 4.17. Smoothing Idf.............................................................................................. 93

List 4.18. Idf kata pencarian........................................................................................ 93

List 4.19. Pencarian dokumen relevan ........................................................................ 94

List 4.20. Penambahan opsi status kata pada pencarian ............................................. 96

List 4.21. Document .................................................................................................... 99

List 4.22. Tf_idf ........................................................................................................ 100

List 4.23. Similarity .................................................................................................. 101

List 4.24. Selection sort............................................................................................. 101

List 4.25. Pencarian dokumen relevan ...................................................................... 104

List 4.25. lookUpWordAtDocument......................................................................... 108

List 4.26. getRelevanDocumentFromDocAccList .................................................... 111

List 4.27. getAvdl...................................................................................................... 113

List 4.28. hitungBobotDokumen............................................................................... 116

List 4.29. hitungBobotPeluangKata .......................................................................... 117

List.4.30. Waktu Pencarian BM25 ............................................................................ 118

List 4.31. Waktu Pencarian VSM ............................................................................. 118

  

DAFTAR TABEL

Tabel 2.1.Kombinasi awalan akhiran yang tidak diijinkan. ........................................ 12

Tabel 2.2.Cara menentukan tipe awalan untuk awalan “te-”. ..................................... 14

Tabel 2.3. Jenis Awalan Berdasarkan Tipe Awalannya.............................................. 14 Tabel. 2.6.1 Contingency Table .................................................................................. 21Tabel 3.1. Struktur tabel ebook_db ............................................................................. 53Tabel 3.2. Struktur tabel ta_ti...................................................................................... 54Tabel 3.3. Struktur tabel pengarang ............................................................................ 54Tabel 3.4. Struktur tabel penerbit................................................................................ 54Tabel 5.1. Rekap Skenario 1 ..................................................................................... 122Tabel 5.2. Rekap Skenario 2 ..................................................................................... 123Tabel 5.3. Rekap Skenario 3 ..................................................................................... 123Tabel 5.4. Rekap Skenario 4 ..................................................................................... 123Tabel 5.5. Rekap Skenario 5 ..................................................................................... 123Tabel 5.6. Rekap Skenario 6 ..................................................................................... 124Tabel 5.7. Rekap Skenario 7 ..................................................................................... 124Tabel 5.8. Rekap Skenario 8 ..................................................................................... 124Tabel 5.9. Rekap Skenario 9 ..................................................................................... 124Tabel 5.10. Precision-Recall responden 1 pada skenario 1 (VSM) .......................... 126Tabel 5.11. Perhitungan interpolasi skenario 1 responden 1 (VSM) ........................ 127Tabel 5.12. Precision-Recall responden 1 pada skenario 1 (BM25) ......................... 128Tabel 5.13. Perhitungan interpolasi skenario 1 responden 1 (BM25) ...................... 128Tabel 5.14. Perhitungan rerata interpolasi (VSM) pada pencarian seluruh isi dokumen ................................................................................................................................... 130Tabel 5.15. Perhitungan rerata interpolasi (VSM) pada pencarian judul dokumen .. 131Tabel 5.16. Rerata interpolasi (VSM) pada pencarian seluruh isi dokumen ............ 131Tabel 5.17. Rerata interpolasi (VSM) pada pencarian judul dokumen ..................... 132Tabel 5.18. Rerata interpolasi (BM25) pada pencarian seluruh isi dokumen ........... 133Tabel 5.19. Rerata interpolasi (BM25) pada pencarian judul dokumen ................... 133Tabel 5.20. Waktu Pencarian VSM........................................................................... 135Tabel 5.21. Waktu Pencarian BM25 ......................................................................... 135Tabel 5.22. Lama Waktu Pencarian VSM ................................................................ 136Tabel 5.23. Lama Waktu Pencarian BM25 ............................................................... 136Tabel 5.24. Perbandingan Lama Waktu Pencarian VSM dan BM25 ....................... 144 Tabel L.3.1. Interpolasi Skenario 1 VSM ................................................................. 180

  

Tabel L.3.2. Interpolasi Skenario 1 BM25................................................................ 180

Tabel L.3.3. Interpolasi Skenario 2 VSM ................................................................. 181

Tabel L.3.4. Interpolasi Skenario 2 BM25................................................................ 181

Tabel L.3.5. Interpolasi Skenario 3 VSM ................................................................. 182

Tabel L.3.6. Interpolasi Skenario 3 BM25................................................................ 182

Tabel L.3.7. Interpolasi Skenario 4 VSM ................................................................. 183

Tabel L.3.8. Interpolasi Skenario 4 BM25................................................................ 183

Tabel L.3.9. Interpolasi Skenario 5 VSM ................................................................. 184

Tabel L.3.10. Interpolasi Skenario 5 BM25.............................................................. 184

Tabel L.3.11. Interpolasi Skenario 6 VSM ............................................................... 185

Tabel L.3.12. Interpolasi Skenario 6 BM25.............................................................. 185

Tabel L.3.13. Interpolasi Skenario 7 VSM ............................................................... 186

Tabel L.3.14. Interpolasi Skenario 7 BM25.............................................................. 186

Tabel L.3.15. Interpolasi Skenario 8 VSM ............................................................... 187

Tabel L.3.16. Interpolasi Skenario 8 BM25.............................................................. 187

Tabel L.3.17. Interpolasi Skenario 9 VSM ............................................................... 188

Tabel L.3.18. Interpolasi Skenario 9 BM25.............................................................. 188

  

DAFTAR LAMPIRAN

Lampiran 1 Contoh Kesioner ................................................................................ 150

Lampiran 2 Screenshoot Hasil Pencarian ............................................................. 172

Lampiran 3 Tabel Perhitungan Interpolasi Precision dan Recall ...................... 180

Lampiran 4 Source Code Program ....................................................................... 189

BAB I PENGANTAR

1.1. Latar Belakang

  Perpustakaan Universitas Sanata Dharma Yogyakarta merupakan

perpustakaan yang berada di Universitas Sanata Dharma (USD) Yogyakarta.

  

Perpustakaan terdiri dari 2 (dua) unit perpustakaan yaitu Perpustakaan Kampus

Mrican dan Perpustakaan Kampus Paingan yang dikelola secara sentralisasi.

  

Perpustakaan kampus Mrican merupakan perpustakaan Pusat, yang terdiri dari 4

(empat) lantai, sedangkan Perpustakaan Kampus Paingan merupakan perpustakaan

cabang, yang terdiri dari 2 (dua) lantai dan berkonsentrasi pada pelayanan pengguna

bagi civitas akademika USD yang berada di Kampus Paingan. Perpustakaan Mrican

dan Paingan dihubungkan dengan jaringan komputer untuk dapat melayani

penggunanya secara online.

  Perpustakaan Universitas Sanata Dharma Yogyakarta tercatat memiliki

jumlah koleksi sebanyak 355.567 judul sampai pada tulisan ini dibuat. Koleksi yang

dimiliki dibagi berdasarkan beberapa jenisnya, yaitu koleksi buku, tugas akhir, Non-

Book Material (NBM), majalah, artikel majalah, suara (audio), gambar (image),

gambar bergerak (video), dan e-book. Pada penelitian ini jenis koleksi yang akan

digunakan adalah tugas akhir dan e-book.

  Untuk membantu pemustaka melakukan pencarian koleksi, Perpustakaan

Universitas Sanata Dharma menyediakan sebuah sistem pencarian koleksi. Sistem

pencarian koleksi ini dapat diakses oleh pemustaka untuk menemukan sendiri koleksi

yang diinginkan. Sistem akan mencari setiap koleksi berdasarkan jenis kata kunci

berupa judul, pengarang, subjek, penerbit, tahun terbit, dan lainnya yang dimasukkan

oleh pemustaka. Dengan demikian, pemustaka harus memasukan kata kunci yang

rinci mengenai informasi koleksi yang diinginkan. Pemustaka akan mengalami

kesulitan dalam pencarian jika hanya mengetahui beberapa potongan informasi

mengenai koleksi yang diinginkan. Hal ini mengakibatkan hasil pencarian yang

ditampilkan oleh sistem akan sangat terbatas dan memiliki perbedaan dengan

keinginan pemustaka.

  Sebagai contoh pemustaka yang ingin mencari tugas akhir berjudul

“Penipisan Citra huruf Jawa Menggunakan metode Zhang Suen” yang ditulis oleh

Margareta Ratna Kurnianita, harus memilih menu tugas akhir dan memilih jenis kata

kunci yang akan dicari. Jika pemustaka memilih jenis kata kunci judul, kata kunci

yang dimasukan harus berupa kata-kata yang terkandung di dalam judul, seperti

“penipisan citra”, “huruf Jawa”, atau “metode Zhang Suen”. Sistem akan mencari

diantara koleksi tugas akhir yang memiliki judul yang mengandung kata kunci yang

dimasukan pengguna. Memasukan kata kunci nama penulis “Margareta Ratna

Kurnianita” pada jenis kata kunci judul akan menyebabkan sistem tidak dapat

menampilkan hasil pencarian. Hal ini disebabkan kata “Margareta Ratna Kurnianita”

  Dari contoh yang telah disebutkan, pemustaka harus mengetahui jenis dari

potongan informasi yang dimilikinya. Potongan informasi yang tidak diketahui

jenisnya akan mengakibatkan hasil pencarian yang tidak diharapkan. Proses

pencarian yang dilakukan oleh pemustaka akan terbantu dengan adanya sistem yang

memiliki kemampuan untuk menelusuri informasi isi buku dan menemukannya dari

potongan informasi yang dimiliki. Salah satu cara yang dapat digunakan dalam

membangun sistem tersebut adalah menggunakan metode Pemerolehan Informasi

(Information Retrieval). Di dalam Pemerolehan Informasi, terdapat metode-metode

untuk mengurutkan hasil pencarian. Binary Independence Model dan Vector Space

Model merupakan contoh pendekatan yang dapat digunakan untuk membangun

tampilan hasil urut pencarian.

1.2. Rumusan Masalah

  Berikut ini merupakan masalah-masalah yang dirumuskan di dalam penelitian:

  1. Bagaimana membangun mesin pencari koleksi Perpustakaan Unversitas Sanata Dharma?

2. Bagaimana unjuk kerja dari metode Binary Independence Model dan Vector

  Space Model dalam membangun mesin pencari untuk Perpustakaan Universitas Sanata Dharma?

  3. Bagaimana kecepatan pencarian dari metode Binary Independence Model dan Vector Space Model dalam menangani koleksi Perpustakaan Universitas Sanata Dharma?

1.3. Tujuan Penelitian

  

Berikut ini merupakan tujuan yang ingin dicapai melalui penelitian:

1. Membangun mesin pencari koleksi Perpustakaan Unversitas Sanata Dharma.

  2. Mengukur unjuk kerja dari metode Binary Independence Model dan Vector Space Model dalam membangun mesin pencari untuk Perpustakaan Universitas Sanata Dharma.

  3. Mengukur kecepatan pencarian dari metode Binary Independence Model dan Vector Space Model dalam menangani koleksi Perpustakaan Universitas Sanata Dharma.

1.4. Batasan Permasalahan

  Berikut ini merupakan batasan masalah dari penelitian:

  1. Penelitian ini mengacu pada studi kasus di Perpustakaan Universitas Sanata Dharma, dengan mengambil sampel berupa koleksi digital tugas akhir dan e- book.

2. Teknik stemming yang digunakan di dalam penelitian ini adalah teknik stemming Bahasa Indonesia dan Bahasa Inggris.

  3. Teknik stemming Bahasa Indonesia menggunakan algoritma Nazief & Adriani dan teknik stemming Bahasa Inggris menggunakan Porter Stemmer Algorithm.

  4. Bahasa pemrograman yang digunakan dalam penelitian ini menggunakan bahasa JAVA.

  5. Model yang akan digunakan adalah Binary Independence Model dan Vector Space Model.

  1.5. Luaran Luaran dari penelitian ini adalah terciptanya sebuah mesin pencari koleksi

perpustakaan yang menggunakan metode Binary Independence Model dan Vector

  Space Model untuk digunakan pada Perpustakaan Universitas Sanata Dharma.

  1.6. Metodologi Penelitian Metode yang digunakan untuk melakukan penelitian ini adalah metode

FAST (Framework for the Application of Sistem Thinking). Metode FAST memiliki

langkah-langkah sebagai berikut:

  1. Analisa Ruang Lingkup Melakukan analisa terhadap ruang lingkup sistem yang sedang berjalan dan pengembangan sistem baru.

  2. Analisa Masalah Melakukan analisa terhadap sistem yang sedang berjalan dan menemukan masalah yang dihadapi.

  3. Perancangan sistem Melakukan perancangan sistem pada penelitian ini dengan diagram use case, diagram proses, dan flowchart.

  4. Implementasi sistem

Melakukan pembangunan sistem sesuai tahap perancangan.

  5. Pengujian Melakukan pengujian hasil sistem dengan metode recall dan precision.

  6. Pelaporan Melakukan pelaporan hasil pengujian dan analisa.

1.7. Sistematika Penulisan

  BAB I : berisi mengenai pendahuluan dan latar belakang masalah yang ingin diselesaikan. BAB II : berisi tentang landasan teori yang digunakan dalam penyusunan dokumen dan pembangunan sistem. BAB III : berisi tentang analisis dan perancangan yang akan digunakan dalam pembangunan sistem

BAB IV : berisi mengenai implementasi dan bentuk pengujian sistem BAB V : berisi mengenai analisa dan kesimpulan

BAB II LANDASAN TEORI Pada bagian ini, penulis akan membahas mengenai dasar-dasar teori yang

  

digunakan dalam penulisan penelitian. Dasar-dasar teori tersebut dapat dipaparkan

sebagai berikut :

2.1. Perpustakaan

  Menurut Undang-undang Republik Indonesia Nomor 47 Tahun 2007,

Perpustakaan adalah institusi pengelola karya tulis, karya cetak, dan/atau karya rekam

secara professional dengan sistem yang baku guna memenuhi kebutuhan pendidikan,

penelitian, pelestarian informasi, dan rekreasi para pemustaka. Berdasarkan jenisnya,

Perpustakaan dapat dibedakan menjadi 5, yaitu Perpustakaan Nasional, Umum,

Sekolah/Madrasah, Perguruan Tinggi, dan Khusus (Indonesia, 2007).Perpustakaan

Dokumen yang terkait

Uji algoritma probabilistic model, vector space model dan extended boolean model pada sistem rekomendasi diferential diagnose penyakit paru-paru : studi kasus Puskesmas Jebed, Pemalang.

3 10 244

Program bantu test psikologi : studi kasus Pusat Pelayanan Tes Konsultasi dan Psikologi Universitas Sanata Dharma - USD Repository

0 0 209

Aplikasi skripsi digital online berbasis web : studi kasus di UPT Perpustakaan Kampus III Universitas Sanata Dharma - USD Repository

0 0 134

Pendaftaran kerja praktek menggunakan JSP dengan Framework Apache Struts : studi kasus Teknik Informatika Universitas Sanata Dharma - USD Repository

0 0 186

Pengujian perangkat lunak menggunakan metode Black Box : studi kasus Exelsa Universitas Sanata Dharma - USD Repository

0 0 306

Sistem penelusuran skripsi : studi kasus di Perpustakaan Universitas Sanata Dharma - USD Repository

0 0 253

Alasan mahasiswa tidak menggunakan sarana angkutan publik : studi kasus pada mahasiswa Universitas Sanata Dharma Kampus I, Mrican Yogyakarta - USD Repository

0 0 110

Analisis minat mahasiswa dalam menggunakan Bus Trans Yogyakarta : studi kasus pada mahasiswa Fakultas Ekonomi Universitas Sanata Dharma Yogyakarta - USD Repository

0 0 95

Simulasi jaringan menggunakan network simulator 2 : studi kasus jaringan komputer Kampus III Universitas Sanata Dharma - USD Repository

0 0 70

Pengaruh kualitas pelayanan, koleksi dan lingkungan fisik terhadap kepuasan pengunjung perpustakaan : studi kasus pada pengunjung Perpustakaan Universitas Sanata Dharma Mrican, Yogyakarta - USD Repository

0 1 159