Impelementasi Support Vector Machines Untuk Pencarian Informasi Buku Di Perpustakaan Daerah Bandung Provinsi Jawa Barat

(1)

(2)

SKRIPSI

Diajukan untuk Menempuh Ujian Akhir Sarjana Program Strata Satu Jurusan Teknik Informatika

Fakultas Teknik dan Ilmu Komputer

Oleh:

RIKI HIDAYAT

10108371

PROGRAM STUDI S1

JURUSAN TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

UNIVERSITAS KOMPUTER INDONESIA

2012

(3)

(4)

(5)

PENCARIAN INFORMASI BUKU DI PERPUSTAKAAN

DAERAH BANDUNG PROVINSI JAWA BARAT

Oleh: RIKI HIDAYAT

10108371

Berdasarkan hasil wawancara terhadap beberapa pengunjung

perpustakaan dapat disimpulkan bahwa untuk mencari informasi buku hanya sedikit pengunjung yang sudah mengetahui identitas dari buku yang akan dicari. Akan tetapi, kebanyakan pengunjung justru tidak mengetahui informasi sedikitpun mengenai identitas buku yang akan dicari melainkan hanya mengetahui gambaran akan kebutuhan informasi yang dibutuhkan terhadap buku. Atas dasar permasalahan tersebut perlu dikembangkan sistem pencarian informasi buku yang dapat menemukan informasi buku sesuai dengan kebutuhan pengunjung secara dinamis. Maksud dinamis dalam penelitian ini adalah masukan terhadap sistem tidak hanya terpaku kepada identitas buku seperti judul, pengarang, penerbit, dan lain-lain, melainkan gambaran kebutuhan pengunjung terhadap buku. Selain itu, pengunjung juga bisa menentukan relevan atau tidaknya informasi buku sebagai

feedback untuk sistem agar sistem bisa menemukan informasi buku yang lebih relevan menurut pengunjung.

Pada penelitian ini dilakukan pembangunan sistem pencarian informasi buku. Tujuannya adalah untuk mempermudah pengunjung menemukan informasi

(6)

buku dapat mempermudah pengunjung untuk mencari informasi buku yang dibutuhkan. Selain itu, metode vector space model dan support vector machines

dapat diimplementasikan untuk membangun sistem pencarian informasi buku.

Kata kunci : sistem pencarian informasi buku, vector space model, support vector machines

(7)

iii

BOOK INFORMATION RETRIEVAL AT LOCAL LIBRARY

BANDUNG WEST JAVA PROVINCE

By: RIKI HIDAYAT

10108371

Based on interview results with some library visitors can be concluded that in order to find information book, only a few visitors who already know about book identity which they want to seacrch. However, most visitors didn’t know about book identity which they want to search but they only know about description of information book as their needed. Depend on that problem need to build a information book retrieval system that can find information book as visitors need dynamically. Dynamically in this research mean that inputs to the system not only book identity such as title, author, publisher, etc., but also description of book information as visitors need. Moreover, visitor can judgement book information by relevan or not as a feedback for system then system can retrieve book information more relevan.

This research, build information retrieval book system. The objective in this research is to find a book information as visitors need. This system build by implementing methods vector space model and support vector machines.

The research results can be concluded that information retrieval book system made visitors to find a book information as their needed easily. Moreover,

(8)

Keyword : information retrieval book system, vector space model, support vector machines

(9)

v Assalammu alaikum Wr. Wb.

Alhamdulillahi Rabbil alamiin, segala puji dan syukur penulis panjatkan kepada Allah SWT, karena dengan izin-Nya dan setitik ilmu pengetahuan yang diberikan kepada mahluk-Nya, penulis dapat menyelesaikan laporan tugas akhir ini dengan

judul “IMPLEMENTASI METODE SUPPORT VECTOR MACHINES UNTUK PENCARIAN INFORMASI BUKU DI PERPUSTAKAAN

DAERAH BANDUNG PROVINSI JAWA BARAT”. Adapun tujuan dari

penyusunan skripsi ini adalah untuk memenuhi salah satu syarat dalam menyelesaikan studi jenjang strata satu (S1) di Program Studi Teknik Informatika, Universitas Komputer Indonesia.

Penulis sangat menyadari kekurangan yang ada pada laporan ini. Kekurangan ini dikarenakan keterbatasan penulis dalam hal ilmu pengetahuan dan pemahaman penulisan laporan. Akan tetapi, penulis berusaha menyusun laporan ini sebaik yang penulis bisa dengan segenap kemampuan dan usaha yang penulis bisa. Selama menulis laporan tugas akhir ini, penulis telah mendapatkan banyak sekali bimbingan dan bantuan dari berbagai pihak yang telah dengan segenap hati dan keikhlasan yang penuh membantu dan membimbing penulis dalam menyelesaikan laporan ini. Dengan kesadaran hati, penulis ucapkan terima kasih kepada :

1. Tuhan Yang Maha Esa yang telah memberikan kesehatan dan kesempatan

kepada penulis dalam menyelesaikan skripsi ini dan juga ata semua keindahan, kemudahan, dan berjuta hikmah yang melahirkan semangat jiwa.

2. Orang tua penulis yang telah memberikan segenap perhatian, cinta dan kasih sayang, dorongan, nasihat serta doa yang tulus dan tanpa batas.

(10)

bersedia meluangkan waktu, tenaga dan pikirannya serta memberikan pengarahan dan pengalaman dalam penyusunan skripsi yang berguna bagi penulis.

5. Ibu Teti yang telah menerima penulis untuk melakukan penelitian tugas akhir di Badan Perpustakaan dan Kearsipan Daerah juga memberikan informasi-informasi yang dibutuhkan penulis dalam penyusunan skripsi. 6. Bapak Andri Heryandi, M.T., selaku dosen wali yang telah mengajarkan

ilmunya selama penulis kuliah di Universitas Komputer Indonesia.

7. Bapak dan Ibu dosen IF UNIKOM yang telah membagi ilmunya selama penulis duduk dibangku kuliah.

Dan tak lupa penulis memohon maaf apabila dalam penulisan laporan tugas akhir ini, penulis telah menyinggung perasaan atau menyakiti hati kepada semua orang baik secara tidak sengaja maupun disengaja. Akhir kata, penulis berharap agar laporan ini dapat berguna bagi semua orang yang membutuhkan. Amien.

(11)

vii

ABSTRACT ... III KATA PENGANTAR ... V DAFTAR ISI ... VII DAFTAR GAMBAR ... XI DAFTAR TABEL ... XIV DAFTAR SIMBOL ... XVI DAFTAR LAMPIRAN ... XIX

BAB 1 PENDAHULUAN ... 1

1.1 Latar Belakang Masalah ... 1

1.2 Identifikasi Masalah ... 4

1.3 Maksud dan Tujuan ... 4

1.4 Batasan Masalah ... 5

1.5 Metodologi Penelitian ... 5

1.6 Sistematika Penulisan ... 7

BAB 2 TINJAUAN PUSTAKA ... 9

2.1 Tinjauan Perusahaan ... 9

2.1.1 Sejarah Badan Perpustakaan dan Kearsipan Daerah ... 9

2.1.2 Profil Perpustakaan ... 10

2.1.3 Visi Misi dan Tujuan Perpustakaan ... 11

A. Visi Perpustakaan ... 11

(12)

viii

2.1.6 Deskripsi Jabatan ... 14

A. Tugas Kepala ... 14

B. Tugas Sekretaris ... 15

C. Tugas Bidang Pengembangan Bahan Pustaka ... 15

D. Tugas Bidang Layanan ... 16

E. Tugas Bidang Pembinaan ... 16

F. Tugas Subbidang layanan dan otomasi perpustakaan ... 17

2.2 Information Retrieval (IR) ... 17

2.2.1 Prilaku Pengguna ... 18

2.2.2 View Dokumen ... 19

2.2.3 Arsitektur Sistem IR ... 19

2.2.4 Stemming ... 20

2.2.5 Pembuatan Index... 22

2.3 Vector Space Model (VSM) ... 24

2.3.1 Indexing ... 26

2.3.2 Normalisasi ... 27

2.4 Ukuran Kemiripan ... 27

2.5 Peningkatan Kualitas Pencarian ... 28

2.6 Support Vector Machines (SVM) ... 29

2.6.1 Formulasi Matematis ... 32

2.6.2 Metode Kernel ... 36

2.7 MySQL ... 37

2.8 PHP ... 39

2.9 Cascading Style Sheets (CSS) ... 41

(13)

2.12.2 Sequence Diagram ... 44

2.12.3 Activity Diagram ... 44

2.12.4 Class Diagram ... 44

BAB 3 ANALISIS DAN PERANCANGAN SISTEM ... 43

3.1 Analisis Sistem ... 43

3.1.1 Analisis Masalah ... 43

3.1.2 Analisis Sistem yang sedang berjalan ... 43

3.1.3 Analisis Kebutuhan Data ... 46

3.1.4 Analisis Metode ... 46

3.1.4.1 Analisis Vector Space Model (VSM) ... 58

3.1.4.2 Analisis Support Vector Machines (SVMs) ... 68

3.1.5 Analisis Kebutuhan Non-Fungsional ... 78

3.1.5.1 Analisis Kebutuhan Perangkat Keras ... 78

3.1.5.2 Analisis Kebutuhan Perangkat Lunak ... 79

3.1.5.3 Analisis Kebutuhan Pengguna ... 79

3.1.6 Analisis Kebutuhan Fungsional ... 81

3.1.6.1 Use Case Diagram ... 81

3.1.6.2 Definisi Aktor ... 83

3.1.6.3 Activity Diagram ... 84

3.1.6.4 Seqeunce Diagram ... 104

3.1.6.5 Class Diagram ... 135

3.2 Perancangan Sistem ... 138

3.2.1 Perancangan Antarmuka ... 138

3.2.1.1 Perancangan Antarmuka Pengunjung ... 138

(14)

3.2.3.2 Method Pencarian Data Buku ... 154

3.2.3.3 Method Pencarian Data Buku Lebih Lanjut ... 155

3.2.3.4 Method Optimisasi Sistem Pencarian ... 155

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM ... 115

4.1 Implementasi Sistem ... 115

4.1.1 Implementasi Perangkat Keras ... 115

4.1.2 Implementasi Perangkat Lunak ... 115

4.1.3 Implementasi Basis Data ... 116

4.1.4 Implementasi Kelas... 117

4.1.5 Implementasi Antarmuka ... 117

4.2 Pengujian Sistem ... 118

4.2.1 Rencana Pengujian Aplikasi ... 118

4.2.1.1 Kasus dan Hasil Pengujian ... 119

4.2.1.2 Kesimpulan Hasil Pengujian ... 131

4.2.2 Pengujian Beta ... 131

4.2.2.1 Hasil Pengujian Beta ... 132

4.2.2.2 Kesimpulan Hasil Pengujian Beta ... 133

BAB 5KESIMPULAN DAN SARAN ... 135

5.1 Kesimpulan ... 135

5.2 Saran ... 135

(15)

1.1 Latar Belakang Masalah

Berdasarkan hasil pengamatan, perpustakaan menjadi tempat sumber informasi dan rekreasi sehingga dapat dinikmati oleh banyak orang. Salah satu perpustakaan yang ada di daerah Bandung yaitu perpustakaan yang dikelola oleh Badan Perpustakaan dan Kearsipan Daerah (BAPUSIPDA). Saat ini jumlah buku di perpustakaan daerah sudah mencapai kurang lebih 180.000 eksemplar per tanggal 18 April 2012. Meskipun dari sekian banyaknya jumlah buku yang ada di perpustakaan tersebut tetap masih belum bisa memenuhi kebutuhan masyarakat. Hal ini dapat membuat seseorang ketika mencari buku dengan cara datang langsung ke perpustakaan menjadi tidak efektif.

Berdasarkan hasil wawancara terhadap beberapa pengunjung perpustakaan dapat disimpulkan bahwa untuk mencari informasi buku hanya sedikit pengunjung yang sudah mengetahui identitas buku (judul, pengarang, subjek, dan lain-lain) yang akan dicari. Akan tetapi kebanyakan pengunjung yang hendak mencari buku justru tidak mengetahui informasi sedikitpun mengenai identitas buku yang akan dicari melainkan hanya mengetahui gambaran akan kebutuhannya mengenai informasi yang dibutuhkan terhadap buku. Sistem pencarian yang ada di perpustakaan tidak dapat memecahkan solusi untuk permasalahan yang sudah dipaparkan sebelumnya karena masukan terhadap sistem masih sangat yaitu identitas buku. Atas dasar permasalahan tersebut perlu dikembangkan sistem pencarian informasi buku yang dapat menemukan informasi buku sesuai dengan gambaran kebutuhan pengunjung secara dinamis.

Untuk mengimplementasikan teknik pencarian yang dapat menjadi solusi untuk permasalahan yang sudah dipaparkan sebelumnya maka diperlukan

(16)

untuk mencari dokumen-dokumen yang relevan dengan masukan terhadap sistem berupa query (deskripsi kebutuhan terhadap dokumen yang dibutuhkan)[3].

A. B. Manwar, dkk[27] telah berhasil mengimplementasikan sistem IR dengan menggunakan metode Vector Space Model (VSM). Oleh karena itu, dalam penelitian ini digunakan metode VSM agar sistem IR yang akan diterapkan dalam sistem pencarian informasi buku bisa direalisasikan.

Metode VSMdigunakan untuk mengukur kemiripan antara dokumen dengan

query. Pada model ini, query dan dokumen dianggap sebagai vektor-vektor pada ruang n-dimensi[1]. Akan tetapi, ukuran kemiripan suatu dokumen yang dinilai oleh sistem belum tentu sama dengan yang dinilai oleh pengguna[11]. Oleh karena itu, sistem perlu mengklasifikasi ulang data-data buku yang akan ditampilkan ke pengunjung. Mengacu pada penelitian Thorsten Joachim[2], dapat disimpulkan bahwa terdapat persamaan mendasar tujuan dari kasus Thorsten Joachim[2] dengan kasus yang sedang diteliti yaitu mengklasifikasikan dokumen kedalam kategori yang sudah ditetapkan dengan menggunakan metode Support Vector Machines (SVMs).

Dari uraian tersebut maka penelitian yang akan dilakukan adalah,

“Implementasi Metode Support Vector Machines untuk Pencarian Informasi

Buku di Perpustakaan Daerah Bandung Provinsi Jawa Barat”.

1.2 Identifikasi Masalah

Dari pemaparan latar belakang masalah, maka masalah tersebut dapat dirumuskan dalam suatu rumusan masalah yaitu bagaimana membangun sistem pencarian informasi buku yang dapat menemukan informasi buku sesuai dengan kebutuhan pengunjung dan dinamis di perpustakaan daerah provinsi Jawa Barat.

1.3 Maksud dan Tujuan

Maksud dari penelitian ini adalah untuk membuat suatu desain dan implementasi sistem pencarian informasi buku yang dapat menemukan informasi

(17)

buku sesuai dengan kebutuhan pengunjung dan dinamis di perpustakaan daerah provinsi Jawa Barat dengan menerapkan metode VSM dan SVMs.

Sistem pencarian informasi buku yang akan dibangun bertujuan untuk

mempermudah melakukan pencarian informasi buku dengan menggunakan query

(kebutuhan pembaca terhadap buku) sebagai masukan terhadap sistem dan keluaran dari sistem berupa identitas buku dan deskripsi buku. Hasil penelitian ini diharapkan mampu memecahkan masalah pengunjung perpustakaan untuk mencari buku yang sesuai dengan kebutuhan meskipun tidak mengetahui identitas buku yang dicari.

1.4 Batasan Masalah

Adapun ruang lingkup yang akan dibahas sangatlah luas, untuk itu diperlukan batasan masalah sebagai berikut :

1. Sistem yang akan dibangun merupakan pengembangan dari

http://www.bapusipda.jabarprov.go.id.

2. Sistem yang dibangun adalah sistem pencarian informasi buku yang ada di perpustakaan daerah Bandung provinsi Jawa Barat.

3. Informasi yang diberikan sistem yaitu berupa identitas buku (judul, penulis dan golongan) dan deskripsi buku.

4. Sistem digunakan oleh dua kategori pengguna yaitu operator dan pengunjung situs.

5. Data buku yang digunakan yaitu data buku yang ditulis dalam bahasa Indonesia dan bahasa Inggris.

6. Sistem akan dibangun menggunakan bahasa pemrograman PHP dan

Database Management System MySQL.

1.5 Metodologi Penelitian

Metodologi penelitian yang digunakan dalam penulisan tugas akhir ini adalah metode deskriptif yang terdiri dari langkah-langkah berikut ini :

(18)

1.5.1 Metode Pengumpulan Data

Metodologi penelitian yang digunakan dalam pengumpulan data yang berkaitan dengan penyusunan tugas akhir dan pembuatan sistem pencarian ini adalah :

1. Studi Kepustakaan

Mencari informasi yang berhubungan dengan permasalahan yang akan dibahas dengan bersumber pada buku-buku serta bacaan lain yang kiranya dapat membantu menyelesaikan pembangunan aplikasi.

2. Studi Dokumentasi

Mengumpulkan informasi mengenai data yang diperlukan agar lebih mudah untuk didefinisikan dan dirumuskan pada permasalahan yang ada.

3. Wawancara

Mengajukan pertanyaan kepada pengunjung mengenai data-data yang dibutuhkan untuk mencari informasi buku dan mengajukan pertanyaan kepada pustakawan mengenai prilaku pengunjung pada saat mencari buku.

1.5.2 Metode Pembangunan Perangkat Lunak

Pembangunan Sistem pencarian ini menggunakan metodologi waterfall yang meliputi beberapa proses diantaranya :

1. Requirements Definition: Mengumpulkan kebutuhan secara lengkap kemudian kemudian dianalisis dan didefinisikan kebutuhan yang harus dipenuhi oleh program yang akan dibangun. Fase ini harus dikerjakan secara lengkap untuk bisa menghasilkan desain yang lengkap.

2. System and Software Design: Desain dikerjakan setelah kebutuhan selesai dikumpulkan secara lengkap.

3. Implementation and Unit Testing: desain program diterjemahkan ke dalam kode-kode dengan menggunakan bahasa pemrograman yang sudah ditentukan. Program yang dibangun langsung diuji baik secara unit.

4. Integration and System Testing: Penyatuan unit-unit program kemudian diuji secara keseluruhan (system testing).

(19)

5. Operation and Maintenance: mengoperasikan program dilingkungannya dan melakukan pemeliharaan, seperti penyesuaian atau perubahan karena adaptasi dengan situasi sebenarnya.

Requirements Definition

System and Software Design

Implementation and Unit Testing

Integration and System Testing

Operation and Maintenance

Gambar 1.1 Waterfall menurut Ian Sommerville[4]

1.6 Sistematika Penulisan

Sistematika penulisan proposal penelitian ini disusun untuk memberikan gambaran umum tentang penelitian yang dijalankan. Sistematika penulisan tugas akhir ini adalah sebagai berikut :

1. BAB 1 PENDAHULUAN

Menguraikan tentang latar belakang permasalahan, mencoba merumuskan inti permasalahan yang dihadapi, menentukan tujuan dan kegunaan penelitian, yang kemudian diikuti dengan pembatasan masalah, asumsi, serta sistematika penulisan.

Pada BAB ini di uraikan, latar belakang masalah, identifikasi masalah, maksud dan tujuan, batasan masalah, metodologi penelitian, dan sistematika penulisan.

(20)

2. BAB 2 TINJAUAN PUSTAKA

Berisi tentang segala hal yang berkaitan dengan perusahaan tempat dilakukannya penelitian serta membahas berbagai konsep dasar dan teori-teori yang berkaitan dengan topik penelitian yang dilakukan dan hal-hal yang berguna dalam proses analisis permasalahan serta tinjauan terhadap penelitian-penelitian serupa yang telah pernah dilakukan sebelumnya termasuk sintesisnya.

Pada BAB ini di uraikan, tinjauan perusahaan, information retrieval,

vector space model, ukuran kemiripan, peningkatan kualitas pencarian,

support vector machines, MySQL, PHP, Cascading Style Sheet(CSS), xampp, adobe dreamweaver, dan unified modelling language.

3. BAB 3 ANALISIS DAN PERANCANGAN SISTEM

Menganalisis masalah terhadap sistem yang akan dibangun, analisis penggunaan metode Stemming, Vector Space Model, dan Support Vector Machines untuk penyelesaian masalah serta menganailis kebutuhan fungsional dan non fungsional. Hasil analisis tersebut kemudian akan digunakan untuk melakukan perancangan antarmuka dan jaringan semantik.

Pada BAB ini di uraikan, analisis sistem, analisis masalah, analisis, sistem yang sedang berjalan, analisis kebutuhan data, analisis proses, analisis kebutuhan non-fungsional, analisis kebutuhan fungsional, perancangan sistem, antarmuka pengunjung, antarmuka operator, dan jaringan semantik

4. BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM

Bab ini berisi hasil implementasi dari hasil analisis dan perancangan yang telah dibuat disertai juga dengan hasil pengujian dari sistem yang dibangun.

Pada BAB ini diuraikan, implementasi sistem, implementasi perangkat

lunak, implementasi perangkat keras, implementasi antarmuka,

implementasi kelas Database, implementasi kelas PreProcessing,

(21)

implementasi SVM, dan pengujian sistem disertai kesimpulan hasil pengujian.

5. BAB 5 KESIMPULAN DAN SARAN

Pada BAB ini akan dibahas mengenai kesimpulan dari keseluruhan masalah yang telah dibahas pada bab sebelumnya dan dilengkapi dengan saran-saran yang dapat dijadikan masukan dalam melakukan penulisan tugas akhir.

(22)

(23)

BAB 2

TINJAUAN PUSTAKA

2.1Tinjauan Perusahaan

2.1.1Sejarah Badan Perpustakaan dan Kearsipan Daerah

Secara historis, lembaga perpustakaan daerah ditingkat Provinsi Jawa Barat yang saat ini menjadi Badan Perpustakaan dan Kearsipan Daerah Provinsi Jawa Barat, sebelumnya mengalami beberapa kali perubahan nama.

Sebagai cikal bakalnya bernama Perpustakaan Negara yang berdiri pada tanggal 23 Mei 1956, dibentuk berdasarkan Surat Keputusan Mentri Pendidikan Pengajaran dan Kebudayaan nomor 29103/s di 19 provinsi, salah satunya yaitu Bandung yang berlokasi di Jalan Diponegoro serta induk organisasinya adalah Biro Perpustakaan dan Pembinaan Buku. Setelah terbit Surat Keputusan Menteri Pendidikan dan Kebudayaan nomor 095/1967 tanggal 6 Desember 1967, ditetapkan bahwa lembaga perpustakaan merupakan induk organisasi perpustakaan negara, kemudian berdasarkan Surat Keputusan Menteri Pendidikan dan Kebudayaan nomor 079/1975 induk organisasi perpustakaan negara menjadi Pusat Pembinaan Perpustakaan.

Empat tahun kemudian, tepatnya tanggal 29 Mei 1979 Menteri Pendidikan dan Kebudayaan mengeluarakan Surat Keputusan nomor 095/1979 tentang Penetapan Pengalihan Nama Perpustakaan Negara Menjadi Perpustakaan Wilayah, sementara induk organisasinya masih Pusat Pembinaan Perpustakaan. Adanya penggabungan Pusat Pembinaan Perpustakaan dengan Perpustakaan Nasional Republik Indonesia berdasarkan keputusan presiden nomor 11 tahun 1989 tentang Perpustakaan Nasional RI, pasal 14(1) nama Perpustakaan Wilayah yang ada di setiap provinsi berubah lagi menjadi Perpustakaan Daerah Jawa Barat dan induk organisasinya adalah Perpustakaan Nasional Republik Indonesia yang merupakan Lembaga Pemerintah Non Departemen (LPND).

(24)

Setelah terbitnya keputusan presiden nomor 50 tahun 1997 tentang Perpustakaan Nasional Republik Indonesia, maka selaras pasal 16(1) nama perpustakaan daerah Jawa Barat berubah lagi menjadi Perpustakaan Nasional Provinsi Jawa Barat, sedangkan induk organsasinya masih Perpustakaan Nasional Republik Indonesia.

Dengan berlakunya Undang-undang nomor 22 Tahun 1999, pada tahun 2001 Perpustakaan Nasional Provinsi Jawa Barat yang pada awalnya merupakan instansi vertikal perpustakaan nasional Republik Indonesia yang berada di ibukota provinsi dilimpahkan kepada pemerintah Provinsi Jawa Barat.

Kemudian tanggal 12 April 2002, berdasarkan peraturan daerah nomor 6 dibentuk Badan Perpustakaan Daerah Jawa Barat sebagai salah satu lembaga teknis daerah Pemerintah Provinsi Jawa Barat dalam bidang perpustakaan.

Selanjutnya Badan Perpustakaan Daerah Provinsi Jawa Barat yang semula berdiri sendiri sebagai lembaga teknis daerah pemerintah Provinsi Jawa Barat bidang perpustakaan mulai 19 November 2008 mengalami perubahan lagi menjadi Badan Perpustakaan dan Kearsipan Daerah berdasarkan peraturan daerah Provinsi Jawa Barat nomor 22 tahun 2008 tentang organisasi dan tata kerja inspektorat, Badan Perencanaan Pembangunan Daerah, lembaga teknis daerah dan satuan polisi pamong praja Provinsi Jawa Barat (lembaran daerah tahun 2008 nomor 21 seri D, tambahan lembaran daerah nomor 56).

2.1.2 Profil Perpustakaan

Adapun profil dari Badan Perpustakaan dan Kearsipan Daerah adalah sebagai berikut :

1. Nama perpustakaan : Badan Perpustakaan dan Kearsipan Daerah 2. Alamat perpustakaan : Jln. Soekarno Hatta no. 629 Bandung 3. No telp : 022 7310435

4. No fax : 022 7301408

(25)

2.1.3Visi Misi dan Tujuan Perpustakaan

A. Visi Perpustakaan

Perpustakaan dan kerasipan sebagai sumber informasi yang handal menuju masyarakat jawa barat cerdas.

B. Misi Perpustakaan

1. Meningkatkan pembinaan dan pengembangan lembaga perpustakaan

dan kearsipan

2. Meningkatkan profesionalisme dan kompetensi SDM pengelola

perpustakaan dan kearsipan.

3. Mengembangkan budaya baca masyarakat guna mewujudkan

masyarakat belajar (learning society).

4. Mengembangkan budaya sadar arsip.

5. Mengembangkan, mengelola, dan melestarikan bahan perpustakaan dan

arsip sebagai khasanah informasi dan pengetahuan.

6. Menyelenggarakan layanan perpustakaan dan kearsipan berbasis

teknologi informasi dan komunikasi.

C. Tujuan Perpustakaan

Memberikan layanan kepada pemustaka, meningkatkan pemberdayaan dan kegemaran membaca, serta memperluas wawasan dan pengetahuan untuk mencerdaskan kehidupan bangsa.

2.1.4Tugas Pokok dan Fungsi

Selaras dengan peraturan Gubernur Jawa Barat nomor 57 tahun 2009 Badan Perpustakaan dan Kearsipan Daerah Provinsi Jawa Barat sebagai lembaga teknis daerah pemerintahan Provinsi Jawa Barat mempunyai tugas

(26)

pokok melaksanakan perumusan dan pelaksanaan kebijakan daerah bidang perpustakaan dan kearsipan daerah berdasarkan asas otonomi, dekonsentrasi, dan tugas pembantuan.

Dalam menyelenggarakan tugas pokok tersebut, Badan Perpustakaan dan Kearsipan Daerah Provinsi Jawa Barat mempunyai fungsi sebagai berikut :

1. Penyelenggaraan perumusan dan penetapan kebijakan teknis bidang perpustakaan dan kearsipan daerah.

2. Penyelenggaraan pemberian dukungan atas penyelenggaraan

pemerintahan daerah bidang perpustakaan dan kearsipan daerah. 2.1.5 Struktur Organisasi

Struktur organisasi merupakan tata cara mengatur hubungan kerja setiap anggota, yaitu menentukan batas wewenang tugas beserta tanggung jawab masing-masing pegawai. Berdasarkan jabatan yang dipegang masing-masing dengan susunan organisasi akan terlihat dimana kedudukan seseorang dengan kegiatan dan fungsi yang telah ditentukan. Gambar 2.1 menjelaskan struktur organisasi di Badan Perpustakaan dan Kearsipan Daerah.

(27)

Gambar 2.1 Struktur Organisasi Badan Perpustakaan dan Kearsipan Daerah

2.1.6Deskripsi Jabatan

Pembagian tugas dalam suatu instansi /lembaga/perusahaan/organisasi sangat penting, supaya terjadi keharmonisan dalam mencapai suatu tujuan.

Berikut ini terdapat deskripsi jabatan yang berlaku di Badan Perpustakaan dan Kearsipan Daerah Jawa Barat :

(28)

A. Tugas Kepala

1. Memimpin, mengatur, membina dan mengendalikan pelaksanaan tugas

pokok dan fungsi badan.

2. Menetapkan kebijaksanaan teknis perancangan pengolahan

perpustakaan.

3. Menetapkan program kerja dan rencana kegiatan perpustakaan.

4. Menyelenggarakan fasilitas dalam bidang perpustakaan meliputi

pengembangan bahan pustaka, layanan dan pembinaan.

5. Memberikan saran, pertimbangan dan rekomendasi sebagai bahan

pengambilan kebijakan gubernur.

B. Tugas Sekretaris

1. Mengkoordinasikan penyusunan program, evaluasi dan pelaporan tugas

badan.

2. Melaksanakan pengaturan pengelolaan administrasi kepegawaian.

3. Mengkoordinasikan pengaturan pengelolaan administrasi keuangan

rutin.

4. Melaksanakan pengelolaan urusan rumah tangga dan perlengkapan. 5. Mengkoordinasikan penyusunan perencanaan strategis dan laporan

akuntabilitas kinerja kerja.

6. Melaksanakan pembinaan kelembagaan dan ketatalaksanaan pada unit kerja badan dilingkungan badan.

7. Melaksanakan perumusan bahan rancangan pendokumentasian

perundang undangan, pengelolaan perpustakaan dan hubungan masyarakat.

8. Melaksanakan pengendalian administrasi keuangan belanja rutin. 9. Melaksanakan pengelolaan naskah dinas dan kearsipan.

(29)

10.Melaksanakan koordinasi dengan unit kerja terkait. 11.Melaksanakan evaluasi dan pelaporan.

C. Tugas Bidang Pengembangan Bahan Pustaka

1. Melaksanakan perumusan program kerja Bidang Pengembangan Bahan

Pustaka.

2. Melaksanakan fasilitas kegiatan pengembangan bahan pustaka.

3. Melaksanakan perumusan bahan koordinasi dalam pelaksanaan

kegiatan pengembangan literatur sekunder.

4. Melaksanakan perumusan bahan koordinasi dalam pelaksanaan

kegiatan pengembangan bahan pustaka.

5. Melaksanakan koordinasi dengan unit kerja terkait. 6. Melaksanakan evaluasi pelaporan.

D. Tugas Bidang Layanan

1. Melaksanakan rencana dan program kerja.

2. Melaksanakan fasilitasi kegiatan layanan perpustakaan.

3. Melaksanakan perumusan bahan koordinasi dalam pelaksanaan

kegiatan layanan perpustakaan.

4. Melaksanakan perumusan bahan koordinasi dalam pelaksanaan

kegiatan otomasi perpustakaan.

5. Melaksanakan perumusan bahan koordinasi dalam dalam pelaksanaan preservasi bahan pustaka.

6. Melaksanakan koordinasi dengan unit kerja terkait. 7. Melaksanakan evaluasi pelaporan.

E. Tugas Bidang Pembinaan

(30)

2. Melaksanakan fasilitasi kegiatan pembinaan.

3. Melaksanakan penyusunan bahan koordinasi dalam pelaksanaan

kegiatan pembinaan.

4. Melaksanakan penyusunan bahan koordinasi dalam pelaksanaan

kegiatan pembinaan sumber daya manusia.

5. Melaksanakan penyusunan bahan koordinasi dalam pelaksanaan

kegiatan pembinaan kelembagaan perpustakaan.

6. Melaksanakan penyusunan bahan koordinasi dalam pelaksanaan

kegiatan kajian perpustakaan.

7. Melaksanakan koordinasi dengan unit kerja terkait. 8. Menyelenggarakan evaluasi dan pelaporan.

F. Tugas Subbidang layanan dan otomasi perpustakaan

1. Sub bidang layanan dan otomasi perpustakaan mempunyai tugas pokok

melaksanakan penyusunan bahan kebijakan teknis dan fasilitasi otomasi perpustakaan.

2. Melaksanakan pengelolaan pangkalan data perpustakaan, pembinaan dan pengembangan otomasi perpustakaan, dan pengelolaan internet.

2.2Information Retrieval (IR)

IR atau Pencarian Informasi dapat didefinisikan sebagai upaya untuk menemukan materi (biasanya dokumen) yang bersifat tidak terstruktur (biasanya teks) yang memenuhi kebutuhan informasi dari jumlah data yang sangat besar (biasanya disimpan dalam komputer).

Salah satu pengertian dai IR menurut Bill Frakes dan Ricardo Yates[14] adalah "sub bidang dari ilmu komputer yang mempelajari tentang pengumpulan data dan temu kembali dokumen". Dalam perkembangan selanjutnya IR dikembangkan menjadi automated IR systems yang menangani temu kembali data secara otomatis dalam jumlah data yang besar.

(31)

Tujuan dari sistem IR adalah memenuhi kebutuhan informasi pengguna dengan me-retrieve semua dokumen yang mungkin relevan, pada waktu yang sama me-retrieve sesedikit mungkin dokumen yang tidak relevan.Sistem IR yang baik memungkinkan pengguna menentukan secara cepat dan akurat apakah isi dari dokumen yang diterima memenuhi kebutuhannya. Agar representasi dokumen lebih baik, dokumen-dokumen dengan topik atau isi yang mirip dikelompokkan bersama-sama [13].

Keefektifan dari temu kembali informasi yang diinginkan tergantung pada dua hal mendasar yaitu perilaku pengguna dan logical view dari sistem temu kembali.

2.2.1Prilaku Pengguna

Dalam sistem IR, pengguna menterjemaahkan kebutuhan informasinya ke dalam bentuk kata query, dengan query ini maka sistem akan melakukan pencarian ke dalam kumpulan dokumen. Kualitas informasi yang dihasilkan dari sistem IR, secara langsung dipengaruhi dua hal yaitu penyajian dokumen secara logikal oleh sistem dan prilaku pengguna, prilaku pengguna maksudnya adalah berhubungan dengan kegiatan pengguna menentukan query yang sesuai dengan informasi yang diinginkan. Interaksi antara pengguna dengan sistem IR melalui aktifitas yang berbeda dapat digambarkan seperti dibawah ini.

Database IR Retrieve

Browsing

(32)

2.2.2 View Dokumen

Sistem basis data saat ini memungkinkan menyimpan representasi dokumen dalam bentuk koleksi keseluruhan kata-kata yang dikandungnya. Dalam hal ini dikatakan bahwa sistem IR mengadopsi full text logical view. Dengan banyaknya dokumen yang harus diproses, maka akan semakin besar kapaistas database yang diperlukan. Full text merupakan penampakan paling lengkap dari suatu dokumen tetapi penggunaannya membutuhkan biaya komputasi tinggi.

Untuk mengatasi hal tersebut, sistem harus dapat mereduksi kata yang disimpan dan mentransformasi logical view dari full text menjadi bentuk indeks. Hal ini dilakukan dengan meng-eliminasi stoplist (kata-kata yang terlalu umum seperti kata sandang, kata sambung, kata ganti, dll) dan melakukan proses stemming (pengubahan bentuk imbuhan ke bentuk dasar). Lebih jauh lagi adalah penggunaan metode-metode kompresi teks.

2.2.3 Arsitektur Sistem IR

(33)

Secara garis besar arsitektur sistem IR diperlihatkan pada gambar II.2. Ada dua pekerjaan yang ditangani oleh sistem ini, yaitu melakukan pre-processing terhadap database dan kemudian menerapkan metode tertentu untuk menghitung kedekatan (relevansi atau similarity) antara dokumen di dalam database yang telah dipreprocess dengan query pengguna. Pada tahapan preprocessing, sistem yang berurusan dengan dokumen semi-structured biasanya memberikan tag tertentu pada term-term atau bagian dari dokumen; sedangkan pada dokumen tidak terstruktur proses ini dilewati dan membiarkan term tanpa imbuhan tag. Query yang dimasukkan pengguna dikonversi sesuai aturan tertentu untuk mengekstrak term-term penting yang sejalan dengan termterm yang sebelumnya telah diekstrak dari dokumen dan menghitung relevansi antara query dan dokumen berdasarkan pada term-term tersebut. Sebagai hasilnya, sistem mengembalikan suatu daftar dokumen terurut descending (ranking) sesuai nilai kemiripannya dengan query pengguna [15].

Setiap dokumen (termasuk query) direpresentasikan menggunakan model bag-of-words yang mengabaikan urutan dari kata-kata di dalam dokumen, struktur sintaktis dari dokumen dan kalimat. Dokumen ditransformasi ke dalam

suatu “tas“ berisi kata-kata independen. Term disimpan dalam suatu database pencarian khusus yang ditata sebagai sebuah inverted index. Index ini merupakan konversi dari dokumen asli yang mengandung sekumpulan kata ke dalam daftar kata yang berasosiasi dengan dokumen terkait dimana kata-kata tersebut muncul.

Algoritma Nazief & Adriani sebagai algoritma stemming untuk teks berbahasa Indonesia yang memiliki kemampuan prosentase keakuratan (presisi) lebih baik dari algoritma lainnya. Algoritma ini sangat dibutuhkan dan menentukan dalam proses IR dalam dokumen Indonesia[24].

2.2.4Stemming

Stemming merupakan suatu proses yang terdapat dalam sistem IR yang mentransformasi kata-kata yang terdapat dalam suatu dokumen ke kata-kata akarnya (root word) dengan menggunakan aturan-aturan tertentu. Sebagai

(34)

contoh, kata bersama, kebersamaan, menyamai, akan distem ke root word-nya

yaitu “sama”. Proses stemming pada teks ber Bahasa Indonesia berbeda dengan

stemming pada teks berbahasa Inggris. Pada teks berbahasa Inggris, proses yang diperlukan hanya proses menghilangkan sufiks. Sedangkan pada teks berbahasa Indonesia, selain sufiks, prefiks, dan konfiks juga dihilangkan[24].

(35)

2.2.5Pembuatan Index

Pembuatan index dari koleksi dokumen merupakan tugas pokok pada tahapan preprocessing di dalam IR. Kualitas index mempengaruhi efektifitas dan efisiensi sistem IR [16]. Index dokumen adalah himpunan term yang menunjukkan isi atau topik yang dikandung oleh dokumen. Index akan membedakan suatu dokumen dari dokumen lain yang berada di dalam koleksi. Ukuran index yang kecil dapat memberikan hasil buruk dan mungkin beberapa item yang relevan terabaikan. Index yang besar memungkinkan ditemukan banyak dokumen yang relevan tetapi sekaligus dapat menaikkan jumlah dokumen yang tidak relevan dan menurunkan kecepatan pencarian [11].

Pembuatan inverted index harus melibatkan konsep linguistic processing yang bertujuan mengekstrak term-term penting dari dokumen yang direpresentasikan sebagai bag-ofwords. Ekstraksi term biasanya melibatkan dua operasi utama berikut [15]:

1. Penghapusan stop-words. Stop-word didefinisikan sebagai term yang tidak berhubungan (irrelevant) dengan subyek utama dari database meskipun kata tersebut sering kali hadir di dalam dokumen. Contoh beberapa daftar stop-word.

Tabel 2.1 Daftar Stop-word

Daftar Stop Word Daftar Stop Word

Yang sudah

Mampu tetapi

Tentang bisa

Di melakukannya

Setelah lakukan

Semua memang

Hampir baik

Juga lain

(36)

Antara setiap

Dan untuk

Ada dari

Seperti mendapatkan

Jadi punya

Karena telah

Of Mr

Mrs …, dll

Stop-words termasuk pula beberapa kata tertentu yang didefinisikan terkait dengan topik database, misal pada database yang menampung daftar karya tulis (paper) penelitian terkait dengan heart diseases, maka kata heart dan disease sebaiknya dihapus.

2. Salah satu teknik untuk meningkatkan performa sistem IR adalah pencarian

berdasarkan variasi morfologi kata. Salah satu contohnya untuk kata ‟siap‟

akan lebih mudah dikenali dalam suatu dokumen yang besar dibandingkan

kata „mempersiapkan‟. Stemming digunkan untuk mencari kata dasar dari bentuk berimbuhan, misalkan untuk kata lari, pelari, berlari, dilarikan, melarikan, semuanya akan dihitung menjadi satu term dengan frekuensi lima, bukan menjadi lima term berbeda dengan frekuensi masing-masing satu.

2.3Vector Space Model (VSM)

VSM adalah model sistem temu balik informasi yang mengibaratkan masing-masing query dan dokumen sebagai sebuah vektor n-dimensi. Tiap dimensi pada vektor tersebut diwakili oleh satu term. Term yang digunakan biasanya berpatokan kepada term yang ada pada query, sehingga term yang ada pada dokumen tetapi tidak ada pada query biasanya diabaikan.

Secara umum prosedur VSM dibagi menjadi tiga tahap. Tahap pertama adalah document indexing, kumpulan term yang telah diekstrak dari teks

(37)

dokumen. Tahap kedua yaitu pembobotan dari term yang sudah di-indeks untuk meningkatkan kualitas pencarian. Tahap terkahir, rangking dokumen berdasarkan tingkat kemiripan antara query dengan dokumen[8].

Pada Vector Space Model ini :

1 Vocabulary merupakan kumpulan semua term berbeda yang tersisa dari dokumen setelah preprocessing dan mengandung t termindex. Term-term ini membentuk suatu ruang vektor.

2 Setiap term i di dalam dokumen atau query j, diberikan suatu bobot (weight) bernilai real wij.

3 Dokumen dan query diekspresikan sebagai vektor t dimensi dj = (w1, w2, ..., wtj) dan terdapat n dokumen di dalam koleksi, yaitu j = 1, 2, ..., n.

Contoh dari model ruang vektor tiga dimensi untuk dua dokumen D1 dan D2, satu query pengguna Q1, dan tiga term T1, T2 dan T3 diperlihatkan pada gambar 2.5.

Gambar 2.5 Vector Space Model[15]

Dalam model ruang vektor, koleksi dokumen direpresentasikan oleh matriks

term document (atau matriks term-frequency). Setiap sel dalam matriks bersesuaian dengan bobot yang diberikan dari suatu term dalam dokumen yang

(38)

ditentukan. Nilai nol berarti bahwa term tersebut tidak hadir di dalam dokumen[15].

Gambar 2.6 Matriks Term Document

2.3.1 Indexing

Pengindeksan / indexing dilakukan untuk mendapatkan bobot dari setiap term dalam dokumen. Penghitungan bobot tersebut dilakukan dengan

melakukan perhitungan terhadap Term Frequency (Tf) dan Document

Frequency (Df) dari tiap term yang terdapat di koleksi dokumen, nilai Df selanjutnya akan diproses menjadi nilai Inverse Document Frequency (Idf) yang akan digunakan dalam perhitungan bobot term[12].

Keberhasilan dari model VSM ini ditentukan oleh skema pembobotan terhadap suatu term baik untuk cakupan lokal maupun global, dan faktor normalisasi [20]. Pembobotan lokal hanya berpedoman pada frekuensi munculnya term dalam suatu dokumen dan tidak melihat frekuensi kemunculan term tersebut di dalam dokumen lainnya. Pendekatan dalam pembobotan lokal yang paling banyak diterapkan adalah term frequency (tf) meskipun terdapat skema lain seperti pembobotan biner, augmented normalized tf, logaritmik tf dan logaritmik alternatif.

Idf dapat ditentukan dengan menggunakan rumus:

(1)

(39)

Idf = inverse document frequency

d = total dokumen

df = jumlah dokumen yang mengandung term

Bobot dari setiap term dapat dihitung dengan rumus w = tf * idf

2.3.2Normalisasi

Faktor normalisasi digunakan untuk menormalkan vektor dokumen sehingga proses retrieval tidak terpengaruh oleh panjang dari dokumen. Normalisasi ini diperlukan karena dokumen panjang biasanya mengandung perulangan term yang sama sehingga menaikkan frekuensi term (tf). Dokumen panjang juga mengandung banyak term yang berbeda sehingga menaikkan ukuran kemiripan antara query dengan dokumen tersebut, meningkatkan peluang di-retrievenya dokumen yang lebih panjang.

Normalisasi yang digunakan adalah normalisasi kosinus. Berdasarkan [22] rumus normalisasi kosinus yaitu :

(2)

Dengan W adalah bobot dari query dan dokumen.

2.4Ukuran Kemiripan

Model ruang vektor dan pembobotan tf-idf digunakan untuk

merepresentasikan nilai numerik dokumen sehingga kemudian dapat dihitung kedekatan antar dokumen. Semakin dekat dua vektor di dalam suatu VSM maka semakin mirip dua dokumen yang diwakili oleh vektor tersebut. Kemiripan antar dokumen dihitung menggunakan suatu fungsi ukuran kemiripan (similarity measure). Ukuran ini memungkinkan perankingan dokumen sesuai dengan kemiripan relevansinya terhadap query. Setelah dokumen diranking, sejumlah tetap dokumen top-scoring dikembalikan kepada pengguna.

(40)

Cosine Similarity tidak hanya digunakan untuk menghitung normalisasi panjang dokumen tapi juga menjadi salah satu ukuran kemiripan yang popular[21]. Ukuran ini menghitung nilai kosinus sudut antara dua vektor. Jika terdapat dua vektor dokumen d dan query q, serta t term diekstrak dari koleksi dokumen maka nilai kosinus antara d dan q didefinisikan sebagai [15] :

2.5Peningkatan Kualitas Pencarian

Rancangan dasar dari sistem IR dapat ditingkatkan untuk menaikkan presisi dan recall serta memperbaiki matriks term-document. Isu pertama sering

diselesaikan menggunakan mekanisme relevance feedback. Beberapa term

ditambahkan ke dalam query awal agar dapat menemukan dokumen yang lebih relevan. Relevance feedback dapat dikerjakan secara manual maupun otomatis. Pada pendekatan manual, pengguna mengidentifikasi dokumen yang relevan dan

term baru dipilih secara manual atau otomatis. Pada pendekatan otomatis, dokumen relevan diidentifikasi menggunakan dokumen top-ranked, kemudian

term-term baru dipilih secara otomatis.

Takashi Onoda, dkk dalam penelitianya yang berjudul Relevance

Feedback Document Retrieval using Support Vector Machines, telah berhasil melakukan peningkatan kualitas pencarian dengan memodifikasi vektor query.

Gambar dibawah ini menjelaskan konsep Relevance Feedback untuk

meningkatkan kualitas pencarian.

(41)

Gambar 2.7 Skema Umpan Balik dalam Pencarian Dokumen[9]

2.6Support Vector Machines (SVM)

Support Vector Machines (SVM) adalah suatu teknik yang relatif baru (1992) untuk melakukan prediksi, baik dalam kasus klasifikasi maupun regresi, yang sangat populer belakangan ini. SVM berada dalam satu kelas dengan

Artificial Neural Network (ANN) dalam hal fungsi dan kondisi permasalahan yang bisa diselesaikan. Keduanya masuk dalam kelas supervised learning. Baik para ilmuwan maupun praktisi telah banyak menerapkan teknik ini dalam menyelesaikan masalah-masalah nyata dalam kehidupan sehari-hari. Baik dalam masalah gene expression analysis, finansial, cuaca hingga di bidang kedokteran. Terbukti dalam banyak implementasi, SVM memberi hasil yang lebih baik dari ANN, terutama dalam hal solusi yang dicapai. ANN menemukan solusi berupa

local optimal sedangkan SVM menemukan solusi yang global optimal. Tidak heran bila solusi ANN dari setiap training selalu berbeda. Hal ini disebabkan solusi local optimal yang dicapai tidak selalu sama. SVM selalu mencapi solusi yang sama untuk setiap running. Dalam teknik ini, SVM berusaha untuk menemukan hyperplane (pemisah/classifier) yang optimal yang bisa memisahkan dua set data dari dua kelas yang berbeda.

Dalam hal ini fungsi pemisah yang dicari adalah fungsi linier. Fungsi ini bisa didefinisikan sebagai :

(42)

g(x) := sgn(f(x)) dengan f(x) = wT x + b

(4)

Dimana x, w ∈ Rn dan b ∈ R. Masalah klasifikasi ini bisa dirumuskan sebagai berikut: kita ingin menemukan set parameter (w, b) sehingga f (xi) =< w,x > + b= yi untuk semua i.

Dalam teknik SVM berusaha menemukan fungsi hyperplane terbaik diantara fungsi yang tidak terbatas jumlahnya untuk memisahkan dua macam obyek. Hyperplane terbaik adalah hyperplane yang terletak di tengah-tengah antara dua set obyek dari dua kelas. Mencari hyperplane terbaik ekuivalen dengan memaksimalkan margin atau jarak antara dua set obyek dari kelas yang berbeda. Jika wx1 + b = +1 adalah hyperplane-pendukung (supporting hyperplane) dari kelas +1 (wx1 + b = +1) dan wx2 + b = -1 hyperplane-pendukung dari kelas -1 (wx2 + b = -1) margin antara dua kelas dapat dihitung dengan mencari jarak antara kedua hyperplane-pendukung dari kedua kelas. Secara spesifik, margin dihitung dengan cara berikut (wx1 + b = +1) - (wx2 + b = -1) => w(x1–x2) = 2 => ( (x1 – x2)) = . Gambar 2.8 memperlihatkan bagaimana SVM bekerja untuk

menemukan suatu fungsi pemisah dengan margin yang maksimal. Untuk membuktikan bahwa memaksimalkan margin antara dua set obyek akan meningkatkan probabilitas pengelompokkan secara benar dari data testing. Pada dasarnya jumlah fungsi pemisah ini tidak terbatas banyaknya. Misalkan dari jumlah yang tidak terbatas ini kita ambil dua saja, yaitu f1(x1) dan f2(x2). Fungsi f1 mempunyai margin yang lebih besar dari pada fungsi f2.Setelah menemukan dua fungsi ini, sekarang suatu data baru masuk dengan keluaran −1. Kita harus

mengelompokkan apakah data ini ada dalam kelas −1 atau +1 menggunakan

fungsi pemisah yang sudah kita temukan. Dengan menggunakan f1, kita akan

kelompokkan data baru ini di kelas −1 yang berarti kita benar

mengelompokkannya. Sekarang coba kita gunakan f2, kita akan menempatkannya di kelas +1 yang berarti salah. Dari contoh sederhana ini kita lihat bahwa

(43)

memperbesar margin bisa meningkatkan probabilitas pengelompokkan suatu data secara benar.

Gambar 2.8 Mencari Fungsi Pemisah Optimal yang dapat Memisahkan Data Secara Linear[29]

(44)

2.6.1 Formulasi Matematis

Secara matematika, formulasi problem optimisasi SVM untuk kasus klasifikasi linier di dalam primal space adalah

Subject to

yi (wxi + b) ≥ 1, i = 1,…., n

(5)

dimana xi adalah data input, yi adalah keluaran dari data xi, w, b adalah parameter-parameter yang kita cari nilainya. Formulasi di atas bertujuan meminimalkan fungsi tujuan (obyektif function) dari persamaan(5) atau memaksimalkan kuantitas atau wTw dengan memperhatikan pembatas yi

(wxi + b) ≥ 1. Bila output data yi = +1, maka pembatas menjadi (wxi + b) ≥ 1.

Sebaliknya bila yi = -1, pembatas menjadi (wxi + b) ≤ -1.

Di dalam kasus yang tidak feasible (infeasible) dimana beberapa data mungkin tidak bisa dikelompokkan secara benar, formulasi matematikanya menjadi berikut :

ti Subject to

yi (wxi + b) + ti ≥ 1, ti ≥ 0, i = 1,…., l

(6)

dimana ti adalah variabel slack. Dengan formulasi ini kita ingin memaksimalkan margin antara dua kelas dengan meminimalkan . Formulasi ini berusaha meminimalkan kesalahan klasifikasi (misclassification error) yang dinyatakan dengan adanya variabel slack ti, secara bersamaan formulasi tersebut

memaksimalkan margin . penggunaan variabel slack ti adalah untuk

mengatasi kasus ketidaklayakan (infeasibility) dari pembatas (constraints) yi (wxi + b) ≥ 1 dengan cara memberi pinalti untuk data yang tidak memenuhi pembatas

(45)

tersebut. Untuk meminimalkan nilai ti ini, kita berikan pinalti dengan menerapkan konstanta ongkos C. Vektor w tegak lurus terhadap fungsi pemisah:

wx + b = 0. Konstanta b menentukan lokasi fungsi pemisah relatif terhadap titik asal.

Problem (3) adalah programa nonlinear. Ini bisa dilihat dari fungsi tujuan (objective function) yang berbentuk kuadrat. Untuk menyelesaikannya, secara komputasi agak sulit dan perlu waktu lebih panjang. Untuk membuat masalah ini lebih mudah dan efisien untuk diselesaikan, masalah ini bisa kita transformasikan ke dalam dual space. Untuk itu, pertama kita ubah problem (6) menjadi fungsi Lagrangian :

(7)

dimana variabel non-negatif αi, dinamakan lagrange multiplier. Solusi dari

problem optimisasi dengan pembatas seperti di atas ditentukan dengan mencari saddle point dari fungsi Lagrangian J(w, b, α). Fungsi ini harus diminimalkan terhadap variabel w dan b dan harus dimaksimalkan terhadap variabel α. Kemudian kita cari turunan pertama dari fungsi J(w, b, α) terhadap variabel w

dan b dan kita samakan dengan 0. Dengan melakukan proses ini, kita akan mendapatkan dua kondisi optimalitas berikut:

Kondisi 1 :

Kondisi 2 :

(46)

(8)

Penerapan kondisi optimalitas 2 pada fungsi Lagrangian (7) akan menghasilkan

(9)

Menurut duality theorem [26]:

1 Jika problem primal mempunyai solusi optimal, maka problem dual juga akan mempunyai solusi optimal yang nilainya sama

2 Bila wo adalah solusi optimal untuk problem primal dan αo untuk problem dual, maka perlu dan cukup bahwa wo solusi layak untuk problem primal dan

Setelah itu, jabarkan persamaan (4) sebagai berikut:

(10)

Menurut kondisi optimalitas ke dua dalam (9), term ketiga sisi sebelah kanan dalam persamaan di atas sama dengan 0. Dengan memakai nilainilai w di (8), maka didapat

(11)

maka persamaan 7 menjadi :

(12)

(47)

(13)

Subject to

0 ≤ αi, i = 1, ..l,

Dengan dot product xixj sering diganti dengan simbol K. K adalah matrik

kernel. Formulasi (10) adalah quadratic programming (QP) dengan pembatas (constraint) linier. Melatih SVM ekuivalen dengan menyelesaikan problem

convex optimization. Karena itu solusi dari SVM adalah unik (dengan asumsi bahwa k adalah positive definite) dan global optimal. Ambil,

(14)

Fungsi pemisah optimal adalah

(15)

dimana ,i =1,..l adalah solusi optimal dari problem (13) dan dipilih

sehingga yif(xi) = 1 untuk sembarang i dengan C > > 0. Data xi dimana > 0

dinamakan support vector dan menyatakan data training yang diperlukan untuk mewakili fungsi keputusan yang optimal. Dalam gambar 1, sebagai contoh, 3 titik berwarna putih menyatakan support vector. Untuk mengatasi masalah ketidaklinieran (nonlinearity) yang sering terjadi dalam kasus nyata, kita bisa menerapkan metode kernel. Metode kernel memberikan pendekatan alternatif dengan cara melakukan mapping data x dari input space ke feature space F

melalui suatu fungsi sehingga . Karena itu suatu titik x

(48)

2.6.2 Metode Kernel

Banyak teknik data mining atau machine learning yang dikembangkan dengan asumsi kelinieran. Sehingga algorithma yang dihasilkan terbatas untuk kasus-kasus yang linier. Karena itu, bila suatu kasus klasifikasi memperlihatkan ketidaklinieran, algorithma seperti perceptron tidak bisa mengatasinya. Secara umum, kasus-kasus di dunia nyata adalah kasus yang tidak linier. Sebagai contoh, perhatikan Gambar 3. Data ini sulit dipisahkan secara linier. Metode kernel [5] adalah salah satu untuk mengatasinya. Dengan metoda kernel suatu data x di input space dimapping ke feature space F dengan dimensi yang lebih

tinggi melalui map sebagai berikut . Karena itu data x di input

space menjadi (x) di feature space.

Sering kali fungsi (x) tidak tersedia atau tidak bisa dihitung. tetapi dot

product dari dua vektor dapat dihitung baik di dalam input space maupun di feature space. Dengan kata lain, sementara (x) mungkin tidak diketahui, dot

product < (x1), (x2) > masih bisa dihitung di feature space. Untuk bisa

memakai metoda kernel, pembatas (constraint) perlu diekspresikan dalam bentuk dot product dari vektor data xi. Sebagai konsekuensi, pembatas yang menjelaskan permasalahan dalam klasifikasi harus diformulasikan kembali sehingga menjadi bentuk dot product. Dalam feature space ini dot product < . > menjadi < (x1), (x2)‟ >. Suatu fungsi kernel, k(x, x‟), bisa untuk menggantikan dot product < (x1), (x2)‟ > Kemudian di feature space, kita bisa membuat

suatu fungsi pemisah yang linier yang mewakili fungsi nonlinear di input space. Gambar 4 mendeskripsikan suatu contoh feature mapping dari ruang dua dimensi ke feature space dua dimensi. Dalam input space, data tidak bisa dipisahkan secara linier, tetapi kita bisa memisahkan di feature space. Karena itu dengan memetakan data ke feature space menjadikan tugas klasifikasi menjadi lebih mudah [5].

(49)

Gambar 2.10 Mapping Data dari Input Space ke Feature Space[29]

Fungsi kernel yang biasanya dipakai dalam literatur SVM [7]: 1. Linear : xTx,

2. Polynomial : (xTx + 1)p,

3. Radial basis function :

4. Tangent hyperbolic (sigmoid) : tanh(βxTxi + β1), dimana β, β1 €R

Fungsi kernel yang legitimate diberikan oleh Teori Mercer [6] dimana fungsi itu harus memenuhi syarat: kontinus dan positive definite. Lebih mudah menemukan fungsi kernel daripada mencari map seperti apa yang tepat untuk melakukan mapping dari input space ke feature space. Pada penerapan metode kernel, tidak perlu tahu map apa yang digunakan untuk satu per satu data, tetapi lebih penting mengetahui bahwa dot produk dua titik di feaure space bisa digantikan oleh fungsi kernel.

2.7MySQL

MySQL adalah sebuah perangkat lunak sistem manajemen basis data SQL (bahasa Inggris: database management system) atau DBMS yang multithread, multi-user, dengan sekitar 6 juta instalasi di seluruh dunia. MySQL AB membuat MySQL tersedia sebagai perangkat lunak gratis dibawah lisensi GNU General Public License (GPL), tetapi mereka juga menjual dibawah lisensi komersial untuk kasus-kasus dimana penggunaannya tidak cocok dengan penggunaan GPL.

(50)

Tidak sama dengan proyek-proyek seperti Apache, dimana perangkat lunak dikembangkan oleh komunitas umum, dan hak cipta untuk kode sumber dimiliki oleh penulisnya masing-masing, MySQL dimiliki dan disponsori oleh sebuah perusahaan komersial Swedia MySQL AB, dimana memegang hak cipta hampir atas semua kode sumbernya. Kedua orang Swedia dan satu orang Finlandia yang mendirikan MySQL AB adalah: David Axmark, Allan Larsson, dan Michael "Monty" Widenius.

MySQL memiliki beberapa keistimewaan, antara lain :

1. Portabilitas. MySQL dapat berjalan stabil pada berbagai sistem operasi seperti Windows, Linux, FreeBSD, Mac Os X Server, Solaris, Amiga, dan masih banyak lagi.

2. Perangkat lunak sumber terbuka. MySQL didistribusikan sebagai

perangkat lunak sumber terbuka, dibawah lisensi GPL sehingga dapat digunakan secara gratis.

3. Multi-user. MySQL dapat digunakan oleh beberapa pengguna dalam waktu yang bersamaan tanpa mengalami masalah atau konflik.

4. 'Performance tuning', MySQL memiliki kecepatan yang menakjubkan dalam

menangani query sederhana, dengan kata lain dapat memproses lebih banyak SQL per satuan waktu.

5. Ragam tipe data. MySQL memiliki ragam tipe data yang sangat kaya, seperti signed / unsigned integer, float, double, char, text, date, timestamp, dan lain-lain.

6. Perintah dan fungsi. MySQL memiliki operator dan fungsi secara penuh yang mendukung perintah Select dan Where dalam perintah (query).

7. Keamanan. MySQL memiliki beberapa lapisan keamanan seperti level

subnetmask, nama host, dan izin akses user dengan sistem perizinan yang mendetail serta sandi terenkripsi.

(51)

8. Skalabilitas dan pembatasan. MySQL mampu menangani basis data dalam skala besar, dengan jumlah rekaman (records) lebih dari 50 juta dan 60 ribu tabel serta 5 milyar baris. Selain itu batas indeks yang dapat ditampung mencapai 32 indeks pada tiap tabelnya.

9. Konektivitas. MySQL dapat melakukan koneksi dengan klien menggunakan protokol TCP/IP, Unix soket (UNIX), atau Named Pipes (NT).

10.Lokalisasi. MySQL dapat mendeteksi pesan kesalahan pada klien dengan menggunakan lebih dari dua puluh bahasa. Meski pun demikian, bahasa Indonesia belum termasuk di dalamnya.

11.Antar muka. MySQL memiliki antar muka (interface) terhadap berbagai aplikasi dan bahasa pemrograman dengan menggunakan fungsi API (Application Programming Interface).

12.Klien dan peralatan. MySQL dilengkapi dengan berbagai peralatan

(tool)yang dapat digunakan untuk administrasi basis data, dan pada setiap peralatan yang ada disertakan petunjuk online.

13.Struktur tabel. MySQL memiliki struktur tabel yang lebih fleksibel dalam menangani ALTER TABLE, dibandingkan basis data lainnya semacam PostgreSQL ataupun Oracle.

2.8PHP

PHP berawal dari skrip Perl/CGI yang dibuat oleh seorang pengembang perangkat lunak bernama Rasmus Lerdorf untuk menghitung jumlah pengunjung

homepage-nya. Karena banyaknya pengunjung yang meminta skrip tersebut, Lerdorf akhirnya membagi-bagikan skrip buatannya yang diberi nama Personal Home Page (PHP).

Banyaknya permintaan membuat Lerdorf terus mengembangkan skripnya. Beberapa orang akhirnya bergabung membentuk tim untuk mengembangkan PHP. Sejak itu PHP berkembang pesat dengan banyak fungsi baru yang ditambahkan. Kepanjangan dari PHP kini berubah menjadi PHP: Hypertext Preprocessor.

(52)

Ada tiga macam penggunaan PHP:

1. Server-side scripting. Ini merupakan jenis penggunaan yang paling banyak dilakukan pengguna PHP. Untuk menggunakannya, dibutuhkan tiga hal: PHP

parser, aplikasi web server yang terkoneksi dengan instalasi PHP, dan aplikasi

web browser.

2. Command line scripting. Pada penggunaan PHP jenis ini hanya dibutuhkan PHP parser.

3. Pembuatan aplikasi berbasis desktop. Pada penggunaan PHP jenis ini, dibutuhkan ekstensi tambahan PHP-GTK.

PHP memiliki empat kelebihan utama yang menarik minat banyak pengguna. Kelebihan utama PHP tersebut diringkas dalam 4P berikut:

1. Practicality. PHP dibuat dengan menitikberatkan pada kepraktisan. Hasilnya, PHP adalah bahasa pemrograman minimalis, dilihat dari segi kebutuhan pengguna dan kebutuhan sintaks.

2. Power. PHP memiliki banyak kemampuan, mulai dari kemampuan untuk terhubung dengan basis data, membuat halaman web dinamis, membuat dan memanipulasi berkas gambar, Flash dan PDF, berkomunikasi dengan bermacam protokol seperti IMAP dan POP3, dan masih banyak lagi.

3. Possibility. PHP dapat menyediakan lebih dari satu solusi untuk suatu masalah

4. Price. PHP selalu dirilis kepada publik tanpa ada batasan untuk penggunaan, modifikasi, atau redistribusi.

2.9Cascading Style Sheets (CSS)

CSS adalah sebuah bahasa style sheet (lembar gaya) yang digunakan untuk mengatur tampilan dokumen yang ditulis dalam bahasa markup. CSS Level 1

(CSS1) diperkenalkan pada tahun 1995 oleh World Wide Web Consortium (W3C)

dan dimaksudkan untuk mengatasi keterbatasan HTML dalam hal keleluasaan pengaturan desain dan tampilan pada sebuah dokumen HTML. Setahun kemudian

(53)

CSS1 diberi status rekomendasi penuh oleh W3C yang juga mengatur spesifikasi CSS. Saat ini ada tiga level CSS, yaitu CSS Level 1 (Recommendation), CSS

Level 2 (Recommendation), dan CSS Level 2 Revision 1 (Candidate Recommendation). Penggunaan CSS paling banyak untuk memformat halaman web yang ditulis dengan HTML dan XHTML. Walau demikian, CSS dapat dipergunakan untuk bahasa markup lain seperti SVG dan XUL.

2.10 XAMPP

XAMPP merupakan singkatan dari X (empat operating system apapun) Apache, MySQL, PHP, Perl. XAMPP merupakan tool yang menyediakan paket perangkat lunak ke dalam satu buah paket. Dalam paketnya sudah terdapat Apache (web server), MySQL (database), PHP (server side scripting), Perl, FTP server, phpMyAdmin dan berbagai pustaka bantu lainnya. Dengan menginstall XAMPP maka tidak perlu lagi melakukan instalasi dan konfigurasi web server Apache, PHP dan MySQL secara manual. XAMPP akan menginstalasi dan mengkonfigurasikannya secara otomatis.

2.11 Adobe Dreamweaver CS5

Dreamweaver merupakan sebuah aplikasi untuk merancang pembuatan

website. Dreamweaver dibuat oleh perusahaan Macromedia sehingga dinamakan Macromedia Dreamweaver. Sejak Macromedia diakuisisi Adobe Inc., namanya berubah menjadi Adobe Dreamweaver. Versi pertama Dreamweaver dibawah Adobe adalah CS5, mengikuti versi rilisnya yang dipaketkan dalam Adobe Creative Suite 5.

Dreamweaver memiliki kelebihan dalam hal kemudahan penggunaan. Untuk pengguna awam, Dreamweaver menyediakan fungsi tampilan Design, sehingga pengguna dapat merancang tampilan halaman web dengan konsep WYSIWYG (What You See Is What You Get). Untuk pengguna tingkat lanjut, Dreamweaver menyediakan tampilan Code sehingga pengguna dapat merancang tampilan yang lebih lengkap menggunakan kode. Pengguna juga dimudahkan

(54)

dengan berbagai fasilitas yang dimiliki Dreamweaver seperti tag auto-completionuntuk penulisan kode HTML. Format yang didukung Dreamweaver juga cukup lengkap, mulai dari HTML, JavaScript, CSS, sampai XML.

2.12 Unified Modelling Language (UML)

UML adalah bahasa spesifikasi standar untuk mendokumentasikan, menspesifikasikan, dan membangun sistem perangkat lunak.

UML adalah himpunan struktur danteknik untuk pemodelan desain program berorientasi objek (OOP) serta aplikasinya. UML adalah metodologi untuk mengembangkan sistem OOP dan sekelompok perangkat tool untuk mendukung pengembangan sistem tersebut UML mulai diperkenalkan oleh Object Management Group, sebuah organisasi yang telah mengembangkan model, teknologi, dan standar OOP sejak tahun 1980-an. Sekarang UML sudah mulai banyak digunakan oleh para praktisi OOP. UML merupakan dasar bagi perangkat (tool) desain berorientasi objek dari IBM.

UML adalah suatu bahasa yang digunakan untuk menentukan, memvisualisasikan, membangun, dan mendokumentasikan suatu sistem informasi. UML dikembangkan sebagai suatu alat untuk analisis dan desain berorientasi objek oleh Grady Booch, Jim Rumbaugh, dan Ivar Jacobson.Namun demikian UML dapat digunakan untuk memahami dan mendokumentasikan setiap sistem informasi.Penggunaan UML dalam industri terus meningkat. Ini merupakan standar terbuka yang menjadikannya sebagai bahasa pemodelan yang umum dalam industri peranti lunak dan pengembangan sistem.

UML menyediakan 10 macam diagram untuk memodelkan aplikasi berorientasi objek, yaitu:

1. Use CaseDiagram untuk memodelkan proses bisnis.

2. Conceptual Diagram untuk memodelkan konsep-konsep yang ada di dalam aplikasi.

(55)

3. Sequence Diagram untuk memodelkan pengiriman pesan (message) antar objek.

4. Collaboration Diagram untuk memodelkan interaksi antar objek.

5. State Diagram untuk memodelkan perilaku objek di dalam sistem.

6. Activity Diagram untuk memodelkan perilaku userdan objek di dalam sistem.

7. Class Diagram untuk memodelkan struktur kelas.

8. Objek Diagram untuk memodelkan struktur objek.

9. Component Diagram untuk memodelkan komponen objek.

10.Deployment Diagram untuk memodelkan distribusi aplikasi.

Berikut akan dijelaskan 4 macam diagram yang paling sering digunakan dalam pembangunan aplikasi berorientasi objek, yaitu use case diagram, sequence diagram, collaboration diagram, dan class diagram.

2.12.1 Use Case Diagram

Use case diagram digunakan untuk memodelkan bisnis proses berdasarkan perspektif pengguna sistem. Use case diagram terdiri atas diagram untuk use case dan actor. Actor merepresentasikan orang yang akan mengoperasikan atau orang yang berinteraksi dengan sistem aplikasi.

Use case merepresentasikan operasi-operasi yang dilakukan oleh actor.

Use case digambarkan berbentuk elips dengan nama operasi dituliskan didalamnya. Actor yang melakukan operasi dihubungkan dengan garis lurus ke

use case.

2.12.2 Sequence Diagram

Sequence diagram menjelaskan secara detil urutan proses yang dilakukan dalam sistem untuk mencapai tujuan dari use case. Interaksi yang terjadi antar class, operasi apa saja yang terlibat, urutan antar operasi, dan informasi yang diperlukan oleh masing-masing operasi.

(56)

2.12.3 Activity Diagram

Activity diagram adalah representasi grafis dari alur kerja tahapan aktifitas. Diagram ini mendukung pilihan tindakan, iterasi dan concurrency. Pada pemodelan UML, activity diagram dapat digunakan untuk menjelaskan bisnis dan alur kerja operasional secara step-by-step dari komponen suatu sistem.

Activity diagram menunjukkan keseluruhan dari aliran kontrol.

2.12.4 Class Diagram

Class diagram merupakan diagram yang selalu ada di permodelan sistem berorientasi objek. Class diagram menunjukkan hubungan antar class dalam sistem yang sedang dibangun dan bagaimana mereka saling berkolaborasi untuk mencapai suatu tujuan.

(57)

3.1 Analisis Sistem

3.1.1 Analisis Masalah

Dilihat dari sistem yang sedang berjalan saat ini sistem pencarian yang berlaku masih manual, dimana pengunjung perpustakaan harus mencari buku satu per satu dengan atau tanpa bertanya ke pustakawan untuk mendapatkan informasi buku yang dibutuhkan. Pada saat mencari buku, sedikit pengunjung sudah mengetahui judul dan pengarang dari buku yang akan dicari, akan tetapi kebanyakan pengunjung perpustakaan justru tidak tahu identitas buku yang akan dicari seperti judul, pengarang, penerbit, dan lain-lain yang hendak dicari.

Permasalahan pada penelitian ini adalah sulitnya mencari buku yang sesuai kebutuhan jika tidak mengetahui informasi sedikitpun mengenai identitas buku yang dibutuhkan sehingga menyebabkan lamanya proses pencarian buku jika harus menganalisis satu per satu buku di perpustakaan.

Oleh karena itu dibutuhkan sistem yang dapat melakukan proses pencarian berdasarkan representasi kebutuhan dari pencari buku kedalam query. Dengan kata lain, sistem yang dibangun dapat menghitung ukuran kemiripan antara dokumen dengan query. Akan tetapi, ukuran kemiripan suatu dokumen yang dinilai oleh sistem belum tentu sama dengan yang dinilai oleh pengguna[11]. Oleh karena itu, sistem perlu mengklasifikasi ulang dokumen-dokumen yang akan ditampilkan ke pengguna.

3.1.2 Analisis Sistem yang sedang berjalan

Proses pencarian buku diperpustakaan bisa dilakukan dengan cara pengunjung bertanya atau menjelaskan langsung mengenai buku yang dibutuhkan kepada pustakawan perpustakaan, jika dirasa pertanyaan atau penjelasan masih kurang jelas maka pustakawan meminta pengunjung untuk menjelaskan gambaran

(58)

kebutuhan pengunjung terhadap buku lebih jelas, jika sudah cukup jelas maka pustakawan merekomendasikan kepada pengunjung untuk mencari buku dilokasi yang disebutkan oleh pustakawan atau pustakawan turut mencari buku yang dibutuhkan pengunjung.

Proses pencarian yang sudah dijelaskan sebelumnya, memiliki banyak kekurangan, seperti :

1. Keterbatasan pengetahuan pustakawan mengenai informasi buku yang

terdaftar di perpustakaan,

2. Proses pencarian membutuhkan waktu yang sangat lama.

Namun proses pencarian ini juga memiliki kelebihan yaitu tingkat keakuratan yang cukup tinggi, karena baik pengunjung atau pustakawan yang melakukan pencarian, sama-sama menganalisis buku satu per satu dari mulai judul hingga isi buku.

Pengunjung Pustakawan

[Penjelasan Kebutuhan Cukup Jelas] [Penjelasan Kebutuhan

Masih Kurang Jelas] Bertanya atau

Menjelaskan Mengenai Informasi Buku yang Dibutuhkan

Mendengarkan Pertanyaan atau Penjelasan Kebutuhan

Pengunjung

Meminta Pengunjung Untuk Menjelaskan Lebih Detail Mengenai

Kebutuhan Buku Memberikan Informasi Mengenai Lokasi Buku

yang Dimaksud

(59)

3.1.3 Analisis Kebutuhan Data

Sistem yang akan dibangun merupakan sistem pencarian buku untuk perpusatakaan daerah. Sebuah sistem pencarian hanya dapat melakukan proses pencarian jika tempat untuk pencarian ada, dan tempat pencarian tersebut adalah identitas buku, dalam penelitian ini data yang dibutuhkan berupa judul, pengarang dan deskripsi. Oleh karena itu, untuk menunjang pembangungan sistem ini, dibutuhkan identitas (judul dan pengarang) dan deskripsi buku yang sudah terdaftar di perpustakaan.

Berdasarkan hasil analisis dari data buku sebanyak 60 data buku dari berbagai golongan, maka diperoleh karakteristik teks dari data buku yang perlu diperhatikan adalah sebagai berikut :

a. Bahasa

Terdapat beragam bahasa yang digunakan dalam buku yang ada di perpustakaan. Pada penelitian ini data buku yang digunakan merupakan data buku dengan teks berbahasa indonesia dan bahasa inggris.

b. Deskripsi Buku

Untuk mendapatkan deskripsi buku, dapat dilihat dari cover belakang buku. Alternatif lain yang bisa dijadikan deskripsi buku yaitu kata pengantar atau daftar isi dari data buku.

c. Jenis Kata

Terdapat beragam jenis kata yang ada data buku, yaitu : 1.kata sesuai EYD,

2.kata yang biasa digunakan sehari-hari, 3.kata berimbuhan, dan

4.kata dasar.

3.1.4 Analisis Metode

Sistem dibagi menjadi dua proses penting, yaitu proses pencarian dan proses pengolahan data.

(60)

Proses pencarian dapat digunakan oleh pengunjung untuk melakukan proses pencarian informasi buku dan lihat deskripsi dari buku itu sendiri. Proses pencarian dalam penelitian ini adalah proses pencarian dinamis, dimana pengguna juga dapat menentukan sesuai atau tidak nya query dengan informasi buku yang ditampilkan dari hasil pencarian, setelah itu sistem akan mengklasifikasikan seluruh data buku yang terdapat dalam database kedalam kategori relevan dan tidak relevan. Data buku yang ditampilkan adalah data buku yang masuk dalam kategori relevan.

Proses pengolahan data, khusus digunakan oleh operator untuk melakukan proses pengolahan (tambah, ubah, lihat detail, cari, dan hapus) data buku, pengolahan (tambah dan ubah) data golongan, dan melakukan optimisasi pada sistem pencarian.

Berikut dibawah ini adalah gambar dari aktivitas sistem pencarian informasi buku :

Pengunjung Sistem

Masukkan Query

Cek Data Buku yang Relevan

Mencari dan Memberi Peringkat Data Buku Berdasarkan Ukuran Kemiripan

Menampilkan Maksimal 10 Informasi Buku dengan Ukuran Kemiripan Tertinggi

Menampilkan Informasi Buku Hasil Klasifikasi

Mengklasifikasi Seluruh Data Buku Berdasarkan Hasil Cek Pengunjung

(61)

Terdapat pula sub proses untuk menunjang proses-proses yang sudah diajabarkan sebelumnya, yaitu:

3.1.4.1Analisis Vector Space Model (VSM) A. Analisis Tokenizing

Tokenizing adalah proses pemotongan string input berdasarkan tiap kata yang menyusunya serta membedakan karakter-karakter tertentu yang dapat diperlakukan sebagai pemisah kata atau bukan. Tahapan ini juga menghilangkan karakter-karakter tertentu seperti tanda baca dan mengubah semua katake bentuk huruf kecil (lower case).

Karakter-karakter yang akan dihapus atau dianggap sebagai pemisah kata,

dapat dilihat di tabel 3.1.

Tabel 3.1 Karakter yang akan Dihapus

Karakter

! ~ + \

@ & = /

# * { “

$ ( } „

% ) [ :

^ - ] ;

` - | .

, < > ?

(62)

Tabel 3.2 Ilustrasi Tokenizing

No. Isi Hasil Tokenizing

D1 Bersama Buku Pintar TOEFL ini, Anda bisa benar-benar pintar menguasai TOEFL dalam waktu singkat! bersama buku pintar toefl ini anda bisa benar pintar menguasai dalam waktu singkat D2 Haji adalah sebuah ibadah yang

menuntut pengorbanan total para pelakunya. haji adalah sebuah ibadah yang menuntut pengorbanan total para pelakunya D3 Informasi yang terdapat dalam

Buku Pintar Seri Junior mencakup banyak hal penting.

informasi yang terdapat dalam buku pintar seri junior mencakup banyak hal penting

Q Pintar menguasai TOEFL pintar

menguasai

toefl

B. Analisis Filtering

Filterting adalah Proses mengambil kata-kata penting dari hasil tokenizng. Untuk dapat melakukan proses filtering ini dapat menggunakan algoritma

stop-list (membuang kata yang kurang penting / stop word) atau word-list

(menyimpan kata penting).

Pada penelitian ini, untuk proses filtering digunakan algoritma stop-list

Berikut dibawah ini adalah daftar sebagian kata-kata stop word dari 569 kata yang terdapat dalam database. Jika dalam suatu data buku terdapat kata kata

stop-word, maka sistem secara otomatis akan menghapus kata-kata tersebut.

Tabel 3.3 Daftar Sebagian Stop-word

Daftar Stop Word

yang sudah

mampu tetapi

tentang bisa

(63)

setelah lakukan

semua memang

hampir baik

juga lain

am pernah

antara setiap

dan untuk

ada dari

seperti mendapatkan

jadi punya

karena telah

of mr

mrs …, dan lain-lain

Tabel 3.4 Ilustrasi Filtering

No. Hasil Tokenizing Hasil Filtering

D1 bersama buku pintar toefl ini anda bisa benar pintar menguasai dalam waktu singkat Pintar Toefl Menguasai Waktu

D2 haji adalah sebuah ibadah yang menuntut pengorbanan total para pelakunya haji ibadah menuntut pengorbanan total pelakunya D3 informasi

yang terdapat dalam buku pintar seri junior mencakup banyak hal penting informasi terdapat pintar seri junior mencakup

Q pintar

menguasai

toefl pintar

menguasai toefl

(64)

C. Analisis Stemming

Stemming adalah proses mencari kata dasar dari tiap kata hasil filtering. Pada penelitian ini digunakan algoritma Nazief & Adriani[23] untuk melakukan proses stemming.

Pada dasarnya, algoritma ini mengelompokkan imbuhan ke dalam beberapa kategori sebagai berikut:

1. Inflection Suffixes yakni kelompok-kelompok akhiran yang tidak mengubah bentuk kata dasar. Kelompok ini dapat dibagi menjadi dua:

a. Particle (P) atau partikel, termasuk di dalamnya adalah partikel “-lah”, “-kah”, “-tah”, dan “-pun”.

b. Possessive Pronoun (PP) atau kata ganti kepunyaan, termasuk di dalamnya adalah “-ku” , “-mu”, dan “-nya”.

2. Derivation Suffixes (DS) yakni kumpulan akhiran yang secara langsung dapat ditambahkan pada kata dasar. Termasuk di dalam tipe ini adalah akhiran “-i”, “-kan”, dan “-an”.

3. Derivation Prefixes (DP) yakni kumpulan awalan yang dapat langsung diberikan pada kata dasar murni, atau pada kata dasar yang sudah mendapatkan penambahan sampai dengan 2 awalan. Termasuk di dalamnya adalah awalan yang dapat bermorfologi (“me-”, “be-”, “pe-”, dan “te-”) dan awalan yang tidak bermorfologi (“di-”, “ke-” dan “se-”).

Pada tabel 3.5, merupakan aturan pemenggalan jika kata berhimbuhan tidak termasuk ke dalam kategori manapun. Simbol C merupakan konsonan, V menandakan vokal, A merupakan vokal atau konsonan, dan P merupakan partikel.

(65)

Tabel 3.5 Aturan Pemenggalan Awalan

Aturan Format Kata Pemenggalan

1 berV… ber-V... | be-rV...

2 berCAP… ber-CAP... dimana C!=‟r‟ & P!=‟er‟

3 berCAerV... ber-CaerV... dimana C!=‟r‟

4 belajar bel-ajar

5 beC1erC2... be-C1erC2... dimana C1!={‟r‟|‟l‟}

6 terV... ter-V... | te-rV...

7 terCerV... ter-CerV... dimana C!=‟r‟

8 terCP... ter-CP... dimana C!=‟r‟ dan P!=‟er‟

9 teC1erC2... te-C1erC2... dimana C1!=‟r‟

10 me{l|r|w|y}V... me-{l|r|w|y}V...

11 mem{b|f|v}... mem-{b|f|v}...

12 mempe... mem-pe...

13 mem{rV|V}... me-m{rV|V}... |me-p{rV|V}…

14 men{c|d|j|z}... men-{c|d|j|z}...

15 menV... me-nV... | me-tV

16 meng{g|h|q|k}... meng-{g|h|q|k}...

17 mengV... meng-V... | meng-kV...

18 menyV... meny-sV...

19 mempV... mem-pV... dengan V!=‟e‟

20 pe{w|y}V... pe-{w|y}V...

21 perV... per-V... | pe-rV...

22 perCAP per-CAP... dimana C!=‟r‟ dan P!=‟er‟

23 perCAerV... per-CAerV... dimana C!=‟r‟

24 pem{b|f|V}... pem-{b|f|V}...

25 pem{rV|V}... pe-m{rV|V}... | pe-p{rV|V}…

26 pen{c|d|j|z}... pen-{c|d|j|z}...

27 penV... pe-nV... | pe-tV...

28 peng{g|h|q}... peng-{g|h|q}...

29 pengV... peng-V... | peng-kV...

30 penyV... peny-sV...

31 pelV...

pe-lV... kecuali “pelajar” yang menghasilkan “ajar”

32 peCerV... per-erV... dimana C!={r|w|y|l|m|n}

33 peCP... pe-CP... dimana C!={r|w|y|l|m|n} dan P!=‟er‟

34 terC1erC2... ter-C1erC2... dimana C1!=‟r‟

(66)

Pada hasil filtering ada beberapa kata yang masih memiliki imbuhan, maka kata-kata tersebut harus diproses lebih lanjut yaitu dengan menggunakan algoritma stemming Nazief dan Adriani. Pada contoh kasus hanya mengambil kata “pengorbanan”. Tahapan yang dilakukan untuk kata “pengorbanan”, dikerjakan dengan langkah-langkah berikut:

Berikut ini adalah contoh-contoh per tahapan dari proses penghilangan imbuhan :

1. Pada awal proses dan setiap langkah menghilangkan imbuhan akan mengecek ke kamus kata dasar, bila kata ditemukan maka proses berhenti. 2. Pada kata “pengorbanan” akan dicek apakah memiliki inflection suffixes,

yaitu akhiran -lah, -kah, -ku, -mu, -nya, -pun, -tah. Ternyata tidak terdapat

inflection suffixes pada kata “pengorbanan”, maka proses selanjutnya dijalankan.

3. Kemudian kata “pengorbanan” dicek apakah memiliki derivation suffixes, yaitu akhiran -i, -an, -kan. Ternyata ditemukan akhiran -an. Maka hapus akhiran -an, sehingga kata menjadi “pengenal”, kemudian sistem mengerjakan pencarian ke database, jika kata “pengenal” ditemukan maka proses berhenti jika tidak maka lanjut pada proses berikutnya.

4. Kata “pengorban” akan dicek, apakah memiliki derivation prefiixes, ternyata kata “pengorban” mengandung derivation prefiixes –pe, sehingga kata menjadi “ngorban”, kemudian sistem mencari kata “ngorban” ke

database jika ditemukan maka kata “ngorban adalah kata dasar dan proses berhenti, jika tidak maka kata “ngorban” kembali menjadi kata “pengorban” dan melanjutkan proses berikutnya.

5. Setelah selesai menjalankan langkah 1 sampai 4, tetapi masih belum

menemukan kata dasar maka tahapan selanjutnya adalah recoding

menggunakan aturan pada tabel 3.4. Kata “pengorban” merupakan kata yang memiliki imbuhan peng- dan diikuti huruf vokal, dengan kondisi tersebut maka aturan yang dipakai adalah aturan nomor 29. Pertama sistem akan memotong kata dengan peng- maka hasilnya menjadi kata “orban”

(1)

Optimisasi Sistem Pencarian

Kasus dan Hasil Uji (Data Normal)

Data Masukan Keyword

Yang Diharapkan Menghitung bobot setiap kata yang terdapat di

keyword, jika ada kata yang sama maka kata diwakili oleh satu nilai bobot saja kemudian nilai bobot

disimpan ke database

Pengamatan Sistem melakukan proses yang diharapkan

Kesimpulan [√] Diterima [ ]Ditolak

Kasus dan Hasil Uji (Data Normal)

Data Masukan Bobot kata

Yang Diharapkan Membaca nilai bobot dari database kemudian ditulis dalam file text dengan format SVM Light dan diberi

(2)

Pengujian Pencarian Menggunakan Vector Space Model

Kasus dan Hasil Uji (Data Normal)

Data Masukan Deskripsi kebutuhan user (query)

Yang Diharapkan Menampilkan maksimal 10 informasi buku yang memiliki tingkat ukuran kemiripan tertinggi dengan query

Pengamatan Sistem melakukan proses yang diharapkan

Kesimpulan [√] Diterima [ ]Ditolak

Kasus Dan Hasil Uji (Data Salah) Data Masukan Kosong atau tidak diisi

Yang Diharapkan Menampilkan pesan kesalahan pencarian

Pengamatan Sistem melakukan proses yang diharapkan

(3)

Pencarian Menggunakan Support Vector Machines

Kasus dan Hasil Uji (Data Normal)

Data Masukan Beberapa data buku yang di-checklist

Yang Diharapkan Menampilkan informasi buku yang relevan terhadap data masukan dan menampilkan kembali data masukan

Pengamatan Sistem melakukan proses yang diharapkan

Kesimpulan [√] Diterima [ ]Ditolak

Kasus Dan Hasil Uji (Data Salah)

Data Masukan Semua data buku di-checklist atau tidak di-checklist

Yang Diharapkan Menampilkan pesan kesalahan pencarian lebih lanjut

Pengamatan Sistem melakukan proses yang diharapkan

(4)

Kesimpulan

1. Metode

Vector Space Model

dan

Support Vector Machines

dapat

diimplementasikan dalam sistem pencarian informasi buku yang dinamis.

2. Pembangunan sistem pencarian informasi buku dapat memepermudah

pengunjung untuk melakukan pencarian informasi buku berdasarkan

representasi kebutuhan pengunjung.

(5)

(6)

Impelementasi Support Vector Machines Untuk Pencarian Informasi Buku Di Perpustakaan Daerah Bandung Provinsi Jawa Barat

Oleh:

RIKI HIDAYAT

10108371

PROGRAM STUDI S1

JURUSAN TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

UNIVERSITAS KOMPUTER INDONESIA

2012

PENCARIAN INFORMASI BUKU DI PERPUSTAKAAN

DAERAH BANDUNG PROVINSI JAWA BARAT

BOOK INFORMATION RETRIEVAL AT LOCAL LIBRARY

BANDUNG WEST JAVA PROVINCE

BAB 2

TINJAUAN PUSTAKA

Optimisasi Sistem Pencarian

Pengujian Pencarian Menggunakan Vector Space Model

Pencarian Menggunakan Support Vector Machines

Kesimpulan

1.

Metode

Vector Space Model

dan

Support Vector Machines

dapat

diimplementasikan dalam sistem pencarian informasi buku yang dinamis.

2.

Pembangunan sistem pencarian informasi buku dapat memepermudah

pengunjung untuk melakukan pencarian informasi buku berdasarkan

representasi kebutuhan pengunjung.

1.

Nelly Indriani W, S.Si., M.T.

2.

Adam Mukharil Bachtiar, S.Kom.

3.

Mira Kania Sabariah, S.T., M.T.

Parts

Dokumen yang terkait

Sistem Informasi Pelayanan Di Badan Perpustakaan Daerah Provinsi Jawa Barat

SISTEM INFORMASI PENDATAAN BUKU PADA PERPUSTAKAAN DAERAH PROVINSI JAWA TENGAH SEMARANG.

Pendeteksian Citra Palsu Dengan Menggunakan Watermarks dan Support Vector Machines.

Aplikasi Support Vector Machines Pada Proses Beamforming.

Kebijakan Digitalisasi Informasi Di Badan Perpustakaan Daerah Provinsi Jawa Barat.

Manajemen Layanan Pojok Jawa Barat dan Buku Langka di Badan Perpustakaan dan Kearsipan Daerah Provinsi Jawa Barat.

Sistem Informasi Manajemen Administrasi Surat di Badan Perpustakaan dan Kearsipan Daerah Provinsi Jawa Barat.

Understanding Support Vector Machines SVMs Classifiers

7.1 Support Vector Machine

question classification menggunakan support vector machines dan stemming

Dokumen yang Anda mencari sudah siap untuk unduhkan