Penerapan Temu Balik Informasi untuk Rekomendasi Topik Tugas Akhir (Studi Kasus: Program Studi S1 Teknik Informatika UK Maranatha).

(1)

v

ABSTRAK

Penelitian ini bertujuan untuk memudahkan pencarian dokumen-dokumen yang memiliki hubungan antar kata, bukan hanya pencarian pada judul dokumen saja akan tetapi dapat juga mencari dari isi dokumen tersebut. Dalam penerapannya penelitian ini menggunakan metode Latent Semantic Indexing (LSI) sebagai dasar metodenya. Latent Semantic Indexing (LSI) merupakan metode pengindeksan yang menggunakan teknik matematika yang disebut Singular Value Decomposition (SVD) untuk mengidentifikasi pola dalam hubungan antar istilah. Singular Value Decomposition (SVD) adalah faktorisasi matriks real atau matriks komplek. Sebagai data untuk penelitian ini menggunakan data tugas akhir dari jurusan S1 Teknik Informatika Universitas Kristen Maranatha dari tahun 2003 hingga 2013. Uji coba dilakukan dengan menggunakan beberapa query yang berbeda dan dengan total dokumen yang dibaca antara 10 dokumen dan 20 dokumen. Setelah uji coba dilakukan, dapat dihasilkan pencarian dokumen yang relevan sesuai dengan kata kunci yang dimasukan, dan pemberian rekomendasi kata berbeda antara pembacaan 10 dokumen dan 20 dokumen. Kata Kunci : Latent Semantic Indexing, pencarian, dokumen, Singular Value Decomposition.


(2)

vi

ABSTRACT

This study aims to facilitate the search for documents which have realtionships between words, not just a search on the title of the document but also from the content of the document. In application of this study using Latent Semantic Indexing (LSI) as the base method. Latent Semantic Indexing (LSI) is an indexing method that uses a mathematical technique called Singular Value Decomposition (SVD) to identify patters in the relationships between terms. Singular Value Decomposition (SVD) is a matrix factorization of the real or complex matrix. As the data for this study using data from the final assignment of S1 Computer Science Maranatha Christian Universty from 2003 to 2013. Trial was performed using several different queries and total documents to read between 10 documents and 20 documents. After the trial is done, relevant documents can be generated according to the entered keywords, and recommendations differ between 10 documents and 20 documents to read.


(3)

vii

DAFTAR ISI

LEMBAR PENGESAHAN ... i

PERNYATAAN ORISINALITAS LAPORAN PENELITIAN ... ii

PERNYATAAN PUBLIKASI LAPORAN PENELITIAN... iii

PRAKATA ... iv

ABSTRAK ... v

ABSTRACT ... vi

DAFTAR ISI ... vii

DAFTAR GAMBAR ... x

DAFTAR TABEL ... xi

DAFTAR NOTASI/ LAMBANG ... xiii

DAFTAR SINGKATAN ... xvi

DAFTAR RUMUS... xvii

DAFTAR KODE PROGRAM ... xviii

BAB I PENDAHULUAN... 1

1.1 Latar Belakang ... 1

1.2 Rumusan Masalah ... 1

1.3 Tujuan ... 2

1.4 Batasan Masalah... 2

1.5 Sistematika Penyajian ... 3

BAB II KAJIAN TEORI... 4

2.1 Latent Semantic Indexing (LSI) ... 4

2.2 Singular Value Decomposition (SVD) ... 4

2.3 Stopwrods ... 10

2.4 Indri ... 11

2.5 Total Reciprocal Rank... 13

BAB III ANALISIS DAN DISAIN ... 14

3.1 Arsitektur Perangkat Lunak ... 14

3.2 Use Case... 15


(4)

viii

3.3.1 Use Case Cari Dokumen Tugas Akhir ... 16

3.3.2 Use Case Rekomendasi ... 16

3.3.3 Use Case Indexing... 17

3.3.4 Use Case Refinment Query ... 17

3.4 Activity Diagram ... 18

3.4.1 Activity Diagram Cari Dokumen Tugas Akhir ... 18

3.4.2 Activity Diagram Melihat Topik Terkait... 19

3.4.3 Activity Diagram Indexing ... 19

3.4.4 Activity Diagram Refinment Query ... 20

3.5 Entity Relationship Diagram (ERD) ... 21

3.6 Gambaran Keseluruhan ... 22

3.6.1 Persyaratan Antarmuka Eksternal ... 22

3.6.2 Antarmuka dengan Pengguna ... 22

3.6.3 Antarmuka Perangkat Keras ... 23

3.6.4 Antarmuka Perangkat Lunak... 23

3.6.5 Fitur-fitur Produk Perangkat Lunak ... 23

3.6.6 Fitur Rekomendasi ... 26

3.7 Disain Antarmuka ... 28

3.7.1 Main Form ... 28

3.7.2 Form Configuration ... 29

BAB IV PENGEMBANGAN PERANGKAT LUNAK ... 30

4.1 Implementasi Class/Modul... 30

4.2 Implementasi Penyimpanan Data ... 31

4.3 Implementasi Antarmuka ... 31

4.3.1 Menu Utama ... 31

4.3.2 Menu Konfigurasi ... 32

4.4 Pseudocode ... 33

4.5 Penjelasan Arsitektur Perangkat Lunak ... 34

4.5.1 Ubah Dokumen dari bentuk PDF menjadi file text ... 34

4.5.2 Membuang Stopwords ... 35

4.5.3 Melakukan Latent Semantic Indexing (LSI) ... 37


(5)

ix

4.5.5 Searching ... 41

BAB V TESTING DAN EVALUASI SISTEM ... 45

5.1 Rencana Pengujian ... 45

5.1.1 Pengujian 1 ... 45

5.1.2 Pengujian Waktu ... 46

5.1.3 Pengujian Query ... 47

5.1.4 Pengujian Rekomendasi ... 86

5.1.5 Total Reciprocal Rank... 93

5.2 Pelaksanaan Pengujian ... 93

5.2.1 Pengujian Menu Utama ... 93

5.2.2 Pengujian Menu Konfigurasi ... 95

BAB VI SIMPULAN DAN SARAN ... 96

6.1 Kesimpulan ... 96

6.2 Saran ... 96


(6)

x

DAFTAR GAMBAR

Gambar 2.1 Matriks A... 6

Gambar 2.2 Menemukan Singular Value dan Eigenvalue ... 6

Gambar 2.3 Menghitung Singular Value ... 7

Gambar 2.4 Eigenvactor... 7

Gambar 2.5 Normalisasi... 7

Gambar 2.6 Matriks V... 8

Gambar 2.7 Matriks U... 8

Gambar 2.8 Reduksi SVD ... 9

Gambar 2.9 Vektor Query ... 10

Gambar 2.10 Cosinus Query ... 10

Gambar 2.11 Indexing Indri ... 11

Gambar 2.12 Searching Indri ... 12

Gambar 3.1 Arsitektur Perangkat Lunak ... 15

Gambar 3.2 Use Case Diagram ... 16

Gambar 3.3 Activity Diagram Cari Dokumen Tugas Akhir ... 18

Gambar 3.4 Activity Diagram Melihat Topik Terkait ... 19

Gambar 3.5 Activity Diagram Indexing ... 20

Gambar 3.6 Refinment Query ... 21

Gambar 3.7 Entity Relationship Diagram (ERD) ... 22

Gambar 3.8 Menu Utama ... 28

Gambar 3.9 Menu Konfiguration ... 29

Gambar 4.1 Class Diagram ... 30

Gambar 4.2 Implementasi Basis Data ... 31

Gambar 4.3 Menu Utama ... 31

Gambar 4.4 Menu Konfigurasi ... 32

Gambar 4.5 Aristektur Perangkat Lunak ... 34

Gambar 4.6 Aplikasi PDFZilla 1.2 ... 35

Gambar 5.1Pengujian 1A ... 45


(7)

xi

DAFTAR TABEL

Tabel 2.1 Contoh TTR ... 13

Tabel 4.1 Contoh daftar stopwords ... 35

Tabel 5.1 Perbedaan waktu pembuatan indeks ... 46

Tabel 5.2 Perbandingan waktu pencarian ... 47

Tabel 5.3 Perbandingan Query 1 ... 47

Tabel 5.4 Perbandingan Qeury 2 ... 50

Tabel 5.5 Perbandingan Query 3 ... 52

Tabel 5.6 Perbandingan Query 4 ... 54

Tabel 5.7 Perbandingan Query 5 ... 57

Tabel 5.8 Perbandingan Query 6 ... 59

Tabel 5.9 Perbandingan Query 7 ... 61

Tabel 5.10 Perbandingan Query 8 ... 63

Tabel 5.11 Perbandingan Query 9 ... 65

Tabel 5.12 Perbandingan Query 10 ... 66

Tabel 5.13 Perbandingan Query 11 ... 68

Tabel 5.14 Perbandingan Query 12 ... 71

Tabel 5.15 Perbandingan Query 13 ... 73

Tabel 5.16 Perbandingan Query 14 ... 75

Tabel 5.17 Perbandingan Query 15 ... 77

Tabel 5.18 Perbandingan Query 16 ... 79

Tabel 5.19 Perbandingan Query 17 ... 80

Tabel 5.20 Perbandingan Query 18 ... 82

Tabel 5.21 Perbandingan Query 19 ... 84

Tabel 5.22 Perbandingan Rekomendasi 1 ... 86

Tabel 5.23 Perbandingan Rekomendasi 2 ... 87

Tabel 5.24 Perbandingan Rekomendasi 3 ... 87

Tabel 5.25 Perbandingan Rekomendasi 4 ... 87

Tabel 5.26 Perbandingan Rekomendasi 5 ... 88

Tabel 5.27 Perbandingan Rekomendasi 6 ... 88


(8)

xii

Tabel 5.29 Perbandingan Rekomendasi 8 ... 89

Tabel 5.30 Perbandingan Rekomendasi 9 ... 89

Tabel 5.31 Perbandingan Rekomendasi 10 ... 89

Tabel 5.32 Perbandingan Rekomendasi 11 ... 90

Tabel 5.33 Perbandingan Rekomendasi 12 ... 90

Tabel 5.34 Perbandingan Rekomendasi 13 ... 90

Tabel 5.35 Perbandingan Rekomendasi 14 ... 91

Tabel 5.36 Perbandingan Rekomendasi 15 ... 91

Tabel 5.37 Perbandingan Rekomendasi 16 ... 91

Tabel 5.38 Perbandingan Rekomendasi 17 ... 92

Tabel 5.39 Perbandingan Rekomendasi 18 ... 92

Tabel 5.40 Perbandingan Rekomendasi 19 ... 92

Tabel 5.41 Hasil Total Reciprocal Rank ... 93

Tabel 5.42 Pengujian menu utama ... 93


(9)

xiii

DAFTAR NOTASI/ LAMBANG

Jenis Notasi/Lambang Nama Arti

UML

UseCase1 Use Case Nama proses

yang ada pada sistem

UML

Actor1

Actor Nama actor yang melakukan proses

UML Communication

Hubungan antara proses (use case) dengan actor

UML «extends» Extends

Pengembangan sebuah proses menjadi use

case lain yang

berbeda UML

<<include>> Include

Menandakan bahwa use case tersebut

menggunakan

use case yang


(10)

xiv

Jenis Notasi/Lambang Nama Arti

UML

Pembelian Barang

Apotek

System

Boundary Kumpulan use case dalam

sebuah sistem besar

ERD Entitas

Bentuk dasar dari model data yang digunakan untuk

melambangkan orang, tenpat, benda, dll

ERD Atribut

Deskripsi karakteristik dari sebuah entitas

ERD Relasi

Hubungan antar entitas

ERD Communication

Garis penghubung entitas dengan relasi Activity Diagram Initial State Awal mula proses


(11)

xv

Jenis Notasi/Lambang Nama Arti

Activity

Diagram

ActionState1

Action State

Proses yang dilakukan oleh sistem/pengguna

Activity Diagram

Final State

Akhir dari sebuah alur

activity Activity

Diagram

Control Flow

Alur antar proses


(12)

xvi

DAFTAR SINGKATAN

LSI = Latent Semantic Indexing SVD = Singular Value Decomposition UML = Unified Modeling Language ERD = Entity Relationship Diagram


(13)

xvii

DAFTAR RUMUS

Rumus 2.1 Rumus SVD ... 4 Rumus 2.2 Rumus reduksi dimensi sebesar k ... 9


(14)

xviii

DAFTAR KODE PROGRAM

Kode Program 4.1 Kode Program Stopwords ... 37

Kode Program 4.2 Kode Program Indexing ... 40

Kode Program 4.3 Save Index ... 41


(15)

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Seiring dengan majunya perkembangan teknologi sekarang, sudah banyak aplikasi untuk melakukan penelusuran dokumen guna mempermudah dan mempersingkat waktu yang dibutuhkan oleh pengguna dalam melakukan pencarian. Akan tetapi sistem pencarian yang disediakan biasanya hanya terbatas untuk melakukan pencarian nama dokumennya saja, sedangkan biasanya pengguna ingin melakukan pencarian dokumen-dokumen yang berkaitan dengan isi dokumen.

Perpustakaan sekarang ini hanya menerapkan pencarian berdasarkan judul artikel atau judul buku saja, khususnya di perpustakaan Universitas Kristen Maranatha. Untuk mempercepat dan menambah keakuratan pencarian agar sesuai dengan keinginan pencari, maka dibuatlah aplikasi pencarian untuk melakukan pencarian bukan hanya pada judul Tugas Akhir saja namun dapat juga melakukan pencarian dari isi dokumennya juga. Dalam penerapannya aplikasi ini akan menggunakan metode Latent Semantic Indexing (LSI) dalam melakukan pengambilan informasi dari dokumen-dokumen yang ada. Latent Semantic

Indexing (LSI) dapat menghasilkan hubungan antar kata atau disebut juga dengan semantic sehingga LSI tidak memerlukan pencocokan yang sama persis untuk

kalimat query agar dapat menghasilkan dokumen yang relevan. Dengan menggunakan metode LSI dimungkinkan untuk melakukan pencarian berdasarkan kata kunci atau frasa dari isi dokumen, selain itu juga LSI dapat melakukan penyaringan kata-kata yang tidak perlu, sehingga dapat mendekati permintaan pencarian.

1.2 Rumusan Masalah

Berdasarkan latar belakang masalah yang telah dijabarkan, perpustakaan Universitas Kristen Maranatha masih menggunakan cara lama untuk melakukan pencarian khususnya pencarian topik tugas akhir dan belum dapat memberikan


(16)

2

referensi topik lain yang berhubungan dengan topik yang sedang dicari. Sehingga dapat dirumuskan masalah - masalah yang terdapat di perpustakaan Universitas Kristen Maranatha adalah :

1. Bagaimana cara untuk dapat melakukan pencarian pada judul tugas akhir atau isi dokumen abstrak tugas akhir ?

2. Bagaimana memanfaatkan hasil penelusuran isi dokumen untuk memberikan rekomendasi topik yang terkait ?

1.3 Tujuan

Berdasarkan latar belakang dan rumusan masalah, maka dapat diambil tujuan pembahasannya antara lain :

1. Menyediakan fasilitas yang menerapkan temu balik informasi untuk pencarian topik tugas akhir di perpustakaan Universitas Kristen Maranatha yang mencakup isi dokumen.

2. Membuat Aplikasi untuk melakukan pencarian dokumen dengan menerapkan metode Latent Semantic Indexing untuk memberikan rekomendasi topik yang terkait dengan topik yang dicari.

1.4 Batasan Masalah

Agar masalah tidak meluas, masalah yang akan dibahas disini adalah : 1. Bagaimana menerapkan fasilitas temu balik informasi dengan

menggunakan metode Latent Semantic Indexing di perpustakaan Universitas Kristen Maranatha untuk mempermudah pengguna dalam mencari topik tugas akhir dan dapat memberikan rekomendasi topik terkait.

2. Data yang digunakan adalah dokumen tugas akhir yang dikumpulkan pada tahun 2006-2013 di Fakultas Teknologi Informasi Jurusan S1 Teknik Informatika.

3. Ukuran indeks yang digunakan seluruh dokumen yang ada, dan hanya bagian abstract saja yang akan dijadikan indeks.

4. Kata kunci yang akan digunakan untuk testing pencarian diambil dari mata kuliah pilihan yang ada di Fakultas Teknologi Informasi Jurusan S1


(17)

3

Teknik Informatika, yang diacu pada buku panduan mahasiswa jurusan S1 Teknik Informatika Tahun Akademik 2012/2013.

1.5 Sistematika Penyajian

Sistematika pembahasan dari penyusunan laporan ini adalah sebagai berikut:

BAB I. Pendahuluan

Bab ini berisi tentang pendahuluan yang terdiri dari latar belakang, rumusan masalah, tujuan, batasan masalah, dan sistematika penyajian laporan tugas akhir.

BAB II. Kajian Teori

Bab ini berisi tentang penjelasan teori-teori yang berkaitan dengan pembuatan dan pendukung perangkat lunak.

BAB III. Analisis dan Disain

Bab ini berisi tentang penjelasan analisis, gambaran arsitektur keseluruhan, dan disain perangkat lunak.

BAB IV. Pengembangan Perangkat Lunak

Bab ini berisi tentang penjelasan perencanaan tahap implementasi modul dan penyimpanan data, penjelasan mengenai analisis dari algoritma yang digunakan.

BAB V. Testing dan Evaluasi Sistem

Bab ini berisi tentang penjelasan rencana pengujian perangkat lunak serta testing yang akan dilakukan.

BAB VI. Kesimpulan dan Saran

Bab ini berisi kesimpulan dari pembahasan pada perancangan perangkat lunak serta analisa pengujian aplikasi yang telah dibuat.


(18)

98

BAB VI

SIMPULAN DAN SARAN

6.1 Kesimpulan

Berdasarkan hasil pembahasan diatas dan hasil yang telah dicapai dalam pembuatan aplikasi ini, maka dapat ditarik kesimpulan sebagai berikut :

1. Telah berhasil dibuat sebuah aplikasi yang dapat melakukan pencarian tugas akhir dengan menggunakan metode Latent Semantic Indexing (LSI).

2. Aplikasi dapat melakukan tahap pre-processing dan indexing, memberikan rekomendasi kata, serta melakukan pencarian dokumen relevan.

3. Setelah dilakukan pengujian pada aplikasi lain yaitu Indri, waktu yang dibutuhkan oleh aplikasi (LSI) untuk melakukan indexing dan searching lebih lama. Hal ini disebabkan aplikasi Indri menerapkan language modeling dan

inference network sebagai dasar modelnya. Aplikasi Indri juga menerapkan

metode clustering dari koleksi lokal ketika melakukan proses pencarian. Hasil pengujian dapat dilihat pada Tabel 5.1 dan Tabel 5.2.

4. Dari hasil pengujian query pada aplikasi Indri dan LSI, terdapat kesamaan dokumen relevan yang dihasilkan meskipun metode yang digunakan berbeda. Hasil pengujian dapat dilihat pada Tabel 5.3 - Tabel 5.8.

5. Dari hasil pengujian untuk perbandingan rekomendasi, ada ketidaksamaan kata yang dihasilkan pada masing-masing aplikasi untuk setiap layer. Hal ini disebabkan hasil yang diperoleh dari masing-masing aplikasi tersebut memberikan dokumen relevan yang tidak selalu sama, sehingga mempengaruhi pemberian rekomendasi kata. Hasil pengujian dapat dilihat pada Tabel 5.22 - Tabel 5.24.

6.2 Saran

Untuk mengembangkan aplikasi ini agar lebih baik lagi maka dapat dilakukan beberapa hal sebagai berikut :

1. Mengubah metode dalam melakukan pencarian rekomendasi agar waktu yang dibutuhkan untuk pencarian tidak terlalu lama.

2. Memperbaiki algoritma untuk pembuatan indeks agar waktu yang dibutuhkan lebih cepat.


(19)

99

3. Memberikan visualisasi keterkaitan kata-kata pada rekomendasi dengan kata kunci pencarian, sehingga dapat diketahui sebaran katanya.

4. Menggabungkan hasil dokumen relevan dari Indri dan LSI untuk memberikan rekomendasi kata yang lebih baik.


(20)

100

DAFTAR PUSTAKA

Deerwester, S. (1988). Improving Information Retrieval with Latent Semantic Indexing. In Proceedings of the 51st Annual Meeting of the American Society

for Information Science 25 (pp. 36-40).

Konchady, M. (2006). Text Mining Applcation Programming. Boston, Massachusetts: Charles River Media.

Kontostathis, A. (n.d.). Essential Dimensions of Latent Semantic Indexing (LSI).

Essential Dimensions of Latent Semantic Indexing (LSI).

Kowalski, G. (2011). Information Retrieval Architecture and Algorithms. Springer US.

Landauer, T., & et, a. (1998). Learning Human-like Knowledge by Singular Value Decomposition. Cambridge: MIT Press.

Metzler, D., Strohman, T., Turtle, H., & Croft, W. B. (2004). Indri at TREC 2004: T erabyte Track.

Strang, G. (2006). Linear Algebra and its Applications. Cengage Learning.

Tala, F. Z. (2003). A Study of Steamming Effects on Information Retrieval in Bahasa Indonesia.

Voorhees, E. (1999). Proceedings of the 8th Text Retrieval Conference. TREC-8


(1)

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Seiring dengan majunya perkembangan teknologi sekarang, sudah banyak aplikasi untuk melakukan penelusuran dokumen guna mempermudah dan mempersingkat waktu yang dibutuhkan oleh pengguna dalam melakukan pencarian. Akan tetapi sistem pencarian yang disediakan biasanya hanya terbatas untuk melakukan pencarian nama dokumennya saja, sedangkan biasanya pengguna ingin melakukan pencarian dokumen-dokumen yang berkaitan dengan isi dokumen.

Perpustakaan sekarang ini hanya menerapkan pencarian berdasarkan judul artikel atau judul buku saja, khususnya di perpustakaan Universitas Kristen Maranatha. Untuk mempercepat dan menambah keakuratan pencarian agar sesuai dengan keinginan pencari, maka dibuatlah aplikasi pencarian untuk melakukan pencarian bukan hanya pada judul Tugas Akhir saja namun dapat juga melakukan pencarian dari isi dokumennya juga. Dalam penerapannya aplikasi ini akan menggunakan metode Latent Semantic Indexing (LSI) dalam melakukan pengambilan informasi dari dokumen-dokumen yang ada. Latent Semantic Indexing (LSI) dapat menghasilkan hubungan antar kata atau disebut juga dengan semantic sehingga LSI tidak memerlukan pencocokan yang sama persis untuk kalimat query agar dapat menghasilkan dokumen yang relevan. Dengan menggunakan metode LSI dimungkinkan untuk melakukan pencarian berdasarkan kata kunci atau frasa dari isi dokumen, selain itu juga LSI dapat melakukan penyaringan kata-kata yang tidak perlu, sehingga dapat mendekati permintaan pencarian.

1.2 Rumusan Masalah

Berdasarkan latar belakang masalah yang telah dijabarkan, perpustakaan Universitas Kristen Maranatha masih menggunakan cara lama untuk melakukan pencarian khususnya pencarian topik tugas akhir dan belum dapat memberikan


(2)

referensi topik lain yang berhubungan dengan topik yang sedang dicari. Sehingga dapat dirumuskan masalah - masalah yang terdapat di perpustakaan Universitas Kristen Maranatha adalah :

1. Bagaimana cara untuk dapat melakukan pencarian pada judul tugas akhir atau isi dokumen abstrak tugas akhir ?

2. Bagaimana memanfaatkan hasil penelusuran isi dokumen untuk memberikan rekomendasi topik yang terkait ?

1.3 Tujuan

Berdasarkan latar belakang dan rumusan masalah, maka dapat diambil tujuan pembahasannya antara lain :

1. Menyediakan fasilitas yang menerapkan temu balik informasi untuk pencarian topik tugas akhir di perpustakaan Universitas Kristen Maranatha yang mencakup isi dokumen.

2. Membuat Aplikasi untuk melakukan pencarian dokumen dengan menerapkan metode Latent Semantic Indexing untuk memberikan rekomendasi topik yang terkait dengan topik yang dicari.

1.4 Batasan Masalah

Agar masalah tidak meluas, masalah yang akan dibahas disini adalah : 1. Bagaimana menerapkan fasilitas temu balik informasi dengan

menggunakan metode Latent Semantic Indexing di perpustakaan Universitas Kristen Maranatha untuk mempermudah pengguna dalam mencari topik tugas akhir dan dapat memberikan rekomendasi topik terkait.

2. Data yang digunakan adalah dokumen tugas akhir yang dikumpulkan pada tahun 2006-2013 di Fakultas Teknologi Informasi Jurusan S1 Teknik Informatika.

3. Ukuran indeks yang digunakan seluruh dokumen yang ada, dan hanya bagian abstract saja yang akan dijadikan indeks.

4. Kata kunci yang akan digunakan untuk testing pencarian diambil dari mata kuliah pilihan yang ada di Fakultas Teknologi Informasi Jurusan S1


(3)

3

Teknik Informatika, yang diacu pada buku panduan mahasiswa jurusan S1 Teknik Informatika Tahun Akademik 2012/2013.

1.5 Sistematika Penyajian

Sistematika pembahasan dari penyusunan laporan ini adalah sebagai berikut:

BAB I. Pendahuluan

Bab ini berisi tentang pendahuluan yang terdiri dari latar belakang, rumusan masalah, tujuan, batasan masalah, dan sistematika penyajian laporan tugas akhir.

BAB II. Kajian Teori

Bab ini berisi tentang penjelasan teori-teori yang berkaitan dengan pembuatan dan pendukung perangkat lunak.

BAB III. Analisis dan Disain

Bab ini berisi tentang penjelasan analisis, gambaran arsitektur keseluruhan, dan disain perangkat lunak.

BAB IV. Pengembangan Perangkat Lunak

Bab ini berisi tentang penjelasan perencanaan tahap implementasi modul dan penyimpanan data, penjelasan mengenai analisis dari algoritma yang digunakan.

BAB V. Testing dan Evaluasi Sistem

Bab ini berisi tentang penjelasan rencana pengujian perangkat lunak serta testing yang akan dilakukan.

BAB VI. Kesimpulan dan Saran

Bab ini berisi kesimpulan dari pembahasan pada perancangan perangkat lunak serta analisa pengujian aplikasi yang telah dibuat.


(4)

98

BAB VI

SIMPULAN DAN SARAN

6.1 Kesimpulan

Berdasarkan hasil pembahasan diatas dan hasil yang telah dicapai dalam pembuatan aplikasi ini, maka dapat ditarik kesimpulan sebagai berikut :

1. Telah berhasil dibuat sebuah aplikasi yang dapat melakukan pencarian tugas akhir dengan menggunakan metode Latent Semantic Indexing (LSI).

2. Aplikasi dapat melakukan tahap pre-processing dan indexing, memberikan rekomendasi kata, serta melakukan pencarian dokumen relevan.

3. Setelah dilakukan pengujian pada aplikasi lain yaitu Indri, waktu yang dibutuhkan oleh aplikasi (LSI) untuk melakukan indexing dan searching lebih lama. Hal ini disebabkan aplikasi Indri menerapkan language modeling dan inference network sebagai dasar modelnya. Aplikasi Indri juga menerapkan metode clustering dari koleksi lokal ketika melakukan proses pencarian. Hasil pengujian dapat dilihat pada Tabel 5.1 dan Tabel 5.2.

4. Dari hasil pengujian query pada aplikasi Indri dan LSI, terdapat kesamaan dokumen relevan yang dihasilkan meskipun metode yang digunakan berbeda. Hasil pengujian dapat dilihat pada Tabel 5.3 - Tabel 5.8.

5. Dari hasil pengujian untuk perbandingan rekomendasi, ada ketidaksamaan kata yang dihasilkan pada masing-masing aplikasi untuk setiap layer. Hal ini disebabkan hasil yang diperoleh dari masing-masing aplikasi tersebut memberikan dokumen relevan yang tidak selalu sama, sehingga mempengaruhi pemberian rekomendasi kata. Hasil pengujian dapat dilihat pada Tabel 5.22 - Tabel 5.24.

6.2 Saran

Untuk mengembangkan aplikasi ini agar lebih baik lagi maka dapat dilakukan beberapa hal sebagai berikut :

1. Mengubah metode dalam melakukan pencarian rekomendasi agar waktu yang dibutuhkan untuk pencarian tidak terlalu lama.

2. Memperbaiki algoritma untuk pembuatan indeks agar waktu yang dibutuhkan lebih cepat.


(5)

99

3. Memberikan visualisasi keterkaitan kata-kata pada rekomendasi dengan kata kunci pencarian, sehingga dapat diketahui sebaran katanya.

4. Menggabungkan hasil dokumen relevan dari Indri dan LSI untuk memberikan rekomendasi kata yang lebih baik.


(6)

100

DAFTAR PUSTAKA

Deerwester, S. (1988). Improving Information Retrieval with Latent Semantic Indexing. In Proceedings of the 51st Annual Meeting of the American Society for Information Science 25 (pp. 36-40).

Konchady, M. (2006). Text Mining Applcation Programming. Boston, Massachusetts: Charles River Media.

Kontostathis, A. (n.d.). Essential Dimensions of Latent Semantic Indexing (LSI). Essential Dimensions of Latent Semantic Indexing (LSI).

Kowalski, G. (2011). Information Retrieval Architecture and Algorithms. Springer US.

Landauer, T., & et, a. (1998). Learning Human-like Knowledge by Singular Value Decomposition. Cambridge: MIT Press.

Metzler, D., Strohman, T., Turtle, H., & Croft, W. B. (2004). Indri at TREC 2004: T erabyte Track.

Strang, G. (2006). Linear Algebra and its Applications. Cengage Learning.

Tala, F. Z. (2003). A Study of Steamming Effects on Information Retrieval in Bahasa Indonesia.

Voorhees, E. (1999). Proceedings of the 8th Text Retrieval Conference. TREC-8 Question Answering Track Report, 77-82.