Rumusan Masalah Tujuan Batasan Masalah Sistematika Penulisan

2 pengurutan data tidak diutamakan. Posting List memerlukan struktur data penyimpanan yang terurut dan dinamis, Ordered Linked List diimplementasikan untuk Posting List karena ukuran Linked List yang dapat melebar menyesuaikan data yang ditambahkan. Ordered Linked List berdasarkan pada Linked List dengan penambahan pengurutan data Robert, 2003. Pencarian dokumen makalah ilmiah yang sudah ada sebagian besar menghasilkan informasi berdasarkan abstrak, judul,pengarang, penerbit, dan subjek makalah. bukan seluruh isi makalah. Peneliti mengembangkan Sistem Pemerolehan Informasi untuk dokumen makalah berbahasa Indonesia menggunakan seluruh isi teks dokumen.

1.2. Rumusan Masalah

Dari latar belakang di atas dapat dirumuskan beberapa masalah yang akan dikaji, yaitu: 1. Sejauh mana performa struktur data Hash dan LinkedList terhadap pencarian dokumen? 2. Bagaimana sistem temu balik informasi ini dapat menghasilkan dokumen yang relevan yang teranking berdasarkan query masukan oleh pengguna? 3. Seberapa relevankah dokumen hasil dari metode pembobotan TD-IDF yang dihasilkan terhadap query pengguna? 3

1.3. Tujuan

Penelitian ini bertujuan untuk mengimplementasikan sistem pemerolehan informasi untuk pencarian makalah ilmiah berbahasa Indonesia menggunakan seluruh isi teks makalah ilmiah dan mengetahui unjuk kerja sistem yang menggunakan Inverted Index klasik dengan struktur data Hash Table dan Ordered LinkedList dengan operasi boolean dasar

1.4. Batasan Masalah

1. Sistem ini berfokus pada dokumen berbahasa Indonesia yang mengandung format Portable Document FormatPDF. 2. Dokumen hasil Query yang akan dipilih user telah tersedia dalam indeks sistem dan merupakan bagian dari koleksi pengujian sebanyak 281 dokumen berbahasa Indonesia. 3. Koleksi pengujian diambil dari kolesi dokumen makalah ilmiah berbahasa Indonesia. 4. Sistem tidak menggunakan DBMS untuk indeks kata dalam pencarian. 4

1.5. Metodologi Penelitian

Dalam penelitian ini dilakukan tahap-tahap penelitian sebagai berikut: 1. Studi Pustaka Studi pustaka penerapan inverted index klasik menggunakan pembobotan TF-IDF dengan operasi AND. 2. Pengumpulan Data Pengumpulan dokumen-dokumen makalah ilmiah yang berbahasa Indonesia sebagai corpus sebanyak 281 dokumen. 3. Implementasi Implementasi penerapan TF-IDF dan struktur data classical yaitu Inverted Index yang berbasis pada Hash dan Ordered LinkedList untuk mendukung inverted index dengan menggunakan rumus pembobotan Savoy.

4. Pengujian

Pengujian relevansi pencarian menggunakan recall precision dan Pengamatan unjuk kerja waktu query dengan operasi AND dengan dua belas kelompok kata yang mengandung frekuensi dokumen tertentu. Kelompok kata tersebut adalah kelompok kata yang memiliki dfk 1 sampai 2, dfk mendekati 140, dan dfk kurang lebih 280, 1 kata kunci pencarian hingga 4 kata kunci pencarian. 5

1.6. Sistematika Penulisan

Sistematika penulisan dan penyusunan tugas akhir ini dibagi menjadi 6 enam bab, yaitu : BAB I PENDAHULUAN Bab ini berisi penjelasan tentang latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, metodologi penelitian, dan sistematika dari penulisan tugas akhir. BAB II LANDASAN TEORI Bab ini berisi penjelasan tentang teori-teori yang berkaitan dengan penulisan tugas akhir. BAB III ANALISIS DAN PERANCANGAN SISTEM Bab ini berisi penjelasan mengenai identifikasi masalah yang ada, kerja dari sistem yang ada, dan analisis sistem yang meliputi analisis masalah dalam sistem lama dan analisis kebutuhan sistem baru. Terdapat pula perancangan sistem meliputi perancangan proses, perancangan basisdata, dan perancangan antarmuka untuk para pengguna sistem. BAB IV IMPLEMENTASI SISTEM Bab ini berisi implementasi dari sistem yang sudah dirancang BAB V ANALISA HASIL Bab ini berisi pengujian terhadap sistem yang telah diimplementasikan 6 BAB VI KESIMPULAN DAN SARAN Bab ini berisi tentang kesimpulan dan saran dari analisis dan perancangan sistem yang telah dilakukan dalam tugas akhir ini. 7

Bab II Landasan Teori

2.1 Information Retrieval

Sistem temu kembali informasi information retrieval system merupakan sistem untuk menemukan kembali retrieve informasi-informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis. Penekanannya ada pada penemukembalian informasi yang sifatnya tidak terstruktur. Salah satu contoh dari sistem temu kembali informasi adalah search-engine atau mesin pencarian Mandala,2004. Tujuan yang harus dipenuhi dari Sistem temu kembali informasi adalah bagaimana mendapatkan dokumen relevan dan tidak mendapatkan dokumen yang tidak relevan. Tujuan lainnya adalah bagaimana menyusun dokumen yang telah didapatkan tersebut ditampilkan terurut dari dokumen yang memiliki tingkat relevansi lebih tingi ke tingkat relevansi rendah. Penyusunan dokumen terurut tersebut disebut sebagai perangkingan dokumen. Dokumen diwakili melalui set index term.Index term menyediakan logical view dari dokumen Jika kolesi dokumen cukup besar komputer akan melakukan pengurangan jumlah set term melalui penghapusan stopwords ,operasi stemming. Operasi teks tersebut akan mengurangi kompleksitas dari dokumen dan mengubah logical view dari full text ke set