Perancangan Struktur Data Inverted Index Contoh Data yang Digunakan

3.1.1. Perancangan Struktur Data Inverted Index

Pada gambar 3.3 berikut ini merupakan model dari struktur data inverted index yang dibangun : t t t doc doc doc doc doc doc id dok. Dictionary termList Posting list Linked list HashMap doc doc doc iterator List Iterator Document Term Term Term Document Document Document Document Document Document Document Document Gambar 3.3 Model Struktur Data Inverted Index Pada gambar 3.3 tersebut terdapat 2 komponen utama, yaitu dictionary yang disimpan pada termList untuk menampung term dan postingList menampung informasi term yaitu id dokumen. TermList dan postingList tersebut merupakan objek yang bertipe LinkedListOrderedUniqueTerm. Hash Map digunakan untuk memetakan term. LinkedList digunakan untuk menghubungkan antar id dokumen. Sedangkan untuk menghubungkan masing-masing term dan postingList dengan menggunakan iterator yang disimpan pada iteratorList kelas bawaan Java.

3.1.2. Contoh Data yang Digunakan

Pada gambar 3.4 berikut ini merupakan contoh dokumen undang-undang yang digunakan sebagai data dari Sistem Pemerolehan Informasi Undang-Undang dan Kasus : Gambar 3.4 Contoh Dokumen Undang-Undang Pada gambar 3.4 tersebut, isi dari tentang yaitu “Perlindungan Konsumen” disimpan per kata ke dalam tabel Kamus_Hukum yang digunakan untuk proses pencarian sub sistem document to document. Kemudian isi dari pasal yaitu “Dalam Undang-Undang ini yang dimaksud dengan : 1. Perlindungan…..” disimpan per pasal ke dalam table Pasal sebagai koleksi dokumen pasal yang digunakan untuk proses pencarian sub sistem query to document. Jumlah dokumen pasal yang digunakan sebagai data di sub sistem query to document yaitu 1942 dokumen .txt yang disimpan di tabel Pasal, terdiri dari 2713 terms yang disimpan di tabel Term_Pasal. Sedangkan contoh dokumen kasus disajikan pada gambar 3.5 berikut ini : Gambar 3.5 Contoh Dokumen Kasus Pada gambar 3.5 tersebut, informasi kasus yang disimpan pada basis data yaitu judul kasus di paling atas, pasal-pasal yang terkait Pasal 45, Pasal 28 UU No. 11 Tahun 2008, dan file dokumen berekstensi .txt itu sendiri. Jumlah dokumen-dokumen kasus yang digunakan sebagai data pada sub sistem document to document yaitu 100 dokumen .txt yang tersimpan pada tabel Kasus, terdiri dari 54 terms yang tersimpan pada tabel Term_Kasus. Dokumen-dokumen tersebut berasal dari artikel-artikel kasus di www.hukumonline.com .

3.2. Analisa Kebutuhan