3.1.1. Perancangan Struktur Data Inverted Index
Pada gambar 3.3 berikut ini merupakan model dari struktur data inverted index
yang dibangun :
t
t
t doc
doc doc
doc doc
doc id dok.
Dictionary
termList
Posting list
Linked list
HashMap doc
doc doc
iterator
List Iterator Document
Term Term
Term Document
Document Document
Document Document
Document Document
Document
Gambar 3.3 Model Struktur Data Inverted Index
Pada gambar 3.3 tersebut terdapat 2 komponen utama, yaitu dictionary yang disimpan pada termList untuk menampung term dan postingList menampung
informasi term yaitu id dokumen. TermList dan postingList tersebut merupakan objek yang bertipe LinkedListOrderedUniqueTerm. Hash Map digunakan
untuk memetakan term. LinkedList digunakan untuk menghubungkan antar id dokumen. Sedangkan untuk menghubungkan masing-masing term dan postingList
dengan menggunakan iterator yang disimpan pada iteratorList kelas bawaan Java.
3.1.2. Contoh Data yang Digunakan
Pada gambar 3.4 berikut ini merupakan contoh dokumen undang-undang yang digunakan sebagai data dari Sistem Pemerolehan Informasi Undang-Undang
dan Kasus :
Gambar 3.4 Contoh Dokumen Undang-Undang
Pada gambar 3.4 tersebut, isi dari tentang yaitu “Perlindungan Konsumen”
disimpan per kata ke dalam tabel Kamus_Hukum yang digunakan untuk proses pencarian sub sistem document to document. Kemudian isi dari pasal yaitu
“Dalam Undang-Undang ini yang dimaksud dengan : 1. Perlindungan…..” disimpan per pasal ke dalam table Pasal sebagai koleksi dokumen pasal yang
digunakan untuk proses pencarian sub sistem query to document. Jumlah dokumen pasal yang digunakan sebagai data di sub sistem query to document
yaitu 1942 dokumen .txt yang disimpan di tabel Pasal, terdiri dari 2713 terms yang disimpan di tabel Term_Pasal. Sedangkan contoh dokumen kasus disajikan
pada gambar 3.5 berikut ini :
Gambar 3.5 Contoh Dokumen Kasus
Pada gambar 3.5 tersebut, informasi kasus yang disimpan pada basis data yaitu judul kasus di paling atas, pasal-pasal yang terkait Pasal 45, Pasal 28 UU
No. 11 Tahun 2008, dan file dokumen berekstensi .txt itu sendiri. Jumlah dokumen-dokumen kasus yang digunakan sebagai data pada sub sistem document
to document yaitu 100 dokumen .txt yang tersimpan pada tabel Kasus, terdiri dari 54 terms yang tersimpan pada tabel Term_Kasus. Dokumen-dokumen
tersebut berasal dari artikel-artikel kasus di www.hukumonline.com
.
3.2. Analisa Kebutuhan