55
Proses yang hanya dapat dilakukan admin yang sudah melakukan proses login. Pada
proses ini admin melakukan upload dokumen berita ke database berita.
3. Proses Pencarian Dokumen Merupakan proses utama dimana proses
pencarian dokumen berita terjadi. Untuk proses yang lebih detail dapat dilihat pada
gambar 3.3
Pada data flow diagram level 1 , proses pencarian dilakukan dengan memproses
query yang dimasukan user. 1. Pada proses preprocessing, akan dilakukan
preprocess pada query dan isi dari dokumen berita. Proses ini akan
menghasilkan term list. 2. Kemudian pada proses feature selection
akan dilakukan penghitungan DocId, Count, Bobot dan PanjangUnit. Dari
proses ini dihasilkan vector dokumen yang telah dinormalisasi.
3. Kemudian dilakukan perhitungan kemiripan antar dokumen pada proses 3.3.
4. Setelah itu dokumen berita akan diklaster pada proses 3.5 menghasilkan cluster-
cluster dokumen. Setiap cluster memiliki 1 dokumen sebagai perwakilan yang disebut
medoid.
5. Medoid masing-masing cluster akan dihitung nilai kemiripannya dengan query
pada proses 3.6. medoid yang memiliki nilai kemiripan lebih dari 0 akan
ditampilkan sebagai hasil pencarian
Gambar 3.3 DFD Level 1
3.2 Flowchart Sistem
Proses pencarian dokumen berita dapat dilihat pada gambar 3.3. Pada tahap awal
dilakukan tahap preprocessing terhadap keyword dan dokumen. Proses ini akan
menghasilkan Term List. Kemudian term list ini akan dilakukan feature selection, seperti
menghitung Tf dan Df dokumen, menghitung Idf, membuat model ruang vector, menghitung
bobot kata dan menormalisasi vector dokumen. Setelah dihasilkan vector dokumen
ternormalisasi, proses clustering akan dilakukan.
Gambar 3.3 Flowchart Sistem Proses clustering dimaksudkan untuk
meningkatkan efektifitas retrieval dari mesin pencari. Pada model inverted file search hasil
pencarian disajikan berupa daftar panjang dokumen yang “dianggap” relevan oleh
sistem. Pada kenyatannya karena pengukuran similaritas hanya dilakukan antara query
dengan dokumen dan ranking dalam daftar jawaban search result adalah didasarkan pada
tingkat similaritas query-dokumen tanpa melihat similaritas antar dokumen maka kasus
yang sering terjadi adalah dokumen yang sebenarnya relevan terhadap query karena
kebetulan frekuensi kata querynya kecil akan berada pada ranking bawah. Sebaliknya suatu
dokumen yang sebenarnya tidak relvan terhadap query karena kebetulan mengandung
56
kata query dengan frekuensi besar akan berada pada ranking atas.
Gambar 3.4 Flowchart Clustering PAM
3.3 Rancangan Database
Database yang digunakan dalam sistem ini adalah databse mysql dengan 8 tabel
di antaranya : 1. Tabel “buku”
Tabel koleksi dokumen berita 2. Tabel “indeks”
Tabel hasil proses indexing. 3. Tabel “jarakdoc”
Tabel jarak antara dokumen berita 4. Tabel “kmedoid”
Tabel medoid dan jarak medoid dengan keyword
5. Tabel “query” Tabel keyword yang dimasukan user
6. Tabel “queryindeks” Tabel hasil indexing keyword
7. Tabel “tb_katadasar” Tabel kumpulan kata dasar bahasa
Indonesia 8. Tabel “vektor”
Tabel vektor dokumen berita
3.4 Hasil Pembahasan 3.4.1 Tampilan Antarmuka
Tampilan antarmuka penguna dalam sistem ini dibuat berbasis web dengan
menggunakan bahasa pemrograman PHP. Tampilan indeks pada sistem ini adalah
halaman pencarian. Untuk dapat menambahkan dokumen berita, administrator
harus melalui proses login administrator. Adapun tampilan antarmuka dari system
pencarian ini adalah sebagai berikut.
1.
Tampilan Halaman Pencarian Gambar 3.5 merupakan tampilan dari
halaman pencarian.
Gambar 3.5 Tampilan Halaman Pencarian Pada halaman ini , user memasukan
keyword pencarian, kemudian memilih menggunakan model IFS atau menggunakan
PAM sebagai teknik penyajian. Jika user memilih PAM, maka hasil pencarian akan
dikelompokan sesuai dengan hasil clustering seperti yang ditampilkan pada gambar 3.6
Gambar 3.6 Tampilan grup pada hasil pencarian menggunakan metode PAM
2.
Halaman Utama Administrator Pada halaman insert dokumen,
terdapat menu menambahkan dokumen berita, mengedit berita dan menghapus berita. Namun
sebelumnya akan dilakukan autentifikasi. Administrator diwajibkan untuk memasukan
username dan password agar menu pada halaman insert dokumen dapat dijalankan.
Tampilan menu insert dokumen dapat dilihat pada gambar 3.8