Flowchart Sistem TINJAUAN PUSTAKA 1 Text Mining

56 kata query dengan frekuensi besar akan berada pada ranking atas. Gambar 3.4 Flowchart Clustering PAM

3.3 Rancangan Database

Database yang digunakan dalam sistem ini adalah databse mysql dengan 8 tabel di antaranya : 1. Tabel “buku” Tabel koleksi dokumen berita 2. Tabel “indeks” Tabel hasil proses indexing. 3. Tabel “jarakdoc” Tabel jarak antara dokumen berita 4. Tabel “kmedoid” Tabel medoid dan jarak medoid dengan keyword 5. Tabel “query” Tabel keyword yang dimasukan user 6. Tabel “queryindeks” Tabel hasil indexing keyword 7. Tabel “tb_katadasar” Tabel kumpulan kata dasar bahasa Indonesia 8. Tabel “vektor” Tabel vektor dokumen berita 3.4 Hasil Pembahasan 3.4.1 Tampilan Antarmuka Tampilan antarmuka penguna dalam sistem ini dibuat berbasis web dengan menggunakan bahasa pemrograman PHP. Tampilan indeks pada sistem ini adalah halaman pencarian. Untuk dapat menambahkan dokumen berita, administrator harus melalui proses login administrator. Adapun tampilan antarmuka dari system pencarian ini adalah sebagai berikut. 1. Tampilan Halaman Pencarian Gambar 3.5 merupakan tampilan dari halaman pencarian. Gambar 3.5 Tampilan Halaman Pencarian Pada halaman ini , user memasukan keyword pencarian, kemudian memilih menggunakan model IFS atau menggunakan PAM sebagai teknik penyajian. Jika user memilih PAM, maka hasil pencarian akan dikelompokan sesuai dengan hasil clustering seperti yang ditampilkan pada gambar 3.6 Gambar 3.6 Tampilan grup pada hasil pencarian menggunakan metode PAM 2. Halaman Utama Administrator Pada halaman insert dokumen, terdapat menu menambahkan dokumen berita, mengedit berita dan menghapus berita. Namun sebelumnya akan dilakukan autentifikasi. Administrator diwajibkan untuk memasukan username dan password agar menu pada halaman insert dokumen dapat dijalankan. Tampilan menu insert dokumen dapat dilihat pada gambar 3.8 57 Gambar 3.7 Tampilan halaman login admin Gambar 3.8 Tampilan halaman insert dokumen 3. Halaman pustaka Pada halaman pustaka, terdapat koleksi dokumen berita. Gambar 3.9 Tampilan halaman pustaka

3.4.2 Implementasi PAM Pada Penyajian Hasil Pencarian

Pada penelitian ini, PAM digunakan untuk meningkatkan efektifitas hasil pencarian. Setelah kotak isian keyword, terdapat menu pilihan jenis pencarian. Pilihan pertama adalah IFS. Pada IFS, hasil pencarian tidak disajikan dalam kelompok. Hasil pencarian diurutkan berdasarkan kedekatan keyword dengan dokumen. Pilihan kedua adalah PAM. Pada metode ini, hasil pencarian akan dikelompokan berdasarkan kedekatan antara dokumen. Perbedaannya terhadapa IFS adalah pada proses penyajiannya, dokumen dikelompokan berdasarkan kedekatan. Masing-masing kelompok memiliki 1 representasi yang disebut medoid. Pada penyajian, akan dihitung kedekatan keyword dan medoid-medoid tersebut. Medoid yang nilai kedekatannya tidak sama dengan 0 akan diretrieve sebagai hasil pencarian bersama dengan anggota kelompoknya. Gambar 3.10 Pilihan jenis pencarian

3.4.3 Pengujian Sistem

Pengujian sistem menggunakan 86 dokumen berita yang didapatkan dari situs portal berita kompas.com. Pengujian dilakukan untuk menentukan akurasi dan efektifitas penggunaan PAM dalam penyajian hasil pencarian. Berikut merupakan rata-rata precision dan recall hasil pencarian menggunakan PAM dalam penyajian dalam 10 kali percobaan: Tabel 3.1 Hasil Pengujian Pencarian Menggunakan PAM Kemudian, ini adalah hasil pencarian dengan metode IFS biasa.