Jumlah Irisan Uji, Banding : 25
Jumlah Gabungan Uji, Banding : 33
Berdasarkan penghitungan yang dilakukan, maka dapat dianalisis bahwa : 1.
Penghitungan manual berlangsung dalam waktu yang cukup lama. 2.
Kemungkinan terjadi kesalahan dalam proses. 3.
Membutuhkan alat bantu lain seperti alat hitung dan kamus.
3.8 Perancangan Database Dan
Interface
Sistem
Sistem pendeteksi dokumen teks yang dirancang terdiri atas dua komponen utama, yaitu database dan
interface
sistem.
3.8.1 Database Sistem
Database sistem merupakan tempat penyimpanan data dalam skala kecil maupun besar. Sub database adalah tabel yang berisi mengenai data spesifik yang dibutuhkan
oleh sistem. Penelitian ini hanya menggunakan dua tabel yang difungsikan untuk pengecekan kata dasar dan kata bersinonim, yaitu :
1. Tabel kata dasar
Tabel ini digunakan pada proses
stemming
. Rancangan tabel kata dasar dapat dilihat pada Tabel 3.4 dengan rincian sebagai berikut :
a. id kata dasar, dan
b. kata dasar.
76 ,
75 100
33 25
x 100
| |
| |
,
x wd
wd wd
wd d
d Kemiripan
pembanding uji
pembanding uji
gabungan irisan
Universitas Sumatera Utara
Tabel 3.4 Rancangan Tabel Kata Dasar No.
Nama Tipe
Ekstra Aksi
1. id_ktdasar
int10
auto increment primary key
2. katadasar
varchar20
2. Tabel kata sinonim
Tabel ini digunakan pada proses
Synonym Recognition
. Rancangan tabel sinonim kata dapat dilihat pada Tabel 3.5 dengan rincian sebagai berikut :
a. id kata sinonim,
b. Sinonim kata, dan
c. Kata dasar.
Tabel 3.5 Rancangan Tabel Kata Sinonim No.
Nama Tipe
Ekstra Aksi
1. id_ktsinonim
int10
auto increment primary key
2. katasinonim
varchar20 3.
sinonim varchar20
3.8.2 Interface Sistem
Interface
sistem merupakan tampilan sistem yang berfungsi untuk membantu pengguna dalam menggunakan sistem.
Interface
sistem pada penelitian ini dibuat sesederhana mungkin dengan tujuan untuk mengurangi penggunaan waktu yang tidak relevan pada proses sistem serta
membantu pengguna dalam memahami dan menggunakan sistem. Rancangan
interface
sistem ini dapat dibagi menjadi dua, yaitu: 1.
Tampilan Awal Tampilan awal digunakan untuk memasukkan data yang diuji maupun
dibandingkan serta nilai-nilai yang diperlukan dalam pemrosesan deteksi kemiripan teks. Tampilan awal sistem menggunakan lima komponen dasar,
yaitu:
iframe
,
textarea, textbox, button,
dan
tabel
. Adapun bentuk ataupun gambaran dari tampilan awal sistem yang akan
dibuat dapat dilihat pada Gambar 3.8 berikut :
Universitas Sumatera Utara
TEXTAREA UJI TEXTAREA BANDING
TOMBOL CETAK UJI
TOMBOL CETAK BANDING
TOMBOL PROSES SISTEM
TEXTBOX N- GRAM
TEXTBOX MODULO
TEXTBOX FILE
TOMBOL SUBMIT
TOMBOL BROWSE
IFRAME UJI
TEXTBOX FILE
TOMBOL SUBMIT
TOMBOL BROWSE
IFRAME BANDING
TOMBOL RESET
Gambar 3.8 Rancangan Tampilan Awal Sistem
Berikut ini merupakan rincian dari rancangan tampilan awal pada Gambar 3.6 yang akan dibuat, yaitu :
a.
Textbox file
untuk memuat
url file
pdf, b.
Tombol
Browse
untuk mencari
file
pdf, c.
Tombol
Submit
untuk membaca isi pdf, d.
IF RAME
uji sebagai media pembaca isi pdf uji, e.
IF RAME
banding sebagai media pembaca isi pdf banding, f.
Tombol pencetak dokumen dari
iframe
uji ke
Textarea
uji, g.
Tombol pencetak dokumen dari
iframe
banding ke
Textarea
banding, h.
Textarea
uji sebagai media pencetak teks pdf uji dan sebagai media input teks uji secara manual,
i.
Textarea
banding sebagai media pencetak teks pdf banding dan sebagai media input teks banding secara manual,
j. Tombol mulai untuk memulai proses pendeteksian.
k. Tombol reset untuk mengembalikan sistem ke keadaan semula.
Universitas Sumatera Utara
2. Tampilan Hasil
Tampilan akhir berfungsi untuk menampilkan hasil dari proses pendeteksian kemiripan dokumen teks. Adapun hasil proses yang akan ditampilkan pada
tampilan hasil adalah: a.
Hasil
stemming
, b.
Hasil
Synonym Recognition
, c.
Hasil
Noise Reduction
, d.
Rangkaian N-Gram, e.
Nilai
hash
tiap rangkaian gram, f.
F ingerprint
dokumen, dan g.
Persentase similaritas dokumen teks.
Rincian tersebut dirancang di dalam satu tabel dan diakhiri dengan waktu proses pendeteksian, sesuai dengan rancangan pada Gambar 3.9 berikut :
WAKTU PROSES SISTEM
TABEL HASIL
NO PROSES
HASIL PROSES PADA TEKS BANDING HASIL PROSES PADA TEKS UJI
Gambar 3.9 Rancangan Tampilan Hasil Sistem
Universitas Sumatera Utara
BAB 4
IMPLEMENTASI DAN PENGUJIAN
Pada bab ini, akan dibahas mengenai implementasi dari algoritma
Manber
, teknik
stemming
, dan
Synonym Recognition
sehingga pengujian terhadap sistem dapat dilakukan, baik untuk tampilan sistem maupun hasil akhir berupa persentase
kemiripan yang dimiliki oleh dokumen teks uji dengan pembandingnya.
4.1 Implementasi