Teks Banding : Agar tubuhnya tidak cepat mengidap penyakit, maka dibutuhkan tambahan vitamin dengan dosis yang pas.
Gram : 2
Modulo
: 2
Gambar 4.8 Hasil Akhir Algoritma Manber
4.2 Pengujian Sistem
Pengujian yang dilakukan pada sistem adalah mendeteksi kemiripan satu dokumen teks uji dengan satu dokumen teks banding baik hanya menggunakan algoritma
Manber
saja, dengan menambahkan teknik
stemming
atau
Synonym Recognition
saja maupun kombinasi kedua teknik. Hal ini dilakukan untuk mengetahui seberapa besar
pengaruhnya terhadap hasil dan waktu pemrosesan, serta beberapa pengujian lainnya, seperti pengujian
rules
pada proses
stemming
dan lainnya.
4.2.1 P engujian Tampilan Sistem
Pengujian yang dilakukan pada tampilan sistem berupa fungsi dari tiap komponen, algoritma serta teknik yang digunakan. Rancangan pengujian dapat dilihat pada Tabel
4.1 dan dilanjutkan dengan hasil pengujian pada Tabel 4.2 berikut ini :
Tabel 4.1 Rancangan Pengujian Tampilan Sistem
No. Komponen Sistem Yang Diuji
Butir Uji 1.
Tombol
Browse
Memunculkan
window
untuk mencari
file
pdf yang akan diuji atau banding 2.
Tombol
Submit
Menampilkan isi
file
pdf ke masing- masing
iframe
, baik uji ataupun banding 3.
Iframe
pembaca file pdf Pembacaan isi
file
pdf ke dalam
iframe
Universitas Sumatera Utara
4. Pencetakan file pdf dari
iframe
ke
textarea
Menguji dua tombol yang berfungsi untuk mencetak
file
pdf dari
iframe
ke
textarea
5.
Textarea Textarea
dapat berisikan teks selain hasil cetak
file
pdf 6.
Tombol Deteksi Pendeteksian dapat diproses atau tidak
7. Tombol Reset
Mengembalikan sistem ke keadaan semula
8.
Stemming
Menghasilkan kata dasar yang sesuai 9.
Synonym Recognition
Menghasilkan kata bersinonim 10. Rangkaian Gram
Menghasilkan rangkaian gram sepanjang N yang di-
input
11.
Hash
Menghasilkan nilai
hash
yang sesuai fungsi
hash
12.
F ingerprint
Menghasilkan
fingerprint
yang sesuai dengan syarat
13. Similaritas Menghasilkan persentase yang sesuai
dengan persamaan
Tabel 4.2 Hasil Pengujian Tampilan Sistem No.
Komponen Sistem Yang Diuji Hasil Pengujian
1. Tombol
Browse
Berhasil 2.
Tombol
Submit
Berhasil 3.
Iframe
pembaca file pdf Berhasil
4. Pencetakan file pdf dari
iframe
ke
textarea
Berhasil
5.
Textarea
Berhasil 6.
Tombol Deteksi Berhasil
7. Tombol Reset
Berhasil 8.
Stemming
Berhasil 9.
Synonym Recognition
Berhasil 10. Rangkaian Gram
Berhasil
Universitas Sumatera Utara
11.
Hash
Berhasil 12.
F ingerprint
Berhasil 13. Similaritas
Berhasil
4.2.2 P engujian P roses Stemming
Sesuai dengan penjelasan pada Bab 3 mengenai penggunaan
rules
dan penambahan bubuhan kata, maka dirancang sebuah pengujian yang dapat dilihat pada Tabel 4.3,
dilanjutkan dengan pembuktian pengujian melalui Gambar 4.9, dan diakhiri dengan hasil pengujian pada Tabel 4.4 berikut ini :
Tabel 4.3 Rancangan Pengujian Rules No.
Rules Butir Uji
1. mem- + -r
Menghasil kata dasar yang dimulai dengan huruf p-
2. men- + huruf vokal -a, -i, -u, -e, o
Menghasil kata dasar yang dimulai dengan huruf t-
3. meny- + huruf apapun
Menghasil kata dasar yang dimulai dengan huruf s-
4. meng- + huruf vokal -a, -i, -u, -e, o + kata
dasar tidak dimulai dengan huruf vocal Menghasil kata dasar yang dimulai
dengan huruf k- 5.
pem- + -r Menghasil kata dasar yang dimulai
dengan huruf p- .6. pen- + huruf vokal -a, -i, -u, -e, o
Menghasil kata dasar yang dimulai dengan huruf t-
7. peny- + huruf apapun
Menghasil kata dasar yang dimulai dengan huruf s-
8. peng- + huruf vokal -a, -i, -u, -e, o + kata
dasar tidak dimulai dengan huruf vokal Menghasil kata dasar yang dimulai
dengan huruf k-
Universitas Sumatera Utara
Gambar 4.9 Pengujian
Stemming
Dan
Rules
Tabel 4.4 Hasil Pengujian Rules No.
Rules Hasil Pengujian
1. mem- + -r
Berhasil 2.
men- + huruf vokal -a, -i, -u, -e, o Berhasil
3. meny- + huruf apapun
Berhasil 4.
meng- + huruf vokal -a, -i, -u, -e, o + kata dasar tidak dimulai dengan huruf vokal
Berhasil
5. pem- + -r
Berhasil 6.
pen- + huruf vokal -a, -i, -u, -e, o Berhasil
7. peny- + huruf apapun
Berhasil 8.
peng- + huruf vokal -a, -i, -u, -e, o + kata dasar tidak dimulai dengan huruf vokal
Berhasil
Berdasarkan hasil pengujian yang diberikan, maka dapat disimpulkan bahwa penambahan
rules
dan bubuhan kata pada
Stemming P orter
merupakan langkah yang tepat untuk menghasilkan kata dasar yang lebih sesuai.
Universitas Sumatera Utara
4.2.3 P engujian Synonym Recognition
Pengujian kata bersinonim dilakukan dengan mengubah kata sinonim yang terdapat di kolom “sinonim” menjadi kata pada kolom “katasinonim”. Berikut ini dipaparkan
rancangan pengujian yang dilakukan pada Tabel 4.5, dilanjutkan dengan pengujian pada Gambar 4.10 dan hasil pengujian pada Tabel 4.6:
Tabel 4.5 Rancangan Pengujian
Synonym Recognition
No. Komponen Yang Diuji
Butir Uji
1. Pengubahan sinonim kata menjadi kata sinonim
Kata bersinonim berubah menjadi kata sinonim
sesuai dengan ubahan sinonim pada database
Gambar 4.10 Pengujian Kata
Synonym Recognition
Tabel 4.6 Hasil Pengujian
Synonym Recognition
No. Komponen Yang Diuji
Hasil Pengujian
1. Kata bersinonim menjadi kata universal
Berhasil
Universitas Sumatera Utara
4.2.4 P engujian Deteksi Kemiripan Dokumen Teks
Adapun rancangan pengujian yang dilakukan dapat dilihat pada Tabel 4.7, dengan pengujian menggunakan contoh kasus yang berasal dari sub Bab 3, yaitu proses
penghitungan manual. Secara berturut, akan ditampilkan hasil pendeteksian baik hanya dengan menggunakan algoritma
Manber
saja Gambar 4.11, maupun dengan penambahan kedua teknik Gambar 4.12.
Tabel 4.7 Rancangan Pengujian Kemiripan Teks No.
Deteksi Kemiripan Teks Butir Uji
1. Hanya menggunakan algoritma
Manber
Persentase kemiripan dan waktu pemrosesan
2. Menggunakan algoritma
Manber
,
stemming
, dan
Synonym Recognition
Gambar 4.11 Hanya Menggunakan Algoritma
Manber
Universitas Sumatera Utara
Gambar 4.12
Stemming
,
Synonym Recognition
, Dan Algoritma
Manber
Berdasarkan pengujian yang telah dilakukan, maka didapatkanlah hasil pengujian pada Tabel 4.8 berikut ini :
Tabel 4.8 Hasil Pengujian Kemiripan Teks No.
Deteksi Kemiripan Teks Persentase Similaritas
Waktu Pemrosesan
1. Hanya menggunakan
algoritma
Manber
60 0.004 detik
2. Menggunakan algoritma
Manber
,
stemming
, dan
Synonym Recognition
75.76 0.92 detik
Dengan melihat hasil pengujian pada Tabel 4.8, maka dapat disimpulkan bahwa: 1.
Waktu pemrosesan algoritma
Manber
sangat cepat, dengan waktu proses sekitar 0.004 detik.
Universitas Sumatera Utara
2. Penggunaan algoritma
Manber
dengan penambahan teknik
stemming
dan
Synonym Recognition
memberikan perbedaan hingga ±15 dibandingkan tanpa penggunaan kombinasinya.
3. Waktu pemrosesan dengan menggunakan kombinasi kedua teknik menjadi
lebih lama karena dilakukan pengecekan pada setiap kata yang terdapat dalam satu dokumen teks.
4.2.5 P engujian Nilai N-Gram
N-Gram merupakan langkah awal dalam pembentukan nilai
hash
maupun
fingerprint
dokumen, serta mempengaruhi hasil akhirnya berupa persentase kemiripan. Oleh karena itu, penggunaan nilai N menjadi sangat penting dan akan menentukan
keseluruhan proses dari algoritma
Manber
. Tabel 4.9 berikut merupakan rancangan pengujian yang dilakukan dengan menggunakan nilai N berbeda dalam kasus yang
sama, kemudian dilanjutkan dengan hasil pengujiannya pada Tabel 4.10, yaitu:
Tabel 4.9 Rancangan Pengujian Nilai N No.
Nilai N Butir Uji
1. N = 1
Persentase kemiripan dan waktu pemrosesan 2.
N = 2 3.
N = 3 4.
N = 4
Tabel 4.10 Hasil Pengujian Nilai N No.
Nilai N Persentase Similaritas
Waktu Pemrosesan
1. N = 1
89.47 0.905 detik
2. N = 2
75.76 0.916 detik
3. N = 3
50 0.909 detik
4. N = 4
28.07 0.924 detik
Berdasarkan hasil pengujian pada Tabel 4.10, maka dapat disimpulkan bahwa: 1.
Penggunaan nilai N tidak berpengaruh pada waktu pemrosesan dilihat dari waktu pemrosesan yantg tidak berubah yaitu sekitar 0.9 detik.
Universitas Sumatera Utara
2. Nilai N yang kecil akan menghasilkan persentase similaritas lebih besar. Hal
ini disebabkan oleh pendeknya rangkaian teks yang terbentuk dan banyaknya jumlah rangkaian teks yang sama di dalam satu dokumen teks.
4.2.6 P engujian Dengan Metode Lainnya
Dilakukan pengujian dengan menggunakan contoh yang sama pada penelitian lainnya. Adapun rancangan pengujian yang dilakukan dapat dilihat pada Tabel 4.11 dengan
hasil pengujiannya pada Tabel 4.12 berikut:
Tabel 4.11 Rancangan Pengujian Dengan Metode Lain No.
Metode Butir Uji
1.
Exact Match
Persentase kemiripan dengan hasil menggunakan algoritma
Manber
2.
Rabin Karp
3.
Levenshtein Distance
4.
Winnowing
Tabel 4.12 Hasil Pengujian Dengan Metode Lain No.
Metode Similaritas
Manber
1.
Exact Match
72.4 86.96
2.
Rabin Karp
66.67 71.43
3.
Levenshtein Distance
70 66.15
4.
Winnowing
50.55 85.02
Berdasarkan hasil pengujian pada Tabel 4.12, disimpulkan bahwa: 1.
Penggunaan algoritma
Manber
dengan penambahan teknik
stemming
dan
Synonym Recognition
mampu mendeteksi kemiripan dokumen teks dengan sangat baik, dibuktikan pada persentase yang dihasilkan.
2. Kombinasi algoritma
Manber
dan teknik pendukungnya dinilai cukup baik dalam mendeteksi similaritas kode program, yaitu dengan menghasilkan
perbedaan similaritas ±4 dengan penelitian yang menggunakan metode
Levenshtein Distance
.
Universitas Sumatera Utara
BAB 5
KESIMPULAN DAN SARAN
Pada bab ini, akan dibahas mengenai kesimpulan dan saran berdasarkan analisis dan pengujian yang dilakukan dalam menyelesaikan permasalahannya, yaitu pendeteksian
kemiripan dokumen teks menggunakan algoritma
Manber
dan teknik
stemming
serta
Synonym Recognition
.
5.1 Kesimpulan