Pengujian Sistem Kesimpulan Dan Saran

Teks Banding : Agar tubuhnya tidak cepat mengidap penyakit, maka dibutuhkan tambahan vitamin dengan dosis yang pas. Gram : 2 Modulo : 2 Gambar 4.8 Hasil Akhir Algoritma Manber

4.2 Pengujian Sistem

Pengujian yang dilakukan pada sistem adalah mendeteksi kemiripan satu dokumen teks uji dengan satu dokumen teks banding baik hanya menggunakan algoritma Manber saja, dengan menambahkan teknik stemming atau Synonym Recognition saja maupun kombinasi kedua teknik. Hal ini dilakukan untuk mengetahui seberapa besar pengaruhnya terhadap hasil dan waktu pemrosesan, serta beberapa pengujian lainnya, seperti pengujian rules pada proses stemming dan lainnya. 4.2.1 P engujian Tampilan Sistem Pengujian yang dilakukan pada tampilan sistem berupa fungsi dari tiap komponen, algoritma serta teknik yang digunakan. Rancangan pengujian dapat dilihat pada Tabel 4.1 dan dilanjutkan dengan hasil pengujian pada Tabel 4.2 berikut ini : Tabel 4.1 Rancangan Pengujian Tampilan Sistem No. Komponen Sistem Yang Diuji Butir Uji 1. Tombol Browse Memunculkan window untuk mencari file pdf yang akan diuji atau banding 2. Tombol Submit Menampilkan isi file pdf ke masing- masing iframe , baik uji ataupun banding 3. Iframe pembaca file pdf Pembacaan isi file pdf ke dalam iframe Universitas Sumatera Utara 4. Pencetakan file pdf dari iframe ke textarea Menguji dua tombol yang berfungsi untuk mencetak file pdf dari iframe ke textarea 5. Textarea Textarea dapat berisikan teks selain hasil cetak file pdf 6. Tombol Deteksi Pendeteksian dapat diproses atau tidak 7. Tombol Reset Mengembalikan sistem ke keadaan semula 8. Stemming Menghasilkan kata dasar yang sesuai 9. Synonym Recognition Menghasilkan kata bersinonim 10. Rangkaian Gram Menghasilkan rangkaian gram sepanjang N yang di- input 11. Hash Menghasilkan nilai hash yang sesuai fungsi hash 12. F ingerprint Menghasilkan fingerprint yang sesuai dengan syarat 13. Similaritas Menghasilkan persentase yang sesuai dengan persamaan Tabel 4.2 Hasil Pengujian Tampilan Sistem No. Komponen Sistem Yang Diuji Hasil Pengujian 1. Tombol Browse Berhasil 2. Tombol Submit Berhasil 3. Iframe pembaca file pdf Berhasil 4. Pencetakan file pdf dari iframe ke textarea Berhasil 5. Textarea Berhasil 6. Tombol Deteksi Berhasil 7. Tombol Reset Berhasil 8. Stemming Berhasil 9. Synonym Recognition Berhasil 10. Rangkaian Gram Berhasil Universitas Sumatera Utara 11. Hash Berhasil 12. F ingerprint Berhasil 13. Similaritas Berhasil 4.2.2 P engujian P roses Stemming Sesuai dengan penjelasan pada Bab 3 mengenai penggunaan rules dan penambahan bubuhan kata, maka dirancang sebuah pengujian yang dapat dilihat pada Tabel 4.3, dilanjutkan dengan pembuktian pengujian melalui Gambar 4.9, dan diakhiri dengan hasil pengujian pada Tabel 4.4 berikut ini : Tabel 4.3 Rancangan Pengujian Rules No. Rules Butir Uji 1. mem- + -r Menghasil kata dasar yang dimulai dengan huruf p- 2. men- + huruf vokal -a, -i, -u, -e, o Menghasil kata dasar yang dimulai dengan huruf t- 3. meny- + huruf apapun Menghasil kata dasar yang dimulai dengan huruf s- 4. meng- + huruf vokal -a, -i, -u, -e, o + kata dasar tidak dimulai dengan huruf vocal Menghasil kata dasar yang dimulai dengan huruf k- 5. pem- + -r Menghasil kata dasar yang dimulai dengan huruf p- .6. pen- + huruf vokal -a, -i, -u, -e, o Menghasil kata dasar yang dimulai dengan huruf t- 7. peny- + huruf apapun Menghasil kata dasar yang dimulai dengan huruf s- 8. peng- + huruf vokal -a, -i, -u, -e, o + kata dasar tidak dimulai dengan huruf vokal Menghasil kata dasar yang dimulai dengan huruf k- Universitas Sumatera Utara Gambar 4.9 Pengujian Stemming Dan Rules Tabel 4.4 Hasil Pengujian Rules No. Rules Hasil Pengujian 1. mem- + -r Berhasil 2. men- + huruf vokal -a, -i, -u, -e, o Berhasil 3. meny- + huruf apapun Berhasil 4. meng- + huruf vokal -a, -i, -u, -e, o + kata dasar tidak dimulai dengan huruf vokal Berhasil 5. pem- + -r Berhasil 6. pen- + huruf vokal -a, -i, -u, -e, o Berhasil 7. peny- + huruf apapun Berhasil 8. peng- + huruf vokal -a, -i, -u, -e, o + kata dasar tidak dimulai dengan huruf vokal Berhasil Berdasarkan hasil pengujian yang diberikan, maka dapat disimpulkan bahwa penambahan rules dan bubuhan kata pada Stemming P orter merupakan langkah yang tepat untuk menghasilkan kata dasar yang lebih sesuai. Universitas Sumatera Utara 4.2.3 P engujian Synonym Recognition Pengujian kata bersinonim dilakukan dengan mengubah kata sinonim yang terdapat di kolom “sinonim” menjadi kata pada kolom “katasinonim”. Berikut ini dipaparkan rancangan pengujian yang dilakukan pada Tabel 4.5, dilanjutkan dengan pengujian pada Gambar 4.10 dan hasil pengujian pada Tabel 4.6: Tabel 4.5 Rancangan Pengujian Synonym Recognition No. Komponen Yang Diuji Butir Uji 1. Pengubahan sinonim kata menjadi kata sinonim Kata bersinonim berubah menjadi kata sinonim sesuai dengan ubahan sinonim pada database Gambar 4.10 Pengujian Kata Synonym Recognition Tabel 4.6 Hasil Pengujian Synonym Recognition No. Komponen Yang Diuji Hasil Pengujian 1. Kata bersinonim menjadi kata universal Berhasil Universitas Sumatera Utara 4.2.4 P engujian Deteksi Kemiripan Dokumen Teks Adapun rancangan pengujian yang dilakukan dapat dilihat pada Tabel 4.7, dengan pengujian menggunakan contoh kasus yang berasal dari sub Bab 3, yaitu proses penghitungan manual. Secara berturut, akan ditampilkan hasil pendeteksian baik hanya dengan menggunakan algoritma Manber saja Gambar 4.11, maupun dengan penambahan kedua teknik Gambar 4.12. Tabel 4.7 Rancangan Pengujian Kemiripan Teks No. Deteksi Kemiripan Teks Butir Uji 1. Hanya menggunakan algoritma Manber Persentase kemiripan dan waktu pemrosesan 2. Menggunakan algoritma Manber , stemming , dan Synonym Recognition Gambar 4.11 Hanya Menggunakan Algoritma Manber Universitas Sumatera Utara Gambar 4.12 Stemming , Synonym Recognition , Dan Algoritma Manber Berdasarkan pengujian yang telah dilakukan, maka didapatkanlah hasil pengujian pada Tabel 4.8 berikut ini : Tabel 4.8 Hasil Pengujian Kemiripan Teks No. Deteksi Kemiripan Teks Persentase Similaritas Waktu Pemrosesan 1. Hanya menggunakan algoritma Manber 60 0.004 detik 2. Menggunakan algoritma Manber , stemming , dan Synonym Recognition 75.76 0.92 detik Dengan melihat hasil pengujian pada Tabel 4.8, maka dapat disimpulkan bahwa: 1. Waktu pemrosesan algoritma Manber sangat cepat, dengan waktu proses sekitar 0.004 detik. Universitas Sumatera Utara 2. Penggunaan algoritma Manber dengan penambahan teknik stemming dan Synonym Recognition memberikan perbedaan hingga ±15 dibandingkan tanpa penggunaan kombinasinya. 3. Waktu pemrosesan dengan menggunakan kombinasi kedua teknik menjadi lebih lama karena dilakukan pengecekan pada setiap kata yang terdapat dalam satu dokumen teks. 4.2.5 P engujian Nilai N-Gram N-Gram merupakan langkah awal dalam pembentukan nilai hash maupun fingerprint dokumen, serta mempengaruhi hasil akhirnya berupa persentase kemiripan. Oleh karena itu, penggunaan nilai N menjadi sangat penting dan akan menentukan keseluruhan proses dari algoritma Manber . Tabel 4.9 berikut merupakan rancangan pengujian yang dilakukan dengan menggunakan nilai N berbeda dalam kasus yang sama, kemudian dilanjutkan dengan hasil pengujiannya pada Tabel 4.10, yaitu: Tabel 4.9 Rancangan Pengujian Nilai N No. Nilai N Butir Uji 1. N = 1 Persentase kemiripan dan waktu pemrosesan 2. N = 2 3. N = 3 4. N = 4 Tabel 4.10 Hasil Pengujian Nilai N No. Nilai N Persentase Similaritas Waktu Pemrosesan 1. N = 1 89.47 0.905 detik 2. N = 2 75.76 0.916 detik 3. N = 3 50 0.909 detik 4. N = 4 28.07 0.924 detik Berdasarkan hasil pengujian pada Tabel 4.10, maka dapat disimpulkan bahwa: 1. Penggunaan nilai N tidak berpengaruh pada waktu pemrosesan dilihat dari waktu pemrosesan yantg tidak berubah yaitu sekitar 0.9 detik. Universitas Sumatera Utara 2. Nilai N yang kecil akan menghasilkan persentase similaritas lebih besar. Hal ini disebabkan oleh pendeknya rangkaian teks yang terbentuk dan banyaknya jumlah rangkaian teks yang sama di dalam satu dokumen teks. 4.2.6 P engujian Dengan Metode Lainnya Dilakukan pengujian dengan menggunakan contoh yang sama pada penelitian lainnya. Adapun rancangan pengujian yang dilakukan dapat dilihat pada Tabel 4.11 dengan hasil pengujiannya pada Tabel 4.12 berikut: Tabel 4.11 Rancangan Pengujian Dengan Metode Lain No. Metode Butir Uji 1. Exact Match Persentase kemiripan dengan hasil menggunakan algoritma Manber 2. Rabin Karp 3. Levenshtein Distance 4. Winnowing Tabel 4.12 Hasil Pengujian Dengan Metode Lain No. Metode Similaritas Manber 1. Exact Match 72.4 86.96 2. Rabin Karp 66.67 71.43 3. Levenshtein Distance 70 66.15 4. Winnowing 50.55 85.02 Berdasarkan hasil pengujian pada Tabel 4.12, disimpulkan bahwa: 1. Penggunaan algoritma Manber dengan penambahan teknik stemming dan Synonym Recognition mampu mendeteksi kemiripan dokumen teks dengan sangat baik, dibuktikan pada persentase yang dihasilkan. 2. Kombinasi algoritma Manber dan teknik pendukungnya dinilai cukup baik dalam mendeteksi similaritas kode program, yaitu dengan menghasilkan perbedaan similaritas ±4 dengan penelitian yang menggunakan metode Levenshtein Distance . Universitas Sumatera Utara BAB 5 KESIMPULAN DAN SARAN Pada bab ini, akan dibahas mengenai kesimpulan dan saran berdasarkan analisis dan pengujian yang dilakukan dalam menyelesaikan permasalahannya, yaitu pendeteksian kemiripan dokumen teks menggunakan algoritma Manber dan teknik stemming serta Synonym Recognition .

5.1 Kesimpulan