BAB 2. TINJAUAN PUSTAKA
Pada bab ini dipaparkan teori-teori serta sumber pustaka yang dipakai pada saat penelitian dilakukan. Teori-teori diambil dari buku literatur, jurnal maupun
website yang sesuai. Teori-teori yang dibahas adalah teori mengenai plagiarisme, Algoritma winnowing, konsep kerja algoritma winnowing, Jaccard Coefficient
Similarity, dan teori-teori yang mendukung.
2.1 Penelitian Terdahulu
Penelitian terdahulu dengan judul “PERANCANGAN SISTEM DETEKSI PLAGIARISME DOKUMEN TEKS DENGAN MENGGUNAKAN ALGORITMA
RABIN- KARP” dilakukan oleh Eko Nugroho mahasiswa Program Studi Ilmu
Komputer, Jurusan Matematika , Fakultas Matemarika dan Ilmu Pengetahuan Alam, Universitas Brawijaya. Penelitian ini bertujuan untuk membandingkan kemiripan
dokumen asli dengan dokumen yang ingin diuji dengan presentase kemiripan kedua dokumen dijadikan bahan pertimbangan apakah dokumen yang diuji merupakan hasil
menjiplak karya orang seseorang atau tidak. Peneliti menggunakan algoritma Rabin- Karp sebagai metode pencarian pola kesamaan dalam dokumen teks. Dalam
penelitian ini juga dilakukan modifikasi algoritma Rabin-Karp dengan menyisipkan metode stemming pada tahap preprocessing, proses hashing, dan pada proses string-
matching yang kemudian dilakukan perbandingan antara algoritma Rabin-Karp sebelum dan sesudah dimodifikasi dari sisi waktu proses serta keakuratan dalam
mendeteksi kemiripan similarity dokumen. Berdasarkan penelitian yang telah dilakukan ada beberapa kekurangan yang
dimiliki oleh algoritma Rabin-Karp original, yaitu waktu proses yang relatif lama terhadap file berukuran besar. Akurasi nilai similarity tergantung pada nilai Kgram
yang diinputkan, semakin kecil nilai Kgram maka akurasi nilai similarity semakin tinggi. Peneliti termotivasi untuk melakukan penelitian tentang indentifikasi
plagiarisme pada file dokumen berbasis teks dengan memanfaatkan algoritma winnowing sebagai algoritma pencari kesamaan teks dalam dokumen, mengingat
algoritma winnowing mampu mengurangi waktu proses pada file berukuran besar dengan memanfaatkan teknik rolling pada proses hashing. Selain itu, nilai akurasi
similarity algoritma winnowing tidak hanya dipengaruhi oleh nilai input Kgram, tetapi juga dipengaruhi oleh nilai input window yang berfungsi memisahkan hasil
hash pada setiap gram-nya.
2.2 Plagiarisme