Rumusan Masalah Batasan Masalah Tujuan Penelitian Manfaat Penelitian Metodologi Penelitian

2 Proses pendeteksian dapat dilakukan dengan mengurai isi dokumen menjadi string yang memiliki nilai dan dilakukan pencocokan dengan dokumen yang tersedia di dalam database. Beberapa penelitian sebelumnya, pendeteksian dilakukan dengan metode Latent Semantic Analysis Alfarisi, 2011, algoritma Rabin-Karp Nugroho, 2011, algoritma Smith-Waterman Novanta, 2009, konsep Similarity dan algoritma Rabin-Karp Salmuasih, 2013. Dalam awal pendeteksian diperlukan proses stemming. Melakukan proses stemming berarti menghilangkan akhiran dari suatu kata. Proses ini sudah sering dilakukan dalam proses pencarian teks, aplikasi kamus, pengklasifikasian subjek dokumen perkantoran, dan mesin pencari Asian, 2005. Berbeda dengan proses stemming peeada bahasa Inggris, proses stemming pada bahasa Indonesia lebih sulit dilakukan karena bahasa Indonesia mengenal imbuhan awalan prefixes, sisipan infixes, akhiran suffixes, dan kombinasi awalan dan akhiran confixes. Penelitian proses stemming pada bahasa Indonesia telah dilakukan sebelumnya. Ada beberapa algoritma yang digunakan untuk melakukan stemming pada dokumen teks berbahasa Indonesia, seperti, algoritma Nazief dan Adriani 1996, algoritma Ahmad, Yussof, dan Sembok 1996, algoritma Vega 2001, algoritma Ariffin dan Setiono 2002, algoritma Confix Stripping oleh Jelita Asian, pengembangan algoritma Nazief dan Adriani 2007, algoritma Enhanced Confix Stripping Stemmer 2010. Dalam penelitian yang akan dilakukan, algoritma Enhanced Confix Stripping Stemmer dipilih untuk proses penguraian teks dari imbuhannya. Untuk menghitung nilai kesamaan teks dengan dokumen dalam database digunakan algoritma Winnowing dengan teknik rolling hash. Algoritma Winnowing membuang seluruh pemakaian karakter yang tidak relevan, seperti, tanda baca, spasi, angka, dan karakter lainnya. Hanya karakter berupa huruf yang akan diproses ke tahap berikutnya Purwitasari et al, 2010.

1.2. Rumusan Masalah

Maraknya tindakan plagiarisme di dunia perkuliahan, baik plagiarisme dalam hal penyelesaian tugas maupun penyusunan karya ilmiah dapat mengurangi bahkan mematikan kreativitas seseorang dalam berkarya. Berdasarkan hal tersebut, penulis dapat merumuskan masalahnya, yaitu bagaimana mendeteksi kesamaan pada 3 dokumen teks sehingga didapatkan perbandingan antara jurnal yang diuji user dan jurnal yang terdeteksi.

1.3. Batasan Masalah

Adapun batasan masalah dalam penelitian ini adalah: 1. Dokumen teks bahasa Indonesia yang digunakan dengan format Portable Document File .pdf. 2. Portable Document File yang terkunci secured tidak dapat di-parsing dengan aplikasi ini. 3. Sumber „kata dasar‟ dari aplikasi ini diambil dari KBBI online. 4. Sumber dokumen karya ilmiah merupakan jurnal mahasiswa USU data akses: repositori USU. 5. Nilai gram dan window pada perhitungan algoritma Winnowing ditentukan oleh penulis.

1.4. Tujuan Penelitian

Tujuan dari penelitian tugas akhir ini adalah mendeteksi kesamaan pada dokumen teks dengan mengombinasikan algoritma Enhanced Confix Stripping Stemmer dan algoritma Winnowing sehingga memperoleh tingkat akurasi yang lebih baik.

1.5. Manfaat Penelitian

Manfaat dari penelitian tugas akhir ini, antara lain: 1. Mengurangi adanya tindak plagiarisme pada mahasiswa dalam penyelesaian karya ilmiah. 2. Memudahkan dosen untuk mengecek tingkat plagiarisme yang dilakukan mahasiswa dalam menyelesaikan tugas akhirnya.

1.6. Metodologi Penelitian

Metodologi yang digunakan penulis adalah: 4 1. Studi Literatur Pada tahap ini, penulis mencari metode yang berbeda dari penelitian sebelumnya dan memahaminya, serta mencari referensi yang berkenaan dengan proses stemming pada dokumen teks, berupa pdf. 2. Desain Sistem Pada tahap ini, penulis membuat flowchart system, use case, dan arsitektur umum dari sistem yang akan dibuat. 3. Pembuatan Sistem Pada tahap ini, penulis mulai mengodekan sistem yang akan dibuat dengan bahasa pemrograman PHP dan database MySQL. 4. Pengujian Sistem Pada tahap ini, penulis melakukan pengujian dari sistem yang telah dibuat. Pengujian akan menampilkan persentase tingkat plagiat dari dokumen yang di-input oleh user dan menampilkan dokumen yang kemungkinan besar sama dengan dokumen yang dimasukkan oleh user tersebut. 6. Dokumentasi Pada tahap ini, penulis menyusun laporan terhadap sistem yang telah dibuat.

1.7. Sistematika Penulisan