Deteksi Kemiripan Dokumen Teks Menggunakan Algoritma Manber

BAB 1

PENDAHULUAN

1.1 Latar Belakang

Teknologi komputer sudah berkembang pesat dan menjadi sebuah kebutuhan bagi
setiap orang. Tentu perkembangan ini memiliki banyak dampak dalam kehidupan.
Salah satu dampak positifnya adalah untuk membantu dan memudahkan kerja
manusia. Sebagai contoh yaitu dalam melakukan suatu pendeteksian.
Banyak manfaat yang dapat diambil dengan adanya proses pendeteksian,
seperti pendeteksian kemiripan dokumen teks. Deteksi kemiripan dokumen teks
merupakan sebuah upaya yang dilakukan untuk menghindari tindakan plagiarisme
sehingga keaslian dari dokumen teks akan tetap terjaga.
Plagiarisme atau penjiplakan dapat diartikan sebagai sebuah tindakan imitasi
atau pemalsuan baik

dari segi bahasa maupun ide dari orang lain dengan

merepresentasikan hal tersebut sebagai hasil karyanya sendiri (Hariharan, 2012).
Plagiarisme dalam bahasa latin diartikan sebagai pencurian, sehingga seseorang yang

melakukan tindak penjiplakan dapat diartikan pula sebagai seorang pencuri.
Ada banyak teknik penjiplakan pada dokumen teks, beberapa diantaranya
adalah copy paste, penulisan kembali sebuah naskah dengan mengubah struktur
penulisannya, pengutipan ide orang lain tanpa mengubah tulisan, dan penjiplakan
dengan cara mengubah bahasa dokumen ke bahasa lainnya tentunya tanpa menuliskan
sumber ide berasal. Oleh sebab itu, penjiplakan menjadi masalah utama dalam ruang
lingkup pendidikan. Hal ini didasarkan pada penelitian yang telah dilakukan oleh
Osman, et al. (2012), dimana hasilnya adalah 70% dari pelajar mengaku melakukan

Universitas Sumatera Utara

2

tindak plagiat, baik plagiat dengan cara mencontek tugas biasa maupun tugas akhir.
Tentunya ini akan merugikan kedua belah pihak, baik pelaku dan korban penjiplakan
khususnya.
Penjiplakan pada tingkat pendidikan biasanya terjadi akibat deadline dari suatu
pekerjaan ataupun dari sifat malas yang dimiliki. Adapun tindak penjiplakan yang
sering dilakukan oleh pelajar adalah jenis copy paste, artinya dokumen teks dijiplak
tanpa mengubah isi teks maupun jenis peringkasan dengan cara menutupi bagian yang

disalin. Di dalam dunia pendidikan, suatu karya ilmiah dikatakan sebagai hasil plagiat
atau penjiplakan apabila kutipan yang dilakukan dijiplak secara utuh dan tidak disertai
penyebutan referensi secara benar (Purwitasari, et al. 2009).
Pendeteksian plagiat dapat dilakukan baik secara manual dengan mengecek
langsung dokumen teks

ataupun secara semi-otomatis dengan bantuan sistem

komputer. Meskipun pendeteksian secara manual merupakan cara yang paling akurat
dalam mendeteksi plagiat, namun cara ini sangat tidak efektif dan efisien, baik dari
segi waktu, tenaga, maupun biaya. Pencegahan merupakan upaya terbaik untuk
menghalangi munculnya plagiarisme, yaitu dengan menekankan moral masyarakat
dan sistem pendidikan akan bahaya plagiarisme. Cara ini akan memberikan efek
jangka panjang, sehingga diharapkan tindak penjiplakan dapat berkurang ataupun
dituntaskan

hingga

selesai


(Salmuasih,

2013).

Pendeteksian

plagiarisme

pada

dokumen teks dapat dilakukan dengan cara membandingkan kemiripan antara isi
dokumen teks yang akan diuji dengan dokumen teks pembandingnya, dimana
dokumen teks pembanding yang digunakan sudah dinyatakan valid sehingga terhindar
dari tindak penjiplakan.
Pendeteksian kemiripan dokumen teks berbahasa Indonesia secara semiotomatis cukuplah sulit untuk dilakukan karena bahasa Indonesia tidak memiliki
rumus bentuk baku yang permanen (Triawati, 2009) ditambah dengan penggunaan
imbuhan, kata ganti orang, dan sinonim kata yang sangat banyak dan memiliki ragam
bentuk serta makna. Tentu hal ini akan semakin memudahkan terjadinya tindak plagiat
dan kesulitan dalam pendeteksiannya.
Salah satu penelitian terdahulu mengenai pendeteksian kemiripan dokumen

teks, yaitu Ramadhani, et al. (2013) yang selain menggunakan algoritma Winnowing,
juga membandingkan algoritma tersebut dengan algoritma Manber . Kesimpulan yang
dapat dituliskan adalah keakuratan pendeteksian cukup baik dengan memberikan

Universitas Sumatera Utara

3

perbedaan hasil similaritas sebesar 4-7% dengan responden yang mencari kesamaan
dokumen secara manual. Meskipun dari segi keakuratan Winnowing lebih unggul,
namun waktu proses algoritma tersebut lebih lama dari algoritma Manber .
Oleh karena itu, dibutuhkan sebuah sistem untuk mendeteksi kemiripan
dokumen teks dengan tingkat keakuratan dan waktu proses yang baik. Adapun
algoritma yang diimplementasikan ke dalam sistem adalah algoritma Manber .
Algoritma ini memiliki waktu proses yang sangat cepat dan ketepatan yang cukup
baik. Algoritma Manber merupakan salah satu dari tiga metode fingerprint selain
Winnowing dan Rabin-Karp. Secara umum, algoritma Winnowing dan Manber

memiliki prinsip kerja yang hampir sama dengan perbedaan, yaitu pada proses
pemilihan fingerprint dokumennya. Proses stemming dan Synonym Recognition juga

akan diimplementasikan ke dalam sistem untuk meningkatkan keakuratan dalam
pendeteksian kemiripan dokumen teks serta mengatasi beberapa teknik penjiplakan.

1.2 Rumusan Masalah

Penjiplakan merupakan perbuatan yang secara sengaja ataupun tidak sengaja
dilakukan dengan cara mengutip sebagian atau seluruh karya orang lain, tanpa
menyatakan sumber secara tepat dan memadai. Salah satu objek yang sering dijadikan
sebagai media penjiplakan adalah dokumen teks. Untuk melihat keaslian dokumen
teks dapat diuji dengan cara membandingkan kemiripan isi dokumen teks. Oleh
karena itu, diperlukan pendekatan untuk mendeteksi kemiripan suatu dokumen teks
dengan dokumen teks lain sehingga tindakan penjiplakan dapat dideteksi dan
dihindari.

1.3 Batasan Masalah

Agar penelitian dapat sesuai dengan permasalahan yang akan diselesaikan, maka
diperlukan beberapa batasan, yaitu sebagai berikut:
1. Hanya menguji dokumen teks, tidak menguji dokumen berupa gambar ataupun
suara.

2. Dokumen yang diuji adalah dokumen yang menggunakan bahasa Indonesia.

Universitas Sumatera Utara

4

3. Pengujian dilakukan pada file dengan format pdf.
4. Hanya memperhatikan tulisan, tidak termasuk makna kalimat.
5. Tidak memperhatikan kesalahan dalam penulisan kata (typo).
6. Tidak memperhatikan adanya penulisan sumber rujukan.
7. Pendeteksian pada plagiarisme jenis Technical Disguise, Disguised, dan Copy
& Paste Plagiarism.

1.4 Tujuan

Tujuan dari penelitian ini adalah mendeteksi kemiripan satu dokumen teks uji dengan
satu dokumen teks pembanding menggunakan algoritma Manber disertai penggunaan
teknik stemming dan Synonym Recognition .

1.5 Manfaat


Adapun manfaat dari penelitian ini adalah:
1. Mengefektifkan serta mengefisiensikan waktu,

tenaga,

dan biaya dalam

mendeteksi kemiripan dokumen teks.
2. Menambah pengetahuan atau wawasan mengenai penjiplakan dan cara untuk
mendeteksi tindakan tersebut.
3. Sebagai bahan untuk pengembangan penelitian selanjutnya.

1.6 Metodologi Penelitian

Adapun metodologi pada penelitian ini adalah:

1. Studi Literatur
Dilakukan pengumpulan referensi melalui berbagai macam buku, jurnal,
artikel, dan materi lainnya yang berkaitan dengan penelitian ini.


Universitas Sumatera Utara

5

2. Pengumpulan Data
Dilakukan pengumpulan data dan informasi yang akan diperlukan dalam
penelitian.

3. Analisis dan Perancangan
Dilakukan analisis terhadap studi literatur untuk mengetahui penyelesaian
permasalahan deteksi kemiripan dokumen dan melakukan perancangan sistem.

4. Implementasi
Perancangan sistem yang telah dibuat akan diimplementasikan ke dalam
aplikasi yang dibuat dengan menggunakan bahasa pemrograman PHP dan
database MySQL.

5. Pengujian
Uji coba produk dan evaluasi. Melakukan uji coba program yang telah dibuat.

Kemudian melakukan evaluasi terhadap kekurangan program.

6. Penyusunan Laporan
Dokumentasi dari hasil analisis dan implementasi dari sistem yang dibangun.

1.7 Sistematika Penulisan

Skripsi ini disusun dengan sistematika penulisan, sebagai berikut:

Bab 1: Pendahuluan
Pada bab ini dibahas mengenai latar belakang penulisan, rumusan masalah, batasan
masalah, tujuan, manfaat, metodologi penelitian, dan sistematika penulisan skripsi.

Bab 2: Landasan Teori
Pada bab ini dibahas mengenai teori-teori yang digunakan dalam pengerjaan skripsi.
Teori-teori yang terdapat pada bab ini mencakup algoritma secara umum dan teknik
pendukungnya.

Universitas Sumatera Utara


6

Bab 3: Analisis Dan Perancangan Sistem
Pada bab ini dibahas mengenai analisis algoritma dan teknik pendukungnya dalam
mendeteksi persentase kemiripan dokumen serta perancangan sistem berdasarkan hasil
analisis yang dilakukan.

Bab 4: Pengimplementasian Dan Pengujian Sistem
Pada bab ini dibahas mengenai implementasi dari sistem dan melakukan pengujian
terhadap kinerja dari sistem yang dibentuk.

Bab 5: Kesimpulan Dan Saran
Pada bab ini berisi tentang kesimpulan yang didapat dari pembuatan skripsi dan saransaran yang mungkin dapat berguna dalam penelitian selanjutnya.

Universitas Sumatera Utara