Sistem pendeteksian plagiarisme dokumen skripsi menggunakan metode overlap measure fuction : studi kasus skripsi Program Studi Teknik Informatika Universitas Sanata Dharma Yogyakarta - USD Repository

  

SISTEM PENDETEKSI PLAGIARISME DOKUMEN SKRIPSI

MENGGUNAKAN METODE OVERLAP MEASURE FUNCTION

(STUDI KASUS SKRIPSI PROGRAM STUDI TEKNIK INFORMATIKA

UNIVERSITAS SANATA DHARMA YOGYAKARTA)

  

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Komputer

  

Program Studi Teknik Informatika

Oleh:

Monica Pancaindrani Dewantari

  

075314060

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

  DETECTION PLAGIARISM SYSTEM OF FINAL PROJECT DOCUMENT USING METHOD OVERLAP MEASURE FUNCTION (A CASE STUDY OF INFORMATIC ENGINEERING FINAL PROJECT DOCUMENT IN SANATA DHARMA UNIVERSITY YOGYAKARTA) A THESIS Presented as Partial Fulfillment of the Requirements To Obtain the Sarjana Komputer Degre

  In Informatics Engineering Department By : Monica Pancaindrani Dewantari

  075314060

INFORMATICS ENGINEERING STUDY PROGRAM FACULTY OF SCIENCE AND TECHNOLOGY

HALAMAN PERSEMBAHAN

  ! ! ! " # $# % & #

  ! ' "#

$ ( '# & # #

#

  ABSTRAK

  Skripsi merupakan tugas akhir yang sangat penting bagi seorang mahasiswa, karena skripsi sebagai salah satu syarat lulus mahasiswa di perguruan tinggi. Mahasiswa sering mengambil jalan praktis dalam pengerjaan skripsi untuk mencari kemudahan. Dalam pengerjaan skripsi sering kali mahasiswa mengutip atau menggunakan beberapa atau keseluruhan kata – kata, kalimat, gagasan, ide, dan bagian – bagian lain hasil skripsi orang lain tanpa mencantumkan secara jelas sumber kutipan yang didapat. Hal ini sangat dilarang keras oleh setiap universitas , sebab mahasiswa yang melakukan tindakan plagiarisme tidak mencerminkan sikap kreatif sebagai kalangan terpelajar. Maka dari itu skripsi ini bertujuan membuat suatu sistem untuk mendeteksi tindakan plagiarisme dokumen skripsi yang dilakukan oleh mahasiswa Universitas Sanata Dharma.

  Proses untuk melakukan pendeteksian plagiarisme dokumen skripsi diawali dengan melakukan proses preprocessing, yaitu tokenisasi, stopword removal,

  

stemming, dan splitter kalimat. Kemudian dengan menggunakan metode overlap

measure function yang akan menghasilkan nilai similarity (nilai bobot) dari setiap

  dokumen query yang dibandingkan dengan dokumen asli, nilai similarity dokumen tersebut yang akan menentukan deteksi plagiarisme yang disesuaikan dengan nilai threshold plagiarisme.

  Skripsi ini menggunakan data 50 dokumen skripsi mahasiswa Teknik Informatika untuk pengujian deteksi plagiarisme, sebelum dideteksi terlebih dahulu harus melakukan pencarian nilai threshold, pencarian nilai threshold plagiarisme menggunakan persentase 50, 40 , dan 30 dari rata – rata jumlah similarity dari dokumen – dokumen yang benar – benar sama(dokumen dengan dirinya sendiri). Setelah dilakukan pengujian persentase nilai threshold ,persentase yang paling baik adalah 50 dibandingkan dengan 30 dan 40.

  Persentase 50 memiliki nilai precision 94,8%, sedangkan persentase 40 dengan

  

precision 92,4% dan persentase 30% dengan precision 70%. Maka dari itu

  untuk mendeteksi plagiarisme pada sistem ini digunakan nilai threshold dengan persentase 50% yaitu 869,3 dan sistem ini berlaku untuk mendeteksi dokumen dengan panjang kalimat 100 sampai 500 kalimat dan panjang kata 5 sampai dengan 50 kata.

  ABSTRACT

  Thesis is the final task which is very important for a college students, because of thesis is one of conditions for graduating college students. College Students often take a practical way to make things easy in doing their thesis. Sometimes they using all of the words, phrases, ideas, and the rest of the thesis of others without citation shall state clearly the source derived. It is strictly prohibited by any university, for students who commit acts of plagiarism does not reflect their creative attitude as the educated. This thesis aims to create a system to detect plagiarism action thesis documents carried by students at the University of Sanata Dharma.

  Process to conduct thesis document plagiarism detection process begins with preprocessing, namely tokenisasi, stopword removal, stemming, and sentence splitter. Then by using the method of overlap measure function that will return the value of similarity (weighted value) of each document query is compared to the original document, the document similarity values that will define plagiarism detection threshold value is adjusted to plagiarism.

  This thesis uses 50 informatics engineering thesis student for plagiarism detection training, before the first detectable threshold value must do a search, the search for plagiarism using the percentage threshold values 50, 40, and 30 from the average number of similarity of the documents which is - is the same (with the document itself). After testing the percentage threshold value, the best percentage was 50 compared with 30 and 40. The percentage of 50 has a value of 94.8% precision, while the percentage of 40 with a precision 92.4% and the percentage of 30% with 70% precision. Therefore to detect plagiarism in these systems are used threshold value with the percentage of 50% is 869.3 and the system is applicable for the detection of long documents with a sentence of 100 to 500 sentences and word length from 5 to 50 words.

KATA PENGANTAR

  Puji syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa, yang telah melimpahkan berkat dan rahmatNya sehingga penulis dapat menyelesaikan tugas akhir yang berjudul “SISTEM PENDETEKSI PLAGIARISME DOKUMEN SKRIPSI MENGGUNAKAN METODE OVERLAP MEASURE FUNCTION (STUDI KASUS SKRIPSI PROGRAM STUDI TEKNIK INFORMASTIKA UNIVERSITAS SANATA DHARMA YOGYAKARTA)”. Tugas akhir ini ditulis sebagai salah satu syarat memperoleh gelar sarjana program studi Teknik Informatika, Fakultas Sains dan Teknologi Universitas Sanata Dharma.

  Dalam kesempatan ini, penulis mengucapkan terimakasih yang sebesar- besarnya kepada :

  1. Ibu P.H. Prima Rosa, S.Si.,M.Sc., selaku Dekan Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta.

  

Ibu Ridhowati Gunawan, S.Kom.,M.T., selaku ketua jurusan Program Studi

2.

  Teknik Informatika Universitas Sanata Dharma Yogyakarta.

  

Ibu Sri Hartati Wijono, S.Si.,M.Kom., selaku Dosen Pembimbing atas segala

3.

  waktu, kesabaran, serta memberi kritik dan saran yang membangun dalam membantu penyelesaian tugas akhir ini.

  4. Bapak Puspaningtyas Sanjoyo Adi S.T.,M.T., dan Bapak J.B.Budi Darmawan,

  

DAFTAR ISI

  HALAMAN JUDUL .................................................................................................... i HALAMAN JUDUL (Bahasa Inggris) ........................................................................ ii HALAMAN PERSETUJUAN .................................................................................... iii HALAMAN PENGESAHAN ..................................................................................... iv HALAMAN PERSEMBAHAN .................................................................................. v HALAMAN PERNYATAAN KEASLIAN KARYA ................................................ vi LEMBAR PERNYATAAN PERSETUJUAN .......................................................... vii ABSTRAK ................................................................................................................ viii ABSTRACT ................................................................................................................ ix KATA PENGANTAR .................................................................................................. x DAFTAR ISI .............................................................................................................. xii DAFTAR TABEL ................................................................................................... xviii DAFTAR GAMBAR ................................................................................................. xx

  BAB I PENDAHULUAN ............................................................................................. 1

  1.1 Latar Belakang ................................................................................................... 1

  1.4 Tujuan Penelitian ................................................................................................. 6

  1.5 Luaran Yang Diharapkan .................................................................................... 6

  1.6 Metodologi Penelitian ......................................................................................... 6

  1.7 Sistematika Penulisan .......................................................................................... 8

  BAB II LANDASAN TEORI ....................................................................................... 9

  2.1 Plagiarisme .......................................................................................................... 9

  2.1.1 Definisi Plagiarisme ..................................................................................... 9

  2.1.2 Bentuk Plagiarisme ..................................................................................... 10

  2.2 Definisi Sistem .................................................................................................. 15

  2.3 Konsep Information Retrieval ........................................................................... 17

  2.3.1 Definisi Information Retrieval ................................................................. 17

  2.3.2 Proses Preprocessing Teks Dokumen ........................................................ 19

  2.4 Stemming Algoritma Nazief dan Adriani ......................................................... 22

  2.5 Deteksi Plagiarisme ........................................................................................... 26

  2.5.1 Overlap Measure Function ......................................................................... 27

  2.5.2 Algoritma ................................................................................................... 29

  2.6 Recall dan Precision ......................................................................................... 31

  3.1 Gambaran Umum Sistem .................................................................................. 33

  3.2 Analisis Kebutuhan Sistem ............................................................................... 41

  3.2.1 Definisi Aktor ............................................................................................. 41

  3.2.2 Diagram Use Case ...................................................................................... 42

  3.2.3 Definisi Use Case ....................................................................................... 44

  3.2.4 Skenario Use Case ...................................................................................... 47

  3.2.4.1 Skenario Use Case Login ............................................................... 47

  3.2.4.2 Skenario Use Case Logout ............................................................. 48

  3.2.4.3 Skenario Use Case Input Account .................................................. 49

  3.2.4.4 Skenario Use Case Edit Account ................................................... 50

  3.2.4.5 Skenario Use Case Hapus Account ................................................ 52

  3.2.4.6 Skenario Use Case Input Stopword ................................................ 53

  3.2.4.7 Skenario Use Case Edit Stopword ................................................. 55

  3.2.4.8 Skenario Use Case Hapus Stopword .............................................. 57

  3.2.4.9 Skenario Use Case Input Kata Dasar ............................................. 58

  3.2.4.10 Skenario Use Case Edit Kata Dasar ............................................. 60

  3.2.4.12 Skenario Use Case Kelola Koleksi Dokumen Skripsi ................. 62

  3.2.4.13 Skenario Use Case Deteksi Plagiarisme Koleksi Dokumen Skripsi ................................................................................................................................ 64

  3.2.4.14 Skenario Use Case Kelola Dokumen Skripsi Baru ...................... 65

  3.2.4.15 Skenario Use Case Deteksi Plagiarisme Dokumen Skripsi ........ 67

  3.2.4.16 Skenario Use Case Pencarian Koleksi Dokumen Skripsi ............ 68

  3.2.5 Model Analisis............................................................................................ 70

  3.2.5.1 Login............................................................................................... 70

  3.2.5.2 Input Account ................................................................................. 71

  3.2.5.3 Edit Account ................................................................................... 72

  3.2.5.4 Hapus Account ............................................................................... 73

  3.2.5.5 Input Stopword ............................................................................... 74

  3.2.5.6 Edit Stopword ................................................................................. 76

  3.2.5.7 Hapus Stopword ............................................................................. 77

  3.2.5.8 Input Kata Dasar ............................................................................. 78

  3.2.5.10 Hapus Kata Dasar ......................................................................... 81

  3.2.5.11 Kelola Koleksi Dokumen Skripsi ................................................. 83

  3.2.5.12 Deteksi Plagiarisme Koleksi Dokumen Skripsi ........................... 85

  3.2.5.13 Kelola Dokumen Skripsi Baru...................................................... 87

  3.2.5.14 Deteksi Plagiarisme Dokumen Skripsi ........................................ 89

  3.2.5.15 Pencarian Koleksi Dokumen Skripsi ........................................... 91

  3.2.5.16 Logout .......................................................................................... 92

  3.2.6 Diagram Konteks ....................................................................................... 93

  3.2.7 Diagram Kelas Keseluruhan ....................................................................... 93

  3.3 Desain Sistem .................................................................................................... 95

  3.3.1 Kelas Perancangan ...................................................................................... 95

  3.3.2 Atribut dan Method .................................................................................. 106

  3.3.3 Perancangan Database .............................................................................. 147

  3.3.4 Antarmuka ................................................................................................ 150

  3.3.5 Rencana Pengujian dan Evaluasi .............................................................. 162

  4.2 Implementasi Antarmuka ................................................................................ 168

  4.3 Implementasi Controller ................................................................................ 180

  4.4 Implemantasi Model ....................................................................................... 180

  4.5 Implemantasi Entity ........................................................................................ 181

  4.6 Method – Method Penting .............................................................................. 183

  4.7 Pengujian Hasil Manual dan Hasil Program ................................................... 189

  4.8 Pengujian Mencari Nilai Threshold ................................................................ 212

  4.9 Pengujian Deteksi Plagiarisme........................................................................ 213

  4.10 Testing Deteksi Plagiarisme ......................................................................... 218

  4.11 Analisa Kelemahan Program ........................................................................ 220

  BAB V KESIMPULAN DAN SARAN ................................................................... 221

  5.1 KESIMPULAN ............................................................................................... 221

  5.2 SARAN ........................................................................................................... 222 DAFTAR PUSTAKA ............................................................................................... 223 LAMPIRAN ............................................................................................................. 226

  

DAFTAR TABEL

Tabel 2.1 Kombinasi Awalan dan Akhiran yang Tidak Diijinkan ............................. 24Tabel 2.2 Cara Menentukan Tipe Awalan untuk Kata yang Diawali dengan “te” ..... 25Tabel 2.3 Jenis Awalan Berdasarkan Tipe Awalannya............................................... 26Tabel 3.1 Hak Akses User........................................................................................... 41Tabel 3.2 Deskripsi Use Case ..................................................................................... 44Tabel 3.3 Skenario Use Case Login ........................................................................... 47Tabel 3.4 Skenario Use Case Logout ......................................................................... 48Tabel 3.5 Skenario Use Case Input Account .............................................................. 49Tabel 3.6 Skenario Use Case Edit Account ................................................................ 51Tabel 3.7 Skenario Use Case Hapus Account ............................................................ 52Tabel 3.8 Skenario Use Case Input Stopword ............................................................ 54Tabel 3.9 Skenario Use Case Edit Stopword .............................................................. 55Tabel 3.10 Skenario Use Case Hapus Stopword ........................................................ 57Tabel 3.11 Skenario Use Case Input Kata Dasar ........................................................ 58Tabel 3.12 Skenario Use Case Edit Kata Dasar ......................................................... 60Tabel 3.15 Skenario Use Case Deteksi Plagiarisme Koleksi Dokumen Skripsi ........ 64Tabel 3.16 Skenario Use Case Kelola Dokumen Skripsi Baru .................................. 66Tabel 3.17 Skenario Use Case Deteksi Plagiarisme Dokumen Skripsi ...................... 67Tabel 3.18 Skenario Use Case Pencarian Koleksi Dokumen Skripsi ......................... 69Tabel 3.19 Kelas Perancangan .................................................................................... 95Tabel 3.20 Diagram Relasional Skripsi .................................................................... 148Tabel 3.21 Diagram Relasional Kalimat ................................................................... 148Tabel 3.22 Diagram Relasional DokumenSimilarity ................................................ 149Tabel 3.23 Diagram Relasional User ........................................................................ 149Tabel 3.24 Diagram Relasional Stopword ................................................................ 149Tabel 3.25 Diagram Relasional Kamus .................................................................... 150Tabel 4.1 Implementasi Controller ........................................................................... 180Tabel 4.2 Diagram Relasional Kamus ...................................................................... 181Tabel 4.3 Ketentuan Pengujian Deteksi Plagiarisme ............................................... 214

  

DAFTAR GAMBAR

Gambar 2.1 Gambaran Sistem .................................................................................... 16Gambar 2.2 Gambaran Umum Information Retrieval ................................................ 18Gambar 2.3 Tahapan Preprocessing ........................................................................... 19Gambar 2.4 Tahapan Tokenisasi ................................................................................. 20Gambar 2.5 Proses Deteksi Plagiat PPChecker .......................................................... 27Gambar 3.1 Gambaran Umum Sistem ........................................................................ 37Gambar 3.2 Algoritma Overlap Measure Function .................................................... 38Gambar 3.3 Alur Pencarian Nilai Threshold .............................................................. 40Gambar 3.4 Diagram Use Case................................................................................... 43Gambar 3.5 Diagram Konteks .................................................................................... 93Gambar 3.6 Diagram Kelas Keseluruhan ................................................................... 95Gambar 3.7 Diagram ERD ........................................................................................ 147Gambar 3.8 Antarmuka Form Login ........................................................................ 150Gambar 3.9 Antarmuka Menu Utama Admin ........................................................... 151Gambar 3.10 Antarmuka Tab Add Account ............................................................. 153Gambar 3.12 Antarmuka Tab Stopword ................................................................... 155Gambar 3.13 Antarmuka Tab Kamus ....................................................................... 156Gambar 3.14 Antarmuka Form Preprocessing Admin ............................................. 157Gambar 3.15 Antarmuka Form Deteksi .................................................................... 158Gambar 3.16 Antarmuka Tab Preprocessing ............................................................ 160Gambar 3.17 Antarmuka Tab Deteksi ...................................................................... 161Gambar 3.18 Antarmuka Form Pencarian Skripsi User ........................................... 162Gambar 4.1 Implementasi Antarmuka Form Login .................................................. 168Gambar 4.2 Implementasi Antarmuka Form Menu Utama Admin ......................... 169Gambar 4.3 Implementasi Antarmuka Form Account Admin Tab Add Account 171Gambar 4.4 Implementasi Antarmuka Form Account Admin Tab Edit Account ... 171Gambar 4.5 Implementasi Antarmuka Form Setting Admin Tab Stopword ............ 172Gambar 4.6 Implementasi Antarmuka Form Setting Admin Tab Kamus ................ 173Gambar 4.7 Implementasi Antarmuka Form Preprocessing Admin ........................ 174Gambar 4.8 Implementasi Antarmuka Form Deteksi ............................................... 175Gambar 4.9 Implementasi Antarmuka Form Menu Utama User .............................. 176Gambar 4.10 Implementasi Antarmuka Form Preprocessing User Tab PreprocessingGambar 4.11 Implementasi Antarmuka Form Preprocessing User Tab Deteksi ...... 178Gambar 4.12 Implementasi Antarmuka Form Pencarian Skripsi User ..................... 179

   I BAB

PENDAHULUAN

1.1 Latar Belakang

  Teknologi saat ini semakin berkembang pesat di berbagai bidang kehidupan , hal ini begitu cepat mendorong banyak orang memanfaatkan teknologi untuk melakukan pekerjaan – pekerjaan agar menjadi lebih praktis, efisien, efektif dan akurat pengerjaannya dalam kehidupan sehari –hari. Oleh karena teknologi telah berkembang sangat pesat, penyalahgunaan akan teknologi juga semakin berkembang di berbagai kalangan masyarakat. Keinginan manusia untuk melakukan hal yang mudah dan praktis memicu berbagai tindakan negatif, salah satu tindakan negatif yang banyak dilakukan adalah plagiarisme . Plagiarisme merupakan suatu tindakan yang menjiplak, mencuri gagasan, ide, atau hasil karya orang lain, hal ini terjadi karena keterbatasan dan kurang kemampuan seseorang dalam berkarya dan menghasilkan pemikiran,ide, atau gagasan yang baru.

  Plagiarisme terjadi pada berbagai bentuk karya , seperti karya tulis , lagu, film, dan berbagai karya yang lain. Akan tetapi yang paling sering diplagiat adalah karya tulis karena sangat mudah untuk menjiplaknya. Menulis adalah suatu kegiatan yang sulit, sebab dituntut keterampilan serta kemampuan menulis yang

  2

  adalah bagaimana menuliskan ide – ide milik sendiri yang ada dalam pikiran agar benar – benar tersampaikan dalam bentuk tulisan. Karena menulis itu sulit, maka membutuhkan waktu dalam mengerjakannya, dalam banyak kasus untuk mempersingkat waktu banyak orang yang mencampurkan ide orang lain ke dalam ide tulisannya sendiri. Dan ini yang dinamakan sebagai tindakan plagiarisme, yang dengan sengaja menggunakan ide dan pemikiran orang lain tanpa atribusi[1]. Maka dari itu diperlukan suatu cara untuk melakukan deteksi tindakan plagiat terhadap karya tulis, agar tindakan plagiat tersebut dapat diatasi.

  Tindakan plagiarisme terhadap karya tulis dapat terjadi dimana – mana, dan paling banyak ditemukan pada dunia pendidikan mulai dari tingkat sekolah sampai perguruan tinggi. Terutama pada tingkat perguruan tinggi, dikalangan mahasiswa tindakan plagiarisme tidak menjadi hal asing lagi. Hal ini terjadi karena mahasiswa hampir setiap hari mengerjakan tugas karya tulis dari dosen seperti laporan, tugas, makalah dan skripsi. Apalagi dalam pengerjaan skripsi, tindakan plagiat paling sering dilakukan padahal skripsi merupakan tugas akhir untuk mencapai kelulusan bagi seorang mahasiswa, akan tetapi banyak mahasiswa yang melakukan kecurangan dalam pengerjaannya. Dalam membuat skripsi sering kali mahasiswa mengutip atau menggunakan beberapa atau keseluruhan kata – kata, gagasan, ide, dan bagian – bagian lain hasil skripsi orang

  3

  tidak ingin bersusah payah dalam menulis skripsi. Hal ini sangat dilarang keras oleh setiap universitas , sebab mahasiswa yang melakukan tindakan plagiarisme tidak mencerminkan sikap kreatif sebagai kalangan terpelajar.

  Universitas Sanata Dharma merupakan salah satu perguruan tinggi swasta yang melarang mahasiswa untuk melakukan tindakan plagiarisme terhadap pembuatan skripsi. Saat ini Universitas Sanata Dharma menggunakan dokumen digital skripsi untuk media penyimpanan dan pemberian informasi skripsi bagi mahasiswa. Penggunaan dokumen digital skripsi oleh pihak universitas dimaksudkan untuk membantu mahasiswa yang akan menempuh skripsi agar mendapatkan informasi, pandangan,wawasan, dan referensi bagi skripsi yang akan dibuat. Akan tetapi penggunaan dokumen digital skripsi tidak menjadi efisien, dikarenakan mahasiswa melakukan penyalahgunaan dengan melakukan plagiarisme terhadap dokumen skripsi yang disediakan oleh pihak universitas.

  Mahasiswa yang tidak memiliki kreativitas dapat dengan mudah menyalin isi dari dokumen digital skripsi. Karena dokumen digital skripsi dapat dengan mudah diplagiat oleh mahasiswa, maka diperlukan sebuah sistem pendeteksi plagiarisme terhadap dokumen skripsi.

  Sistem pendeteksian plagiarisme pada dokumen skripsi ini sangat penting dilakukan untuk usaha menemukan tindakan plagiat skripsi yang dilakukan oleh

  4

rabin karp [3][4]. Pada pendeteksian plagiarisme menggunakan rabin karp,

  algoritma ini digunakan untuk mendeteksi plagiarisme dengan mencari pola tulisan yang didapat dari substring-substring pada sebuah teks dalam dokumen, algoritma ini menggunakan hashing untuk menemukan sebuah substring dalam sebuah teks [3]. Pada pendeteksi plagiarisme menggunakan algoritma smith

  

waterman, dengan melakukan pembandingan antara dua dokumen untuk

  mengetahui tingkat kemiripan antara kedua dokumen tersebut. Hasil pembandingan dinyatakan dalam bentuk bobot atau nilai kemiripan dari dokumen yang dibandingkan [4]. Sistem pendeteksian plagiarisme yang akan dibuat menggunakan algoritma overlap measure function , algoritma ini mampu mendeteksi plagiarisme dengan membandingkan beberapa dokumen yang telah diekstrak. Dokumen – dokumen tersebut terlebih dahulu diolah dengan tahap

  

preprocessing dan dipecah menjadi per kalimat. Setelah didapatkan kalimat –

  kalimat dari setiap dokuem asli dan dokumen query, selanjutnya kalimat tersebut akan diproses ke dalam perhitungan overlap measure function untuk mendapatkan nilai similarity antara dokumen – dokumen asli dengan dokumen

  

query. Lalu dari hasil perhitungan nilai - nilai similarity, akan dimasukkan ke

  algoritma overlap measure function, untuk melakukan perbandingan nilai – nilai

  

similarity pada dokumen – dokumen asli dengan dokumen query, sehingga akan

  didapat informasi hasil pendeteksian plagiarisme pada dokumen, pendeteksian

  5

  disesuaikan dengan nilai threshold yang didapat sebelum proses pendeteksian dilakukan [5].

  1.2 Rumusan Masalah

  Berdasarkan latar belakang yang telah diuraikan di atas, maka rumusan masalah yang didapatkan adalah

  Bagaimana mengimplementasikan metode overlap measure function untuk 1.

  membangun sistem pendeteksi plagiarisme pada dokumen skripsi.

  Bagaimana ketepatan metode overlap measure function dalam melakukan 2.

  deteksi plagiarisme pada dokumen skripsi

  1.3 Batasan Masalah

  1. Pendeteksian plagiarisme hanya dilakukan pada topik sistem informasi dokumen skripsi Program Studi Teknik Informatika Universitas Sanata Dharma Yogyakarta.

  Pendeteksian plagiarisme dokumen skripsi dilakukan pada teks Abstrak,Bab1, 2.

  dan Bab2 dari dokumen skripsi.

  Jumlah data dokumen skripsi yang akan diproses pada sistem ini berjumlah 50 3.

  dokumen skripsi teknik informatika.

  4. Pendeteksian plagiarisme dokumen skripsi hanya dilakukan pada dokumen yang berbahasa Indonesia.

  6 6.

  Pendeteksian plagiarisme dokumen skripsi tidak menghiraukan adanya kutipan dalam teks.

  1.4 Tujuan Penelitian

  Tujuan dari penelitian ini adalah sebagai berikut : 1.

  Mendeteksi tindakan plagiarisme dokumen skripsi yang dilakukan oleh mahasiswa Universitas Sanata Dharma.

  2. Menguji ketepatan metode overlap measure function dalam usaha untuk mendeteksi tindakan plagiarisme terhadap dokumen skripsi.

  1.5 Luaran Yang Diharapkan

  Sebuah sistem yang dapat mendeteksi tindakan plagiarisme pada dokumen skripsi mahasiswa Universitas Sanata Dharma Yogyakarta dengan menerapkan metode overlap measure function.

  1.6 Metodologi Penelitian

  Metodologi penelitian yang digunakan dalam penyelesaian tugas akhir ini adalah sebagai berikut :

  1. Studi pustaka Studi literatur dilakukan untuk mempelajari dan memahami konsep tentang tindakan plagiarisme, mempelajari bagaimana cara mendeteksi tindakan plagiarisme, mempelajari metode overlap measure function yang akan dipergunakan untuk mendeteksi tindakan plagiarisme, dan mempelajari materi

  7

  ilmu pemerolehan informasi. Konsep dan materi yang dipelajari didapatkan dari berbagai sumber seperti buku dan internet.

  Observasi 2.

  Untuk mendapatkan data tentang dokumen digital skripsi program studi Teknik Informatika, maka penulis melakukan survei ke perpustakaan Universitas Sanata Dharma Yogyakarta.

  3. Analisis dan perancangan sistem Melakukan analisis terhadap masalah dan kebutuhan sistem yang akan dibangun. Lalu melakukan perancangan umum sistem sesuai dengan kebutuhan sistem.

  4. Pembuatan Sistem Berdasarkan hasil analisis dan perancangan sistem, maka tahap selajutnya adalah pembuatan sistem.

  Implementasi dan pengujian 5.

  Tahap ini adalah tahap untuk menjalankan sistem yang telah dibuat, lalu melakukan pengujian terhadap efektivitas dan efisiensi dari sistem pendeteksian plagiarisme, dan melakukan pengujian terhadap ketepatan metode overlap measure function yang dipergunakan untuk mendeteksi plagiarisme dokumen skripsi.

  8 Evaluasi 6.

  Menganalisis hasil implementasi dan membuat kesimpulan terhadap penelitian tugas akhir yang telah dikerjakan.

1.7 Sistematika Penulisan

  Sistematika penulisan Tugas Akhir ini adalah sebagai berikut:

  BAB I PENDAHULUAN Bab ini berisi latar belakang masalah, rumusan masalah, batasan

  masalah, tujuan penelitian, ,metodologi penelitian, dan sistematika penulisan.

  BAB II TINJAUAN PUSTAKA Bab ini berisi landasan teori yang merupakan dasar – dasar teori yang

  dipergunakan dalam membuat Tugas Akhir, yaitu teori tentang plagiarisme, pemerolehan informasi dan metode overlap measure

  function.

  BAB III ANALISA DAN PERANCANGAN SISTEM Bab ini berisi penjelasan mengenai analisa masalah, analisa kebutuhan

  sisten dan penjelasan mengenai gambaran umum dari sistem yang dibuat.

  BAB IV IMPLEMENTASI SISTEM Bab ini berisi hasil langkah – langkah implementasi dari sistem yang

  9 BAB V PENUTUP

  Bab ini berisi kesimpulan dan saran atas hasil penelitian dari Tugas akhir ini.

BAB II LANDASAN TEORI

2.1 Plagiarisme

2.1.1 Definisi Plagiarisme

  Plagiarisme berasal dari bahasa Latin yaitu plagiarius yang berarti penculik, atau dalam bahasa Latin yang lain yaitu plagus. Definisi plagiarisme secara luas yaitu mengambil alih bahan, ide, gambar, tulisan oleh mereka yang mengaku sebagai pencipta asli[6]. Beberapa definisi plagiarisme dalam arti yang lebih khusus yang pertama yaitu tindakan yang dengan sengaja menyalin kata – kata atau ide milik orang lain tanpa atribusi. Definisi plagiarisme yang kedua yaitu membeli, meminjam, atau mencuri sebuah makalah penelitian atau esai milik orang lain, kemudian menampilkannya sebagai milik pribadi. Definisi yang ketiga yaitu mengambil garis besar gagasan dan argumen milik orang lain, lalu dirangkai kembali menggunakan kata – kata sendiri. Dan definisi khusus plagiarisme yang terakhir yaitu menyajikan fakta atau data statistik tanpa mengutip sumber yang asli [1].

  Plagiarisme adalah bentuk penyalahgunaan hak kekayaan intelektual milik orang lain, yang mana karya tersebut direpresentasikan dan diakui

  10

  kreativitas banyak orang, kekosongan akan ide, kreativitas, dan sifat malas yang memunculkan tindakan plagiarisme. Umumnya tindakan plagiarisme marak dikalangan siswa dan mahasiswa, seharusnya mereka sebagai kalangan terpelajar harus lebih produktif dalam berkarya dan menjauhi tindakan plagiarisme untuk kepentingan pribadi. Beberapa alasan tindakan plagiarisme semakin marak dilakukan yaitu kurangnya kesadaran beretika, perangkat teknologi informasi dengan mobilitas tinggi yang memudahkan para plagiator mengambil sumber - sumber milik orang lain melalui akses internet, agar dapat memperoleh prestasi akademik yang memuaskan dengan berbagai upaya, dan para plagiator yang semakin profesional dalam menggunakan dan mencari material yang dibutuhkan [7].

2.1.2 Bentuk Plagiarisme

  Bentuk-bentuk plagiarisme yang sering terjadi di dunia akademis berdasarkan artikel Clough (2003:2) adalah:[2]

  Plagiarisme kata per kata, merupakan penyalinan kalimat secara 1.

  langsung dari sebuah dokumen teks tanpa adanya pengutipan atau perizinan.

  2. Plagiarisme parafrase, merupakan penulisan ulang dengan

  11 3.

  Plagiarisme sumber sekunder, merupakan perbuatan mengutip

  kepada sumber asli yang didapat dari sumber sekunder dengan menghiraukan teks asli dari sumber yang sebenarnya.

  4. Plagiarisme struktur sumber, merupakan penyalinan / penjiplakan struktur suatu argumen dari sebuah sumber.

  5. Plagiarisme ide, merupakan penggunaan ulang suatu gagasan/pemikiran asli dari sebuah sumber teks tanpa bergantung bentuk teks sumber.

  6. Plagiarisme authorship, merupakan pembubuhan nama sendiri secara langsung pada hasil karya orang lain.

  Bila dilihat dari berbagai macam bentuk-bentuk plagiarisme diatas, dapat disimpulkan bahwa tindakan plagiarisme yang terjadi di dunia akademis lebih cenderung kepada tindakan menggunakan kembali suatu bagian dokumen teks berupa kata/kalimat dari suatu sumber yang tidak mengikuti tata aturan hak cipta, seperti aturan pengutipan ( citation ) ataupun ketidakjelasan sumber/pengarang asli (bibliography).

  Beberapa faktor yang dapat digunakan untuk mengidentifikasikan

  12 Penggunaan kosa kata.

  1. Menganalisis kosa kata yang digunakan dalam suatu tugas terhadap penggunaan kosa kata sebelumnya dapat membantu menentukan apakah mahasiswa benar-benar telah menulis teks tersebut. Dengan menemukan suatu kosa kata baru dalam jumlah yang besar (terutama kosa kata lanjut) dapat menentukan apakah mahasiswa menulis teks tanpa melakukan plagiarisme.

  2. Perubahan kosa kata.

  Apabila penggunaan kosa kata berubah secara significant dalam suatu teks, hal ini dapat mengindikasikan plagiarisme dengan cara

  copy and paste.

  3. Teks yang membingungkan.

  Apabila alur dari suatu teks tidak halus dan tidak konsisten, hal ini mengindikasikan penulis tidak menulis menggunakan pemikirannya sendiri atau beberapa bagian dari tulisannya bukanlah hasil karyanya.

  Penggunaan tanda baca.

  4.

  13 Jumlah kemiripan teks.

  5. Pasti ada beberapa kemiripan antara beberapa teks yang menulis dengan topic yang sama seperti nama-nama, istilah-istilah dan sebagainya. Bagaimanapun, tidak wajar bila beberapa teks yang berbeda memiliki kesamaan atau kemiripan teks dalam jumlah yang besar.

  6. Kesalahan ejaan yang sama.

  Merupakan hal yang biasa terjadi bagi seorang penulis dalam membuat suatu karya tulis. Menjadi tidak wajar bila beberapa teks yang berbeda memiliki kesalahan-kesalahan yang sama dalam pengejaan atau jumlah ejaan salah yang sama.

  7. Distribusi kata – kata.

  Tidak wajar apabila distribusi penggunaan kata dalam teks yang berbeda memiliki kesamaan. Sebagai contoh, suatu teks memiliki parameter yang sama untuk suatu distribusi statisitk yang digunakan untuk menjelaskan penggunaan istilah.

  Struktur sintaksis teks.

  8.

  14

  wajar bila penggunaan struktur sintaksis yang digunakan oleh beberapa penulis akan berbeda.

  9. Rangkaian – rangkaian panjang kata yang sama.

  Tidak wajar apabila suatu teks yang berbeda (bahkan yang menggunakan judul yang sama) memiliki rangkaian/urutan karakter yang sama.

  10. Order kemiripan antar teks.

  Hal ini bisa mengindikasikan plagiarisme apabila orde kecocokan kata atau frase antar dua teks sama. Meskipun diajarkan untuk menyajikan fakta-fakta dalam suatu aturan (contohnya pendahulan, isi, kemudian kesimpulan), kurang wajar jika fakta-fakta yang sama dilaporkan dalam orde yang sama.

  Ketergantungan pada frasa atau kata tertentu.

  11. Seorang penulis mungkin memilih penggunaan suatu kata atau frase tertentu. Kekonsistenan penggunaan kata-kata tersebut dalam suatu teks yang ditulis oleh orang lain dengan menggunankan kata yang berbeda dapat mengindikasikan plagiarisme.

  15 digunakan dengan frekuensi yang sama.

  13. Keputusan untuk menggunakan kalimat panjang atau kalimat pendek. Tanpa sepengetahuan kita, para penulis tentu memiliki keputusan penggunaan panjang kalimat yang tidak biasa dikombinasikan dengan fitur-fitur lain.

  Teks yang dapat dibaca.

  14. Penggunaan metrik/ukuran seperti index Gunning FOG, Flesch

  Reading Ease Formula atau SMOG dapat membantu menentukan

  suatu skor kemampuan. Tidak wajar apabila penulis yang berbeda akan memiliki skor yang sama.

  15. Referensi yang tidak jelas.

  Apabila referensi yang muncul dalam suatu teks tetapi tidak terdapat pada daftar pustaka, hal ini dapat mengindikasikan plagiarisme cut and paste, dimana penulis tidak menyalin referensinya secara lengkap.

2.2 Definisi Sistem

  Sistem adalah suatu kesatuan usaha yang terdiri dari bagian – bagian

  16

  • – elemen yang saling berinteraksi secara teratur dalam rangka mencapai tujuan atau sub tujuan[8]. Definisi sistem secara sederhana adalah suatu kumpulan atau himpunan dari unsur atau variabel – variabel yang saling terorganisasi, saling berinteraksi, dan saling bergantung satu sama lain [9] .

  Arsitektur dari sistem digambarkan pada gambar 2.1 , gambar tersebut menjelaskan bahwa di dalam sebuah sistem terdapat 4 elemen, yaitu input, proses, kontroler, dan output. Keempat elemen tersebut saling berhubungan untuk mencapai tujuan dari sebuah sistem. Pertama – tama untuk melaksanakan sebuah sistem harus ada elemen input yang merupakan hal – hal yang dimasukan ke dalam sistem, lalu input akan di proses sehingga menghasilkan output dari sistem. Terdapat balikan yang berhubungan dengan ke ketiga elemen yaitu input, proses, dan output untuk menjamin ketiga elemen tersebut dapat berjalan dengan baik

  Input Proses Output Balikan

Gambar 2.1 Gambaran Sistem[10]

  17

2.3 Konsep Information Retrieval

2.3.1 Definisi Information Retrieval

  Information Retrieval adalah sebuah bidang yang berhubungan dengan

  struktur, analisis, organisasi, penyimpanan, pencarian dan pemerolehan dari informasi (Salton,1968). Gerard Salton merupakan orang yang pertama kali mencetuskan bidang Information Retrieval pada tahun 1960, lalu menuangkan konsep Information Retrieval dalam bukunya pada tahun 1968 [11].

  Information Retrieval dipergunakan untuk menemukan kembali informasi – informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis ( Bunyamin,2008 ). Information

  Retrieval berhubungan dengan pencarian informasi yang isinya tidak memiliki

  struktur. Demikian pula ekspresi kebutuhan pengguna yang disebut query, juga tidak memiliki struktur. Serta koleksi dokumen yang juga tidak terstruktur[12]. Informasi retrieval merupakan bidang yang berkembang secara paralel dengan sistem basis data selama beberapa tahun. Sistem basis data lebih fokus pada query dan proses transaksional dari struktur data. Sedangkan dalam Informasi retrieval ditemukan dokumen yang tidak terstruktur , pencarian berdasarkan kata kunci dan tingkat kesamaan [13].

  18

  kebutuhan informasi yang dimiliki oleh user, kebutuhan informasi tersebut merupakan suatu permintaan kebutuhan oleh user yang akan diformulasikan menjadi query. Permintaan user diformulasikan menjadi query agar sistem dapat mengenali permintaan yang disampaikan oleh user kepada sistem.

  Kemudian di sisi lain terdapat koleksi dokumen yang akan dilakukan proses

  indexing sehingga menghasilkan indexed document . Lalu dilakukan

  perbandingan query dengan kumpulan dokumen yang telah diproses

  indexing, proses perbandingan ini juga disebut proses pencocokan. Dari

Dokumen yang terkait

Deteksi outlier menggunakan Algoritma Local Outlier Probability studi kasus data akademik mahasiswa Program Studi Teknik Informatika Universitas Sanata Dharma

1 9 263

Deteksi Outlier menggunakan algoritma Block Based Nested Loop studi kasus data akademik mahasiswa Program Studi Teknik Informatika Universitas Sanata Dharma

0 1 200

Pemanfaatan teknologi WAP untuk sistem informasi skripsi online : studi kasus Teknik Informatika Universitas Sanata Dharma Yogyakarta - USD Repository

0 0 117

Aplikasi skripsi digital online berbasis web : studi kasus di UPT Perpustakaan Kampus III Universitas Sanata Dharma - USD Repository

0 0 134

Implementasi algoritma K-Means untuk memprediksi nilai mahasiswa : studi kasus mahasiswa Teknik Informatika Universitas Sanata Dharma - USD Repository

0 1 76

Sistem pendukung pengambilan keputusan seleksi dosen pembimbing pra TA dengan metode Promethee : studi kasus Jurusan Teknik Informatika Universitas Sanata Dharma Yogyakarta - USD Repository

1 0 157

Pendaftaran kerja praktek menggunakan JSP dengan Framework Apache Struts : studi kasus Teknik Informatika Universitas Sanata Dharma - USD Repository

0 0 186

SPPK penjadwalan kuliah dengan algoritma genetika : studi kasus Jurusan Teknik Informatika Universitas Sanata Dharma Yogyakarta - USD Repository

0 0 101

Pengujian perangkat lunak menggunakan metode Black Box : studi kasus Exelsa Universitas Sanata Dharma - USD Repository

0 0 306

Sistem penelusuran skripsi : studi kasus di Perpustakaan Universitas Sanata Dharma - USD Repository

0 0 253