Implementasi Algortima Manber Pada Persamaan Makna Bahasa Indonesia dan Melayu Berbasis Android

BAB 1
PENDAHULUAN

1.1

Latar Belakang

Bangsa Indonesia memiliki berbagai budaya yang tersebar di semua wilayah
Indonesia.

Salah

satu

bentuk

keanekaragaman

budaya

tersebut


adalah

keanekaragaman bahasa yang dimiliki oleh hampir setiap suku bangsa dan daerah di
Indonesia. Bahasa merupakan budaya yang paling erat kaitannya dengan kehidupan
masyarakat pemakainya.
Dari sudut linguistik, bahasa Indonesia adalah salah satu dari ragam bahasa
melayu yang sebenarnya berasal dari Melayu Riau. Penutur bahasa Indonesia kerap
kali menggunakan versi sehari-hari (kolokial) dan atau mencampur adukkan dengan
dialek Melayu lainnya. Dari sudut pandang yang lain ternyata banyak ditemukan
kemiripan makna kata antara bahasa Indonesia dan Melayu, dengan pernyataan
tersebut maka penulis mengambil studi kasus tersebut dengan mengimplementasikan
algoritma manber untuk mencari persamaan makna antara bahasa Indonesia dan
Melayu.
Algoritma Manber dapat dipakai untuk mendeteksi kemiripan suatu teks
ataupun dokumen dengan waktu proses yang cepat serta akurat. Algoritma
Winowwing dan Manber mempunyai cara kerja yang hampir sama dengan
perbedaannya, yaitu proses pemilihan fingerprint dokumennya. Proses Stemming dan
Synonim


Recognition

bisa

juga

diimplementasikan

kedalam

sistem

untuk

meningkatkan keakuratan dalam mendeteksi kemiripan dokumen teks serta untuk
meyelesaikan beberapa teknik penjiplakan (Djafar, 2015).

Universitas Sumatera Utara

8


Pada penelitian terdahulu Djafar (2015) dengan judul penelitian Deteksi kemiripan
dokumen teks menggunakan algoritma Manber pada penelitian tersebut disimpulkan
bahwa dokumen teks sering dijadikan sebagai objek penjiplakan atau tindak plagiat
karena perkembangan teknologi yang semakin pesat tentu akan memudahkan tindakan
tersebut dilakukan sistem yang dibangun dengan mengimplementasikan teknik
stemming porter dan synonym recognition untuk mengatasi teknik penjiplakan seperti
Technical

disguise dan Disguised plagiarism, Di dalam penelitian ini terdapat

perbedaan hasil yang didapatkan dengan menggunakan teknik tersebut mencapai 15 %
dibandingkan tanpa penggunannya.
Menurut Winangga, Marji dan Ridok (2014) dengan hasil penelitiannya
membuat sistem deteksi plagiarism pada dokumen teks bahasa Indonesia
menggunakan algoritma Winowwing dan Stemming. Algoritma Winowwing akan
mencari fingerprint menghilangkan imbuhan kata Similiarity antar dokumen
berdasarkan kecocokn substring antar fingerprint yang akan dihitung menggunakan
prinsip jaccard coefficient.
Menurut Kurniawati, Sekarwati dan Wicaksana (2012) dengan hasil penelitian

Arsitektur untuk aplikasi deteksi kesamaan dokumen Bahasa Indonesia . Disimpulkan
bahwa pengukuran kesamaan dokumen telah banyak dilakukan untuk dokumen
Bahasa Inggris. Pengukuran kesamaan untuk dokumen Bahasa Indonesia relatif
sedikit. Kesamaan dokumen bukan hanya ditinjau dari sisi kata yang digunakan
sebagai penyusun kalimat adalah sama, akan tetapi juga dikatakan dikatakan mirip
apabila isi dokumen memiliki makna yang sama. Penelitian pengukurannya kesamaan
dokumen Bahasa Indonesia relatif sedikit. Kesamaan dokumen bukan hanya ditinjau
dari sisi kata yang digunakan sebagai penyusun kalimat adalah sama, akan tetapi juga
dikatakan mirip apabila isi dokumen memiliki makna yang sama. Penelitian
pengukuran kesamaan dokumen Bahasa Indonesia yang ada hanya mengukur
kesamaan kata ataupun kalimat, belum mempertimbangkan struktur kalimat, jumlah
kalimat, posisi kalimat dan makna kata untuk membandingkan kalimat. Penelitian ini
bertujuan untuk mengembangkan arsitektur aplikasi deteksi kesamaandokumen teks
Bahasa Indonesia dengan mempertimbangkan struktur kalimat, jumlah kalimat, posisi

Universitas Sumatera Utara

9

kalimat dan memperhitungkan faktor sinonim kata untuk melihat dari sisi makna kata.

Arsitektur aplikasi deteksi kesamaan dokumen meliputi tahap pemilahan dokumen
menjadi kalimat, pemilahan kalimat menjadi kata, menentukan struktur kalimat dan
membandingkan kesamaan dokumen.
Menurut Mujahidin (2013), dengan hasil penelitiannya Implementasi Metode
Rabin-Karp untuk mendeteksi kesamaan dokumen. Plagiat atau biasa disebut
penjiplakan adalah sebuah masalah yang cukup signifikan pada berbagai kalangan
yang selalu berinteraksi dengan komputer. Hal plagiat yang biasanya dilakukan
terhadap konten digital adalah melakukan copypaste, quote, dan revisi terhadap
dokumen asli. Untuk mengantisipasinya, dibutuhkan suatu cara yang dapat
menganalisis teknik-teknik plagiat yang dilakukan. Ada beberapa pendekatan yang
bisa diambil, salah satunya dengan mempergunakan algoritma Rabin Karp.
Pada penelitian terdahulu, Algoritma Manber dapat diimplementasikan untuk
mendeteksi persamaan teks dalam dokumen berekstensi .*pdf berdasarkan

hal

tersebut penulis mencoba untuk menyelesaikan kasus persamaan makna bahasa
Indonesia dan Melayu yang memiliki persamaan makna tetapi berbeda kata
menggunakan algoritma Manber, diharapkan penelitian ini dapat berguna untuk
masyarakat Indonesia untuk mengetahui persamaan makna tersebut.


1.2

Rumusan Masalah
Perumusan masalah adalah sebagai berikut :

a.

Untuk mengetahui adanya dalam kamus digital Melayu Langkat yang
memanfaatkan algoritma Manber untuk mencari persamaan makna.

b.

Untuk mengetahui proses penerapan serta keakuratan dengan metode dan
algoritma yang digunakan untuk mencari persamaan makna bahasa Indonesia dan
Melayu.

c.

Untuk mengetahui pendeteksi kesamaan makna sehingga didapatkan perbedaan

hasil Smiliaritas antara bahasa indonesia dan Melayu yang di-inputkan.

1.3

Ruang Lingkup Masalah

Universitas Sumatera Utara

10

Batasan masalah didalam penelitian ini adalah sebagai berikut :
a.

Kasus yang diuji hanya menerapkan bahasa Indonesia dan Melayu Langkat
dengan data yang diproses hanya mencari persamaan makna yang memiliki kata
berbeda.

b.

Tidak memperhatikan kesalahan penulisan kata (typo).


c.

Pengguna meng-input berupa teks, tidak berupa simbol (&,%,#,!, dan lainnya),
karakter spesial, gambar, dan suara.

d.

Output dari hasil sistem yang dibangun berupa persamaan makna antara bahasa
Indonesia dengan Melayu Langkat.

e.

Kamus yang digunakan di dalam penelitian ini adalah kamus bahasa Melayu
Langkat – Indonesia.

f.

1.4


Sistem ini dibangun menggunakan bahasa pemrograman Java berbasis Android.

Tujuan Penelitian

Tujuan penelitian implementasi algoritma Manber pada persamaan makna bahasa
Indonesia dan Melayu adalah:
a.

Mengetahui cara kerja dari algoritma Manber yang diimplementasikan untuk
mencari kesamaan makna bahasa Indonesia dan bahasa Melayu.

b.

Mencari persamaan makna bahasa Indonesia dan Melayu agar mendapatkan
informasi yang bermanfaat dalam mendapatkan persamaan makna tersebut.

c.

Mencari kemiripan kata (string) dengan menggunakan Teknik Hashing, yang
akhirnya mendapatkan nilai presentase kemiripan menggunakan Jaccard’s

Similarity Coeficient .

1.5

Manfaat Penelitian

Manfaat didalam penelitian ini adalah sebagai berikut :
a.

Untuk mendapatkan informasi tentang persamaan makna antara bahasa
Indonesia dan Melayu

b.

Memudahkan masyarakat untuk mendapatkan informasi tentang persamaan
makna antara bahasa Indonesia dan Melayu.

Universitas Sumatera Utara

11


c.

Sebagai media pembelajaran untuk sekolah-sekolah terutama fakultas sastra
dengan program studi sastra Indonesia dan Melayu yang ingin mempelajari
makna antara bahasa Indonesia dan Melayu.

d.

Sebagai bahan pertimbangan penelitian selanjutnya apabila ingin dikembangkan
oleh para peneliti lainnya.

1.6

Metodologi Penelitian

Dalam Metodologi penelitian akan digunakan beberapa tahapan dalam penelitian ini
yaitu sebagai berikut:
a. Library Research
Pada library research, penulis mempelajari dari sumber-sumber seperti buku dalam
perpustakaan, dengan sumber-sumber yang berhubungan dengan text mining dan
Algoritma Manber.
b. Browsing
Penulis menjelajah beberapa sumber seperti e-journal dan e-book yang menjadi
tuntunan penulis untuk menyelesaikan penelitian ini.
c. Analisis dan Perancangan Sistem
Pada tahapan analisis dan perancangan sistem, penulis akan membuat pemodelan
sistem dengan Unified Modeling Language (UML) yang berfungsi untuk
memudahkan pengguna untuk mengerti bagaimana sistem berjalan dengan
memanfaatkan use case diagram, activity diagram, class diagram dan sequence
diagram.
d. Implementasi
Hasil dari analisi dan perancangan sistem diimplementasikan kedalam bahasa
pemrograman dengan menggunakan Java sebagai bahasa pemrogramannya, serta
platform Android untuk menjalankan hasil sistem dari penelitian penulis.
e. Uji Coba
Tahapan uji coba merupakan tahapan yang penting dalam suatu pembangunan suatu
sistem yaitu melihat seberapa baik pengimplementasiannya dan apakah tepat dengan

Universitas Sumatera Utara

12

tujuan penelitan.

1.7

Sistematika Penulisan

Untuk mempermudah penulisan Skripsi, penulis membuat suatu sistematika penulisan
terdiri dari:

BAB 1

PENDAHULUAN
Pada Bab ini berisikan berisikan latar belakang, identifikasi masalah,
batasan masalah, maksud dan tujuan penelitian, kegunaan penelitian,
metode penelitian serta sistematika penulisan.

BAB 2

LANDASAN TEORI
Bab ini berisikan uraian dan penjelasan teori-teori singkat yang
berhubungan dengan judul.

BAB 3

PERANCANGAN SISTEM
Pada Bab ini dijelaskan dan diuraikan tentang pembuatan serta
perancangan sistem yang dibangun pada skripsi ini.

BAB 4

IMPLEMENTASI SISTEM
Bab ini menguraikan tentang perancangan program dan implementasi
sistem disertai dengan komponen-komponen kebutuhan sistem.

BAB 5

KESIMPULAN
Pada bab terakhir penulis akan menguraikan beberapa kesimpulan dari
beberapa uraian bab-bab sebelumnya. Dan akan berusaha memberikan
saran yang mungkin bermanfaat.

Universitas Sumatera Utara