Implementasi Algortima Manber Pada Persamaan Makna Bahasa Indonesia dan Melayu Berbasis Android Chapter III V

BAB 3
ANALISIS DAN PERANCANGAN

3.1

Analisis Sistem

Analisis sistem adalah sebuah teknik pemecahan masalah yang menguraikan sebuah
sistem menjadi bagian-bagian komponen dengan tujuan mempelajari seberapa bagus
bagian-bagian komponen tersebut bekerja dan berinteraksi untuk meraih tujuan
mereka. Analisis sistem merupakan pembelajaran sebuah sistem dan komponenkomponennya sebagai prasyarat desain sistem, spesifikasi sebuah sistem baru dan
diperbaiki. Analisis sistem bisa juga disebut sebuah istilah yang secara kolektif
mendeskripsikan fase-fase awal pengembangan sistem (Whitten, 2004).

3.2

Desain Sistem

Information System design atau desain sistem informasi didefenisikan sebagai tugas
yang fokus pada spesifikasi solusi detail berbasis komputer. Dapat juga disebut
physical design. Jika analisis sistem menekankan pada masalah bisnis, maka

sebaliknya desain sistem fokus pada segi teksnis atau implementasi sebuah sistem

3.3

Analisis Masalah

Sebuah sistem dapat dianggap baik apabila sistem tersebut bisa dipahami dan dapat
digunakan oleh orang yang membutuhkan. Adapun masalah didalam sistem yang
ingin dikembangkan adalah bagaimana mencari persamaan makna antara bahasa
indonesia dan bahasa melayu yang sebenarnya memiliki struktur kata, lafal,

Universitas Sumatera Utara

Pengucapan yang sama namun berbeda makna. Data yang digunakan di dalam bahasa
melayu

langkat

sebagai


contoh

:Abah:Babah;

di

keluarga-keluarga

tertentu

dipergunakan untuk menyebut Ayah. Adapun sistem yang ingin dikembangkan
memakai bantuan Algoritma Manber, serta ditambah dengan Fingerprint dan jacquard
coefficient untuk mencari presentase similiritas kata. Untuk mencari dan menelaah awal
dari masalah ini, diperlukan suatu diagram grafis yakni diagram Ishikawa, sehingga
dapat dikembangkan masalah tersebut oleh sebab maupun akibat dari permasalahan
sistem tersebut. Diagram Ishikawa adalah sebuah alat grafis yang digunakan untuk
mengidentifikasi, mengeksplorasi dan menggambarkan suatu masalah, sebab dan akibat
dari masalah itu (Whitten, 2004). Pemodelan diagram Ishikawa dapat dilihat pada
pemodelan gambar dibawah ini :


USER

METHOD

P
r
o
s
e
s

Belum adanya ditemukan
pencarian
persamaan
makna
menggunakan
algortima Manber

penghitungan
tingkat

persamaan
makna

m

Belum adanya
berbasis android
- Kosa kata Bahasa
Indonesia
- Kosa Kata Bahasa Melayu

Aplikasi
untuk
persamaan
makna
Indonesia-melayu
jarang ditemukan.

aplikasi


mencari
bahasa
masing

MECHINE

MATERIAL

Gambar 3.1

Diagram Ishikawa

Pada gambar diagram ishikawa diatas, segi empat paling kanan (kepala ikan)
menunjukkan masalah utama yaitu user atau admin ingin mengetahui kata yang
memiliki sama makna yang akan dicek. sedangkan aspek yang ditunjukkan segi empat

Universitas Sumatera Utara

yang dihubungkan oleh garis ke tulang utama (garis horizontal yang terhubung ke
kepala ikan). Selanjutnya tulang-tulang kecil yang diwakili oleh garis panah yang

mengarah ke tulang-tulang kategori masalah menunjukkan sebab akibat yang muncul
pada permasalahan tersebut.

3.4

Pemodelan Sistem

Permodelan sistem adalah dilakukan untuk memperoleh gambaran yang lebih jelas
tentang objek apa saja yang akan berinteraksi dengan sistem serta hal-hal apa saja yang
dilakukan oleh sebuah sistem sehingga sistem dapat berfungsi sesuai dengan baik sesuai
dengan fungsionalitasnya. Pemodelan ini sendiri menggunakan usecase dan activity
diagram, Usecase digunakan untuk menggambarkan sebuah sistem.

3.4.1

Use Case

Menurut Whitten, Bentley dan Dittman (2004) yang berpendapat bahwa Diagram
usecase


mengindentifikasi

dan

menggambarkan

fungsi-fungsi

sistem

dengan

menggunakan alat yang disebut usecase. Usecase menggambarkan fungsi-fungsi sistem
dari sudut pandangan pengguna eksternal dan dalam sebuah cara dan terminologi yang
mereka pahami. Usecase merupakan hasil penyusunan kembali lingkup fungsionalitas
menjadi banyak pernyataan fungsionalitas sistem yang lebih kecil.

Gambar 3.2 Use case Diagram

Hal yang pertama kali dilakukan sistem yang dibangun adalah user menginput kata

bahasa Melayu yang ingin dicari maknanya yang sama dengan bahasa indonesia, setelah

Universitas Sumatera Utara

kata tersebut di-input-kan maka sistem akan me-load data json dari kata bahasa
indonesia, kemudian diproses sehingga didapatlah hasil berupa persamaan makna antara
bahasa indonesia dan melayu beserta hasil presentase dari kedua kata atau kalimat
tersebut. Dapat dilihat pada gambar 3.1 dan diberikan narasi usecase pada tabel 3.1

Tabel 3.1 Narasi Use Case
Nama

Pencarian Makna Bahasa Indonesia dan Melayu

Aktor

User

Deskripsi


Dalam

pencarian

makna

Bahasa

Indonesia

dan

Melayu

menggunakan algoritma Manber dan Presentase menggunakan
jacquard coefficient
Alur Dasar

Diperlukan sebuah input dari user untuk sistem memproses tugas
yang diberikan oleh user.


Alur Alternatif

User wajib meng-input kata dengan Bahasa Indonesia

Pra Kondisi

User meng-input-kan kata

Pasca Kondisi

User mendapatkan hasil berupa makna

3.4.2

Activity Diagram

Activity Diagram secara grafis digunakan untuk menggambarkan rangkaian aliran
aktifitas baik proses bisnis atau usecase. Diagram ini juga dapat digunakan untuk
memodelkan action yang akan dilakukan saat sebuah operasi dieksekusi, dan

memodelkan hasil dari action tersebut. (Whitten, Bentley, dan Dittman, 2004).
Adapun bentuk ataupun gambaran dari tampilan pencarian yang akan dibuat
dapat dilihat pada gambar 3.3 dan diberikan narasi activity diagram pada tabel 3.2
berikut:

Universitas Sumatera Utara

Gambar 3.3Activity Diagram

Tabel 3.2 Narasi Diagram activity
Nama

Activity Diagram

Actor

User

Deskripsi

Activity Diagram menggambarkan tentang tahap dari
proses eksekusi sistem yang dilakukan oleh user.

Kondisi Awal

User diberikan interface awal

Alur Dasar

Kegiatan User

Respon Sistem

1. input kata

1.

2. Menekan tombol Cari

tampilan masukkan kata.

3. Hasil

2. Sistem me-load makna

Sistem

memberikan

yang bersumber dari json
3. sistem memproses kata
tersebut.
Kondisi Akhir

Sistem memberikan hasil persamaan makna kata.

Universitas Sumatera Utara

3.4.3

Sequence Diagram

Sequence Diagram adalah secara grafis menggambarkan bagaiman objek berinteraksi
dengan suatu sama lain melalui pesan pada eksekusi sebuah usecase atau operasi.
Diagram ini mengilustrasikan bagaimana pesan terkirim dan diterima diantara objek dan
dalam sekuensi apa. (Whitten, Bentley dan Dittman, 2004).
Adapun bentuk ataupun gambaran dari tampilan pencarian yang akan dibuat
dapat dilihat pada gambar 3.4, dan narasi sequence diagrampada tabel 3.3 berikut:

Gambar 3.4 Sequence Diagram

Tabel 3.3 Narasi Sequence Diagram
Nama

Diagram Sequence

Aktor

User

Deskripsi

Diagram sequence mengilustrasikan alur sistem dalam
urutan waktu penggunaan system

Kondisi Awal

Sistem awal hanya menampilkan menu input-an kata
yang nantinya akan diproses oleh sistem.

Alur Dasar

Kegiatan

Respon

User

Sistem

Universitas Sumatera Utara

1. User meng-input-kan
kata

1. Meng-input-kan

kata

kedalam sistem untuk

2. Menerima

hasil

pencarian

persamaan

makna

diproses.
2. Memvalidasi

makna

kata.
3. Mengambil

makna

kata pada teks.
4. Menampilkan
kata

pada

makna
menu

proses.
5. Memproses input dari
user.
Kondisi Akhir

Mendapatkan

hasil Memberikan

pencarian makna.

3.5

Pseudocode Program

3.5.1

Pseudocode Hashing

hasil

pencarian makna.

hash(ngram[], prime_base, n){
listHash[] ← int[ngram.length];
for(i ← 0; i < ngram.lenght; i++){
text[] ← ngram.toArray();
hash ← 0;for(j←0; j < text.length; j++){
hash ← hash + ((int)text[j] * pow(prime_base, n- j 1))
}
listHash[i] ← hash
}
return listHash
}

3.5.2

Pseudocode N-Gram

counNGram(word, n){
if (word.length> 0){
ngram ← string[text.length - (n -1)];

Universitas Sumatera Utara

for (i ← 0; i MIN_MANBER){
return true;
}
Return false;
}
3.6

Perancangan Algoritma

Flowchartmerupakan langkah awal pembuatan program. Dengan adanya flowchart
urutan proses kegiatan menjadi lebih jelas. Jika ada penambahan proses maka dapat
dilakukan

lebih

mudah.

setelah

flowchart

selesai

disusun,

selanjutnya

menerjemahkannya ke bentuk program dengan bahasa pemrograman.

3.6.1

Flowchart Algoritma Manber

Pada Flowchart Algoritma Manber pertama tentukan gram yang akan dibentuk,
kemudian bentuk gram dan hashing. Setelah hashing terbentuk, maka langkah
selanjutnya window pun dibentuk. Nilai-nilai dari minimal dari masing-masing window
inilah yang akan menjadi nilai fingerprint untuk menghitung nilai kesamaan makna
kalimat tersebut, serta persamaan jacquard smilirity untuk menghitung nilai presentase
dari dua kata dan kalimat yang dicari maknanya.

Universitas Sumatera Utara

START

INPUT KATA

A

METODE N - GRAM

METODE N - GRAM
FUNGSI HASH

FUNGSI HASH

FUNGSI
HASH

TEKS UJI

NILAI HASH

FUNGSI
HASH

TEKS BANDING

NILAI HASH

A

H MOD P = 0

FINGER
PRINT

PERS. JACQUARD
COEFICIENT

FINISH

Gambar 3.5Flowchart Algoritma Manber

Universitas Sumatera Utara

3.7

Deteksi Kemiripan Teks Secara Manual

Berikut ini merupakan contoh penghitungan manual dari pendeteksian kemiripan teks
pada penjiplakan jenis Disguised Plagiarism, yaitu:
Teks Uji

: abah.

Teks Banding : babah
Gram

1.

:2

Rangkaian N-Gram dengan nilai N=2

Teks Uji

: ab ba ah

Teks Banding

: ba ab ba ah

2.

Menentukan nilai hash dengan memasukkan rangkaian gram kedalam fungsi hash.

Teks Uji :
H(ab | b=2 | k=2) ฀ ASCII ( a ) * 2 (2-1) + ASCII ( b )* 2 (1-1)
= 97 * 21 + 98 * 20
= 194 + 98
= 292
H(ba | b=2 | k=2) ฀ ASCII ( b ) * 2 (2-1) + ASCII ( a )* 2 (1-1)
= 98 * 21 + 97 * 20
= 196 + 97
= 293
H(ah | b=2 | k=2) ฀ ASCII ( a ) * 2 (2-1) + ASCII ( h )* 2 (1-1)
= 97 * 21 + 104 * 20
= 194 + 104
= 298
Maka didapatkan hasil dari Teks Uji :
292 | 293 | 298 |

Teks Banding :
H(ba | b=2 | k=2) ฀ ASCII ( b ) * 2 (2-1) + ASCII ( a ) * 2 (1-1)
= 98 * 21 + 97 * 20
= 196 + 97
= 293
H(ab | b=2 | k=2) ฀ ASCII ( a ) * 2 (2-1) + ASCII ( b ) * 2 (1-1)
= 97 * 21 + 98 * 20

Universitas Sumatera Utara

= 194 + 98
= 292
H(ba | b=2 | k=2) ฀ ASCII ( b ) * 2 (2-1) + ASCII ( a ) * 2 (1-1)
= 98 * 21 + 97 * 20
= 196 + 97
= 293
H(ah | b=2 | k=2) ฀ ASCII ( a ) * 2 (2-1) + ASCII ( h )* 2 (1-1)
= 97 * 21 + 104 * 20
= 194 + 104
= 298
Maka didapatkan hasil dari teks Banding adalah :
293 | 292 | 293 | 298 |

3.

Memilih fingerprint dari nilai hash yang memenuhi persyaratan, yaitu dengan nilai
pembagi P =1.
H mod P = 0

Teks Uji :
292 | 293 | 298 |

Teks Banding :
293 | 292 | 293 | 298 |

4.

Menghitung similaritas, yaitu dengan menggunakan rumus (2.3) sehingga
didapatkan hasil akhir berupa persentase similaritas teks.

Jumlah irisan (Uji, Banding)

:3

Jumlah Gabungan (Uji, Banding)

:4

Similaritas (di, dj) =

| w(di ) ∩ w (dj)|
| w(di ) ∪ w (dj)|

x 100 %

3
=

4

x 100 %

= 0.75 %

Universitas Sumatera Utara

Persentase diatas didapatkan dari proses pencarian persamaan kata (string) yang diinput-kan, kemudian dengan ditentukan nilai N-Gram terbentuklah nilai hashing,
setelah nilai hash memenuhi persyaratan dengan menentukan nilai pembagi P = 1, maka
didapatkan nilai irisan (intersection) dan Gabungan (Union), Untuk diproses
menggunakn metode kemiripan (smilirity) Jaccard’s Similarity Coeficient dari hasil
data banding dan data uji didapatkan nilai persentase kemiripan dari kedua string yang
di-input-kan sebelumnya.

3.8

Perancangan Interface Sistem

Interface sistem merupakan tampilan sistem yang berfungsi untuk membantu pengguna
dalam menggunakan sistem.
Interface sistem pada penelitian ini dibuat sesederhana mungkin dengan tujuan
untuk mengurangi pengguna waktu yang tidak relavan pada proses sistem serta
membantu pengguna dalam memahami dan menggunakan sistem rancangan interface
sistem ini dapat dibagi menjadi tiga yaitu :

1.

Tampilan Splash Screen

Tampilan Splash Screen digunakan untuk tampilan interface awal aplikasi ini, yang
menjelaskan dasar apa sistem ini dabangun. Tampilan awal sistem ini menggunakan
dua komponen dasar, yaitu: textarea dan image. Adapun bentuk ataupun gambaran dari
tampilan awal sistem yang akan dibuat dapat dilihat pada Gambar 3.7 berikut:

Universitas Sumatera Utara

Gambar 3.6 Tampilan Interface Splash Screen
Berikut ini merupakan rincian dari rancangan tampilan awal pada Gambar 3.7 yang akan
dibuat dapat dilihat pada Tabel 3.4, yaitu :
Tabel 3.4 Keterangan Interface Home Sistem
No
Keterangan
1. Picture,digunakan untuk gambar icon dari aplikasi persamaan makna”
2. Text Description, user dapat melihat nama aplikasi pada saat aplikasi pertama
kali dibuka.
3. Text, user dapat melihat nama pembuat aplikasi.
2. Tampilan Pencarian
Tampilan Pencarian digunakan untuk memasukkan kata dan kalimat yang ingin
dicari persamaan maknanya. Tampilan pencarian ini menggunakan empat
komponen antara lain :Title Bar, TextBox, Button, ListBox.
Adapun bentuk ataupun gambaran dari tampilan pencarian yang akan dibuat
dapat dilihat pada Gambar 3.6 berikut:

Universitas Sumatera Utara

Gambar 3.7 Tampilan Interface Pencarian

Berikut ini merupakan rincian dari rancangan tampilan Hasil pada Gambar 3.6 yang
akan dibuat dapat dilihat pada Tabel 3.5, yaitu

Tabel 3.5 KeteranganInterface Hasil Sistem
No
Keterangan
1. Title Bar, komponen ini berfungsi untukmenampilkan judul aplikasi sinonim
bahasa Indonesia dan melayu
2. Button Proses, tombol ini digunakan untuk memproses kata atau kalimat yang
diinputkan untuk dicari maknanya.
3. TextBox, komponen ini digunakan untuk memasukkan kata atau kalimat yang
ingin diproses maknanya.
4. ListBox, berfungsi untuk menampilkan hasil dan perbandingan antara bahasa
indonesia dan melayu.
3. Tampilan Hasil Pencarian
Tampilan Hasil Pencarian digunakan untuk melihat hasil kata yang ingin dicari
persamaan maknanya. Tampilan pencarian ini menggunakan empat komponen
antara lain :Title Bar, TextBox, Button, ListBox.
Adapun bentuk ataupun gambaran dari tampilan hasil pencarian yang akan
dibuat dapat dilihat pada Gambar 3.6 berikut:

Universitas Sumatera Utara

Gambar 3.8 Tampilan Interface Hasil Pecarian

Berikut ini merupakan rincian dari rancangan tampilan Hasil pada Gambar
3.9 yang akan dibuat dapat dilihat pada Tabel 3.6, yaitu

Tabel 3.6 KeteranganInterface Hasil PencarianSistem
No
Keterangan
1. Title Bar, komponen ini berfungsi untukmenampilkan judul aplikasi sinonim
bahasa Indonesia dan melayu
2. Button Proses, tombol ini digunakan untuk memproses kata atau kalimat yang
diinputkan untuk dicari maknanya.
3. TextBox, komponen ini digunakan untuk memasukkan kata atau kalimat yang
ingin diproses maknanya.
4. ListBox, berfungsi untuk menampilkan hasil dan perbandingan antara bahasa
indonesia dan melayu.
4. Tampilan Detail Proses
Tampilan Detail Proses digunakan untuk melihat hasil proses algoritma seperti
nilai Has, N-Gram, dan Presentase Similarirtas. Tampilan pencarian ini
menggunakan Tiga komponen antara lain :Title Bar, TextBox, Scroll.

Universitas Sumatera Utara

Adapun bentuk ataupun gambaran dari tampilan hasil pencarian yang
akan dibuat dapat dilihat pada Gambar 3.6 berikut:

Gambar 3.9 Tampilan Interface Detail Proses

Berikut ini merupakan rincian dari rancangan tampilan Detail Proses pada Gambar
3.9 yang akan dibuat dapat dilihat pada Tabel 3.6, yaitu

Tabel 3.7 KeteranganInterface Hasil PencarianSistem
No
Keterangan
1. Title Bar, komponen ini berfungsi untukmenampilkan judul aplikasi sinonim
bahasa Indonesia dan melayu, dan dapat kembali ke tampilan sebelumnya.
2. Textarea, komponen ini digunakan untuk menampilkan hasil dari proses
algoritma seperti proses hash, N-Gram, dan Presentase Similaritas.
4. Scroll, berfungsi untuk menurunkan ataupun menaikkan tampilan hasil
pencarian proses algoritma
5. Tampilan Menu About
Tampilan About yang digunakan untuk menampilkan tentang pembuat program, dan
aplikasi yang akan dibagun. Tampilan pencarian ini menggunakan empat komponen
antara lain : textarea, picture.
Adapun bentuk ataupun gambaran dari tampilan pencarian yang akan dibuat

Universitas Sumatera Utara

dapat dilihat pada Gambar 3.7 berikut:

Gambar 3.10 Tampilan InterfaceAbout
Berikut ini merupakan rincian dari rancangan tampilan about pada Gambar 3.7 yang akan
dibuat dapat dilihat pada Tabel 3.8, yaitu :
Tabel 3.8 Keterangan Interface About Sistem
No
Keterangan
1. TextArea, digunakan untuk membuat teks judul, nama pembuat program (Author),
serta jurusan, fakultas, dan universitas penulis.
2. Picture, untuk meletakkan gambar logo, yakni logo aplikasi yang dibuat penulis.

Universitas Sumatera Utara

BAB 4
IMPLEMENTASI DAN PENGUJIAN SISTEM

Pada bab ini, akan dibahas mengenai implementasi dari algoritma Manber dan Jacquard
Coeficient sehingga pengujian terhadap sistem dapat dilakukan, baik untuk tampilan
sistem maupun hasil akhir berupa persentase kemiripan yang dimiliki oleh dokumen
teks uji dengan pembandingnya.

4.1

Implementasi Sistem

Implementasi sistem merupakan penerapan dari hasil analisis dan perancangan sistem
yang telah dibuat. Pada tahap ini, aplikasi yang telah dianalisis dan dirancang akan
dibangun dan bekerja sesuai dengan fungsi yang telah dirancang pada bab sebelumnya,
sehingga diketahui apakah sistem ini dapat bekerja dengan baik.
Aplikasi ini adalah aplikasi yang berbasis Android yang dibangun menggunakan
bahasa pemrograman Java dengan menggunakan IDE Android Studio 2.2 dan sumber

Universitas Sumatera Utara

data berasal dari load data yang bersumber dari json.
Aplikasi ini memiliki 4 (empat) antarmuka yaitu halaman splash screen,
halaman pencarian, halaman detail dan halaman about.

4.2

Antarmuka Sistem

Berikut akan diuraikan halaman-halaman yang dibangun pada aplikasi ini dan proses
yang terjadi didalamnya.

4.2.1

Halaman Splash Screen

Halaman Splash Screen adalah halaman yang akan muncul pertama sekali ketika
pengguna membuka aplikasi dan baru saja mengkondisikan perangkat dalam keadaan
terkunci. Pada halaman Splash Screen ini terdapat kata-kata yang didalamnya terdapat
nama aplikasi serta pengembang dari aplikasi.

Gambar 4.1 Halaman Splash Screen

4.2.2

Halaman Pencarian

Halaman Pencarian adalah halaman dimana pengguna dapat meng-input-kan kata yang
ingin dicari persamaaan makna dari bahasa indonesia dan melayu, serta terdapat button
yang berguna untuk mencari kata-kata yang memiliki makna yang sama.

Universitas Sumatera Utara

Gambar 4.2 Halaman Pencarian

4.2.3

Halaman Setelah Pencarian

Halaman setelah Pencarian adalah halaman dimana pengguna dapat melihat hasil result
dari pencarian, dimana terdapat kata-kata dasar yang telah di-load dari json dan
ditampilkan kata-kata yang memiliki persamaan makna serta terdapat waktu pencarian.

Gambar 4.3 Halaman Setelah Pencarian

Universitas Sumatera Utara

4.2.4

Halaman Detail

Halaman detail adalah halaman dimana dimana pengguna dapat melihat hasil detail
dimana didalamnya ditampilkan dari hasil teks uji dan teks banding yang masingmasing hasil menampilkan nilai N-Gram dan Hash Serta Proses Jacquard Coeficient
yang menampilkan intersection (irisan) dan union (gabungan) serta persentase
pencarian.

Gambar 4.4 Halaman Detail Process

4.2.5

Halaman About

Halaman About adalah halaman dimana pengguna dapat melihat judul dari apikasi serta
tentang pembuat aplikasi serta tujuan dibuat aplikasi.

Universitas Sumatera Utara

Gambar 4.5 Halaman About

4.3

Pengujian Sistem

Pengujian sistem dilakukan untuk mengetahui apakah sistem yang dibangun dapat
berjalan dengan benar dan mengetahui apakah metode N-Gram dan Hash dapat
diimplementasikan pada algoritma Manber. Dalam pengujian ini akan dilihat bagaimana
sistem mencari data serta mengolahnya menggunakan metode N-Gram dan Hash serta
hasil presentase menggunakan metode jacquard Coeficient.

4.3.1

Pengujian Pencarian Kata

Pencarian kata adalah proses terpenting dari implementasi algoritma manber
dikarenakan dari kata yang di-input oleh pengguna didapatkan persamaan kata yang
memiliki persamaan makna antara bahasa indonesia dan melayu. Pada proses pengujian
pencarian kata ini terdapat beberapa kata yang memiliki jumlah pencarian lebih dari
satu serta didapatkan pula waktu pengerjaan yang ditampilkan dalam bentuk
millisecond.

Universitas Sumatera Utara

Gambar 4.6 Pengujian Pencarian Kata

4.3.2

Pengujian Detail Process

Pengujian Detail Proses ini ditampilkan hasil proses dari algoritma Manber dimana
terdapat perbandingan antara teks uji dan teks banding yang menampilkan N-Gram dan
Hash serta terdapat pula hasil persentase dari Metode Jacquard Coeficient yang
menampilkan hasil intersection (irissan) dan gabungan (union) dari perbandingan teks
uji dan teks banding.

Universitas Sumatera Utara

Gambar 4.7 Pengujian Detail Process

4.3.3

Hasil Pengujian Makna Bahasa Indonesia dan Melayu

Pada bagian ini akan ditampilkan hasil pengujian proses pencarian kata yang memiliki
persamaan makna yang diimplementasikan menggunakan metode N-Gram dan Nilai
Hash, serta menggunkan Algoritma Manber. Pada pengujian ini akan dilihat seberapa
valid dari beberapa percobaan kata-kata yang di-input-kan. Hasil pengujian dapat dilihat
pada Tabel 4.1 berikut.

Tabel 4.1 Hasil Persamaan Makna Bahasa Indonesia dan Melayu
No

Data Uji

Data Banding

Hasil

Running Time

Universitas Sumatera Utara

1.

Abah

valid

251.624 ms

2.

Abu

valid

132.6399 ms

3.

Bau

valid

146.2322 ms

4.

Dodol

valid

183.39809 ms

Universitas Sumatera Utara

5.

Emak

valid

293.30339 ms

6.

Imam

valid

155.54822 ms

7.

Jamban

Valid

208.34187 ms

8.

Magang

valid

161.29448 ms

9.

Qari

valid

142.30136 ms

Universitas Sumatera Utara

10.

Uban

valid

185.7263 ms

Pada tabel hasil pengujian, dapat dilihat bahwa terdapat persamaan makna dari dua kata
yaitu bahasa Indonesia sebagai data input dan bahasa melayu sebagai data pencarian,
dapat disimpulkan bahwasanya algoritma manber bekerja dengan mencari persamaan
bentuk kata, bukan mencari persamaan makna antara bahasa Indonesia dan melayu.
Untuk Melihat hasil detail perbandingan pengujian dari algoritma manber,
seberapa besar tingkat validitas dari kata yang diinputkan, maka penulis mencoba dari
beberapa tingkatan kata sehingga didapatkan hasil valid dan running time ,berikut
penulis mencoba dengan menguji tiga kata, enam kata, dan delapan kata.
Tabel 4.2 Hasil Pengujian Empat Kata
No

Data Uji

1.

2.

Data Banding

Hasil

Running Time

Abis

valid

184.04416 ms

Elok

valid

226.1736 ms

Universitas Sumatera Utara

3.

Fana

valid

183.75647 ms

4.

Geli

valid

109.96297 ms

5.

Hala

valid

151.9988 ms

6.

Idap

valid

169.26197 ms

7.

Jela

valid

142.17116 ms

Universitas Sumatera Utara

8.

Maki

valid

158.84839 ms

9.

Odol

valid

162.8489 ms

10.

Raib

valid

133.44453 ms

Tabel 4.3 Hasil Pengujian Enam Kata
No

Data Uji

1.

Adinda

Data Banding

Hasil

Running Time

valid

173.05443 ms

Universitas Sumatera Utara

2.

Algojo

valid

158.73537 ms

3.

Balang

valid

137.71057 ms

4.

Empang

valid

163.65338 ms

5.

Faedah

valid

131.77078 ms

Universitas Sumatera Utara

6.

Gertak

valid

142.23416 ms

7.

Hening

valid

153.9088 ms

8.

Imbang

valid

154.11198 ms

9.

Jalang

valid

150.25948 ms

Universitas Sumatera Utara

10.

Jerami

valid

151.78285 ms

Tabel 4.4 Hasil Pengujian Delapan Kata
No

Data Uji

1.

Bedimar

Data Banding

Hasil

Running Time

Tidak

218.65979 ms

valid

2.

Belantan

valid

164.4785 ms

3.

Celengan

valid

165.64026 ms

Universitas Sumatera Utara

4.

Canggung

valid

121.214424 ms

5.

Gundalan

valid

539.62506 ms

6.

Kandangan

Tidak

159.11684 ms

valid

7.

Kembaran

valid

165.23608 ms

Universitas Sumatera Utara

8.

Maklumat

valid

175.28864 ms

9.

Ngungkap

valid

128.8628 ms

10.

Kapangan

valid

130.77963 ms

Berdasarkan hasil pengujian dari penelitian Tabel 4.2, Tabel 4.3 dan Tabel 4.4,
running time dari pencarian kata dan jumlah hasil pencarian yang dapat ditemukan pada
Algoritma Manber yang dilakukan terhadap string yang berbeda dengan panjang string
yang berbeda dengan 10 kali percobaan dan menghasilkan nilai rata – rata dari setiap
string tersebut.

Tabel 4.5 Hasil Pengujian Algoritma Manber Panjang String 4, 6 dan 8
No

4 String

Running

6 String

Time (ms)

Running

8 String

Time (ms)

Running
Time (ms)

1.

Abis

184.04416

Adinda

173.05443

Bedimar

2.

Elok

226.1736

Algojo

158.73537

Belantan

218.65979
ms
164.4785

Universitas Sumatera Utara

3.

Fana

183.75647

Balang

137.71057

Celengan

165.64026

4.

Geli

109.96297

Empang

163.65338

Canggung

121.214424

5.

Hala

151.9988

Faedah

131.77078

Gundalan

539.62506

6.

Idap

169.26197

Gertak

142.23416

Kandangan

159.11684

7.

Jela

142.17116

Hening

153.9088

Kembaran

165.23608

8.

Maki

158.84839

Imbang

154.11198

Maklumat

175.28864

9.

Odol

162.8489

Jalang

150.25948

Ngungkap

128.8628

10.

Raib

133.44453

Jerami

151.78285

Kapangan

130.77963

Total

113.55917
8

137.870388

279.582467

Rata-rata

11.355918

13.787039

27.958247

Adapun hasil pengujian dari Algoritma yang dapat dilihat pada Tabel 4.5 Setelah
diperoleh hasil pengujian dari tabel 4.4, table 4.3 dan tabel 4.4 maka dibuat grafik
perbandingan dari hasil pengujian untuk masing-masing panjang string tersebut. grafik
dapat dilihat pada Gambar 4.8, Gambar 4.9 dan Gambar 4.10.

18,000,000
16,000,000
14,000,000
12,000,000
10,000,000
Series 1

8,000,000
6,000,000
4,000,000
2,000,000
0
Geli

Hala

Idap

Jela

Maki

Odol

Raib

Gambar 4.8 Grafik running time 4 string

Universitas Sumatera Utara

18,000,000
16,000,000
14,000,000
12,000,000
10,000,000
8,000,000

Series 1

6,000,000
4,000,000
2,000,000

Ad
i

nd

a
Al
go
j
Ba o
la
Em ng
pa
n
Fa g
ed
a
G h
er
ta
H k
en
in
Im g
ba
ng
Ja
la
n
Je g
ra
m
i

0

Gambar 4.9 Grafik running time 6 string
140,000,000
120,000,000
100,000,000
80,000,000
60,000,000
Series 1
40,000,000
20,000,000

Be
di
Be ma
la r
C nta
el
e n
C nga
an
gg n
G un
un g
Ka da
nd lan
a
Ke nga
m n
b
M ara
ak n
l
N um
gu at
n
Ka gka
pa p
ng
an

0

Gambar 4.10 Grafik running time 8 string
Apabila ditarik perbandingan dari tiga jenis pengujian baik itu 4 string, 6 string,
8 string, maka dapat dilihat panjang grafik yang dapat dilihat pada gambar 4.10 berikut.

Universitas Sumatera Utara

140,000,000
120,000,000
100,000,000
80,000,000

Series 1
Series 2
Series 3

60,000,000
40,000,000
20,000,000
0
1

2

3

4

5

6

7

8

9

10

Gambar 4.11 Grafik perbandingan running time

Berdasarkan grafik tersebut dijelaskan bahwa tingkat valid dan hasil kecepatan
running time pada Algoritma Manber berkerja berdasarkan panjang string, dari ketiga
percobaan string didapatkan bahwa semakin pendek string yang diinputkan, maka
tingkat valid lebih tinggi dan kecepatan running time lebih cepat dibandingkan dengan
string yang panjang sebagai contoh pada penelitian ini panjang 4 string waktu hasil
running time lebih cepat dan dibandingkan dengan 8 string. Rata-rata dari total hasil
percobaan berdasarkan panjang string tersebut dapat dijelaskan pada Gambar 4.11.
300,000,000
250,000,000
200,000,000
Total
Rata-rata

150,000,000
100,000,000
50,000,000
0
1

2

3

4

5

6

Gambar 4.12 Grafik Perbandingan nilai total dan rata rata 4 string, 6 string dan 8
string

Universitas Sumatera Utara

BAB 5
KESIMPULAN DAN SARAN

5.1.

Kesimpulan

Kesimpulan yang dapat diambil dari penelitian ini adalah:
1. Aplikasi yang dirancang telah mampu melakukan mencari persamaan makna
antara Bahasa Indonesia dan Melayu menggunakan algoritma Manber.
2. Berdasarkan hasil pengujian yang dilakukan membuktikan bahwa panjang string
menentukan waktu proses atau running time, string yang lebih pendek waktu
proses lebih cepat dibandingkan waktu proses string yang lebih panjang,
didalam penelitian ini didapatkan hasil rata-rata proses 4 string 11.355.918 ms, 6
string 13.787039 ms dan 8 string 27.958247 ms.

Universitas Sumatera Utara

3. Berdasarkan pengujian yang dilakukan algortima manber bekerja dengan
mencari persamaan bentuk kata, bukan mencari persamaan makna antara bahasa
Indonesia dan melayu.
4. Dalam proses mencari persamaan makna ternyata mebutuhkan presentase untuk
nilai smiliritas antar kata menggunakan jacquard similarity.

5.2.

Saran

Saran yang dapat diberikan Penulis untuk pengembangan dan perbaikan sistem lebih
lanjut adalah:
1. Aplikasi yang di rancang diharapkan dapat mencari persamaan makna antara
makna bahasa Indonesia-Melayu maupun sebaliknya.
2. Aplikasi yang dirancang diharapkan dapat mendeteksi apakah makna tersebut
mengandung frase yang berulang atau tidak.
3. Agar dapat mengenali makna dengan cara melakukan pengetikan, maka aplikasi
akan langsung mendeteksi persamaan makna kedua bahasa tersebut.

DAFTAR PUSTAKA

Agusta, L. 2009. Perbandingan algortima stemming porter dengan algoritma nazief &
andriani untuk stemming dokumen teks bahasa indonesia. KNS&109-036: 196-201.

Djafar, I.M. 2015. Deteksi Kemiripan Dokumen Teks Menggunakan Algoritma Manber.
Skripsi. Universitas Sumatera Utara.

Ferari, L.A. 2015. Implementasi Algoritma Winnowing dan Porter Stemmer
Mendeteksi Kemiripan Dua Dokumen Berbasis Web. Skripsi. Universitas
Sumatera Utara

Kasman, A.D. 2013. Kolaborasi Dahsyat Android dengan PHP & MySQL. Lokomedia:

Universitas Sumatera Utara