Implementasi Algortima Manber Pada Persamaan Makna Bahasa Indonesia dan Melayu Berbasis Android

IMPLEMENTASI ALGORTIMA MANBER PADA PERSAMAAN
MAKNA BAHASA INDONESIA DAN MELAYU BERBASIS
ANDROID
SKRIPSI
AGUS MANUR
141421048

PROGRAM STUDI S1 EKSTENSI ILMU KOMPUTER
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2017

Universitas Sumatera Utara

IMPLEMENTASI ALGORITMA MANBER PADA PERSMAAN
MAKNA BAHASA INDONESIA DAN MELAYU BERBASIS
ANDROID
SKRIPSI
Diajukan untuk melengkap itugas dan memenuhi syarat memperoleh ijazah
SarjanaIlmuKomputer


AGUS MANUR
141421048

PROGRAM STUDI S1 EKSTENSI ILMU KOMPUTER
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2017

Universitas Sumatera Utara

PERSETUJUAN

Judul

Kategori

: IMPLEMENTASI ALGORITMA MANBER PADA
PERSAMAAN MAKNA BAHASA INDONESIA DAN

MELAYU BERBASIS ANDROID
: SKRIPSI

Nama

: AGUS MANUR

Nomor Induk Mahasiswa : 141421048
Program Studi

: SARJANA (S-1) EKSTENSI ILMU KOMPUTER

Departemen

: ILMU KOMPUTER

Fakultas

: FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI
INFORMASI UNIVERSITAS SUMATERA UTARA


Diluluskan di
Medan, Agustus 2017

Komisi Pembimbing :
Pembimbing 2

Pembimbing 1

Sri Melvani Hardi, S.Kom., M.Kom
NIP. 198805012015042006

Drs. Agus Salim Harahap, M.Si
NIP. 195408281981011004

Diketahui/disetujui oleh
Program Studi S-1 Ilmu Komputer
Ketua,

Dr. Poltak Sihombing, M.Kom.

NIP. 196203171991031001

Universitas Sumatera Utara

PERNYATAAN

IMPLEMENTASI ALGORITMA MANBER PADA PERSAMAAN
MAKNA BAHASA INDONESIA DAN MELAYU BERBASIS
ANDROID

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa
kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.

Medan, Agustus 2017

Agus Manur
141421048


Universitas Sumatera Utara

UCAPAN TERIMA KASIH

Segala Puji dan syukur penulis ucapkan kepada Allah SWT, karena atas rahmat dan
karunia-Nya penulis dapat menyelesaikan penelitian ini. Terima kasih yang pertama
penulis sampaikan kepada Ayahanda Buyung Anak dan Ibunda Sari Alam, yang telah
mendidik, mendoakan, dan memberi kasih sayangnya kepada penulis, adik tersayang
Yogi Alamsyah dan Nadila Permata Sari, serta seluruh keluarga, untuk dukungan dan
doanya kepada penulis sehingga dapat menyelesaikan studi ini.
Banyak bantuan berupa uluran tangan, motivasi, buah pikiran dan kerjasama yang
telah penulis terima selama menempuh studi sampai dengan penyelesaian penelitian
ini. Oleh karena itu, penulis ingin menyampaikan ucapan terima kasih kepada pihakpihak yang telah membantu. Ucapan terima kasih penulis sampaikan kepada:
1. Bapak Prof. Dr. Runtung Sitepu, S.H., M.Hum. selaku Rektor Universitas
Sumatera Utara.
2. Bapak Prof. Dr. Opim Salim Sitompul selaku Dekan Fasilkom-TI USU.
3. Bapak Dr. Poltak Sihombing, M.Kom. selaku Ketua Program Studi S-1 Ilmu
Komputer Universitas Sumatera Utara dan selaku Dosen Pembimbing I yang telah
memberikan bimbingan dan dukungan kepada penulis
4. Bapak Heriyance, ST., M.Kom. selaku Sekretaris Program Studi S1 Ilmu

Komputer yang telah memberikan bimbingan dan dukungan kepada penulis.
5. Bapak Drs. Agus Salim Harahap, M.Si. selaku Dosen Pembimbing I yang telah
memberikan bimbingan dan dukungan kepada penulis.
6. Ibu Sri Melvani Hardi, S.Kom., M.Kom. selaku Dosen Pembimbing II yang telah
memberikan bimbingan dan dukungan kepada penulis.
7. Bapak Dr. Syahril Efendi, S.Si., M.IT. selaku Dosen Pembanding I yang telah
memberikan bimbingan dan dukungan kepada penulis.
8. Bapak M. Andri Budiman, S.T., M.Comp.Sc., M.E.M. selaku Dosen Pembanding
II sekaligus menjadi Dosen Pembimbing Akademik yang telah memberikan
bimbingan dan dukungan kepada penulis.

Universitas Sumatera Utara

9. Seluruh tenaga pengajar dan pegawai di Fakultas Ilmu Komputer dan Teknologi
Informasi USU, terkhususnya di Program Studi S-1 Ilmu Komputer.
10. Sahabat-sahabat Ogiana, Dea Yulianda Pratiwi, Nadra Kartika Lingga, Iqbal
Habibie, yang telah memberikan semangat dan dukungan serta doanya kepada
penulis.
11. Teman-teman kuliah Ekstensi Ilmu Komputer stambuk 2014, khususnya Kom C,
yang telah berbagi motivasi, rasa kebersamaan, dan inspirasi kepada penulis.

12. Sahabat-sahabat Pejuang Wisuda yang saling berbagi ilmu pengetahuan,
pemikiran, motivasi, dan dukungan kepada penulis.
13. Semua pihak yang terlibat langsung atau tidak langsung yang penulis tidak dapat
dituliskan satu per satu.

Penulis menyadari bahwa skripsi ini masih terdapat kekurangan. Oleh karena itu,
kepada pembaca agar kiranya memberika kritik dan saran yang bersifat membangun
demi kesempurnaan skrispsi ini. Semoga penelitian ini bermanfaat bagi penulis,
pendidikan, masyarakat, organisasi dan negara.

Medan, Agustus 2017

Penulis

Universitas Sumatera Utara

ABSTRAK

Bahasa Indonesia ternyata memiliki banyak kemiripan makna kata dengan Bahasa
Melayu, karena jika dipandang dari sudut linguistik Bahasa Indonesia adalah salah

satu dari ragam bahasa melayu yang sebenarnya berasal dari Melayu Riau. Maka
berdasarkan pernyataan tersebut, penulis membuat aplikasi untuk mencari persamaan
makna dari bahasa Indonesia dan Melayu. Penulis menerapkan algoritma Manber
untuk mendeteksi kemiripan suatu teks ataupun dokumen dengan waktu proses yang
cepat serta akurat. Didalam proses menentukan persamaan makna dilakukan dengan
menggunakan teknik N-Gram, dam akhirnya didapatkan nilai Hash, yang selanjutnya
dapat dilihat dari hasil data uji dan data banding, setelah didapat hasil keduanya maka
didapatkanlah hasil nilai Similarity atau persentase menggunakan Jacquard
Coeficient. Penelitian ini menunjukkan bahwa algoritma Manber mampu mencari kata
yang memiliki makna yang sama, serta ketepatan sebuah kata (string) yang di-inputkan akan lebih besar persentase-nya bila panjang kata (string) lebih pendek
dibandingkan dengan kata (string) yang lebih panjang.
Kata Kunci : Manber, N-Gram, Hash, Smilarity, Jacquard Coeficient

Universitas Sumatera Utara

IMPLEMENTATION OF MANBER ALGORITHM ON THE EQUATION OF
INDONESIAN AND MALAY BASED ON ANDROID

ABSTRACT
Indonesian language has many similar meanings of words with Malay, because if

viewed from the linguistic point of Indonesia language is one of the variety of Malay
language that actually comes from Riau Malay. So based on the statement, the author
makes an application to find the meaning equation of the Indonesian language and
Malay. The author applies the Manber algorithm to detect the resemblance of a text
or document with a fast and accurate processing time. In the process of determining
the equation of meaning is done by using N-Gram technique, finally got Hash value,
which can be seen from result of test data and data of appeal, after obtained result of
both then got result of value of Similarity or percentage using Jacquard Coeficient.
This study shows that the Manber algorithm is able to find words that have the same
meaning, and the accuracy of a word (string) is input will be greater percentage if the
length of the word (string) is shorter than the word (string) more long.
Keywords: Manber, N-Gram, Hash, Similarity, Jacquard Coeficient

Universitas Sumatera Utara

DAFTAR ISI

Halaman

Persetujuan


ii

Pernyataan

iii

Penghargaan

iv

Abstrak

vi

Abstract

vii

Daftar Isi


viii

Daftar Tabel

xi

Daftar Gambar

xii

BAB 1 PENDAHULUAN
1.1

Latar Belakang

1

1.2

Rumusan Masalah

3

1.3

Ruang Lingkup Masalah

3

1.4

Tujuan Penelitian

4

1.5

Manfaat Penelitian

4

1.6

Metodologi Penelitian

5

1.7

Sistematika Penulisan

5

BAB 2 LANDASAN TEORI
2.1

Pengertian Text Mining

8

2.2

Algortima Manber

9

2.3

Metode N – Gram

10

2.4

Nilai Hash

11

2.4.1 Macam- Mmacam Fungsi Hash

12

2.5

14

Nilai Fingerprint Dokumen

Universitas Sumatera Utara

2.6

Jaccard’s Similarity Coeficient

15

BAB 3 ANALISIS DAN PERANCANGAN
3.1

Analisis Sistem

17

3.2

Desain Sistem

17

3.3

Analisis Masalah

17

3.4

Pemodelan Sistem

19

3.4.1

Use Case

19

3.4.2

Activity Diagram

20

3.4.3

Sequence Diagram

22

3.5

Pseudocode Program

23

3.5.1

Pseudocode Hashing

23

3.5.2

Pseudocode N-Gram

23

3.5.3

Pseudocode Manber

23

3.6

Perancangan Algortima

24

3.5.1

Flowchart Algortima Manber

24

3.7

Deteksi Kemiripan Teks Secara Manual

26

3.8

Perancangan Interface Sistem

28

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM
4.1

Implementasi Sistem

34

4.2

Antarmuka Sistem

34

4.2.1

Halaman Splash Screen

34

4.2.2

Halaman Pencarian

35

4.2.3

Halaman Setelah Pencarian

36

4.2.4

Halaman Detail

36

4.2.5

Halaman About

37

4.3 Pengujian Sistem

38

4.3.1

Pengujian Pencarian Kata

38

4.3.2

Pengujian Detail Proses

39

4.3.3

Hasil Persamaan Makna Bahasa Indonesia dan Melayu

39

BAB 5 KESIMPULAN DAN SARAN

Universitas Sumatera Utara

5.1. Kesimpulan

53

5.2. Saran

53

DAFTAR PUSTAKA
LAMPIRAN : KODE PROGRAM

Universitas Sumatera Utara

DAFTAR TABEL

Halaman
Tabel 3.1 NarasiUse Case

15

Tabel 3.2 Narasi Diagram Activity

16

Tabel 3.3 Narasi Diagram Sequence

17

Tabel 3.4 KeteranganInterface HomeSistem

23

Tabel 3.5 KeteranganInterfaceHasilSistem

24

Tabel 3.6 KeteranganInterfaceAboutSistem

25

Tabel 3.7 KeteranganInterface HelpSistem

26

Tabel 4.1 Hasil Persamaan Makna Bahasa Indonesia danMelayu

40

Tabel 4.2 Hasil Pengujian Empat Kata

42

Tabel 4.3 Hasil Pengujian Enam Kata

44

Tabel 4.4 Hasil Pengujian Delapan Kata

47

Tabel 4.5 Hasil Pengujian Algoritma Manber Panjang String 4, 6 dan 8

49

Universitas Sumatera Utara

DAFTAR GAMBAR

Halaman
Gambar3.1

Diagram Ishikawa

13

Gambar 3.2

Use Case Diagram

14

Gambar 3.3

Acticity Diagram

16

Gambar 3.4

Sequence Diagram

17

Gambar 3.5

Flowchart Algoritma Manber

19

Gambar 3.6

Tampilan Interface Splash Screen

22

Gambar 3.7

Tampilan InterfacePencarian

23

Gambar 3.8

Tampilan InterfaceHasilPencarian

24

Gambar 3.9

Tampilan Interface Detail Proses

25

Gambar 3.10

Tampilan Interface About

26

Gambar 4.1

Halaman Spalash Screen

28

Gambar 4.2

Halaman Pencarian

28

Gambar 4.3

Halaman Setelah Pencarian

29

Gambar 4.4

Halaman Detail Process

30

Gambar 4.5

Halaman About

30

Gambar 4.6

Pengujian Pencarian Kata

31

Gambar 4.7

Pengujian Detail Proses

32

Gambar 4.8

Grafik running time 4 string

50

Gambar 4.9

Grafik running time 6 string

50

Gambar 4.10

Grafik running time 8 string

50

Gambar 4.11

Grafik perbandingan running time

51

Gambar 4.12

Grafik perbandingan nilai total dan rata-rata

52

4 string, 6 string, 8 string

Universitas Sumatera Utara

DAFTAR LAMPIRAN

A

Listing Program

B

Daftar Riwayat Hidup

A-1

Universitas Sumatera Utara