Perbandingan Algoritma Reverse Colussi Dengan Algoritma Zhu Takaoka Dalam Pencocokan String

(1)

(2)

Bahwa yang bertandatangan di bawah ini, penulis dan pihak perusahaan tempat penelitian, Menyetujui:

Untuk memberikan kepada Universitas Komputer Indonesia Hak Bebas Royalty

Noneksklusif atas penelitian ini dan bersedia untuk di-online_{-kan sesuai dengan}

ketentuan yang berlaku untuk kepentingan riset dan pendidikan .

Bandung, 25 Agustus 2016

Penulis,

ALINDA 10112495

Mengetahui, Pembimbing

Kania Evita Dewi, S.Pd., M.Si. NIP. 41277006092

(3)

(4)

(5)

Saya yang bertanda tangan di bawah ini : Nama : ALINDA

NIM : 10112495

Judul Skripsi : PERBANDINGAN ALGORITMA REVERSE COLUSSI DENGAN ALGORITMA ZHU TAKAOKA DALAM PENCOCOKAN STRING

Menyatakan bahwa saya tidak melakukan tindakan meniru, menyalin atau menjiplak skripsi atau karya ilmiah yang telah ada. Apabila saya terbukti melakukan tindakan terebut, maka saya bersedia untuk menerima sanksi yang diberikan dengan ketentuan yang ditetapkan dan berlaku di Program Studi Teknik Informatika Universitas Komputer Indonesia.

Mengetahui, Yang memberi pernyataan

(ALINDA) NIM. 10112495

(6)

F-1

Ds. Cikapinis Kec. Karangnunggal Kab. Tasikmalaya 46186

Prov. Jawa Barat

Tempat, Tgl Lahir : Tasikmalaya, 23 September 1993 Jenis Kelamin : Laki-laki

Agama : Islam

Kewarganegaraan : Indonesia Telepon : 085315277723

Email : [email protected]

PENDIDIKAN FORMAL

2012-2016 : Strata 1 – Teknik Informatika, Universitas Komputer Indonesia

2009-2010 : Jurusan Teknik Komputer dan Jaringan, SMK Negeri Bantarkalong, Tasikmalaya 2006-2009 : SMPN 4 Karangnunggal

2000-2006 : SDN Gandamekar

KEAHLIAN PEMROGRAMAN

Bahasa Pemrograman : Java, C#, PHP, HTML5, Java Mobile, Yii framework.

Tools Pemrograman : Microsoft Visual Studio, Netbeans, Eclipse.

Demikian Riwayat Hidup ini saya buat dengan sebenar-benarnya dalam keadaan sadar dan tanpa paksaan.

Bandung, 25 Agustus 2016

(7)

SKRIPSI

Diajukan untuk Menempuh Ujian Akhir Sarjana

ALINDA

10112495

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

UNIVERSITAS KOMPUTER INDONESIA

2016

(8)

iii

Puji syukur kehadirat Allah SWT yang Maha Melihat lagi Maha Pengampun atas rahmat, hidayah, dan karunia-Nya sehingga penulis dapat menyelesaikan karya tulis yang berbentuk skripsi ini sesuai dengan waktu yang telah dilancarkan. Sholawat dan salam semoga senantiasa tercurah kepada Nabi Muhammad SAW, kepada keluarga dan sahabat serta umat yang turut pada ajarannya. Sehingga tugas akhir yang berjudul Perbandingan Algoritma Reverse Colussi dengan Algoritma Zhu-Takaoka dalam Pencocokan String dapat diselesaikan. Tugas akhir merupakan syarat terakhir yang harus ditempuh untuk menyelesaikan pendidikan pada jenjang Strata Satu (S1), pada Jurusan Teknik Informatika Universitas Komputer Indonesia.

Dalam penulisan skripsi ini, tentunya banyak pihak yang telah memberikan bantuan baik moril maupun materil. Oleh karena itu penulis ingin menyampaikan ucapan terimakasih yang tiada hingganya kepada :

1. Allah SWT yang telah memberikan kesehatan, kesempatan, kelancaran, dan kemudahan kepada penulis dalam proses menyelesaikan skripsi ini.

2. Kepada kedua orang tua yang sangat saya hormati dan saya cintai, yang selalu

memberikan do’a, kekuatan moril, motivasi, dan inspirasi kepada penulis.

3. Bapak Irawan Afriyanto, S.T., M.T. selaku Ketua Program Studi Teknik Informatika Universitas Komputer Indonesia (UNIKOM).

4. Ibu Riani Lubis, S.T., M.T. selaku dosen wali yang telah membantu dalam proses belajar mengajar selama di UNIKOM.

5. Ibu Kania Evita Dewi, S.Pd., M.Si. selaku pembimbing dalam mengerjakan skripsi ini, yang tidak pernah berhenti untuk memberikan pengarahan dan pandangan dalam menyelesaikan masalah yang dihadapi, dan penuh kesabaran.

(9)

bimbingan dengan dosen pembimbing tidak begitu menegangkan.

8. Seluruh staf dosen Teknik Informatika yang telah memberikan ilmu yang sangat bermanfaat bagi penulis dimasa sekarang dan mudah-mudahan juga di masa depan.

9. Saudara-saudara sekeluarga yang juga memberikan dukungan dan motivasi untuk menjadi orang yang lebih baik.

10.Tika Sartika selaku orang terdekat, yang memotivasi dan memberikan dukungan dan bantuan secara nyata untuk menyelesaikan skripsi.

11.Taufik selaku teman seperjuangan dari Tasik, yang telah banyak membantu dalam menyelesaikan program aplikasi yang dibuat untuk skripsi.

12.Sahabat 92, yang selalu menjadi inspirasi dan motivasi, untuk lulus tepat waktu. 13.Teman – teman IF-12, yang telah menemani selama perkuliahan di UNIKOM. 14.Mahasiswa UNIKOM, yang membuat saya malu ketika tidak lulus tepat waktu. 15.Rizki Primandar Admizan dan Puji Pra Ramdhani, alumni yang telah bersedia

untuk memberikan data yang menjadi pendukung selesainya skripsi.

Penulis menyadari bahwa skripsi ini masih banyak kekurangan dan masih jauh dari kata sempurna. Oleh karena itu saran dan kritik yang konstruktif dari semua pihak sangat diharapkan demi penyempurnaan selanjutnya. Akhir kata dari penulis berharap skripsi ini dapat bermanfaat khususnya bagi penulis sendiri dan umumnya bagi orang lain yang membutuhkan. Semoga Allah SWT selalu meridhoi kita semua, aamiin.

Jazakumullah Khairan Katsiran, Wassalamu’alaikum Wr. Wb.

Bandung, Agustus 2016 Penulis

(10)

ABSTRAK ... i

ABSTRACT ... ii

KATA PENGANTAR ... iii

DAFTAR ISI ... v

DAFTAR GAMBAR ... viii

DAFTAR TABEL ... ix

DAFTAR SIMBOL ... xii

DAFTAR LAMPIRAN ... xiv

BAB 1 PENDAHULUAN ... 1

1.1 Latar Belakang Masalah ... 1

1.2 Perumusan Masalah ... 3

1.3 Maksud dan Tujuan ... 4

1.4 Batasan Masalah ... 4

1.5 Metodologi Penelitian ... 5

1.6 Sistematika Penulisan ... 7

BAB 2 TINJAUAN PUSTAKA ... 9

2.1 Rumah Baca Buku Sunda jeung Sajabana ... 9

2.2 String ... 9

2.3 StringMatching ... 9

2.4 Algoritma ... 10

2.4.1 Ciri dan Sifat Algoritma ... 11

2.5 Algoritma String Matching ... 12

2.5.1 Algoritma Zhu-Takaoka... 13

2.5.2 Algoritma Reverse Colussi ... 17

2.6 Kompleksitas Algoritma ... 26

2.6.1 Kompleksitas Waktu ... 28

2.7 Notasi Big O ... 30

(11)

2.11 Data Flow Diagram (DFD) ... 40

2.12 QT Creator ... 42

2.13 C++ ... 42

2.14 JavaScript ... 43

2.15 Code Editor ... 43

2.16 Web browser ... 44

BAB 3 ANALISIS DAN PERANCANGAN SISTEM SISTEM ... 45

3.1 Analisis Sistem ... 45

3.1.1 Analisis Masalah ... 45

3.1.2 Analisis Data Masukan ... 45

3.1.3 Deskripsi Umum ... 46

3.1.4 Analisis Metode ... 47

3.1.5 Analisis Kompleksitas ... 96

3.1.6 Spesifikasi Kebutuhan Perangkat Lunak ... 99

3.2 Perancangan Sistem ... 102

3.2.1 Perancangan Struktur Menu ... 102

3.2.2 Perancangan Antarmuka ... 103

3.2.3 Jaringan Semantik ... 105

3.2.4 Perancangan Prosedural ... 106

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM ... 109

4.1 Implementasi Sistem ... 109

4.1.1 Implementasi Perangkat Keras ... 109

4.1.2 Implementasi Perangkat Lunak ... 109

4.1.3 Implementasi Antarmuka... 110

4.2 Pengujian Sistem ... 111

4.2.1 Rencana Pengujian... 111

(12)

vii

5.1 Kesimpulan ... 129 5.2 Saran ... 130 DAFTAR PUSTAKA ... 131

(13)

131

(Edisi Revisi). Bandung: Informatika Bandung.

[2] Fernando, H. (2009). Perbandingan dan Pengujian Beberapa Algoritma Pencocokan String. [Online]. Diunduh pada 30 April

2016.http://informatika.stei.itb.ac.id/~rinaldi.munir/Stmik/2009-2010/Makalah2009/MakalahIF3051-2009-006.pdf.

[3] Aulia, R. (2008). Analisis Algoritma Knuth Morris Pratt dan Algoritma Boyer Moore Dalam Proses Pencarian String. [Online]. Diunduh pada 7 Mei

2016.http://informatika.stei.itb.ac.id/~rinaldi.munir/Stmik/2007-2008/Makalah2008/MakalahIF2251-2008-101.pdf

[4] Handoyo, R.A. (2004). Perbandingan Waktu Proses Pencarian Data antara Algoritma Raita dengan Algoritma Zhu-Takaoka. [Online]. Diunduh pada 24 Mei 2016.

http://karyailmiah.tarumanagara.ac.id/index.php/S1TI/article/view/2315 [5] Haryadi, D. (2010).”Pencocokkan String dengan Algoritma Reverse

Colussi“.[Online]. Diunduh pada 19 Mei 2016.

http://informatika.stei.itb.ac.id/~rinaldi.munir/Stmik/2010-2011/Makalah2010 /MakalahStima2010-034.pdf.

[6] “Bahasa Sunda”.[Online]. Diakses pada 2 Agustus 2016

http://www.aswanblog.com/2015/01/kamus-besar-bahasa-sunda-terlengkap-dan.html, https://id.wikipedia.org/wiki/Aksara_Sunda_Baku [7] Sugiyono. (2010). Metode Penelitian Kuantitatif, Kualitatif dan R&D.

Bandung: ALFABETA.

[8] Sommerville, I. (2003). Software Engineering (Rekayasa Perangkat Lunak) Edisi 6 Jilid 1. Jakarta: Erlangga.

[9] Rojali, A. (2014). Analisis Perbandingan Algoritma Knuth-Morris-Pratt dengan Algoritma Boyer-Moore pada Permainan Word Search Puzzle.

(14)

[10] Ramdhani. P.P. (2013). Analisis Perbandingan Performansi Algoritma Zhu-Takaoka dan Algoritma Karp-Rabin pada pencarian kata di Rumah Baca Buku Sunda. Undergraduate Theses from JBPTUNIKOMPP.

http://elib.unikom.ac.id.

[11] Nugroho, A. (2009). Rekayasa Perangkat Lunak Menggunakan UML dan Java. Yogyakarta: Andi Yogyakarta.

[12] Admizan, R. P. (2014). Perbandingan Algoritma Reverse Colussi dengan Algoritma Karp-Rabin dalam Mencari dan Mencocokan String pada Word Game. Undergraduate Theses from JBPTUNIKOMPP.

http://elib.unikom.ac.id.

[13] “Mengenal QT Creator”. [Online]. Diakses pada 24 Juli 2016

http://www.proweb.co.id/articles/mobile_development/qt_creator.html

[14] “Apa Itu Bahasa C++?”.[Online]. Diakses 24 Juli 2016.

http://www.belajarcpp.com/2016/01/pengertian-cplusplus-dan-borland- cplusplus.html

[15] “Pengenalan JavaScript” .[Online]. Diakses 24 Juli 2016.

https://developer.mozilla.org/id/docs/Web/JavaScript/Getting_Started

[16] “5 Code Editor Gratis TerbaikTahun 2015”. [Online]. Diakses 24 Juli 2016.

http://salatigadev.com/5-code-editor-gratis-terbaik-tahun-2015/ [17] “Pengertian Browser”. [Online]. Diakses 24 Juli 2016.

(15)

BAB 1

PENDAHULUAN

1.1 Latar Belakang Masalah

Secara sederhana algoritma merupakan prosedur untuk memecahkan suatu masalah. Algoritma adalah deretan instruksi yang jelas untuk memecahkan masalah, yaitu untuk memperoleh keluaran yang diinginkan dari suatu masukan dalam jumlah waktu yang terbatas [1]. Banyak cabang dari ilmu komputer yang diacu dalam terminologi algoritma, misalnya algoritma Perutean (routing) pesan di dalam jaringan komputer, algoritma Brensenham untuk menggambar garis lurus (bidang grafika komputer), algoritma Knuth-Morris-Pratt untuk mencari suatu pola di dalam teks atau string mathcing (bidang information retrievel), dan sebagainya.

String matching atau pencocokkan string merupakan hal dasar yang sangat perlu dipelajari terutama dalam lingkup yang berkaitan dengan text processing. Secara umum, istilah yang terdapat dalam pencocokkan string antara lain teks dan pattern. Teks (text) adalah (long) string yang panjangnya n. Pattern yaitu string dengan panjang m karakter (m < n) yang akan di cari di dalam teks[2].

Terdapat beragam algoritma pencocokkan string, baik algoritma yang diciptakan dari awal maupun algoritma pengembangan, yang dapat digunakan untuk melakukan pencocokkan string. Salah satu algoritma pencocokkan string

yang paling efisien adalah algoritma Boyer-Moore [2]. Menurut penelitian Kristanto, Rachmat dan Gunawan dalam jurnal Implementasi Algoritma Boyer-Moore pada Permainan Word Search Puzzle menyatakan bahwa algoritma Boyer Moore memiliki tingkat akurasi pada saat pencocokan string sebanyak 100%. Algoritma Boyer-Moore mempunyai empat konsep dasar di dalam proses pencocokkan string, yaitu preporcessing, right-to-left-scan, bad-character-rule, good-suffix-rule. Meskipun algoritma Boyer-Moore dipandang sebagai algoritma yang paling efisien untuk pencocokkan string, namun algoritma tersebut masih memiliki beberapa kekurangan, diantaranya yaitu tidak bagus untuk binary string

(16)

algorit-ma pengembangan dari algoritalgorit-ma Boyer-Moore. Dua diantaranya adalah algoritma

Zhu-Takaoka dan algoritma Reverse Colussi.

Algoritma Zhu-Takaoka memiliki karakteristik sama dengan algoritma

Boyer-Moore yaitu preprocessing, right-to-left-scan, bad-character-rule, good-suffix-rule. Perbaikan yang dilakukan oleh algoritma Zhu-Takaoka adalah bad-character-rule yang menggunakan array dua dimensi untuk menghitung nilai pergeseran sedangkan algoritma Boyer-Moore hanya menggunakan array satu dimensi. Algoritma Zhu-Takaoka lebih cepat dalam pencarian kata dan kalimat dibandingkan dengan algoritma Raita [4].

Sementara itu, algoritma Reverse Colussi juga merupakan salah satu algoritma perbaikan dari algoritma Boyer-Moore yang idenya berasal dari algoritma

colussi. Algoritma ini juga melakukan pencocokkan dari kanan ke kiri. Terdapat dua fase pencarian pada algoritma Reverse Colussi, yaitu fase pemrosesan awal dan fase pencarian. Pada fase pemrosesan awal dilakukan pencarian sepasang karakter, serta pencarian special positions dan non-special position. Sedangkan, pada fase pencarian dilakukan pencarian pattern terhadap teks. Algoritma Reverse Colussi

menghasilkan jumlah perbandingan tiap karakter yang lebih sedikit dari pada algoritma Boyer-Moore, Knuth-Morris-Pratt, Dan Colussi [5]. Algoritma Reverse Colussi juga sangat cepat dalam melakukan pencarian string, tetapi membutuhkan waktu pemrosesan awal yang lambat. Hal ini dikarenakan harus menghasilkan dua tabel terlebih dahulu sebelum memulai pencocokkan [5].

Sebagaimana yang telah dijelaskan bahwa algoritma Boyer-Moore masih memiliki beberapa kekurangan. Sementara itu, algoritma Reverse Colussi dan algoritma Zhu-Takaoka merupakan pengembangan dari algoritma Boyer-Moore

yang keduanya memiliki keunggulan dan kelemahan masing-masing, yakni dalam proses pencarian, pencocokkan, kecepatan, ketepatan, dan lain-lain. Namun demikian, belum dapat dipastikan apakah kedua algoritma pengembangan tersebut sudah memperbaiki kekurangan yang dimiliki algoritma Boyer-Moore. Selain itu, di antara kedua algoritma tersebut belum dapat dipastikan juga algoritma manakah yang lebih optimal dalam melakukan pencocokan pattern. Oleh karena itu, analisis perbandingan performansi terhadap kedua algoritma dapat dilakukan untuk

(17)

mengetahui tingkat akurasi dan waktu yang dibutuhkan dalam satu kali proses pencocokkan string yang digunakan oleh kedua algoritma tersebut.

Bahasa sunda memiliki sistem penulisan aksara sunda baku yaitu aksara swara, aksara ngalagena, rarangken dan angka. Setiap kata dalam tulisan bahasa sunda pasti mengandung keempat sistem penulisan tersebut. Karateristik dari

aksara ngalagena memiliki pola kebanyakan dua huruf seperti ka, ca, ta, pa, ya, wa, ga, ja, da, ba, ra, sa, na, ha, ma, la, dan lain-lain. Selain itu dalam aksara sunda biasanya setiap kata memiliki karakter yang berulang seperti kata awewe, lalaki, jelema, papanggih, babaturan, badag, baham, balangsak dan lain-lain [6].

Berdasarkan permasalahan yang telah dipaparkan di atas, untuk menganalisis perbandingan performansi dari algoritma Zhu-Takaoka dan Reverse Colussi dalam melakukan pencocokan string, maka kedua algoritma tersebut akan diimplementasikan pada pencocokkan string menggunakan data sinopsis buku berbahasa sunda yang diambil dari Rumah Baca Buku Sunda. Pola dua karakter dari aksara ngalagena akan memperlihatkan kelebihan dari algoritma Zhu Takaoka

pada saat pencocokan string, sedangkan kata dalam bahasa sunda yang memiliki karakter sering berulang akan menampilkan kelebihan dari algoritma Reverse Colussi dalam mencari sepecial position, analisis perbandingan performansi tersebut dilakukan untuk menentukan algoritma pengembangan Boyer Moore

manakah yang lebih optimal berdasarkan hasil perbandingan akurasi dan kecepatan waktu proses pencocokan string untuk melakukan pencocokan karakter yang terdapat dalam sinopsis dari buku berbahasa sunda.

1.2 Perumusan Masalah

Berdasarkan latar belakang yang telah diuraikan, maka dapat dirumuskan masalah dari penelitian ini adalah bagaimana membandingkan algoritma Zhu-Takaoka dan algoritma Reverse Colussi untuk mengetahui tingkat akurasi yang dihasilkan dan waktu yang diperlukan pada proses pencocokkan string bahasa sunda.

(18)

1.3 Maksud dan Tujuan

Maksud dari penulisan skripsi ini adalah melakukan analisis terhadap kinerja algoritma Zhu-Takaoka dan algoritma Reverse Colussi dalam pencocokkan

string bahasa sunda.

Tujuan yang akan dicapai pada penelitian ini adalah mengetahui akurasi dan waktu yang diperlukan pada saat melakukan pencocokkan string bahasa sunda oleh algoritma Reverse Colussi dan algoritma Zhu-Takaoka.

1.4 Batasan Masalah

Batasan masalah dalam melakukan perbandingan algoritma Reverse Colussi

dan Zhu-Takaoka pada pencocokkan string ini adalah sebagai berikut.

1. Membandingkan performansi algoritma Reverse Colussi dan algoritma

Zhu-Takaoka mengenai tingkat akurasi yang dihasilkan dan waktu yang digunakan dalam satu pattern.

2. Pattern atau kata yang dicari memiliki relevansi dengan sumber string yang ada pada sistem.

3. Panjang pattern yang digunakan pada penelitian ini, yaitu berjumlah 2 sampai 20 karakter karena menurut observasi dilapangan diketahui bahwa nama orang atau nama tempat yang diingat oleh pengunjung yang dijadikan kata kunci atau pattern biasanya berjumlah antara 2 sampai 20 karakter. 4. Sinopsis buku yang digunakan hanya buku berbahasa Sunda, berformat txt. 5. Output dari perangkat lunak adalah waktu preprocessing dan waktu pencocokan dari algoritma yang digunakan, jumlah karakter tak berulang pada sumber string yang dicari, dan jumlah pola yang ditemukan.

6. Parameter yang digunakan dalam analisis perbandingan adalah akurasi yang dihasilkan dan kecepatan waktu proses yang dibutuhkan oleh kedua algoritma.

7. Analisis pembangunan perangkat lunak menggunakan pendekatan analisis terstruktur.

(19)

1.5 Metodologi Penelitian

Metode penelitian eksperimen bertujuan untuk menyelidiki kemungkinan sebab akibat dengan cara melakukan percobaan berulang kepada satu atau lebih kondisi perlakuan dan membandingkan hasilnya [7].

Pada penelitian ini akan dilakukan perbandingan antara dua algoritma untuk menguji akurasi yang dihasilkan dan berapa waktu yang diperlukan dalam satu kali proses pencocokkan dengan beberapa kali percobaan.

Dari kedua pernyataan tersebut metode eksperimen adalah metode yang paling sesuai untuk digunakan pada penelitian ini. Tahapan yang akan dilalui pada penelitian ini adalah sebagai berikut.

1. Tahap Pengumpulan Data

Metode pengumpulan data yang digunakan pada penelitian ini antara lain : a. Studi literatur.

Studi Literatur dilakukan dengan cara mengumpulkan dan mempelajari jurnal, paper, makalah dan artikel yang berkaitan dengan masalah yang akan dibahas dalam pembuatan tugas akhir ini.

b. Studi lapangan.

Studi lapangan dilakukan untuk mengamati kegiatan secara langsung dilapangan dan mengumpulkan semua informasi yang dibutuhkan. c. Wawancara.

Wawancara dilakukan kepada Bapak Mamat Sasmita selaku pengelola sekaligus pemilik dari Rumah Baca Buku Sunda untuk mengetahui segala informasi yang dibutuhkan pada penelitian ini.

2. Tahap Analisis Algoritma

Teknik analisis algoritma menggunakan teknik eksperimen dengan cara melakukan perbandingan antara algoritma Zhu-Takaoka dan algoritma Reverse Colussi terhadap akurasi yang dihasilkan dan kompleksitas waktu yang digunakan dalam pencocokkan string pada aplikasi Perbandingan Algoritma Zhu-Takaoka dan Algoritma Reverse Colussi.

(20)

3. Tahap Pembangunan Perangkat Lunak

Waterfall model adalah model yang mengusulkan sebuah pendekatan kepada pembangunan software yang sistematik dan sekuensial, metode ini sangat baik digunakan untuk produk software yang sudah jelas kebutuhannya di awal, untuk meminimalisir kesalahan[8]. Dari pernyataan tersebut waterfall model dirasa model pembangunan perangkat lunak yang sesuai pada penelitan ini. Berikut beberapa tahapan waterfall model.

a. RequirementsAnalysisand Definition

Mengumpulkan kebutuhan secara lengkap kemudian dianalisis dan didefinisikan kebutuhan yang harus dipenuhi oleh program yang akan dibangun. Fase ini harus dikerjakan secara lengkap untuk bisa menghasilkan desain yang lengkap.

b. Sistem and Software Design

Desain dikerjakan setelah kebutuhan selesai dikumpulkan secara lengkap. c. Implementationand Unit Testing

Desain program diterjemahkan kedalam kode-kode dengan menggunakan bahasa pemrograman yang sudah ditentukan. Program yang dibangun langsung diuji secara unit.

d. Integrationand Sistem Testing

Penyatuan unit-unit program kemudian diuji secara keseluruhan (system testing).

e. Operationand Maintenance

Mengoperasikan program di lingkungannya dan melakukan pemeliharaan, seperti penyesuaian atau perubahan karena adaptasi dengan situasi sebenarnya.

(21)

Gambar 1.1 Waterfall[8]

4. Tahap Pengujian

Pengujian yang dilakukan pada penelitian ini adalah menggunakan pengujian Unit Testing. Hasil dari pengujian ini digunakan untuk menarik kesimpulan yang nantinya akan jadi hasil akhir.

1.6 Sistematika Penulisan

Sistematika penulisan skripsi dibuat untuk memberikan gambaran umum mengenai penelitian yang dilaksanakan. Penyusunan skripsi ini dibagi ke dalam lima bab yang disusun secara sistematis sesuai dengan pokok-pokok permasalahan yang dibahas. Sistematika penulisan tugas akhir ini adalah sebagai berikut:

BAB 1 PENDAHULUAN

Bab ini berisi penjelasan mengenai latar belakang masalah, perumusan masalah, maksud dan tujuan, batasan masalah, metodologi penelitian dan sistematika penulisan yang dilakukan pada penelitian ini.

Requirements definition

System and Software Design

Implementation and unit testing

Integration and sytem testing

Operation and maintenance

(22)

BAB 2 TINJAUAN PUSTAKA

Bab ini membahas berbagai konsep dasar dan teori-teori yang berkaitan dengan topik penelitian seperti pengertian String, String Matching, Algoritma, Algoritma String Matching, Algoritma Zhu-Takaoka, Algoritma Reverse Colussi, Kompleksitas Algoritma, Notasi Big-O, Metode Pembangunan Perangkat Lunak yang digunakan, Bahasa Pemrograman yang digunakan, Tools yang digunakan, Pemodelan Data yang dilakukan, pendekatan untuk pembangunan software yang digunakan, dan pengujian algoritma yang digunakan.

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

Bab ini berisi pembahasan mengenai analisis dan perancangan algoritma

Zhu-Takaoka dan algoritma Reverse Colussi yang akan diimplementasikan pada aplikasi Perbandingan Algoritma Zhu-Takaoka dan Algoritma Reverse Colussi.

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM

Bab ini berisi pembahasan mengenai implementasi algoritma Zhu-Takaoka

dan algoritma Reverse Colussi dari hasil tahapan analisis algoritma dan perancangan sistem yang dibangun, serta uji coba dan hasil pengujian sistem menggunakan Unit Testing.

BAB 5 KESIMPULAN DAN SARAN

Bab ini berisi kesimpulan yang diperoleh dari hasil pengujian yang dilakukan untuk mengetahui tingkat akurasi dan waktu yang dibutuhkan oleh algoritma Zhu-Takaoka dan Reverse Colussi pada saat mencocokkan string dalam satu kali proses dan saran untuk pengembangan selanjutnya.

(23)

BAB 2

TINJAUAN PUSTAKA

2.1 Rumah Baca Buku Sunda jeung Sajabana

Rumah Baca Buku Sunda Jeung Sajabana adalah perpustakaan yang pada dasarnya berisi buku-buku Sunda. Perpustakaan ini didirikan pada tahun 2004, dan berada di salah satu perumahan kota Bandung, yaitu di Perumahan Margawangi JL. Margawangi VII No.5 Margacinta Bandung.

Perpustakaan ini terbuka untuk orang-orang yang berminat, tanpa dipungut biaya sedikit pun. Namun demikian, pengunjung hanya boleh membaca di tempat, tanpa bisa dibawa pulang. Dengan kata lain, semua bacaan yang ada di tempat ini tidak untuk dipinjamkan.

Setelah memasuki tempat ini, pengunjung akan menemukan banyak bacaan di luar Bahasa Sunda. Oleh karena itu, perpustakaan ini diberi nama Rumah Baca Buku Sunda Jeung Sajabana, “Jeung Sajabana” memiliki arti “dan sebagainya”

yang merujuk pada bacaan-bacaan di luar Bahasa Sunda.

Bacaan yang ada di tempat ini, tidak sebatas buku terbitan tertentu, tetapi juga kumpulan cerita, serta artikel bahasa Sunda yang menarik dalam bentuk kliping.

2.2 String

Dalam ilmu komputer, string dapat diartikan sebagai sekuens dari karakter. Selain sebagai data abstrak yang menyimpan sekuens nilai data, string juga dapat berupa bytes yang merupakan elemen pembentuk karakter, sesuai dengan encoding

karakter yang disepakati ASCII ataupun EBCDIC [9].

2.3 String

Matching

Dalam Bahasa Indonesia string matching dikenal dengan istilah ‘pencocokan string’ atau ‘pencocokan kata’. Berikut adalah perumusan kasus pencocokan kata (String Matching).

(24)

Diasumsikan teks adalah sebuah susunan T[1..n] dengan panjang n dan memiliki susunan P[1..m] dengan panjang m. Lalu, elemen P dan T merupakan karakter-karakter yang digambarkan dari ∑ abjad terbatas. Contoh, diketahui ∑ =

{0,1} atau ∑ = {a,b,…,z}. Sedangkan karakter susunan P and T dapat didefinisikan

sebagai kata (string) pada banyak karakter [9].

Pola yang dimaksud adalah dimana P muncul dengan shift s dalam teks T

(atau , ekuivalen , pola P muncul pada permulaan di posisi s + 1 pada teks T) Jika 0 ≤ s ≤ n – m dan T[s +1..s +m] = P[1..m] (itu adalah, jika T[s + j] = P[j], for 1 ≤ j ≤ m). Jika P muncul dengan shift s di T, maka disebut s sebuah shift yang sah. Kasus pencocokan kata (String Macthing) merupakan masalah dari menemukan semua shift yang sah dengan pola pemberian P yang muncul di teks pemberian T. Kecocokan adalah apabila karakter pada teks T dan karakter pada pola P yang dibandingkan adalah sama. Mengacu pada gambar di bawah, bahwa pola P

melakukan pergeseran dalam teks T. Masalah pencocokan string adalah masalah menemukan semua pergeseran yang valid dengan diberikan pola P yang terjadi pada teks T.

Gambar 2.1 Kasus String Matching

2.4 Algoritma

Algoritma adalah urutan langkah-langkah untuk memecahkan suatu masalah[1]. Terdapat beragam definisi dari para ahli mengenai algoritma, tetapi pada intinya prinsip algoritma adalah proses pemecahan suatu masalah. Berikut adalah definisi algoritma yang dikutip dari salah satu literatur.

Menurut Goodman Hadet Niemi, algoritma adalah urutan-urutan terbatas dari operasi-operasi yang terdefinisi dengan baik, yang masing-masing membutuhkan memori dan waktu yang terbatas untuk menyelesaikan masalah[1]. Langkah-langkah dalam algoritma harus logis dan harus dapat ditentukan bernilai

(25)

salah atau benar. Selain itu, dalam beberapa konteks, algoritma dapat diartikan sebagai spesifikasi urutan langkah untuk melakukan pekerjaan tertentu.

Terdapat beberapa pertimbangan dalam pemilihan algoritma[1]. Pertama, algoritma itu harus benar, artinya algoritma akan memberikan keluaran yang dikehendaki dari sejumlah masukan yang diberikan. Pertimbangan kedua adalah efektif, yaitu harus mengetahui seberapa baik hasil yang dicapai oleh algoritma tersebut. Hal tersebut dianggap sangat penting terutama pada algoritma untuk menyelesaikan masalah yang memerlukan aproksimasi hasil (hasil yang hanya berupa pendekatan). Pertimbangan ketiga yaitu efisiensi algoritma. Untuk menilai efisiensi algoritma dapat ditinjau dari 2 hal, yaitu efisiensi waktu dan memori. Meskipun algoritma memberikan keluaran yang benar atau paling mendekati, tetapi jika harus menunggu berjam-jam untuk mendapatkan keluaran dari algoritma tersebut, biasanya algoritma seperti itu tidak akan dipakai karena setiap orang menginginkan keluaran yang cepat. Sama halnya dengan memori, semakin besar memori yang terpakai maka semakin buruklah algoritma tersebut.

2.4.1 Ciri dan Sifat Algoritma

Setiap penggunaan algoritma memiliki ciri dan sifat. Menurut Donald E. Knuth dalam bukunya The Art of Computer Programming, algoritma harus mempunya 5 ciri penting [9], yaitu sebagai berikut:

1. Algoritma mempunyai awal dan akhir, artinya suatu algoritma harus berhenti setelah mengerjakan serangkaian tugas. Dengan kata lain, suatu algortima memiliki langkah yang terbatas.

2. Setiap langkah harus didefinisikan dengan tepat sehingga tidak memiliki arti ganda (not ambiguous).

3. Memiliki masukan (input) atau kondisi awal. 4. Memiliki keluaran (output) atau kondisi akhir.

(26)

Berdasarkan ciri algoritma yang dipaparkan oleh Donuld E. Knuth, maka dapat disimpulkan sifat utama suatu algoritma[9], yaitu :

1. Input

Suatu algoritma memliki input atau kondisi awal sebelum algoritma dilaksanakan. Input tersebut dapat berupa nilai-nilai pengubah yang diambil dari himpunan khusus.

2. Output

Suatu algortima akan menghasilkan output setelah dilaksanakan. Nilai

output diperoleh dari nilai input yang telah diproses melalui algoritma. 3. Definiteness

Langkah-langkah yang dituliskan dalam algoritma terdefinisi dengan jelas sehingga mudah dilaksanakan oleh sistem.

4. Finiteness

Suatu algoritma harus memberikan kondisi nilai akhir atau output setelah melakukan sejumlah langkah yang terbatas jumlahnya untuk setiap kondisi awal atau input yang diberikan.

5. Effectiveness

Setiap langkah dalam algoritma bisa dilaksanakan dalam selang waktu tertentu sehingga pada akhirnya memberi solusi sesuai yang diharapkan. 6. Generality

Langkah-langkah algoritma berlaku untuk setiap himpunan input yang sesuai dengan persoalan yang akan diberikan, tidak hanya untuk himpunan tertentu.

2.5 Algoritma

String Matching

Menurut Brassard dan Bratley, algoritma string matching adalah sebuah algoritma yang digunakan dalam pencocokkan suatu pola kata tertentu terhadap suatu kalimat atau teks [9]. Menurut arah pencarianya, algoritma pencocokan string

(27)

1. Dari arah yang paling alami, yaitu dari kiri ke kanan yang merupakan arah membaca, algoritma yang termasuk kategori ini adalah :

1) Algoritma Brute Force

2) Algoritma Knuth-Morris-Pratt

2. Dari kanan ke kiri, arah yang biasanya menghasilkan hasil terbaik secara praktikal, contohnya adalah Algoritma Boyer-Moore yang kemudian banyak dikembangkan menjadi algoritma turbo Boyer-Moore, algoritma tuned Boyer-Moore dan algoritma Zhu-Takaoka.

3. Dari arah yang ditentukan secara spesifik oleh algoritma tersebut (arah ini menghasilkan hasil terbaik secara teoretis), seperti:

1) Algoritma Colussi

2) Algoritma Chrochemore-Perrin

2.5.1 Algoritma Zhu-Takaoka

Algoritma Zhu-Takaoka merupakan salah satu algoritma pencocokan string

(String Matching) yang merupakan pengembangan dari algoritma Boyer-Moore. Algoritma ini dipublikasikan oleh Zhu Rui Feng dan Tadao Takaoka pada tahun 1986 [10]. Dalam penelitiannya, Zhu dan Takaoka menyebut algoritma pencocokan

string ini sebagai BM" Algorithm (Boyer-Moore Algorithm) karena merupakan modifikasi dari algoritma pencocokan string Boyer-Moore, yaitu algoritma yang dibuat oleh Boyer R.S. dan Moore J.S. Algoritma Zhu-Takaoka dan algoritma

Boyer-Moore memiliki ciri yang sama dalam proses pencarian string, yaitu terdapat tahap Preprocessing, Right-to-left scan, Bad character rule dan Good-suffix rule[10]. Sementara itu, perbedaan dari kedua algoritma tersebut terletak pada tahap penentuan Bad character rule. Dalam Boyer-Moore, bad character hanya terdiri dari array satu dimensi, sedangkan dalam Zhu-Takaokaarray dimodifikasi menjadi dua dimensi. Berikut ini adalah penjelasan mengenai karakter algoritma Zhu-Takaoka.

(28)

1. Preprocessing

Preprocessing adalah proses yang dilakukan sebelum proses inti, yaitu proses pencarian pattern dalam suatu teks. Dalam algoritma Zhu-Takaoka,

preprocessing meliputi proses pencarian nilai pergeseran karakter (good-suffix shift) yang nilai nya ditentukan dalam good suffix preprocessing, dan pergeseran karakter jika ditemukan ketidakcocokan karakter (bad-character shift) yang nilai nya ditentukan dalam bad character preprocessing.

2. Right-to-Left Scan Rule

Sebagaimana disebutkan sebelumnya, bahwa Zhu-Takaoka merupakan salah satu algoritma yang melakukan pencocokan string dari kanan ke kiri, maka proses pencarian algoritma ini dilakukan dengan teknik right-to-left scan rule. Teknik ini dilakukan dengan membandingkan pattern dengan sumber teks. Perbandingan dilakukan dari karakter paling kanan pada pattern dengan karakter paling kanan pada sumber teks. Apabila dalam proses tersebut ditemukan kecocokan, maka perbandingan akan dilanjutkan dengan bergerak ke kiri sampai pada karakter pertama dari pattern. Tetapi apabila ditemukan ketidakcocokan, maka akan dilakukan pergeseran yang jumlah pergeserannya ditentukan oleh aturan

bad-character shift atau good-suffix shift.

3. Bad-Charcter Shift Rule

Ketika ditemukan ketidakcocokan dalam proses perbandingan, aturan bad-character shift dibutuhkan untuk menghindari pengulangan perbandingan. Dalam aturan bad-character shift, jumlah pergeseran yang dilakukan disimpan dalam bentuk tabel array dua dimensi. Tabel tersebut terdiri dari beberapa kolom, yaitu kolom karakter dan kolom shift yang menunjukan jumlah pergeseran.

4. Good Suffix Shift Rule

Aturan good-suffix shift dibuat untuk menangani kasus dimana terdapat pengulangan karakter pada pattern.

(29)

5. Langkah – langkah pencarian

Proses inti pencarian Algoritma Zhu-Takaoka yaitu dilakukan dengan teknik Right-to-left scan rule. Teknik ini membandingkan pattern yang dicari dengan sumber teks dimulai dari kanan ke kiri. Berikut contoh pencocokan string

dengan algoritma Zhu-Takaoka : Pattern yang dicari : DONE

Sumber string (Teks) : INDONESIAINDONESI Dari hasil preproccessing maka dihasil kan tabel ztBc :

Tabel 2.1 Tabel ztBc D E N O D 3 4 4 2 E 3 4 4 4 N 3 4 4 4 O 3 4 1 4

Tabel 2.2 bmGs: i 0 1 2 3 X[i] D O N E bmGs 4 4 4 1

Percobaan ke 1: