Algoritma Algoritma Pencocokan String

BAB 2 LANDASAN TEORI

2.1. Algoritma

Istilah algoritma algorithm berasal dari kata “algoris” dan “ritmis”, yang pertama kali diungkapkan oleh Abu Ja‟far Mohammed Ibn Musa al Khowarizmi 825 M dalam buku Al-Jabr Wa-al Muqabla. Dalam bidang pemrograman algoritma didefenisikan sebagai suatu metode khusus yang tepat dan terdiri dari serangkaian langkah yang terstruktur dan dituliskan secara matematis yang akan dikerjakan untuk menyelesaikan suatu masalah dengan bantuan komputer. Jogiyanto, 2005. Istilah algoritma digunakan dalam ilmu komputer untuk menggambarkan metode pemecahan masalah yang terbatas, deterministik, dan efektif yang cocok untuk implementasi sebagai program komputer. Sedgewick. 2011. Terdapat beberapa defenisi yang diberikan untuk kata algoritma antara lain Priyatna. 2015 : a. Algoritma adalah sekelompok aturan untuk menyelesaikan perhitungan yang dilakukan oleh tangan atau mesin. b. Algoritma adalah langkah demi langkah sebuah prosedur berhinggga yang dibutuhkan untuk menghasilkan sebuah penyelesaian. c. Algoritma adalah urutan langkah-langkah perhitungan yang mentrasformasikan dari nilai masukan menjadi keluaran. d. Algoritma adalah urutan operasi yang dilakukan terhadap data yang terorganisasi dalam struktur data. e. Algoritma adalah sebuah program abstrak yang dapat dieksekusi secara fisik oleh mesin. f. Algoritma adalah sebuah model perhitungan yang akan dilakukan oleh komputer. Universitas Sumatera Utara

2.2. Algoritma Pencocokan String

Algoritma pencocokan string string matching merupakan komponen dasar dalam pengimplementasian berbagai perangkat lunak praktis yang sudah ada. String matching digunakan untuk menemukan satu atau lebih string yang disebut dengan pattern string yang akan dicocokkan ke dalam text dalam string yang disebut dengan text string yang di-input. Charras. 1997. Algoritma yang dianggap memiliki hasil yang paling baik dalam praktiknya merupakan algoritma yang bergerak mencocokan string dari arah kanan ke kiri. Untuk mengetahui manakah algoritma yang mampu mencari string paling cepat, maka muncullah ide untuk meneliti kemampuan dari algoritma-algoritma ini. Sagita. 2013. String adalah rangkaian karakter selama Σ alphabet yang terbatas. Misalnya, ATCTAGAGA adalah string lebih . Masalah pencocokan string adalah untuk menemukan semua kejadian dari string P yang disebut pola, di string T pada alphabet yang sama yang disebut teks. Mengingat string x, y, dan z kita mengatakan bahwa x adalah awalan dari xy, akhiran dari yx, dan faktor yxz. Navarro. 2002. Exact string matching, yaitu pencocokan sebuah string secara sangat tepat dengan susunan karakter dalam string yang dicocokkan baik dalam jumlah maupun urutan karakter dalam stringnya. Pada proses pencocokan string, digunakan sebuah window yang akan bergeser di text. Window itu memiliki panjang yang sama dengan panjang pattern. Pada awal proses pencocokan string, window diletakkan pada ujung kiri text, lalu karakter-karakter pada window dibandingkan dengan karakter-karakter pada pattern, kemudian window akan digeser ke kanan di text dengan jarak tertentu, dan pergeseran tersebut baru akan berhenti bila window tersebut sampai pada ujung kanan text atau sampai pattern ditemukan cocok. Charras. 1997. Contoh sliding windows yang sedang menggeser pattern di teks dapat dilihat di Gambar 2.1. Universitas Sumatera Utara Gambar 2.1 Mekanisme Sliding Windows Algoritma pencocokan string dapat diklasifikasikan menjadi tiga bagian menurut pencariannya, Charras. 1997 : a. Kategori pertama, arah yang paling alami dalam pencocokan string yaitu dari kiri ke kanan. Algoritma kategori ini melakukan pencocokan string dimulai dari karakter paling kiri pattern seperti yang ditunjukkan pada Gambar 2.2. Beberapa algoritma yang termasuk dalam kategori ini adalah algoritma brute force, algoritma Karb-Rabin, dan algoritma Knuth-Morris-Pratt. Gambar 2.2 Pencocokan dari Karakter Paling kiri ke Paling Kanan Pattern b. Kategori kedua, algoritma yang melakukan pencocokan dari kanan ke kiri karakter pada pattern seperti yang dapat dilihat pada Gambar 2.3. Algoritma yang termasuk dalam kategori ini umumnya dikatakan sebagai algoritma yang menghasilkan hasil terbaik pada praktekmya, yaitu algoritma Boyer-Moore. Gambar 2.3 Pencocokan dari Karakter Paling Kanan ke Paling Kiri Pattern Universitas Sumatera Utara c. Kategori ketiga yaitu pencocokan dari dua arah yang telah ditentukan oleh tiap algoritma tertentu. Salah satunya seperti yang diterapkan oleh Galil-Seiferas dan Crochemore-Perrin dalam algoritma Two Way, mereka membagi pattern y menjadi dua bagian yaitu y = y 1 y 2 . Seperti yang dapat kita lihat pada Gambar 2.4, pertama kali, pencarian terjadi pada y 2 yang dilakukan dari karakter paling kiri ke kanan, apabila selama pencarian pertama tidak terjadi ketidakcocokan atau pattern y 2 cocok dengan text selanjutnya pada pencarian kedua algoritma akan memeriksa pada y 1 yang dilakukan dari kanan ke kiri seperti yang ditunjukkan pada Gambar 2.5. Gambar 2.4 Pencocokan Pattern y 2 Dimulai dari Karakter Paling Kiri Gambar 2.5 Pencocokan Pattern y 1 Dimulai dari Karakter Paling Kanan

2.3. Algoritma Galil-Seiferas