Pengertian String Matching Cara Kerja String Matching

BAB 2 LANDASAN TEORI

2.1 String Matching

2.1.1 Pengertian String Matching

String matching adalah pencarian sebuah pattern pada sebuah teks Cormen, T.H. et al. 1994. String matching digunakan untuk menemukan suatu string yang disebut dengan pattern dalam string yang disebut dengan teks Charras, C. Lecroq, T. 1997. Prinsip kerja algoritma string matching Effendi, D. et al. 2013 adalah sebagai berikut: 1. Memindai teks dengan bantuan sebuah window yang ukurannya sama dengan panjang pattern. 2. Menempatkan window pada awal teks. 3. Membandingkan karakter pada window dengan karakter dari pattern. Setelah pencocokan baik hasilnya cocok atau tidak cocok dilakukan pergeseran ke kanan pada window. Prosedur ini dilakukan berulang-ulang sampai window berada pada akhir teks. Mekanisme ini disebut mekanisme sliding window. Algoritma string matching mempunyai tiga komponen utama Effendi, D. et al. 2013, yaitu: 1. Pattern, yaitu deretan karakter yang akan dicocokkan dengan teks, dinyatakan dengan [ … − ], panjang pattern dinyatakan dengan . 2. Teks, yaitu tempat pencocokan pattern dilakukan. Dinyatakan dengan [ … − ], panjang teks dinyatakan dengan . Universitas Sumatera Utara 6 3. Alfabet, berisi semua simbol yang digunakan oleh bahasa pada teks dan pattern, dinyatakan dengan ∑ dengan ukuran dinyatakan ASIZE.

2.1.2 Cara Kerja String Matching

Cara yang jelas untuk mencari pattern yang cocok dengan teks adalah dengan mencoba mencari di setiap posisi awal dari teks dan mengabaikan pencarian secepat mungkin jika karakter yang salah ditemukan Knuth, D.E. et al. 1977. Proses pertama adalah menyelaraskan bagian paling kiri dari pattern dengan teks. Kemudian dibandingkan karakter yang sesuai dari teks dan pattern. Setelah seluruhnya cocok maupun tidak cocok dari pattern, window digeser ke kanan sampai posisi − + pada teks. Menurut Singh, R. Verma, H.N. 2011, efisiensi dari algoritma terletak pada dua tahap: 1. Tahap praproses, tahap ini mengumpulkan informasi penuh tentang pattern dan menggunakan informasi ini pada tahap pencarian. 2. Tahap pencarian, pattern dibandingkan dengan window dari kanan ke kiri atau kiri ke kanan sampai kecocokan atau ketidakcocokan terjadi. Dengan sebuah nilai karakter m n yang akan dicari dalam teks. Dalam algoritma pencocokan string, teks diasumsikan berada di dalam memori, sehingga bila kita mencari string di dalam sebuah arsip, maka semua isi arsip perlu dibaca terlebih dahulu kemudian disimpan di dalam memori. Jika pattern muncul lebih dari sekali di dalam teks, maka pencarian hanya akan memberikan keluaran berupa lokasi pattern ditemukan pertama kali Wulan, 2011.

2.1.3 Klasifikasi Algoritma String Matching