Implementasi Dan Perbandingan Algoritma Smith Dan Algoritma Raita Pada Pencarian Kata

BAB I

PENDAHULUAN

1.1Latar Belakang
Pencocokan string merupakan masalah mendasar yang terjadi dalam berbagai
aplikasi praktis. (Mitani & Ino, 2016).Pencocokan string adalah proses
menemukan jumlah kejadian dari P pola panjang m di T teks panjang n, di mana
dalam prakteknya m lebih kecil dari n.(Abdulrakeeb & Hassan, 2017).Dalam
pencarianstring, diperlukan algoritma untuk mencocokkan string yang dicari
dengan semua stringyang terdapat dalam dokumen teks tersebut. Pencocokan
stringatau string matching adalah proses pencarian semua kemunculan string
pendek P[0..n-1] yang disebut pattern di string yang lebih panjang T[0..m-1]
yang disebut teks. (Kumara, 2008).
Algoritma pencocokan string yang penulis gunakan dalam penelitian ini
adalah algoritma Smith dan algoritma Raita. Algoritma Raita menggunakan
fungsi pergeseran bad-character dari algoritma Boyer Moore. Sedangkan
algoritma Smith tidak hanya menggunakan fungsi pergeseran bad-character dari
algoritma Boyer Moore , tapi mengambil nilai terbesar dari bad-character dari
algoritma Quick Search dengan fungsi pergeseran bad-character dari algoritma
Boyer Moore.

Pada penelitian yang terdahulu, Secara teoretis algoritma Smith
cenderung memiliki running time yang jauh lebih besar, namun pada percobaan
riil algoritma Smith lebih cepat dibandingkan dengan algoritma ApostolicoCrochemore selama pattern bisa ditemukan didalam teks. Sementara itu, jika
pattern tidak berada di dalam teks, algoritma Smith memiliki running time lebih
besar. (Hutagalung, 2016). Dan penulis akan membandingkan algoritma Smith

Universitas Sumatera Utara

dengan algoritma Raita yang pada penelitian terdahulu, Banyaknya data pada
database (SQLITE) tidak mempengaruhi kecepatan pencarian data kamus
(Nasution, 2016).
Kedua algoritma pada pencarian kata akan diimplementasikan pada Judul
Skripsi Mahasiswa Ilmu Komputer USU. Yang mana setiap tahun nya jurusan
ilmu komputer menghasilkan sarjana baru dengan judul skripsi yang berbeda
beda. Semua skripsi mahasiswa disusun rapi di ruang perpustakaan skripsi (lantai
II). Mahasiswa, Dosen dan Pegawai dapat melihat seluruh skripsi yang ada.
Namun disaat mereka mencari informasi judul skripsi, mereka harus melihat satu
persatu judul skripsi dihalaman depan skripsi. Hal tersebut terlihat kurang efisien
, Selain itu dengan jam operasional perpustakaan yang terbatas yaitu dari jam
08.00-17.00dapat menghambat orang yang membutuhkan data dengan cepat.

Maka dari itu penelitian ini akan diimplementasikan pada kasus pencarian judul
skripsiMahasiswa Ilmu Komputer USU.
Setelah kedua algoritma ini diimplementasikan maka kedua algoritma ini
akan dibandingkan kinerjanya dalam mencocokkan string. Diukur berdasarkan
kompleksitas

teoritis

(big Ө),

dan

running

timepencocokkan

pattern

(milidetik)untuk berbagai panjang pattern P[0..n-1].Hasil dari setiap komponen
pengukuran akan dibandingkan satu sama lain sehingga dapat menghasilkan

kesimpulan algoritma mana yang lebih efisien diantara kedua nya dalam proses
pencocokan string.

1.2Rumusan Masalah
Masalah yang akan dibahas adalah sulitnya melakukan pencarian kata pada
judul skripsi mahasiswa ilmu komputer USU yang memiliki kemiripan kata
secara manual.

1.3 Batasan Masalah
Batasan masalah yang dapat diambil dari latar belakang di atas adalah :

Universitas Sumatera Utara

1. Parameter pembanding yang diukur adalah kompleksitas teoritis Big θ dan
running time pencocokan pattern (milidetik) untuk berbagai panjang
pattern P[0..n-1].
2. Objek yang digunakan sebagai studi kasus adalah judul skripsi mahasiswa
ilmu komputer USU dengan batasan jumlah judul sebanyak 260 (dua ratus
enam puluh) buah.
3. Sistem yang dibuat terbatas pada data berupa teks yang menyimpan data

judul, nim, nama, tahun dan keyword abstract dari skripsi yang
bersangkutan.
4. Target pencocokan string dari sistem yang dibuat yaitu judul skripsi, nim
mahasiswa, nama mahasiswa dan keyword abstract
5. Bahasa pemrograman yang digunakan adalah Java dan Database
Management System MySQL versi 5.6.26.

1.4 Tujuan Penelitian

Tujuan dari penelitian ini adalah mengetahui algoritma mana diantara algoritma
Smithdan algoritma Raita yang lebih efisien dalam pencocokan string dengan
membandingkan kompleksitas waktudalam notasi asimptotik (big Ө) danrunning
timepencocokkan pattern (milidetik)untuk berbagai panjang pattern P[0..n-1]
pada algoritma Smith dan algoritma Raita.

1.5 Manfaat Penelitian
Manfaat dari penelitian ini adalah
1. Pengguna dimudahkan untuk melakukan pencarian katapada judul skripsi
mahasiswa ilmu komputer USU.
2. Pengguna dimudahkan untuk mengetahui judul skripsi yang sudah pernah

ada di Ilmu Komputer USU.

Universitas Sumatera Utara

1.6

Metodologi Penelitian
Penelitian ini menerapkan beberapa metode penelitian sebagai berikut:
1. Studi Literatur
Ditahap ini penulisan dimulai dengan studi kepustakaan yaitu proses
pengumpulan bahan-bahan referensi baik dari buku-buku, artikel-artikel,
maupun dari hasil penelitian mengenai Kompleksitas, String Matching,
algoritma Smith dan algoritma Raita.
2. Pengumpulan dan Analisis Data
Ditahap

ini

dilakukan


pengumpulan

dan

analisis

data

yang

berhubungan dengan penelitian ini, seperti data skripsi mahasiswa Ilmu
Komputer

USU

dari

USU

Institutional


Repository

http://repository.usu.ac.id/, dan fungsi algoritma Smith denganalgoritma
Raita bisa bekerja dalam sebuah aplikasi pencarian string agar penulis
mengetahui karakter (string) yang akan dicari.
3. Analisis dan Perancangan Sistem
Merancang sistem sesuai dengan rencana yang telah ditentukan, yaitu
meliputi perancangan desain awal serta pembuatan flowchart,diagram
ishikawa, Unified Modeling Language (UML), Proses perancangan

ini

berdasarkan pada batasan masalah dari penelitian ini.
4. Implementasi Sistem
Ditahap ini pembuatan sistem dengan menggunakan bahasa pemrograman
Java berbasis desktop telah selesai dilaksanakan dan menambahkan data
hasil algoritma Smith dan Raita ke dalam sistem.
5. Pengujian Sistem
Ditahap ini akan dilakukan pengujian terhadap sistem yang telah

dikembangkan.
6. Dokumentasi Sistem
Melakukan pembuatan dokumentasi sistem mulai dari tahap awal
hingga pengujian sistem,

untuk

selanjutnya

dibuat

dalam bentuk

laporan penelitian (skripsi).

Universitas Sumatera Utara

1.7

Sistematika Penulisan


Agar pembahasan menjadi lebih sistematis, skripsi ini dibuat dalam lima bab,
meliputi:
BAB I

PENDAHULUAN
Bab ini berisi latar belakang penelitian judul skripsi “Implementasi dan
Perbandingan Algoritma Smith dan Algoritma Raita pada Pencarian Judul
Skripsi Mahasiswa Ilmu Komputer USU”, rumusan masalah, batasan
masalah, tujuan penelitian, manfaat penelitian, metodologi penelitian,
tinjauan pustaka, dan sistematika penulisan skripsi.

BAB II

LANDASAN TEORI

Bab ini berisi penjelasan singkat mengenai definisi algoritma, Notasi
Asimptotik, algoritma pencocokan string, algoritma Smith, algoritma
Raita, fase preprocessing, fase pencarian, dan penelitian yang
relevan.


BAB III

ANALISIS DAN PERANCANGAN SISTEM
Bab ini berisi uraian dari analisis sistem, analisis kebutuhan, analisis proses,
Ishikawa Diagram, Unified Modeling Language (UML) Diagram, flowchart,
dan design interface system.

BAB IV

IMPLEMENTASI DAN PENGUJIAN SISTEM
Pada tahap ini dilakukan pembuatan sistem dan coding sesuai dengan
analisis dan perancangan. Kemudian dilakukan pengujian sistem.

BAB V

KESIMPULAN DAN SARAN

Bab terakhir akan memuat kesimpulan isi dari keseluruhan uraian dari
bab-bab sebelumnya dan saran-saran dari hasil yang diperoleh yang

diharapkan dapat bermanfaat dalam pengembangan selanjutnya.

Universitas Sumatera Utara