Implementasi Global Tresholding Metode Otsu dan Tesseract Engine dengan Algoritma Horspool untuk Menerjemahkan Kata Berbahasa Jepang Jenis Katakana

vii

ABSTRAK
Bahasa Jepang merupakan salah satu bahasa yang paling sering digunakan di dunia
yaitu pada urutan kesembilan, sehingga dibutuhkan pengetahuan mengenai bahasa dan
tulisan Jepang. Masih banyaknya masyarakat yang belum mengetahui tentang bahasa
Jepang baik penulisan, arti maupun penyebutan sehingga dibuat sistem yang bisa
menerjemahkan dari aksara Jepang ke bahasa Indonesia dengan menerapkan Image
Process dan OCR Tesseract yang kemudian dikombinasikan dengan algoritma String
Matching Horspool. OCR diperlukan untuk mengenali teks yang terdapat dalam
sebuah gambar. Gambar inputan mengalami proses segmentasi untuk mendapatkan
citra biner dengan Treshold Metode OTSU setelah itu dicocokan dengan data latih
aksara Jepang yang sudah tersedia. Image Processing dilakukan untuk menambah
akurasi ketepatan pengenalan OCR Tesseract.String yang didapat kemudian
diterjemahkan secara online, dan dilakukan proses string matching dengan data yang
terdapat dalam database. Algoritma Horspool menyimpan informasi pencarian untuk
melakukan pergeseran yang lebih jauh karena pencocokan string dilakukan dari
kanan ke kiri sehingga waktu pencarian lebih pendek. Hasil yang didapat dari aplikasi
ini menampilkan keseluruhan string yang berhasil dikenali dan pattern yang cocok
dengan string yang berhasil dikenali.
Kata Kunci : Image Processing, Metode OCR, OCR Tesseract, Algoritma Horspool,

Pengenalan Kata dari Image

Universitas Sumatera Utara

viii

ABSTRACT
Japanese is one of the most commonly used languages in the world in the ninth order,
requiring knowledge of Japanese language and writing. There are still many people
who do not know about the Japanese language either writing, meaning and
mentioning that made a system that can translate from Japanese script to the
Indonesian language by applying Image Process and OCR Tesseract which then
combined with String Matching Horspool algorithm. OCR is required to recognize the
text contained in an image. The input image experiencing segmentation process to get
a binary image with the OTSU Treshold Method after which it is matched with
Japanese script tracking data already available. Image Processing is done to increase
accuracy of the accuracy of the introduction of OCR Tesseract. The obtained string is
then translated online, and a string matching process is done with the data contained
in the database. The Horspool algorithm stores search information to make further
shifts because string matching is done from right to left so that search time is shorter.

The results obtained from this app show the entire string that was recognized and the
pattern matching the string that was successfully recognized.
Keywords : Image Processing, OCR Method, OCR Tesseract, Horspool Algorithm,
Word Recognition from Image

Universitas Sumatera Utara