Implementasi Algoritma Thresholding Adaptif dan Tesseract OCR untuk Mendeteksi Citra Teks Kemasan Makanan Berbasis Android

vi

ABSTRAK

Informasi yang ada pada sebuah kemasan produk makanan tidak dapat dicari secara
instan. Hal ini menyulitkan konsumen yang hanya ingin mengetahui informasi yang
ada pada kemasan makanan tersebut. Diperlukan suatu metode bagaimana mengambil
citra teks kemasan makanan dan perangkat langsung mengenali teks yang ada pada
produk tersebut. Optical Character Recognition merupakan cabang dari konsep
artificial intelligence dari bidang pengolahan citra, dimana suatu citra yang berisikan
teks dapat dikonversi menjadi editable text. Sebelum citra teks kemasan dapat dikenali
menggunakan metode Tesseract OCR, perlu dilakukan tahap pre-processing yaitu
implementasi algoritma Thresholding Adaptif yang bertujuan untuk memisahkan
antara citra teks dengan citra background dalam bentuk citra biner. Kemudian
Tesseract OCR mengenali setiap teks yang ada pada citra dengan tahapan metode yang
dilalui yaitu feature extraction, segmentasi per kata, dan word recognition. Penelitian
ini difokuskan untuk mengembangkan aplikasi pengenalan citra teks kemasan makanan
berbasis Android. Citra teks yang dikenali terdiri dari 10 citra melalui kamera dan 20
citra lainnya melalui galeri unduhan dari internet dengan kategori font yaitu Serif dan
Sans Serif. Dari pengujian yang telah dilakukan, diperoleh tingkat akurasi terbaik
mencapai 100% pada citra uji melalui kamera dengan kategori font Serif dan 94.56%

pada citra uji melalui galeri dengan kategori font Sans Serif.
Kata Kunci : Kemasan Makanan, Optical Character Recognition, Thresholding
Adaptif, Tesseract, Pre-processing.

Universitas Sumatera Utara

vii

IMPLEMENTATION OF ADAPTIVE THRESHOLDING ALGORITHM AND
TESSERACT OCR FOR DETECTING FOOD PACKAGING
TEXT-IMAGE BASED ON ANDROID

ABSTRACT

The information written on a food packaging cannot be searched instantly. It will be
difficult for customers who just want to find out some information from the food
packaging. A proposed method is required on how to capture the text-image of the food
packaging and directly recognize the text contained on the product. Optical Character
Recognition is a branch of artificial intelligence concepts from the field of image
processing, where it converts text-image into an editable text. In order to identify the

food packaging texts using Tesseract OCR, a pre-processing approach is needed to
separate the text image from the background image in the form of a binary image using
Adaptive Thresholding algorithm. Then Tesseract OCR will try to recognize every text
contained in the image using several methods i.e. feature extraction, text segmentation,
and word recognition. This research is focused on developing a food packaging text
image recognition based on Android application. The images that must be identified
will consist of 10 text images using the camera and 20 other text images using the
gallery function downloaded from the internet. The font category are Serif and Sans
Serif. The final result after the test has been conducted, it is found that text images
taken from camera has the best accuracy of 100% with Serif font categories while the
text images from the gallery has the accuracy of 94.56% with Sans Serif font categories.
Keywords : Food Packaging, Optical Character Recognition, Thresholding Adaptif,
Tesseract, Pre-processing.

Universitas Sumatera Utara