188
thresholding. Fisher thresholding dilakukan sebagai tahap pertama, kemudian local thresholding dilakukan pada tahap keduanya.
2.2 Fisher Thresholding
Gambar berikut menunjukkan alur proses dari metode Fisher thresholding.
Gambar 1. Proses Fisher Thresholding
Fisher thresholding melakukan perhitungan threshold dengan mencari nilai maksimum antara Between-Class Scatter dan Within-Class Scatter. Misalkan I merupakan citra
grayscale dengan L sebagai gray level [ 0,1, …, L-1], maka probabilitas dari nilai gray i
yang muncul pada citra dapat didefinisikan sebagai berikut [4].
1
Asumsikan piksel-piksel pada citra terbagi menjadi 2 kelas C1 dan C2 berdasarkan nilai gray t.
2 Maka nilai mean gray level pada tiap kelas dapat didefinisikan sebagai berikut.
3 Sedangkan variansi kelas dapat dihitung berdasarkan:
4 dan variansi antar kelas:
5 maka, nilai threshold dapat dihitung berdasarkan:
6 di mana nilai
7 yang memenuhi
8 Keterangan:
n
i
= Frekuensi gray level i N = Jumlah piksel pada citra
L = Gray level
Mulai Input Citra
Grayscale Hitung histogram
citra Lakukan proses
morphological erosi dan dilasi
Hitung fungsi objektif untuk
mendapatkan nilai maksimum
gunakan nilai k yang menghasilkan
nilai maksimum sebagai threshold
Output citra hasil Fisher Thresholding
Selesai
189 p
i
= Peluang gray level i w = Probabilitas tiap kelas
k = Nilai threshold yang dihitung m = Mean gray level tiap kelas
σ
2
= Variansi tiap kelas λ = Fungsi objektif
2.3 Sauvola Thresholding
Gambar 2. Proses Sauvola Thresholding
Metode Sauvola merupakan modifikasi dari metode Niblack [5]. Pendekatan dari Niblack adalah membedakan threshold citra berdasarkan nilai rataan dan standard deviasi
lokal yang dihitung berdasarkan ketetanggaan pada piksel dengan menggunakan jendela ketetanggaan. Modifikasi yang dilakukan Sauvola adalah dengan menghitung threshold
menggunakan nilai dinamis R dari standard deviasi [5].
Berikut rumus yang digunakan untuk menghitung nilai threshold T [5]. 9
di mana nilai m merupakan rata-rata gray level tiap kelas dan nilai s merupakan standard deviasi. Nilai R yang digunakan adalah 128 yang merupakan nilai maksimum standard
deviasi untuk citra grayscale.
3 PERANCANGAN SISTEM
Deskripsi Umum Sistem Gambar berikut menunjukan alur kerja sistem secara keseluruhan.
Gambar 3. Alur kerja secara umum sistem OCR yang dibangun
Proses diawali dengan input citra melalui proses capture kamera atau me-load citra yang sudah ada pada storage. Kemudian, dilakukan proses Fisher Thresholding. Setelah
itu dilanjutkan dengan Sauvola Thresholding pada citra. Citra biner yang dihasilkan dari mixed binarization tersebut kemudian diproses menggunakan Tesseract Engine untuk
menghasilkan data teks dari hasil pengenalan kata yang terdapat pada citra. Mulai
Input Citra Grayscale
Hitung mean per window
size Hitung Standar
Deviasi per window size
Hitung nilai threshold per
window size Lakukan
thresholding tiap window
Selesai
Input Citra Convert
Grayscale Morphological
Operation Fisher
Thresholding
Sauvola Thresholding
Output Citra Biner
OCR melalui Tesseract
Engine Output Data
Teks
190
3.1 Kebutuhan Sistem