“Р” ЩКНК BКСКЬК ЊЮЬТК, ЭОЭКЩТ ЩКНК BКСКЬК UФЫКТЧК, СЮЫЮП ЭОЫЬОЛЮЭ ЬОЭКЫК НОЧРКЧ СЮЫЮП “С”.
Perbedaan-perbedaan dalam penggunaan huruf Cyrillic dan perbedaan bahasa yang menggunakannya memnunjukkan bahwa tidak semua kata yang menggunakan
huruf Cyrillic merupakan kata dari Bahasa Rusia. Oleh karena itu, tidak semua kata yang menggunakan huruf Cyrillic dapat diterjemahkan menggunakan kamus bahasa
Rusia.
2.2. Pengolahan Citra Digital
Pengolahan citra adalah memanipulasi citra untuk meningkatkan kualitas citra sehingga lebih mudah diinterpretasi oleh mesin atau manusia Munir, 2004.
Pengolahan citra disebut juga pemrosesan citra atau
image processing
. Proses pengolahan citra yang dilakukan untuk menyiapkan citra adalah seperti
binerisasi, penghilangan derau, deteksi kemiringan, segmentasi karakter, normalisasi ukuran citra,
thinning
dan
skeletonisation
Alginahi, 2010
2.2.1. Pengertian Citra
Citra adalah gambar pada bidang dwimatra atau dua dimensi Munir, 2004. Citra yang dapat diproses secara digital adalah citra digital. Citra digital dapat diperoleh
dari alat penangkap citra digital serperti kamera digital atau
scanner
.
Gambar 2.1. Piksel pada citra Munir, 2004
Universitas Sumatera Utara
Citra digital disusun oleh banyak kotak kecil yang disebut piksel, seperti pada ditunjukkan pada persamaan 2.1. Piksel-piksel tersebut masing masing menyimpan
informasi warna seperti merah, hijau dan biru. Nilai yang disimpan berjarak antara 0 sampai 255 dengan 0 artinya hitam dan 255 berarti putih. Citra digital dapat
dinyatakan dalam bentuk matriks xy, dengan panjang matriks M dan tinggi matriks N dengan anggota matriks adalah piksel-piksel dari citra digital tersebut. Matriksnya
adalah sebagai berikut:
2.2.2. Binerisasi
Proses binerisasi adalah proses untuk menghasilkan citra biner atau citra hitam putih. Metode yang digunakan adalah metode pengambangan atau
thresholding,
yaitu mengganti nilai piksel menjadi 0 atau 255 sesuai dengan nilai ambang batas atau
threshold
yang sudah ditentukan. Citra harus dibinerkan terlebih dahulu karena citra tersebut akan diambil atau
diekstrak fiturnya. Fitur yang diinginkan hanyalah bagian huruf yang ingin dikenali saja, tanpa memuat informasi lain yang tidak penting seperti warna. Oleh karena itu,
citra harus dibinerkan terlebih dahulu. Ada beberapa cara untuk menentukan nilai ambang batas pada proses
pengambangan. Salah satu metode yang cukup terkenal untuk menentukan nilai ambang batas tersebut adalah metode Otsu Singh et al, 2011. Metode Otsu adalah
metode yang digunakan untuk menghasilkan citra biner atau citra hitam putih dari sebuah citra yang masih memiliki tingkat keabuan atau
grayscale
Bhargava et al, 2014. Oleh karena itu, sebuah citra harus diubah menjadi citra
grayscale
terlebih dahulu.
Tahapan dalam memperoleh citra
grayscale
adalah sebagai berikut. 1.
Mengambil piksel dari citra yang akan diproses 2.
Nilai dari warna hijau, biru dan merah dari piksel tersebut kemudian diambil
Universitas Sumatera Utara
3. Mengalikan setiap nilai warna tersebut dengan koefisien warna masing masing.
Kemudian nilai tersebut ditotalkan. 4.
Mengganti nilai warna dari piksel yang sedang diproses dengan nilai warna yang didapat pada proses sebelumnya.
5. Proses kemudian diulangi ke piksel berikutnya sampai seluruh piksel pada
citra diproses. Koefisien warna untuk setiap nilai warna digunakan karena adanya perbedaan
cara mata manusia membedakan warna. Citra yang sudah menjadi abu-abu sudah boleh diproses menjadi citra hitam
putih dengan menggunakan algoritma Otsu. Langkah-langkah binerisasi citra
grayscale
menggunakan algoritma Otsu untuk mencari ambang batas adalah sebagai berikut Otsu, 1979.
1. Membuat histogram dari tingkat kemunculan semua tingkat keabuan pada
citra
grayscale
. 2.
Menghitung kemungkinan probabilitas kelas dan rata-rata
mean
kelas pada kemungkinan ambang batas
threshold
pada 0. 3.
Untuk setiap kemungkinan ambang batas yang mungkin ada sesuai histogram, piksel dipisahkan menjadi 2 bagian, mewakili piksel later
belakang dan piksel karakter. Kemudian dicarilah akar dari kuadrat perbedaan antara rata-rata dari kedua bagian tersebut.
4. Nilai dari ambang batas diperbaharui untuk setiap iterasi, dan nilainya
sesuai pada hasil langkah sebelumnya 5.
Nilai yang terbesar setelah iterasi berakhir adalah nilai ambang batas yang diinginkan
6. Setiap piksel kemudian diperbaharui pada citra
grayscale
dengan menggantinya menjadi putih jika lebih besar dari ambang batas, dan hitam
jika lebih kecil atau sama dengan ambang batas. Hasil dari binerisasi dengan algoritma Otsu dapat dilihat pada gambar 2.2.
Universitas Sumatera Utara
Gambar 2.2. Hasil binerisasi dengan algoritma Otsu. Gambar asli kiri dan hasil binerisasi kanan.
2.2.3.. Penapisan Derau