METODE SKELETON SEBAGAI METODE PENIPISAN DALAM CITRA TULISAN

  

METODE SKELETON SEBAGAI METODE PENIPISAN

DALAM CITRA TULISAN

1 2 Lailatul Husniah , Wahyu Andhyka K 1.

  Jaringan Cerdas dan Multimedia, Institut Teknologi Sepuluh Nopember, Surabaya 2. Fakultas Teknik, Jurusan Teknik Informatika, Universitas Muhammadiyah Malang

  

Kontak Person:

Lailatul Husniah

Keputih, Sukolilo

Surabaya, 60111

Telp: (62 31) 599 4251-54, Fax: (62 31) 593 1237, E-mail

Abstrak

  

OCR (Optical Character Recognation) adalah sebuah sistem komputer yang dapat membaca huruf,

baik yang berasal dari sebuah pencetak (printer atau mesin ketik) maupun yang berasal dari tulisan

tangan. OCR sebagai pengenal pola otomatis mencoba mengenali apakah citra masukan yang

diterima cocok dengan salah satu citra yang telah ditentukan. Ada banyak pendekatan yang dapat

dipakai untuk mengembangkan pembuatan pengenal pola otomatis antara lain memakai pendekatan

numerik, statistik, sintaktik, neural dan, aturan produksi (rule-based). Salah satu tahapan yang dapat

dilakukan dalam pengenalan karakter adalah menemukan struktur awal pembentuk karakter tersebut,

dengan demikian akan diketahui pola dari karakter tersebut.

Salah satu metode yang dapat digunakan dalam pembentukan karakter tersebut dengan skeletonizing.

Dalam metode tersebut citra tulisan akan direduksi dan ditipiskan sehingga bernilai hanya satu

piksel, hal tersebut berguna untuk mendapatkan citra asli terutama untuk citra yang berpotongan.

Dalam penelitian ini didapatkan bahwa metode tersebut dibandingkan dengan metode Parker dan

Dilatasi dapat meningkatkan hasil dengan waktu pemrosesan sekitar 0,0140449 milisecond, dalam

hal ini dapat dikatakan bahwa metode tersebut berhasil.

  Kata kunci: OCR, Skeletonizing, Thinning Method, Parker, Dilatasi

Pendahuluan

  OCR (Optical Character Recognation) adalah sebuah sistem komputer yang dapat membaca huruf, baik yang berasal dari sebuah pencetak (printer atau mesin ketik) maupun yang berasal dari tulisan tangan [1, 2, 3, 4]. Adanya sistem pengenal huruf ini akan meningkatkan fleksibilitas ataupun kemampuan dan kecerdasan sistem komputer. Dengan adanya sistem OCR maka pengguna dapat lebih leluasa memasukkan data karena pengguna tidak harus memakai papan ketik tetapi bisa menggunakan pena elektronik untuk menulis sebagaimana pengguna menulis dikertas [2]. Adanya OCR juga akan memudahkan penanganan pekerjaan yang memakai input tulisan.

  OCR dapat dipandang sebagai bagian dari pengenal otomatis yang lebih luas yakni pengenal pola otomatis (automatic pattern recognition). Dalam pengenal pola otomatis mencoba mengenali apakah citra masukan yang diterima cocok dengan salah satu citra yang telah ditentukan [1]. Sistem ini misalnya dipakai untuk mendeteksi sidik jari, tandatangan, bahkan wajah seseorang.

  Ada banyak pendekatan yang dapat dipakai untuk mengembangkan pembuatan pengenal pola otomatis antara lain memakai pendekatan numerik, statistik, sintaktik, neural dan, aturan produksi (rule-based) [1, 5, 6]. Secara umum metode-metode tersebut dapat digolongkan menjadi dua kelompok metode yakni metode berbasis statistik dan metode berbasis struktur. Dalam metode yang berbasis statistik, setiap pola ditransformasi kedalam vektor yang memakai ukuran dan karakteristik tertentu. Karakteristik ini seringkali lebih bersifat statistik misalnya distribusi pixel ataupun jarak pixel. Sedang dalam metode yang berbasis struktur, setiap pola yang diproses dinyatakan sebagai gabungan beberapa struktur elementer. Pengenalan selanjutnya dilakukan dengan mencocokkan komposisi struktur elementer dengan struktur yang sudah disimpan memakai aturan tertentu misalnya

  I - 108 SENTRA memakai pendekatan teori bahasa formal dan automata. Salah satu tahapan yang dapat dilakukan dalam pengenalan karakter adalah menemukan struktur awal pembentuk karakter tersebut, dengan demikian akan diketahui pola dari karakter tersebut.

Metode Penelitian

  Dalam metode pengenalan pola berbasis statistik, setiap pola ditransformasi ke dalam vektor yang memakai ukuran dan karakteristik tertentu. Karakteristik ini seringkali lebih bersifat statistik misalnya distribusi pixel ataupun jarak pixel. Sedang dalam metode yang berbasis struktur, setiap pola yang diproses dinyatakan sebagai gabungan beberapa struktur elementer. Pengenalan selanjutnya dilakukan dengan mencocokkan komposisi struktur elementer dengan struktur yang sudah disimpan memakai aturan tertentu misalnya memakai pendekatan teori bahasa formal dan automata. Berikut ini adalah tahapan didalam pengenalan sebuah pola [3]: 1.

  Data Capture, merupakan proses konversi suatu dokumen (hardcopy) menjadi suatu file gambar (BMP).

  2. Preprocessing, merupakan suatu proses untuk menghilangkan bagian-bagian yang tidak diperlukan pada gambar input untuk proses selanjutnya. Beberapa contoh preprocessing adalah

  noise filtering .

  3. Segmentation, adalah proses memisahkan area pengamatan (region) pada tiap karakter yang akan dideteksi.

  4. Normalization, adalah proses merubah dimensi region tiap karakter dan ketebalan karakter.

  Algoritma yang digunakan pada proses ini adalah algoritma scaling dan thinning.

  5. Feature Extraction, adalah proses untuk mengambil ciri-ciri tertentu dari karakter yang diamati.

  6. Recognition, merupakan proses untuk mengenali karakter yang diamati dengan cara membandingkan ciri-ciri karakter yang diperoleh dengan ciri-ciri karakter yang ada pada database

  7. Postprocessing, pada umumnya proses yang dilakukan pada tahap ini adalah proses koreksi ejaan sesuai dengan bahasa yang digunakan.

  Segmentasi dapat dilakukan dengan proses thresholding, yakni proses perubahan dari citra hasil keluaran proses pengambilan citra menjadi citra biner. Pada thresholding pada umumnya direpresentasikan menjadi dua warna, warna putih merepresentasikan objek (latar depan) dan warna hitam menyatakan latar belakang (background), namun pada beberapa penelitian juga dimungkinkan untuk melakukan multi level thresholding sehingga hasil dari proses tersebut tidak hanya berwarna hitam dan putih. Proses segmentasi dilakukan dengan melakukan proses adaptive thresholding pada citra kedalaman dengan batasan bahwa pada penelitian ini diasumsikan bahwa background bersih dan mendeteksi hanya satu object per-frame. Proses adaptive thresholding merupakan pengembangan dari metode thresholding yang telah ada. Proses adaptive thresholding akan ditangani oleh prosedur cvAdaptiveThreshold() yang merupakan pengembangan dari cvThreshold(), dalam prosedur tersebut memiliki dua pilihan metode untuk penerapan adaptive threshold yakni CV_ADAPTIVE_THRESH_MEAN_C dan CV_ADAPTIVE_THRESH_GAUSSIAN_C. Pada metode pertama semua piksel didalam area akan diberi bobot yang sama, sedangkan pada metode yang kedua piksel didalam area sekitar (x,y) akan diberi bobot berdasarkan fungsi Gaussian dari jarak terhadap titik pusat. Berikut adalah protipe segmentasi latar depan berdasarkan prosedur adaptive

  thresholding [7]:

  void cvAdaptiveThreshold( CvArr* src, CvArr* dst, double max_val, int adaptive_method = CV_ADAPTIVE_THRESH_MEAN_C, int threshold_type = CV_THRESH_BINARY, int block_size =3,

  ); Distance transform biasa digunakan sebagai operator dalam normalisasi dalam citra biner, hasil dari distance transform adalah level keabu-abuan dari citra yang sama dengan citra masukan, kecuali intensitas titik didalam bagian foreground dari level tersebut diubah untuk menunjukkan kedekatan dari setiap titik seperti terlihat pada Gambar 1. Ada beberapa jenis distance transform tergantung dari matrik yang digunakan antar piksel tersebut. Dalam penelitian yang dilakukan digunakan empat kernel matrik yang digunakan untuk membuat skeletonizing. Perbedaan dalam proses

  I - 109

  

skeletonizing yang dilakukan digunakan empat kernel yang digunakan untuk mem-filter hasil dari

  Distance Transform yang dilakukan. Hasil dari filter tersebut selanjutnya dilakukan perhitungan untuk mencari nilai maksimum dan minimum untuk mendapatkan nilai citra skeletonizing. Adapun kernel yang digunakan untuk mem-filter hasil distance transform terlihat pada Gambar 2

  Gambar 1. Perbedaan Matrik Biner dan Distance Transformation [7] Gambar 2. Kernel Skeletonizing [7]

  Lebih lengkap dari penelitian ini didapatkan rancangan metodologi yang akan digunakan untuk penelitian yang dilakukan. Tahapan penelitian seperti terlihat pada Gambar 3 dimulai dengan mengambil citra baik itu citra berwarna (RGB) maupun citra dengan derajat keabu-abuan (Gray Sclae Image), selanjutnya citra tersebut diubah kedalam bentuk distance transform dimana citra akan berubah menjadi citra skeleton awal, selanjutnya citra tersebut di lakukan penyaringan menggunakan kernel yang telah ditentukan, dari kernel tersebut akan disaring sesuai dengan nilai tertinggi dari kernel tersebut. Hasil dari penyaringan di kernel kemudian akan digabungkan menggunakan operator MAX. Hasil dari operator MAX tersebut adalah citra dengan nilai terbesar dari setiap hasil penyaringan ditiap proses dan citra tersebut yang selanjutnya akan menjadi citra skeleton

  Gambar 3. Rancangan Sistem

Hasil Penelitian dan Pembahasan Uji Distance Transform, Adaptive Distance Transform, Metode Parker

  Pengujian pada tahap berikut bertujuan untuk melihat hasil dari skeletonizing dari tiga metode yang digunakan sebagai pembanding. Seperti terlihat pada Gambar 4a adalah citra asli dari tulisan, Gambar 4b hasil dari skeletonizing metode Parker yang telah dimodifikasi oleh Jose Iguelmar, Gambar 4c hasil dari skeletonizing metode dilatasi, dan Gambar 4d merupakan hasil dari skeletonizing distance transform adaptive .

  Selanjutnya hasil dari perbandingan dari ketiga metode tersebut tercantum pada Tabel 1. perbandingan dilakukan dengan melihat hasil dari proses skeletonizing dari masing-masing metode

  I - 110 SENTRA

  I - 111

  7 T F F

  Gambar 4. Hasil Perbandingan Skeletonizing

  2 0,013736 3 0,013784 4 0,013833 5 0,013884 6 0,013936 7 0,013993 8 0,014047 a b c d

  Dalam Millisecond Metode Diajukan 1 0,013689

  Tabel 2 Waktu Perbandingan Metode Skeletonizing Frame

  Pengujian untuk metode skeletonizing juga dilakukan untuk waktu pemprosesan yang dibutuhkan untuk mengeluarkan hasil dari skeletonizing. Dari waktu yang diperoleh metode dilatasi lebih unggul dengan rata-rata waktu yang dibutuhkan untuk memproses frame sebesar 0,0095403 detik, kemudian waktu yang dibutuhkan untuk metode yang diajukan sebesar 0,0140449. Hasil dari perbandingan waktu dalam millisecond yang didapatkan seperti tertera pada Tabel 2 menunjukkan bahwa metode yang diajukan dapat digunakan untuk pemrosesan waktu nyata. Hal tersebut didukung juga dengan hasil yang diperoleh pada Tabel 1.

  8 T F F Dari hasi perbandingan dari Tabel 1 terlihat bahwa metode yang diusulkan dapat menangani dengan baik

  6 T F F

  yang dibandingkan. Hasil dari proses tersebut dibandingkan dengan data ground truth yang telah dibuat untuk membandingkan hasilnya.

  5 T F F

  4 T F F

  3 T F F

  2 T F F

  1 T F F

  Tabel 1. Hasil Perbandingan Skeletonizing Frame Adaptive Distance Transform Parker Dilatasi

Uji Kecepatan Adaptive Distance Transform

Kesimpulan

  OCR sebagai pengenal pola otomatis mencoba mengenali apakah citra masukan yang diterima cocok dengan salah satu citra yang telah ditentukan. Salah satu tahapan yang dapat dilakukan dalam pengenalan karakter adalah menemukan struktur awal pembentuk karakter tersebut, dengan demikian akan diketahui pola dari karakter tersebut.

  Salah satu metode yang dapat digunakan dalam pembentukan karakter tersebut salah satunya dengan metode penipisan atau skeletonizing. Dalam metode tersebut citra tulisan akan direduksi dan ditipiskan sehingga bernilai hanya satu piksel, hal tersebut berguna untuk mendapatkan citra asli terutama untuk citra yang berpotongan. Dalam penelitian ini didapatkan bahwa metode tersebut dibandingkan dengan metode penipisan lainnya dapat meningkatkan hasil dengan waktu pemrosesan sekitar 0,0140449 milisecond, dalam hal ini dapat dikatakan bahwa metode tersebut berhasil.

Referensi

  [1] Abbyy Mobile OCR Engine. http://www.abbyy.com/mobileocr/. [2] Arief, Edwi Sosiawan, SIP, M.Si, Perkembangan Teknologi Komunikasi. [3]

  Chen, Datong, Jean, Herve, Text Detection and Recognition in Images and Video Frames. 2003 [4] GOCR - A Free OpticalCharacter Recognition Program.http://jocr.sourceforge.net/. [5]

  Hymes, Lewin, OCR for Mobile Phones, 2008 [6]

  Jakl, Andreas, Mobile Cumputing, FH Hagenberg, 2009 [7] Bradski, G., & Kaehler, A, (2008), Learning OpenCV, ed. M. Loukides, O’REILLY, New York.

  I - 112 SENTRA