191
diset dengan nilai-nilai ganjil dalam rentang 3 sampai 21. Dari teks hasil proses tersebut akan dihitung Word Accuracy Wacc dan Character Accuracy Cacc.
5. Selanjutnya data uji diproses menggunakan OCR dengan pre-processing binarisasi Otsu. Hasil dari proses tersebut akan dibandingkan dengan proses yang
menggunakan Mixed Binarization dan proses tanpa binarisasi. Parameter pengukur yang digunakan meliputi Word Accuracy Wacc, Character Accuracy
Cacc dan waktu proses pengenalan.
4.1 Hasil Observasi Parameter Erosi dan Dilasi
Tabel berikut menunjukkan hasil observasi terhadap nilai-nilai erosi dan dilasi yang diujikan. Parameter pengukur yang dilihat ada 3, yaitu Wacc, Cacc, dan waktu proses.
Tabel 1. Hasil observasi parameter erosi dan dilasi
Parameter OCR Result
Times
Erosi dan Dilasi 1
75.16 92.84
156.67
2 76.68
94.96 152.31
3 63.17
82.34 151.15
4 38.85
71.76 160.57
5 37.45
61.00 153.94
6 19.30
51.01 157.74
7 15.28
38.59 161.39
8 11.79
36.02 154.45
9 9.09
32.49 160.87
10 8.67
22.16 150.72
Berdasarkan tabel di atas, terlihat bahwa parameter erosi dan dilasi berpengaruh terhadap tingkat akurasi teks yang dikenali oleh sistem. Besarnya nilai erosi dan dilasi
yang digunakan akan mempengaruhi struktur stroke pada citra. Semakin besar nilai erosi dan dilasi, maka stroke pada citra akan semakin tipis, demikian pula sebaliknya. Nilai erosi
dan dilasi yang terlalu kecil atau besar dapat membuat ukuran stroke yang sulit untuk diproses. Dari percobaan ini, diperoleh nilai erosi dan dilasi yang optimal, yaitu 2.
4.2 Hasil Observasi Nilai Parameter K-Factor
Tabel berikut menunjukkan hasil observasi terhadap nilai-nilai k-factor yang diujikan. Parameter pengukur yang dilihat ada 3, yaitu Wacc, Cacc, dan waktu proses.
Tabel 2. Hasil observasi nilai parameter k-factor
Parameter OCR Result
Times
K Factor 0.1
5.41 47.98
155.18
0.2 77.56
89.57 151.46
0.3 0.00
10.67 159.64
0.4 0.00
12.39 157.16
0.5 2.60
12.00 150.24
0.6 0.50
15.32 160.97
0.7 0.00
9.23 150.38
0.8 1.30
13.88 151.18
0.9 0.00
7.85 156.15
Besarnya nilai k-factor yang digunakan berpengaruh terhadap nilai threshold pada setiap pixel. Jika nilai k = 0, maka nilai threshold sama dengan mean rata-rata. Semakin
besar nilai k maka semakin besar pula nilai threshold-nya. Nilai threshold yang tinggi cenderung menghasilkan nilai 1 atau mendekati warna putih. Hal tersebut menyebabkan
kualitas citra yang kurang baik. Sebaliknya nilai threshold yang semakin kecil akan
192
menghasilkan warna yang mendekati hitam. Berdasarkan percobaan, nilai k-factor yang optimal untuk digunakan pada penelitian ini adalah 0.2.
4.3 Hasil Observasi Nilai Parameter Window Size