72
BAB V HASIL DAN PEMBAHASAN
5.1. Data Masukan
Data masukan untuk pengujian diambil dari buku sastra jawa “Menak Sorangan I” dan “Panji Sekar”, pada halaman 3, dan 4. Alasan dipilihnya buku-buku
tersebut karena ketebalan buku relatif tipis sehingga memudahkan untuk proses mengambilan data dengan scanner. Alasan lain adalah buku tersebut walaupun relatif
kuno, yaitu cetakan pada tahun 1933 dan 1936, tetapi relatif masih baik kualitas kertasnya. Karakteristik data masukan selengkapnya dapat dilihat dalam tabel 5.1,
dan contoh gambar dari citra dokumen masukan dapat dilihat pada gambar 5.1.
Tabel 5.1. Karakteristik File Masukan
No Nama Dokumen
Ukuran Citra baris dan kolom Besar File byte
1 Menak Sorangan hal. 3
2208 vs 1502 493056
2 Menak Sorangan hal. 4
2312 vs 1520 3514240
3 Panji Sekar hal. 3
2323 vs 1496 3475208
4 Panji Sekar hal. 4
2307 vs 1505 3472035
5.2. Eksekusi Modul-Modul
Setelah data masukan diperoleh maka selanjutnya dilakukan berbagai proses pengolahan tingkat piksel atau biasa disebut preprocessing, dengan tujuan untuk
mendapatkan citra-citra karakter yang menyusun citra dokumen. Tahap pengolahan tingkat piksel yang pertama adalah proses binarisasi. Dari
hasil eksekusi untuk data ke 1 diperoleh nilai ambang sebesar 143. Artinya semua PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
73
piksel dengan intensitas warna kurang dari atau sama dengan 143 diganti dengan nilai 0 dan sebaliknya diganti dengan nilai 1 lihat gambar 5.2.
Gambar 5.3. menampilkan hasil proses normalisasi orientasi untuk data ke 1. Dalam proses ini diperoleh besar sudut kemiringan
θ sebesar 0.537815, sehingga citra hasil proses binarisasi harus dirotasi dulu sebesar 0.537815.
Gambar 5.1.
Contoh Citra Dokumen Menak Sorangan halaman 3 data ke 1 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
74
Gambar 5.2. Contoh Tampilan Citra Hasil Proses Binarisasi
75
Gambar 5.3. Contoh Tampilan Citra Hasil Normalisasi Orientasi
76
Gambar 5.4 menggambarkan cuplikan hasil eksekusi proses thinning. Pada gambar 5.4 terlihat bahwa hasil thinning menunjukkan tingkat pembuatan kerangka
huruf yang bisa dikatakan baik.
Gambar 5.4. Contoh Tampilan Hasil Proses Thinning
Proses segmentasi dimulai dengan membuat histogram baris dengan tujuan untuk mendapatkan batas-batas indek pemotongan baris-baris teks. Gambar 5.5.
menggambarkan contoh histogram dengan batas indek untuk pemotongan pada suatu cuplikan citra dokumen.
Gambar 5.5. Cuplikan histogram hasil proses profil proyeksi vertikal
Batas-batas indeks baris
77
Setelah setiap baris teks dapat dipisahkan, proses segmentasi dilanjutkan dengan membuat histogram kolom untuk setiap baris teks. Terlihat dalam contoh
gambar 5.6. bahwa hasil histogram menunjukkan kemudahan untuk proses pemisahan karakter, yaitu dengan mengambil titik-titik dalam histogram yang tidak
bernilai 0, sementara nilai 0 dipergunakan untuk nilai pemisah antar karakter.
Gambar 5.6. Cuplikan histogram hasil proses profil proyeksi horisontal
Setelah proses profil proyeksi horisontal selesai, maka proses selanjutnya mempergunakan hasil proses tersebut untuk memperoleh citra setiap karakter dari
citra dokumennya. Gambar 5.7 memperlihatkan sebagian citra karakter yang dihasilkan proses segmentasi.
Gambar 5.7. Contoh citra karakter hasil akhir proses segmentasi
Batas indeks karakter PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
78
Setelah citra setiap karakter dalam citra dokumen diperoleh, maka kemudian dapat dilakukan baik proses pembuatan basis data karakter Jawa maupun proses
pengenalan karakter. Tabel 5.2 di bawah ini merupakan hasil akhir proses pengenalan karakter untuk data ke 1 dari karakter-karakter yang dihasilkan oleh
proses segmentasi. Dalam tabel tersebut diperlihatkan deretan nama latin yang menjadi nama dari setiap karakter yang ditemukan.
Tabel 5.2. Hasil Proses Pengenalan Karakter Dokumen Menak Sorangan I halaman 3
1 : adeg2 adeg2 pra ju ri t ka la taling ka tarung dra t ca ma pu h ka
li ya na pra ju ri t ku par ma n PadaLingsa PadaMadya Dur ma PadaMadya ra ja sa la sa la ha nga ta ga1 ga2 pra
ju ri t ti ra PadaLingsa ra tu ing Ta m bang ti mi s si ra ra ja ya l ya l mang sa h ni ti h
taling mang tarung pe tha k mang la ga si ke taling p pe bin di PadaLingsa prap ta pa yu dan
su sum bar ngu su h tan ding PadaLungsi PadaMadya me taling ta tarung n na na pa taling ya pra ju ri t
ku par mban sa par sa ha nge ma sa si PadaLingsa hi ki PadaLingsa sa sa g gen na PadaLingsa han de
la ing Ka la taling ka PadaLingsa dra t pa yu tan be ta h mi yar si PadaLingsa ya mit ma nem bah PadaLingsa sang
ra ja ja Ba la sa hir PadaLungsi PadaMadya wu sa i ngi taling da na ing gus ti Ta sang su l nga la m mang sah
pa ha na taling ha s thi PadaLingsa pa si ke p pan ga da PadaLingsa pra p ta ha yu na ha yun na n sa
sa : ha ran mu pra juri t kang me tu ing pra PadaLingsa sun raja ja Ba lasa hir
PadaLungsi PadaMadya ing mi Na ba n ku tha ning su n kang mi taling nang tarung ka PadaLingsa
han de la ing Bu ru da ngi n ba li ka sira sa sa PadaLingsa pra ju rit Ka la taling ka tarung dra t
ing su n ra tu Tam bang hi mi s sun ra ja ma l ya la1 la2 taling ha h pa taling ya ja Ba
79
la1 tarung sa hir PadaLungsi PadaMadya ha ku dhung nga sa ri sa sa n mu taling ba tarung n ba ba ma tarung
taling dan yit na ing sun bin di PadaLingsa sang ra ja mi Na ha n ku dhung pa ri taling sa sa sa ja PadaLingsa ra ja
ya1 da l yal mu ter bin di PadaLingsa su rak gu me rah PadaLingsa tu me ma1 ma2 puh pu nang bin di
PadaLungsi PadaMadya kad ya ge la1 ma2 p tu me ma puh ingpa ri s waja PadaLingsa has ta ni ra ta taling na ha
tarung si k sa ra taling jang mi Na adeg2 adeg2 te te dha k a na sa king bu ku se ra t tan ta nga na
ing kang taling mi ma pe taling n wa n te na ing L ma2 i d tarung : h ma2
sa ma2PadaLingsa v na : tarung PadaLingsa t na i tarung h PadaLingsa b i o t h na tarung k PadaLungsi
Nama-nama latin yang muncul dalam proses pengenalan karakter sebelumnya telah terdapat dalam database karakter Jawa yang dibangun oleh sistem pembuat
basis data. Jika sistem menemukan karakter baru yaitu karakter yang belum terdapat dalam basis data karakter Jawa, maka sistem akan menyimpan karakter baru tersebut
untuk kemudian diproses oleh developer. Selain nama latin, dalam basis data karakter Jawa juga disimpan ciri dari
setiap karakter dan matriks citra dari setiap karakternya. Tabel 5.3. memperlihatkan contoh sebagian karakter yang disimpan dalam database karakter Jawa.
Tabel 5.3. Contoh sebagian karakter dalam database karakter Jawa No.Urut
Nama Latin
Matriks Ciri Gambar Karakter
1 1
21 23 24 16 8 8
13 5 7
2 :
4 6 4 5 0 0
8 6 0 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
80
No.Urut Nama
Latin Matriks Ciri
Gambar Karakter
3
4 13 14 19 4 12
15 15 0
4 pra
36 23 40 27 23 28
32 24 35
5 ju
52 52 41 0 0 50
0 24 24
6 ri
5 22 16 19 30 26
0 19 17
7 t ka
48 51 25 34 27 18
31 30 40
8 la
17 14 17 19 8 14
9 15 16
9 taling
22 23 23 2 1 19
0 9 7
10 tarung
11 5 5 2 7 3
7 7 5
11 dra
40 49 34 24 5 27
29 24 35
12 t ca
61 56 27 20 34 10
26 27 48
13 ma
17 14 19 12 16 14
11 16 13
14 pu
16 20 49 0 0 51
0 24 26
15 h
12 13 16 10 11 0
4 14 0 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
81
No.Urut Nama
Latin Matriks Ciri
Gambar Karakter
16 ka
18 19 30 25 11 17
7 6 8
17 li
0 23 22 15 25 22
29 26 39
18 ya
18 18 18 15 17 18
23 18 16
19 na
20 9 22 21 19 9
4 0 7
20 pra
30 26 48 24 0 26
24 24 32
21 ju
61 58 35 0 7 47
0 30 18
22 ri
9 20 18 24 36 22
0 12 18
23 t ku
62 56 30 50 56 54
0 17 36
24 par
0 9 18 17 0 18
34 24 14
25 ma
19 15 21 15 12 18
10 18 10
26 n
67 40 39 8 2 36
19 27 26
27 .
6 3 0 0 7 3
0 0 6 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
82
Seperti telah diuraikan dalam bab sebelumnya, proses di dalam sistem pembuat basis data mempergunakan modul-modul yang terdapat dalam sistem
pengenalan karakter. Modul utama yang dipergunakan adalah modul untuk ekstraksi ciri dan pencarian karakter. Dan masukan dalam sistem ini adalah ciri dari karakter
beserta karakter itu sendiri. Maka rekod-rekod penyusun database karakter Jawa sangat tergantung pada proses pengenalan karakter.
Pada tabel 5.2 terlihat bahwa proses pengenalan karakter akan menghasilkan nama-nama latin untuk setiap citra karakter dalam citra dokumen. Nama yang
diberikan adalah benar-benar nama latin yang sesuai dengan kaidah karakter Jawa, dan belum diproses sesuai aturan pembacaan karakter Jawa. Sebagai contoh deretan
citra karakter yang sesuai dengan akan dikenali dengan nama
taling ka tarung. Sistem pengenalan citra dokumen yang dibangun dalam penelitian
ini mencoba untuk membuat proses pembentukan kata, walaupun masih sebatas
menghilangkan tanda-tanda baca seperti taling dan tarung. Sebagai contoh apabila ditemukan string taling ka tarung, maka string itu akan diubah menjadi ko. Tabel
5.4 di bawah ini memperlihatkan hasil dari proses pembentukan kata dari nama-nama latin yang terdapat dalam tabel 5.2 di atas.
Tabel 5.4. Hasil Proses Pembentukan Kata
1 : pra ju ri t ka la ka dra t ca ma pu h ka li ya na pra ju ri t ku par ma n ,
Dur ma ra ja sa la sa la ha nga ta ga pra ju ri t ti ra , ra tu ing Ta m bang ti mi s si ra ra ja ya l ya l mang sa h ni ti h mong
pe tha k mang la ga si ke taling p pe bin di ,prap ta pa yu dan su sum bar
83
ngu su h tan ding . me to n na na pa ye pra ju ri t ku par mban sa par sa ha nge ma
sa si , hi ki , sa sa g gen na , han de la ing Ka la ke , dra t pa yu
tan be ta h mi yar si , ya mit ma nem bah , sang ra ja ja Ba la sa hir .
wu sa i ngi de na ing gus ti Ta sang su l nga la m mang sah pa ha na e s thi ,
pa si ke p pan ga da , pra p ta ha yu na ha yun na n sa sa : ha ran mu pra
juri t kang me tu ing pra , sun raja ja Ba lasa hir . ing mi Na ba n ku tha ning su n kang mi nong ka , han de la ing Bu ru da
ngi n ba li ka sira sa sa , pra ju rit Ka la ko dra t ing su n ra tu Tam bang
hi mi s sun ra ja ma l ya la1 la2 e h pa ye ja Ba la1 tarung sa hir
. ha ku dhung nga sa ri sa sa n mu bon ba ba ma tarung de n yit na ing
sun bin di , sang ra ja mi Na ha n ku dhung pa ri se sa sa ja ,ra ja ya1 da l yal mu
ter bin di , su rak gu me rah , tu me ma1 ma2 puh pu nang bin di . kad ya ge
la1 ma2 p tu me ma puh ing pa ri s wa ja , has ta ni ra ta n o si k sa ra jeng mi
Na te te dha k a na sa king bu ku se ra t tan ta nga na ing kang
taling mi ma pe taling n wa n te na ing L ma2 i d tarung : h ma2 sa ma2. v na : tarung . t na i tarung h . b i o t h na tarung k .
5.3. Analisis Output Pengenalan Karakter