Data Masukan Eksekusi Modul-Modul

72

BAB V HASIL DAN PEMBAHASAN

5.1. Data Masukan

Data masukan untuk pengujian diambil dari buku sastra jawa “Menak Sorangan I” dan “Panji Sekar”, pada halaman 3, dan 4. Alasan dipilihnya buku-buku tersebut karena ketebalan buku relatif tipis sehingga memudahkan untuk proses mengambilan data dengan scanner. Alasan lain adalah buku tersebut walaupun relatif kuno, yaitu cetakan pada tahun 1933 dan 1936, tetapi relatif masih baik kualitas kertasnya. Karakteristik data masukan selengkapnya dapat dilihat dalam tabel 5.1, dan contoh gambar dari citra dokumen masukan dapat dilihat pada gambar 5.1. Tabel 5.1. Karakteristik File Masukan No Nama Dokumen Ukuran Citra baris dan kolom Besar File byte 1 Menak Sorangan hal. 3 2208 vs 1502 493056 2 Menak Sorangan hal. 4 2312 vs 1520 3514240 3 Panji Sekar hal. 3 2323 vs 1496 3475208 4 Panji Sekar hal. 4 2307 vs 1505 3472035

5.2. Eksekusi Modul-Modul

Setelah data masukan diperoleh maka selanjutnya dilakukan berbagai proses pengolahan tingkat piksel atau biasa disebut preprocessing, dengan tujuan untuk mendapatkan citra-citra karakter yang menyusun citra dokumen. Tahap pengolahan tingkat piksel yang pertama adalah proses binarisasi. Dari hasil eksekusi untuk data ke 1 diperoleh nilai ambang sebesar 143. Artinya semua PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 73 piksel dengan intensitas warna kurang dari atau sama dengan 143 diganti dengan nilai 0 dan sebaliknya diganti dengan nilai 1 lihat gambar 5.2. Gambar 5.3. menampilkan hasil proses normalisasi orientasi untuk data ke 1. Dalam proses ini diperoleh besar sudut kemiringan θ sebesar 0.537815, sehingga citra hasil proses binarisasi harus dirotasi dulu sebesar 0.537815. Gambar 5.1. Contoh Citra Dokumen Menak Sorangan halaman 3 data ke 1 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 74 Gambar 5.2. Contoh Tampilan Citra Hasil Proses Binarisasi 75 Gambar 5.3. Contoh Tampilan Citra Hasil Normalisasi Orientasi 76 Gambar 5.4 menggambarkan cuplikan hasil eksekusi proses thinning. Pada gambar 5.4 terlihat bahwa hasil thinning menunjukkan tingkat pembuatan kerangka huruf yang bisa dikatakan baik. Gambar 5.4. Contoh Tampilan Hasil Proses Thinning Proses segmentasi dimulai dengan membuat histogram baris dengan tujuan untuk mendapatkan batas-batas indek pemotongan baris-baris teks. Gambar 5.5. menggambarkan contoh histogram dengan batas indek untuk pemotongan pada suatu cuplikan citra dokumen. Gambar 5.5. Cuplikan histogram hasil proses profil proyeksi vertikal Batas-batas indeks baris 77 Setelah setiap baris teks dapat dipisahkan, proses segmentasi dilanjutkan dengan membuat histogram kolom untuk setiap baris teks. Terlihat dalam contoh gambar 5.6. bahwa hasil histogram menunjukkan kemudahan untuk proses pemisahan karakter, yaitu dengan mengambil titik-titik dalam histogram yang tidak bernilai 0, sementara nilai 0 dipergunakan untuk nilai pemisah antar karakter. Gambar 5.6. Cuplikan histogram hasil proses profil proyeksi horisontal Setelah proses profil proyeksi horisontal selesai, maka proses selanjutnya mempergunakan hasil proses tersebut untuk memperoleh citra setiap karakter dari citra dokumennya. Gambar 5.7 memperlihatkan sebagian citra karakter yang dihasilkan proses segmentasi. Gambar 5.7. Contoh citra karakter hasil akhir proses segmentasi Batas indeks karakter PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 78 Setelah citra setiap karakter dalam citra dokumen diperoleh, maka kemudian dapat dilakukan baik proses pembuatan basis data karakter Jawa maupun proses pengenalan karakter. Tabel 5.2 di bawah ini merupakan hasil akhir proses pengenalan karakter untuk data ke 1 dari karakter-karakter yang dihasilkan oleh proses segmentasi. Dalam tabel tersebut diperlihatkan deretan nama latin yang menjadi nama dari setiap karakter yang ditemukan. Tabel 5.2. Hasil Proses Pengenalan Karakter Dokumen Menak Sorangan I halaman 3 1 : adeg2 adeg2 pra ju ri t ka la taling ka tarung dra t ca ma pu h ka li ya na pra ju ri t ku par ma n PadaLingsa PadaMadya Dur ma PadaMadya ra ja sa la sa la ha nga ta ga1 ga2 pra ju ri t ti ra PadaLingsa ra tu ing Ta m bang ti mi s si ra ra ja ya l ya l mang sa h ni ti h taling mang tarung pe tha k mang la ga si ke taling p pe bin di PadaLingsa prap ta pa yu dan su sum bar ngu su h tan ding PadaLungsi PadaMadya me taling ta tarung n na na pa taling ya pra ju ri t ku par mban sa par sa ha nge ma sa si PadaLingsa hi ki PadaLingsa sa sa g gen na PadaLingsa han de la ing Ka la taling ka PadaLingsa dra t pa yu tan be ta h mi yar si PadaLingsa ya mit ma nem bah PadaLingsa sang ra ja ja Ba la sa hir PadaLungsi PadaMadya wu sa i ngi taling da na ing gus ti Ta sang su l nga la m mang sah pa ha na taling ha s thi PadaLingsa pa si ke p pan ga da PadaLingsa pra p ta ha yu na ha yun na n sa sa : ha ran mu pra juri t kang me tu ing pra PadaLingsa sun raja ja Ba lasa hir PadaLungsi PadaMadya ing mi Na ba n ku tha ning su n kang mi taling nang tarung ka PadaLingsa han de la ing Bu ru da ngi n ba li ka sira sa sa PadaLingsa pra ju rit Ka la taling ka tarung dra t ing su n ra tu Tam bang hi mi s sun ra ja ma l ya la1 la2 taling ha h pa taling ya ja Ba 79 la1 tarung sa hir PadaLungsi PadaMadya ha ku dhung nga sa ri sa sa n mu taling ba tarung n ba ba ma tarung taling dan yit na ing sun bin di PadaLingsa sang ra ja mi Na ha n ku dhung pa ri taling sa sa sa ja PadaLingsa ra ja ya1 da l yal mu ter bin di PadaLingsa su rak gu me rah PadaLingsa tu me ma1 ma2 puh pu nang bin di PadaLungsi PadaMadya kad ya ge la1 ma2 p tu me ma puh ingpa ri s waja PadaLingsa has ta ni ra ta taling na ha tarung si k sa ra taling jang mi Na adeg2 adeg2 te te dha k a na sa king bu ku se ra t tan ta nga na ing kang taling mi ma pe taling n wa n te na ing L ma2 i d tarung : h ma2 sa ma2PadaLingsa v na : tarung PadaLingsa t na i tarung h PadaLingsa b i o t h na tarung k PadaLungsi Nama-nama latin yang muncul dalam proses pengenalan karakter sebelumnya telah terdapat dalam database karakter Jawa yang dibangun oleh sistem pembuat basis data. Jika sistem menemukan karakter baru yaitu karakter yang belum terdapat dalam basis data karakter Jawa, maka sistem akan menyimpan karakter baru tersebut untuk kemudian diproses oleh developer. Selain nama latin, dalam basis data karakter Jawa juga disimpan ciri dari setiap karakter dan matriks citra dari setiap karakternya. Tabel 5.3. memperlihatkan contoh sebagian karakter yang disimpan dalam database karakter Jawa. Tabel 5.3. Contoh sebagian karakter dalam database karakter Jawa No.Urut Nama Latin Matriks Ciri Gambar Karakter 1 1 21 23 24 16 8 8 13 5 7 2 : 4 6 4 5 0 0 8 6 0 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 80 No.Urut Nama Latin Matriks Ciri Gambar Karakter 3 4 13 14 19 4 12 15 15 0 4 pra 36 23 40 27 23 28 32 24 35 5 ju 52 52 41 0 0 50 0 24 24 6 ri 5 22 16 19 30 26 0 19 17 7 t ka 48 51 25 34 27 18 31 30 40 8 la 17 14 17 19 8 14 9 15 16 9 taling 22 23 23 2 1 19 0 9 7 10 tarung 11 5 5 2 7 3 7 7 5 11 dra 40 49 34 24 5 27 29 24 35 12 t ca 61 56 27 20 34 10 26 27 48 13 ma 17 14 19 12 16 14 11 16 13 14 pu 16 20 49 0 0 51 0 24 26 15 h 12 13 16 10 11 0 4 14 0 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 81 No.Urut Nama Latin Matriks Ciri Gambar Karakter 16 ka 18 19 30 25 11 17 7 6 8 17 li 0 23 22 15 25 22 29 26 39 18 ya 18 18 18 15 17 18 23 18 16 19 na 20 9 22 21 19 9 4 0 7 20 pra 30 26 48 24 0 26 24 24 32 21 ju 61 58 35 0 7 47 0 30 18 22 ri 9 20 18 24 36 22 0 12 18 23 t ku 62 56 30 50 56 54 0 17 36 24 par 0 9 18 17 0 18 34 24 14 25 ma 19 15 21 15 12 18 10 18 10 26 n 67 40 39 8 2 36 19 27 26 27 . 6 3 0 0 7 3 0 0 6 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 82 Seperti telah diuraikan dalam bab sebelumnya, proses di dalam sistem pembuat basis data mempergunakan modul-modul yang terdapat dalam sistem pengenalan karakter. Modul utama yang dipergunakan adalah modul untuk ekstraksi ciri dan pencarian karakter. Dan masukan dalam sistem ini adalah ciri dari karakter beserta karakter itu sendiri. Maka rekod-rekod penyusun database karakter Jawa sangat tergantung pada proses pengenalan karakter. Pada tabel 5.2 terlihat bahwa proses pengenalan karakter akan menghasilkan nama-nama latin untuk setiap citra karakter dalam citra dokumen. Nama yang diberikan adalah benar-benar nama latin yang sesuai dengan kaidah karakter Jawa, dan belum diproses sesuai aturan pembacaan karakter Jawa. Sebagai contoh deretan citra karakter yang sesuai dengan akan dikenali dengan nama taling ka tarung. Sistem pengenalan citra dokumen yang dibangun dalam penelitian ini mencoba untuk membuat proses pembentukan kata, walaupun masih sebatas menghilangkan tanda-tanda baca seperti taling dan tarung. Sebagai contoh apabila ditemukan string taling ka tarung, maka string itu akan diubah menjadi ko. Tabel 5.4 di bawah ini memperlihatkan hasil dari proses pembentukan kata dari nama-nama latin yang terdapat dalam tabel 5.2 di atas. Tabel 5.4. Hasil Proses Pembentukan Kata 1 : pra ju ri t ka la ka dra t ca ma pu h ka li ya na pra ju ri t ku par ma n , Dur ma ra ja sa la sa la ha nga ta ga pra ju ri t ti ra , ra tu ing Ta m bang ti mi s si ra ra ja ya l ya l mang sa h ni ti h mong pe tha k mang la ga si ke taling p pe bin di ,prap ta pa yu dan su sum bar 83 ngu su h tan ding . me to n na na pa ye pra ju ri t ku par mban sa par sa ha nge ma sa si , hi ki , sa sa g gen na , han de la ing Ka la ke , dra t pa yu tan be ta h mi yar si , ya mit ma nem bah , sang ra ja ja Ba la sa hir . wu sa i ngi de na ing gus ti Ta sang su l nga la m mang sah pa ha na e s thi , pa si ke p pan ga da , pra p ta ha yu na ha yun na n sa sa : ha ran mu pra juri t kang me tu ing pra , sun raja ja Ba lasa hir . ing mi Na ba n ku tha ning su n kang mi nong ka , han de la ing Bu ru da ngi n ba li ka sira sa sa , pra ju rit Ka la ko dra t ing su n ra tu Tam bang hi mi s sun ra ja ma l ya la1 la2 e h pa ye ja Ba la1 tarung sa hir . ha ku dhung nga sa ri sa sa n mu bon ba ba ma tarung de n yit na ing sun bin di , sang ra ja mi Na ha n ku dhung pa ri se sa sa ja ,ra ja ya1 da l yal mu ter bin di , su rak gu me rah , tu me ma1 ma2 puh pu nang bin di . kad ya ge la1 ma2 p tu me ma puh ing pa ri s wa ja , has ta ni ra ta n o si k sa ra jeng mi Na te te dha k a na sa king bu ku se ra t tan ta nga na ing kang taling mi ma pe taling n wa n te na ing L ma2 i d tarung : h ma2 sa ma2. v na : tarung . t na i tarung h . b i o t h na tarung k .

5.3. Analisis Output Pengenalan Karakter