Diagram Aliran Data Sistem Pengenalan Citra Dokumen SPCD

38 database, maka proses juga akan menampilkan nama latin dari karakter Jawa tersebut kepada Developer. Apabila data citra karakter dengan ciri tertentu belum ada dalam database, maka proses Tambah Data akan memasukkan data citra karakter Jawa tersebut ke dalam basis data Pustaka Karakter Jawa.

3.2.2.2 Diagram Aliran Data Sistem Pengenalan Citra Dokumen SPCD

Diagram aliran data dari SPCD terdiri dari beberapa level, yaitu dimulai dari level 0 seperti terlihat dalam gambar 3.6., sampai level 2. Entitas luar yaitu user memberikan masukan kepada sistem berupa citra dokumen yang akan dikonversi. Selain itu sistem juga akan mengambil informasi dari basis data Pustaka Karakter Jawa, di mana basis data tersebut dihasilkan oleh Sistem Pembuat Basis Data. Sistem kemudian akan memproses citra dokumen yang diperoleh dari user untuk menghasilkan keluaran berupa teks dokumen dari citra dokumen yang bersangkutan, dan kemudian memberikan hasil tersebut kepada user. User Sistem Pengenalan Citra Dokumen SPCD citra dokumen teks dokumen File Pustaka Karakter Jawa ciri karakter Jawa, Nama Latin Developer cit ra ka ra kte r Gambar 3.6 DAD Level 0 Sistem Pengenalan Citra Dokumen Informasi lebih rinci dari proses SPCD diperlihatkan dalam DAD level 1 SPCD seperti terlihat dalam gambar 3.7. Terdapat tujuh buah proses dalam sistem 39 SPCD ini. Sedangkan masukan untuk sistem diperoleh dari user maupun dari Sistem Pembuat Basis Data. User citra bin er 3 Filling 4 Thinning 5 Segmen 6 Pengenalan Karakter 7 Pembentukan Kata File citra biner citra terotasi citra tero tas i File citra filling citra filling citra filling File citra kerangka dokumen citra kerangka dokumen citra keran gka d okum en File citra-citra karakter citra-citra karakter citra -citr a ka rakt er 8 Tampil Data File Pustaka Karakter Jawa ciri karakter jawa, nama latin File Nama-nama latin nama -nam a latin nama-nama latin File Teks deretan k ata dere tan k ata CI tr a Do ku m en citra biner 2 Normalisasi Orientasi 1 Binarisasi File citra terotasi tasi citra-citra baris File citra-citra baris ciri karakter jawa, nama latin, citra karakter Developer Te k s Dok u m e n citra k arakte r baru Gambar 3.7 DAD Level 1 Sistem Pengenalan Citra Dokumen 40 Setelah user memberikan masukan berupa citra dokumen, kemudian sistem akan melakukan proses binarisasi. Proses binarisasi ini berfungsi untuk memisahkan citra utama dengan citra latar belakang. Sebagai hasil dari proses ini akan diperoleh data citra biner yang mempunyai nilai 1 jika piksel dari citra adalah bagian dari latar belakang, atau 0 jika piksel dari citra adalah bagian dari citra utama. Proses selanjutnya adalah proses normalisasi orientasi. Proses normalisasi orientasi bertujuan untuk mengetahui seberapa besar sudut penyimpangan proses scanning, dan kemudian apabila ditemukan sudut dengan besar tertentu, maka citra masukan kemudian dirotasi sebesar sudut penyimpangannya. Setelah dihasilkan citra biner yang normal, maka data citra biner normal akan disimpan dan diproses ke tahap berikutnya, yaitu proses Filtering. Dalam proses filtering citra tadi akan dikurangi sebanyak mungkin noisenya. Hasil dari proses filtering adalah berupa citra biner yang relatif sudah bebas dari noise, seperti tidak ada lagi piksel yang terasing, atau adanya lubang di dalam kerumunan piksel. Tahap selanjutnya adalah proses thinning, yaitu proses yang berfungsi untuk menghasilkan kerangka dari setiap bentuk citra karakter Jawa. Sebagai hasil dari proses ini akan diperoleh citra dokumen yang setiap karakter dalam dokumen tersebut sudah berupa kerangka pokoknya saja. Hasil dari proses thinning ini kemudian akan diolah lagi dalam proses segmentasi. Proses segmentasi berfungsi untuk memisahkan setiap karakter dari karakter yang lain. Keluaran dari proses ini adalah deretan citra karakter Jawa yang menyusun citra dokumen yang dimasukkan oleh user. 41 Proses pengolahan tingkat piksel berakhir di proses segmentasi. Langkah berikutnya adalah proses pengenalan karakter. Dalam proses ini setiap karakter Jawa yang diperoleh akan dicoba untuk dikenali dengan nama Latinnya. Sehingga sebagai hasil dari proses ini akan berupa deretan nama-nama Latin penyusun citra dokumen di awal. Setelah deretan nama-nama Latin diperoleh maka nama-nama Latin itu akan dipakai sebagai masukan untuk proses pembentukan kata. Proses pembentukan kata ini akan menyusun kata-kata berdasarkan nama-nama Latin yang diperoleh. Jika semua nama sudah selesai diproses menunjukkan bahwa proses pembentukan kata juga selesai. Proses selanjutnya tinggal menampilkan hasil akhir dari keseluruhan proses konversi kepada user, yaitu berupa sebuah teks dokumen. 1.1 Cari Ambang citra dokumen ambang 1.2 Ubah Biner citra biner File citra biner User citra dokumen Gambar 3.8 DAD Level 2 Proses Binarisasi Penjabaran lebih rinci dari proses-proses binarisasi, normalisasi orientasi, filling, segmentasi, dan pengenalan karakter dinyatakan dalam DAD level 2. DAD level 2 proses Binarisasi gambar 3.8 di atas dijabarkan menjadi proses Cari Ambang, dan Ubah Biner. Proses Cari Ambang akan mencari nilai ambang threshold yang menjadi acuan pemisahan obyek dari latar. Nilai ambang threshold ini kemudian dikirim ke proses Ubah Biner. Proses Ubah Biner akan mengubah nilai 42 elemen dari matriks citra inputan menjadi hanya bernilai 0 atau 1, di mana nilai 0 menyatakan obyek sementara nilai 1 menyatakan latar belakang obyek. DAD level 2 proses Normalisasi Orientasi dijabarkan menjadi proses Cari Teta dan Rotasi gambar 3.9. Proses Cari Teta akan mencari besar sudut kemiringan teta θ hasil proses scanning citra. Kemudian nilai teta ini akan dikirim ke proses Putar Citra yang akan memutar citra biner sebesar sebagai teta apabila nilai teta tidak sama dengan nol. 2.1 Cari Teta citra biner teta 2.2 Putar Citra citra b iner citra terotasi File citra terotasi Gambar 3.9 DAD Level 2 Proses Normalisasi Orientasi Proses Filling dijabarkan lebih lanjut dalam DAD level 2 seperti ditunjukkan dalam gambar 3.10, yaitu terdiri dari proses Erosi dan Dilatasi. Proses Erosi akan mengubah nilai piksel dari obyek menjadi latar apabila ditemukan adanya piksel- piksel obyek yang terasing dalam piksel latar pada citra masukan. Citra baru hasil proses Erosi kemudian dipakai sebagai masukan dalam proses Dilatasi. Dalam proses Erosi piksel-piksel latar yang terasing dalam kelompok piksel obyek akan diubah menjadi piksel obyek. 3.1 Erosi citra terotasi citra ubah1 3.2 Dilatasi citra filling File citra filling Gambar 3.10 DAD Level 2 Proses Filling 43 5.1 Proyeksi vertikal citra kerangka dokumen histogram vertikal 5.2 Cari indek baris citra kerangka dokumen indek baris File indek baris ind ek bar is 5.3 Potong baris citra -citr a b aris File citra-citra baris 5.4 Proyeksi horisontal citra-citra baris 5.5 Cari indek kolom citra-citra baris indek kolom File indek kolom ind ek ko lom 5.6 Potong karakter cit ra -c itra b ari s citra-citra karakter File citra-citra karakter Gambar 3.11 DAD Level 2 Proses Segmentasi DAD level 2 proses Segmentasi gambar 3.11 di atas dijabarkan menjadi proses Proyeksi Vertikal, Cari Indek Baris, Potong Baris, Proyeksi Horisontal, Cari Indek Kolom, dan proses Potong Karakter. Proses Proyeksi Vertikal akan menghitung banyaknya piksel hitam yang tegak lurus sumbu y sesuai dengan rumus 2.13. Nilai proyeksi vertikal kemudian dipergunakan dalam proses Cari Indek Baris untuk menemukan indek-indek baris yang akan menjadi acuan untuk membagi citra masukan menjadi baris-baris karakter citra pada proses Potong Baris. Sehingga dari proses Potong Baris akan diperoleh baris-baris citra karakter yang akan disimpan dalam suatu file, serta akan dikirim ke proses Proyeksi Horisontal. Pada Proses Proyeksi Horisontal akan dihitung banyaknya piksel hitam yang tegak lurus sumbu x dengan mempergunakan rumus 2.14. Nilai proyeksi horisontal kemudian PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 44 dipergunakan dalam proses Cari Indek Kolom untuk menemukan indek-indek kolom setiap baris data yang akan menjadi acuan untuk membagi citra masukan menjadi citra-citra karakter pada proses Potong Karakter. Sehingga hasil akhir dari keseluruhan proses segmentasi adalah citra-citra karakter penyusun citra masukan, yang akan disimpan dalam sebuah file . Penjabaran lebih rinci proses Pengenalan Karakter digambarkan dalam gambar 3.12. Terdapat dua buah proses utama dalam DAD tersebut, yaitu proses Ekstraksi Ciri dan proses Cari Ciri. Proses Ekstraksi Ciri berfungsi untuk menghitung ciri dari citra karakter masukan. Ciri hasil proses Ekstraksi Ciri ini kemudian akan dipergunakan sebagai masukan dalam proses Cari Ciri, untuk menemukan nama latin dari citra karakter masukan. 6.1 Ekstraksi ciri citra-citra karakter 6.2 Cari karakter ciri-ciri karakter na m a- na m a la tin File nama-nama latin cir i k ar ak te r j aw a, nam a lati n citra -citra kar akte r File Pustaka Karakter Jawa citr a k ara kte r b aru Developer Gambar 3.12 DAD Level 2 Proses Pengenalan Karakter 45

3.2.3 Struktur Program