2
merepresentasikannya dalam komputer. Mengingat tidak semua orang mengenal karakter Jawa, maka akan lebih bermanfaat lagi apabila kemudian naskah berkarakter
Jawa tersebut dapat direpresentasikan pula dengan karakter Latin tanpa kehilangan maknanya.
1.2 Perumusan Masalah
Berdasarkan latar belakang di atas, maka permasalahan yang dapat dirumuskan adalah:
a. Bagaimana membaca dan mengubah data masukan berupa hasil scan menjadi sebuah bentuk tertentu yang siap diolah?
b. Bagaimana mengimplementasikan algoritma-algoritma yang berkait dengan analisis citra dokumen teks untuk membuat prototipe perangkat lunak yang dapat
mengenali masukan sebuah citra dokumen teks yang ditulis dengan mempergunakan karakter Jawa?
c. Bagaimana merepresentasikan citra dokumen teks yang memakai model tulisan karakter Jawa yang sudah dikenal tersebut ke dalam dokumen teks yang memakai
karakter Latin?
1.3 Batasan Masalah
Dalam penelitian ini ada beberapa pembatasan masalah yang dilakukan, yaitu:
a. Proses yang akan dilakukan adalah analisis citra dokumen teks saja b. Citra dokumen ditulis dengan mempergunakan karakter Jawa yang monokrom
3
c. Citra dokumen diambil dari buku cetakan dengan ketentuan terdapat jarak antar baris
d. Masukan hanya berupa satu citra dokumen teks per satu saat.
1.4 Keaslian Penelitian
Sejauh yang penulis ketahui, penelitian yang membahas tentang analisis citra dokumen telah banyak dilakukan, namun implementasinya pada citra
dokumen teks yang ditulis dengan mempergunakan karakter Jawa belum ada sebelumnya.
Penelitian ini pada dasarnya meneruskan kerja dari Suprihatin 2003. Bedanya, input program bukan diperoleh dari komputer melainkan dari hasil scan
sebuah citra dokumen teks.
1.5 Tujuan Penelitian
Tujuan yang ingin dicapai dalam penelitian ini adalah merancang dan membuat sebuah perangkat lunak yang mampu melakukan analisis citra dokumen
teks, sehingga dapat digunakan untuk mengolah sebuah citra dokumen teks yang ditulis dengan mempergunakan karakter Jawa.
1.6 Faedah Penelitian
Manfaat yang diharapkan dari penelitian ini adalah dapat melakukan konversi naskah dari buku sastra jawa ke dalam format teks karakter Latin secara otomatis.
4
1.7 Metodologi Penelitian
Penelitian ini dilakukan dengan mempergunakan tahapan proses analisis citra dokumen yang skemanya dapat digambarkan sebagai berikut:
Data Capture
Binarisasi Filling
Dokumen Menak
Sorangan Thinning
Segmentasi Pengenalan
Karakter Pembentukan
Kata Deretan Kata
Dalam Huruf Latin
Gambar 1.1 Bagan Proses Analisis Citra Dokumen “Menak Sorangan”
a. Data Capture Tahap awal dari proses analisis citra dokumen adalah digitalisasi data
dokumen dengan mempergunakan alat bantu scan. Hasil digitalisasi disimpan
dalam file .jpg. Selanjutnya dilakukan langkah normalisasi orientasi
terhadap file tersebut. b. Binarisasi
Setelah data dalam format digital diperoleh, maka langkah selanjutnya adalah mengubah citra dari citra yang non hitam putih ke dalam citra hitam putih. Di
mana warna hitam adalah untuk citranya, dan warna putih adalah warna latar belakang.
c. Filling Hasil dari proses binarisasi sangat mungkin terdapat beberapa noise,
contohnya adalah adanya salt and pepper. Agar proses selanjutnya berhasil dengan baik, maka harus dilakukan proses untuk mengurangi noise ini.
5
d. Thinning Setelah diperoleh citra yang bebas dari noise, maka selanjutnya dilakukan
proses untuk mengurangi komponen citra yang tidak mempunyai arti atau tidak membedakan.
e. Segmentasi Segmentasi adalah proses untuk memisahkan komponen setiap teks yang
nantinya akan dipergunakan dalam tahap pengenalan karakter. f. Pengenalan Karakter
Tahap pengenalan karakter bertujuan untuk mengenali setiap karakter yang telah diperoleh sebagai hasil dari segmentasi.
g. Pembentukan Kata Pembentukan kata menjadi tahap terakhir dari keseluruhan proses analisis.
Sebagai keluaran dari tahap ini akan diperoleh deretan kata yang dibentuk dari hasil pengenalan karakter.
Langkah penelitian: a. Merancang dan membuat program aplikasi Sistem Pengenalan Citra Dokumen
Teks Sastra Jawa b. Menguji coba program aplikasi yang telah dibuat.
c. Melakukan analisis terhadap hasil pengujian. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6
1.8 Tinjauan Pustaka