SEGMENTASI CITRA DOKUMEN TEKS SASTRA JAWA MODERN

  

SEGMENTASI CITRA DOKUMEN

TEKS SASTRA JAWA MODERN

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Sains (S.Si)

  

Program Studi Ilmu Komputer

Oleh :

Vitri

NIM : 033124025

  

PROGRAM STUDI ILMU KOMPUTER

JURUSAN MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2007

DOCUMENT IMAGE SEGMENTATION OF MODERN JAVANESE LITERATURE A THESIS

  Presented as Partial Fulfillment of the Requirements To Obtain Sarjana Sains (S.Si) Degree Computer Science Study Program

  By : Vitri Student ID : 033124025

SKRIPSI SEGMENTASI CITRA DOKUMEN TEKS SASTRA JAWA MODERN

  

Oleh :

Vitri

NIM : 033124025

telah disetujui oleh

  Pembimbing

Anastasia Rita Widiarti, S.Si., M.Kom. tanggal....................................

SKRIPSI SEGMENTASI CITRA DOKUMEN TEKS SASTRA JAWA MODERN

  

Dipersiapkan dan ditulis oleh :

Vitri

NIM : 033124025

Telah dipertahankan di depan Panitia Penguji

pada tanggal 16 Agustus 2007

dan dinyatakan memenuhi syarat

  

Susunan Panitia Penguji

Nama Lengkap Tanda Tangan

Ketua : Ir. Greg. Heliarko, S.J., S.S., B.S.T., M.Sc., M.A. ...............................

Sekretaris : P.H. Prima Rosa, S.Si., M.Sc. ................................

Anggota : Anastasia Rita Widiarti, S.Si., M.Kom. ................................

Anggota : Drs. Hj. Haris Sriwindono, M.Kom. ................................

Anggota : St. Eko Hari Parmadi, S.Si., M.Kom. ................................

Yogyakarta,

  16 Agustus 2007 Fakultas Sains dan Teknologi Universitas Sanata Dharma Dekan,

  (Ir. Greg. Heliarko, S.J., S.S., B.S.T., M.Sc., M.A.)

PERSEMBAHAN

  

Satu bola basket di tanganku dihargai sekitar 19 dolar,

satu bola basket di tangan Michael jordan dihargai sekitar 30 juta dolar.

  

Nilainya tergantung di tangan siapa bola itu berada.

2 ekor ikan dan 5 roti di tanganku menjadi sepasang sandwiches ikan,

2 ekor ikan dan 5 roti di tangan Tuhan dapat memberi makan ribuan orang.

  

Paku di tanganku dapat digunakan membuat satu kandang burung,

paku di tangan Tuhan Yesus Kristus menghasilkan keselamatan untuk seluruh dunia.

  

Selalu tergantung di tangan siapa benda itu berada.

Oleh karena itu, serahkanlah kegelisahanmu, kekhawatiranmu, ketakutanmu,

harapanmu, impianmu dan keluargamu ke dalam tangan Tuhan,

karena......dalam tangan-Nya segala sesuatu dibuat-Nya menjadi berguna bagimu dan

bagi orang yang kau kasihi.

  

Engkau akan menjadi mahkota keagungan di tangan Tuhan dan serban kerajaan di

tangan Allahmu (Yesaya 62:3)

Skripsi ini ku persembahkan UNTUK :

  • Tuhanku Yesus Kristus • Papa dan Mamaku tercinta
  • • Koko dan ceceku tersayang

M O TTO :

  J adilah diri an da sen diri. Siapa lagi yan g bisa m elakukan n ya lebih baik ketim bang diri anda sendiri? - Fr a n k Gib lin , Ii

Do all the goods you can , All the best you can , In all tim es you can , In all places

you can , For all the creatures you can .

PERNYATAAN KEASLIAN KARYA

  

Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini

tidak memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan dalam kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.

  Yogyakarta,

  16 Agustus 2007 Penulis Vitri

  

SEGMENTASI CITRA DOKUMEN

TEKS SASTRA JAWA MODERN

Vitri

INTISARI

  Dokumen teks sastra jawa modern merupakan warisan kebudayaan yang

sangat penting dan patut dilestarikan baik secara fisik maupun makna. Pengenalan

citra dokumen adalah salah satu cara pelestarian yang bisa dilakukan, karena

dengan pengenalan citra, dokumen teks tersebut dapat dikenali dan dapat bertahan

lebih lama.

  Segmentasi adalah tahapan dalam proses pengolahan citra tingkat piksel

dengan tujuan utama untuk mendapatkan citra-citra karakter penyusun citra

dokumen teks. Citra karakter penyusun tersebut akan berfungsi sebagai masukan

untuk tahap selanjutnya yaitu pengenalan citra karakter.

  Penelitian ini membuat sebuah sistem segmentasi citra dokumen teks

sastra Jawa modern. Data masukan untuk sistem diperoleh dari hasil pembacaan

dokumen teks sastra Jawa modern dengan alat optis, yang kemudian disimpan

sebagai file gambar dengan format *.bmp. Metode segmentasi yang dipergunakan

adalah profil proyeksi dan chain code, dan dikembangkan menggunakan bahasa

pemrograman Delphi.

  Dari hasil penelitian terhadap 5 citra dokumen, diperoleh rata-rata

prosentase keberhasilan segmentasi sebesar 94,62% dengan rata-rata waktu yang

dibutuhkan adalah 28,143 detik. Dengan demikian, dapat disimpulkan bahwa

pemilihan metode profil proyeksi dan chain code pada penelitian ini relatif sudah

baik.

  

DOCUMENT IMAGE SEGMENTATION OF

MODERN JAVANESE LITERATURE

Vitri

ABSTRACT

  Text document of modern Javanese literature is a cultural heritage which is

very important and needed to be preserved both physically and semantically. The

recognition of document image is one of the preservation efforts that can be done,

since through the image recognition, the text document could be recognized and

therefore could survive longer.

  Segmentation is one of the stages in pixel image processing whose main

objective is to obtain character images that forms the text document. Those

character will be as the inputs of the next stage namely character image

recognition.

  The objective of this research is to develop an image segmentation system

of modern Javanese literature’s text document. The input data of the system is

obtained from the scanning of modern Javanese literature’s text document using

an optical device, which later on is saved as picture file in *.bmp format. The

segmentation methods used are the projection profile and the chain code. The

system is developed using Delphi programming language.

  Based on the experiments using five document images, the average

percentage of segmentation succes rate is 94,62%, while the averagge time needed

is 28,14 seconds. Therefore, it can be concluded that the choosing of the

projection profile and the chain code methods in this research is relatively

appropriate.

  Puji syukur ke hadirat Tuhan Yesus Kristus yang telah melimpahkan

rahmat dan kasih-Nya sehingga penulis dapat menyelesaikan skripsi dengan judul

“Segmentasi Citra Dokumen Teks Sastra Jawa Modern”.

  Skripsi ini disusun sebagai salah satu syarat untuk memperoleh gelar

Sarjana Sains (S.Si) Program Studi Ilmu Komputer di Fakultas Sains dan

Teknologi Universitas Sanata Dharma Yogyakarta.

  Dalam penulisan skripsi penulis menyadari banyak pihak yang telah

memberikan sumbangan baik pikiran, waktu, tenaga, bimbingan dan dorongan

pada penulis sehingga akhirnya skripsi ini dapat selesai. Oleh karena itu dengan

segala kerendahan hati penulis menyampaikan ucapan terima kasih yang sebesar-

besarnya kepada : 1.

  Ibu Anastasia Rita Widiarti, S.Si., M.Kom. selaku dosen pembimbing yang

telah memberikan bimbingan, arahan, dan petunjuk selama penulisan skripsi.

  2. Bapak Drs. Hj. Haris Sriwindono, M.Kom selaku dosen pembimbing akademik, sekaligus dosen penguji yang telah memberikan bimbingan, masukan, saran, dan kritik yang membangun untuk skripsi ini.

  3. Bapak St. Eko Hari Parmadi, S.Si., M.Kom selaku dosen penguji yang telah

memberikan, masukan, saran dan kritik yang membangun untuk skripsi ini.

  4. Romo Gregorius Heliarko selaku Dekan Fakultas Sains dan Teknologi.

  5. Ibu P.H. Prima Rosa, M.Sc.selaku Kepala Program Studi Ilmu Komputer atas kesabaran dan bimbingannya.

  6. Seluruh dosen pengajar Program Studi Ilmu Komputer Universitas Sanata Dharma yang telah membimbing penulis selama kuliah, dan seluruh karyawan terkait atas bantuan yang diberikan untuk kelancaran penyelesaian skripsi 7. Papa dan Mama atas kasih sayang, doa yang tulus, dorongan semangat, dan pengorbanannya selama ini.

  8. Kedua kakak penulis Andrew Michael dan Vivi yang telah banyak memberikan bantuan, dorongan semangat, pelajaran hidup dan kasih sayang.

  9. Iwan yang telah memberi banyak pelajaran hidup, semangat dan kasih sayang, sehingga penulis menjadi lebih kuat dan dewasa dalam menjalani hidup.

  10. Mbak Tika yang selalu memberikan bantuan, dorongan semangat dan selalu siap mendampingi penulis.

  11. Kadek, Anjar, Clara dan Rey atas bantuan, semangat dan kerjasamanya selama kuliah dan dalam penulisan skripsi ini.

  12. Semua teman seperjuangan ikom’03.

  13. Semua pihak yang tidak dapat penulis sebutkan satu persatu.

  Penulis menyadari bahwa skripsi ini masih banyak kekurangan dan jauh dari kesempurnaan, sehingga segala kritik dan saran yang bersifat membangun sangat penulis harapkan demi perbaikan skripsi ini. Akhirnya dengan segala kekurangan yang ada, penulis berharap agar skripsi ini masih dapat diambil manfaatnya.

  Yogyakarta,

  16 Agustus 2007 Penulis

  

DAFTAR ISI

HALAMAN JUDUL ........................................................................................ i

HALAMAN PERSETUJUAN PEMBIMBING .............................................. ii

HALAMAN PENGESAHAN .......................................................................... iii

HALAMAN PERSEMBAHAN ....................................................................... iv

PERNYATAAN KEASLIAN KARYA ........................................................... v

  

INTISARI ......................................................................................................... vi

ABSTRACT ....................................................................................................... vii

KATA PENGANTAR ...................................................................................... viii

DAFTAR ISI .................................................................................................... x

DAFTAR TABEL ............................................................................................ xiii

DAFTAR GAMBAR ....................................................................................... xiv

DAFTAR LAMPIRAN .................................................................................... xvi

BAB 1 PENDAHULUAN ...............................................................................

  1 A.

  1 Latar Belakang ...............................................................................

  B.

  3 Rumusan Masalah ..........................................................................

  C.

  3 Batasan Masalah .............................................................................

  D.

  3 Tujuan dan Manfaat .......................................................................

  E.

  4 Metode ............................................................................................

  F.

  4 Sistematika Penulisan .....................................................................

  BAB 2 DASAR TEORI ...................................................................................

  6

  A.

  6 Citra ................................................................................................

  1.

  6 Citra Biner ................................................................................

  2.

  7 Citra Skala Keabuan .................................................................

  3.

  8 Citra Warna ..............................................................................

  4.

  8 Citra Warna Berindeks .............................................................

  B.

  9 Citra Dokumen Teks ......................................................................

  C.

  10 Pengolahan Citra Digital ................................................................

  D.

  13 Histogram .......................................................................................

  E.

  13 Binarisasi ........................................................................................

  F.

  15 Segmentasi Citra Dokumen ............................................................

  1.

  15 Profil Proyeksi ..........................................................................

  2.

  16 Kode Rantai (Chain Code) .......................................................

  BAB 3 ANALISA DAN PERANCANGAN ...................................................

  18 A.

  18 Analisa ............................................................................................

  B.

  19 Perancangan ...................................................................................

  1.

  19 Perancangan Proses ..................................................................

  2.

  23 Perancangan Menu ...................................................................

  3.

  25 Perancangan Teknologi ............................................................

  4.

  25 Perancangan Antar Muka .........................................................

  5.

  29 Perancangan Struktur Data .......................................................

  BAB 4 IMPLEMENTASI ................................................................................

  31 A.

  31 Implementasi Antar Muka dan Menu .............................................

  B.

  34 Implementasi Proses .......................................................................

  BAB 5 HASIL DAN PEMBAHASAN ............................................................

  46 A.

  46 Data Masukan .................................................................................

  B.

  46 Perangkat Keras dan Perangkat Lunak ...........................................

  C.

  47 Eksekusi Modul ..............................................................................

  D.

  54 Analisis Output ...............................................................................

  BAB 6 KESIMPULAN DAN SARAN ............................................................

  64 A.

  64 Kesimpulan .....................................................................................

  B.

  64 Saran ............................................................................................... DAFTAR PUSTAKA ......................................................................................

  65 LAMPIRAN .....................................................................................................

  66

DAFTAR TABEL Tabel 1. Karakteristik citra dokumen masukan ................................................

  Tabel 2. Hasil indeks baris ................................................................................ Tabel 3. Hasil indeks baris ................................................................................ Tabel 4. Cuplikan hasil Chain code citra dokumen data 1 ............................... Tabel 5. Waktu Proses binarisasi dan segmentasi.............................................. Tabel 6. Besar file hasil binarisasi dan segmentasi............................................ Tabel 7. Analisis output Segmentasi Citra Dokumen data 1 ............................ Tabel 8. Analisis output Segmentasi Citra Dokumen data 2 ............................ Tabel 9. Analisis output Segmentasi Citra Dokumen data 3 ............................ Tabel 10. Analisis output Segmentasi Citra Dokumen data 4 .......................... Tabel 11. Analisis output Segmentasi Citra Dokumen data 5 .......................... Tabel 12. Rangkuman hasil Analisis output sistem ..........................................

  46

  50

  51

  53

  54

  55

  55

  57

  58

  60

  61

  63

DAFTAR GAMBAR Gambar 1. Citra biner dan representasinya dalam data digital .......................

  7 Gambar 2. Citra skala keabuan dan representasinya dalam data digital ..........

  7 Gambar 3. Citra warna dan representasinya dalam data digital .......................

  8 Gambar 4. Citra warna berindeks dan representasinya dalam data digital ......

  9 Gambar 5. Citra dokumen teks ........................................................................

  10 Gambar 6. Histogram citra ...............................................................................

  13 Gambar 7. citra dengan proyeksi vertikal dan horizontal ................................

  16 Gambar 8. Chain code 4 arah mata angin ........................................................

  17 Gambar 9. Chain code 8 arah mata angin ........................................................

  17 Gambar 10. Diagram konteks ...........................................................................

  19 Gambar 11. DAD level 1 ..................................................................................

  20 Gambar 12. DAD level 2 untuk proses binarisasi .............................................

  20 Gambar 13. DAD level 2 untuk proses segmentasi ..........................................

  21 Gambar 14. Rancangan menu ...........................................................................

  23 Gambar 15. Rancangan antar muka menu utama ..............................................

  25 Gambar 16. Rancangan antar muka menu hasil segmentasi baris ....................

  26 Gambar 17. Rancangan antar muka menu hasil segmentasi kolom ..................

  27 Gambar 18. Rancangan antar muka menu chain code ......................................

  28 Gambar 19. Rancangan antar muka menu piksel awal .....................................

  28 Gambar 20. Rancang antar muka menu piksel biner ........................................

  29

  Gambar 21. Form Judul .................................................................................... Gambar 22. Form Utama .................................................................................. Gambar 23. Form Indeks baris .......................................................................... Gambar 24. Form Indeks Kolom ...................................................................... Gambar 25. Form Chain code ........................................................................... Gambar 26. Form Piksel awal ........................................................................... Gambar 27. Form Piksel biner .......................................................................... Gambar 28. Citra dokumen masukan data 1 ..................................................... Gambar 29. Citra dokumen hasil proses binarisasi data 1 ................................ Gambar 30. Histogram baris pada cuplikan citra dokumen data 1 ................... Gambar 31. Hasil pemotongan histogram baris ................................................ Gambar 32. Histogram kolom pada cuplikan citra dokumen data 1 ................. Gambar 33. Hasil pemotongan histogram kolom ............................................. Gambar 34. Hasil pemotongan kolom citra baris ............................................. Gambar 35. Citra dokumen hasil proses segmentasi data 1 .............................. Gambar 36. Citra hasil chain code dan Chain code ..........................................

  48

  51

  51

  50

  50

  49

  49

  47

  31

  34

  33

  33

  32

  32

  31

  52

DAFTAR LAMPIRAN Lampiran 1. Implementasi Modul dalam Sistem .............................................

  Lampiran 2. Data Citra Dokumen Masukan dan Hasil .................................... Lampiran 3. Hasil Chain Code ........................................................................

  66

  86

  98

BAB I PENDAHULUAN A LATAR BELAKANG Dewasa ini, aplikasi-aplikasi yang berhubungan dengan pemrosesan citra

  berkembang pesat. Aplikasi-aplikasi pemrosesan citra telah merambah ke berbagai bidang. Contoh aplikasinya antara lain, analisis citra dokumen, pengenalan sidik jari, pembacaan kode barang, pengenalan plat nomor kendaraan dll. Salah satu aplikasi yang paling banyak diteliti dan paling cepat berkembang adalah ilmu analisis citra dokumen.

  Analisis citra dokumen merupakan ilmu yang membahas tentang algoritma-algoritma dan teknik-teknik yang diterapkan pada citra dokumen untuk menghasilkan deskripsi yang dapat dikenali oleh komputer (Widiarti, 2006). Contoh kasus yang membutuhkan analisis citra dokumen misalnya pembaca dokumen sampai dengan pembuatan sistem pengenal huruf otomatis (automatic character recoqnizer) untuk suatu citra karakter ataupun citra dokumen.

  Sistem pengenal huruf otomatis telah banyak ditemukan pada berbagai alat elektronik misalnya sebagai media input pengganti keyboard pada PC genggam atau PDA. Selain itu, dengan adanya sistem pengenal huruf otomatis, berbagai dokumen teks seperti jurnal-jurnal, surat-surat kantor bahkan naskah-naskah kuno penting seperti naskah-naskah Jawa, dapat diubah ke dalam format digital untuk dikenali atau bahkan diperbaharui.

  

Dokumen teks berupa naskah-naskah kuno seperti naskah Jawa merupakan

peninggalan kebudayaan lokal yang sangat penting dan perlu dilestarikan.

  

Tidak hanya naskah dokumen secara fisik, makna yang terkandung dalam

naskah dokumen tersebut juga harus dilestarikan dengan cara

menerjemahkannya ke dalam bahasa latin yang mudah dimengerti. Hal ini

membuka peluang yang sangat besar bagi perkembangan ilmu analisis citra

dokumen, khususnya untuk melestarikan naskah-naskah kuno atau dokumen

Jawa yang banyak ditemukan di Yogyakarta.

  

Secara umum terdapat 3 tahapan utama dalam analisis citra dokumen

(Widiarti, 2006). Pertama, menangkap atau mengambil citra dokumen teks

dengan menggunakan scanner. Kedua, proses pengolaan tingkat piksel.

Ketiga, tahap analisis tingkat fitur. Proses pengolaan tingkat piksel dibagi lagi

menjadi beberapa tahap yaitu binarisasi, normalisasi orientasi, pengurangan

noise (filling), perangkaan (thinning), dan segmentasi citra dokumen.

  

Sedangkan proses analisis tingkat fitur dibagi menjadi 2 tahap yaitu

pengenalan dan analisis teks serta pengenalan dan analisis grafis.

  Di antara tahap-tahap tersebut diatas, segmentasi citra dokumen

merupakan tahap paling akhir sebelum pengenalan dan analisis citra teks

maupun grafis, yang outputnya akan menjadi input dan salah satu penentu

berhasil tidaknya suatu pengenalan citra dokumen. Karena itu, tahap

segmentasi sangat penting untuk dilakukan dan perlu perhatian yang khusus

agar citra karakter yang dihasilkan benar-benar dapat digunakan sebagai

masukan dalam proses pengenalan citra dokumen.

B RUMUSAN MASALAH

  Bagaimana melakukan proses segmentasi sehingga mendapatkan citra- citra karakter penyusun citra dokumen teks pada sebuah citra dokumen teks sastra Jawa modern?

C BATASAN MASALAH

  Sistem yang akan dibangun hanya akan membahas proses segmentasi dan sedikit proses binarisasi sebuah citra dokumen teks sastra Jawa Modern.

  Apabila ada proses sebelum proses segmentasi seperti normalisasi orientasi, filling dan perangkaan, maka proses-proses tersebut akan dihitung atau dilakukan secara manual dan tidak dibahas dalam tugas akhir ini.

  Citra dokumen masukan yang ideal untuk sistem ini adalah citra dokumen sastra Jawa modern yang tidak miring, bebas dari derau atau noise, karakter penyusun citra dokumen tebal dan jelas, serta memiliki batas baris dan kolom yang jelas.

D TUJUAN DAN MANFAAT

  Tujuan yang ingin dicapai adalah membangun sistem yang dapat melakukan proses segmentasi untuk memperoleh citra-citra karakter penyusun yang terdapat dalam citra dokumen teks sastra Jawa modern masukan.

  Manfaatnya adalah citra-citra karakter yang diperoleh diharapkan dapat menjadi input yang baik dalam pengenalan citra dokumen teks sastra Jawa modern.

E METODE

  Metode yang digunakan untuk membuat sistem segmentasi citra dokumen ini adalah sebagai berikut :

  1 Pengumpulan kebutuhan sistem Pada tahap ini yang dilakukan adalah mengumpulkan data-data yang terkait dengan sistem antara lain : citra dokumen yang akan digunakan sebagai percobaan dan pelatihan, perangkat keras dan perangkat lunak yang dibutuhkan.

  2 Perancangan sistem Pada tahap ini dilakukan perancangan yang dibutuhkan dalam sistem, antara lain : proses-proses yang akan dilakukan, menu dan keterkaitannya, karakteristik antar muka dan struktur data.

  4 Pengujian Tahap ini dilakukan untuk mengetahui apakah sistem sesuai dengan yang

diinginkan, juga digunakan untuk mengetahui kesalahan yang mungkin

F SISTEMATIKA PENULISAN

  Bab I Pendahuluan Pendahuluan akan membahas tentang latar belakang masalah, rumusan masalah, batasan masalah, tujuan dan manfaat, metodologi, sistematika penulisan.

  Bab II Dasar Teori Dalam dasar teori akan membahas tentang berbagai dasar yang mempengaruhi dan mendasari pembuatan sistem segmentasi citra dokumen sastra Jawa modern ini.

  Bab III Analisis dan Perancangan Sistem Dalam bab ini akan membahas tentang analisis masalah untuk mempermudah dalam perancangan sistem serta perancangan sistem antara lain perancangan modul dan antarmuka.

  

foto keluarga, gambar burung dan citra tak tampak seperti data gambar dalam

file yang sering disebut citra digital. Dari antara kelompok citra tersebut,

hanya citra digital yang dapat diolah menggunakan komputer, sehingga yang

akan dibahas dalam tugas akhir ini hanya citra digital.

  Citra digital tersusun atas kumpulan titik atau elemen-elemen gambar yang

disebut piksel (picture element). Piksel merupakan elemen terkecil dari sebuah

citra digital, dengan jumlah total piksel adalah M x N, dimana M merupakan

width (nilai tinggi citra digital) dan N merupakan height (nilai lebar citra digital ). Setiap piksel memiliki nilai berupa angka digital yang merepresentasikan informasi yang mewakili piksel tersebut.

  Menurut Achmad dan Firdausy (2005), format nilai piksel ditentukan oleh format citra digital antara lain:

  1 Citra Biner Citra biner merupakan citra yang hanya mempunyai dua nilai derajat keabuan yaitu hitam dan putih. Setiap piksel pada citra biner memiliki nilai 0 untuk warna hitam atau 1 untuk warna putih dan hanya membutuhkan representasi 1 bit. Beberapa contoh citra biner antara lain, citra logo instansi (yang hanya terdiri atas warna hitam dan putih), citra kode barang yang tertera pada label barang, dan citra teks (hasil pemindaian dokumen).

  = 0 0 1 1 = 0 0 1 1 = 0 0 1 1 = 0 0 0 1

Gambar 1. Citra biner dan representasinya dalam data digital

  2 Citra Skala Keabuan Citra skala keabuan memberikan kemungkinan warna yang lebih banyak daripada citra biner. Banyaknya kemungkinan nilai dan nilai maksimumnya bergantung pada jumlah bit yang digunakan. Misalnya

  8 untuk skala keabuan 8 bit, maka jumlah kemungkinan nilainya adalah 2 =

  8 256, dan nilai maksimumnya adalah 2 -1 = 255. Format citra ini disebut skala keabuan karena pada umumnya warna yang dipakai adalah antara hitam sebagai warna minimal dan putih sebagai warna maksimalnya, sehingga warna antaranya adalah abu-abu.

  = 107 153 177 175 = 108 143 177 176 = 105 128 162 176 = 105 123 157 173

  Gambar 2. Citra skala keabuan dan representasinya dalam data digital

  3 Citra Warna Pada citra warna, setiap titik mempunyai warna yang spesifik yang merupakan kombinasi dari 3 warna dasar, yaitu: merah, hijau dan biru. Format citra seperti ini sering disebut sebagai citra RGB (red-green-blue). Setiap warna dasar mempunyai intensitas sendiri dengan nilai maksimum 255 (8 bit), misalnya warna kuning merupakan kombinasi warna merah dan hijau sehingga nilai RGB-nya adalah 255 255 0. Dengan demikian setiap titik pada citra warna membutuhkan data 3 byte.

  Jumlah kombinasi warna yang mungkin unutk format citra ini

  24 adalah 2 atau lebih dari 16 juta warna, dengan demikian bisa dianggap mencakup semua warna yang ada.

  = 183 168 235 156 131 212 151 115 205 157 101 200 = 146 139 207 130 115 198 139 110 203 149 102 204 = 124 122 195 112 104 190 123 103 202 136 99 204 = 128 131 208 108 104 198 110 98 200 122 93 201

  Gambar 3. Citra warna dan representasinya dalam data digital

  4 Citra Warna Berindeks Jumlah memori yang dibutuhkan untuk format citra warna adalah 3 kali jumlah titik yang ada dalam citra yang ditinjau. Di lain pihak, pada kebanyakan kasus, jumlah warna yang ada dalam suatu citra terkadang sangat terbatas, karena banyaknya warna dalam sebuah citra tidak mungkin melebihi banyaknya titik dalam citra itu sendiri. Untuk kasus tersebut, disediakan format citra warna berindeks. Pada format ini, informasi setiap titik merupakan indeks dari suatu tabel yang berisi informasi warna yang tersedia, yang disebut palet warna.

  Palet warna merupakan bagian dari citra warna berindeks, sehingga pada saat menyimpan citra ini ke dalam file, informasi palet warna juga harus disertakan.

Gambar 4. Citra warna berindeks dan representasinya dalam data digital B

CITRA DOKUMEN TEKS

  Dokumen teks merupakan sebuah tulisan yang memuat informasi (Anonim, 2006). Biasanya dokumen ditulis atau dicetak di atas kertas dan informasinya ditulis menggunakan tinta baik menggunakan tangan ataupun media elektronik seperti komputer.

  Sama halnya dengan dokumen teks, citra dokumen teks merupakan suatu citra yang berisi kumpulan teks atau tulisan tapi dalam format digital. Citra dokumen teks masukan yang diperlukan dalam proses segmentasi adalah berupa citra dokumen biner. Jika citra dokumen masukan tidak berupa citra dokumen biner, maka citra tersebut akan diproses menjadi citra biner terlebih dahulu melalui proses binarisasi.

Gambar 5. Citra dokumen teks C

PENGOLAHAN CITRA DIGITAL

  Pengolahan citra digital adalah pemrosesan citra, khususnya dengan menggunakan komputer, menjadi citra dengan kualitas lebih baik. Pengolahan citra digital bertujuan memperbaiki kualitas citra agar mudah diinterpretasi oleh manusia atau mesin.

  Operasi-operasi yang dilakukan di dalam pengolahan citra banyak

ragamnya. Namun, secara umum, operasi pengolahan citra dapat

diklasifikasikan dalam beberapa jenis (Munir, 2004) sebagai berikut :

  1 Perbaikan kualitas citra

Jenis operasi ini bertujuan untuk memperbaiki kualitas citra dengan cara

memanipulasi parameter-parameter citra. Dengan operasi ini, ciri-ciri khusus yang terdapat di dalam citra lebih ditonjolkan.

  Tujuan pemugaran citra hampir sama dengan operasi perbaikan citra. Bedanya, pada pemugaran citra penyebab degradasi gambar diketahui.

  3 Pemampatan citra

Jenis operasi ini dilakukan agar citra dapat direpresentasikan dalam bentuk

yang lebih kompak sehingga memerlukan memori yang lebih sedikit. Hal

penting yang harus diperhatikan dalam pemampatan adalah citra yang

telah dimampatkan harus tetap mempunyai kualitas gambar yang bagus.

  4 Segmentasi citra

Jenis operasi ini bertujuan untuk memecah suatu citra ke dalam beberapa

segmen dengan suatu kriteria tertentu. Jenis operasi ini berkaitan erat dengan pengenalan pola yang akan dibahas dalam tugas akhir ini.

  5 Analisis citra

Jenis operasi ini bertujuan menghitung besaran kuantitatif dari citra untuk menghasilkan deskripsinya. Teknik analisis citra mengekstraksi ciri-ciri tertentu yang membantu dalam identifikasi objek. Proses segmentasi kadangkala diperlukan untuk melokalisasi objek yang diinginkan dari sekelilingnya.

  6 Rekonstruksi citra Jenis operasi ini bertujuan untuk membentuk ulang objek dari beberapa citra hasil proyeksi. Operasi rekonstruksi citra banyak digunakan dalam bidang medis.

  

Pengolahan citra pada dasarnya dilakukan dengan cara memodifikasi setiap

titik dalam citra tersebut sesuai keperluan. Menurut Achmad dan Firdausy

(2005), secara garis besar modifikasi tersebut dikelompokkan menjadi: 1.

  Operasi titik, dimana setiap titik diolah secara tidak berhubungan terhadap titik-titik yang lain.

  2. Operasi global, di mana karakteristik global (biasanya berupa sifat statistik) dari citra digunakan untuk memodifikasi nilai setiap titik.

  3. Operasi temporal/berbasis bingkai, di mana sebuah citra diolah dengan cara dikombinasikan dengan citra lain.

  4. Operasi geometri, di mana bentuk, ukuran, atau orientasi citra dimodifikasi secara geometris.

  5. Operasi banyak titik bertetangga, di mana data dari titik-titik yang bersebelahan dengan titik yang ditinjau ikut berperan dalam mengubah nilai.

  6. Operasi morfologi, yaitu operasi yang berdasarkan segmen atau bagian dalam citra yang menjadi perhatian.

D HISTOGRAM

  Histogram merupakan salah satu alat bantu yang paling sederhana dan sangat berguna dalam pengolahan citra (Achmad dan Firdausy, 2005).

  Histogram citra adalah grafik yang menggambarkan penyebaran nilai-nilai intensitas piksel dari suatu citra atau bagian tertentu di dalam citra.

  Misalkan citra digital memiliki L derajat keabuan, yaitu dari 0 sampai L-1 (pada citra dengan kuantitas derajat keabuan 8 bit, nilai derajat keabuan dari 0 sampai 255). Secara matematis histogram citra dihitung dengan rumus (Munir, 2004) : n i h = , i = , 1 , 2 ,....., L

  1 i n

  Dimana : n i = jumlah piksel yang memiliki derajat keabuan i n = jumlah seluruh piksel di dalam citra a b

Gambar 6. a) citra skala keabuan, b) histogram citra skala keabuan E

   BINARISASI Binarisasi merupakan proses untuk memisahkan objek dari latar belakang yang tidak dibutuhkan (O’Gorman dan Kasturi, 1997). Tujuan utama dari

  

proses ini adalah menentukan nilai ambang yang akan berfungsi untuk

membagi citra menjadi dua bagian secara otomatis. Salah satu algoritma

pencarian nilai ambang adalah menggunakan algoritma K-Mean Clustering.

  K-Mean Clustering merupakan suatu algoritma yang menggolongkan

suatu objek berdasarkan atribut atau ciri tertentu kedalam K kelompok

(Savakis, 1998). K merupakan banyaknya kelompok yang akan dibentuk dan

bernilai bulat. Dalam kasus binarisasi, kelompok yang akan dibuat sebanyak

dua kelompok yaitu kelompok objek dan kelompok latar belakang. Berikut ini

merupakan algoritma K-Mean Clustering (Teknomo, 2004) :

  1 Menentukan jumlah kelompok yang akan dibuat.

  2 Inisialisasi Mean (pusat) dari masing-masing kelompok.

  3 Menghitung jarak setiap titik terhadap masing-masing pusat dan mengelompokkan titik tersebut ke dalam kelompok yang memiliki jarak paling minimum.

  4 Menghitung kembali pusat masing-masing kelompok dengan cara menghitung rata-rata nilai setiap kelompok.

  5 Ulangi kembali langkah 3-4 jika masih ada objek yang berpindah kelompok atau pusat lama tidak sama dengan pusat baru.

  6 Nilai ambang diperoleh dengan menghitung rata-rata semua pusat.

  Nilai biner suatu citra g(x,y), dimana f(x,y) menyatakan gray-level dari

suatu poin (x,y), dan T menyatakan suatu nilai ambang, didefinisikan sebagai

berikut : 1 jika f ( x , y ) T

  ⎧ > g ( x , y ) =

  ⎨ jika f ( x , y ) T

  ≤

F SEGMENTASI CITRA DOKUMEN

  Segmentasi citra dokumen merupakan tahapan dalam proses pengolahan citra dokumen tingkat piksel (Widiarti, 2006) dengan tujuan utama untuk memperoleh citra-citra penyusun yang terdapat dalam citra dokumen masukan dengan cara melakukan pembagian terhadap citra dokumen masukan sehingga diperoleh beberapa wilayah berdasarkan kriteria tertentu. Hasil dari proses segmentasi ini akan digunakan untuk proses yang lebih lanjut yang dapat dilakukan terhadap suatu citra, yaitu pengenalan citra.

  Ada beberapa metode yang dapat digunakan dalam segmentasi citra, antara lain yaitu :

  1 Profil Proyeksi Metode profil proyeksi dibagi menjadi 2 yaitu profil proyeksi vertikal dan profil proyeksi horizontal. Profil proyeksi vertikal adalah banyaknya piksel hitam yang tegak lurus dengan sumbu y, yaitu:

  [ ] [ ] ∑

  = =

  M j v

  S j i i P

  1 , Sedangkan profil proyeksi horizontal adalah banyaknya piksel hitam yang tegak lurus dengan sumbu x (Widiarti,2006), yaitu:

  [ ] [ ] ∑

  = =

  N i h

  S j i j P

  1 ,

  Keterangan : S = Citra Pv = Profil proyeksi vertikal Ph = Profil proyeksi horizontal

  M = Lebar citra N = Tinggi citra i = Baris i = 1,2,3.......,N j = Kolom j = 1,2,3.......,M

  Gambar 7. citra dengan proyeksi vertikal dan horizontal

  2 Kode Rantai (Chain Code) Kode rantai (chain code) adalah notasi untuk mengkodekan garis tepi yang membentuk batas daerah (Munir, 2004). Pengkodean dengan chain code lebih singkat dan jelas dibandingkan dengan notasi [(x ,y ),(x ,y ),..].

  1

  1

  2

  2 Kode rantai digambarkan untuk membentuk batas wilayah dimana piksel putih berada di luar dan piksel hitam berada di dalam batas wilayah. Kode rantai menspesifikasikan arah setiap piksel tepi di dalam garis tepi. Ada

dua kode arah yang dapat digunakan dalam kode rantai (Price, 1996) :

a

  4 arah mata angin Arah yang digunakan adalah 4 arah mata angin, seperti yang terlihat pada gambar 8. Karena menggunakan 4 arah mata angin, maka dibutuhkan 2 bit untuk mengkodekan setiap arah. a b

Gambar 8. a) 4 arah mata angin, b) kode rantai : 222110321033

b 8 arah mata angin

  Arah yang digunakan adalah 8 arah mata angin, seperti yang terlihat pada gambar 9. Karena menggunakan 8 arah mata angin, maka dibutuhkan 3 bit untuk mengkodekan setiap arah. a b

Gambar 9. a) 8 arah mata angin, b) kode rantai : 01700754444422

  Dimulai dari sebuah piksel tepi (x,y), arah setiap piksel tepi yang

membentuk batas objek dikodekan dengan salah satu dari delapan kode

rantai. Kode rantai merepresentasikan batas objek dengan koordinat piksel tepi pertama lalu diikuti dengan garis kode rantai. membutuhkan input berupa citra dokumen sastra jawa modern. Sebelum menjadi input dalam proses segmentasi, ada beberapa proses yang harus dilakukan terlebih dahulu terhadap citra dokumen tersebut. Proses-proses tersebut adalah :

  1 Normalisasi orientasi, berfungsi untuk mengurangi kesalahan orientasi, misalnya citra miring saat pembacaan data citra dokumen dengan scanner.

  2 Binarisasi, berfungsi untuk membagi citra menjadi dua kelompok yaitu kelompok objek yang dinyatakan dengan nilai biner 0 dan kelompok latar yang dinyatakan dengan nilai biner 1.

  3 Filling, berfungsi untuk menghapus sebanyak mungkin noise yang muncul pada citra dokumen.

  Proses normalisasi orientasi dan filling akan dilakukan secara manual dan tidak akan dibahas lebih lanjut dalam tugas akhir ini.

  Selanjutnya, untuk mengatasi input citra dokumen yang tidak biner, sistem diharapkan mampu mengubah citra dokumen input menjadi citra dokumen biner. Algoritma pencarian nilai ambang dalam binarisasi yang digunakan adalah algoritma K-Mean Clustering.

  Setelah citra dokumen sudah baik, artinya sudah melewati ketiga proses diatas, maka citra dokumen tersebut siap menjadi input dari proses segmentasi. Metode segmentasi yang digunakan ada 2 yaitu profil proyeksi dan chain code dengan 8 arah mata angin. Profil proyeksi digunakan untuk membagi citra dokumen menjadi baris-baris dan kolom-kolom yang berisi karakter. Kemudian chain code digunakan untuk mengkodekan tepi dari setiap karakter.

  Hasil yang diharapkan adalah memperoleh citra-citra karakter penyusun citra dokumen beserta chain code dari masing-masing karakter yang terpisah satu-sama lain.

B PERANCANGAN

  1 Perancangan Proses a Diagram Konteks (DAD level 0)

  Gambar 10. Diagram konteks

Input dari sistem segmentasi citra dokumen sastra jawa modern ini

  adalah citra dokumen sastra jawa modern yang telah melalui proses normalisasi orientasi dan filling secara manual terlebih dahulu. Citra tersebut akan diproses sehingga menghasilkan citra-citra karakter penyusun citra dokumen beserta dengan chain code-nya masing- masing. b DAD level 1