PENGENALAN POLA BATIK YOGYAKARTA MENGGUNAKAN METODE HIDDEN MARKOV MODELS DENGAN STUDI KASUS DI MUSEUM BATIK YOGYAKARTA

  

PENGENALAN POLA BATIK YOGYAKARTA MENGGUNAKAN

METODE HIDDEN MARKOV MODELS DENGAN STUDI KASUS

DI MUSEUM BATIK YOGYAKARTA

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Teknik

  

Program Studi Teknik Informatika

Oleh:

Aprina Sulistia Melantika

  

NIM: 065314012

JURUSAN TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

  

THE YOGYAKARTA BATIK PATTERN RECOGNITION

USING HIDDEN MARKOV MODELS METHOD

BY OBSERVATION AT MUSEUM BATIK YOGYAKARTA

A Thesis

Presented as Partial Fulfillment of The Requirements

  

To Obtain the Sarjana Teknik Degree

In Department of Informatics Engineering

By:

Aprina Sulistia Melantika

  

Student ID: 065314012

INFORMATICS ENGINEERING STUDY PROGRAM

  

INFORMATICS ENGINEERING DEPARTMENT

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

HALAMAN PERSEMBAHAN

  

Jangan sekali-kali putus asa,

Tapi jika engkau putus asa juga,

Teruslah bekerja dalam keputusasaan itu…

  

Bila Anda berpikir Anda bisa,maka Anda benar. Bila Anda berpikir Anda t idak

bisa, Anda pun benar… karena it u ket ika seseorang berpikir t idak bisa, maka

sesungguhnya dia t elah membuang kesempat an unt uk menjadi bisa.

  Terima kasih untuk segalanya…

Untuk keluarga tercinta, kakak-kakak dan adekku terima kasih

untuk doa dan dukungan untukku.

Untuk Sahabatku: A tha, Tiara, dan A gnes terima kasih untuk

dukungan dan semangat untukku selama ini.

Untuk semua anak kos Palem, terutama Monic, Intan, Evy, Vica,

Elok terima kasih untuk semangat dan doa kalian.

  

Skripsi ini kupersembahkan untuk:

  ABSTRAK Batik Yogyakarta merupakan salah satu warisan budaya Indonesia, namun

sayangnya sedikit orang yang mengetahui tentang pola batik Yogyakarta. Untuk

memudahkan dalam mengenali pola batik Yogyakarta, maka diperlukan sebuah

alat bantu. Alat bantu ini digunakan untuk mengenali gambar batik Yogyakarta

dan menerjemahkannya ke dalam informasi berupa nama batik Yogyakarta.

  Hidden Markov Models merupakan metode yang banyak digunakan untuk

pengenalan pola karena keberhasilannya dalam menangani variabilitas data.

Hidden Markov Models (HMM) merupakan metode stokastik. HMM memproses

data diskret batik Yogyakarta menjadi sebuah rantai Markov. Rantai ini terdiri

dari banyak state, dengan probabilitas transisi yang menghubungkan state satu

dengan state lainnya.

  Ada 20 jenis batik Yogyakarta yang akan dikenali dan setiap batik dibuat

model dari 25 sampel batik tersebut dengan algoritma Baum-Welch yang mencari

means dan varians dari data sampel yang didapat. Tahap ini merupakan fase pelatihan HMM. Untuk fase pengujian digunakan algoritma Viterbi, dengan mencari angka

kemiripan terbesar dengan cara membandingkan data baru dengan model-model

yang ada. Untuk tahap evaluasi digunakan metode 5-fold cross validation yang

mencari akurasi dari 500 data yang ada.

  Dari hasil penelitian, diperoleh bentuk feature terbaik pengenalan pola batik

Yogyakarta menggunakan HMM adalah rata-rata edge horizontal, dengan akurasi

sebesar 69% pada jumlah state sebanyak 25 state.

  

ABSTRACT

Batik Yogyakarta is one of Indonesia's cultural heritage, but unfortunately

few people know about Yogyakarta batik patterns. To facilitate in identifying

pattern batik of Yogyakarta, then needed a tool. This tool is used to recognize

images of batik of Yogyakarta and translate it into information in the form of a

batik of Yogyakarta.

  Hidden Markov Models are a widely used method for pattern recognition

because of its success in dealing with data variability. Hidden Markov Models

(HMM) is a stochastic method. It process discrete Yogyakarta batik, to be a

sequence of chain called Markov chain. This chain consists of many states, with

state transition probabilities that connect one with another state.

  There are 20 types of batik of Yogyakarta which would be recognized and

each batik made models of 25 samples of batik with Baum-Welch algorithm, the

search for means and variances from sample data obtained. This phase is the

phase of the HMM training.

  For the testing phase used Viterbi algorithm, by finding the largest

similarity numbers by comparing new data with existing models. For the

evaluation phase used the method 5-fold cross validation to find the accuracy of

the 500 available data.

  From the research results, obtained form the best feature of Yogyakarta batik

pattern recognition using the HMM is the average horizontal edge, with an

accuracy of 69% in total as many as 25 state.

KATA PENGANTAR

  Puji syukur kepada Yesus Kristus atas berkat dan karunia yang telah

diberikan sehingga penulis dapat menyelesaikan skripsi dengan judul “Pengenalan

Pola Batik Yogyakarta Menggunakan Metode Hidden Markov Models Dengan

Studi Kasus Di Museum Batik Yogyakarta”.

  Dalam penyusunan skripsi ini, banyak sekali pihak yang telah membantu

penulis, dan pada kesempatan ini penulis ingin mengucapkan terima kasih

sedalam-dalamnya kepada:

  1. Kedua orang tua penulis, Ciu Kim Su dan Cong Mi Mi atas dukungan moral, spiritual, dan financial dalam penyusunan skripsi.

  2. Ibu A. Rita Widiarti, S.Si., M.Kom selaku dosen pembimbing atas segala waktu, saran, bimbingan, dan kesabaran yang telah diberikan.

  3. Drs. C. Kuntoro Adi S.J, M.A, M.S, Ph.D yang telah menjadi pembimbing dan teman diskusi yang sangat membantu.

  4. Mbak Phalita N. Wastu yang telah meluangkan waktu untuk menjelaskan tentang konsep Hidden Markov Models.

  5. Pihak pengelola museum batik yang telah bersedia memberikan data-data batik Yogyakarta.

  6. Teman suka dan dukaku, Yustinus Nugroho yang selalu memberi semangat, saran, dan nasehat yang sangat berguna.

  7. Seluruh civitas akademia Teknik Informatika angkatan 2006 dan pihak-

  DAFTAR ISI

HALAMAN JUDUL BAHASA INDONESIA ...................................................... i

HALAMAN JUDUL BAHASA INGGRIS .......................................................... ii

HALAMAN PERSETUJUAN ............................................................................ iii

HALAMAN PENGESAHAN ............................................................................. iv

HALAMAN PERSEMBAHAN ........................................................................... v

HALAMAN PERNYATAAN KEASLIAN KARYA .......................................... vi

HALAMAN PERSETUJUAN PUBLIKASI ...................................................... vii

ABSTRAK ....................................................................................................... viii

ABSTRACT ....................................................................................................... ix

KATA PENGANTAR ......................................................................................... x

DAFTAR ISI ..................................................................................................... xii

DAFTAR GAMBAR ......................................................................................... xv

DAFTAR TABEL ........................................................................................... xvii

  

I. PENDAHULUAN ............................................................................................ 1

  

1.1 Latar Belakang ............................................................................................... 1

  

1.2 Rumusan Masalah .......................................................................................... 2

  

1.3 Tujuan ........................................................................................................... 2

  

1.4 Batasan Masalah ............................................................................................ 2

  

1.5 Metodologi Penelitian .................................................................................... 4

  

1.6 Sistematika Penulisan .................................................................................... 4

  

II. LANDASAN TEORI ...................................................................................... 6

  

2.1 Batik Yogyakarta ........................................................................................... 6

  

2.2 Feature pada Batik Yogyakarta ...................................................................... 7

  

2.3 Pengenalan Pola ............................................................................................. 9

  

2.4 Metode Hidden Markov Models ................................................................... 11

  

2.4.1 Algoritma Pemodelan Hidden Markov Models .......................................... 13

  

2.4.2 Algoritma training dengan Baum-Welch ................................................... 15

  

2.6 Matlab ......................................................................................................... 18

  

III. ANALISA DAN PERANCANGAN SISTEM ............................................. 20

  

3.1 Perancangan Sistem Secara Umum ............................................................. 20

  

3.1.1 Gambaran Sistem ...................................................................................... 22

  

3.1.2 Perancangan Fase Training Model ............................................................ 23

  

3.1.3 Perancangan Fase Pengenalan ................................................................... 30

  

3.1.4 Perancangan Proses Evaluasi..................................................................... 31

  

3.2 Perancangan Antar Muka ............................................................................. 33

  

3.2.1 Halaman Perancangan Home ..................................................................... 33

  

3.2.2 Halaman Pengenalan Batik........................................................................ 34

  

3.2.4 Halaman Konsep Hidden Markov Models ................................................. 36

  

3.2.5 Halaman Identitas Program ....................................................................... 36

  

3.2.6 Halaman Bantuan Pengenalan ................................................................... 37

  

3.2.7 Halaman Bantuan Pengujian ..................................................................... 38

  

3.3 Kebutuhan Software dan Hardware .............................................................. 38

  

3.4 Algoritma Pembuatan Program .................................................................... 39

  

3.4.1 Modul Ekstraksi Feature ........................................................................... 39

  

3.4.2 Modul pembuatan feature HTK ................................................................. 47

  

3.4.3 Modul pelatihan dengan Baum-Welch ....................................................... 47

  

3.4.4 Modul pengenalan dengan Viterbi ............................................................. 48

  3.4.5 Modul pembuatan confusion matrix dan perhitungan evaluasi 5-fold cross

validation .......................................................................................................... 48

  

IV. IMPLEMENTASI SISTEM ......................................................................... 49

  

4.1 Implementasi Antar Muka yang Digunakan pada Sistem .............................. 49

  

4.1.1. Halaman Utama ....................................................................................... 49

  

4.1.2. Halaman Pengenalan Batik ...................................................................... 50

  

4.1.3. Halaman Pengujian Batik Yogyakarta ..................................................... 52

  

4.1.4. Halaman Konsep HMM .......................................................................... 55

  

4.1.5. Halaman Bantuan .................................................................................... 57

  

5.1.1. Hasil Penelitian Menggunakan Feature Warna dan Edge Information ...... 60

  

5.1.2. Hasil Penelitian Menggunakan Feature Edge Information ........................ 69

  

5.2 Kelebihan dan Kekurangan Metode.............................................................. 77

  

5.2.1 Kelebihan .................................................................................................. 77

  

5.2.2 Kekurangan ............................................................................................... 77

  

VI. KESIMPULAN DAN SARAN .................................................................... 78

  

6.1. Kesimpulan ................................................................................................. 78

  

6.2. Saran ........................................................................................................... 80

DAFTAR PUSTAKA ........................................................................................ 82

LAMPIRAN 1 CODING PROGRAM ............................................................... 84

LAMPIRAN 2 ISI FILE HASIL PROSES HMM ............................................ 122

LAMPIRAN 3 DATA PENELITIAN .............................................................. 149

  DAFTAR GAMBAR

Gambar 2.1 Contoh tiga tipe rantai HMM .......................................................... 13Gambar 2.2 Ilustrasi dari operasi pada Baum-Welch. ......................................... 16Gambar 2.3 Gambaran metode evaluasi 5-fold cross validation ......................... 18Gambar 3.1 Alur Pengenalan Batik Yogyakarta Secara Umum .......................... 21Gambar 3.2 Blok Diagram Sistem ...................................................................... 21Gambar 3.3 Gambaran Umum ........................................................................... 22Gambar 3.4 Tahap Training dan Testing ............................................................ 22Gambar 3.5 Tahap Training ............................................................................... 22Gambar 3.6 Tahap Testing ................................................................................. 22Gambar 3.7. Bentuk-bentuk ekstraksi feature pada fase pengenalan (testing) ..... 29Gambar 3.8. Halaman Home Sistem Pengenal Batik Yogyakarta ....................... 33Gambar 3.9. Halaman Pengenalan Pola Sistem Pengenal Batik Yogyakarta ....... 34Gambar 3.10. Halaman Pengujian HMM ........................................................... 35Gambar 3.11. Halaman Konsep HMM Sistem Pengenal Batik Yogyakarta ........ 36Gambar 3.12. Halaman Identitas Program .......................................................... 36Gambar 3.13. Halaman Bantuan Sistem Pengenal Batik Yogyakarta .................. 37Gambar 3.14. Halaman Bantuan Sistem Pengenal Batik Yogyakarta .................. 38Gambar 4.1 Halaman utama prototipe pengenalan batik Yogyakarta .................. 50Gambar 4.2 Halaman pengenalan batik Yogyakarta ........................................... 50Gambar 4.3 Kotak file selector untuk mengambil gambar .................................. 51Gambar 4.4 Peringatan jika tidak ada file yang dipilih ....................................... 51Gambar 4.5 Halaman pengujian akurasi Hidden Markov Models ....................... 52Gambar 4.6 Peringatan jika terjadi kesalahan input angka state .......................... 53Gambar 4.7 Halaman penjelasan konsep Hidden Markov Models ...................... 55Gambar 4.8 Halaman penjelasan konsep Baum-Welch ....................................... 56Gambar 4.9 Halaman penjelasan konsep Viterbi ................................................ 56Gambar 4.10 Halaman penjelasan konsep 5-fold cross validation ...................... 57Gambar 4.13 Halaman About ............................................................................. 59Gambar 4.14 Halaman About Programmer ........................................................ 59

  

DAFTAR TABEL

Tabel 3.1 Matriks Mean 8 Vektor ...................................................................... 24Tabel 3.2 Confusion Matrix ............................................................................... 32Tabel 5.1. Data angka akurasi feature rata-rata edge vertikal .............................. 61Tabel 5.2. Data angka akurasi feature rata-rata edge horisontal .......................... 62Tabel 5.3. Data angka akurasi feature rata-rata edge vertikal-horisontal ............. 64Tabel 5.4. Data angka akurasi feature rata-rata edge .......................................... 65Tabel 5.5. Data angka akurasi feature warna + rata-rata edge vertikal ................ 66Tabel 5.6. Data angka akurasi feature warna + rata-rata edge horizontal ............ 67Tabel 5.7. Data angka akurasi feature warna + rata-rata edge vertikal-horizontal 69Tabel 5.8. Data angka akurasi feature 1V (vektor vertikal) ................................. 70Tabel 5.9. Data angka akurasi feature 2V (2 vektor vertikal) .............................. 71Tabel 5.10. Data angka akurasi feature 4V (4 vektor vertikal) ............................ 72Tabel 5.11. Data angka akurasi feature 1H (vektor horizontal) ........................... 73Tabel 5.12. Data angka akurasi feature 2H (2 vektor horizontal) ........................ 74Tabel 5.13. Data angka akurasi feature 4H (4 vektor horizontal) ........................ 75Tabel 5.14. Data angka akurasi feature VH (vektor vertikal-horizontal) ............. 76Tabel 6.1 Rangkuman Hasil Percobaan Feature Warna dan Edge ...................... 78Tabel 6.2 Rangkuman Hasil Percobaan Feature Edge ........................................ 79

BAB I PENDAHULUAN

1.1 Latar Belakang

  Batik merupakan warisan budaya bangsa Indonesia. Batik Yogyakarta

adalah salah satu dari batik Indonesia, yang pada awalnya hanya dibuat terbatas

untuk kalangan keraton saja. Batik di Yogyakarta sekarang ini berkembang sangat

pesat. Namun, perkembangan tersebut tidak diimbangi dengan pengetahuan

tentang pola-pola batik Yogyakarta. Hanya sedikit orang yang mengetahui tentang

pola-pola batik, sehingga diperlukan suatu alat bantu untuk menerjemahkan pola

batik ke dalam sebuah informasi.

  Banyak penelitian pengenalan pola dilakukan dengan menggunakan

berbagai metode dan implementasi yang berbeda-beda, seperti metode cavity

features dan neural network untuk mengenali pola tulisan tangan Thai

(Phokharatkul and Kimpan, 1998), metode pendekatan Two Stage Classification

untuk mengenali pola tulisan tangan Tamil (S. Hewavitharana dan H. C.

  Fernando, 2002), dan sebagainya.

  Dari berbagai penelitian yang telah dilakukan, diperoleh sebuah metode

yang cukup baik dan akurat untuk menangani tingginya variabilitas atau

keberagaman kemungkinan tulisan tangan, yaitu metode Hidden Markov Models.

Pada penelitian tulisan tangan huruf Sinhala, HMM memiliki akurasi sebesar

64,3% dan 92,1% (Hewavitharana, Fernando, dan Kodikara), penelitian huruf

  

Thai akurasinya sebesar 81 – 89,3% (Dan Povey dan Roongroj Nopsuwanchai,

2003).

  Sehingga dari data di atas, metode Hidden Markov Models akan digunakan

penulis untuk mengenali pola batik Yogyakarta ini dan untuk menganalisa metode

perhitungan serta pengenalan pola batik tersebut, maka penulis mengambil topik

Pengenalan Pola Batik Yogyakarta Menggunakan Metode Hidden Markov

Models dengan Studi Kasus di Museum Batik Yogyakarta ” disertai dengan

pembangunan sebuah sistem pengenal pola batik dalam sistem komputer.

  1.2 Rumusan Masalah

Dari latar belakang masalah di atas, rumusan masalah pada tugas akhir ini adalah

“Bagaimana secara otomatis mengenal pola batik Yogyakarta menggunakan

metode Hidden Markov Models?” dan “Bagaimana menguji unjuk kerja metode

HMM untuk pengenalan pola batik?”

  1.3 Tujuan

Menganalisa dan mengetahui kelebihan serta kekurangan metode Hidden Markov

Models dalam menangani data citra pola batik Yogyakarta.

  1.4 Batasan Masalah 1. Pola batik yang diteliti adalah pola batik daerah Yogyakarta.

2. Algoritma yang dipakai untuk pengenalan pola batik Yogyakarta adalah

  

3. Pembuatan program hanya sebuah prototipe untuk membantu analisa

algoritma Hidden Markov Models dalam menangani pola batik Yogyakarta.

  4. Ada 20 jenis batik Yogyakarta yang digunakan untuk penelitian ini.

  5. Sampel batik yang digunakan berdasarkan:

a. Citra yang dapat diproses adalah citra bertipe JPG (*.jpg).

  b. Jarak kain batik dengan kamera digital waktu pemotretan data batik adalah sekitar 30 cm.

  c. Foto batik diambil menggunakan kamera digital FujiFilm 10 MP.

  

d. Ukuran gambar yang dapat diproses adalah 200x200 piksel.

  e. Proses cropping yang dilakukan yaitu: dari data batik yang didapat terlebih dahulu di-crop untuk menghilangkan sinar blitz, kemudian meng-crop bagian pola batik yang merupakan ciri dari pola batik tersebut, yang selanjutnya ukuran data pola batik hasil crop diubah menjadi 200x200 piksel.

  

6. Proses ekstraksi feature berdasarkan warna dan edge information. Untuk

ekstraksi feature, data dibagi menjadi beberapa area, yaitu 8 baris dan 8 kolom, sehingga akan terdapat 64 area pengamatan.

  

7. Citra masukan akan mengalami proses edge detection dengan

menggunakan fungsi yang telah disediakan library MATLAB Version 7.1.0.246 (R14) Service Pack 3.

1.5 Metodologi Penelitian

  1. Survei ke museum batik Yogyakarta untuk memperoleh data citra pola batik.

  2. Wawancara kepada ahli budaya di museum batik Yogyakarta mengenai macam-macam pola batik.

  3. Studi literatur, yaitu dengan mempelajari materi dan artikel tentang metode Hidden Markov Models , serta feature study untuk menentukan fitur yang cocok untuk pola batik.

  4. Implementasi, yaitu tahap pelaksanaan yang meliputi pembuatan alat bantu

berupa suatu perangkat lunak untuk memudahkan pengujian pola batik.

  5. Pengujian atau analisa hasil terhadap sistem yang dibuat.

1.6 Sistematika Penulisan

BAB I PENDAHULUAN Berisi latar belakang, rumusan masalah, tujuan, batasan masalah, metodologi penelitian, dan sistematika penulisan. BAB II LANDASAN TEORI Berisi landasan teori yang dipakai untuk pembahasan tugas akhir. BAB III ANALISA DAN PERANCANGAN SISTEM Bab ini berisi analisa dan gambaran umum mengenai perancangan

  sistem yang akan dibangun, yaitu sebuah perangkat lunak yang dapat mengenali pola batik Yogyakarta dan menerjemahkannya ke dalam

BAB IV IMPLEMENTASI SISTEM Berisi implementasi sistem menggunakan metode Hidden Markov Models . BAB V ANALISA HASIL DAN PEMBAHASAN Bab ini berisi analisa hasil dan pembahasan mengenai pengenalan dan pengujian pola batik. BAB VI KESIMPULAN DAN SARAN Bab ini berisi kesimpulan dan saran yang diperoleh dari keseluruhan

  proses pembuatan tugas akhir ini, serta beberapa saran untuk pengembangan sistem lebih lanjut.

BAB II LANDASAN TEORI

2.1 Batik Yogyakarta Batik merupakan warisan budaya yang dewasa ini semakin berkembang.

  

Jika dahulu batik hanya digunakan untuk acara adat, saat ini batik dapat

digunakan di berbagai tempat. Salah satunya adalah batik Yogyakarta yang sudah

dikenal sejak dahulu kala.

  Menurut Sultan Hamengku Buwono X, motif batik Yogyakarta adalah

buatan leluhur sehingga tidak diketahui dengan pasti siapa yang menciptakan

motif-motif tersebut (tempointeraktif.com, 2009). Batik Yogyakarta adalah salah

satu dari batik Indonesia yang pada awalnya dibuat terbatas hanya untuk kalangan

keluarga keraton saja. Setiap motif yang terwujud dalam goresan canting pada

kain batik Yogyakarta sarat akan makna karena memiliki filosofi tersendiri. Hal

inilah yang membedakan batik Yogyakarta dengan batik-batik lain, yang menjaga

batik Yogyakarta tetap memiliki eksklusivitas dari sebuah mahakarya seni dan

budaya Indonesia.

  Batik di Daerah Istimewa Yogyakarta saat ini berkembang dengan pesat.

Tidak kurang dari 400 motif batik khas Yogyakarta yang terdiri dari motif batik

klasik maupun motif batik modern berada di Yogyakarta sehingga Yogya dikenal

dengan sebutan Kota Batik (craft.jogja.com, 2006).

2.2 Feature pada Batik Yogyakarta

  Feature merupakan suatu tanda yang khas, yang membedakan antara satu

gambar dengan gambar yang lain. Feature digunakan untuk menjadi model dalam

Hidden Markov, yang kemudian diekstrak cirinya untuk diolah dalam proses

training dan testing. Ekstraksi feature berupa data batik Yogyakarta belum

memiliki ukuran yang pasti karena belum ada penelitian percobaan Hidden

  

Markov Models dalam menangani data batik. Beberapa feature yang penting pada

gambar adalah warna, edge information, bentuk, dan tekstur. Penulis mencoba

menggunakan feature warna dan edge information dalam penelitian ini yang

diharapkan dapat menjadi pilihan tepat dalam pengenalan pola batik.

  a) Warna Warna pada citra merupakan persepsi yang dirasakan oleh sistem visual

manusia terhadap panjang gelombang cahaya yang dipantulkan oleh obyek.

Warna-warna yang dapat ditangkap oleh mata manusia merupakan kombinasi

cahaya dengan panjang berbeda. Kombinasi yang memberikan rentang warna

paling lebar adalah red (R), green (G) dan blue (B).

  Perhitungan kadar warna berdasarkan atas percobaan yang telah

dilakukan pada penelitian untuk klasifikasi tingkat kematangan tomat merah

menggunakan metode perbandingan kadar warna (Noviyanto, 2009). Untuk

menghitung rata-rata Red ( ), rata-rata Green ( ̅), rata-rata Blue ( ), kadar Red,

kadar Green, kadar Blue, dan rata-rata dari , ̅, dan digunakan rumus:

  ∑ ∑ R = (2.1) G = ∑ ∑

  (2.2) B =

  ∑ ∑ (2.3)

  = ̅

  (2.4) =

  ̅ ̅ (2.5)

  = ̅

  (2.6) RGB =

  ̅ (2.7) di mana

  M = lebar citra (kolom matriks) N = tinggi citra (baris matriks) R ij

  = nilai piksel Red G ij

  = nilai piksel Green B ij = nilai piksel Blue = rata-rata Red ̅ = rata-rata Green = rata-rata Blue

  = rata-rata dari , ̅, dan

b) Edge Information

  Edge (tepi) adalah perubahan nilai intensitas derajat keabuan yang mendadak (besar) dalam jarak yang singkat. Tepi digunakan untuk proses segmentasi dan indentifikasi obyek di dalam citra. Operasi ini bertujuan obyek, yang membatasi suatu wilayah obyek satu dengan yang lainnya. Tujuan lain operasi pendeteksian tepi adalah untuk meningkatkan penampakan garis batas suatu daerah atau objek di dalam citra (Murinto,

  .

  2008)

2.3 Pengenalan Pola

  Pengenalan pola (pattern recognition) sesungguhnya telah lama ada dan

telah mengalami perkembangan terus menerus dimulai dari pengenalan pola

tradisional kemudian menjadi pengenalan pola modern. Pada mulanya pengenalan

pola berbasis pada kemampuan alat indera manusia, di mana manusia mampu

mengingat suatu informasi pola secara menyeluruh hanya berdasarkan sebagian

informasi pola yang tersimpan di dalam ingatannya. Misalnya sebuah nada

pendek yang dibunyikan dapat membuat manusia mengingat sebuah lagu secara

keseluruhan.

  Inti dari pengenalan pola adalah proses pengenalan suatu obyek dengan

menggunakan berbagai metode di mana dalam proses pengenalannya memiliki

tingkat akurasi yang tinggi. Memiliki tingkat akurasi yang tinggi mengandung

pengertian bahwa suatu obyek yang secara manual (oleh manusia) tidak dapat

dikenali tetapi bila menggunakan salah suatu metode pengenalan yang

diaplikasikan pada komputer masih dapat dikenali.

  

Langkah– langkah pengenalan pola citra teks ialah sebagai berikut (Witten, 2005):

1. Data masukan berupa teks disiapkan.

  

2. Pada tahap penginderaan, mesin menginderakan teks dengan sensor

kemudian memasukkan citra hasil pindai itu ke dalam aplikasi pemroses teks. Teks ini masih berupa citra berisi kumpulan piksel yang memiliki data warna RGB (Red – Green – Blue).

  

3. Setelah citra ditangkap dengan sensor, maka citra tersebut dikenai

langkah-langkah pre-processing, yaitu tahapan yang dilalui untuk memisahkan obyek dari berbagai derau dan menjadikan obyek ini siap untuk diklasifikasikan. Seperti ketika manusia menginderakan sesuatu,

maka ia akan berkonsentrasi pada obyek utama. Pre-processing meliputi:

   Konversi dari citra berwarna (Red-Green-Blue/ RGB) menjadi citra

  hitam putih yang memiliki matriks informasi warna 0 dan 1 (biner) saja. Hal ini disebut dengan proses binarisasi citra.

   Pada tahap koreksi kemiringan, citra biner dibuat menjadi lurus

  sejajar dengan sumbu x. Hal ini dilakukan untuk memperbesar akurasi dan menghindari kegagalan pengenalan karena citra yang miring.

   Pada tahap normalisasi, citra dibuat menjadi tipis. Citra ditipiskan

  dengan metode thinning atau skeletonization untuk mendapatkan garis kerangka dari tiap karakter. Normalisasi ini dapat juga dilengkapi dengan proses penghilangan derau, yaitu tahap menghilangkan piksel-piksel yang tidak diperlukan ketika tahap pengenalan. Selain milik obyek utama, piksel lainnya dihilangkan.

   Kemudian citra dikenai segmentasi, yaitu langkah pemisahan citra

  utama dari latar belakang yang tidak memiliki andil dalam langkah

pengenalan, serta pemisahan karakter per karakter.

  4. Ekstraksi feature merupakan langkah pemilihan ciri yang ingin diidentifikasi dari citra aksara yang telah dikenai proses pre-processing.

  5. Tahap klasifikasi citra merupakan tahap utama dalam pengenalan pola.

  Klasifikasi ini bisa berdasarkan unsupervised maupun supervised learning.

  Unsupervised learning berarti kategori tercipta dengan sendirinya sesuai dengan feature yang ditangkap, sedangkan supervised learning berarti sudah ada batas-batas pengetahuan untuk menentukan kelas dari obyek yang ditangkap. Pada tahap ini, feature dibandingkan kemiripannya dengan model yang sudah diketahui oleh mesin.

  6. Post processing merupakan tahap analisa terhadap hasil klasifikasi.

  Beberapa proses dalam tahap ini antara lain penghitungan jumlah kesalahan untuk menentukan akurasi, penghitungan resiko, analisa konteks, dan multiple classifier.

  7. Tahap terakhir ialah mendapatkan output berupa pengenalan tulisan, sehingga keputusan dapat diambil dari hasil pengenalan ini.

2.4 Metode Hidden Markov Models

  Metode Hidden Markov Model mulai diperkenalkan dan dipelajari pada

akhir tahun 1960, metode yang berupa model statistik dari rantai Markov ini

  

recognition (speech, face, handwriting), seperti dijelaskan oleh Lawrence R.

Rabiner dalam laporannya yang berjudul “A Tutorial on Hidden Markov Models

and Selected Applications in Speech Recognition”. Pada beberapa penelitian,

sudah dicobakan metode Hidden Markov Models untuk pengenalan pola berupa

citra.

  Hidden Markov Model (HMM) adalah sebuah model statistik dari sebuah

sistem yang diasumsikan dari rantai Markov dengan parameter yang tak diketahui,

dan tantangannya adalah menentukan parameter-parameter tersembunyi (hidden)

dari parameter-parameter yang dapat diamati (Przytycka, 2005). Parameter-

parameter yang ditentukan kemudian dapat digunakan untuk analisis yang lebih

jauh dalam pengenalan pola. Disebut statistik karena HMM mencari means,

varians , dan probabilitas dari model yang dimasukkan.

  HMM didefinisikan sebagai kumpulan lima parameter (N, M, A, B, π). Jika dianggap λ = {A, B, π} maka HMM mempunyai parameter tertentu N dan M. Ciri-ciri HMM adalah:

   Observasi diketahui tetapi urutan state tidak diketahui sehingga disebut hidden.

   Observasi adalah fungsi probabilitas state.  Perpindahan state adalah dalam bentuk probabilitas. HMM digunakan untuk pembuatan model yang digunakan ketika proses

training , maupun proses testing. Permodelan ini dapat berupa model kontinu

untuk data yang berlanjut seiring jalannya waktu, seperti data suara. Beberapa

  

data lainnya menggunakan permodelan Hidden Markov diskret, seperti data

berupa citra batik yang selanjutnya diterapkan dalam penelitian ini.

  Langkah-langkah dalam permodelan Hidden Markov mencakup langkah

ekstraksi feature hingga testing, yang dijelaskan secara kronologis pada sub bab

selanjutnya.

2.4.1 Algoritma Pemodelan Hidden Markov Models

  Setelah feature didapatkan, maka permodelan Hidden Markov dapat

dibangkitkan. Dari data feature diskret, dapat dibuat sebuah rangkaian state

dengan angka probabilitas transisi sebagai penghubungnya. Bentuk lengkap

model HMM ialah berupa state-state yang saling berhubungan, yang mana tiap

state terhubung dari state mana pun.

Gambar 2.1 Contoh tiga tipe rantai HMM Algoritma Hidden Markov Models dibangkitkan dari beberapa parameter, yaitu (Rabiner, 1989): (2.9) λ = ( A, B, π )

  Permodelan dengan parameter di atas dapat dijelaskan sebagai berikut:

1. Terdapat sebuah parameter N, yaitu banyaknya state untuk model. Setiap

  state dinotasikan sebagai S = { S 1 , S 2 , S 3 , ..., S N } dan state pada waktu t ialah q . t

  2. M, banyaknya simbol observasi tiap state. Simbol observasi berhubungan dengan keluaran fisik dari sistem yang dimodelkan. Dinotasikan sebagai V= { V 1 , V 2 , V 3 , ..., V M }.

  3. Matriks transisi probabilitas A = {a ij }, di mana a ij = P(q t+1 = S j | q t = S i ), 1 < i, j < N (2.10) dan dengan syarat a > 0 dan a = 1 ij ∑

  4. Simbol distribusi probabilitas pada state j, B = { bj(k) } di mana b j (k) = P ( V k pada t | q t = S j ), 1 < j < N (2.11) 1 < k < M.

  5. Inisialisasi distribusi state i } di mana π = { π i = P ( q i = S j ), 1 < i < N (2.13)

  π Dengan nilai-nilai yang tepat untuk variabel N, M, A, B dan π, maka O = O

1 O

  2 O 3 ... O t (2.14)

di mana untuk setiap observasi Ot ialah satu dari simbol yang ada pada V, dan T

adalah banyaknya observasi yang ada pada sekuens tersebut.

2.4.2 Algoritma training dengan Baum-Welch

  Masalah utama dalam HMM adalah mengatur parameter model

λ={A,B,π} agar probabilitas urutan observasi yaitu P(O|λ) menjadi maksimal.

  Parameter model λ={A,B, π} yang memaksimalkan P(O|λ) dapat dicari dengan

prosedur iterasi yaitu dengan metode EM (Expectation Modification) atau

algoritma forward-backward atau sering disebut dengan metode Baum Welch.

  

Diasumsikan keluaran observasi (O) adalah korespondensi 1 – 1 dengan keadaan

(Q) sehingga parameter HMM menjadi tidak tersembunyi lagi.

  Variabel forward didefinisikan sebagai observasi parsial dari probabilitas

state sekuen yang dilambangkan dengan O1 , O2 ,…,Ot (hingga waktu t) dan state

Si pada waktu t

  , dengan model λ, dan α sebagai t(i). Sedangkan variabel backward

didefinisikan sebagai observasi parsial dari probabilitas state sekuen dari t+1 ke

state sebelumnya, di mana terdapat state Si pada waktu t , dengan model λ, dan α sebagai t(i). Observasi dari probabilitas state sekuen ini dihitung dengan rumus: (2.15)

  Probabilitas pada saat berada pada state Si pada waktu t, dan diberikan sekuens observasi O , dan model λ, ialah: (2.16)

  (a) (b)

Gambar 2.2 Ilustrasi dari operasi pada Baum-Welch.

(a) variabel forward . (b)variabel backward .

Untuk menghitung model HMM dari kelas yang diberikan, maka kita akan

membutuhkan banyak sampel data dari kelas ini untuk dimodelkan. Karakteristik

dari setiap contoh ini kemudian diekstrak dan disimpan dalam sebuah parameter

vektor sekuens xt. Parameter ini yang dipetakan sebagai ekuivalensi dari Ot.

  Cara kerja metode Baum-Welch: 1. Estimasikan sebuah model HMM sebagai .

2. Dengan nilai λ dan sekuens observasi O, hitung sebuah model baru

  | ( | )

  <

3. Jika menghasilkan , maka hentikan langkah

  ℎ ℎ ( | ) ini. Jika tidak, maka letakkan nilai untuk menggantikan λ dan ulangi langkah 1.

2.4.3 Algoritma testing dengan Viterbi

   q ... q } Algoritma Viterbi digunakan untuk menghitung sekuens state Q={q

  1

  2 T ,

yang paling dekat probabilitasnya dari sebuah sekuens observasi O={O O ... O }

  1

  2 T yang didefinisikan sebagai:

  ( ) = max [ … = , … | ] (2.17)

, ,…, λ

  ( )

  merupakan nilai probabilitas terbaik pada waktu t, yang dihitung pada observasi t pertama dan diakhiri pada state S i .

2.5 Metode Evaluasi 5-Fold Cross Validation

  Tingkat akurasi sebuah sistem pengenalan pol dapat diukur dengan metode

pengukuran 5-fold cross validation yang membagi tiap kelompok batik menjadi