PENGENALAN POLA BATIK YOGYAKARTA MENGGUNAKAN METODE HIDDEN MARKOV MODELS DENGAN STUDI KASUS DI MUSEUM BATIK YOGYAKARTA
PENGENALAN POLA BATIK YOGYAKARTA MENGGUNAKAN
METODE HIDDEN MARKOV MODELS DENGAN STUDI KASUS
DI MUSEUM BATIK YOGYAKARTA
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Teknik
Program Studi Teknik Informatika
Oleh:
Aprina Sulistia Melantika
NIM: 065314012
JURUSAN TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
THE YOGYAKARTA BATIK PATTERN RECOGNITION
USING HIDDEN MARKOV MODELS METHOD
BY OBSERVATION AT MUSEUM BATIK YOGYAKARTA
A Thesis
Presented as Partial Fulfillment of The Requirements
To Obtain the Sarjana Teknik Degree
In Department of Informatics Engineering
By:
Aprina Sulistia Melantika
Student ID: 065314012
INFORMATICS ENGINEERING STUDY PROGRAM
INFORMATICS ENGINEERING DEPARTMENT
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
HALAMAN PERSEMBAHAN
Jangan sekali-kali putus asa,
Tapi jika engkau putus asa juga,
Teruslah bekerja dalam keputusasaan itu…
Bila Anda berpikir Anda bisa,maka Anda benar. Bila Anda berpikir Anda t idak
bisa, Anda pun benar… karena it u ket ika seseorang berpikir t idak bisa, maka
sesungguhnya dia t elah membuang kesempat an unt uk menjadi bisa.
Terima kasih untuk segalanya…
Untuk keluarga tercinta, kakak-kakak dan adekku terima kasih
untuk doa dan dukungan untukku.Untuk Sahabatku: A tha, Tiara, dan A gnes terima kasih untuk
dukungan dan semangat untukku selama ini.Untuk semua anak kos Palem, terutama Monic, Intan, Evy, Vica,
Elok terima kasih untuk semangat dan doa kalian.
Skripsi ini kupersembahkan untuk:
ABSTRAK Batik Yogyakarta merupakan salah satu warisan budaya Indonesia, namun
sayangnya sedikit orang yang mengetahui tentang pola batik Yogyakarta. Untuk
memudahkan dalam mengenali pola batik Yogyakarta, maka diperlukan sebuah
alat bantu. Alat bantu ini digunakan untuk mengenali gambar batik Yogyakarta
dan menerjemahkannya ke dalam informasi berupa nama batik Yogyakarta.Hidden Markov Models merupakan metode yang banyak digunakan untuk
pengenalan pola karena keberhasilannya dalam menangani variabilitas data.
Hidden Markov Models (HMM) merupakan metode stokastik. HMM memproses
data diskret batik Yogyakarta menjadi sebuah rantai Markov. Rantai ini terdiri
dari banyak state, dengan probabilitas transisi yang menghubungkan state satu
dengan state lainnya.Ada 20 jenis batik Yogyakarta yang akan dikenali dan setiap batik dibuat
model dari 25 sampel batik tersebut dengan algoritma Baum-Welch yang mencari
means dan varians dari data sampel yang didapat. Tahap ini merupakan fase pelatihan HMM. Untuk fase pengujian digunakan algoritma Viterbi, dengan mencari angkakemiripan terbesar dengan cara membandingkan data baru dengan model-model
yang ada. Untuk tahap evaluasi digunakan metode 5-fold cross validation yang
mencari akurasi dari 500 data yang ada.Dari hasil penelitian, diperoleh bentuk feature terbaik pengenalan pola batik
Yogyakarta menggunakan HMM adalah rata-rata edge horizontal, dengan akurasi
sebesar 69% pada jumlah state sebanyak 25 state.
ABSTRACT
Batik Yogyakarta is one of Indonesia's cultural heritage, but unfortunatelyfew people know about Yogyakarta batik patterns. To facilitate in identifying
pattern batik of Yogyakarta, then needed a tool. This tool is used to recognize
images of batik of Yogyakarta and translate it into information in the form of a
batik of Yogyakarta.Hidden Markov Models are a widely used method for pattern recognition
because of its success in dealing with data variability. Hidden Markov Models
(HMM) is a stochastic method. It process discrete Yogyakarta batik, to be a
sequence of chain called Markov chain. This chain consists of many states, with
state transition probabilities that connect one with another state.There are 20 types of batik of Yogyakarta which would be recognized and
each batik made models of 25 samples of batik with Baum-Welch algorithm, the
search for means and variances from sample data obtained. This phase is the
phase of the HMM training.For the testing phase used Viterbi algorithm, by finding the largest
similarity numbers by comparing new data with existing models. For the
evaluation phase used the method 5-fold cross validation to find the accuracy of
the 500 available data.From the research results, obtained form the best feature of Yogyakarta batik
pattern recognition using the HMM is the average horizontal edge, with an
accuracy of 69% in total as many as 25 state.KATA PENGANTAR
Puji syukur kepada Yesus Kristus atas berkat dan karunia yang telah
diberikan sehingga penulis dapat menyelesaikan skripsi dengan judul “Pengenalan
Pola Batik Yogyakarta Menggunakan Metode Hidden Markov Models Dengan
Studi Kasus Di Museum Batik Yogyakarta”.Dalam penyusunan skripsi ini, banyak sekali pihak yang telah membantu
penulis, dan pada kesempatan ini penulis ingin mengucapkan terima kasih
sedalam-dalamnya kepada:1. Kedua orang tua penulis, Ciu Kim Su dan Cong Mi Mi atas dukungan moral, spiritual, dan financial dalam penyusunan skripsi.
2. Ibu A. Rita Widiarti, S.Si., M.Kom selaku dosen pembimbing atas segala waktu, saran, bimbingan, dan kesabaran yang telah diberikan.
3. Drs. C. Kuntoro Adi S.J, M.A, M.S, Ph.D yang telah menjadi pembimbing dan teman diskusi yang sangat membantu.
4. Mbak Phalita N. Wastu yang telah meluangkan waktu untuk menjelaskan tentang konsep Hidden Markov Models.
5. Pihak pengelola museum batik yang telah bersedia memberikan data-data batik Yogyakarta.
6. Teman suka dan dukaku, Yustinus Nugroho yang selalu memberi semangat, saran, dan nasehat yang sangat berguna.
7. Seluruh civitas akademia Teknik Informatika angkatan 2006 dan pihak-
DAFTAR ISI
HALAMAN JUDUL BAHASA INDONESIA ...................................................... i
HALAMAN JUDUL BAHASA INGGRIS .......................................................... ii
HALAMAN PERSETUJUAN ............................................................................ iii
HALAMAN PENGESAHAN ............................................................................. iv
HALAMAN PERSEMBAHAN ........................................................................... v
HALAMAN PERNYATAAN KEASLIAN KARYA .......................................... vi
HALAMAN PERSETUJUAN PUBLIKASI ...................................................... vii
ABSTRAK ....................................................................................................... viii
ABSTRACT ....................................................................................................... ix
KATA PENGANTAR ......................................................................................... x
DAFTAR ISI ..................................................................................................... xii
DAFTAR GAMBAR ......................................................................................... xv
DAFTAR TABEL ........................................................................................... xvii
I. PENDAHULUAN ............................................................................................ 1
1.1 Latar Belakang ............................................................................................... 1
1.2 Rumusan Masalah .......................................................................................... 2
1.3 Tujuan ........................................................................................................... 2
1.4 Batasan Masalah ............................................................................................ 2
1.5 Metodologi Penelitian .................................................................................... 4
1.6 Sistematika Penulisan .................................................................................... 4
II. LANDASAN TEORI ...................................................................................... 6
2.1 Batik Yogyakarta ........................................................................................... 6
2.2 Feature pada Batik Yogyakarta ...................................................................... 7
2.3 Pengenalan Pola ............................................................................................. 9
2.4 Metode Hidden Markov Models ................................................................... 11
2.4.1 Algoritma Pemodelan Hidden Markov Models .......................................... 13
2.4.2 Algoritma training dengan Baum-Welch ................................................... 15
2.6 Matlab ......................................................................................................... 18
III. ANALISA DAN PERANCANGAN SISTEM ............................................. 20
3.1 Perancangan Sistem Secara Umum ............................................................. 20
3.1.1 Gambaran Sistem ...................................................................................... 22
3.1.2 Perancangan Fase Training Model ............................................................ 23
3.1.3 Perancangan Fase Pengenalan ................................................................... 30
3.1.4 Perancangan Proses Evaluasi..................................................................... 31
3.2 Perancangan Antar Muka ............................................................................. 33
3.2.1 Halaman Perancangan Home ..................................................................... 33
3.2.2 Halaman Pengenalan Batik........................................................................ 34
3.2.4 Halaman Konsep Hidden Markov Models ................................................. 36
3.2.5 Halaman Identitas Program ....................................................................... 36
3.2.6 Halaman Bantuan Pengenalan ................................................................... 37
3.2.7 Halaman Bantuan Pengujian ..................................................................... 38
3.3 Kebutuhan Software dan Hardware .............................................................. 38
3.4 Algoritma Pembuatan Program .................................................................... 39
3.4.1 Modul Ekstraksi Feature ........................................................................... 39
3.4.2 Modul pembuatan feature HTK ................................................................. 47
3.4.3 Modul pelatihan dengan Baum-Welch ....................................................... 47
3.4.4 Modul pengenalan dengan Viterbi ............................................................. 48
3.4.5 Modul pembuatan confusion matrix dan perhitungan evaluasi 5-fold cross
validation .......................................................................................................... 48
IV. IMPLEMENTASI SISTEM ......................................................................... 49
4.1 Implementasi Antar Muka yang Digunakan pada Sistem .............................. 49
4.1.1. Halaman Utama ....................................................................................... 49
4.1.2. Halaman Pengenalan Batik ...................................................................... 50
4.1.3. Halaman Pengujian Batik Yogyakarta ..................................................... 52
4.1.4. Halaman Konsep HMM .......................................................................... 55
4.1.5. Halaman Bantuan .................................................................................... 57
5.1.1. Hasil Penelitian Menggunakan Feature Warna dan Edge Information ...... 60
5.1.2. Hasil Penelitian Menggunakan Feature Edge Information ........................ 69
5.2 Kelebihan dan Kekurangan Metode.............................................................. 77
5.2.1 Kelebihan .................................................................................................. 77
5.2.2 Kekurangan ............................................................................................... 77
VI. KESIMPULAN DAN SARAN .................................................................... 78
6.1. Kesimpulan ................................................................................................. 78
6.2. Saran ........................................................................................................... 80
DAFTAR PUSTAKA ........................................................................................ 82
LAMPIRAN 1 CODING PROGRAM ............................................................... 84
LAMPIRAN 2 ISI FILE HASIL PROSES HMM ............................................ 122
LAMPIRAN 3 DATA PENELITIAN .............................................................. 149
DAFTAR GAMBAR
Gambar 2.1 Contoh tiga tipe rantai HMM .......................................................... 13Gambar 2.2 Ilustrasi dari operasi pada Baum-Welch. ......................................... 16Gambar 2.3 Gambaran metode evaluasi 5-fold cross validation ......................... 18Gambar 3.1 Alur Pengenalan Batik Yogyakarta Secara Umum .......................... 21Gambar 3.2 Blok Diagram Sistem ...................................................................... 21Gambar 3.3 Gambaran Umum ........................................................................... 22Gambar 3.4 Tahap Training dan Testing ............................................................ 22Gambar 3.5 Tahap Training ............................................................................... 22Gambar 3.6 Tahap Testing ................................................................................. 22Gambar 3.7. Bentuk-bentuk ekstraksi feature pada fase pengenalan (testing) ..... 29Gambar 3.8. Halaman Home Sistem Pengenal Batik Yogyakarta ....................... 33Gambar 3.9. Halaman Pengenalan Pola Sistem Pengenal Batik Yogyakarta ....... 34Gambar 3.10. Halaman Pengujian HMM ........................................................... 35Gambar 3.11. Halaman Konsep HMM Sistem Pengenal Batik Yogyakarta ........ 36Gambar 3.12. Halaman Identitas Program .......................................................... 36Gambar 3.13. Halaman Bantuan Sistem Pengenal Batik Yogyakarta .................. 37Gambar 3.14. Halaman Bantuan Sistem Pengenal Batik Yogyakarta .................. 38Gambar 4.1 Halaman utama prototipe pengenalan batik Yogyakarta .................. 50Gambar 4.2 Halaman pengenalan batik Yogyakarta ........................................... 50Gambar 4.3 Kotak file selector untuk mengambil gambar .................................. 51Gambar 4.4 Peringatan jika tidak ada file yang dipilih ....................................... 51Gambar 4.5 Halaman pengujian akurasi Hidden Markov Models ....................... 52Gambar 4.6 Peringatan jika terjadi kesalahan input angka state .......................... 53Gambar 4.7 Halaman penjelasan konsep Hidden Markov Models ...................... 55Gambar 4.8 Halaman penjelasan konsep Baum-Welch ....................................... 56Gambar 4.9 Halaman penjelasan konsep Viterbi ................................................ 56Gambar 4.10 Halaman penjelasan konsep 5-fold cross validation ...................... 57Gambar 4.13 Halaman About ............................................................................. 59Gambar 4.14 Halaman About Programmer ........................................................ 59
DAFTAR TABEL
Tabel 3.1 Matriks Mean 8 Vektor ...................................................................... 24Tabel 3.2 Confusion Matrix ............................................................................... 32Tabel 5.1. Data angka akurasi feature rata-rata edge vertikal .............................. 61Tabel 5.2. Data angka akurasi feature rata-rata edge horisontal .......................... 62Tabel 5.3. Data angka akurasi feature rata-rata edge vertikal-horisontal ............. 64Tabel 5.4. Data angka akurasi feature rata-rata edge .......................................... 65Tabel 5.5. Data angka akurasi feature warna + rata-rata edge vertikal ................ 66Tabel 5.6. Data angka akurasi feature warna + rata-rata edge horizontal ............ 67Tabel 5.7. Data angka akurasi feature warna + rata-rata edge vertikal-horizontal 69Tabel 5.8. Data angka akurasi feature 1V (vektor vertikal) ................................. 70Tabel 5.9. Data angka akurasi feature 2V (2 vektor vertikal) .............................. 71Tabel 5.10. Data angka akurasi feature 4V (4 vektor vertikal) ............................ 72Tabel 5.11. Data angka akurasi feature 1H (vektor horizontal) ........................... 73Tabel 5.12. Data angka akurasi feature 2H (2 vektor horizontal) ........................ 74Tabel 5.13. Data angka akurasi feature 4H (4 vektor horizontal) ........................ 75Tabel 5.14. Data angka akurasi feature VH (vektor vertikal-horizontal) ............. 76Tabel 6.1 Rangkuman Hasil Percobaan Feature Warna dan Edge ...................... 78Tabel 6.2 Rangkuman Hasil Percobaan Feature Edge ........................................ 79BAB I PENDAHULUAN
1.1 Latar Belakang
Batik merupakan warisan budaya bangsa Indonesia. Batik Yogyakarta
adalah salah satu dari batik Indonesia, yang pada awalnya hanya dibuat terbatas
untuk kalangan keraton saja. Batik di Yogyakarta sekarang ini berkembang sangat
pesat. Namun, perkembangan tersebut tidak diimbangi dengan pengetahuan
tentang pola-pola batik Yogyakarta. Hanya sedikit orang yang mengetahui tentang
pola-pola batik, sehingga diperlukan suatu alat bantu untuk menerjemahkan pola
batik ke dalam sebuah informasi.Banyak penelitian pengenalan pola dilakukan dengan menggunakan
berbagai metode dan implementasi yang berbeda-beda, seperti metode cavity
features dan neural network untuk mengenali pola tulisan tangan Thai
(Phokharatkul and Kimpan, 1998), metode pendekatan Two Stage Classification
untuk mengenali pola tulisan tangan Tamil (S. Hewavitharana dan H. C.
Fernando, 2002), dan sebagainya.
Dari berbagai penelitian yang telah dilakukan, diperoleh sebuah metode
yang cukup baik dan akurat untuk menangani tingginya variabilitas atau
keberagaman kemungkinan tulisan tangan, yaitu metode Hidden Markov Models.
Pada penelitian tulisan tangan huruf Sinhala, HMM memiliki akurasi sebesar
64,3% dan 92,1% (Hewavitharana, Fernando, dan Kodikara), penelitian huruf
Thai akurasinya sebesar 81 – 89,3% (Dan Povey dan Roongroj Nopsuwanchai,
2003).Sehingga dari data di atas, metode Hidden Markov Models akan digunakan
penulis untuk mengenali pola batik Yogyakarta ini dan untuk menganalisa metode
perhitungan serta pengenalan pola batik tersebut, maka penulis mengambil topik
“Pengenalan Pola Batik Yogyakarta Menggunakan Metode Hidden Markov
Models dengan Studi Kasus di Museum Batik Yogyakarta ” disertai dengan
pembangunan sebuah sistem pengenal pola batik dalam sistem komputer.1.2 Rumusan Masalah
Dari latar belakang masalah di atas, rumusan masalah pada tugas akhir ini adalah
“Bagaimana secara otomatis mengenal pola batik Yogyakarta menggunakan
metode Hidden Markov Models?” dan “Bagaimana menguji unjuk kerja metode
HMM untuk pengenalan pola batik?”1.3 Tujuan
Menganalisa dan mengetahui kelebihan serta kekurangan metode Hidden Markov
Models dalam menangani data citra pola batik Yogyakarta.1.4 Batasan Masalah 1. Pola batik yang diteliti adalah pola batik daerah Yogyakarta.
2. Algoritma yang dipakai untuk pengenalan pola batik Yogyakarta adalah
3. Pembuatan program hanya sebuah prototipe untuk membantu analisa
algoritma Hidden Markov Models dalam menangani pola batik Yogyakarta.4. Ada 20 jenis batik Yogyakarta yang digunakan untuk penelitian ini.
5. Sampel batik yang digunakan berdasarkan:
a. Citra yang dapat diproses adalah citra bertipe JPG (*.jpg).
b. Jarak kain batik dengan kamera digital waktu pemotretan data batik adalah sekitar 30 cm.
c. Foto batik diambil menggunakan kamera digital FujiFilm 10 MP.
d. Ukuran gambar yang dapat diproses adalah 200x200 piksel.
e. Proses cropping yang dilakukan yaitu: dari data batik yang didapat terlebih dahulu di-crop untuk menghilangkan sinar blitz, kemudian meng-crop bagian pola batik yang merupakan ciri dari pola batik tersebut, yang selanjutnya ukuran data pola batik hasil crop diubah menjadi 200x200 piksel.
6. Proses ekstraksi feature berdasarkan warna dan edge information. Untuk
ekstraksi feature, data dibagi menjadi beberapa area, yaitu 8 baris dan 8 kolom, sehingga akan terdapat 64 area pengamatan.
7. Citra masukan akan mengalami proses edge detection dengan
menggunakan fungsi yang telah disediakan library MATLAB Version 7.1.0.246 (R14) Service Pack 3.1.5 Metodologi Penelitian
1. Survei ke museum batik Yogyakarta untuk memperoleh data citra pola batik.
2. Wawancara kepada ahli budaya di museum batik Yogyakarta mengenai macam-macam pola batik.
3. Studi literatur, yaitu dengan mempelajari materi dan artikel tentang metode Hidden Markov Models , serta feature study untuk menentukan fitur yang cocok untuk pola batik.
4. Implementasi, yaitu tahap pelaksanaan yang meliputi pembuatan alat bantu
berupa suatu perangkat lunak untuk memudahkan pengujian pola batik.
5. Pengujian atau analisa hasil terhadap sistem yang dibuat.
1.6 Sistematika Penulisan
BAB I PENDAHULUAN Berisi latar belakang, rumusan masalah, tujuan, batasan masalah, metodologi penelitian, dan sistematika penulisan. BAB II LANDASAN TEORI Berisi landasan teori yang dipakai untuk pembahasan tugas akhir. BAB III ANALISA DAN PERANCANGAN SISTEM Bab ini berisi analisa dan gambaran umum mengenai perancangan
sistem yang akan dibangun, yaitu sebuah perangkat lunak yang dapat mengenali pola batik Yogyakarta dan menerjemahkannya ke dalam
BAB IV IMPLEMENTASI SISTEM Berisi implementasi sistem menggunakan metode Hidden Markov Models . BAB V ANALISA HASIL DAN PEMBAHASAN Bab ini berisi analisa hasil dan pembahasan mengenai pengenalan dan pengujian pola batik. BAB VI KESIMPULAN DAN SARAN Bab ini berisi kesimpulan dan saran yang diperoleh dari keseluruhan
proses pembuatan tugas akhir ini, serta beberapa saran untuk pengembangan sistem lebih lanjut.
BAB II LANDASAN TEORI
2.1 Batik Yogyakarta Batik merupakan warisan budaya yang dewasa ini semakin berkembang.
Jika dahulu batik hanya digunakan untuk acara adat, saat ini batik dapat
digunakan di berbagai tempat. Salah satunya adalah batik Yogyakarta yang sudah
dikenal sejak dahulu kala.Menurut Sultan Hamengku Buwono X, motif batik Yogyakarta adalah
buatan leluhur sehingga tidak diketahui dengan pasti siapa yang menciptakan
motif-motif tersebut (tempointeraktif.com, 2009). Batik Yogyakarta adalah salah
satu dari batik Indonesia yang pada awalnya dibuat terbatas hanya untuk kalangan
keluarga keraton saja. Setiap motif yang terwujud dalam goresan canting pada
kain batik Yogyakarta sarat akan makna karena memiliki filosofi tersendiri. Hal
inilah yang membedakan batik Yogyakarta dengan batik-batik lain, yang menjaga
batik Yogyakarta tetap memiliki eksklusivitas dari sebuah mahakarya seni dan
budaya Indonesia.Batik di Daerah Istimewa Yogyakarta saat ini berkembang dengan pesat.
Tidak kurang dari 400 motif batik khas Yogyakarta yang terdiri dari motif batik
klasik maupun motif batik modern berada di Yogyakarta sehingga Yogya dikenal
dengan sebutan Kota Batik (craft.jogja.com, 2006).2.2 Feature pada Batik Yogyakarta
Feature merupakan suatu tanda yang khas, yang membedakan antara satu
gambar dengan gambar yang lain. Feature digunakan untuk menjadi model dalam
Hidden Markov, yang kemudian diekstrak cirinya untuk diolah dalam proses
training dan testing. Ekstraksi feature berupa data batik Yogyakarta belummemiliki ukuran yang pasti karena belum ada penelitian percobaan Hidden
Markov Models dalam menangani data batik. Beberapa feature yang penting pada
gambar adalah warna, edge information, bentuk, dan tekstur. Penulis mencoba
menggunakan feature warna dan edge information dalam penelitian ini yang
diharapkan dapat menjadi pilihan tepat dalam pengenalan pola batik.a) Warna Warna pada citra merupakan persepsi yang dirasakan oleh sistem visual
manusia terhadap panjang gelombang cahaya yang dipantulkan oleh obyek.
Warna-warna yang dapat ditangkap oleh mata manusia merupakan kombinasi
cahaya dengan panjang berbeda. Kombinasi yang memberikan rentang warna
paling lebar adalah red (R), green (G) dan blue (B).Perhitungan kadar warna berdasarkan atas percobaan yang telah
dilakukan pada penelitian untuk klasifikasi tingkat kematangan tomat merah
menggunakan metode perbandingan kadar warna (Noviyanto, 2009). Untuk
menghitung rata-rata Red ( ), rata-rata Green ( ̅), rata-rata Blue ( ), kadar Red,
kadar Green, kadar Blue, dan rata-rata dari , ̅, dan digunakan rumus:∑ ∑ R = (2.1) G = ∑ ∑
(2.2) B =
∑ ∑ (2.3)
= ̅
(2.4) =
̅ ̅ (2.5)
= ̅
(2.6) RGB =
̅ (2.7) di mana
M = lebar citra (kolom matriks) N = tinggi citra (baris matriks) R ij
= nilai piksel Red G ij
= nilai piksel Green B ij = nilai piksel Blue = rata-rata Red ̅ = rata-rata Green = rata-rata Blue
= rata-rata dari , ̅, dan
b) Edge Information
Edge (tepi) adalah perubahan nilai intensitas derajat keabuan yang mendadak (besar) dalam jarak yang singkat. Tepi digunakan untuk proses segmentasi dan indentifikasi obyek di dalam citra. Operasi ini bertujuan obyek, yang membatasi suatu wilayah obyek satu dengan yang lainnya. Tujuan lain operasi pendeteksian tepi adalah untuk meningkatkan penampakan garis batas suatu daerah atau objek di dalam citra (Murinto,
.
2008)
2.3 Pengenalan Pola
Pengenalan pola (pattern recognition) sesungguhnya telah lama ada dan
telah mengalami perkembangan terus menerus dimulai dari pengenalan pola
tradisional kemudian menjadi pengenalan pola modern. Pada mulanya pengenalan
pola berbasis pada kemampuan alat indera manusia, di mana manusia mampu
mengingat suatu informasi pola secara menyeluruh hanya berdasarkan sebagian
informasi pola yang tersimpan di dalam ingatannya. Misalnya sebuah nada
pendek yang dibunyikan dapat membuat manusia mengingat sebuah lagu secara
keseluruhan.Inti dari pengenalan pola adalah proses pengenalan suatu obyek dengan
menggunakan berbagai metode di mana dalam proses pengenalannya memiliki
tingkat akurasi yang tinggi. Memiliki tingkat akurasi yang tinggi mengandung
pengertian bahwa suatu obyek yang secara manual (oleh manusia) tidak dapat
dikenali tetapi bila menggunakan salah suatu metode pengenalan yang
diaplikasikan pada komputer masih dapat dikenali.
Langkah– langkah pengenalan pola citra teks ialah sebagai berikut (Witten, 2005):
1. Data masukan berupa teks disiapkan.
2. Pada tahap penginderaan, mesin menginderakan teks dengan sensor
kemudian memasukkan citra hasil pindai itu ke dalam aplikasi pemroses teks. Teks ini masih berupa citra berisi kumpulan piksel yang memiliki data warna RGB (Red – Green – Blue).
3. Setelah citra ditangkap dengan sensor, maka citra tersebut dikenai
langkah-langkah pre-processing, yaitu tahapan yang dilalui untuk memisahkan obyek dari berbagai derau dan menjadikan obyek ini siap untuk diklasifikasikan. Seperti ketika manusia menginderakan sesuatu,maka ia akan berkonsentrasi pada obyek utama. Pre-processing meliputi:
Konversi dari citra berwarna (Red-Green-Blue/ RGB) menjadi citra
hitam putih yang memiliki matriks informasi warna 0 dan 1 (biner) saja. Hal ini disebut dengan proses binarisasi citra.
Pada tahap koreksi kemiringan, citra biner dibuat menjadi lurus
sejajar dengan sumbu x. Hal ini dilakukan untuk memperbesar akurasi dan menghindari kegagalan pengenalan karena citra yang miring.
Pada tahap normalisasi, citra dibuat menjadi tipis. Citra ditipiskan
dengan metode thinning atau skeletonization untuk mendapatkan garis kerangka dari tiap karakter. Normalisasi ini dapat juga dilengkapi dengan proses penghilangan derau, yaitu tahap menghilangkan piksel-piksel yang tidak diperlukan ketika tahap pengenalan. Selain milik obyek utama, piksel lainnya dihilangkan.
Kemudian citra dikenai segmentasi, yaitu langkah pemisahan citra
utama dari latar belakang yang tidak memiliki andil dalam langkah
pengenalan, serta pemisahan karakter per karakter.
4. Ekstraksi feature merupakan langkah pemilihan ciri yang ingin diidentifikasi dari citra aksara yang telah dikenai proses pre-processing.
5. Tahap klasifikasi citra merupakan tahap utama dalam pengenalan pola.
Klasifikasi ini bisa berdasarkan unsupervised maupun supervised learning.
Unsupervised learning berarti kategori tercipta dengan sendirinya sesuai dengan feature yang ditangkap, sedangkan supervised learning berarti sudah ada batas-batas pengetahuan untuk menentukan kelas dari obyek yang ditangkap. Pada tahap ini, feature dibandingkan kemiripannya dengan model yang sudah diketahui oleh mesin.
6. Post processing merupakan tahap analisa terhadap hasil klasifikasi.
Beberapa proses dalam tahap ini antara lain penghitungan jumlah kesalahan untuk menentukan akurasi, penghitungan resiko, analisa konteks, dan multiple classifier.
7. Tahap terakhir ialah mendapatkan output berupa pengenalan tulisan, sehingga keputusan dapat diambil dari hasil pengenalan ini.
2.4 Metode Hidden Markov Models
Metode Hidden Markov Model mulai diperkenalkan dan dipelajari pada
akhir tahun 1960, metode yang berupa model statistik dari rantai Markov ini
recognition (speech, face, handwriting), seperti dijelaskan oleh Lawrence R.
Rabiner dalam laporannya yang berjudul “A Tutorial on Hidden Markov Models
and Selected Applications in Speech Recognition”. Pada beberapa penelitian,
sudah dicobakan metode Hidden Markov Models untuk pengenalan pola berupa
citra.Hidden Markov Model (HMM) adalah sebuah model statistik dari sebuah
sistem yang diasumsikan dari rantai Markov dengan parameter yang tak diketahui,
dan tantangannya adalah menentukan parameter-parameter tersembunyi (hidden)
dari parameter-parameter yang dapat diamati (Przytycka, 2005). Parameter-
parameter yang ditentukan kemudian dapat digunakan untuk analisis yang lebih
jauh dalam pengenalan pola. Disebut statistik karena HMM mencari means,
varians , dan probabilitas dari model yang dimasukkan.HMM didefinisikan sebagai kumpulan lima parameter (N, M, A, B, π). Jika dianggap λ = {A, B, π} maka HMM mempunyai parameter tertentu N dan M. Ciri-ciri HMM adalah:
Observasi diketahui tetapi urutan state tidak diketahui sehingga disebut hidden.
Observasi adalah fungsi probabilitas state. Perpindahan state adalah dalam bentuk probabilitas. HMM digunakan untuk pembuatan model yang digunakan ketika proses
training , maupun proses testing. Permodelan ini dapat berupa model kontinu
untuk data yang berlanjut seiring jalannya waktu, seperti data suara. Beberapa
data lainnya menggunakan permodelan Hidden Markov diskret, seperti data
berupa citra batik yang selanjutnya diterapkan dalam penelitian ini.Langkah-langkah dalam permodelan Hidden Markov mencakup langkah
ekstraksi feature hingga testing, yang dijelaskan secara kronologis pada sub bab
selanjutnya.2.4.1 Algoritma Pemodelan Hidden Markov Models
Setelah feature didapatkan, maka permodelan Hidden Markov dapat
dibangkitkan. Dari data feature diskret, dapat dibuat sebuah rangkaian state
dengan angka probabilitas transisi sebagai penghubungnya. Bentuk lengkap
model HMM ialah berupa state-state yang saling berhubungan, yang mana tiap
state terhubung dari state mana pun. Gambar 2.1 Contoh tiga tipe rantai HMM Algoritma Hidden Markov Models dibangkitkan dari beberapa parameter, yaitu (Rabiner, 1989): (2.9) λ = ( A, B, π )Permodelan dengan parameter di atas dapat dijelaskan sebagai berikut:
1. Terdapat sebuah parameter N, yaitu banyaknya state untuk model. Setiap
state dinotasikan sebagai S = { S 1 , S 2 , S 3 , ..., S N } dan state pada waktu t ialah q . t
2. M, banyaknya simbol observasi tiap state. Simbol observasi berhubungan dengan keluaran fisik dari sistem yang dimodelkan. Dinotasikan sebagai V= { V 1 , V 2 , V 3 , ..., V M }.
3. Matriks transisi probabilitas A = {a ij }, di mana a ij = P(q t+1 = S j | q t = S i ), 1 < i, j < N (2.10) dan dengan syarat a > 0 dan a = 1 ij ∑
4. Simbol distribusi probabilitas pada state j, B = { bj(k) } di mana b j (k) = P ( V k pada t | q t = S j ), 1 < j < N (2.11) 1 < k < M.
5. Inisialisasi distribusi state i } di mana π = { π i = P ( q i = S j ), 1 < i < N (2.13)
π Dengan nilai-nilai yang tepat untuk variabel N, M, A, B dan π, maka O = O
1 O
2 O 3 ... O t (2.14)
di mana untuk setiap observasi Ot ialah satu dari simbol yang ada pada V, dan T
adalah banyaknya observasi yang ada pada sekuens tersebut.2.4.2 Algoritma training dengan Baum-Welch
Masalah utama dalam HMM adalah mengatur parameter model
λ={A,B,π} agar probabilitas urutan observasi yaitu P(O|λ) menjadi maksimal.
Parameter model λ={A,B, π} yang memaksimalkan P(O|λ) dapat dicari dengan
prosedur iterasi yaitu dengan metode EM (Expectation Modification) atau
algoritma forward-backward atau sering disebut dengan metode Baum Welch.
Diasumsikan keluaran observasi (O) adalah korespondensi 1 – 1 dengan keadaan
(Q) sehingga parameter HMM menjadi tidak tersembunyi lagi.Variabel forward didefinisikan sebagai observasi parsial dari probabilitas
state sekuen yang dilambangkan dengan O1 , O2 ,…,Ot (hingga waktu t) dan state
Si pada waktu t, dengan model λ, dan α sebagai t(i). Sedangkan variabel backward
didefinisikan sebagai observasi parsial dari probabilitas state sekuen dari t+1 ke
state sebelumnya, di mana terdapat state Si pada waktu t , dengan model λ, dan α sebagai t(i). Observasi dari probabilitas state sekuen ini dihitung dengan rumus: (2.15)Probabilitas pada saat berada pada state Si pada waktu t, dan diberikan sekuens observasi O , dan model λ, ialah: (2.16)
(a) (b)
Gambar 2.2 Ilustrasi dari operasi pada Baum-Welch.
(a) variabel forward . (b)variabel backward .
Untuk menghitung model HMM dari kelas yang diberikan, maka kita akanmembutuhkan banyak sampel data dari kelas ini untuk dimodelkan. Karakteristik
dari setiap contoh ini kemudian diekstrak dan disimpan dalam sebuah parameter
vektor sekuens xt. Parameter ini yang dipetakan sebagai ekuivalensi dari Ot.Cara kerja metode Baum-Welch: 1. Estimasikan sebuah model HMM sebagai .
2. Dengan nilai λ dan sekuens observasi O, hitung sebuah model baru
| ( | )
<
3. Jika menghasilkan , maka hentikan langkah
ℎ ℎ ( | ) ini. Jika tidak, maka letakkan nilai untuk menggantikan λ dan ulangi langkah 1.
2.4.3 Algoritma testing dengan Viterbi
q ... q } Algoritma Viterbi digunakan untuk menghitung sekuens state Q={q
1
2 T ,
yang paling dekat probabilitasnya dari sebuah sekuens observasi O={O O ... O }
1
2 T yang didefinisikan sebagai:
( ) = max [ … = , … | ] (2.17)
, ,…, λ
( )
merupakan nilai probabilitas terbaik pada waktu t, yang dihitung pada observasi t pertama dan diakhiri pada state S i .
2.5 Metode Evaluasi 5-Fold Cross Validation
Tingkat akurasi sebuah sistem pengenalan pol dapat diukur dengan metode
pengukuran 5-fold cross validation yang membagi tiap kelompok batik menjadi