PERLUASAN METODE FEATURE POINT EXTRACTION UNTUK PENGENALAN HURUF JEPANG HIRAGANA SKRIPSI
PERLUASAN METODE FEATURE POINT
EXTRACTION UNTUK PENGENALAN HURUF JEPANG HIRAGANA SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Sains
Program Studi Ilmu Komputer Oleh: Antonius Willy Setiawan
NIM: 043124003 PROGRAM STUDI ILMU KOMPUTER JURUSAN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA
THE EXTENSION OF FEATURE POINT EXTRACTION METHOD FOR JAPANESE HIRAGANA LETTER RECOGNITION
A THESIS Presented as Partial Fulfillment of the Requirements to Obtain the Sarjana Sains Degree in Computer Science Study Program
By: Antonius Willy Setiawan
ID: 043124003 COMPUTER SCIENCE STUDY PROGRAM DEPARTMENT OF MATHEMATIC FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY
HALAMAN PERSEMBAHAN
Kupersembahkan skripsi ini untuk:
- Tuhan Yesus Kristus, Bunda Maria, dan Santo Yusuf, serta Santo Antonius dan Santo Aloysius di Surga atas segala rahmat, kasih, perlindungan, dan bimbingan-Nya.
- Papa, Mama, dan Ko Ai atas kasih, dukungan, dan doa.
- Almamaterku Universitas Sanata Dharma, khususnya Ilmu Komputer angkatan 2004.
HALAMAN MOTTO
ߎ߁ࠎ߿ ߏߣ శ㒶⍫ ߩᅤ ߒޕ
(Time is running like an arrow.)
ࠊߚߒ ߥࠎ ⑳ ߪ ߩߚߦ↢ ߈ߡࠆߩ㧫
(What am I still living for?)
߆߉ ߊࠆ ↢ ߈ߡࠆ㒢 ࠅޔ⧰ ߒߎߣ߇ࠆޕ
(People will always face problem as long as they live.)
߭ߣ ߰ ߺ ࠊࠇ ߰ ߥ߅ ੱ ߩᝄ ࠅ ߡᚒ ߇ᝄ ࠅ⋥ ߖޕ
(The wise one always fixes his/her own mistake.)
߭ߣ ߆ߎ ߹ੱ ߪㆊ ߦ↢ ߈ࠆ߽ߩߦࠄߕޔ ߢ߈ࠆߎߣࠍ
߿ࠇ߫ߩߢߔޕ
(People should not dwell on the past. It is enough to try your best in
all that you are doing now.)
ABSTRAK
PERLUASAN METODE FEATURE POINT EXTRACTION
UNTUK PENGENALAN HURUF JEPANG HIRAGANA
Bagi para penggemar kebudayaan Jepang, huruf Hiragana merupakanhuruf dasar di Jepang yang digunakan untuk menuliskan kata-kata Jepang asli,
dimana salah satu kesulitan yang dialami para peminat bahasa Jepang ialah
mengenali tulisan huruf Jepang. Manusia mengenali objek berdasarkan ciri-ciri
dan pengetahuan yang pernah diamatinya dari objek tersebut. Tujuan dari
pengenalan pola adalah mengklarifikasi dan mendeskripsikan objek. Salah satu
metode pengenalan pola yang relatif awal ialah Feature Point Extraction.Dalam Feature Point Extraction, digunakan tabel hubungan ketetanggaan
antarpiksel. Matriks dari karakter input dicocokkan dengan tabel untuk
mendapatkan nilai tertentu, dan dicari selisihnya dengan tiap template. Karakter
inputdigolongkan ke dalam template yang memiliki total selisih minimum.
Hasil segmentasi yang dilakukan menyebabkan munculnya matriks yang
tidak memenuhi kriteria sehingga proses pengenalan tidak dapat dilanjutkan.
Masalah ini diatasi dengan memperluas metode Feature Point Extraction, yaitu
menambah tabel baru. Dari hasil pengujian, terbukti metode ini dapat dipakai
untuk mengenali huruf Hiragana.
ABSTRACT
THE EXTENSION OF FEATURE POINT EXTRACTION METHOD
FOR JAPANESE HIRAGANA LETTER RECOGNITION
For those who are interested about Japanese cultural, Hiragana is a basicletter used to write Japanese words, which unfortunately, one of many difficulties
in learning Japanese cultural is recognizing these Japanese letters. Human
recognize object based on characteristics and knowledge which they have
observed from that object. The purpose of pattern recognition is to clarify and to
describe an object. Feature Point Extraction is one of many methods of pattern
recognition, which is used earlier.Feature Point Extraction method uses table of enumeration of possible
pixel neighborhood. Matrix from the character input is matched with those in the
table to gain a value, and then this value is used to count the subtraction between
the input and the template. The character input is concluded as a template which
has a minimum total of subtraction.Character segmentation causes disqualified matrixes spotted, thus
recognizing process cannot be continued. This problem is solved by extending the
method of Feature Point Extraction; it is adding a new table. From the result of
character testing, it is proved that this method can be used to recognize the letter
of Hiragana.KATA PENGANTAR
Puji dan syukur penulis haturkan ke hadapan Tuhan Yesus Kristus karena
atas berkat dan kasih-Nya yang tiada henti, penulis dapat menyelesaikan skripsi
yang berjudul “PERLUASAN METODE FEATURE POINT EXTRACTION
UNTUK PENGENALAN HURUF JEPANG HIRAGANA” pada waktunya.
Terima kasih karena Engkau selalu memberikan yang terbaik untukku.
Adapun skripsi ini ditulis untuk memenuhi salah satu syarat memperoleh
gelar Sarjana Sains pada Program Studi Ilmu Komputer, Jurusan Matematika,
Fakultas Sains dan Teknologi, Universitas Sanata Dharma Yogyakarta.Penulis tentu tidak sendirian selama masa studi; bantuan demi bantuan
penulis terima dari berbagai pihak dalam berbagai bentuk. Oleh karena itu, pada
kesempatan ini, dengan rendah hati, penulis ingin mengucapkan rasa syukur dan
terima kasih sebesar-besarnya kepada:1. Romo Greg selaku dekan FST, Bu Rosa selaku Kaprodi Ikom, Pak Eko Hari selaku dosen pembimbing akademik, dan Pak Joko selaku dosen pembimbing TA, serta Mas Tukijo dan Mbak Linda atas pelayanannya di Sekretariat. Terima kasih atas kesempatan, perhatian, dukungan, bimbingan, dan bantuannya kepada saya selama masa perkuliahan, khususnya masa-masa skripsi.
2. Papa, Mama, Ko Ai, dan Cie Kristin yang tak henti-hentinya memberikan doa, dukungan moral dan materi, serta Lessie dan anjing-anjingku lainnya
3. Para kerabat: Ku Khing sekeluarga, Ik Liang, Ik Gwat sekeluarga, dan Ku
Nga sekeluarga, yang selalu memberi bantuan dan perhatian selama studi.4. Opa Harjoko beserta kerabat-kerabat lainnya di Surga atas jasa-jasanya.
5. Mbah Dasro sekeluarga yang bersedia memberikan tempat kos yang
murah dan nyaman, serta makanan yang enak-enak.
6. Sahabat-sahabat terbaikku di Yogya: Agung “Acenk”, Budi “Ndut”, Beny
“Bendot”, Maman “Coeman”, Henry “Ondie”, Hendra “Ganyong”, Dicky, Jimy “Jigo”, Frans “Njoohe”, Andy “Cimeng”, Prast, Adi “Gemblung”, Mas Agung “Sawitri”, Toak, Raymond “Emon”, Vandi, Hermez, Bayu “Celeng”, Fery, dan teman-teman lainnya, khususnya teman-teman Tasura52. Aku tidak akan pernah melupakan kegilaan, kebrutalan, kebersamaan, persahabatan, petualangan, dan pengalaman yang sangat mengesankan selama bersama kalian. Kalian telah memberikan semangat dan motivasi
sehingga aku dapat terus berkarya. Go on top yuu’…pengen ngulti neh…!
7. Terima kasih juga untuk sahabat-sahabat cewek: Nanda “Nandut”, Cie
Lian, Intan “Singo”, Mbak Ina, Kadek “Krik2”, Ayu, Bella, Wiwit, Fany, Ratna Asien, Vera “Kero”, dan lain-lain, atas pengalaman dan persahabatan yang mengesankan.
8. Teman-temanku di Jember, khususnya teman-teman SMUK Santo Paulus: David “Ping-ping”, Kiki “Mashimaro”, Vena “Bokong”, Teddy “Tweety”, Eliana “Ayam”, Pak Gora “Goraemon”, dan teman-temanku lainnya terlebih III IPA3 tahun 2003/2004; teman-teman spiritualku: Romo Agung (dulu masih Frater), Aji (sekarang sudah Frater), Hendra O., Basuki, Doni; cucu-cucuku Ayu, Astrid, Lia, Yuke, dkk; serta EPSILON CLUB: Vico, Brahma, Petrus (sekarang sudah Frater), Santoso, Teddy “GPC”, Bayu “Bayek”, Adi “Timbul”, Fauzan “Uyan”, Hambar, Teguh, Yones, dan
Aditya “Mbah”, atas kenangan dan persahabatannya hingga sekarang.
9. Teman-temanku dari USD: Campus Ministry: Mas Darto, Mbak Nita, Gaudeamus Choir
, dan teman-teman lainnya atas pengalaman yang tidak terlupakan; teman-teman KKN angkatan XXXV kelompok 24: Mono, Silvi “Bundo”, Mayora “Beng-beng”, Linda, Ita, Alfa “Galon”, Naomi “Mami”, beserta Pak DPL-nya: Pak Hery Santoso, atas kegilaan dan pengalaman yang mengesankan; teman-teman Ikom, khususnya angkatan 2004: Henry, Kornel, Damian, Beni, Ipung, Hali, Beli, Amel, Deby, Desy, Eka, dan semuanya atas kebersamaan dan perjuangannya selama kuliah.
10. Beserta pihak-pihak lain yang tidak mungkin dapat disebutkan satu per satu yang telah banyak berjasa.
Penulis sadar bahwa skripsi ini masih belum sempurna. Oleh karena itu,
penulis memohon maaf atas ketidaksempurnaan ini dan bersedia menerima
masukan demi kebaikan bersama. Akhir kata, penulis berharap semoga karya ini
berguna bagi para pembaca sekalian. Terima kasih.Yogyakarta, Agustus 2008 Penulis
DAFTAR ISI
halaman
Halaman Judul ………………………………………………………… i
Title …………………………………………………………………… ii
Halaman Persetujuan …………………………………………………… iii
Halaman Pengesahan …………………………………………………… iv
Halaman Pernyataan Keaslian Karya ……………………………… v
Halaman Persembahan ………………………………………………… vi
Halaman Motto ………………………………………………………… vii
Halaman Persetujuan Publikasi ……………………………………… viii
Abstrak ………………………………………………………………… ix
Abstract ………………………………………………………………… x
Kata Pengantar ………………………………………………………… xi
Daftar Isi ………………………………………………………………… xiv
Daftar Gambar ………………………………………………………… xviii
Daftar Tabel …………………………………………………………… xxi
BAB I PENDAHULUAN ……………………………………………
1
1.1 Latar Belakang Masalah …………………………………
1
1.2 Rumusan Masalah ………………………………………
3
1.3 Batasan Masalah ………………………………………
3
1.5 Manfaat Penelitian ………………………………………
4
1.6 Metode Penelitian ………………………………………
4
1.7 Sistematika Penulisan ……………………………………
6 BAB II LANDASAN TEORI …………………………………………
7
2.1 Pengolahan Citra …………………………………………
7
2.1.1 Definisi …………………………………………
7
2.1.2 Preprocessing ……………………………………
8
2.1.2.1 Thresholding ……………………………
8
2.2 Pengenalan Pola (Pattern Recognition) ………………… 12 Feature Point Extraction
2.3 ………………………………… 16
2.4 Huruf Hiragana ………………………………………… 22
BAB III DESAIN ………………………………………………………
26
3.1 Gambaran Sistem Secara Umum ………………………… 26
3.2 Desain Proses …………………………………………… 32
3.2.1 Proses binerisasi ………………………………… 32
3.2.2 Proses menghilangkan pinggiran putih ………… 36
3.2.3 Proses segmentasi 9 bagian ……………………… 38
3.2.4 Proses pencocokan dengan tabel ………………… 39
3.2.5 Proses mencari selisih minimum dengan template … 40
3.3 Navigasi Menu ………………………………………… 43
3.4 Desain Interface ………………………………………… 44
3.4.1 Home …………………………………………… 44
3.4.2 Daftar Hiragana ………………………………… 45
3.4.3 Bantuan ………………………………………… 45
3.4.4 Tentang Program ………………………………… 46
3.4.5 Input Gambar …………………………………… 46
3.4.6 Kesimpulan ……………………………………… 47
3.4.7 Kesimpulan untuk input salah …………………… 48
3.5 Spesifikasi Hardware dan Software …………………… 48
Hardware 3.5.1 ………………………………………… 48
Software 3.5.2 ………………………………………… 49
BAB IV HASIL DAN PEMBAHASAN ………………………………
50
4.1 Hasil Tampilan User Interface ………………………… 50
4.1.1 Tampilan Home ………………………………… 50
4.1.2 Tampilan Daftar Hiragana ……………………… 51
4.1.3 Tampilan Bantuan ……………………………… 52
4.1.4 Tampilan Tentang Program ……………………… 53
4.1.5 Tampilan Input Gambar ………………………… 53
4.1.6 Tampilan Kesimpulan …………………………… 54
4.1.7 Tampilan Kesimpulan untuk Input yang Salah …… 55
4.2 Hasil Pengujian Karakter ………………………………… 55
4.3 Implementasi dengan 256 Hubungan Ketetanggaan Antarpiksel ……………………………………………… 62
4.4 Implementasi dengan 512 Hubungan Ketetanggaan Antarpiksel ……………………………………………… 64
4.5 Analisis Unjuk Kerja …………………………………… 67
4.6 Kelemahan Aplikasi …………………………………… 72
BAB V PENUTUP …………………………………………………
74
5.1 Kesimpulan ……………………………………………… 74
5.2 Saran …………………………………………………… 75 DAFTAR PUSTAKA …………………………………………………
76 LAMPIRAN …………………………………………………………
77 Cuplikan Listing Program …………………………………… 78 Daftar Template ……………………………………………… 84
DAFTAR GAMBAR
halamanGambar 2.1 Jenis distribusi intensitas citra ……………………………9 Gambar 2.2 Citra dengan distribusi intensitas yang jelas ………………
9 Gambar 2.3 Hasil threshold yang baik ………………………………… 10
Gambar 2.4 Citra dengan distribusi intensitas yang hampir sama ……… 10Gambar 2.5 Hasil threshold yang kurang baik ………………………… 11Gambar 2.6 Thresholding setelah operasi deteksi tepi ………………… 11Gambar 2.7 Skema umum proses pengenalan pola……………………… 14Gambar 2.8 Template matching ………………………………………… 15Gambar 2.9 Pemecahan matriks 9x9 menjadi 9 bagian ……………… 19Gambar 2.10 Karakter input dan karakter template …………………… 19Gambar 2.11 Karakter-karakter yang dipecah menjadi 9 bagian ……… 20Gambar 2.12 Contoh segmentasi karakter “A” ………………………… 21Gambar 2.13 Perbandingan penulisan Hiragana dan Katakana ………… 22Gambar 2.14 Contoh aturan penulisan huruf Hiragana ……………… 22Gambar 2.15 Karakter dasar Hiragana ………………………………… 23Gambar 2.16 Karakter-karakter tambahan Hiragana ………………… 24Gambar 2.17 Contoh penulisan Furigana ……………………………… 25Gambar 3.1 Diagram gambaran sistem secara umum ………………… 27Gambar 3.2 Diagram pemrosesan citra input ………………………… 27Gambar 3.4 Diagram proses binerisasi secara keseluruhan ………… 32Gambar 3.5 Diagram proses thresholding …………………………… 33Gambar 3.6 Diagram proses binerisasi ……………………………… 34Gambar 3.7 Diagram proses penukaran piksel hitam dan piksel putih jika objek berwarna putih ………………… 35Gambar 3.8 Diagram proses menghilangkan pinggiran putih ………… 37Gambar 3.9 Diagram proses segmentasi 9 bagian …………………… 38Gambar 3.10 Diagram proses pencocokan dengan tabel ……………… 39Gambar 3.11 Diagram proses mencari selisih minimum dengan template ………………………………………… 40Gambar 3.12 Diagram proses menghitung prosentase kemiripan ……… 42Gambar 3.13 Navigasi menu ………………………………………… 43Gambar 3.14 Desain interface Home ………………………………… 44Gambar 3.15 Desain interface Daftar Hiragana ……………………… 45Gambar 3.16 Desain interface Bantuan ……………………………… 45Gambar 3.17 Desain interface Tentang Program ……………………… 46Gambar 3.18 Desain interface Input Gambar ………………………… 46Gambar 3.19 Desain interface Kesimpulan ………………………… 47Gambar 3.20 Desain interface Kesimpulan untuk input yang salah …… 48Gambar 4.1 Tampilan interface Home ……………………………… 50Gambar 4.2 Tampilan interface Daftar Hiragana …………………… 51Gambar 4.3 Tampilan interface Bantuan …………………………… 52Gambar 4.4 Tampilan interface Tentang Program …………………… 53Gambar 4.5 Tampilan interface Input Gambar sebelum memilih Huruf ………………………………………………… 53Gambar 4.6 Tampilan Interface Input Gambar setelah memilih Huruf ………………………………………………… 54Gambar 4.7 Tampilan Interface Kesimpulan ………………………… 54Gambar 4.8 Tampilan Interface Kesimpulan untuk Input yang Salah … 55Gambar 4.9 Karakter input beserta hasil-hasil pemrosesan citranya … 62Gambar 4.10 Hasil segmentasi karakter input ………………………… 62Gambar 4.11 Bagian segmentasi karakter input yang memenuhi kriteria ………………………………………………… 67Gambar 4.12 Perbandingan huruf “me” dan “nu” …………………… 69
DAFTAR TABEL
halamanTabel 2.1 Tabel hubungan ketetanggaan antarpiksel, piksel pada posisi (2,2) bernilai 0 …………………………… 17Tabel 2.2 Tabel perbandingan I ……………………………………… 21Tabel 2.3 Tabel perbandingan II ……………………………………… 21Tabel 2.4 Tabel komposisi nilai karakter “A” ………………………… 22Tabel 3.1 Tabel hubungan ketetanggaan antarpiksel, piksel pada posisi (2,2) bernilai 1 …………………………… 30Tabel 4.1 Tabel hasil pengujian karakter ……………………………… 55Tabel 4.2 Tabel komposisi nilai karakter input berdasarkan tabel 256 hubungan ketetanggaan antarpiksel ……………… 63Tabel 4.3 Tabel komposisi nilai karakter input berdasarkan tabel 512 hubungan ketetanggaan antarpiksel ……………… 64Tabel 4.4 Total selisih dengan setiap template pada pengujian kedua … 65Tabel 4.5 Tabel selisih dengan template u …………………………… 66BAB I PENDAHULUAN
1.1 Latar Belakang Masalah
Kemampuan manusia yang banyak bermanfaat dalam aktivitas sehari-harinya ialah kemampuan mengindera, baik dengan mata, telinga, maupun indera lainnya. Dengan mata, manusia dapat melihat serta memutuskan objek apa yang dilihatnya. Walaupun beberapa objek yang dilihat tidak sama persis, tetapi manusia mampu melihat kesamaannya sebagai satu golongan yang sejenis. Misalnya, manusia melihat berbagai macam jenis gelas. Walaupun bentuknya berbeda-beda, tetapi manusia tetap tahu bahwa itu semua adalah gelas. Kemampuan manusia ini disebabkan karena dalam ingatan manusia telah terdapat begitu banyak ciri yang membedakan antara satu objek dengan objek yang lain. Contohnya, dalam ingatan, manusia telah menyimpan begitu banyak objek gelas, yang tentu saja memiliki ciri-ciri khusus yang dapat membedakannya dengan objek lain.
Sehingga di hadapan berbagai jenis gelas yang berbeda bentuk dan penampakannya, dengan begitu mudahnya, manusia masih tetap dapat berkata bahwa itu adalah gelas. Bagaimana manusia melakukan generalisasi terhadap sekian banyak ciri-ciri objek (padahal tidak semua objek pernah dilihat manusia) masih sulit untuk dijelaskan.
Komputer, yang kecerdasannya mendekati manusia, mulai banyak
sebagai mesin penghitung (masalah sederhana), sekarang dapat
menyelesaikan masalah-masalah manusia yang lebih kompleks, misalnya
mengidentifikasi tanda tangan, mengidentifikasi wajah, mengidentifikasi
tulisan/huruf, dsb. Metode-metode yang dipakai dalam mengenali suatu pola
ada bermacam-macam, misalnya Jaringan Syaraf Tiruan, seperti ADALINE
dan Back Propagation, Feature Point Extraction, Logika Kabur, dan
sebagainya.Kebudayaan Jepang sekarang banyak peminatnya, termasuk penulis
sendiri, baik musik, film, anime, hingga seni penulisan huruf Jepang. Huruf
Hiragana merupakan huruf dasar yang digunakan untuk menuliskan kata-
kata Jepang asli, dimana penulisannya mirip seperti huruf Jawa, yaitu per
suku kata. Selain huruf Hiragana ada juga huruf Katakana (untuk
menuliskan kata-kata serapan/asing dan bunyi-bunyian) serta huruf Kanji
(gabungan dari huruf Hiragana yang tiap hurufnya sudah memiliki arti kata
tersendiri dan lebih rumit cara penulisannya). Salah satu kesulitan yang
dialami para peminat bahasa Jepang adalah dalam mengenali huruf Jepang
karena bentuk hurufnya lebih rumit dibandingkan dengan huruf alfabet biasa.
Berdasarkan masalah seperti telah diungkapkan di atas, penulis ingin
membuat suatu aplikasi yang dapat mengenali huruf Jepang, yaitu huruf
Hiragana dengan menggunakan metode Feature Point Extraction. Metode
ini merupakan metode yang relatif awal berkaitan dengan pengenalan
karakter, sehingga lebih mudah. Metode ini menggunakan ciri dari tiap
karakter sebagai konsep untuk melakukan klasifikasi. Yang dimaksud ciri ialah susunan piksel dalam matriks dari tiap karakter. Metode ini juga memiliki syarat, yaitu hanya matriks yang memiliki ketentuan tertentu saja yang akan dipakai, sedangkan yang tidak memenuhi ketentuan tersebut akan diabaikan.
1.2 Rumusan Masalah Bagaimana membangun sebuah aplikasi untuk dapat mengenali huruf Jepang Hiragana dengan metode Feature Point Extraction?
1.3 Batasan Masalah
1. Input berupa file gambar berekstensi *.jpg, *.jpeg, *.bmp, atau *.gif.
2. Aplikasi yang dirancang hanya dapat mengenali satu karakter untuk tiap pengenalannya dari total 46 huruf Hiragana dasar.
3. Tingkat pengenalan terbatas pada jumlah template sebanyak 5 buah untuk tiap karakter, dan tidak dapat dilakukan penambahan template.
4. Semakin besar dimensi file gambar, tingkat pengenalan juga semakin berkurang (penulis menggunakan resolusi 100x100 piksel).
5. Software yang digunakan adalah MatLab.
1.4 Tujuan Penelitian
Membangun sebuah aplikasi untuk dapat mengenali huruf Jepang Hiragana dengan metode Feature Point Extraction.
1.5 Manfaat Penelitian
1. Sebagai bahan studi bagi peneliti lainnya untuk mengembangkan aplikasi serupa yang lebih baik.
2. Sebagai bantuan bagi penggemar kebudayaan Jepang mengenali huruf Hiragana .
1.6 Metode Penelitian
Metode yang digunakan dalam penelitian ini adalah sebagai berikut:
1. Analisis Kebutuhan Yang dilakukan dalam analisis kebutuhan ialah mengumpulkan sampel tulisan Hiragana dalam berbagai jenis tulisan. Caranya ialah dengan membagi-bagikan contoh tulisan Hiragana kepada banyak orang untuk ditulis ulang. Sampel yang diperoleh ini akan digunakan sebagai template untuk pengenalan huruf Hiragana.
Selain itu, peneliti juga mengumpulkan serta meninjau berbagai bahan/referensi mengenai algoritma yang digunakan dalam pengenalan pola, yaitu Feature Point Extraction, baik secara teoritis maupun secara praktis. Hasilnya ialah berbagai macam sampel tulisan Hiragana serta bahan-bahan/referensi mengenai algoritma Feature Point Extraction.
2. Desain Dalam desain, peneliti mulai menyusun tampilan antarmuka serta berbagai tombol/fungsi yang akan digunakan untuk membangun sebuah aplikasi pengenalan huruf Hiragana, baik untuk input maupun output.
Hasilnya ialah sebuah aplikasi yang telah mempunyai tampilan antarmuka lengkap beserta fasilitas input-outputnya tetapi belum berfungsi.
3. Implementasi/Coding Dalam tahap ini, peneliti mulai mengimplementasikan algoritma Feature Point Extraction ke dalam bahasa komputer sesuai dengan desain yang telah disusun. Hasilnya ialah sebuah aplikasi yang dapat membaca tulisan Hiragana dan memberikan output-nya.
4. Evaluasi Setelah aplikasi dibangun, perlu dilakukan pengujian atas kemungkinan terjadinya kesalahan. Proses perbaikan dilakukan terus- menerus hingga aplikasi yang dibuat relatif tidak memuat kesalahan (kesalahan yang mungkin muncul adalah kesalahan yang memang merupakan kelemahan dari algoritma Feature Point Extraction).
Hasilnya ialah sebuah aplikasi pengenalan huruf Hiragana yang lebih akurat.
5. Penyusunan Laporan Dalam tahap ini, peneliti menyusun laporan ilmiah tertulis tentang penelitian yang dilakukan, mulai dari tahap awal hingga akhir. Proses penyusunan laporan ini dapat dimulai bersamaan dengan dimulainya penelitian serta mengalami revisi sejalan dengan perubahan yang terjadi selama penelitian. Hasilnya ialah laporan ilmiah tertulis/skripsi.
1.7 Sistematika Penulisan
Berikut adalah garis besar dari isi karya ilmiah yang akan disusun:
BAB I PENDAHULUAN Bab I tersusun atas latar belakang masalah, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, metode penelitian, serta sistematika penulisan.
BAB II LANDASAN TEORI Bab II berisi tentang teori-teori yang dipakai dalam implementasi, contohnya adalah teori tentang pengolahan citra dan Feature Point Extraction .
BAB III DESAIN Pada bagian desain, berisi mengenai bagaimana rancangan dari aplikasi yang akan dibangun, misalnya ialah gambaran sistem
secara umum, desain proses, serta desain interface.
BAB IV HASIL DAN PEMBAHASAN Bab IV berisi mengenai hasil implementasi dari program yang dibuat serta pembahasannya. BAB V PENUTUP Penutup berisi tentang kesimpulan dan saran.
BAB II LANDASAN TEORI
2.1 Pengolahan Citra
2.1.1 Definisi Berikut ini adalah definisi mengenai pengolahan citra. Citra
adalah gambar dua dimensi yang dihasilkan dari gambar analog dua dimensi yang kontinu menjadi gambar diskrit melalui proses sampling. Gambar analog dibagi menjadi N baris dan M kolom sehingga menjadi gambar diskrit. Persilangan antara baris dan kolom tertentu disebut dengan piksel. Contohnya adalah gambar/titik diskrit pada baris n dan kolom m disebut dengan piksel [n,m].
Sampling adalah proses untuk menentukan warna pada piksel tertentu pada citra dari sebuah gambar yang kontinu. Pada proses sampling biasanya dicari warna rata-rata dari gambar analog yang kemudian dibulatkan. Proses sampling sering juga disebut proses digitasi.
Derau (noise) adalah gambar atau piksel yang mengganggu kualitas citra. Derau dapat disebabkan oleh gangguan fisis (optik) pada alat akuisisi maupun secara disengaja akibat proses pengolahan yang tidak sesuai. Contohnya adalah bintik hitam atau putih yang muncul secara acak yang tidak diinginkan di dalam citra. Bintik acak ini disebut dengan derau salt & pepper .
2.1.2 Preprocessing
Preprocessing merupakan suatu langkah dalam pengolahan citra yang perlu dilakukan untuk menghilangkan objek-objek yang tidak diperlukan, bahkan dapat mengganggu suatu citra, sehingga proses pengenalan pola dapat menjadi lebih akurat (Pearson, 2001: 96).
2.1.2.1 Thresholding
Dalam berbagai pemrosesan citra, sangat membantu jika dapat dipisahkan antara daerah/citra sebagai objek (yang dikehendaki) dari citra yang merupakan latar belakang (background) dari keseluruhan citra.
Thresholding memberikan kemudahan dalam melakukan segmentasi ini
berdasarkan perbedaan intensitas warna dari kedua citra tersebut.
Input dari thresholding dapat berupa citra grayscale ataupun berwarna. Dalam implementasi yang paling sederhana, outputnya merupakan citra biner yang merepresentasikan segmentasi. Piksel hitam menggambarkan background sedangkan piksel putih menggambarkan foreground
(atau bisa juga sebaliknya). Segmentasi dilakukan berdasarkan sebuah parameter yang disebut sebagai intensitas threshold. Tiap piksel dari suatu citra dibandingkan dengan parameter ini. Jika piksel citra nilainya lebih tinggi dari threshold, piksel tersebut diset menjadi putih atau bernilai 1 sebagai outputnya. Jika tidak, diset menjadi hitam atau bernilai 0 (atau sebaliknya).
Tidak semua citra dapat disegmentasi menggunakan thresholding yang sederhana. Bisa atau tidaknya sebuah citra disegmentasi dengan baik
ditentukan dengan melihat histogram intensitas dari citra. Jika
memungkinkan untuk memisahkan foreground dari citra berdasarkan
intensitas piksel maka intensitas piksel pada objek foreground harus
benar-benar berbeda dari intensitas piksel background. Dalam hal ini,
dapat dilihat dari perbedaan puncak dalam histogram.Gambar 2.1 Jenis distribusi intensitas citraGambar 2.1 A) menunjukkan distribusi intensitas bi-modal. Citra ini dapat disegmentasi menggunakan threshold tunggal T1. Gambar 2.1 B)
terlihat lebih kompleks. Dianggap bahwa puncak di tengah merupakan
objek yang diinginkan maka segmentasi memerulukan dua threshold: T1
dan T2. Pada gambar 2.1 C), kedua puncak dari distribusi bi-modal
terlihat hampir sama maka hampir tidak mungkin untuk dapat melakukan
segmentasi dengan baik menggunakan threshold tunggal.Gambar 2.2 Citra dengan distribusi intensitas yang jelasGambar 2.2 di atas menunjukkan distribusi bi-modal yang baik; pada histogram, puncak yang lebih rendah merepresentasikan objek,sedangkan yang lebih tinggi merepresentasikan background.
Citra pada gambar 2.2 dapat disegmentasi menggunakan threshold
tunggal dengan nilai intensitas piksel 120. Hasilnya adalah seperti pada
gambar 2.3 sebagai berikut:Gambar 2.3 Hasil threshold yang baikTetapi dengan adanya gradasi pencahayaan yang cukup jelas,
seperti gambar 2.4 di bawah ini, puncak yang merepresentasikan
foreground dan background dapat tampak memiliki kesamaan, maka threshold yang sederhana tidak dapat memberikan hasil yang baik.Gambar 2.4 Citra dengan distribusi intensitas yang hampir samaCitra pada gambar 2.5 menunjukkan hasil segmentasi yang kurang
baik untuk threshold tunggal dari citra pada gambar 2.4 dengan nilai 80
Gambar 2.5 Hasil threshold yang kurang baikThresholding juga dapat dipakai untuk memfilter output maupun
input untuk operator lain. Sebagai contoh, deteksi tepi, seperti operasi
Sobel, akan menandai daerah dari citra yang memiliki gradien tinggi. Jika
yang diinginkan hanya gradien di atas nilai tertentu (misalnya tepi yang
tajam), maka thresholding dapat digunakan hanya untuk menyeleksi
garis-garis yang tajam saja dan mengeset piksel lainnya menjadi hitam.(a) (b) (c)
Gambar 2.6 Thresholding setelah operasi deteksi tepiPada gambar 2.6, gambar (a) merupakan gambar mula-mula,
kemudian dikenai operasi Sobel dan menghasilkan gambar (b). Hasil
akhirnya, yaitu gambar (c), diperoleh setelah gambar (b) dikenai
thresholding dengan nilai 60 (Fisher, 2003).1. Dipilih sembarang nilai untuk inisalisasi awal threshold (T)
b. m
1 dan m
4. Nilai threshold baru diperoleh dari rata-rata m
2
2 = nilai rata-rata G
Berikut ini adalah langkah-langkah dalam melakukan iterative thresholding
1
a. m
1 = nilai rata-rata G
3. Rata-rata dari tiap bagian dihitung.
2 = {f(m,n):f(m,n)<T} (piksel background) Sebagai catatan, f(m,n) adalah nilai dari piksel yang terletak pada kolom ke-m dan baris ke-n.
b. G
1 = {f(m,n):f(m,n)>=T} (piksel objek)
2. Citra disegmentasi menjadi objek dan background, yang menghasilkan dua bagian: a. G
:
2 T’ = (m
- m
2 )/2
5. Kembali ke langkah kedua, tetapi dengan menggunakan nilai threshold yang baru didapat dari langkah (4). Terus diulang sampai nilai threshold yang diperoleh sama dengan nilai threshold sebelumnya.