PERLUASAN METODE FEATURE POINT EXTRACTION UNTUK PENGENALAN HURUF JEPANG HIRAGANA SKRIPSI

PERLUASAN METODE FEATURE POINT

EXTRACTION UNTUK PENGENALAN HURUF JEPANG HIRAGANA SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Sains

Program Studi Ilmu Komputer Oleh: Antonius Willy Setiawan

NIM: 043124003 PROGRAM STUDI ILMU KOMPUTER JURUSAN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA

THE EXTENSION OF FEATURE POINT EXTRACTION METHOD FOR JAPANESE HIRAGANA LETTER RECOGNITION

A THESIS Presented as Partial Fulfillment of the Requirements to Obtain the Sarjana Sains Degree in Computer Science Study Program

By: Antonius Willy Setiawan

ID: 043124003 COMPUTER SCIENCE STUDY PROGRAM DEPARTMENT OF MATHEMATIC FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY

HALAMAN PERSEMBAHAN

Kupersembahkan skripsi ini untuk:

Tuhan Yesus Kristus, Bunda Maria, dan Santo Yusuf, serta Santo Antonius dan Santo Aloysius di Surga atas segala rahmat, kasih, perlindungan, dan bimbingan-Nya.
Papa, Mama, dan Ko Ai atas kasih, dukungan, dan doa.
Almamaterku Universitas Sanata Dharma, khususnya Ilmu Komputer angkatan 2004.

HALAMAN MOTTO

ߎ߁޿ࠎ߿ ߏߣ శ㒶⍫ ߩᅤ ߒޕ

(Time is running like an arrow.)

ࠊߚߒ ߥࠎ ޿

⑳ ߪ૗ ߩߚ߼ߦ↢ ߈ߡ޿ࠆߩ㧫

(What am I still living for?)

޿ ߆߉ ߊࠆ ↢ ߈ߡ޿ࠆ㒢 ࠅޔ⧰ ߒ޿ߎߣ߇޽ࠆޕ

(People will always face problem as long as they live.)

߭ߣ ߰ ߺ ࠊࠇ ߰ ߥ߅ ੱ ߩᝄ ࠅ⷗ ߡᚒ ߇ᝄ ࠅ⋥ ߖޕ

(The wise one always fixes his/her own mistake.)

߭ߣ ߆ߎ ޿ ޿߹

ੱ ߪㆊ෰ ߦ↢ ߈ࠆ߽ߩߦ޽ࠄߕޔ੹ ߢ߈ࠆߎߣࠍ

߿ࠇ߫޿޿ߩߢߔޕ

(People should not dwell on the past. It is enough to try your best in

all that you are doing now.)

ABSTRAK

PERLUASAN METODE FEATURE POINT EXTRACTION

UNTUK PENGENALAN HURUF JEPANG HIRAGANA

Bagi para penggemar kebudayaan Jepang, huruf Hiragana merupakan

huruf dasar di Jepang yang digunakan untuk menuliskan kata-kata Jepang asli,

dimana salah satu kesulitan yang dialami para peminat bahasa Jepang ialah

mengenali tulisan huruf Jepang. Manusia mengenali objek berdasarkan ciri-ciri

dan pengetahuan yang pernah diamatinya dari objek tersebut. Tujuan dari

pengenalan pola adalah mengklarifikasi dan mendeskripsikan objek. Salah satu

metode pengenalan pola yang relatif awal ialah Feature Point Extraction.

Dalam Feature Point Extraction, digunakan tabel hubungan ketetanggaan

antarpiksel. Matriks dari karakter input dicocokkan dengan tabel untuk

mendapatkan nilai tertentu, dan dicari selisihnya dengan tiap template. Karakter

input

digolongkan ke dalam template yang memiliki total selisih minimum.

Hasil segmentasi yang dilakukan menyebabkan munculnya matriks yang

tidak memenuhi kriteria sehingga proses pengenalan tidak dapat dilanjutkan.

Masalah ini diatasi dengan memperluas metode Feature Point Extraction, yaitu

menambah tabel baru. Dari hasil pengujian, terbukti metode ini dapat dipakai

untuk mengenali huruf Hiragana.

ABSTRACT

THE EXTENSION OF FEATURE POINT EXTRACTION METHOD

FOR JAPANESE HIRAGANA LETTER RECOGNITION

For those who are interested about Japanese cultural, Hiragana is a basic

letter used to write Japanese words, which unfortunately, one of many difficulties

in learning Japanese cultural is recognizing these Japanese letters. Human

recognize object based on characteristics and knowledge which they have

observed from that object. The purpose of pattern recognition is to clarify and to

describe an object. Feature Point Extraction is one of many methods of pattern

recognition, which is used earlier.

Feature Point Extraction method uses table of enumeration of possible

pixel neighborhood. Matrix from the character input is matched with those in the

table to gain a value, and then this value is used to count the subtraction between

the input and the template. The character input is concluded as a template which

has a minimum total of subtraction.

Character segmentation causes disqualified matrixes spotted, thus

recognizing process cannot be continued. This problem is solved by extending the

method of Feature Point Extraction; it is adding a new table. From the result of

character testing, it is proved that this method can be used to recognize the letter

of Hiragana.

KATA PENGANTAR

Puji dan syukur penulis haturkan ke hadapan Tuhan Yesus Kristus karena

atas berkat dan kasih-Nya yang tiada henti, penulis dapat menyelesaikan skripsi

yang berjudul “PERLUASAN METODE FEATURE POINT EXTRACTION

UNTUK PENGENALAN HURUF JEPANG HIRAGANA” pada waktunya.

Terima kasih karena Engkau selalu memberikan yang terbaik untukku.

Adapun skripsi ini ditulis untuk memenuhi salah satu syarat memperoleh

gelar Sarjana Sains pada Program Studi Ilmu Komputer, Jurusan Matematika,

Fakultas Sains dan Teknologi, Universitas Sanata Dharma Yogyakarta.

Penulis tentu tidak sendirian selama masa studi; bantuan demi bantuan

penulis terima dari berbagai pihak dalam berbagai bentuk. Oleh karena itu, pada

kesempatan ini, dengan rendah hati, penulis ingin mengucapkan rasa syukur dan

terima kasih sebesar-besarnya kepada:

1. Romo Greg selaku dekan FST, Bu Rosa selaku Kaprodi Ikom, Pak Eko Hari selaku dosen pembimbing akademik, dan Pak Joko selaku dosen pembimbing TA, serta Mas Tukijo dan Mbak Linda atas pelayanannya di Sekretariat. Terima kasih atas kesempatan, perhatian, dukungan, bimbingan, dan bantuannya kepada saya selama masa perkuliahan, khususnya masa-masa skripsi.

2. Papa, Mama, Ko Ai, dan Cie Kristin yang tak henti-hentinya memberikan doa, dukungan moral dan materi, serta Lessie dan anjing-anjingku lainnya

3. Para kerabat: Ku Khing sekeluarga, Ik Liang, Ik Gwat sekeluarga, dan Ku

Nga sekeluarga, yang selalu memberi bantuan dan perhatian selama studi.

4. Opa Harjoko beserta kerabat-kerabat lainnya di Surga atas jasa-jasanya.

5. Mbah Dasro sekeluarga yang bersedia memberikan tempat kos yang

murah dan nyaman, serta makanan yang enak-enak.

6. Sahabat-sahabat terbaikku di Yogya: Agung “Acenk”, Budi “Ndut”, Beny

“Bendot”, Maman “Coeman”, Henry “Ondie”, Hendra “Ganyong”, Dicky, Jimy “Jigo”, Frans “Njoohe”, Andy “Cimeng”, Prast, Adi “Gemblung”, Mas Agung “Sawitri”, Toak, Raymond “Emon”, Vandi, Hermez, Bayu “Celeng”, Fery, dan teman-teman lainnya, khususnya teman-teman Tasura

52. Aku tidak akan pernah melupakan kegilaan, kebrutalan, kebersamaan, persahabatan, petualangan, dan pengalaman yang sangat mengesankan selama bersama kalian. Kalian telah memberikan semangat dan motivasi

sehingga aku dapat terus berkarya. Go on top yuu’…pengen ngulti neh…!

7. Terima kasih juga untuk sahabat-sahabat cewek: Nanda “Nandut”, Cie

Lian, Intan “Singo”, Mbak Ina, Kadek “Krik2”, Ayu, Bella, Wiwit, Fany, Ratna Asien, Vera “Kero”, dan lain-lain, atas pengalaman dan persahabatan yang mengesankan.

8. Teman-temanku di Jember, khususnya teman-teman SMUK Santo Paulus: David “Ping-ping”, Kiki “Mashimaro”, Vena “Bokong”, Teddy “Tweety”, Eliana “Ayam”, Pak Gora “Goraemon”, dan teman-temanku lainnya terlebih III IPA3 tahun 2003/2004; teman-teman spiritualku: Romo Agung (dulu masih Frater), Aji (sekarang sudah Frater), Hendra O., Basuki, Doni; cucu-cucuku Ayu, Astrid, Lia, Yuke, dkk; serta EPSILON CLUB: Vico, Brahma, Petrus (sekarang sudah Frater), Santoso, Teddy “GPC”, Bayu “Bayek”, Adi “Timbul”, Fauzan “Uyan”, Hambar, Teguh, Yones, dan

Aditya “Mbah”, atas kenangan dan persahabatannya hingga sekarang.

9. Teman-temanku dari USD: Campus Ministry: Mas Darto, Mbak Nita, Gaudeamus Choir

, dan teman-teman lainnya atas pengalaman yang tidak terlupakan; teman-teman KKN angkatan XXXV kelompok 24: Mono, Silvi “Bundo”, Mayora “Beng-beng”, Linda, Ita, Alfa “Galon”, Naomi “Mami”, beserta Pak DPL-nya: Pak Hery Santoso, atas kegilaan dan pengalaman yang mengesankan; teman-teman Ikom, khususnya angkatan 2004: Henry, Kornel, Damian, Beni, Ipung, Hali, Beli, Amel, Deby, Desy, Eka, dan semuanya atas kebersamaan dan perjuangannya selama kuliah.

10. Beserta pihak-pihak lain yang tidak mungkin dapat disebutkan satu per satu yang telah banyak berjasa.

Penulis sadar bahwa skripsi ini masih belum sempurna. Oleh karena itu,

penulis memohon maaf atas ketidaksempurnaan ini dan bersedia menerima

masukan demi kebaikan bersama. Akhir kata, penulis berharap semoga karya ini

berguna bagi para pembaca sekalian. Terima kasih.

Yogyakarta, Agustus 2008 Penulis

DAFTAR ISI

halaman

Halaman Judul ………………………………………………………… i

Title …………………………………………………………………… ii

Halaman Persetujuan …………………………………………………… iii

Halaman Pengesahan …………………………………………………… iv

Halaman Pernyataan Keaslian Karya ……………………………… v

Halaman Persembahan ………………………………………………… vi

Halaman Motto ………………………………………………………… vii

Halaman Persetujuan Publikasi ……………………………………… viii

Abstrak ………………………………………………………………… ix

Abstract ………………………………………………………………… x

Kata Pengantar ………………………………………………………… xi

Daftar Isi ………………………………………………………………… xiv

Daftar Gambar ………………………………………………………… xviii

Daftar Tabel …………………………………………………………… xxi

BAB I PENDAHULUAN ……………………………………………

1.1 Latar Belakang Masalah …………………………………

1.2 Rumusan Masalah ………………………………………

1.3 Batasan Masalah ………………………………………

1.5 Manfaat Penelitian ………………………………………

1.6 Metode Penelitian ………………………………………

1.7 Sistematika Penulisan ……………………………………

6 BAB II LANDASAN TEORI …………………………………………

2.1 Pengolahan Citra …………………………………………

2.1.1 Definisi …………………………………………

2.1.2 Preprocessing ……………………………………

2.1.2.1 Thresholding ……………………………

2.2 Pengenalan Pola (Pattern Recognition) ………………… 12 Feature Point Extraction

2.3 ………………………………… 16

2.4 Huruf Hiragana ………………………………………… 22

BAB III DESAIN ………………………………………………………

3.1 Gambaran Sistem Secara Umum ………………………… 26

3.2 Desain Proses …………………………………………… 32

3.2.1 Proses binerisasi ………………………………… 32

3.2.2 Proses menghilangkan pinggiran putih ………… 36

3.2.3 Proses segmentasi 9 bagian ……………………… 38

3.2.4 Proses pencocokan dengan tabel ………………… 39

3.2.5 Proses mencari selisih minimum dengan template … 40

3.3 Navigasi Menu ………………………………………… 43

3.4 Desain Interface ………………………………………… 44

3.4.1 Home …………………………………………… 44

3.4.2 Daftar Hiragana ………………………………… 45

3.4.3 Bantuan ………………………………………… 45

3.4.4 Tentang Program ………………………………… 46

3.4.5 Input Gambar …………………………………… 46

3.4.6 Kesimpulan ……………………………………… 47

3.4.7 Kesimpulan untuk input salah …………………… 48

3.5 Spesifikasi Hardware dan Software …………………… 48

Hardware 3.5.1 ………………………………………… 48

Software 3.5.2 ………………………………………… 49

BAB IV HASIL DAN PEMBAHASAN ………………………………

4.1 Hasil Tampilan User Interface ………………………… 50

4.1.1 Tampilan Home ………………………………… 50

4.1.2 Tampilan Daftar Hiragana ……………………… 51

4.1.3 Tampilan Bantuan ……………………………… 52

4.1.4 Tampilan Tentang Program ……………………… 53

4.1.5 Tampilan Input Gambar ………………………… 53

4.1.6 Tampilan Kesimpulan …………………………… 54

4.1.7 Tampilan Kesimpulan untuk Input yang Salah …… 55

4.2 Hasil Pengujian Karakter ………………………………… 55

4.3 Implementasi dengan 256 Hubungan Ketetanggaan Antarpiksel ……………………………………………… 62

4.4 Implementasi dengan 512 Hubungan Ketetanggaan Antarpiksel ……………………………………………… 64

4.5 Analisis Unjuk Kerja …………………………………… 67

4.6 Kelemahan Aplikasi …………………………………… 72

BAB V PENUTUP …………………………………………………

5.1 Kesimpulan ……………………………………………… 74

5.2 Saran …………………………………………………… 75 DAFTAR PUSTAKA …………………………………………………

76 LAMPIRAN …………………………………………………………

77 Cuplikan Listing Program …………………………………… 78 Daftar Template ……………………………………………… 84

DAFTAR GAMBAR

halaman

Gambar 2.1 Jenis distribusi intensitas citra ……………………………

9 Gambar 2.2 Citra dengan distribusi intensitas yang jelas ………………

9 Gambar 2.3 Hasil threshold yang baik ………………………………… 10

Gambar 2.4 Citra dengan distribusi intensitas yang hampir sama ……… 10Gambar 2.5 Hasil threshold yang kurang baik ………………………… 11Gambar 2.6 Thresholding setelah operasi deteksi tepi ………………… 11Gambar 2.7 Skema umum proses pengenalan pola……………………… 14Gambar 2.8 Template matching ………………………………………… 15Gambar 2.9 Pemecahan matriks 9x9 menjadi 9 bagian ……………… 19Gambar 2.10 Karakter input dan karakter template …………………… 19Gambar 2.11 Karakter-karakter yang dipecah menjadi 9 bagian ……… 20Gambar 2.12 Contoh segmentasi karakter “A” ………………………… 21Gambar 2.13 Perbandingan penulisan Hiragana dan Katakana ………… 22Gambar 2.14 Contoh aturan penulisan huruf Hiragana ……………… 22Gambar 2.15 Karakter dasar Hiragana ………………………………… 23Gambar 2.16 Karakter-karakter tambahan Hiragana ………………… 24Gambar 2.17 Contoh penulisan Furigana ……………………………… 25Gambar 3.1 Diagram gambaran sistem secara umum ………………… 27Gambar 3.2 Diagram pemrosesan citra input ………………………… 27Gambar 3.4 Diagram proses binerisasi secara keseluruhan ………… 32Gambar 3.5 Diagram proses thresholding …………………………… 33Gambar 3.6 Diagram proses binerisasi ……………………………… 34Gambar 3.7 Diagram proses penukaran piksel hitam dan piksel putih jika objek berwarna putih ………………… 35Gambar 3.8 Diagram proses menghilangkan pinggiran putih ………… 37Gambar 3.9 Diagram proses segmentasi 9 bagian …………………… 38Gambar 3.10 Diagram proses pencocokan dengan tabel ……………… 39Gambar 3.11 Diagram proses mencari selisih minimum dengan template ………………………………………… 40Gambar 3.12 Diagram proses menghitung prosentase kemiripan ……… 42Gambar 3.13 Navigasi menu ………………………………………… 43Gambar 3.14 Desain interface Home ………………………………… 44Gambar 3.15 Desain interface Daftar Hiragana ……………………… 45Gambar 3.16 Desain interface Bantuan ……………………………… 45Gambar 3.17 Desain interface Tentang Program ……………………… 46Gambar 3.18 Desain interface Input Gambar ………………………… 46Gambar 3.19 Desain interface Kesimpulan ………………………… 47Gambar 3.20 Desain interface Kesimpulan untuk input yang salah …… 48Gambar 4.1 Tampilan interface Home ……………………………… 50Gambar 4.2 Tampilan interface Daftar Hiragana …………………… 51Gambar 4.3 Tampilan interface Bantuan …………………………… 52Gambar 4.4 Tampilan interface Tentang Program …………………… 53Gambar 4.5 Tampilan interface Input Gambar sebelum memilih Huruf ………………………………………………… 53Gambar 4.6 Tampilan Interface Input Gambar setelah memilih Huruf ………………………………………………… 54Gambar 4.7 Tampilan Interface Kesimpulan ………………………… 54Gambar 4.8 Tampilan Interface Kesimpulan untuk Input yang Salah … 55Gambar 4.9 Karakter input beserta hasil-hasil pemrosesan citranya … 62Gambar 4.10 Hasil segmentasi karakter input ………………………… 62Gambar 4.11 Bagian segmentasi karakter input yang memenuhi kriteria ………………………………………………… 67Gambar 4.12 Perbandingan huruf “me” dan “nu” …………………… 69

DAFTAR TABEL

halaman

Tabel 2.1 Tabel hubungan ketetanggaan antarpiksel, piksel pada posisi (2,2) bernilai 0 …………………………… 17Tabel 2.2 Tabel perbandingan I ……………………………………… 21Tabel 2.3 Tabel perbandingan II ……………………………………… 21Tabel 2.4 Tabel komposisi nilai karakter “A” ………………………… 22Tabel 3.1 Tabel hubungan ketetanggaan antarpiksel, piksel pada posisi (2,2) bernilai 1 …………………………… 30Tabel 4.1 Tabel hasil pengujian karakter ……………………………… 55Tabel 4.2 Tabel komposisi nilai karakter input berdasarkan tabel 256 hubungan ketetanggaan antarpiksel ……………… 63Tabel 4.3 Tabel komposisi nilai karakter input berdasarkan tabel 512 hubungan ketetanggaan antarpiksel ……………… 64Tabel 4.4 Total selisih dengan setiap template pada pengujian kedua … 65Tabel 4.5 Tabel selisih dengan template u …………………………… 66

BAB I PENDAHULUAN

1.1 Latar Belakang Masalah

Kemampuan manusia yang banyak bermanfaat dalam aktivitas sehari-harinya ialah kemampuan mengindera, baik dengan mata, telinga, maupun indera lainnya. Dengan mata, manusia dapat melihat serta memutuskan objek apa yang dilihatnya. Walaupun beberapa objek yang dilihat tidak sama persis, tetapi manusia mampu melihat kesamaannya sebagai satu golongan yang sejenis. Misalnya, manusia melihat berbagai macam jenis gelas. Walaupun bentuknya berbeda-beda, tetapi manusia tetap tahu bahwa itu semua adalah gelas. Kemampuan manusia ini disebabkan karena dalam ingatan manusia telah terdapat begitu banyak ciri yang membedakan antara satu objek dengan objek yang lain. Contohnya, dalam ingatan, manusia telah menyimpan begitu banyak objek gelas, yang tentu saja memiliki ciri-ciri khusus yang dapat membedakannya dengan objek lain.

Sehingga di hadapan berbagai jenis gelas yang berbeda bentuk dan penampakannya, dengan begitu mudahnya, manusia masih tetap dapat berkata bahwa itu adalah gelas. Bagaimana manusia melakukan generalisasi terhadap sekian banyak ciri-ciri objek (padahal tidak semua objek pernah dilihat manusia) masih sulit untuk dijelaskan.

Komputer, yang kecerdasannya mendekati manusia, mulai banyak

sebagai mesin penghitung (masalah sederhana), sekarang dapat

menyelesaikan masalah-masalah manusia yang lebih kompleks, misalnya

mengidentifikasi tanda tangan, mengidentifikasi wajah, mengidentifikasi

tulisan/huruf, dsb. Metode-metode yang dipakai dalam mengenali suatu pola

ada bermacam-macam, misalnya Jaringan Syaraf Tiruan, seperti ADALINE

dan Back Propagation, Feature Point Extraction, Logika Kabur, dan

sebagainya.

Kebudayaan Jepang sekarang banyak peminatnya, termasuk penulis

sendiri, baik musik, film, anime, hingga seni penulisan huruf Jepang. Huruf

Hiragana merupakan huruf dasar yang digunakan untuk menuliskan kata-

kata Jepang asli, dimana penulisannya mirip seperti huruf Jawa, yaitu per

suku kata. Selain huruf Hiragana ada juga huruf Katakana (untuk

menuliskan kata-kata serapan/asing dan bunyi-bunyian) serta huruf Kanji

(gabungan dari huruf Hiragana yang tiap hurufnya sudah memiliki arti kata

tersendiri dan lebih rumit cara penulisannya). Salah satu kesulitan yang

dialami para peminat bahasa Jepang adalah dalam mengenali huruf Jepang

karena bentuk hurufnya lebih rumit dibandingkan dengan huruf alfabet biasa.

Berdasarkan masalah seperti telah diungkapkan di atas, penulis ingin

membuat suatu aplikasi yang dapat mengenali huruf Jepang, yaitu huruf

Hiragana dengan menggunakan metode Feature Point Extraction. Metode

ini merupakan metode yang relatif awal berkaitan dengan pengenalan

karakter, sehingga lebih mudah. Metode ini menggunakan ciri dari tiap

karakter sebagai konsep untuk melakukan klasifikasi. Yang dimaksud ciri ialah susunan piksel dalam matriks dari tiap karakter. Metode ini juga memiliki syarat, yaitu hanya matriks yang memiliki ketentuan tertentu saja yang akan dipakai, sedangkan yang tidak memenuhi ketentuan tersebut akan diabaikan.

1.2 Rumusan Masalah Bagaimana membangun sebuah aplikasi untuk dapat mengenali huruf Jepang Hiragana dengan metode Feature Point Extraction?

1.3 Batasan Masalah

1. Input berupa file gambar berekstensi *.jpg, *.jpeg, *.bmp, atau *.gif.

2. Aplikasi yang dirancang hanya dapat mengenali satu karakter untuk tiap pengenalannya dari total 46 huruf Hiragana dasar.

3. Tingkat pengenalan terbatas pada jumlah template sebanyak 5 buah untuk tiap karakter, dan tidak dapat dilakukan penambahan template.

4. Semakin besar dimensi file gambar, tingkat pengenalan juga semakin berkurang (penulis menggunakan resolusi 100x100 piksel).

5. Software yang digunakan adalah MatLab.

1.4 Tujuan Penelitian

Membangun sebuah aplikasi untuk dapat mengenali huruf Jepang Hiragana dengan metode Feature Point Extraction.

1.5 Manfaat Penelitian

1. Sebagai bahan studi bagi peneliti lainnya untuk mengembangkan aplikasi serupa yang lebih baik.

2. Sebagai bantuan bagi penggemar kebudayaan Jepang mengenali huruf Hiragana .

1.6 Metode Penelitian

Metode yang digunakan dalam penelitian ini adalah sebagai berikut:

1. Analisis Kebutuhan Yang dilakukan dalam analisis kebutuhan ialah mengumpulkan sampel tulisan Hiragana dalam berbagai jenis tulisan. Caranya ialah dengan membagi-bagikan contoh tulisan Hiragana kepada banyak orang untuk ditulis ulang. Sampel yang diperoleh ini akan digunakan sebagai template untuk pengenalan huruf Hiragana.

Selain itu, peneliti juga mengumpulkan serta meninjau berbagai bahan/referensi mengenai algoritma yang digunakan dalam pengenalan pola, yaitu Feature Point Extraction, baik secara teoritis maupun secara praktis. Hasilnya ialah berbagai macam sampel tulisan Hiragana serta bahan-bahan/referensi mengenai algoritma Feature Point Extraction.

2. Desain Dalam desain, peneliti mulai menyusun tampilan antarmuka serta berbagai tombol/fungsi yang akan digunakan untuk membangun sebuah aplikasi pengenalan huruf Hiragana, baik untuk input maupun output.

Hasilnya ialah sebuah aplikasi yang telah mempunyai tampilan antarmuka lengkap beserta fasilitas input-outputnya tetapi belum berfungsi.

3. Implementasi/Coding Dalam tahap ini, peneliti mulai mengimplementasikan algoritma Feature Point Extraction ke dalam bahasa komputer sesuai dengan desain yang telah disusun. Hasilnya ialah sebuah aplikasi yang dapat membaca tulisan Hiragana dan memberikan output-nya.

4. Evaluasi Setelah aplikasi dibangun, perlu dilakukan pengujian atas kemungkinan terjadinya kesalahan. Proses perbaikan dilakukan terus- menerus hingga aplikasi yang dibuat relatif tidak memuat kesalahan (kesalahan yang mungkin muncul adalah kesalahan yang memang merupakan kelemahan dari algoritma Feature Point Extraction).

Hasilnya ialah sebuah aplikasi pengenalan huruf Hiragana yang lebih akurat.

5. Penyusunan Laporan Dalam tahap ini, peneliti menyusun laporan ilmiah tertulis tentang penelitian yang dilakukan, mulai dari tahap awal hingga akhir. Proses penyusunan laporan ini dapat dimulai bersamaan dengan dimulainya penelitian serta mengalami revisi sejalan dengan perubahan yang terjadi selama penelitian. Hasilnya ialah laporan ilmiah tertulis/skripsi.

1.7 Sistematika Penulisan

Berikut adalah garis besar dari isi karya ilmiah yang akan disusun:

BAB I PENDAHULUAN Bab I tersusun atas latar belakang masalah, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, metode penelitian, serta sistematika penulisan.

BAB II LANDASAN TEORI Bab II berisi tentang teori-teori yang dipakai dalam implementasi, contohnya adalah teori tentang pengolahan citra dan Feature Point Extraction .

BAB III DESAIN Pada bagian desain, berisi mengenai bagaimana rancangan dari aplikasi yang akan dibangun, misalnya ialah gambaran sistem

secara umum, desain proses, serta desain interface.

BAB IV HASIL DAN PEMBAHASAN Bab IV berisi mengenai hasil implementasi dari program yang dibuat serta pembahasannya. BAB V PENUTUP Penutup berisi tentang kesimpulan dan saran.

BAB II LANDASAN TEORI

2.1 Pengolahan Citra

2.1.1 Definisi Berikut ini adalah definisi mengenai pengolahan citra. Citra

adalah gambar dua dimensi yang dihasilkan dari gambar analog dua dimensi yang kontinu menjadi gambar diskrit melalui proses sampling. Gambar analog dibagi menjadi N baris dan M kolom sehingga menjadi gambar diskrit. Persilangan antara baris dan kolom tertentu disebut dengan piksel. Contohnya adalah gambar/titik diskrit pada baris n dan kolom m disebut dengan piksel [n,m].

Sampling adalah proses untuk menentukan warna pada piksel tertentu pada citra dari sebuah gambar yang kontinu. Pada proses sampling biasanya dicari warna rata-rata dari gambar analog yang kemudian dibulatkan. Proses sampling sering juga disebut proses digitasi.

Derau (noise) adalah gambar atau piksel yang mengganggu kualitas citra. Derau dapat disebabkan oleh gangguan fisis (optik) pada alat akuisisi maupun secara disengaja akibat proses pengolahan yang tidak sesuai. Contohnya adalah bintik hitam atau putih yang muncul secara acak yang tidak diinginkan di dalam citra. Bintik acak ini disebut dengan derau salt & pepper .

2.1.2 Preprocessing

Preprocessing merupakan suatu langkah dalam pengolahan citra yang perlu dilakukan untuk menghilangkan objek-objek yang tidak diperlukan, bahkan dapat mengganggu suatu citra, sehingga proses pengenalan pola dapat menjadi lebih akurat (Pearson, 2001: 96).

2.1.2.1 Thresholding

Dalam berbagai pemrosesan citra, sangat membantu jika dapat dipisahkan antara daerah/citra sebagai objek (yang dikehendaki) dari citra yang merupakan latar belakang (background) dari keseluruhan citra.

Thresholding memberikan kemudahan dalam melakukan segmentasi ini

berdasarkan perbedaan intensitas warna dari kedua citra tersebut.

Input dari thresholding dapat berupa citra grayscale ataupun berwarna. Dalam implementasi yang paling sederhana, outputnya merupakan citra biner yang merepresentasikan segmentasi. Piksel hitam menggambarkan background sedangkan piksel putih menggambarkan foreground

(atau bisa juga sebaliknya). Segmentasi dilakukan berdasarkan sebuah parameter yang disebut sebagai intensitas threshold. Tiap piksel dari suatu citra dibandingkan dengan parameter ini. Jika piksel citra nilainya lebih tinggi dari threshold, piksel tersebut diset menjadi putih atau bernilai 1 sebagai outputnya. Jika tidak, diset menjadi hitam atau bernilai 0 (atau sebaliknya).

Tidak semua citra dapat disegmentasi menggunakan thresholding yang sederhana. Bisa atau tidaknya sebuah citra disegmentasi dengan baik

ditentukan dengan melihat histogram intensitas dari citra. Jika

memungkinkan untuk memisahkan foreground dari citra berdasarkan

intensitas piksel maka intensitas piksel pada objek foreground harus

benar-benar berbeda dari intensitas piksel background. Dalam hal ini,

dapat dilihat dari perbedaan puncak dalam histogram.

Gambar 2.1 Jenis distribusi intensitas citraGambar 2.1 A) menunjukkan distribusi intensitas bi-modal. Citra ini dapat disegmentasi menggunakan threshold tunggal T1. Gambar 2.1 B)

terlihat lebih kompleks. Dianggap bahwa puncak di tengah merupakan

objek yang diinginkan maka segmentasi memerulukan dua threshold: T1

dan T2. Pada gambar 2.1 C), kedua puncak dari distribusi bi-modal

terlihat hampir sama maka hampir tidak mungkin untuk dapat melakukan

segmentasi dengan baik menggunakan threshold tunggal.

Gambar 2.2 Citra dengan distribusi intensitas yang jelasGambar 2.2 di atas menunjukkan distribusi bi-modal yang baik; pada histogram, puncak yang lebih rendah merepresentasikan objek,

sedangkan yang lebih tinggi merepresentasikan background.

Citra pada gambar 2.2 dapat disegmentasi menggunakan threshold

tunggal dengan nilai intensitas piksel 120. Hasilnya adalah seperti pada

gambar 2.3 sebagai berikut:Gambar 2.3 Hasil threshold yang baik

Tetapi dengan adanya gradasi pencahayaan yang cukup jelas,

seperti gambar 2.4 di bawah ini, puncak yang merepresentasikan

foreground dan background dapat tampak memiliki kesamaan, maka threshold yang sederhana tidak dapat memberikan hasil yang baik.

Gambar 2.4 Citra dengan distribusi intensitas yang hampir sama

Citra pada gambar 2.5 menunjukkan hasil segmentasi yang kurang

baik untuk threshold tunggal dari citra pada gambar 2.4 dengan nilai 80

Gambar 2.5 Hasil threshold yang kurang baik

Thresholding juga dapat dipakai untuk memfilter output maupun

input untuk operator lain. Sebagai contoh, deteksi tepi, seperti operasi

Sobel

, akan menandai daerah dari citra yang memiliki gradien tinggi. Jika

yang diinginkan hanya gradien di atas nilai tertentu (misalnya tepi yang

tajam), maka thresholding dapat digunakan hanya untuk menyeleksi

garis-garis yang tajam saja dan mengeset piksel lainnya menjadi hitam.

(a) (b) (c)

Gambar 2.6 Thresholding setelah operasi deteksi tepi

Pada gambar 2.6, gambar (a) merupakan gambar mula-mula,

kemudian dikenai operasi Sobel dan menghasilkan gambar (b). Hasil

akhirnya, yaitu gambar (c), diperoleh setelah gambar (b) dikenai

thresholding dengan nilai 60 (Fisher, 2003).

1. Dipilih sembarang nilai untuk inisalisasi awal threshold (T)

b. m

1 dan m

4. Nilai threshold baru diperoleh dari rata-rata m

2 = nilai rata-rata G

Berikut ini adalah langkah-langkah dalam melakukan iterative thresholding

a. m

1 = nilai rata-rata G

3. Rata-rata dari tiap bagian dihitung.

2 = {f(m,n):f(m,n)<T} (piksel background) Sebagai catatan, f(m,n) adalah nilai dari piksel yang terletak pada kolom ke-m dan baris ke-n.

b. G

1 = {f(m,n):f(m,n)>=T} (piksel objek)

2. Citra disegmentasi menjadi objek dan background, yang menghasilkan dua bagian: a. G

2 T’ = (m

2 )/2

5. Kembali ke langkah kedua, tetapi dengan menggunakan nilai threshold yang baru didapat dari langkah (4). Terus diulang sampai nilai threshold yang diperoleh sama dengan nilai threshold sebelumnya.

PERLUASAN METODE FEATURE POINT EXTRACTION UNTUK PENGENALAN HURUF JEPANG HIRAGANA SKRIPSI