PENGENALAN HURUF JEPANG HIRAGANA MENGGUNAKAN PERLUASAN METODE FEATURE POINT EXTRACTION

SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer

Program Studi Teknik Informatika Oleh: Yohanes Vandi Kurniawan

NIM: 055314050 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA

2012

JAPANESE HIRAGANA LETTER RECOGNITION USING THE EXTENSION OF

FEATURE POINT EXTRACTION METHOD A THESIS Presented as Partial Fulfillment of the Requirements to Obtain the Sarjana Komputer Degree in Informatics Engineering Study Program

By: Yohanes Vandi Kurniawan

ID: 055314050

INFORMATICS ENGINEERING STUDY PROGRAM FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY YOGYAKARTA 2012

HALAMAN PERSEMBAHAN

Kupersembahkan skripsi ini untuk:

Sang Tunggal Trinitas Yang Suci, Allah Bapa, Allah Putra, dan Allah

Roh Kudus, atas segala rahmat, kasih, perlindungan, dan bimbingan- Nya.

Papa, Mama, Cece, dan Titi, atas dukungan dan doa mereka.
Almamaterku Universitas Sanata Dharma, khususnya program studi Teknik Informatika.

Ada harga yang harus dibayar untuk bisa tumbuh dan berkembang, Bayarannya adalah komitmen.

(Ed Cole)

ABSTRAK

PENGENALAN HURUF JEPANG HIRAGANA

MENGGUNAKAN PERLUASAN METODE

FEATURE POINT EXTRACTION

Huruf Hiragana merupakan salah satu huruf tradisional sederhana yang

dipakai oleh bangsa Jepang untuk menuliskan kata-kata yang memiliki makna asli

dalam bahasa Jepang, yang seringkali digunakan bersama huruf Kanji yang lebih

rumit penulisannya. Walaupun termasuk huruf yang lebih sederhana dibandingkan

huruf Kanji, tetapi huruf Hiragana memiliki tingkat kerumitan diatas huruf latin,

sehingga lebih sulit untuk dipelajari dan dikenali.

Dalam mengenali suatu obyek dibutuhkan proses pembelajaran, yang

didapatkan berdasarkan ciri-ciri dan pengalaman yang didapatnya dari

pengalaman mengamati obyek yang serupa. Dalam implementasi di bidang

komputasi, hal ini disebut pengenalan pola, dan salah satu metode untuk

mendapatkan ciri-ciri suatu obyek adalah dengan perluasan metode Feature Point

Extraction .

Dalam Feature Point Extraction, digunakan tabel hubungan ketetanggaan

antarpiksel. Matriks yang didapat dari karakter input dicocokkan dengan tabel

untuk mendapatkan nilai tertentu, kemudian dihitung selisihnya dengan tiap

template . Dalam menghitung selisih antara input dan template digunakan metode

selisih jarak Euclidean yang memakai ciri tiap obyek. Karakter input yang

memiliki selisih jarak paling kecil lkemudian digolongkan sebagai huruf yang

sama dengan template tersebut.

ABSTRACT

JAPANESE HIRAGANA LETTER RECOGNITION

USING THE EXTENSION OF

FEATURE POINT EXTRACTION METHOD

Hiragana letter were a traditional letter which Japanese use to write down

words that have a real meaning in Japanese words, which also often met together

with Kanji letter in daily use, which is more complicated ones. Even though it is

simpler compared to Kanji, Hiragana has more complex grade compared to those

latin letters, which result in difficulties for learnt and recognized.

In recognizing an object, it is necessary to get a learning progress, which

comes from the result of observing the same kind of object and get features from

it. In computational implementation, those named “pattern recognition”, and one

of the methods for getting those feature were Feature Point Extraction.

In Feature Point Extraction method, a numeration of possible pixel

neighborhood were used, The matrix which got from the input character were

compared to the table, thus result in some value. Those value then being used by

subtracting the input value with all templates value. When calculating a

subtraction of those two, we used Euclidean distance method which uses each

value of both input and templates object. The input and a template which has more

less distance value compared to others then concluded as a same letter.

KATA PENGANTAR

Puji dan syukur kepada Allah Bapa Yang Maha Kuasa karena atas

penyertaan-Nya penulis dapat menyelesaikan tugas akhir yang berjudul

“PENGENALAN HURUF JEPANG HIRAGANA MENGGUNAKAN

PERLUASAN METODE FEATURE POINT EXTRACTION“.

Adapun tugas akhir ini ditulis untuk memenuhi salah satu syarat

memperoleh gelar Sarjana Komputer pada Program Studi Teknik Informatika,

Fakultas Sains dan Teknologi, Universitas Sanata Dharma Yogyakarta.

Penulis mendapat banyak sekali bantuan selama awal perkuliahan sampai

dengan selesainya masa studi di Universitas Sanata Dharma ini. Oleh karena itu,

pada kesempatan ini, penulis ingin mengucapkan rasa syukur dan terima kasih

sebesar-besarnya kepada:

1. Bu Rosa selaku dekan Fakultas Sains dan teknologi, Bu Rido selaku Kaprodi Teknik Informatika, Pak Wawan selaku dosen pembimbing akademik, dan Pak Eko Hari selaku dosen pembimbing TA, serta pihak sekretariat atas pelayanan administrasinya selama ini. Terima kasih atas bimbingan dan bantuannya kepada penulis selama masa perkuliahan, khususnya masa-masa skripsi.

2. Papa, Mama, Cece, dan Titi yang tak henti-hentinya memberikan doa, dukungan moral dan materi.

3. Para kerabat dari keluarga besar Njoo Khay Liem yang selama ini telah banyak memberikan banyak dorongan motivasi, dan bantuan doa serta materi yang melimpah sehingga studi ini dapat diselesaikan: Ik Po Lik, Wa

I De, Wa I Eng, Wa I Lie, Ik Lik, dan keluarga lainnya yang selalu memberi bantuan dan perhatian melimpah selama studi.

4. Para kerabat dari keluarga besar Tjioe Swie Lien yang selama ini telah banyak memberikan banyak dorongan motivasi, dan bantuan doa serta materi yang melimpah: Ama A Tjan, Cek Gie, Kho Beng, Kho Eng, dan

kerabat lainnya yang memberi dukungan dan perhatian selama studi.

5. Semua kerabatku yang sudah dipanggil Tuhan atas pertolongan dan perhatian mereka padaku selama hidup dan juga sampai saat ini: Ang Kong Swie Lin, Gua Kong Khay Liem, Gua Ma Lian Hwa, Po Ngah, Ik Liang, Thio A Hwie, dan semuanya yang tidak dapat kusebutkan satu- persatu.

6. Semua teman-teman yang telah banyak membantu dan mendukung, menyemangati dan mendorong, sehingga penulis dapat menyelesaikan studi ini. “Hanyou” wimon atas bantuannya yang teramat banyak, teman- teman TI seperjuangan Sesar, Yunianto, Ricky, Alex, Kartono, Fendy, Charles, dan semua teman yang tentunya sangat membantu tetapi belum

7. Bapak T.C. Hardiono dari kost Tasura, serta Mbak Santhi dan Mas Agung dari kost Sawahan yang telah memberikan lebih dari sekedar tumpangan tempat tinggal.

Penulis memohon maaf atas segala kesalahan yang ada dan bersedia

menerima masukan demi kemajuan yang lebih baik. Akhir kata, penulis berharap

semoga karya ini berguna bagi para pembaca sekalian. Terima kasih.

Yogyakarta, Juli 2012 Penulis

DAFTAR ISI

halaman

Halaman Judul ………………………………………………………… i

Title …………………………………………………………………… ii

Halaman Persetujuan …………………………………………………… iii

Halaman Pengesahan …………………………………………………… iv

Halaman Pernyataan Keaslian Karya …..……………………………… v

Halaman Persembahan ………………………………………………… vi

Halaman Motto ………………………………………………………… vii

Halaman Persetujuan Publikasi ……………………………………… viii

Abstrak ………………………………………………………………… ix

Abstract

………………………………………………………………… x

Kata Pengantar ………………………………………………………… xi

Daftar Isi ………………………………………………………………… xiv

Daftar Gambar ………………………………………………………… xviii

Daftar Tabel …………………………………………………………… xxi

BAB I PENDAHULUAN ……………………………………………

1.1 Latar Belakang Masalah ……………………………………

1.2 Rumusan Masalah …………………………………………

1.3 Batasan Masalah ……………………………………………

1.4 Tujuan Penelitian ……..……………………………………

1.5 Manfaat Penelitian …………………………………………

1.6 Metodologi Penelitian ………………………………………

1.7 Sistematika Penulisan ………………………………………

6 BAB II LANDASAN TEORI …………………………………………….

2.1 Pengolahan Citra ……………………………………………

8 2.3.1 Definisi ........................................................................

8 2.3.2 Preprocessing ................................................................

9 2.3.3 Thesholding ..................................................................

9 2.2 Feature Point Extraction .......................................................

14 2.3 Template Matching ................................................................

21 2.4 Jarak Minimum Euclidean .....................................................

2.5 Huruf Hiragana …………………………………………

26 BAB III ANALISIS DAN PERANCANGAN SISTEM ............................

3.1 Gambaran Sistem ............................................……………… 29

3.2 Desain Proses ……………………………………………...... 33

3.3 Analisis Kebutuhan ……………………………………...….. 38 3.4 Logical Design ……….…………………………………….

3.5 Navigasi Menu ……………………………………………… 42

3.6 Desain User Interface………………………………………… 44

3.7 Spesifikasi Perangkat Pembangun Sistem…………………… 51

3.8 Spesifikasi Perangkat untuk Menjalankan Sistem ………….. 52

6.1 Kesimpulan …………………………………………………

BAB VI PENUTUP ……………………………………………………

5.1 Hasil Pengujian Karakter ……………………………………. 66

BAB V ANALISIS HASIL DAN KESIMPULAN ………………....….. 66

4.2.7 Menu Hasil Pengolahan Citra …..…….…….………… 65

4.2.6 Menu Pemberitahuan Kesalahan ……….….………… 64

4.2.5 Menu Pemilihan Gambar ………….……….…….….. 63

4.2.4 Menu tentang Program …..……...………….……….. 62

4.2.3 Menu Daftar Tabel Hiragana ………….…………….. 61

59 4.2.2 Menu Bantuan Aplikasi ………...………….………..

BAB IV IMPLEMENTASI SISTEM ……………………………………

4.2 Implementasi Interface ……………………………………… 59 4.2.1 Cover Menu Utama ………….……………………..

4.1.5 Proses Penghitungan Persentase Kemiripan …….…. 58

4.1.4 Proses Penghitungan Jarak Euclidean …...…….…... 55

4.1.3 Proses Ekstraksi Ciri ……………………..………… 54

4.1.2 Proses Segmentasi Citra ……………………………. 53

4.1.1 Proses Binerisasi …………………………….………

4.1 Implementasi Proses ………………………………………

6.2 Saran ….. …………………………………………………

68 DAFTAR PUSTAKA …………………………………………………….

69 LAMPIRAN ………………...…………………………………………….

70 Citra Template …………………………………………………….. 71 Citra Pengujian ………….……………………………………….

DAFTAR GAMBAR

halaman

18 Gambar 2.10 Skema template matching secara umum …………....……… 22

28 Gambar 2.17 Karakter penggabungan dua huruf Hiragana ………………

27 Gambar 2.16 Karakter-karakter tambahan Hiragana …………………

26 Gambar 2.15 Karakter dasar Hiragana dan Katakana ……………………

25 Gambar 2.14 Perbandingan penulisan Hiragana dan Katakana …………

24 Gambar 2.13 Rumus Jarak Euclidean ………………………………………

22 Gambar 2.12 Digram jarak antara dua titik ………………………………

Gambar 2.11 Contoh template dari obyek huruf dan obyek wajah .………

18 Gambar 2.9 Karakter-karakter yang dipecah menjadi 9 bagian ..………

Gambar 2.1 Jenis distribusi intensitas citra ……………………………Gambar 2.8 Karakter huruf input S dan E ………………………………

13 Gambar 2.7 Pemecahan matriks 9x9 menjadi 9 bagian ....……………… 17

12 Gambar 2.6 Thresholding setelah operasi deteksi tepi …………………

12 Gambar 2.5 Hasil threshold yang kurang baik …………………………

11 Gambar 2.4 Citra dengan distribusi intensitas yang hampir sama ………

11 Gambar 2.3 Hasil threshold yang baik …………………………………

10 Gambar 2.2 Citra dengan distribusi intensitas yang jelas ………………

Gambar 3.1 Diagram gambaran sistem secara umum …………………

31 Gambar 3.2 Diagram pemrosesan citra ……….………………………… 32

Gambar 3.3 Diagram pembagian segmentasi ……………………………

33 Gambar 3.4 Diagram proses segmentasi menjadi 9 bagian ……………… 33

Gambar 3.5 Diagram proses pencocokan dengan tabel ………………… 34Gambar 3.6 Diagram proses penghitungan jarak Euclidean …………… 35Gambar 3.7 Diagram proses penghitungan persentase kemiripan ……… 36Gambar 3.8 Diagram Use Case …………………………………………

37 Gambar 3.9 Context Diagram …………………………………………

38 Gambar 3.10 Data Flow Diagram level 1 ………………………………

38 Gambar 3.11 Data Flow Diagram level 2 proses pengolahan data gambar

39 Gambar 3.12 Entity Relationship Diagram ………………………………

40 Gambar 3.13 Navigasi menu …………………………………………

41 Gambar 3.14 Desain interface Home …………………………………

43 Gambar 3.15 Desain interface Input Gambar …………………………

44 Gambar 3.16 Desain interface Kesimpulan pengenalan pola ……………

45 Gambar 3.17 Desain interface Pemberitahuan Kesalahan ………………

46 Gambar 3.18 Desain interface Daftar Hiragana …………………………

47 Gambar 3.19 Desain interface Tentang Program …………………………

48 Gambar 3.20 Desain interface Bantuan ……..………………………… 49

Gambar 4.1 Tampilan Menu Utama Aplikasi ………………………… 59Gambar 4.2 Tampilan Menu Bantuan Aplikasi ……………………… 60Gambar 4.3 Tampilan Daftar Tabel Hiragana …………………………

Gambar 4.4 Tampilan Menu Tentang Program ………………………. 62Gambar 4.5 Tampilan Menu Pemilihan Gambar ……………………… 63Gambar 4.6 Tampilan Menu Pemberitahuan Kesalahan ……….……… 64Gambar 4.7 Tampilan Menu Hasil Pengolahan Citra ………………… 65

DAFTAR TABEL

Halaman

Tabel 2.1 Tabel hubungan ketetanggaan antarpiksel, piksel pada posisi (2,2) bernilai 0 ……………………………

16 Tabel 2.2 Tabel hubungan ketetanggaan antarpiksel, piksel pada posisi (2,2) bernilai 1 ……………………………

19 Tabel 2.3 Tabel hasil nilai tiap segmen ……...…………………………… 20

Tabel 5.1 Tabel hasil pengujian karakter ………………………………

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Penginderaan adalah salah satu kemampuan alami manusia yang memungkinkan manusia untuk membedakan suatu hal dengan hal lainnya. Dalam perkembangan selanjutnya, pembedaan yang dilakukan manusia

menyebabkan terjadinya suatu klasifikasi. Suatu obyek yang memiliki tingkat kemiripan yang tinggi berdasarkan kategori yang ditentukan oleh manusia itu sendiri, akan dikelompokkan menjadi suatu kumpulan obyek yang sejenis. Suatu contoh dari kemampuan pengindraan itu sendiri adalah kemampuan manusia untuk membedakan dan mengklasifikasikan sebuah obyek bernama kursi. Fungsi, karakteristik, dan ciri-ciri dari obyek kursi yang selama ini telah dilihat manusia tersebut disimpan di dalam ingatan manusia tersebut, dan mengalami proses generalisasi. Sehingga, meskipun dia tidak melihat semua jenis kursi yang ada, namun ia akan tetap dapat mengidentifikasi setiap obyek kursi yang ia lihat.

Kemampuan penginderaan manusia tersebut juga telah mengembangkan tingkat pola pikir manusia, dan salah satu hasil dari perkembangan pikiran manusia adalah komputer. Sejalan dengan perkembangan pola pikir manusia, komputer juga terus berkembang. Dari komputer yang hanya berfungsi sebagai alat bantu hitung, semakin berkembang menjadi perangkat yang memiliki kecerdasan buatan seperti manusia, yang dapat membantu melakukan pekerjaan-pekerjaan yang kompleks seperti mengidentifikasi tanda tangan, mengidentifikasi wajah, mengidentifikasi tulisan/huruf, dsb. Metode-metode yang dipakai dalam mengidentifikasi pola-pola tersebut ada bermacam-macam, misalnya Jaringan Syaraf Tiruan, Logika Kabur, Pendekatan menggunakan statistik, dan sebagainya.

Selain perkembangan pola pikir, adanya kemampuan penginderaan telah menimbulkan peningkatan pola pikir manusia dan munculnya suatu unsur seni, dan akibat dari hal tersebut adalah muncul dan berkembangnya kebudayaan. Salah satu kebudayaan yang muncul akibat adanya perubahan dalam pola pikir dan unsur seni manusia adalah kebudayaan jepang. Kebudayaan Jepang klasik mulai berkembang pada abad ke-3, ketika penduduk Jepang mulai berinteraksi dengan kekaisaran di China. Dari proses interaksi tersebut tercipta suatu sistem penulisan baru di Jepang, antara lain Hiragana, Katakana, dan Kanji. Huruf hiragana, adalah suatu huruf yang dikembangkan dari karakter huruf China. Huruf dasar dari Hiragana berjumlah 46, dan dikembangkan dari tulisan kaligrafi China yang mengalami penyederhanaan. Karena bentuk dan cara penulisannya yang berbeda dari aksara latin, maka pada umumnya peminat bahasa Jepang harus melakukan suatu penyesuaian tersendiri akibat tingkat kerumitan huruf Hiragana yang lebih tinggi dari tulisan latin.

Berdasarkan permasalahan yang telah diungkapkan sebelumnya, maka penulis ingin membuat suatu aplikasi yang dapat mengenali huruf Hiragana dengan menggunakan menggunakan rumus pengukuran jarak Euclidean . Metode ini adalah suatu metode yang menentukan tingkat kemiripan suatu data dengan cara mengukur jarak berdasarkan rumus tertentu. Tolak ukur dalam mengelompokkan data tersebut diambil dari “ciri” yang didapat dari data tersebut. Sebagai jalan untuk mendapatkan ciri tersebut, digunakan metode ekstraksi ciri bernama Feature Point Extraction untuk mengambil “ciri” yang nantinya akan digunakan untuk mengenali huruf Jepang Hiragana.

1.2. Rumusan Masalah

Rumusan masalah yang muncul dalam pembuatan aplikasi ini adalah sebagai berikut: Bagaimana cara mengenali karakter huruf Jepang Hiragana dengan menggunakan Feature Point Extraction dan metode pengukuran jarak Euclidean ? 1.3.

Batasan Masalah Beberapa batasan masalah dalam aplikasi pengenalan huruf Jepang

Hiragana ini adalah sebagai berikut:

1. Metode yang digunakan untuk mengenali huruf Jepang Hiragana adalah metode perbandingan dengan mengukur jarak Euclidean.

2. Proses pengambilan ciri menggunakan perluasan metode Feature Point Extraction

3. Pengenalan huruf Jepang Hiragana ini dibuat dengan menggunakan aplikasi pemrograman MatLab.

4. Data huruf Jepang Hiragana yang akan diklasifikasikan berupa file gambar yang berekstensi *.jpg, *.jpeg, atau *.bmp

5. Aplikasi yang dibangun untuk mengenali huruf Jepang Hiragana hanya dapat menginputkan satu karakter untuk setiap pemasukan hurufnya.

6. Huruf Jepang Hiragana yang akan dikenali adalah 5 karakter dari huruf Hiragana dasar yaitu ”ma”, ”mi”, ”mu”, ”me”, dan ”mo”.

1.4. Tujuan Penelitian

Tujuan yang akan dicapai dalam penelitian ini adalah:

Membangun sebuah aplikasi untuk mengenali lima jenis huruf Jepang Hiragana dengan menggunakan perluasan Metode Feature Point Extraction dan metode pengukuran jarak Euclidean.

1.5. Manfaat Penelitian

1. Membantu pengguna aplikasi dalam mengenali huruf Jepang Hiragana .

2. Membantu pengguna dalam mengetahui derajat kebenaran huruf Jepang Hiragana.

1.6. Metodologi Penelitian

Metodologi penelitian yang digunakan dalam penelitian ini adalah:

1. Studi Pustaka Dalam menyusun penelitian ini, penyusun mempelajari buku dan literatur-literatur dari internet mengenai Feature Point Extraction, pemrograman MatLab, jarak Euclidean, dan aksara Jepang Hiragana, yang selanjutnya akan dimanfaatkan sebagai dasar dalam membangun perangkat lunak yang diuji coba dalam laboratorium komputer.

2. Metode Perancangan Perangkat Lunak Waterfall

1. Analisis Kebutuhan Yang dilakukan dalam tahapan ini adalah mengumpulkan sampel huruf Jepang Hiragana dalam berbagai jenis gaya penulisan. Pengumpulan sampel data berupa huruf Jepang akan dilakukan dengan membagi-bagikan contoh karakter huruf Hiragana kepada banyak orang untuk ditulis ulang. Sampel yang diperoleh ini akan digunakan sebagai template untuk pengenalan huruf Hiragana.

Selain hal tersebut, peneliti mengumpulkan dan meninjau berbagai referensi mengenai rumus jarak Euclidean dan ekstraksi ciri pengenalan huruf Hiragana, yaitu, baik secara teoritis maupun secara praktis. Hasilnya ialah berbagai macam sampel huruf Hiragana serta referensi mengenai ekstraksi ciri menggunakan Feature Point Extraction .

2. Desain Sistem Dalam perancangan sistem, peneliti mulai melakukan proses perancangan sistem dengan membuat diagram alur data/ Data Flow Diagram (DFD), ER Diagram, serta penyusunan tampilan antarmuka dan berbagai tombol/fungsi yang akan digunakan untuk membangun sebuah aplikasi yang dapat mengenali huruf Hiragana, baik untuk input maupun output. Hasil akhir yang menjadi tujuan dalam tahap ini adalah terciptanya suatu desain sistem dan rancangan tampilan antarmuka lengkap dengan sarana untuk input dan output yang ditujukan bagi pemakai sistem, walaupun fasilitas input dan output tersebut masih belum berfungsi sepenuhnya.

3. Implementasi/Coding Dalam tahap ini, metode ekstraksi ciri menggunakan Feature Point Extraction dan pengukuran jarak Euclidean mulai diimplementasikan ke dalam sistem sesuai dengan rancangan dan desain sistem yang telah disusun dalam tahap sebelumnya. Hasil yang akan dicapai adalah terciptanya suatu aplikasi yang dapat mengenali huruf Hiragana dan memberikan output kepada pemakai sistem.

4. Integrasi dan Testing Sistem Dalam tahap integrasi dan testing sistem ini, dilakukan pengujian terhadap aplikasi yang telah dibangun dengan tujuan untuk dapat menemukan kemungkinan terjadinya kesalahan dalam sistem.

Proses evaluasi akan dilakukan secara berkesinambungan sehingga sistem yang dibangun relatif lebih akurat daripada sebelumnya. Hasil yang ingin dicapai dalam tahap ini adalah terciptanya sebuah aplikasi

yang dapat mengenali huruf Hiragana secara lebih akurat.

5. Pemeliharaan Sistem Dalam tahap pemeliharaan sistem ini, kesalahan dan kekurangan sistem yang telah ditemukan akan berusaha diatasi, sehingga program yang telah dihasilkan akan menjadi lebih sempurna.

1.7. Sistematika Penulisan

Berikut adalah garis besar dari isi karya ilmiah yang akan disusun:

BAB I PENDAHULUAN Bab I membahas tentang latar belakang masalah, rumusan

masalah, batasan masalah, tujuan penelitian, manfaat penelitian,

BAB II LANDASAN TEORI Bab II membahas tentang teori-teori yang melandasi penelitian, seperti teori tentang pengolahan citra dan metode pengukuran jarak Euclidean.

BAB III ANALISIS DAN PERANCANGAN SISTEM Bab III membahas tentang analisa dan perancangan sistem, yang berisi bagaimana rancangan aplikasi yang akan dibangun, meliputi gambaran sistem secara umum, desain proses, analisis kebutuhan, Data Flow Diagram, ER Diagram, desain interface, serta kebutuhan Hardware dan Software.

BAB IV IMPLEMENTASI SISTEM Bab IV berisi hasil implementasi dari program yang dibuat serta pembahasannya. BAB V ANALISIS HASIL DAN PEMBAHASAN Bagian analisis hasil implementasi ini berisikan analisa dari implementasi yang telah dibuat. BAB VI PENUTUP Penutup berisi tentang kesimpulan dan saran dari hasil dari penelitian ini.

BAB II LANDASAN TEORI Penyusunan tugas akhir ini membutuhkan beberapa landasan teori yang

digunakan sebagai acuan dalam memahami dan mengimplementasikan metode

pengukuran jarak Euclidean untuk mengenali citra berupa huruf Jepang Hiragana,

antara lain: Pengolahan citra, Feature Point Extraction, Template Matching, Jarak

Euclidean, dan Huruf Hiragana.

2.1 Pengolahan Citra

2.1.1 Definisi Berikut ini adalah definisi mengenai pengolahan citra.

Citra adalah istilah lain untuk gambar, yang merupakan salah satu komponen multimedia yang memegang peranan sangat penting sebagai bentuk informasi visual. Secara harafiah, citra adalah gambar pada bidang dwimatra (dua dimensi), sedangkan ditinjau dari sudut pandang matematis, citra merupakan fungsi menerus (continue) dari intensitas cahaya pada bidang dwimatra (Munir, 2004).

Digitalisasi Citra adalah proses untuk merepresentasikan suatu citra secara numerik dengan nilai-nilai diskrit. Representasi citra dari fungsi kontinu menjadi nilai-nilai diskrit yang dinamakan digitalisasi inilah yang disebut dengan citra digital (Munir, 2004).

Derau (noise) adalah gambar atau piksel yang mengganggu kualitas citra. Derau dapat disebabkan oleh gangguan fisis (optik) pada alat akuisisi maupun secara disengaja akibat proses pengolahan yang tidak sesuai. Contohnya adalah bintik hitam atau putih yang muncul secara acak yang tidak diinginkan di dalam citra. Bintik acak ini disebut dengan derau salt & pepper . Noise tidak dapat ditebak secara tepat karena sifatnya yang acak namun dapat dikarakterisasikan dengan efeknya pada sebuah citra.

(Parker, 1997).

2.3.2 Preprocessing Preprocessing merupakan suatu proses awal yang dilakukan untuk memperbaiki kualitas citra (edge enhancement) dengan menggunakan teknik-teknik pengolahan citra (Munir, 2004). Beberapa proses yang termasuk dalam preprocessing ini adalah pengubahan histogram citra, penapisan derau (noise filtering), dan pengubahan geometrik.

2.3.3 Thresholding Dalam berbagai pemrosesan citra, sangat membantu jika dapat dipisahkan antara daerah/citra sebagai objek (yang dikehendaki) dari citra yang merupakan latar belakang (background) dari keseluruhan citra.

Thresholding memberikan kemudahan dalam melakukan segmentasi ini berdasarkan perbedaan intensitas warna dari kedua citra tersebut (Fisher, 2003).

Input dari ari thresholding dapat berupa citra grayscale ataupun berwarna. Dalam m implementasi yang paling sederhana, ou outputnya merupakan citra bi biner yang merepresentasikan segmentasi. Piks ksel hitam menggambarkan b background sedangkan piksel putih menggam gambarkan foreground (atau bi bisa juga sebaliknya). Segmentasi dilakukan berd erdasarkan sebuah parameter y er yang disebut sebagai intensitas threshold. Tia Tiap piksel dari suatu citra di dibandingkan dengan parameter ini. Jika piks iksel citra nilainya lebih tingg nggi dari threshold, piksel tersebut diset menja njadi putih atau bernilai 1 seb sebagai outputnya. Jika tidak, diset menjadi hit hitam atau bernilai 0 (atau seba ebaliknya).

Tidak semu ua citra dapat disegmentasi menggunakan thresho hresholding yang sederhana. Bis Bisa atau tidaknya sebuah citra disegmentasi deng engan baik ditentukan dengan gan melihat histogram intensitas dari citra itra. Jika memungkinkan un untuk memisahkan foreground dari citra berd erdasarkan intensitas piksel m maka intensitas piksel pada objek foreground ground harus benar-benar berbed beda dari intensitas piksel background (Fisher er, 2003).

Dalam hal ini, dapa pat dilihat dari perbedaan puncak dalam histogram ogram .

Gambar 2.1 a) menunjukkan distribusi intensitas bi-modal. Citra ini dapat disegmentasi menggunakan threshold tunggal T1. Gambar 2.1 b)

terlihat lebih kompleks. Dianggap bahwa puncak di tengah merupakan objek yang diinginkan maka segmentasi memerulukan dua threshold: T1 dan T2. Pada gambar 2.1 c), kedua puncak dari distribusi bi-modal terlihat hampir sama maka hampir tidak mungkin untuk dapat melakukan segmentasi dengan baik menggunakan threshold tunggal.

Gambar 2.2 Citra dengan distribusi intensitas yang jelasGambar 2.2 di atas menunjukkan distribusi bi-modal yang baik; pada histogram, puncak yang lebih rendah merepresentasikan objek,

sedangkan yang lebih tinggi merepresentasikan background.

Citra pada gambar 2.2 dapat disegmentasi menggunakan threshold tunggal dengan nilai intensitas piksel 120. Hasilnya adalah seperti pada

gambar 2.3 sebagai berikut:Gambar 2.3 Hasil threshold yang baik Tetapi dengan adanya gradasi pencahayaan yang cukup jelas, seperti gambar 2.4 di bawah ini, puncak yang merepresentasikan foreground dan background dapat tampak memiliki kesamaan, maka

threshold yang sederhana tidak dapat memberikan hasil yang baik.

Gambar 2.4 Citra dengan distribusi intensitas yang hampir sama

Citra pada gambar 2.5 menunjukkan hasil segmentasi yang kurang baik untuk threshold tunggal dari citra pada gambar 2.2 dengan nilai 80 dan 120 berturut-turut:

Gambar 2.5 Hasil threshold yang kurang baik

Thresholding juga dapat dipakai untuk memfilter output maupun input untuk operator lain. Sebagai contoh, deteksi tepi, seperti operasi Sobel , akan menandai daerah dari citra yang memiliki gradien tinggi

Jika yang dii diinginkan hanya gradien di atas nilai tertentu (mi (misalnya tepi yang tajam), ), maka thresholding dapat digunakan hany nya untuk menyeleksi garis-g garis yang tajam saja dan mengeset piksel el lainnya menjadi hitam.

(a) (b) (c) (c) Gamba bar 2.6 Thresholding setelah operasi deteksi te i tepi Pada gamb bar 2.6, gambar (a) merupakan gambar mu ula-mula, kemudian dikenai ai operasi Sobel dan menghasilkan gambar (b (b). Hasil akhirnya, yaitu g gambar (c), diperoleh setelah gambar (b)

b) dikenai thresholding dengan n gan nilai 60 (Fisher, 2003).

Berikut ini ni adalah langkah-langkah dalam melakukan n iterative thresholding :

1. Dipilih s ilih sembarang nilai untuk inisalisasi awal threshold shold (T)

2. Citra d disegmentasi menjadi objek dan background round , yang menghas hasilkan dua bagian: a. G G 1 = {f(m,n):f(m,n)>=T} (piksel objek)

b. G G 2 = {f(m,n):f(m,n)<T} (piksel background) Seba bagai catatan, f(m,n) adalah nilai dari piks iksel yang terlet erletak pada kolom ke-m dan baris ke-n.

3. Rata-rata dari tiap bagian dihitung.

a. m 1 = nilai rata-rata G

b. m = nilai rata-rata G

4. Nilai threshold baru diperoleh dari rata-rata m

1 dan m

2 T’ = (m +m )/2

5. Kembali ke langkah kedua, tetapi dengan menggunakan nilai threshold yang baru didapat dari langkah (4). Terus diulang sampai nilai threshold yang diperoleh sama dengan nilai threshold sebelumnya.

2.2 Feature Point Extraction

Yang dimaksudkan dengan feature point ialah suatu titik dari citra yang diperhatikan oleh manusia. Titik dapat merupakan perpotongan antara dua garis, atau merupakan sebuah pojok, atau juga hanya titik begitu saja. Titik-titik ini dapat membantu dalam mendefinisikan suatu keterhubungan dalam dua garis yang berbeda. Dua garis dapat saja bersilangan penuh satu dengan yang lain, berpotongan seperti dalam huruf “Y” atau “T”, membentuk sebuah pojok, atau tidak berpotongan sama sekali. Orang-orang cenderung sensitif dengan keterhubungan semacam ini; susunan titik-titik sedemikian rupa yang membentuk sebuah huruf “Z” lebih diperhatikan daripada jumlah titiknya. Jenis keterhubungan inilah yang digunakan dalam pengenalan karakter (Brown, 1992). Algoritma-algoritma yang banyak digunakan dalam OCR (Optical Character Recognition) mampu memberikan tingkat keakuratan yang tinggi dan cepat, tetapi tetap saja hampir semuanya melakukan kesalahan yang tidak masuk akal dari sudut pandang manusia. Jika kesalahannya dalam membedakan karakter “5” dengan “S”, masih termasuk wajar karena kemiripan kedua karakter tersebut. Tetapi kesalahan dalam membedakan “5” dari “M” sangat di luar dugaan. Kesalahan semacam ini disebabkan karena algoritma-algoritma tersebut umumnya lebih memperhatikan sekumpulan ciri-ciri yang berbeda dari sudut pandang manusia untuk keperluan komputasi (Brown, 1992).

Kesalahan dalam mengenali karakter juga disebabkan oleh karena terbatasnya jumlah ciri yang dikumpulkan. Apabila ciri-ciri dari karakter diperbanyak maka keakurasian akan meningkat (Brown, 1992).

Algoritma ini pada dasarnya membandingkan susunan piksel dalam tiap matriks biner 3x3 dengan tabel yang memuat nilai-nilai untuk tiap kemungkinan susunan piksel tersebut. Yang dibandingkan ialah matriks yang memiliki piksel di posisi (2,2) bernilai 0 atau berwarna hitam saja.

Karena piksel tersebut memiliki 8 tetangga dan tiap tetangga memiliki

8 kemungkinan bernilai 0 atau 1 maka seluruhnya memiliki 256 (2 ) kemungkinan susunan piksel. Nilai yang ada dalam tabel bernilai 0 sampai dengan 255 (Brown, 1992).

Tabel 2.1 Tabel hubungan ketetanggaan antarpiksel, piksel pada posisi (2,2) bernilai 0

PENGENALAN HURUF JEPANG HIRAGANA MENGGUNAKAN PERLUASAN METODE FEATURE POINT EXTRACTION