Data Acquisition Preprocessing LANDASAN TEORI

dapat kita peroleh matriks proyeksi horizontalnya adalah [ 0 6 7 6 6 6 7 0 ]. Berdasarkan hasil dari matriks tersebut dapat disimpulkan bahwa batas paling atas pada objek tersebut berada pada baris ke-2 dan batas paling bawah berada pada baris ke-7. Secara visual, hasil dari projection profile vertical dan horizontal projection dapat dinyatakan sebagai berikut: Gambar 2.11 Projection Profile dari Citra Aksara Pa dan Ra Gambar 2.11 adalah representasi citra hasil projection profile terhadap Gambar 2.10. Gambar sebelah kiri adalah aksara pa dan sebelah kanan adalah aksara ra yang telah tersegmentasi dengan baik. Dengan projection profile maka kita dapat memisahkan masing-masing aksara yang menyusun sebuah kata pada citra nama jalan. 2.5.5 Resizing Resizing atau mengubah ukuran citra merupakan sebuah cara untuk mengubah dimensi citra dengan ukuran tertentu sehingga informasi pixel dari citra tersebut juga berubah. Sebagai contoh, ketika ukuran citra diperkecil maka informasi pixel yang tidak dibutuhkan akan dihilangkan sedangkan ketika ukuran citra diperbesar maka akan ditambahkan informasi pixel baru untuk memperoleh ukuran citra yang lebih besar.

2.6 ICZ-ZCZ

ICZ merupakan kependekan dari Image Centroid and Zone. Ekstraksi ciri ICZ pada dasarnya bekerja dengan mencari titik centroid dari citra kemudian citra dibagi menjadi n zona yang sama. Jika citra sudah dibagi kedalam n zona kemudian menghitung jarak antara masing-masing pixel yang ada disetiap zona dengan titik centroid-nya. Total nilai jarak yang ada disetiap zona merupakan nilai rerata dari jarak semua pixel di zona tersebut. Hasil dari ekstraksi ciri ICZ akan menghasilkan n fitur dari objek tersebut. ZCZ merupakan kependekan dari Zone Centroid and Zone. Ekstraksi ciri ZCZ bekerja dengan membagi citra menjadi n zona kemudian masing- masing zona dihitung titik centroid-nya masing-masing. Setelah didapatkan titik centroid kemudian menghitung jarak semua pixel di zona tersebut dengan titik centroid. Total nilai jarak yang diperoleh di tiap zona merupakan rerata semua jarak yang dihasilkan. Langkah tersebut diulang sebanyak n zona yang ada sehingga hasil dari ekstraksi ciri ZCZ menghasilkan n fitur. Perbedaan yang mendasar dari ekstraksi ciri ICZ dan ZCZ adalah penghitungan centroid dan pembagian zona yang dilakukan. ICZ bekerja dengan mencari titik centroid-nya terlebih dahulu kemudian citra dibagi kedalam n zona yang sama sehingga akan didapatkan satu titik centroid sedangkan ZCZ membagi n zona citra kemudian masing-masing zona dicari titik centroid-nya sehingga didapatkan centroid sebanyak jumlah zona yang ada. ICZ-ZCZ merupakan gabungan dari kedua ekstraksi ciri tersebut sehingga hasil dari ekstraksi cirinya akan diperoleh sebanyak 2n fitur. Rumus yang digunakan untuk mencari titik centroid dapat dinyatakan sebagai berikut: � = ∑ . � = ∑ � = 2.5 � = ∑ . � = ∑ � = 2.6 Dengan: x c = centroid pada koordinat x y c = centroid pada koordinat y x i = koordinat titik x ke-i y i = koordinat titik y ke-i p i = nilai pixel pada titik ke-i Dalam penghitungan jarak antara centroid dengan nilai pixel yang ada di dalam zona menggunakan perhitungan jarak Euclidean distance dengan rumus seperti pada persamaan 2.7. Misalkan terpadat sebuah citra aksara pa seperti Gambar 2.11. Pinsip kerja dari ekstraksi ciri menggunakan ICZ adalah sebagai berikut. Langkah pertama adalah mencari titik centroid-nya. Citra masukkan untuk proses ektraksi ciri adalah citra biner, sehingga objek dari citra memiliki representasi nilai 1, atau bagian yang berwarna putih. Dengan demikian nilai x i dan y i adalah 1 sedangkan untuk nilai p i tergantung dari sumbu mana yang akan kita cari, jika sumbu x maka nilai p i merupakan nilai koordinat objek pada sumbu x sedangkan jika sumbu y maka nilai p i merupakan nilai koordinat objek pada sumbu y. Berdasarkan persamaan 2.5 dan 2.6 ketika suatu bilangan dikalikan 1 akan menghasilan bilangan itu sendiri maka secara sederhana kita cukup menjumlahkan nilai koordinat pada masing-masing sumbu untuk seriap pixel objeknya. Titik centroid untuk � dan � dapat dihitung dengan: � = + + + + + + + + + + + + + + + + + + + + + + = = � = + + + + + + + + + + + + + + + + + + + + + + = = . Dengan hasil yang diperoleh maka pusat massa centroid objek tersebut berada di titik 4, 3.82. Setelah titik centroid diperoleh maka objek tersebut kita bagi menjadi beberapa zona. Untuk mempermudah perhitungan kita bagi menjadi 3 zona secara horizontal. Jika citra sudah dibagi kedalam 3 zona kemudian menghitung jarak antara masing-masing pixel yang ada disetiap zona terhadap titik centroid-nya. Total nilai jarak yang ada disetiap zona merupakan nilai rerata dari jarak semua pixel di zona tersebut. Hasil dari ekstraksi ciri ICZ akan menghasilkan 3 fitur dari objek tersebut, sesuai dengan jumlah pembagian zona yang diberikan. Adapun persamaan yang digunakan untuk menghitung nilai jarak adalah menggunakan euclidean distance seperti pada persamaan 2.7. Gambar 2.12 Pembagian Zona dan Perhitungan Jarak ICZ Gambar 2.12 merupakan representasi pembagian zona menggunakan ICZ yang dibagi menjadi 3 zona sama besar secara horizontal pada citra aksara pa. Perhitungan untuk fitur pada zona 1 adalah sebagai berikut: = √ − + − . = . = √ − + − . = . = √ − + − . = . = √ − + − . = . = √ − + − . = . = √ − + − . = . = . + . + . + . + . + . = . Berdasarkan hasil perhitungan diatas maka ciri atau fitur dari zona 1 adalah 3.01. Cara yang sama juga berlaku untuk mencari nilai ciri atau fitur pada zona 2 dan zona 3 sehingga diperoleh fitur zona ke 2 adalah 2.11 serta zona 3 adalah 2.66. Jika digabung akan menghasilkan 3 fitur, yaitu [ 3.01 2.11 2.66 ]. Setelah semua ciri yang dihitung menggunakan metode ICZ diperoleh maka dilanjutkan dengan mengekstrak ciri objek menggunakan metode ZCZ. Prinsip kerja dari ekstraksi ciri menggunakan ZCZ adalah sebagai berikut. Langkah pertama adalah membagi kedalam beberapa zona, sama dengan langkah sebelumnya, yaitu membagi ke dalam 3 zona secara horizontal kemudian mencari titik centroid untuk setiap zona yang ada. Setelah didapatkan titik centroid-nya, lalu menghitung jarak antara masing- masing pixel yang ada disetiap zona terhadap titik centroid-nya menggunakan euclidean distance. Total nilai jarak yang ada disetiap zona merupakan nilai rerata dari jarak semua pixel di zona tersebut. Hasil dari ekstraksi ciri ZCZ akan menghasilkan 3 fitur dari objek tersebut, sesuai dengan jumlah pembagian zona yang diberikan. Adapun titik centroid x c dan y c pada zona 1 adalah sebagai berikut: � = + + + + + = = � = + + + + + = = . Dengan demikian maka titik centroid pada zona 1 adalah 4, 1.67. Proses yang sama juga dilakukan untuk mencari titik centroid pada zona 2 dan zona 3, yang masing-masing titik centroid-nya adalah 4, 1.50 dan 4, 1.56. Gambar 2.13 Pembagian Zona dan Perhitungan Jarak ZCZ Gambar 2.13 merupakan representasi pembagian zona menggunakan ZCZ yang dibagi menjadi 3 zona sama besar secara horizontal pada citra aksara pa. Perhitungan untuk fitur pada zona 1 adalah sebagai berikut: = √ − + − . = . = √ − + − . = . = √ − + − . = . = √ − + − . = . = √ − + − . = . = √ − + − . = . = . + . + . + . + . + . = . Berdasarkan hasil perhitungan diatas maka ciri atau fitur dari zona 1 adalah 2.06. Cara yang sama juga berlaku untuk mencari nilai ciri atau fitur pada zona 2 dan zona 3 sehingga diperoleh fitur zona ke 2 adalah 2.08 serta zona 3 adalah 1.90. Jika digabung akan menghasilkan 3 fitur, yaitu [ 3.01 2.11 2.66 ]. Setelah didapatkan masing-masing 3 fitur menggunakan metode ICZ dan ZCZ lalu fitur tersebut digabungkan sehingga menjadi 6 fitur yang merepresentasikan citra tersebut sehingga dapat ditulis [ 3.01 2.11 2.66 2.06 2.08 1.90 ].

2.7 Template Matching

Model klasifikasi yang digunakan dalam penelitian ini adalah menggunakan template matching. Pendekatan template matching dipilih karena paling mudah untuk diterapkan dan sesuai dengan karakteristik data yang akan dikenali. Prinsip pendekatan template matching untuk klasifikasi adalah mengukur kedekatan atau kesamaan similarity antar objek atau entities yang diperbandingkan. Objek yang diperbandingkan adalah data uji yang akan dikenali dengan database template yang sudah disimpan. Ketika suatu objek baru yang ingin dikenali dibandingkan dengan database template kemudian diperoleh nilai kesamaan yang relatif besar maka secara langsung objek baru tersebut dapat diklasifikasikan atau dikenali sesuai dengan template pembandingnya. Secara umum rumus yang biasa digunakan untuk mengukur jarak antar 2 objek adalah menggunakan euclidean distance. Adapun rumus euclidean distance dapat ditulis sebagai berikut: , = √∑ − � = 2.7 Dengan: dx,y = jarak antara vektor objek x dan y n = jumlah dimensi objek x k , y k = nilai vektor objek x dan y ke-k