6
Secara sederhana neuron ini diperlihatkan pada Gambar 2.1 di bawah ini.
x
1
gfx,w w
n
w
1
w
2
x
2
y …
x
n
Gambar 2.1 Model dasar neuron
Pada Gambar 2.1 di atas, keluaran neuron dirumuskan secara umum sebagai y = gfx, w, dengan x = [x
1
, x
2
, …, x
n
] adalah vektor nilai masukan dan w = [w
1
, w
2
, …, w
n
] adalah vektor nilai bobot.
Neuron-neuron yang saling tersambung akan dapat membentuk banyak macam arsitektur jaringan seperti diperlihatkan oleh Fausett 1994, Lin dan Lee
1996, dan Patterson 1996. Gambar 2.2 memperlihatkan contoh arsitektur jaringan umpanmaju tiga-lapis yang merupakan dasar arsitektur jaringan syaraf
tiruan yang digunakan dalam penelitian ini. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
7
keluaran lapis ke-3
lapis ke-2
lapis ke-1 masukan
Gambar 2.2 Contoh jaringan umpanmaju tiga-lapis.
Bobot-bobot sambungan dalam jaringan merupakan tempat jaringan syaraf menyimpan informasi. Terdapat banyak ragam algoritma pelatihan untuk
mengeset nilai-nilai bobot ini. Pada penelitian ini, algoritma yang dipakai adalah algoritma pelatihan terbimbing jaringan syaraf probabilistis. Algoritma pelatihan
ini pada dasarnya adalah, pembentukan neuron pada lapis ke-1 yang merupakan anak turunan neuron pada lapis ke-2, pada Gambar 2.2 di atas.
2.2.2 Pengklasifikasi Bayes
Jaringan syaraf tiruan yang dipergunakan dalam penelitian ini didasarkan pada pengklasifikasi Bayes, yang melakukan klasifikasi dengan berdasarkan pada
sifat-sifat statistis sekelompok data informasi. Secara sederhana, pengklasifikasi Bayes untuk kasus klasifikasi dua-kelas diperlihatkan sebagai berikut.
8
h
A
c
A
f
A
x h
B
c
B
f
B
x 2.1
dengan h
A
, h
B
: probabilitas apriori kelas A dan B c
A
, c
B
: risiko pemilihan kelas A dan B f
A
x , f
B
x : kerapatan probabilitas kelas A dan B untuk masukan x.
2.2.3 Jendela Parzen
Kerapatan probabilitas kelas pada pengklasifikasi Bayes di atas, biasanya tidak diketahui. Oleh karena itu, digunakan suatu cara untuk mengestimasi
kerapatan probabilitas dengan berdasarkan pada jendela Parzen, yang dirumuskan sebagai:
∑
=
⎟⎟ ⎠
⎞ ⎜⎜
⎝ ⎛
=
n i
i
x x
D K
n x
f
1
, 1
σ 2.2
dengan n
: jumlah sampel σ
: faktor penyekala ⎟⎟
⎠ ⎞
⎜⎜ ⎝
⎛ σ
,
i
x x
D K
: fungsi kernel dengan Dx,x
i
adalah fungsi jarak antara vektor masukan x dan sampel x
i
.
Fungsi kernel di atas, pada dasarnya bertujuan untuk menghitung nilai kemiripan antara masukan dengan sampel yang ada. Nilai kemiripan ini akan
9
makin tinggi bila masukannya makin mirip dengan sampel yang ada dan sebaliknya, makin rendah bila masukannya makin tidak mirip dengan sampel yang
ada. Bentuk fungsi kernel di atas dapat beragam, namun fungsi tersebut harus
memenuhi kriteria-kriteria sebagaimana ditulis oleh Masters 1995 sebagai berikut.
1. Fungsi kernel harus berhingga:
∞
ϕ ϕ
ϕ
d K
| |
sup
2.3
2. Fungsi kernel harus dengan cepat menuju nol bila argumennya
meningkat dalam nilai absolutnya:
∞
∫
∞ ∞
−
ϕ ϕ d
K
lim =
∞ →
ϕ ϕ
ϕ
K 2.4
3. Fungsi kernel harus dinormalisasi, bila yang akan diestimasi adalah
fungsi kerapatan: 1
=
∫
∞ ∞
−
ϕ ϕ d
K 2.5
10
4. Untuk mendapatkan kelakuan asimtotik yang tepat, jendela faktor
penyekala harus menyempit bila jumlah sampelnya meningkat:
lim =
∞ →
n n
σ ∞
=
∞ →
n n
n σ
lim 2.6
Salah satu contoh fungsi kernel yang memenuhi empat kriteria di atas adalah fungsi Gaussian, yang diperlihatkan pada persamaan:
2
ϕ
ϕ
−
= e K
2.7
Dalam fungsi kernel di atas, tercakup adanya fungsi jarak. Fungsi jarak tersebut merupakan fungsi untuk menghitung jarak antara dua buah vektor.
Terdapat banyak macam fungsi jarak yang dapat dipergunakan untuk keperluan tersebut Wilson et al, 1997. Salah satu macam fungsi jarak tersebut adalah
fungsi jarak Minkowsky yang diperlihatkan pada persamaan:
r n
i r
i i
y x
y x
D
1 1
, ⎟
⎟ ⎠
⎞ ⎜
⎜ ⎝
⎛ −
=
∑
=
2.8
dengan r adalah bilangan bulat 1,2, …, yang merupakan orde fungsi jarak tersebut.
11
2.2.4 Optimasi faktor penyekala
Besar nilai faktor penyekala pada persamaan 2.2, dicari dengan melalui proses optimasi yang memperhatikan hal-hal sebagai berikut.
1. Bila masukan x diketahui merupakan sampel kelas
ω, maka diharapkan nilai fx yang maksimum. Nilai yang maksimum ini dapat terjadi bila keadaan
kandungan derau pada masukan x tersebut adalah 0 . 2.
Bila masukan x diketahui bukan merupakan sampel kelas ω, maka diharapkan
nilai fx yang minimum. Nilai yang minimum ini dapat terjadi bila keadaan kandungan derau pada masukan x tersebut adalah 50
1
Berdasarkan hal-hal di atas proses optimasi yang memaksimumkan nilai fx pada kandungan derau 0 , dapat ditulis sebagai:
1
| maks
=
=
derau
x f
g σ
2.9
Karena nilai fx|
derau=0
di atas selalu lebih kecil dari 1, maka persamaan 2.9 di atas dapat ditulis dalam bentuk minimisasi fungsi:
1
| 1
min
=
− =
derau
x f
g σ
2.10
1
Dalam hal ini, dipilih derau 50 , karena dengan derau setinggi itu, citra masukannya benar- benar sangat tidak mirip dengan citra yang disimpan.
12
Selanjutnya, proses optimasi untuk meminimumkan fx pada kandungan derau 50 adalah:
50 2
| min
=
=
derau
x f
g σ
2.11
Akhirnya, proses optimasi keseluruhannya adalah minimisasi gabungan persamaan 2.10 dan 2.11:
2 1
σ σ
σ g
g g
+ =
2.12
{ }
50
1 min
= =
+ −
=
derau derau
x f
x f
g σ
2.13
Dalam penelitian ini, proses minimisasi pada fungsi g σ di atas dilakukan
dengan menggunakan pencarian kuadratis Buchanan dkk., 1992, yang algoritmanya ditulis sebagai berikut.
Algoritma 2.1 Pencarian Kuadratis
Masukan Tetapkan batas minimum
σ dan batas maksimum
σ
2
untuk fungsi g. Tetapkan
toleransi ε
Hitung 2
2 1
σ σ
σ +
= dan h =
σ
1
- σ
Kalang Ulangi
jika g σ
g σ
1
, maka geser kiri σ
2
= σ
1
; σ
1
= σ
; σ
= σ
1
- h jika g
σ
2
g σ
1
, maka geser kanan σ
= σ
1
; σ
1
= σ
2
; σ
2
= σ
1
+ h PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
13
] .
2 .[
2 ]
.[
2 1
2 1
σ σ
σ σ
σ σ
σ g
g g
g g
h +
− −
+ =
jika g σ
g σ
1
, maka σ
1
= σ
2 h
h =
;
σ =
σ
1
– h ; σ
2
= σ
1
+ h
hingga h
ε Keluaran Minimum
fungsi g pada
σ
1
dengan galat lebih kecil dari h.
2.3 Hipotesis
Model jaringan syaraf tiruan untuk pengenalan huruf yang dirancang, mempunyai 26 macam kelas, yaitu dari A hingga Z. Setiap kelas mempunyai
sejumlah sampel dari 1 hingga n. Masukan huruf berderau yang telah diubah menjadi vektor, selanjutnya
dihitung kerapatan probabilitasnya untuk setiap kelas, dengan menggunakan jendela Parzen. Penghitungan dengan jendela Parzen ini pada dasarnya dilakukan
dalam dua tahap berikut. 1.
Tahap pertama, penghitungan nilai kemiripan masukan setiap sampel di setiap kelas. Penghitungan nilai kemiripan ini dilakukan dengan menggunakan
fungsi kernel yang telah ditentukan sebelumnya. 2.
Tahap kedua, penjumlahan ternormalisasi nilai-nilai kemiripan yang terdapat di setiap kelas.
14
Dengan berdasarkan pada aturan klasifikasi Bayes, maka keluaran jaringan syaraf tiruan adalah kelas yang mempunyai nilai kerapatan probabilitas terbesar
2
.
2.4 Langkah Penelitian
Penelitian dilakukan dengan melalui tahap-tahap sebagai berikut. 1.
Perancangan sistem pengenalan citra huruf berderau secara keseluruhan. 2.
Perancangan model jaringan syaraf tiruan, dengan berdasarkan pada jaringan syaraf probabilistis.
3. Pengimplementasian model jaringan syaraf tiruan dalam bentuk program,
dengan menggunakan MATLAB. 4.
Pengimplementasian sistem pengenalan citra huruf berderau secara keseluruhan dalam bentuk program, dengan menggunakan MATLAB.
5. Pengujian watak dan unjukkerja sistem pengenalan citra huruf berderau secara
keseluruhan. 6.
Analisis hasil pengujian. 7.
Pembuatan laporan penelitian.
2
H
al ini berlaku bila jumlah sampel dan risiko pemilihan untuk setiap kelas, sama besarnya.
BAB 3 CARA PENELITIAN
Penelitian dilakukan dengan cara merancang sistem pengenalan citra huruf berderau, yang masukan dan keluarannya berupa citra dengan format bitmap.
Implementasi sistem dituliskan dalam bentuk program dengan menggunakan MATLAB.
3.1 Bahan Penelitian
Bahan yang dipakai untuk menjalankan penelitian ini berupa citra huruf dengan spesifikasi sebagai berikut.
1. Format citra
: Bitmap 2.
Ukuran citra : 32x32 piksel
3. Huruf
: A hingga Z 4.
Jenis huruf : Roman dan Arial
Dalam penelitian ini, citra huruf dengan spesifikasi di atas dibuat dengan menggunakan program PAINT yang terdapat dalam sistem operasi WINDOWS
95. Hasil pembuatan citra huruf tersebut tersebut, secara visual diperlihatkan dalam Gambar 3.1.
16
a Jenis huruf Roman
b Jenis huruf Arial
Gambar 3.1 Dua macam jenis huruf: Roman dan Arial.
17
3.2 Alat Penelitian
Alat yang dipakai untuk menjalankan penelitian ini dibedakan menjadi dua macam sebagai berikut.
1. Perangkat-keras: Komputer berbasiskan mikroprosesor AMD5X86133MHz
dengan memori 16 MB, harddisk 850 MB, monitor VGA dan pencetak. 2.
Perangkat-lunak: MATLAB versi 5.0 yang dilengkapi dengan Image Processing Toolbox.
3.3 Jalan Penelitian
Jalannya penelitian yang dilakukan diuraikan seperti berikut.
3.3.1 Perancangan keseluruhan sistem
Keseluruhan sistem pengenalan citra huruf berderau yang dirancang diperlihatkan secara blok pada Gambar 3.2.