Pengenalan Kata Menggunakan Self-Organizing Map Sebagai Input Kamus Berbasis Android

(1)

Bab ini membahas tentang teori landasan teori dalam penyelesaian masalah skripsi ini. Hal-hal yang akan dibahas ialah Bahasa Rusia, teori pengolahan citra digital, ektraksi fitur, pengenalan pola, Self-Organizing Map.

2.1. Bahasa Rusia

Bahasa Rusia adalah Bahasa Nasional dari Rusia, Belarus, Kazakhstan, dan Kyrgyzstan. Selain sebagai bahasa Nasional, Bahasa Rusia juga diakui sebagai bahasa kedua di Ukraina, Moldovia, Transnistria, Abkhazia, dan Ossetia Selatan. Bahasa Rusia termasuk rumpun bahasa Eropa Timur. Bahasa lain yang sangat dekat dengan Bahasa Rusia adalah Bahasa Ukraina, Bahasa Belarus dan Bahasa Rusyn. Selain bahasa-bahasa tersebut, Bahasa Rusia juga masih serumpun dengan bahasa lain seperti Bahasa Bulgaria, Bahasa Serbia, Bahasa Polandia, dan sebagainya.

Bahasa Rusia tidak menggunakan alfabet dari huruf latin, melainkan huruf Cyrillic. Huruf Cyrillic adalah huruf yang digunakan oleh sebagian besar bahasa-bahasa di Eropa Timur. Huruf Cyrillic yang digunakan oleh Bahasa Rusia mengandung 33 huruf, dan memiliki huruf besar. Huruf Cyrillic ditulis dari kiri ke kanan. Untuk daftar huruf Cyrillic yang digunakan oleh Bahasa Rusia dan pembacaannya dengan huruf latin yang setara, dapat dilihat pada tabel 2.1.

Hampir semua bahasa yang serumpun dengan Bahasa Rusia menggunakan huruf Cyrillic, seperti bahasa Belarus, Bahasa Ukraina, Bahasa Bulgaria, dan sebagainya. Bahasa yang serumpun dengan Bahasa Rusia tetapi tidak menggunakan huruf Cyrillic contohnya adalah Bahasa Polandia dan Bahasa Ceko. Keduanya menggunakan huruf Latin.

Terdapat perbedaan antara huruf Cyrillic yang digunakan oleh Bahasa Rusia dengan bahasa-bahasa lain yang menggunakan huruf Cyrillic. Contohnya pada Bahasa BЮХРКЫТК вКЧР ЭТНКФ ЦОЧРРЮЧКФКЧ СЮЫЮП “Ё”,“ ”, НКЧ “ ”, ЬОСТЧРРК ЭОЫНКЩКЭ СКЧвК 30 huruf pada huruf Cyrillic yang digunakan oleh Bahasa Bulgaria. Contoh yang lain


(2)

yang tidak terdapat pada hurЮП CвЫТХХТМ ЩКНК BКСКЬК ЊЮЬТК, ЬОЩОЫЭТ СЮЫЮП “ ” НКЧ “ ”. Tabel 2.1. Tabel huruf Cyrillic

No Huruf besar Huruf kecil Nama Bunyi Transkripsi

1 A a /a/ a

2 be /b/ b

3 B ve, we /v, w/ v

4 ge /g/ g

5 de /d/ d

6 E ye /ye/ gye, e

7 Ё yo /yo/ yo

8 zhe /zh/ zh

9 ze /z/ z

10 i /i/ i

11 i-kratkoye /y/ y, i

12 ka /k/ k

13 el /l/ l

14 M em /m/ m

15 H en /n/ n

16 O o /o/ o

17 pe /p/ p

18 P er /r/ r

19 C es /s/ s

20 T te /t/ t

21 u /u/ u

22 ef /f/ f

23 X ha, kha /kh/ j, kh

24 tse /ts/ ts

25 che /ch/ ch

26 sya /sy/ sy

27 scha /sch/ sycy

28 tvyordiy znak (tidak dibaca)

29 Ї /Ї/ y

30 myagkiy znak (tidak dibaca)

31 e /e/ e

32 yu /yu/ yu

33 ya /ya/ ya

Terdapat pula perbedaan cara baca pada huruf Cyrillic yang digunakan oleh BКСКЬК ЊЮЬТК НОЧРКЧ ЛКСКЬК ХКТЧ. CШЧЭШСЧвК КНКХКС СЮЫЮП “ ” ЬОЭКЫК НОЧРКЧ СЮЫЮП


(3)

“Р” ЩКНК BКСКЬК ЊЮЬТК, ЭОЭКЩТ ЩКНК BКСКЬК UФЫКТЧК, СЮЫЮП ЭОЫЬОЛЮЭ ЬОЭКЫК НОЧРКЧ СЮЫЮП “С”.

Perbedaan-perbedaan dalam penggunaan huruf Cyrillic dan perbedaan bahasa yang menggunakannya memnunjukkan bahwa tidak semua kata yang menggunakan huruf Cyrillic merupakan kata dari Bahasa Rusia. Oleh karena itu, tidak semua kata yang menggunakan huruf Cyrillic dapat diterjemahkan menggunakan kamus bahasa Rusia.

2.2. Pengolahan Citra Digital

Pengolahan citra adalah memanipulasi citra untuk meningkatkan kualitas citra sehingga lebih mudah diinterpretasi oleh mesin atau manusia (Munir, 2004). Pengolahan citra disebut juga pemrosesan citra atau image processing.

Proses pengolahan citra yang dilakukan untuk menyiapkan citra adalah seperti binerisasi, penghilangan derau, deteksi kemiringan, segmentasi karakter, normalisasi ukuran citra, thinning dan skeletonisation (Alginahi, 2010)

2.2.1. Pengertian Citra

Citra adalah gambar pada bidang dwimatra atau dua dimensi (Munir, 2004). Citra yang dapat diproses secara digital adalah citra digital. Citra digital dapat diperoleh dari alat penangkap citra digital serperti kamera digital atau scanner.


(4)

Citra digital disusun oleh banyak kotak kecil yang disebut piksel, seperti pada ditunjukkan pada persamaan 2.1. Piksel-piksel tersebut masing masing menyimpan informasi warna seperti merah, hijau dan biru. Nilai yang disimpan berjarak antara 0 sampai 255 dengan 0 artinya hitam dan 255 berarti putih. Citra digital dapat dinyatakan dalam bentuk matriks x*y, dengan panjang matriks M dan tinggi matriks N dengan anggota matriks adalah piksel-piksel dari citra digital tersebut. Matriksnya adalah sebagai berikut:

2.2.2. Binerisasi

Proses binerisasi adalah proses untuk menghasilkan citra biner atau citra hitam putih. Metode yang digunakan adalah metode pengambangan atau thresholding, yaitu mengganti nilai piksel menjadi 0 atau 255 sesuai dengan nilai ambang batas atau threshold yang sudah ditentukan.

Citra harus dibinerkan terlebih dahulu karena citra tersebut akan diambil atau diekstrak fiturnya. Fitur yang diinginkan hanyalah bagian huruf yang ingin dikenali saja, tanpa memuat informasi lain yang tidak penting seperti warna. Oleh karena itu, citra harus dibinerkan terlebih dahulu.

Ada beberapa cara untuk menentukan nilai ambang batas pada proses pengambangan. Salah satu metode yang cukup terkenal untuk menentukan nilai ambang batas tersebut adalah metode Otsu (Singh et al, 2011). Metode Otsu adalah metode yang digunakan untuk menghasilkan citra biner atau citra hitam putih dari sebuah citra yang masih memiliki tingkat keabuan atau grayscale (Bhargava et al, 2014). Oleh karena itu, sebuah citra harus diubah menjadi citra grayscale terlebih dahulu.

Tahapan dalam memperoleh citra grayscale adalah sebagai berikut. 1. Mengambil piksel dari citra yang akan diproses


(5)

3. Mengalikan setiap nilai warna tersebut dengan koefisien warna masing masing. Kemudian nilai tersebut ditotalkan.

4. Mengganti nilai warna dari piksel yang sedang diproses dengan nilai warna yang didapat pada proses sebelumnya.

5. Proses kemudian diulangi ke piksel berikutnya sampai seluruh piksel pada citra diproses.

Koefisien warna untuk setiap nilai warna digunakan karena adanya perbedaan cara mata manusia membedakan warna.

Citra yang sudah menjadi abu-abu sudah boleh diproses menjadi citra hitam putih dengan menggunakan algoritma Otsu. Langkah-langkah binerisasi citra grayscale menggunakan algoritma Otsu untuk mencari ambang batas adalah sebagai berikut (Otsu, 1979).

1. Membuat histogram dari tingkat kemunculan semua tingkat keabuan pada citra grayscale.

2. Menghitung kemungkinan (probabilitas) kelas dan rata-rata (mean) kelas pada kemungkinan ambang batas (threshold) pada 0.

3. Untuk setiap kemungkinan ambang batas yang mungkin ada (sesuai histogram), piksel dipisahkan menjadi 2 bagian, mewakili piksel later belakang dan piksel karakter. Kemudian dicarilah akar dari kuadrat perbedaan antara rata-rata dari kedua bagian tersebut.

4. Nilai dari ambang batas diperbaharui untuk setiap iterasi, dan nilainya sesuai pada hasil langkah sebelumnya

5. Nilai yang terbesar setelah iterasi berakhir adalah nilai ambang batas yang diinginkan

6. Setiap piksel kemudian diperbaharui pada citra grayscale dengan menggantinya menjadi putih jika lebih besar dari ambang batas, dan hitam jika lebih kecil atau sama dengan ambang batas.


(6)

Gambar 2.2. Hasil binerisasi dengan algoritma Otsu. Gambar asli (kiri) dan hasil binerisasi (kanan).

2.2.3.. Penapisan Derau

Penapisan derau adalah proses untuk menapis derau yang terdapat pada sebuah citra. Proses ini disebut juga penghilangan derau. Derau adalah piksel yang memiliki variasi intensitas yang tidak berkorelasi pada tetangganya (Munir, 2004).

Pengambilan gambar menggunakan kamera sering meninggalkan bercak atau titik-titik yang sebenarnya tidak ada pada objek aslinya. Titik-titik tersebut disebut juga dengan derau. Derau dihasilkan dari adanya lonjakan intensitas yang disebabkan oleh piksel yang tidak berhasil diisi, timbulnya galat pada konversi analog ke digital, galat pada transmisi data, atau kesalahan pada proses pendigitalan (Leavline, 2013). Derau akan menggangu proses pengambilan tulang pada karakter (Tarabek, 2008), sehingga harus diminimalisir agar tulang yang dihasilkan masih dapat mewakili citra karakter yang diproses dengan baik.

Salah satu metode untuk menapis derau adalah dengan menggunakan metode Median Filter (Efford, 2000). Metode ini menggantikan piksel(x,y) dengan nilai tengah atau median yang dihitung dari piksel tetangganya. Yang dimaksud dengan piksel tetangga adalah piksel yang berada disekelilingnya. Contoh ketetanggaan 3x3 dapat dilihat pada gambar 2.3.


(7)

P9 P2 P3 P8 P1 P4 P7 P6 P5

Gambar 2.3. Piksel dan tetangganya (Alginahi, 2010)

Median filter mengambil median dari sebuah piksel dan tetangganya sesuai ukuran ketetanggaannya. Ukuran ketetanggaan 5x5 akan berukuran 5 piksel x 5 piksel, dan seterusnya. Median diapat dengan menyortir nilai nilai tersebut dari yang rendah ke yang tinggi, kemudian mengambil nilai tengahnya. Nilai dari piksel yang sedang diproses akan digantikan dengan nilai median tersebut.

Tahapan sederhana dari median filter adalah sebagai berikut:

1. Mengambil sebuah piksel dan tetangganya (sesuai ukuran ketetanggaan) sehingga membentuk sebuah matriks.

2. Median dari matriks tersebut diambil

3. Mengganti nilai piksel sedang diproses dengan median yang didapat pada tahap sebelumnya.

4. Proses diulangi ke piksel berikutnya sampai seluruh piksel pada citra diproses. Hasil dari Median filter adalah citra yang lebih halus gambarnya. Derau yang ada akan berkurang. Semakin tinggi ukuran ketetanggaan yang digunakan, maka dera yang berkurang akan semakin tinggi. Misalnya, ukuran ketetanggan 5x5 akan lebih baik menapis derau daripada ukuran ketetanggan 3x3. Akan tetapi, ukuran ketetanggan yang sangat tinggi dapat memburamkan citra. Oleh karena itu, ukuran ketetanggan harusnya seukuran yang cukup saja. Contoh median filter dengan ukuran ketetanggaan 3x3, 5x5 dan 9x9 dapat dilihat pada gambar 2.4.


(8)

Gambar 2.4. Citra dengan Median Filter. Citra asli (kiri atas), citra hasil median filter 3x3 (kanan atas), x5 (kiri bawah) dan 9x9 (kanan bawah)

2.2.4. Segmentasi

Segmentasi citra adalah proses untuk memotong gambar yang memuat sebuah kata menjadi potongan-potongan yang membuat setiap karakter dalam kata tersebut. Proses ini akan mengisolasi setiap karakter dalam bentuk citra yang hanya berisi satu karakter. Hal ini sangat penting, mengingat yang akan dikenali adalah huruf, bukanlah kata, sehngga sebuah kata harus dipotong menjadi huruf-huruf yang terpisah agar dapat dikenali nantinya.


(9)

Proses memotong citra yang mengandung satu buah kata menjadi banyak citra yang mengandung satu buah karakter per citra, secara bertahap adalah sebagai berikut: 1. Citra diubah menjadi citra hitem putih terlebih dahulu. Hitam akan menjadi piksel karakter, dan putih adalah piksel latar belakang. Citra akan dibagi menjadi kolom-kolom yang akan berisi satu karakter per kolom.

2. Selusuri piksel mulai dari kiri atas ke bawah untuk mencari piksel karakter. Jika ditemukan piksel latar belakang, maka cek terus apakah piksel tersebut terus menerus latar belakang (tak mengandung piksel karakter). Lakukan sampai ditemukan barisan piksel yang mengandung piksel karakter. Kemudian cek terus sampai ditemukan barisan yang hanya piksel latar belakang lagi.. 3. Dengan demikian, akan diperoleh koordinat dari piksel-piksel paling sudut dari

karakter tersebut.

4. Potong gambar dengan koordinat yang didapat dari proses sebelumnya. Simpan potongan gambar tersebut sebagai citra baru. Dengan demikian, kolom pertama sudah selesai.

5. Ulangi proses pencarian piksel karakter paling kiri atas untuk kolom berikutnya. Ulangi terus sampei piksel karakter paling kanan bawah untuk seluruh gambar.

Ilustrasi dari pengisolasian karakter dari sebuah citra berisi sebuah kata dapat dilihat pada gambar 2.5.

Gambar 2.5. Ilustrasi pemotongan karakter dari sebuah citra

2.2.5. Thinning

Thinning adalah proses untuk mendapatkan tulang dari sebuah citra. Proses ini disebut juga skeletonisation. Tebal dari tulang adalah 1 piksel. Proses thinning dilakukan agar citra karakter dapat direduksi menjadi sebuah bentuk yang mewakili karakter tersebut


(10)

karakter tersebut.

Salah satu metode cepat untuk mendapatkan tulang adalah metode Zhang-Suen (Widiarti, 2011). Algoritma Zhang-Suen adalah algoritma untuk menghasilkan citra tulang dari sebuah citra biner. Pada algoritma ini, terdapat istilah Contour Point , yaitu piksel yang memilki nilai 1 dan 8 tetangga yang bernilai 0. Adapun tahapan dari algoritma Zhang-Suen adalah sebagai berikut (Zhang & Suen, 1984):

1. Piksel hitam diasumsikan menjadi 1 dan piksel putih diasumsikan menjadi 0, serta citra masukan berukuran panjang dan lebar MxN.

2. Setiap piksel akan memiliki delapan tetangga, dengan ketetanggaan sesuai gambar 2.3.

3. Diasumsikan A(p1) adalah jumlah transisi dari putih ke hitam pada urutan piksel P2,P3,P4,P5,P6,P7,P8,P9,P2. P2 diakhir adalah untuk menunjukkan sirkulasi. Asumsikan B(p1) adalah jumlah tetangga yang hitam dari P1.

4. Semua piksel akan dites apakah memenuhi kondisi berikut: a. Piksel tersebut hitam dan punya 8 tetangga

b. 2 <= B(p1) <= 6 c. A(p1) = 1

d. Paling tidak salah satu dari P2,P4 dan P6 adalah putih e. Paling tidak salah satu dari P4, P6 dan P8 adalah putih

Piksel yang memenuhi kondisi ini akan diubah menjadi putih. 5. Semua piksel akan dites sekali lagi apakah memenuhi kondisi berikut:

a. Piksel tersebut hitam dan punya 8 tetangga b. 2 <= B(p1) <= 6

c. A(p1) = 1

d. Paling tidak salah satu dari P2, P4 dan P8 adalah putih e. Paling tidak salah satu dari P2, P6 dan P8 adalah putih

Piksel yang memenuhi kondisi ini akan diubah menjadi putih

6. Proses akan diulangi terus untuk semua piksel di citra sampai tidak ada lagi yang boleh diubah.


(11)

(a) (b)

Gambar 2.6. Proses Thinning. Citra sebelum thinning (a) dan citra hasil thinning(b)

2.3. Ekstraksi Fitur

Ekstraksi fitur atau feature extraction adalah proses mereduksi citra yang didapat dari proses pengolahan citra menjadi fitur yang mampu mewakili citra tersebut. Salah satu metode ekstraksi fitur adalah pixel mapping atau pemetaan piksel (Mulyo et al, 2004). Pemetaan piksel dilakukan dengan cara membuat sebuah string yang akan panjangnya sama dengan panjang citra dikali dengan lebar citra. Hal ini dilakukan karena string haruslah mampu menampung semua piksel dari citra. Fitur yang diekstrak dari citra adalah keberadaan piksel dan pola piksel tersebut.

Ekstraksi fitur dilakukan terhadap citra yang sudah melewati semua tahapan pengolahan citra. Citra akan diubah menjadi sebuah string. Piksel hitam akan menjadi 1, dan piksel putih akan menjadi 0. Tetapi menggantinya menjadi -0,5 untuk yang putih dan 0,5 untuk yang hitam juga dapat diterima. Penggantian menjadi 0,5 dan -0,5 terbukti meningkatkan performa pengenalan pola (Heaton, 2005). Ilustrasi pemetaan piksel dapat dilihat pada gambar 2.7.


(12)

Gambar 2.7. Ilustrasi pemetaan piksel, dari citra menjadi untaian nilai

2.4. Pengenalan Pola

Pola adalah sebuah entitas yang dapat memiliki ciri. Ciri tersebut bisa pakai untuk membedakan satu pola dengan pola yang lain. Dengan demikian, pola yang satu memiliki keunikan dari pola yang lain. Oleh karena itu, setiap pola bisa dibedakan dengan melihat ciri-ciri yang dimiliki pola tersebut (Bishop, 2006).

Pengenalan pola adalah suatu ilmu untuk mengklasifikasikan sebuah objek dengan objek lain berdasarkan ciri yang ada.

Gambar 2.8. Struktur Sistem Pengenalan Pola

Struktur dari pengenalan pola selalu dimulai dari sensor yang akan menangkap data. Prapengolahan dilakukan untuk menyiapkan data agar siap diklasifikasi. Setelah itu data akan diekstrak sehingga menjadi fitur yang siap untuk diklasifikasikan. Setelah itu digunakan algoritma klasifikasi untuk mengklasifikasikan pola tersebut. Ilustrasi dari strukturnya dapat dilihat pada gambar 2.8.

Sensor Prapengolahan Ekstraksi Ciri Algoritma Klasifikasi


(13)

Algoritma klasifikasi ialah algoritma yang digunakan untuk mengklasifikasikan data masukan. Contoh dari algoritma klasifikasi adalah jaringan saraf tiruan (JST) (Schalkoff, 1992). Dengan JST, masukan bisa diklasifikasikan berdasarkan hasil pencarian beberapa ciri yang signifikan dan memproses serta menganalisis ciri tersebut.

2.5. Self-Organizing Map

Teknik Self-OrganizingMap atau disebut juga Kohonen Map (sesuai dengan nama penemunya, Teuvo Kohonen) adalah salah satu algoritma pembelajaran dalam jaringan saraf tiruan (Heaton, 2005). Algoritma ini menganalogikan cara kerja otak manusia, dimana setiap sel otak manusia memiliki tugas yang berbeda-beda. Sel-sel saraf tersebut mengkelompokkan diri mereka sendiri sesuai dengan informasi yang diterima. Pengelompokan seperti ini disebut unsupervised learning (Kusumadewi, 2003).

Unsupervised learning adalah metode pembejalaran yang tidak terawasi, dimana tidak diperlukan adanya target output. Metode ini tidak menentukan hasil seperti apa yang diharapkan selagi proses pembelajaran. Tujuan dari metode ini yaitu agar dapat mengelompokkan semua unit dengan pola yang mirip atau sama ke dalam sebuah pengelompokan klasifikasi tertentu.

Sesuai dengan ciri unsupervised learning, self-organizing map merupakan jaringan saraf yang mempelajari distribusi pola-pola himpunan tanpa dibimbing oleh pemberian bobot dan target. Oleh karena itulah, algoritma ini disebut self-organizing atau mengatur diri sendiri. Ilustrasi jaringan sarafnya dapat dilihat pada gambar 2.9.


(14)

Gambar 2.9. Contoh jaringan kohonen dengan ukuran node 4x4 dan 2 unit masukan (Heaton, 2005)

Tahapan proses pembelajaran dari jaringan saraf tiruan self-organizing map adalah sebagai berikut (Zamasari, 2005):

1. Diinisialisasikan seluruh bobot dengan nilai random Wij, radius tetangga dan ХКУЮ ЩОЦЛОХКУКЫКЧ α.

2. Mengerjakan tahap a-f sampai kondisi berhenti dipenuhi a. mengevaluasi kesalahan untuk setiap vektor masukan x b. menyimpan bobot dengan kesalahan paling minimal

c. mengecek neuron keluaran yang telah aktif, jika terdapat neuron keluaran yang tidak pernah firing, maka forcewin dan kembali ke (a). Jika tidak, lanjut ke langkah (e)

d. Forcewin :

i. Menghitung aktivasi setiap vektor masukan dan ambil indeks vektor masukan dengan aktivasi yang paling kecil


(15)

ii. Setiap neuron keluaran dengan vektor masukan yang didapat pada (a) dan pilih indeks neuron keluaran dengan nilai terbesar yang tidak pernah aktif selama pelatihan

iii. Memodifikasi bobot dari neuron keluaran pada (b) e. MenyesЮКТФКЧ ЛШЛШЭ НОЧРКЧ ЩОЫЬКЦККЧ а’ = а + К(б-w) f. Memperbaiki learning rate

g. Mengecek kondisi berhenti 3. Mengambil bobot terbaik

4. Normalisasi bobot

2.6. Penelitian Terkait

Beberapa penelitian terdahulu terkait dengan penelitian pengolahan citra, Self-organizing Map, dan pengenalan pola serta karakter, dapat dilihat pada tabel 2.2.

Pada penelitian Limbing (2007), Self-organizing Map digunakan untuk mengenali citra huruf latin yang ada pada dokumen tertulis. Penelitian yang dilakukan oleh Limbing yaitu membuat sebuah perangkat lunak yang dapat melakukan pengenalan huruf cetak pada dokumen yang dipindai dan kemudian menjadi sebuah berkas teks. Huruf yang dikenali adalah berupa huruf cetak. Pengolahan citra yang terjadi adalah binerisasi, thinning dan segmentasi karakter. Dari penelitian ini, didapat kesimpulan bahwa metode Self-organizing Map bisa digunakan untuk mengenali huruf cetak, dengan akurasi 95,62% untuk pemindaian kalimat saja, 72,40% untuk pemindaian paragraf. Tetapi hasil tersebut didapat jika font yang dipindai sudah dilatihkan terlebih dahulu. Untuk font yang belum dilatihkan, didapat 70,43% pada pemindaian kalimat saja, dan 55,62% untuk pemindaian paragraf.

Pada penelitian Prarian (2010), Self-organizing Map digunakan untuk mengenali citra huruf Lampung yang didapat dari webcam dan print screen. Penelitian yang dilakukan Prarian yaitu membuat sebuah aplikasi yang mampu membaca tulisan dari huruf Lampung dan menunjukkan hasil pembacaan huruf Lampung tersebut. Pembacaan huruf Lampung dilakukan secara transliterasi atau transkripsi. Citra huruf


(16)

Penggunaan pengolahan citra pada penelitian ini masih sama dengan penelitian Limbing. Pengolahan citra yang dilakukan adalah pemotongan gambar, segmentasi huruf, perubahan ukuran, dan thinning. Hasil yang didapat adalah Self-organizing Map mampu mengenali huruf Lampung dengan akurasi 75%.

Pada penelitian Fauziah (2013), Self-organizing Map digunakan untuk mengenali citra huruf Korea yang didapat dari print screen. Tujuan dari penelitian yang dilakukan oleh Fauziah adalah untuk membuat sebuah aplikasi yang dapat mengidenfitikasikan huruf Korea lalu menerjemahkannya ke huruf Latin dan Bahasa Indonesia. Metode ektraksi fitur yang digunakan adalah Principal Component Analysis, sedangkan pada pengenalannya digunakan Self-organizing Map. Huruf Korea yang diidentifikasikan adalah print screen dari huruf Korea di layar komputer. Hasilnya adalah, Self-organizing map mampu mengenali huruf Korea dengan akurasi 97,31%. Hasil pengenalan pada penelitian ini sangat tinggi, karena citra yang diproses adalah citra print screen yang tentunya tidak membutuhkan pengolahan citra yang kompleks, tidak seperti hasil pengambilan citra pada kamera yang ditemukan derau atau pengambilan kata yang miring. Hal ini tentunya sangat berpengaruh pada akurasi dari pengenalan pola.

Tabel 2.2. Tabel Penelitian Terdahulu

Penulis Judul Penelitian Keterangan

Stefanus Suriaatmadja Limbing (2007)

Pembuatan aplikasi perangkat lunak pengenalan huruf cetak pada file text hasil scanning dengan menggunakan metode kohonen neural network

Self-organizing Map digunakan untuk

mengenali citra dokumen hasil scan. Huruf yang dikenali adalah huruf Latin.

Cahyo Prarian (2010)

Desain dan Implementasi Sistem Penerjemah Aksara Lampung ke Huruf Latin Berbasis Pengolahan Citra Digital dan Jaringan Syaraf Tiruan Self-organizing Map

Self-organizing Map digunakan untuk mengenali citra huruf Lampung yang diambil dari citra kata Bahasa


(17)

Lampung yang dipotong terlebih dahulu. Citra didapat dari webcam dan print screen.

Farah Fauziah (2012)

Sistem Penerjemah Huruf Korea Ke Huruf Latin Dan Bahasa Indonesia Berbasis Pengolahan Citra Digital Dan Jaringan Syaraf Tiruan Self-Organizing Map (Som)

Self-organizing Map digunakan untuk mengenali citra huruf korea yang diambil dari printscreen.


(1)

Gambar 2.7. Ilustrasi pemetaan piksel, dari citra menjadi untaian nilai

2.4. Pengenalan Pola

Pola adalah sebuah entitas yang dapat memiliki ciri. Ciri tersebut bisa pakai untuk membedakan satu pola dengan pola yang lain. Dengan demikian, pola yang satu memiliki keunikan dari pola yang lain. Oleh karena itu, setiap pola bisa dibedakan dengan melihat ciri-ciri yang dimiliki pola tersebut (Bishop, 2006).

Pengenalan pola adalah suatu ilmu untuk mengklasifikasikan sebuah objek dengan objek lain berdasarkan ciri yang ada.

Gambar 2.8. Struktur Sistem Pengenalan Pola

Struktur dari pengenalan pola selalu dimulai dari sensor yang akan menangkap data. Prapengolahan dilakukan untuk menyiapkan data agar siap diklasifikasi. Setelah itu data akan diekstrak sehingga menjadi fitur yang siap untuk diklasifikasikan. Setelah itu digunakan algoritma klasifikasi untuk mengklasifikasikan pola tersebut. Ilustrasi dari strukturnya dapat dilihat pada gambar 2.8.

Sensor Prapengolahan Ekstraksi Ciri Algoritma Klasifikasi


(2)

Algoritma klasifikasi ialah algoritma yang digunakan untuk mengklasifikasikan data masukan. Contoh dari algoritma klasifikasi adalah jaringan saraf tiruan (JST) (Schalkoff, 1992). Dengan JST, masukan bisa diklasifikasikan berdasarkan hasil pencarian beberapa ciri yang signifikan dan memproses serta menganalisis ciri tersebut.

2.5. Self-Organizing Map

Teknik Self-OrganizingMap atau disebut juga Kohonen Map (sesuai dengan nama penemunya, Teuvo Kohonen) adalah salah satu algoritma pembelajaran dalam jaringan saraf tiruan (Heaton, 2005). Algoritma ini menganalogikan cara kerja otak manusia, dimana setiap sel otak manusia memiliki tugas yang berbeda-beda. Sel-sel saraf tersebut mengkelompokkan diri mereka sendiri sesuai dengan informasi yang diterima. Pengelompokan seperti ini disebut unsupervised learning (Kusumadewi, 2003).

Unsupervised learning adalah metode pembejalaran yang tidak terawasi, dimana tidak diperlukan adanya target output. Metode ini tidak menentukan hasil seperti apa yang diharapkan selagi proses pembelajaran. Tujuan dari metode ini yaitu agar dapat mengelompokkan semua unit dengan pola yang mirip atau sama ke dalam sebuah pengelompokan klasifikasi tertentu.

Sesuai dengan ciri unsupervised learning, self-organizing map merupakan jaringan saraf yang mempelajari distribusi pola-pola himpunan tanpa dibimbing oleh pemberian bobot dan target. Oleh karena itulah, algoritma ini disebut self-organizing atau mengatur diri sendiri. Ilustrasi jaringan sarafnya dapat dilihat pada gambar 2.9.


(3)

Gambar 2.9. Contoh jaringan kohonen dengan ukuran node 4x4 dan 2 unit masukan (Heaton, 2005)

Tahapan proses pembelajaran dari jaringan saraf tiruan self-organizing map adalah sebagai berikut (Zamasari, 2005):

1. Diinisialisasikan seluruh bobot dengan nilai random Wij, radius tetangga dan

ХКУЮ ЩОЦЛОХКУКЫКЧ α.

2. Mengerjakan tahap a-f sampai kondisi berhenti dipenuhi a. mengevaluasi kesalahan untuk setiap vektor masukan x b. menyimpan bobot dengan kesalahan paling minimal

c. mengecek neuron keluaran yang telah aktif, jika terdapat neuron keluaran yang tidak pernah firing, maka forcewin dan kembali ke (a). Jika tidak, lanjut ke langkah (e)

d. Forcewin :

i. Menghitung aktivasi setiap vektor masukan dan ambil indeks vektor masukan dengan aktivasi yang paling kecil


(4)

ii. Setiap neuron keluaran dengan vektor masukan yang didapat pada (a) dan pilih indeks neuron keluaran dengan nilai terbesar yang tidak pernah aktif selama pelatihan

iii. Memodifikasi bobot dari neuron keluaran pada (b) e. MenyesЮКТФКЧ ЛШЛШЭ НОЧРКЧ ЩОЫЬКЦККЧ а’ = а + К(б-w) f. Memperbaiki learning rate

g. Mengecek kondisi berhenti 3. Mengambil bobot terbaik

4. Normalisasi bobot

2.6. Penelitian Terkait

Beberapa penelitian terdahulu terkait dengan penelitian pengolahan citra, Self-organizing Map, dan pengenalan pola serta karakter, dapat dilihat pada tabel 2.2.

Pada penelitian Limbing (2007), Self-organizing Map digunakan untuk mengenali citra huruf latin yang ada pada dokumen tertulis. Penelitian yang dilakukan oleh Limbing yaitu membuat sebuah perangkat lunak yang dapat melakukan pengenalan huruf cetak pada dokumen yang dipindai dan kemudian menjadi sebuah berkas teks. Huruf yang dikenali adalah berupa huruf cetak. Pengolahan citra yang terjadi adalah binerisasi, thinning dan segmentasi karakter. Dari penelitian ini, didapat kesimpulan bahwa metode Self-organizing Map bisa digunakan untuk mengenali huruf cetak, dengan akurasi 95,62% untuk pemindaian kalimat saja, 72,40% untuk pemindaian paragraf. Tetapi hasil tersebut didapat jika font yang dipindai sudah dilatihkan terlebih dahulu. Untuk font yang belum dilatihkan, didapat 70,43% pada pemindaian kalimat saja, dan 55,62% untuk pemindaian paragraf.

Pada penelitian Prarian (2010), Self-organizing Map digunakan untuk mengenali citra huruf Lampung yang didapat dari webcam dan print screen. Penelitian yang dilakukan Prarian yaitu membuat sebuah aplikasi yang mampu membaca tulisan dari huruf Lampung dan menunjukkan hasil pembacaan huruf Lampung tersebut.


(5)

Lampung yang diambil adalah hasil huruf cetak yang dicetak dan kemudian dipindai. Penggunaan pengolahan citra pada penelitian ini masih sama dengan penelitian Limbing. Pengolahan citra yang dilakukan adalah pemotongan gambar, segmentasi huruf, perubahan ukuran, dan thinning. Hasil yang didapat adalah Self-organizing Map mampu mengenali huruf Lampung dengan akurasi 75%.

Pada penelitian Fauziah (2013), Self-organizing Map digunakan untuk mengenali citra huruf Korea yang didapat dari print screen. Tujuan dari penelitian yang dilakukan oleh Fauziah adalah untuk membuat sebuah aplikasi yang dapat mengidenfitikasikan huruf Korea lalu menerjemahkannya ke huruf Latin dan Bahasa Indonesia. Metode ektraksi fitur yang digunakan adalah Principal Component Analysis, sedangkan pada pengenalannya digunakan Self-organizing Map. Huruf Korea yang diidentifikasikan adalah print screen dari huruf Korea di layar komputer. Hasilnya adalah, Self-organizing map mampu mengenali huruf Korea dengan akurasi 97,31%. Hasil pengenalan pada penelitian ini sangat tinggi, karena citra yang diproses adalah citra print screen yang tentunya tidak membutuhkan pengolahan citra yang kompleks, tidak seperti hasil pengambilan citra pada kamera yang ditemukan derau atau pengambilan kata yang miring. Hal ini tentunya sangat berpengaruh pada akurasi dari pengenalan pola.

Tabel 2.2. Tabel Penelitian Terdahulu

Penulis Judul Penelitian Keterangan

Stefanus Suriaatmadja Limbing (2007)

Pembuatan aplikasi perangkat lunak pengenalan huruf cetak pada file text hasil scanning dengan menggunakan metode kohonen neural network

Self-organizing Map digunakan untuk

mengenali citra dokumen hasil scan. Huruf yang dikenali adalah huruf Latin.

Cahyo Prarian (2010)

Desain dan Implementasi Sistem Penerjemah Aksara Lampung ke Huruf Latin Berbasis Pengolahan Citra Digital dan Jaringan Syaraf Tiruan Self-organizing Map

Self-organizing Map digunakan untuk mengenali citra huruf Lampung yang diambil dari citra kata Bahasa


(6)

Lampung yang dipotong terlebih dahulu. Citra didapat dari webcam dan print screen.

Farah Fauziah (2012)

Sistem Penerjemah Huruf Korea Ke Huruf Latin Dan Bahasa Indonesia Berbasis Pengolahan Citra Digital Dan Jaringan Syaraf Tiruan Self-Organizing Map (Som)

Self-organizing Map digunakan untuk mengenali citra huruf korea yang diambil dari printscreen.