PENGENALAN POLA DAUN DENGAN MENGGUNAKAN METODE RADIAL BASIS FUNCTION DENGAN K-MEANS CLUSTERING UNTUK PENENTUAN JENIS TANAMAN.
(2)
PROCEEDING
SEMINAR NASIONAL
TEKNOLOGI INFORMASI DAN
APLIKASINYA 2013
“Aplikasi Teknologi Informasi dalam Menunjang
Pelestarian Budaya Nasional dan Pengembangan
Sektor Pariwisata”
Bali, 20 September 2013
Diselenggarakan Oleh :
Program Studi Teknik Informatika
Jurusan Ilmu Komputer
Universitas Udayana
(3)
KATA PENGANTAR
Puji syukur kita panjatkan kehadirat Tuhan Yang Maha Esa, atas terselesainya
penyususnan Proceeding SNATIA 2013 ini. Buku ini memuat naskah hasil penelitian
dari berbagai bidang kajian yang telah direview oleh pakar dibidangnya dan telah
dipresentasikan dalam acara Seminar SNATIA tahun 2013 pada tanggal 20 September
2013 di Universitas Udayana kampus Bukit Jimbaran, Badung, Bali.
Kegiatan SNATIA 2013 merupakan agenda tahunan Program Studi Teknik
Informatika, Jurusan Ilmu Komputer, Universitas Udayana. SNATIA 2013 mengambil
tema “Aplikasi Teknologi Informasi dalam Menunjang Pelestarian Budaya Nasional
dan Pengembangan Sektor Pariwisata”, dengan pembicara utama seminar yang terdiri
dari pakar peneliti dibidang teknologi informasi, pembicara dari praktisi pariwisata Bali,
dan pembicara dari Dinas Kebudayaan Propinsi Bali.
Meskipun kegiatan seminar dan pendokumentasian naskah dalam proceeding ini
telah dipersiapkan dengan baik, namun kami menyadari masih banyak kekurangannya.
Untuk itu panitia mohon maaf yang sebesar-besarnya, dan juga mengucapkan
terimakasih atas kepercayaan dan kerjasamanya dalam kegiatan ini. Kritik dan saran
perbaikan sangat diharapkan untuk penyempurnaan di masa mendatang, yang dapat
dikirimkan melalui e-mail snatia@cs.unud.ac.id.
Kepada semua pihak yang terlibat, baik langsung maupun tidak langsung dalam
penyelenggaraan seminar, dan penyusunan proceeding SNATIA 2013, panitia
mengucapkan terima kasih.
Denpasar, 20 September 2013
(4)
DAFTAR ISI
Kata Pengantar
Daftar Isi
Penerapan Analytical Network Process Dalam Purchasing Motor Second
(Studi Kasus : Sumber Baru Motor, Yogyakarta)
Agus Aan Jiwa Permana ...
1
Transformasi Model Warna Yuv Dan Fuzzy Support Vector Machine
Untuk Klasifikasi Citra Satelit
Ahmad Afif Supianto, Sutrisno ...
13
Passage Retrieval In Question Answering System
I Wayan Supriana, I Wayan Santiyasa, Cokorda Rai Adi Pramartha ...
23
Sentiment Analysis Dokumen E-Complaint Kampus Menggunakan
Additive Selected Kernel SVM
Imam Cholissodin, Budi Darma S ...
29
Segmentasi Data Citra Satelit Berdasarkan Homogenitas Spektral
Menggunakan Model Markov Random Field
Murinto, Agus Harjoko, Sri Hartati ...
53
Penerapan Algoritma Boyer More Dan Levenshtein Distance Dalam
Koreksi Penulisan Kata Berbahasa Indonesia
Yulison Herry Chrisnanto, Erna Dhini Nurhasanah, Agus Komarudin ...
61
Artificial Stigmergy Semut Dalam Penanganan Masalah Optimasi
Pencarian Jalur Terpendek Ekspedisi Barang
Ketut Bayu Yogha Bintoro, Ni G. A. P. Harry Saptarini ...
73
Pengembangan Sistem Informasi Akuntansi BMT Berbasis Web (studi
kasus BMT AZZAM)
Tedy Setiadi, Risfi Syarif ...
81
Pengaturan Penempatan Buku Di Perpustakaan Menggunakan Metode
Association Rule Analysis Dan Vertical Format Algorithm
Ni Wayan Mirah Pratiwi Negari, Agus Muliantara, Ngurah Agus Sanjaya
ER ... ...
93
Pengamanan Data Citra Digital Menggunakan Metode Vigenere Cipher
Hamdani , Anindita Septiarini, Irmadani Apriningrum ...
103
Teknik Pengamanan dari Serangan Spammers
(5)
Femur Length Detection And Measurement Using Cascade Adaboost And
Morphology Operators
Zaki Imaduddin, I Putu Satwika, Robeth Rahmatullah, Wisnu Jatmiko ...
119
Sistem Pendukung Pemilihan Keputusan Penentuan Kelayakan Penerima
Jaminan Kesehatan Masyarakat Menggunakan Multiple Attribut Decision
Making (MADM) Dan Metode Simple Additive Weighting (SAW)
Gunawan Abdillah, Agus Komarudin, Agun Abdul Gani ...
127
Pseudo Random Number Generator Untuk Kode Acak Pin Pada Sistem
Informasi PMDK Online
Made Putra Wira Dharma, Agus Muliantara ...
135
SMS Gateway Untuk Peningkatan Pelayanan Kepada Customer (Studi
Kasus : PT Bhakti Jaya Mobil Indonesia)
Ni G. A. P. Harry Saptarini, Zulfahmi Alif Abdi...
145
Optimasi Sistem Distribusi Dua Tingkat Dengan Algoritma Genetika
Adaptif
Putu Indah Ciptayani, Zulfahmi Indra ...
159
Pengaruh Nguyen Widrow Dan Momentum Pada Kinerja Jaringan Syaraf
Tiruan Backpropagation
I Gusti Agung Ari Bawarta, I Made Widiartha ...
167
Peramalan Hujan Harian Menggunakan Algoritma Backpropagation
Ida Bagus Gede Bayu Priyanta, Elsyantri Nana Suhendra,
I Gede Santi
Astawa ... ...
175
Pengenalan Pola Daun Dengan Menggunakan Metode Radial Basis
Function Dengan K-Means Clustering Untuk Penentuan Jenis Tanaman
Ni Putu Tessa Intaran, Agus Muliantara ...
181
Prototype Sistem Penunjuk Arah dan Pelacakan Bagi Penyandang Tuna
Netra berbasis RFID (Radio Frequency Identification)
I Made Widhi Wirawan ...
189
Aplikasi Mobile Menampilkan Data Property Perusahaan Property
Menggunakan Sistem Operasi Android
Cok. Istri Oka Diah Anggaraeni ...
201
Implementasi Fuzzy dalam Proses Pengereman Secara Otomatis
Menggunakan Metode Mamdani
(6)
Proceeding Seminar Nasional Teknologi Informasi & Aplikasinya
2013
181 Jurusan Ilmu Komputer, FMIPA, Universitas Udayana
PENGENALAN POLA DAUN DENGAN MENGGUNAKAN METODE RADIAL
BASIS FUNCTION DENGAN K-MEANS CLUSTERING UNTUK PENENTUAN
JENIS TANAMAN
Ni Putu Tessa Intaran, Agus Muliantara
Jurusan Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Udayana
Jalan Kampus Bukit Jimbaran, Badung, Bali Email : tessa_changetheworld@yahoo.com
ABSTRAK
Indonesia merupakan negara beriklim tropis, oleh karena itu indonesia memiliki spesies tanaman yang beraneka ragam. Tidak semua orang dapat mengenali berbagai jenis tanaman. Untuk itu deperlukan aplikasi yang dapat menyimpan data dan mengenali jenis tumbuhan.
Pada penelitian ini digunakan metode RBFdengan k-means clusteringyang merupakan pengembangan dari RBF dengan randomize cluster decision. Sistem ini terdiri dari beberapa proses yaitu image acquisition, image pre-processing dan image recognition.
Pada penelitian ini penulis menggunakan dataset sebanyak 390 yang diklasifikasikan kedalam 13 class. Tingkat akurasi yang diperoleh dari RBF dengan randomize cluster decision adalah 84.6% dan RBF dengan k-means clustering adalah 98.4%. Dari hasil yang diperoleh menunjukkan bahwa performa RBF dengan k-means clustering lebih unggul dibandingkan RBF dengan randomize cluster decision.
Kata Kunci: Pengenalan Pola, K-Means Clustering, Radial Basis Function ABSTRACT
Indonesia is a tropical country, therefore Indonesia has diverse plant species. Not everyone si able to recognize different types of plants. It is necessary for applications that can store data and identity plants.
In this study the RBF with k-means clustering is used, which is the development of RBF with randomize cluster decision. The system consists of several processes namely image acquisition, image pre-processing and image recognition.
In this study the authors used 390 datasets which are classified into 13 classes. The level of accuracy obtained from RBF with randomize cluster decision is 84.6%, while RBF with k-means clustering is 98.4%. From the result show that RBF with k-means clustering’s performance is better than RFB with randomize cluster decision.
(7)
Proceeding Seminar Nasional Teknologi Informasi & Aplikasinya
2013
182 Jurusan Ilmu Komputer, FMIPA, Universitas Udayana
1
PENDAHULUAN1.1 Latar Belakang
Indonesia merupakan negara beriklim tropis, oleh karena itu indonesia memiliki spesies tanaman yang beraneka ragam. Tanaman yang tersebar ada yang berguna dan ada juga yang berbahaya. Tidak semua orang dapat mengenali berbagai jenis tanaman karena untuk menghafal semua jenis tanaman merupakan tugas yang sulit dilakukan oleh manusia. Oleh karena itu diperlukanlah suatu aplikasi yang mampu mengenali jenis daun dan mengklasifikasikannya ke dalam jenis tanaman.
Dalam ilmu komputer dan Informatika, aplikasi jaringan syaraf tiruan telah banyak dibuktikan keberhasilannya, terutama dalam hal pengenalan pola (pattern recognition) [1].Secara umum terdapat dua tipe pelatihan jaringan syaraf tiruan yaitu pelatihan tanpa pengarahan (unsupervised training) dan pelatihan dengan pengarahan (supervised training)[4]. Jaringan syaraf supervised memiliki kemampuan generalisasi yang baik, dimana proses pembelajaran dan pengenalan pola disesuaikan dengan pola target, sehingga hasil pembelajaran akan diawasi oleh nilai selisih antara target dengan hasil output pembelajaran. Namun model supervised memiliki suatu kelemahan yaitu proses pembelajarannya yang terkadang memakan waktu yang lama. Hal ini disebabkan karena pembelajarannya terus berlanjut (bolak-balik) hingga bobot yang dicapai dianggap ideal. Dilain pihak, jaringan syaraf unsupervised memiliki kemampuan mengelompokkan data masukan dan memerlukan waktu pelatihan yang singkat. Dengan mengkombinasikan kedua jaringan saraf ini dapat dihasilkan suatu jaringan saraf hibrida Fungsi Basis Radial yang memiliki kemampuan generalisasi yang baik dan waktu pelatihan yang singkat[4].
1.2 Rumusan Masalah
Bagaimana mendeteksi dan mengklasifikasikan pola daun berdasarkan citra yang diperoleh dengan memanfaatkan hasil ekstraksi fitur sebagai input pada jaringan saraf tiruan Radial Basis Function.
1.3 Batasan Masalah
Tanaman yang digunakan sebagai input sistem adalah beberapa jenis tanaman dengan menggambil gambar dari daunnya. Tidak semua jenis tanaman yang dijadikan sebagai input hal ini dikarenakan jumlah tamanan yang ada cukup banyak.
2
METODE PENELITIAN 2.1 Diagram KonsepPada diagram konsep, sistem dimulai dengan mengambil citra daun dari berbagai tanaman, kemudian menyimpannya di database sistem. Sistem menerima inputan citra daun yang belum dikenali dari user kemudian mengekstrak beberapa fitur dengan teknik ekstraksi fitur, kemudian dilanjutkan dengan proses recognition. Sistem diagram konsep ditunjukkan pada Gambar 1.
(8)
Proceeding Seminar Nasional Teknologi Informasi & Aplikasinya
2013
183 Jurusan Ilmu Komputer, FMIPA, Universitas Udayana (2)
2.2 Image Acquisition
Merupakan proses pengambilan citra daun dengan menggunakan kamera digital dengan latar belakang daun berwarna putih. Citra daun disimpan dalam format .jpg.
2.3 Image Pre-processing
Merupakan proses sebelum ekstraksi fitur. Pada proses ini citra daun diubah ukurannya menjadi 800 x 800 piksel. Hal ini bertujuan untuk menyeragamkan ukuran semua citra daun. 2.3 Ekstraksi Fitur
Merupakan proses untuk mendapatkan fitur- fitur yang terdapat pada citra sehingga menghasilkan vektor input yang akan digunakan sebagai inputan pada jaringan saraf tiruan. Pada penelitian ini ekstraksi fitur yang digunakan yaitu Principal Component Analysis (PCA). 2.4 K-Means Clustering
Algoritma k-means pertama kali diperkenalkan oleh J.B. MacQueen pada tahun 1976. Berikut merupakan langkah-langkah dari algoritma k-means[3]:
1. Menentukan jumlah cluster 2. Menentukan nilai centroid
Dalam menentukan nilai centroid untuk awal iterasi, nilai awal centroid dilakukan secara acak. Sedangkan jika menentukan nilai centroid yang merupakan tahap dari iterasi, maka digunakan rumus sebagai berikut :
dimana :
adalah centroid / rata-rata cluster ke-i untuk variabel ke-j adalah jumlah data yang menjadi anggota cluster ke-i
adalah indeks dari cluster adalah indeks dari variabel
adalah nilai data ke-k yang ada di dalam cluster tersebut untuk variabel ke-j 3. Menghitung jarak antara titik centroid dengan tiap-tiap objek.
Untuk menghitung jarak tersebut dapat menggunakan Euclidean Distance, yaitu :
dimana :
adalah Euclidean Distance adalah banyaknya objek
merupakan koordinat objek dan merupakan koordinat centroid 4. Pengelompokan objek
Untuk menentukan anggota cluster adalah dengan memperhitungkan jarak minimum objek. Nilai diperoleh dalam keanggotaan data pada distance matriks adalah 0 atau 1, dimana nilai 1 untuk data yang dialokasikan ke cluster dan nilai 0 untuk data yang dialokasikan ke cluster yang lain.
5. Kembali ke tahap 2
lakukan perulangan hingga centroid yang dihasilkan tetap dan anggota cluster tidak berpindah ke cluster lain.
(9)
Proceeding Seminar Nasional Teknologi Informasi & Aplikasinya
2013
184 Jurusan Ilmu Komputer, FMIPA, Universitas Udayana (3)
2.5 Radial Basis Function
Seperti halnya jaringan saraf tiruan yang lain, Radial Basis FunctionNetwork (RBFN) juga memiliki topologi jaringan. Topologi milik RFBN terdiri atas unit lapisan masukkan (input layer), unit lapisan tersembunyi (hidden layer), dan unit keluaran (output layer) [1].Topologi RBFN ditunjukkan pada Gambar 2 :
Hal yang khusus pada RBFN ialah berikut ini :
1. Jumlah cluster yang terbentuk dari proses clustering menentukan jumlah hidden layer yang akan di pakai.
2. Pada hidden layer digunakan sebuah fungsi aktivasi yang berbasis radial, yaitu fungsi Gaussian.
Gambar 14 Topologi Jaringan RBF 3. Sifat jaringannya ialah feed-forward.
Fungsi Gaussian bisa dituliskan sebagai berikut :
dimana nilai adalah nilai spread
Pada rumus juga disebutkan tentang adanya center atau pusat. Pusat yang dimaksud disini ialah pusat cluster dari data. Jumlah center menentukan jumlah hidden layer yang dipakai [1].
Algoritma Pelatihan Jaringan
Berguna atau tidaknya suatu jaringan saraf tiruan ditentukan dari hasil pelatihannya yang berupa bobot neuronnya. RBFN memiliki algoritma pelatihan yang agak unik karena terdiri atas cara yaitu supervised dan unsupervised sekaligus. Pelatihan RBFN terdiri dari dua tahap [1]. Tahap 1 : Clustering Data
Pada tahap pertama, data di-cluster atau dikelompokkan. Penentuan cluster dengan sendirinya akan menghasilkan center atau pusat dari kelompok data. Jumlah cluster menentukan hidden unit yang dipakai [1].
Dalam menentukan center, ada dua cara yang bisa dipakai yaitu dengan cara menetukan center secara acak dari kelompok data (randomize cluster decision) dan dengan menggunakan algoritma clustering.
Dalam penelitian ini, untuk menentukan center dari suatu cluster, penulis menggunakan dua metode yang akan dibandingkan yaitu randomize cluster decision dan k-means
(10)
Proceeding Seminar Nasional Teknologi Informasi & Aplikasinya
2013
185 Jurusan Ilmu Komputer, FMIPA, Universitas Udayana
clustering. Dengan algoritma tersebut, jaringan saraf tiruan mampu mencari sendiri center-center yang terbaik dari pelatihan RBFN tersebut, dapat disimpulkan bahwa pada tahap ini, pelatihan bersifat unsupervised.
Tahap 2 : Mencari Nilai Bobot
Tahap ini bertujuan untuk mendapatkan nilai bobot neuron pada jaringan saraf hal ini dikarenakan jaringan saraf tiruan menyimpan pengetahuannya dalam bobot. Pada tahap ini juga dibutuhkan data training beserta targetnya. Jadi, dapat disimpulkan bahwa tahap ini bersifat supervised. Langkah-langkah pada tahap ini adalah sebagai berikut :
1. Meneruskan sinyal input ke hidden layer dan menghitung nilai fungsi aktivasinya pada tiap hidden layer. Untuk itu digunakan rumus [1]:
m = 1,2,3,... sesuai dengan jumlah training pattern j = 1,2,3,... sesuai dengan jumlah hidden layer x = vektor input
t = vektor data yang dianggap sebagai center
2. Menyusun matriks Gaussian dari hasil perhitungan pada langkah 1.
3. Menghitung bobot (w) dengan mengalikan pseudoinverse dari matrik G dengan vektor target (d) dari data training. Rumusnya yaitu :
Hasil akhir pada tahap ini yaitu nilai spread, center dan bobot yang disimpan. ProsesTesting
Pada proses testing data inputan baru di aktifasi terlebih dahulu menggunakan fungsi aktivasi, kemudian dikalikan dengan bobot yang telah disimpan pada proses sebelumnya. Berikut merupakan langkah-langkah pada proses testing.
1. Meneruskan sinyal input ke hidden layer dan menghitung nilai fungsi aktivasinya pada tiap hidden layer. Dengan Rumus :
2. Nilai spread yang digunaka yaitu nilai spread yang telah disimpan pada proses training, begitu pula dengan nilai center-nya.
3. Menyusun matriks Gaussian
4. Hasil dari matrik gaussian tersebut dikalikan dengan bobot yang telah disimpan pada proses training sebelumnya. Sehingga
y = hasil output
G = matrik gaussian citra baru
(6)
(7)
(8)
(11)
Proceeding Seminar Nasional Teknologi Informasi & Aplikasinya
2013
186 Jurusan Ilmu Komputer, FMIPA, Universitas Udayana w = bobot
2.6 User Interface
Gambar 15 Form Input Citra
Gambar 2 merupakan form untuk menginputkan citra yang ingin dikenali. Inputan berupa angka nomor urut citra yang sudah disimpan di dalam database.
Gambar 16 Form Hasil Pengenalan
Gambar 3 merupakan form yang menampilkan hasil pengenalan dari citra daun yang ingin dikenali.
3
HASIL DAN PEMBAHASANSistem ini menggunakan data training sebanyak 390 gambar yang diklasifikasikan kedalam 13 class dimana masing-masing class terdiri dari 30 gambar. Sementara untuk data testing digunakan 5 gambar pada masing-masing class, sehingga jumlah data testing adalah 65 gambar.
Tabel 5 Data Hasil Testing Jenis Tanaman
(Nama Ilmiah)
N RBF
denganRandomize Cluster Decision
RBF dengan K-Means
Clustering
B S B S
Mangifera indica 5 5 0 5 0
Psidium guajava 5 5 0 5 0
Aloe vera 5 3 2 5 0
Indigofera Tinctoria 5 5 0 5 0
Cinnamomum japonicum Sieb.
5 4 1 5 0
Citrus reticulata Blanco
5 5 0 5 0
(12)
Proceeding Seminar Nasional Teknologi Informasi & Aplikasinya
2013
187 Jurusan Ilmu Komputer, FMIPA, Universitas Udayana amaryllifolius
Dahlia pinata 5 3 2 5 0
Punica granatum 5 5 0 5 0
Hylocereus undatus 5 5 0 5 0
Lansium domesticum 5 5 0 5 0
Erythrina 5 3 2 4 1
Mallotus paniculate 5 3 2 5 0
N = Jumlah Data, B = Jumlah Data Benar, S = Jumlah Data Salah
Presentase akurasi sistem diperoleh dengan cara [2]:
= Presentase
= Jumlah data yang benar = Jumlah keseluruhan data
4
KESIMPULANPada penelitian ini membandingkan dua metode yaitu RBF dengan randomize cluster decision dan RBF dengan k-means clustering. Hasil yang diperoleh yaitu RBF dengan randomize cluster decision memiliki tingkat akurasi 84.6 % sedangkan RBF dengan k-means clustering memiliki tingkat keakuratan 98.4%. Hal ini berarti bahwa RBF dengan k-means clustering lebih unggul dibandingkan RBF dengan randomize cluster decision. Sistem RBF memiliki keunggulan dalam hal kecepatan pelatihan karena tidak ada target iterasi pada proses pelatihan (hanya 1 kali jalan).
Saran kedepannya diharapkan agar menggunakan dataset yang lebih banyak lagi serta menggunakan metode lain untuk membandingkan hasil penelitian ini dengan hasil penelitian selanjutnya.
5
DAFTAR PUSTAKA[1] Haryono, Muhammad E.A. 2005. Pengenalan Huruf Menggunakan Model Jaringan Saraf Tiruan Radial Basis Function Dengan Randomize Cluster Decition. Yogyakarta..
[2] Hietania, F. 2012. Implementasi Backpropagation Dalam Pengolahan Citra Teks Tulisan Tangan Menjadi Teks Digital. JELIKU
[3] Wakhidah, Nur. 2005. Clustering Menggunakan K-Means Algorithm. Tr@nsForMat!ka ISSN 1693-3656 Vol.8 No.1
[4] Elviralita, Yoan. 2011. Pengembangan Metode Jringan Safar Tiruan Dengan Fungsi Basis Radial (FBR) Fuzzy Dan Aplikasinya. Depok : Universitas Indonesia.
(1)
182 Jurusan Ilmu Komputer, FMIPA, Universitas Udayana
1
PENDAHULUAN1.1 Latar Belakang
Indonesia merupakan negara beriklim tropis, oleh karena itu indonesia memiliki spesies tanaman yang beraneka ragam. Tanaman yang tersebar ada yang berguna dan ada juga yang berbahaya. Tidak semua orang dapat mengenali berbagai jenis tanaman karena untuk menghafal semua jenis tanaman merupakan tugas yang sulit dilakukan oleh manusia. Oleh karena itu diperlukanlah suatu aplikasi yang mampu mengenali jenis daun dan mengklasifikasikannya ke dalam jenis tanaman.
Dalam ilmu komputer dan Informatika, aplikasi jaringan syaraf tiruan telah banyak dibuktikan keberhasilannya, terutama dalam hal pengenalan pola (pattern recognition) [1].Secara umum terdapat dua tipe pelatihan jaringan syaraf tiruan yaitu pelatihan tanpa pengarahan (unsupervised training) dan pelatihan dengan pengarahan (supervised training)[4]. Jaringan syaraf supervised memiliki kemampuan generalisasi yang baik, dimana proses pembelajaran dan pengenalan pola disesuaikan dengan pola target, sehingga hasil pembelajaran akan diawasi oleh nilai selisih antara target dengan hasil output pembelajaran. Namun model supervised memiliki suatu kelemahan yaitu proses pembelajarannya yang terkadang memakan waktu yang lama. Hal ini disebabkan karena pembelajarannya terus berlanjut (bolak-balik) hingga bobot yang dicapai dianggap ideal. Dilain pihak, jaringan syaraf unsupervised memiliki kemampuan mengelompokkan data masukan dan memerlukan waktu pelatihan yang singkat. Dengan mengkombinasikan kedua jaringan saraf ini dapat dihasilkan suatu jaringan saraf hibrida Fungsi Basis Radial yang memiliki kemampuan generalisasi yang baik dan waktu pelatihan yang singkat[4].
1.2 Rumusan Masalah
Bagaimana mendeteksi dan mengklasifikasikan pola daun berdasarkan citra yang diperoleh dengan memanfaatkan hasil ekstraksi fitur sebagai input pada jaringan saraf tiruan Radial Basis Function.
1.3 Batasan Masalah
Tanaman yang digunakan sebagai input sistem adalah beberapa jenis tanaman dengan menggambil gambar dari daunnya. Tidak semua jenis tanaman yang dijadikan sebagai input hal ini dikarenakan jumlah tamanan yang ada cukup banyak.
2
METODE PENELITIAN 2.1 Diagram KonsepPada diagram konsep, sistem dimulai dengan mengambil citra daun dari berbagai tanaman, kemudian menyimpannya di database sistem. Sistem menerima inputan citra daun yang belum dikenali dari user kemudian mengekstrak beberapa fitur dengan teknik ekstraksi fitur, kemudian dilanjutkan dengan proses recognition. Sistem diagram konsep ditunjukkan pada Gambar 1.
(2)
183 Jurusan Ilmu Komputer, FMIPA, Universitas Udayana (2)
2.2 Image Acquisition
Merupakan proses pengambilan citra daun dengan menggunakan kamera digital dengan latar belakang daun berwarna putih. Citra daun disimpan dalam format .jpg.
2.3 Image Pre-processing
Merupakan proses sebelum ekstraksi fitur. Pada proses ini citra daun diubah ukurannya menjadi 800 x 800 piksel. Hal ini bertujuan untuk menyeragamkan ukuran semua citra daun.
2.3 Ekstraksi Fitur
Merupakan proses untuk mendapatkan fitur- fitur yang terdapat pada citra sehingga menghasilkan vektor input yang akan digunakan sebagai inputan pada jaringan saraf tiruan. Pada penelitian ini ekstraksi fitur yang digunakan yaitu Principal Component Analysis (PCA).
2.4 K-Means Clustering
Algoritma k-means pertama kali diperkenalkan oleh J.B. MacQueen pada tahun 1976. Berikut merupakan langkah-langkah dari algoritma k-means[3]:
1. Menentukan jumlah cluster 2. Menentukan nilai centroid
Dalam menentukan nilai centroid untuk awal iterasi, nilai awal centroid dilakukan secara acak. Sedangkan jika menentukan nilai centroid yang merupakan tahap dari iterasi, maka digunakan rumus sebagai berikut :
dimana :
adalah centroid / rata-rata cluster ke-i untuk variabel ke-j adalah jumlah data yang menjadi anggota cluster ke-i
adalah indeks dari cluster adalah indeks dari variabel
adalah nilai data ke-k yang ada di dalam cluster tersebut untuk variabel ke-j 3. Menghitung jarak antara titik centroid dengan tiap-tiap objek.
Untuk menghitung jarak tersebut dapat menggunakan Euclidean Distance, yaitu :
dimana :
adalah Euclidean Distance adalah banyaknya objek
merupakan koordinat objek dan merupakan koordinat centroid 4. Pengelompokan objek
Untuk menentukan anggota cluster adalah dengan memperhitungkan jarak minimum objek. Nilai diperoleh dalam keanggotaan data pada distance matriks adalah 0 atau 1, dimana nilai 1 untuk data yang dialokasikan ke cluster dan nilai 0 untuk data yang dialokasikan ke cluster yang lain.
5. Kembali ke tahap 2
lakukan perulangan hingga centroid yang dihasilkan tetap dan anggota cluster tidak berpindah ke cluster lain.
(3)
184 Jurusan Ilmu Komputer, FMIPA, Universitas Udayana (3)
2.5 Radial Basis Function
Seperti halnya jaringan saraf tiruan yang lain, Radial Basis FunctionNetwork (RBFN) juga memiliki topologi jaringan. Topologi milik RFBN terdiri atas unit lapisan masukkan (input layer), unit lapisan tersembunyi (hidden layer), dan unit keluaran (output layer) [1].Topologi RBFN ditunjukkan pada Gambar 2 :
Hal yang khusus pada RBFN ialah berikut ini :
1. Jumlah cluster yang terbentuk dari proses clustering menentukan jumlah hidden layer yang akan di pakai.
2. Pada hidden layer digunakan sebuah fungsi aktivasi yang berbasis radial, yaitu fungsi Gaussian.
Gambar 14 Topologi Jaringan RBF
3. Sifat jaringannya ialah feed-forward.
Fungsi Gaussian bisa dituliskan sebagai berikut :
dimana nilai adalah nilai spread
Pada rumus juga disebutkan tentang adanya center atau pusat. Pusat yang dimaksud disini ialah pusat cluster dari data. Jumlah center menentukan jumlah hidden layer yang dipakai [1].
Algoritma Pelatihan Jaringan
Berguna atau tidaknya suatu jaringan saraf tiruan ditentukan dari hasil pelatihannya yang berupa bobot neuronnya. RBFN memiliki algoritma pelatihan yang agak unik karena terdiri atas cara yaitu supervised dan unsupervised sekaligus. Pelatihan RBFN terdiri dari dua tahap [1].
Tahap 1 : Clustering Data
Pada tahap pertama, data di-cluster atau dikelompokkan. Penentuan cluster dengan sendirinya akan menghasilkan center atau pusat dari kelompok data. Jumlah cluster menentukan hidden unit yang dipakai [1].
Dalam menentukan center, ada dua cara yang bisa dipakai yaitu dengan cara menetukan center secara acak dari kelompok data (randomize cluster decision) dan dengan menggunakan algoritma clustering.
Dalam penelitian ini, untuk menentukan center dari suatu cluster, penulis menggunakan dua metode yang akan dibandingkan yaitu randomize cluster decision dan k-means
(4)
185 Jurusan Ilmu Komputer, FMIPA, Universitas Udayana
clustering. Dengan algoritma tersebut, jaringan saraf tiruan mampu mencari sendiri center-center yang terbaik dari pelatihan RBFN tersebut, dapat disimpulkan bahwa pada tahap ini, pelatihan bersifat unsupervised.
Tahap 2 : Mencari Nilai Bobot
Tahap ini bertujuan untuk mendapatkan nilai bobot neuron pada jaringan saraf hal ini dikarenakan jaringan saraf tiruan menyimpan pengetahuannya dalam bobot. Pada tahap ini juga dibutuhkan data training beserta targetnya. Jadi, dapat disimpulkan bahwa tahap ini bersifat supervised. Langkah-langkah pada tahap ini adalah sebagai berikut :
1. Meneruskan sinyal input ke hidden layer dan menghitung nilai fungsi aktivasinya pada tiap hidden layer. Untuk itu digunakan rumus [1]:
m = 1,2,3,... sesuai dengan jumlah training pattern j = 1,2,3,... sesuai dengan jumlah hidden layer x = vektor input
t = vektor data yang dianggap sebagai center
2. Menyusun matriks Gaussian dari hasil perhitungan pada langkah 1.
3. Menghitung bobot (w) dengan mengalikan pseudoinverse dari matrik G dengan vektor target (d) dari data training. Rumusnya yaitu :
Hasil akhir pada tahap ini yaitu nilai spread, center dan bobot yang disimpan.
ProsesTesting
Pada proses testing data inputan baru di aktifasi terlebih dahulu menggunakan fungsi aktivasi, kemudian dikalikan dengan bobot yang telah disimpan pada proses sebelumnya. Berikut merupakan langkah-langkah pada proses testing.
1. Meneruskan sinyal input ke hidden layer dan menghitung nilai fungsi aktivasinya pada tiap hidden layer. Dengan Rumus :
2. Nilai spread yang digunaka yaitu nilai spread yang telah disimpan pada proses training, begitu pula dengan nilai center-nya.
3. Menyusun matriks Gaussian
4. Hasil dari matrik gaussian tersebut dikalikan dengan bobot yang telah disimpan pada proses training sebelumnya. Sehingga
y = hasil output
G = matrik gaussian citra baru
(6)
(7)
(8)
(5)
186 Jurusan Ilmu Komputer, FMIPA, Universitas Udayana w = bobot
2.6 User Interface
Gambar 15 Form Input Citra
Gambar 2 merupakan form untuk menginputkan citra yang ingin dikenali. Inputan berupa angka nomor urut citra yang sudah disimpan di dalam database.
Gambar 16 Form Hasil Pengenalan
Gambar 3 merupakan form yang menampilkan hasil pengenalan dari citra daun yang ingin dikenali.
3
HASIL DAN PEMBAHASANSistem ini menggunakan data training sebanyak 390 gambar yang diklasifikasikan kedalam 13 class dimana masing-masing class terdiri dari 30 gambar. Sementara untuk data testing digunakan 5 gambar pada masing-masing class, sehingga jumlah data testing adalah 65 gambar.
Tabel 5 Data Hasil Testing
Jenis Tanaman (Nama Ilmiah)
N RBF
denganRandomize Cluster Decision
RBF dengan K-Means
Clustering
B S B S
Mangifera indica 5 5 0 5 0
Psidium guajava 5 5 0 5 0
Aloe vera 5 3 2 5 0
Indigofera Tinctoria 5 5 0 5 0
Cinnamomum japonicum Sieb.
5 4 1 5 0
Citrus reticulata Blanco
5 5 0 5 0
(6)
187 Jurusan Ilmu Komputer, FMIPA, Universitas Udayana amaryllifolius
Dahlia pinata 5 3 2 5 0
Punica granatum 5 5 0 5 0
Hylocereus undatus 5 5 0 5 0
Lansium domesticum 5 5 0 5 0
Erythrina 5 3 2 4 1
Mallotus paniculate 5 3 2 5 0
N = Jumlah Data, B = Jumlah Data Benar, S = Jumlah Data Salah
Presentase akurasi sistem diperoleh dengan cara [2]:
= Presentase
= Jumlah data yang benar = Jumlah keseluruhan data
4
KESIMPULANPada penelitian ini membandingkan dua metode yaitu RBF dengan randomize cluster decision dan RBF dengan k-means clustering. Hasil yang diperoleh yaitu RBF dengan randomize cluster decision memiliki tingkat akurasi 84.6 % sedangkan RBF dengan k-means clustering memiliki tingkat keakuratan 98.4%. Hal ini berarti bahwa RBF dengan k-means clustering lebih unggul dibandingkan RBF dengan randomize cluster decision. Sistem RBF memiliki keunggulan dalam hal kecepatan pelatihan karena tidak ada target iterasi pada proses pelatihan (hanya 1 kali jalan).
Saran kedepannya diharapkan agar menggunakan dataset yang lebih banyak lagi serta menggunakan metode lain untuk membandingkan hasil penelitian ini dengan hasil penelitian selanjutnya.
5
DAFTAR PUSTAKA[1] Haryono, Muhammad E.A. 2005. Pengenalan Huruf Menggunakan Model Jaringan Saraf Tiruan Radial Basis Function Dengan Randomize Cluster Decition. Yogyakarta..
[2] Hietania, F. 2012. Implementasi Backpropagation Dalam Pengolahan Citra Teks Tulisan Tangan Menjadi Teks Digital. JELIKU
[3] Wakhidah, Nur. 2005. Clustering Menggunakan K-Means Algorithm. Tr@nsForMat!ka ISSN 1693-3656 Vol.8 No.1
[4] Elviralita, Yoan. 2011. Pengembangan Metode Jringan Safar Tiruan Dengan Fungsi Basis Radial (FBR) Fuzzy Dan Aplikasinya. Depok : Universitas Indonesia.