Pengenalan Pola Daun Untuk Menentukan Jenis Tanaman Obat Tradisional Bali dengan Metode SVM-BDT.

(1)

PENGENALAN POLA DAUN UNTUK MENENTUKAN JENIS

TANAMAN OBAT TRADISIONAL BALI DENGAN METODE

SVM-BDT

SKRIPSI

I WAYAN PIO PRATAMA 1208605033

PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS UDAYANA

BUKIT JIMBARAN 2016


(2)

ii

SURAT PERNYATAAN KEASLIAN KARYA ILMIAH

Yang bertanda tangan di bawah ini menyatakan bahwa naskah Skripsi dengan judul: ……… ……… ………

Nama : I Wayan Pio Pratama

NIM : 1208605033

Program Studi : Teknik Informatika E-mail : piopratama2@gmail.com Nomor telp/HP : 0895338211285

Alamat : Br. Kalah, Peliatan, Ubud, Gianyar

Belum pernah dipublikasikan dalam dokumen skripsi, jurnal nasional maupun internasional atau dalam prosiding manapun, dan tidak sedang atau akan diajukan untuk publikasi di jurnal atau prosiding manapun. Apabila di kemudian hari terbukti terdapat pelanggaran kaidah-kaidah akademik pada karya ilmiah saya, maka saya bersedia menanggung sanksi-sanksi yang dijatuhkan karena kesalahan tersebut, sebagaimana diatur oleh Peraturan Menteri Pendidikan Nasional Nomor 17 Tahun 2010 tentang Pencegahan dan Penanggulangan Plagiat di Perguruan Tinggi.

Demikian Surat Pernyataan ini saya buat dengan sesungguhnya untuk dapat dipergunakan bilamana diperlukan.

Denpasar, 16 Januari 2016 Yang membuat pernyataan,

Materai

(I Wayan Pio Pratama) NIM. 1208605033


(3)

(4)

(5)

(6)

vi

KATA PENGANTAR

Laporan tugas akhir dengan judul Pengenalan Pola Daun Untuk Menentukan Jenis Tanaman Obat Tradisional Bali dengan Metode SVM-BDT ini disusun dalam rangkaian kegiatan pelaksanaan Tugas Akhir di Jurusan Ilmu Komputer FMIPA UNUD. Sehubungan dengan telah terselesaikannya laporan tugas akhir ini, maka penulis ucapkan terima kasih dan penghargaan kepada berbagai pihak yang telah membantu dalam menyusun laporan tugas akhir ini, antara lain:

1. Bapak Agus Muliantara, S.Kom, M.Kom sebagai Pembimbing I yang telah banyak membantu menyempurnakan tugas akhir ini;

2. Bapak I Putu Gede Hendra Suputra, S.Kom, M.Kom sebagai Pembimbing II yang telah bersedia meluangkan waktu untuk mengoreksi serta memberikan saran selama penyusunan tugas akhir ini;

3. Bapak Agus Muliantara, S.Kom, M.Kom. selaku Ketua Jurusan Ilmu Komputer Universitas Udayana yang telah banyak memberikan motivasi sehingga memperlancar dalam proses pembuatan tugas akhir ini;

4. Bapak-bapak dan ibu-ibu dosen di Jurusan Ilmu Komputer yang juga telah meluangkan waktu turut memberikan saran dan masukan dalam penyusunan skripsi ini;

5. Semua pihak yang telah memberi dukungan sehingga skripsi ini dapat diselesaikan sesuai dengan waktu yang ditentukan.

Disadari pula bahwa tentu proposal ini masih mengandung kelemahan dan kekurangan sehingga kritik dan saran dari pembaca sangat penulis harapkan. Penulis juga berharap skripsi ini mampu memberikan inspirasi kepada pembaca dan menemukan ide-ide baru yang dapat dibuat menjadi topik penelitian selanjutnya.

Bukit Jimbaran, 17 Januari 2016


(7)

vii DAFTAR ISI

HALAMAN JUDUL ... i

SURAT PERNYATAAN KEASLIAN KARYA ILMIAH ... ii

LEMBAR PENGESAHAN TUGAS AKHIR ... iii

ABSTRAK ... iv

ABSTRACT ... v

KATA PENGANTAR ... vi

DAFTAR ISI ... vii

DAFTAR TABEL ... x

DAFTAR GAMBAR ... xi

DAFTAR LAMPIRAN ... xii

BAB I PENDAHULUAN ... 1

Latar Belakang ... 1

Rumusan Masalah ... 2

Tujuan Penelitian ... 2

Batasan Masalah ... 2

Manfaat Penelitian ... 3

Metodelogi Penelitian ... 3

1.6.1 Desain Penelitian ... 3

1.6.2 Pengumpulan Data ... 4

1.6.3 Pengolahan Data Awal ... 4

1.6.4 Metode yang Digunakan ... 5

BAB II TINJAUAN PUSTAKA ... 6

Tinjauan Teoritis ... 6

2.1.1 Usadha Taru ... 6

2.1.2 Daun ... 7


(8)

viii

2.1.3.4 Diteksi Tepi ... 10

2.1.3.5 Structuring Elements (SE)... 12

2.1.4 Pengenalan Pola ... 14

2.1.5 Sequential Minimal Optimization (SMO) ... 19

2.1.6 BDT (Binary Decsision Tree) ... 21

2.1.7 Random Subsampling ... 21

BAB III ANALISIS DAN PERANCANGAN ... 23

Kebutuhan Fungsional ... 23

3.1.1 Tanaman Obat Tradisional Bali ... 23

3.1.2 Melakukan Acquisition dan Pre-processing Pada Citra Daun ... 24

3.1.3 Ekstraksi Fitur Tanaman Obat Tradisional Bali ... 25

3.1.4 Training Dengan SVM-BDT ... 26

3.1.5 Penyelesaian SVM Dengan SMO ... 28

Rancangan Data ... 31

Testing ... 32

Rancangan Antar Muka Sistem ... 33

Pengujian dan Evaluasi ... 34

BAB IV HASIL DAN PEMBAHASAN ... 35

Pengumpulan Dataset ... 35

Implemetasi Acquisition Citra Daun ... 40

Fitur Tanaman Obat Tradisional Bali ... 41

Implementasi Proses SVM-BDT ... 43

Tampilan Antarmuka Sistem ... 45

Hasil dan Pengujian Sistem ... 49


(9)

ix

BAB V KESIMPULAN DAN SARAN ... 54

Kesimpulan ... 54

Saran ... 54

DAFTAR PUSTAKA ... 55 LAMPIRAN


(10)

x

DAFTAR TABEL

Tabel 2. 1 Fungsi Kernel ... 18

Tabel 3. 1 Psudocode Dot Product ... 28

Tabel 3. 2 Psudocode Fungsi Hyperplane ... 28

Tabel 3. 3 Psudocode Update Bias ... 29

Tabel 3. 4 Psudocode SMO ... 29

Tabel 4. 1 Daftar Tanaman Obat Tradisional Bali ... 36

Tabel 4. 2 Source Code SVM-BDT ... 44

Tabel 4. 3 Hasil Pengujian Sistem Dengan Fitur Tambahan ... 49


(11)

xi

DAFTAR GAMBAR

Gambar 2. 1 Bentuk Dasar Daun ... 7

Gambar 2. 2 Jenis Tepian Daun ... 8

Gambar 2. 3 Contoh Daun ... 8

Gambar 2. 4 (a) Citra RGB (b) Citra Hasil Opening Morphology... 13

Gambar 2. 5 (a) hyperplane non optimal (b) hyperplane optimal ... 15

Gambar 2. 6 SVM-Nonlinear ... 18

Gambar 2. 7 SMO ... 19

Gambar 2. 8 BDT ... 21

Gambar 3. 1 Proses Training dan Testing ... 23

Gambar 3. 2 Preprocessing ... 25

Gambar 3. 3 Flowchart Training ... 27

Gambar 3. 4 SVM-BDT ... 28

Gambar 3. 5 Contoh Citra Daun ... 32

Gambar 3. 6 Flowchart Testing ... 33

Gambar 3. 7 Rancangan Antar Muka Ekstraksi Fitur ... 33

Gambar 3. 8 Rancangan Antar Muka Training dan Testing ... 34

Gambar 4. 1 Daun Kecibling Scanner ... 40

Gambar 4. 2 Daun Dadap Scanner ... 40

Gambar 4. 3 Daun Kecibling Hasil Edit ... 41

Gambar 4. 4 Daun Dadap Hasil Edit ... 41

Gambar 4. 5 Tampilan Antarmuka Awal Sistem ... 45

Gambar 4. 6 Tampilan Antarmuka Sistem Menu Ekstraksi Fitur ... 46

Gambar 4. 7 Tampilan Menu Klasifikasi ... 47

Gambar 4. 8 Tampilan Hasil Uji Satu Data ... 48

Gambar 4. 9 Tampilan Hasil Uji dengan random subsampling ... 48

Gambar 4. 10 Grafik Akurasi Dengan Fitur Tambahan ... 51


(12)

xii

DAFTAR LAMPIRAN Lampiran

1. Hasil Uji Coba Klasifikasi Jenis Tanaman Obat Tradisional Bali dengan Metode SVM-BDT untuk 1 Iterasi


(13)

1 BAB I PENDAHULUAN Latar Belakang

Tanaman merupakan bagian penting dalam ekosistem, berbagai jenis tanaman telah digunakan selama berabad-abad dalam bidang pangan, papan, maupun obat-obatan. Gloria Samantha dalam http://nationalgeographic.co.id menyatakan “…Indonesia menjadi habitat bagi 30.000 dari total sekitar 40.000 jenis tumbuh-tumbuhan obat yang telah dikenal di dunia”, dari sekian banyak jenis tanaman obat yang ada di Indonesia 1.300 jenis telah dimanfaatkan sebagai obat tradisional (Muktiningsih, 2001).

Tanaman obat merupakan salah satu jenis tanaman yang memiliki peranan yang sangat penting dalam hidup manusia, bahkan berdasarkan data WHO 2007, sekitar 80% penduduk dunia dalam perawatan kesehatan memanfaatkan obat tradisional yang berasal dari ekstrak tumbuhan. Pengetahuan tentang obat tradisional khususnya tanaman obat tradisional Bali yang masih rendah menyebabkan sulitnya pemanfaatan obat tradisional oleh masing-masing orang dalam lingkup kecil seperti keluarga, hal ini karena pengetahuan mengenai tanaman obat tradisional Bali masih diturunkan berdasarkan kebiasaan dan pustaka-pustaka seperti lontar yang hanya dimiliki oleh segelintir orang. Tanaman obat tradisional yang mencapai ribuan jenisnya juga sulit untuk diidentifikasi, sekalipun masyarakat telah memiliki pengetahuan mengenai ciri-ciri tanaman obat Bali, karena terdapat beberapa jenis tanaman yang memiliki ciri yang sama satu dengan lainnya dan adanya faktor subjektif dari mata manusia, menyebabkan kesalahan dalam penentuan jenis tanaman obat tradisional Bali kerap terjadi. Hal ini menjelaskan bahwa informasi dan ketelitian menjadi sangat penting dalam melakukan identifikasi tanaman obat tradisional Bali. Mengamati fenomena ini maka dibutuhkan suatu perangkat lunak untuk menentukan jenis tanaman obat tradisional Bali agar kesalahan klasifikasi dapat diminimalisir.

Peneliti bidang Artificial Intelegence telah menggunakan beberapa metode dalam melakukan klasifikasi jenis tanaman seperti probabilistic neural network,


(14)

2

fourier moment, SVM-BDT. Metode yang kerap digunakan dalam klasifikasi tanaman salah satunya adalah SVM-BDT, dibandingkan dengan beberapa metode lainnya seperti fourier moment, probabilistic neural network (PNN) maka SVM-BDT dinyatakan memberikan hasil yang baik dalam hal klasifikasi tanaman (Krishna Singh, 2010). SVM merupakan klasifikasi yang memperoleh solusi optimal sebagai pembeda antar kelas, lain halnya dengan neural network yang umumnya solusi ditentukan oleh pemilihan bobot awal, sehingga classifier yang didapat kemungkinan merupakan local optimum. Klasifikasi jenis tanaman tidak hanya ditentukan oleh metode yang digunakan tapi juga oleh penentuan fitur-fitur yang menjadi tolak ukur klasifikasi, untuk itu ekstraksi fitur juga menjadi penentu akurasi dari classifier (abdul kadir, 2011). Berdasarkan pemaparan sebelumnya maka penelitian kali ini difokuskan pada bagaimana melakukan klasifikasi jenis tanaman obat tradisional Bali.

Rumusan Masalah

Berdasarkan latar belakang di atas maka dapat dirumuskan masalah sebagai berikut :

1. Bagaimana cara mendapatkan citra daun yang sesuai untuk klasifikasi tanaman obat tradisional Bali ?

2. Bagaimana cara menerapkan metode SVM-BDT untuk pengenalan tanaman obat tradisional Bali ?

Tujuan Penelitian

Tujuan dari penelitian ini adalah untuk menerapkan metode SVM-BDT untuk mengenali jenis tanaman obat tradisional Bali yang dilatih.

Batasan Masalah

Ada beberapa batasan masalah dalam penelitian ini. Hal ini dilakukan agar program yang dirancang dapat berjalan dengan baik. Berikut batasan yang ada :

1. Sistem yang dirancang merupakan program offline berbasis desktop. 2. Sistem ini dapat mengenali jenis tanaman obat tradisional hanya


(15)

3

3. Citra daun yang digunakan untuk training maupun testing berukuran minimal 1600 x 1200 piksel diambil dengan scanner dan berlatar putih. 4. Sistem hanya dirancang untuk menentukan jenis antara tanaman obat Bali

satu dengan tanaman obat Bali lainnya yang digunakan sebagai sampel. Manfaat Penelitian

Manfaat dari penelitian ini adalah membantu masyarakat awam dan peneliti berkaitan dengan botani dan obat-obatan dalam menentukan jenis tanaman obat tradisional Bali.

Metodelogi Penelitian

Pada sub-bab metode penelitian dijelaskan mengenai proses yang dilalui untuk mendapatkan fitur-fitur daun serta metode klasifikasi yang digunakan untuk menentukan jenis tanaman obat tradisional Bali. Adapun sub-bab metode penelitian menjelaskan tentang desain penelitian, pengumpulan data, pengolahan data awal dan metode yang digunakan.

1.6.1 Desain Penelitian

Judul dari penelitian ini adalah “Pengenalan Pola Daun Untuk Menentukan Jenis Tanaman Obat Tradisional Bali dengan Metode SVM-BDT”. Penelitian ini merupakan penelitian riset eksperimental (Hasibuan, 2007). Analisis data citra dilakukan dengan memilih data daun tanaman obat tradisional Bali dari sekian banyak jenis tanaman obat di kebun Bokashi Farm, pemilihan tanaman obat tradisional Bali ini didasarkan atas buku usadha Bali. Selanjutnya, daun asli dibersihkan dan di-scan, selanjutnya data diolah sedemikian rupa sehingga memiliki background putih dan didapat ukuran yang diinginkan, proses ini dilakukan secara manual dengan software pengolahan citra. Ukuran background citra yang digunakan minimal 1600x1200 piksel hal ini diperlukan agar ukuran dari citra daun hasil scan sesuai dengan ukuran sebenarnya. Daun hasil load dimunculkan pada imagebox, gambar yang muncul merupakan gambar awal yang di-resize ke ukuran 400 x 300 piksel. Tahap selanjutnya adalah pre-processing yakni citra RGB dikonversi menjadi citra grayscale, black and white, diteksi tepi,


(16)

4

dan operasi morfologi. Proses selanjutnya setelah tahap ekstraksi fitur agar diperoleh 12 fitur digital, selain itu penelitian ini juga menambah fitur 7 Hu’s moment invariant yang nantinya dapat digunakan sebagai pembanding jika dengan maupun tanpa fitur 7 Hu’s moment invariant. Proses berikutnya adalah training dengan SVM-BDT dan dilanjutkan dengan proses testing terhadap data-data daun obat tradisional Bali yang digunakan sebagai sampel.

1.6.2 Pengumpulan Data

Data penelitian ada dua jenis (Hasibuan, 2007), yaitu data primer dan data sekunder. Data primer adalah data yang diambil langsung dari objek penelitian. Sedangkan data sekunder merupakan data yang tidak diperoleh secara langsung dari objek penelitian, melainkan data yang berasal dari sumber yang telah di kumpulkan oleh pihak lain. Data yang digunakan dalam penelitian ini adalah data sekunder, data yang diperoleh berupa daun tanaman yang telah berisi label pada tanamannya, data ini diperoleh dari kebun tanaman obat Bokasi Farm.

1.6.3 Pengolahan Data Awal

Daun tanaman obat tradisional yang berisi label dipilah-pilah untuk dijadikan sampel, pemilihan sampel didasarkan pada jenis-jenias daun yang memiliki kemiripan satu dengan lainnya dan tercantum dalam buku usadha Bali. Data daun dibersihkan dan di-scan lalu diberikan label berupa angka untuk tiap jenis tanaman sesuai data dari kebun Bokasi Farm. Setelah diperoleh data daun asli kemudian dibersihkan dan dilakukan proses scanning citra daun dengan format .jpg, foto daun ini kemudian diolah dengan software pengolahan citra agar background daun hasil scanning menjadi putih dan dilakukan proses resize menjadi ukuran 1600x1200 piksel. Langkah selanjutnya adalah pengolahan citra untuk mendapatkan fitur yang diperlukan, adapun tahapan tersebut meliputi preprocessing seperti proses cropping ,grayscale, black and white, edge ditection, dan opening morphologi. Kemudian dilakukan proses ektraksi fitur seperti smooth factor, narrow factor, diameter, aspect ratio, form factor, rectangularity, perimeter ratio of diameter, perimeter ratio of physiological length and physiological width, dan lima Vein features, selain 12 fitur tersebut juga dilakukan pencarian 7 fitur


(17)

5

lainnya yakni 7 Hu’s invariant moment yang merupakan fitur yang digunakan sebagai pembanding kemampuan klasifikasi nantinya.

1.6.4 Metode yang Digunakan

Dalam penelitian ini, metode yang digunakan untuk training adalah metode SVM-BDT. Pada proses training melibatkan proses pencarian hyperplane yang digunakan untuk klasifikasi terhadap data training maupun testing. SVM merupakan salah satu metode yang sangat popular dengan solusi global-nya jika dibandingkan dengan metode machine learning lainnya seperti perceptron maupun backpropagation. Metode SVM (Support Vector Machine) memberikan solusi optimal pada setiap proses trainingnya, sehingga berbeda dengan perceptron maupun backpropagation yang sering kali memperoleh solusi optimum local yang disebabkan oleh inisialisasi bobot awal secara random. SVM pada proses training berusaha memperoleh hyperplane yang umumnya berupa nilai lagrange multiplier dan nilai bias. SVM hanya menggunakan data-data support vector untuk melakukan klasifikasi sehingga proses testing menjadi relatif cepat, selain itu SVM juga melibatkan fungsi kernel dalam proses training dan testing pada data non-linier guna meningkatkan dimensi data agar lebih mudah untuk memperoleh hyperplane pada data. SVM merupakan salah satu metode yang sangat powerfull, akan tetapi memiliki kelemahan yakni tidak mampunya melakukan klasifikasi multiclass, untuk itu metode SVM di-hybrid dengan model lain yang dalam penelitian ini adalah model BDT(Binary Decsision Tree), sehingga SVM mampu melakukan proses klasifikasi multiclass. SVM-BDT menerapkan proses devisive clustering sebelum dilakukanya proses SVM, proses ini dilakukan secara rekursif, sehingga terbentuk dua kelas berbeda pada setiap iterasi, sampai semua kelas pada data training terklasifikasi.


(18)

6 BAB II

TINJAUAN PUSTAKA Tinjauan Teoritis

2.1.1 Usadha Taru

Ayurveda sudah ada semenjak 2000 tahun yang lalu. Ayurveda adalah ilmu pengetahuan tentang hidup yang berasal dari kata sangsekerta Ayur dan Veda. Ayur berarti hidup dan Veda yang berati pengetahuan. Ayurveda berasal dari Negeri India, namun sekarang menyebar ke seluruh Asia dan negara barat. Sekarang ini Ayurveda dipraktekkan oleh negara-negara yang berkembang seperti Amerika Serikat, Amerika Latin, Eropa dan negara lainnya. Pengobatan Ayurveda berkembang pesat karena terbukti aman dan efektif.

Ramuan obat Ayurveda yang tersedia biasanya berasal dari bahan tanaman, binatang dan bahan dari mineral-mineral. Bahan-bahan yang berasal dari tanaman seperti yang disebutkan dalam pengobatan tradisional (Usadha) Bali dikenal dengan pengobatan Taru Pramana. Taru berarti tanaman dan pramana yang berarti berkhasiat obat. Masyarakat Bali sudah terbiasa memakai tanaman Taru Premana sebagai obat tradisional oleh para Pengusada atau Balian (Healer). Tanaman Taru Premana ini bermanfaat memberikan perlindungan yang terbaik bagi tubuh melawan penyakit, sehingga sangat baik dipakai setiap hari dan sudah menjadikan bagian dari pola hidup sehat. Bahkan, tidak jarang masyarakat memakaiannya saling berdampingan dengan obat modern, hanya saja waktu minumnya diberikan jarak sekitar 2 jam sebelum meminum obat modern. Biasanya obat yang berasal dari tanaman Taru Premana ini dipakai dalam proses mempercepat pemulihan kesehatan. Herbal Taru Premana ini dibuat berupa ekstrak dari tumbuh-tumbuhan atau sari pati dari air tanaman tersebut diolah diberikan pengeras berupa gula tebu atau gula merah menjadi herbal berupa minuman instan, atau digodok untuk diminum air godokannya atau diolah berupa sari pati tanaman, dikeringkan lalu dimasukkan ke dalam kemasan berupa kapsul.


(19)

7

2.1.2 Daun

Daun merupakan suatu bagian tumbuhan yang paling penting pada tumbuhan, secara umum daun digunakan oleh tumbuhan untuk melakukan fotosintesis maupun melakukan respirasi. Pada umumnya tiap tumbuhan mempunyai sejumlah besar daun. Daun hanya terdapat pada batang saja dan tidak pernah terdapat pada bagian lain pada tubuh tumbuhan. Daun memiliki berbagai bentuk dasar seperti ditunjukan pada gambar 2.1.


(20)

8

Dalam Pengenalan jenis tanaman maka tepi daun juga memberikan peranan penting dalam menentukan jenis suatu tanaman. Tepi daun secara umum ada beberapa jenis seperti ditunjukan pada gambar 2.2.

Gambar 2. 2 Jenis Tepian Daun (Bowo, 2011)

Serat daun, lebar daun, warna, dan tekstur kerap kali digunakan dalam klasifikasi jenis daun. Gambar 2.3 menunjukan beberapa jenis daun dengan seratnya, warna, bentuk, lebar, dan tepian daun.


(21)

9

2.1.3 Pengolahan citra

Pengolahan citra adalah pemrosesan citra, khususnya menggunakan komputer untuk mengubah suatu citra menjadi citra dengan format yang berbeda. Klasifikasi citra tidak dapat langsung dilakukan, karena itu diperlukan proses-proses preprocessing seperti grayscale, black and white, smoothing, morphology ,dan edge ditection guna mendapatkan fitur sesuai dengan format yang diinginkan.

2.1.3.1 Citra Grayscale

Citra grayscale merupakan citra digital yang hanya memiliki sebuah nilai kanal pada setiap pixelnya. Nilai tersebut digunakan untuk menunjukan tingkat intensitas citra. Grayscale dapat dihitung dengan persamaan berikut (Lee, 2013) :

= . ∗ + . ∗ + . ∗ ... (2.1)

Keterangan :

∶ ∶

2.1.3.2 Citra Biner

Citra Biner adalah citra digital yang hanya memiliki dua kemungkinan nilai pixel yaitu hitam dan putih. Citra biner juga disebut sebagai citra BW (black white) atau citra monokrom. Berikut persamaan untuk mengubah citra keabuan menjadi citra biner dengan nilai ambang T (Munir, 2013):

, = { ,, , < ... (2.2) Keterangan :

, ∶ ,

∶ ℎ ℎ

2.1.3.3 Smoothing

Pelembutan citra (image smoothing) bertujuan untuk menekan gangguan (noise) pada citra. Gangguan pada citra umumnya berupa variasi intensitas suatu


(22)

10

piksel yang tidak berkolerasi dengan piksel-piksel tetangganya. Piksel yang mengalami gangguan umumnya memiliki frekuensi tinggi. Operasi pelembutan citra dilakukan untuk menekan komponen yang berfrekuensi tinggi dan meloloskan komponen yang berfrekuensi rendah.

2.1.3.3.1 Mean Filter

Mean filter bekerja dengan meratakan piksel citra keabuan, sehingga citra yang diperoleh tampak lebih kabur dari kontrasnya. Berikut matrik mean filter 3x3 (elemen bertanda * menyatakan posisi (0,0) dari piksel yang di-konvolusi).

[ ∗

]

Matrix ini digunakan untuk melakukan smooting dengan melakukan perkalian dengan nilai-nilai tetangga dari citra biner dan mengganti hasil konvulsi dengan nilai tengah matrik citra biner.

2.1.3.4 Diteksi Tepi

Diteksi tepi merupakan pendekatan yang paling sering digunakan untuk untuk segmentasi citra berdasarkan perubahan intensitas yang terjadi secara tiba-tiba, dalam diteksi tepi terdapat 3 langkah dasar yang harus dilakukan (Gonzales, 2008):

1. Image smoothing 2. Ditection of edge point 3. Edge localization

2.1.3.4.1 Dasar Diteksi Tepi

Perubahan intensitas yang besar dalam jarak yang singkat dipandang sebagai fungsi yang memiliki kemiringan yang besar. Kemiringan fungsi biasanya


(23)

11

dilakukan dengan menghitung turunan pertama (gradien). Berikut persamaan gradien dalam notasi vector (Gonzales, 2008) :

= = [ ] = [

� � � �

] ... (2.3) Dalam hal ini,

= � , = +∆ , − , ... (2.4)

=� , = ,∆ + − , ... (2.5) Umumnya ∆ = ∆ = , sehingga persamaan turunan pertama menjadi (Munir, 2013):

= � , = + , − , ... (2.6)

=� , = , + − , ... (2.7) Kedua turunan diatas dapat dipandang sebagai dua buah mask konvulsi berikut (Munir,2013):

= [− ] ... (2.8)

= [− ] ... (2.9) Berdasarkan konvolusi dengan kedua mask tersebut, kita menghitung kekuatan tepi, G[f(x,y)], yang merupakan magnitudo dari gradien, dan arah tepi � , , untuk setiap piksel (Gonzales, 2008):

, = = √ + ... (2.10)

, ≈ | | + | | ... (2.11)

� = − ... (2.12)

Keputusan apakah suatu piksel merupakan tepi atau bukan tepi dinyatakan dengan operasi pengambangan berikut (Munir, 2013):

, = { , , , ... (2.13)

Keterangan :

, ∶ ,


(24)

12

∶ ℎ ℎ

� ∶ ℎ

dalam hal ini T adalah nilai ambang, piksel tepi dinyatakan putih sedangkan piksel bukan tepi dinyatakan hitam.

2.1.3.4.2 Operator Sobel

Suatu pengatuan piksel di sekitar piksel (x,y) :

[ , ]

Operator Sobel adalah magnitude dari gradient yang dihitung dengan :

= √ + ... (2.14) Turunan parsial dihitung dengan :

= + + − + + ... (2.15)

= + + − + + ... (2.16) Dengan konstanta c adalah 2, dalam bentuk mask, Sx dan Sy dapat dinyatakan sebagai :

= [−−

− ] = [− − − ]

Arah tepi dihitung dengan persamaan :

� , = − ... (2.17)

2.1.3.5 Structuring Elements (SE)

Operasi morphologi menggunakan dua input himpunan yaitu suatu citra (pada umumnya citra biner) dan suatu kernel. Khusus dalam morphologi, istilah kernel biasa disebut dengan structuring elements. SE merupakan suatu matrik dan pada umumnya berukuran kecil, yang digunakan dalam proses morphology. Berikut contoh SE berbentuk disk.


(25)

13

2.1.3.6 Opening

Operasi opening merupakan operasi erosi yang diikuti oleh operasi dilasi. Operasi ini mencegah penurunan ukuran objek secara keseluruhan. Pada citra grayscale operasi ini memberikan efek penurunan intensitas bagian citra yang terang yang berukuran lebih kecil dari SE. Sedangkan untuk bagian terang yang lebih besar dari SE tidak berubah. Adapun perubahan yang terjadi setelah proses opening.

(a) (b)

2.1.3.7 HU Invariant Moment

Citra daun memiliki ukuran ruang vektor yang besar, asumsikan memiliki citra berukuran 100x100 piksel dan akan menghasilkan vector pengamatan dengan dimensi 100x100 = 10000, jika dilakukan proses komputasi akan memerlukan waktu komputasi yang lama. Oleh karena itu perlu dilakukan transformasi ruang vector menjadi dimensi yang lebih rendah namun memiliki kualitas citra yang sama baiknya dengan citra asli.

Metode HU Invariant Moment merupakan metode yang umum digunakan pada citra agar memperoleh dimensi yang lebih rendah dan memiliki kualitas citra yang baik dan lebih bervariasi. Citra 2D dengan fungsi f(x,y) dan berordo (p+q) didefinisikan sebagai (Huang, 2010):

= ∫ ∫−∞−∞∞ , ... (2.18)

Untuk p,q=1,2,… citra dengan intensitas piksel I(x,y), maka raw moments dihitung dengan :

� = ∑ ∑ , ... (2.19)


(26)

14

Sedangkan untuk central moments didefinisikan sebagai (Huang, 2010):

� = ∫ ∫−∞−∞∞ − ̅ − ̅ , ... (2.20)

Untuk citra digital maka persamaan diatas menjadi :

� = ∑ ∑ − − , , = , , , … ... (2.21)

Dengan

= ... (2.22)

= ... (2.23) Untuk Rotation Invariant Moments dihitung dengan (Fang, 2014):

= � + � ... (2.24)

= � + � + � ... (2.25)

= � + � + � + � ... (2.26)

= � + � + � + � ... (2.27)

= � + � � + � [ � + � − � + � ] +

� − � � + � [ � + � − � + � ] ... (2.28)

= � + � [ � + � − � + � ] + � � + � � + �

... (2.29)

= � + � � + � [ � + � − � + � ] +

� + � � + � [ � + � − � + � ] ... (2.30)

Dengan

� = �

� + +

... (2.31) Keterangan :

2.1.4 Pengenalan Pola

Pola adalah entitas yang terdefinisi dan dapat diidentifikasi melalui ciri-cirinya (features). Ciri-ciri tersebut digunakan untuk membedakan suatu pola dengan pola lainnya. Ciri yang bagus adalah ciri yang memiliki daya pembeda yang


(27)

15

tinggi, sehingga pengelompokan pola berdasarkan ciri yang dimiliki dapat dilakukan dengan keakuratan yang tinggi.

2.1.4.1 SVM (Support Vector Machine)

SVM merupakan salah satu metode klasifikasi yang umum digunakan saat ini oleh banyak peneliti, karena memiliki kemampuan yang baik dalam banyak aplikasi. Ide dasar SVM adalah memaksimalkan batas hyperplane, yang diilustrasikan seperti gambar berikut :

(a) (b)

Gambar 2. 5 (a) hyperplane non optimal (b) hyperplane optimal (Han, 2006) Pada gambar 2.5 (a) ada sejumlah pilihan hyperplane yang mungkin untuk set data, sedangkan gambar 2.5 (b) merupakan hyperplane dengan margin yang paling maksimal. Meskipun sebenarnya pada gambar 2.5 (a) bisa juga menggunakan hyperplane sembarang, tetapi hyperplane dengan margin yang maksimal akan memberikan generalisasi yang lebih baik pada metode klasifikasi. Konsep klasifikasi dengan SVM dapat dijelaskan secara sederhana sebagai usaha untuk mencari hyperplane terbaik yang berfungsi sebagai pemisah dua buah kelas data pada input space. Data yang tergabung pada kelas -1 disimbolkan dengan bentuk lingkaran keabuan, sedangkan data pada kelas +1, disimbolkan dengan bentuk lingkaran berwarna putih.

Hyperplane

Non-optimal

Hyperplane


(28)

16

2.1.4.1.1 SVM Linier

Setiap data latih dinyatakan oleh , dengan i=1, 2, …, N, dan =

{ , , … , } merupakan atribut (fitur) set untuk data latih ke-i. Untuk

{− , + } menyatakan label kelas. Hyperplane dapat dinotasikan (Prasetyo, 2014):

. + = ... (2.32) w dan b adalah parameter model. . merupakan inner-product antara w dan . Dengan memberikan label -1 untuk kelas pertama dan +1 untuk kelas kedua, maka untuk prediksi semua data uji menggunakan formula (Prasetyo, 2014):

= {+ ,− , . + > . + < ... (2.33) Untuk support vector memenuhi persamaan (Prasetyo, 2014):

. + = − ... (2.34)

. + = + ... (2.35) Dengan mengurangkan kedua persamaan support vector maka diperoleh jarak antara dua hyperplane dari dua kelas tersebut, dinyatakan dengan persamaan berikut (Prasetyo, 2014):

= ‖ ‖ ... (2.36) Margin optimal dihitung dengan memaksimalkan jarak antara hyperplane dan data terdekat. Permasalahan ini selanjutnya diselesaikan dengan Quadratic Programming (QP) dengan meminimalkan invers. Berikut permasalahan QP dalam persamaan matematis (Krisantus, 2007) :

Min

‖ ‖ ... (2.37) Subject to


(29)

17

Permasalahan ini sulit untuk diselesaikan untuk itu perlu dirubah terlebih dahulu dalam bentuk Lagrange Multipliers (Prasetyo, 2014):

= ∑�= � − ∑ � �, ... (2.39)

. merupakan dot-product dua buah data dalam data latih. Syarat 1:

∑� � =

= ... (2.40)

Syarat 2:

� , = , , … , ... (2.41) Keterangan :

� ∶ −

∶ −

∶ −

2.1.4.1.2 SVM Nonlinier

Jika dalam ANN ada perceptron dan MLP, maka dalam SVM terdapat SVM Linier dan SVM Nonlinier (kernel trick). Seperti halnya Perceptron, SVM sebenarnya adalah hyperplane linier yang hanya bekerja pada data yang dapat dipisahkan secara linier. Untuk data yang distribusi kelasnya tidak linear biasanya menggunakan pendekatan kernel pada fitur data awal set data. Kernel dapat didefinisikan sebagai suatu fungsi yang memetakan fitur data dari dimensi awal (rendah) ke fitur baru dengan dimensi yang relatif lebih tinggi (Prasetyo, 2014). Pendekatan ini berbeda dengan metode klasifikasi pada umunya yang justru mengurangi dimensi awal untuk menyederhanakan proses dan memberikan akurasi prediksi yang lebih baik. Berikut gambar permasalahan non-linear :


(30)

18

Gambar 2. 6 SVM-Nonlinear (krisantus, 2007)

Pemetaan kernel dengan cara menghitung dot product dua buah vector di ruang dimensi baru dengan memakai komponen kedua buah vector tersebut di ruang dimensi asal sebagai berikut (Prasetyo, 2014):

( , ) = . ... (2.42) Dan untuk prediksi pada data uji (z) dengan dimensi fitur yang baru dapat diformulasikan (Prasetyo, 2014) :

= . z + = ∑�= � . K , z + ... (2.43)

Keterangan :

� ∶ −

∶ −

∶ ∶

∶ −

N adalah jumlah data yang menjadi support vector, adalah support vector, dan z adalah data uji yang akan dilakukan prediksi.

Berikut beberapa pilihan fungsi kernel (Prasetyo, 2014): Tabel 2. 1 Fungsi Kernel

Nama Kernel Definisi Fungsi


(31)

19

Polynomial K(x,y)= . +

Gaussian RBF K(x,y)=exp −‖ − ‖

.�

Sigmoid K(x,y)=�a�h � . +

Invers Multiquadric K(x,y)=

√‖ − ‖ +

Keterangan :

, ∶ ∶

2.1.5 Sequential Minimal Optimization (SMO)

SMO merupakan algoritma yang diperuntukan untuk mengoptimalkan SVM. SMO membantu dalam menyelesaikan persamaan QP SVM (2.39) dengan batasan (2.40) dan (2.41). Ide SMO pada setiap langkahnya adalah memilih dua lagrange multipliers untuk dioptimalkan, jika ditemukan maka update SVM untuk merefleksikan nilai optimal yang baru (Platt, 1998). Permasalahan QP diselesaikan dengan memenuhi kondisi KKT (Karush Kuhn Tucker). Berikut kondisi yang mana QP dapat diselesaikan untuk semua i :

� = <=> ... (2.44)

< � < <=> = ... (2.45)

� = <=> ... (2.46) Permasalahan QP dapat dilihat seperti pada gambar berikut :


(32)

20

pada gambar 2.6 terlihat � dan � harus berada dalam batasan � , � , sedangkan ∑�= � menyebabkan � dan � berada dalam garis diagonal, dua batasan tersebut membuat fungsi objective QP menjadi optimum. Hal ini memberikan penjelasan kenapa lagrange multipliers dapat dioptimalkan (Platt, 1998). Pertama akan dihitung � jika ≠ maka akan berlaku aturan berikut (Platt, 1998):

= �ax , � − � ... (2.47)

= �i� , + � − � ... (2.48) Jika sama maka berlaku persamaan berikut :

= �ax , � + � − ... (2.49)

= �i� , � + � ... (2.50) Turunan kedua fungsi objektif sepanjang garis diagonal dapat dinyatakan sebagai berikut (Platt, 1998) :

� = , − , − , ... (2.51) Untuk menghitung � dapat dilakukan sebagai berikut (Platt, 1998):

� = � − � −� ... (2.52) E merupakan error training yang dapat dihitung sebagai berikut :

� = ∑ = � , + − ... (2.53)

Setelah itu dapat dihitung � sebagai berikut :

� = � + � − � , ... (2.54)

Dimana � , didapat dengan persamaan berikut :

� , = {� , �, < � <

, �

... (2.55) Sedangkan untuk bias yang baru bisa didapatkan dengan persamaan berikut :

= − � − � − � , − � − � , ... (2.56)

= − � − � − � , − � − � , ... (2.57)

= {

= , < � <

= , < � <


(33)

21

� ∶

� ∶

� ∶

2.1.6 BDT (Binary Decsision Tree)

Pohon biner merupakan pohon yang terdiri atas sebuah akar yang setiap vertex memiliki maksimal 2 anak, yakni anak sebelah kiri maupun kanan. Berikut aturan mengenai pohon biner :

1. Jika T adalah pohon biner penuh dengan i simpul internal, maka T memiliki i + 1 simpul terminal dan 2i + 1 jumlah simpul.

Berikut adalah contoh binary tree :

Gambar 2. 8 BDT

Pohon biner diatas merupakan pohon yang digunakan untuk menyimpan setiap proses SVM dalam node tree, yang mana pada gambar 2.7 root tree diatas membagi kelas 1,2,3,4,5 menjadi dua kelas yang dimisalkan dengan kelas + dan - sehingga pada setiap node pada tree dapat dilakukan proses pelatihan SVM secara rekursif sampai semua data telah terbagi sesuai kelasnya masing-masing.

2.1.7 Random Subsampling

Metode random subsampling melakukan metode hold-out beberapa kali (misalkan k kali) untuk meningkatkan perkiraan kinerja classifier. Metode hold out merupakan metode yang memecah set data menjadi dua yakni data latih untuk


(34)

22

training dan data uji untuk testing dengan proporsi tertentu. Andaikan menyatakan akurasi model pada iterasi ke-i. Akurasi keseluruhan dapat ditunjukan oleh formula berikut (Prasetyo, 2014):


(1)

Permasalahan ini sulit untuk diselesaikan untuk itu perlu dirubah terlebih dahulu dalam bentuk Lagrange Multipliers (Prasetyo, 2014):

= ∑�= � − ∑ � �, ... (2.39) . merupakan dot-product dua buah data dalam data latih.

Syarat 1: ∑� � =

= ... (2.40) Syarat 2:

� , = , , … , ... (2.41) Keterangan :

� ∶ −

∶ −

∶ −

2.1.4.1.2 SVM Nonlinier

Jika dalam ANN ada perceptron dan MLP, maka dalam SVM terdapat SVM Linier dan SVM Nonlinier (kernel trick). Seperti halnya Perceptron, SVM sebenarnya adalah hyperplane linier yang hanya bekerja pada data yang dapat dipisahkan secara linier. Untuk data yang distribusi kelasnya tidak linear biasanya menggunakan pendekatan kernel pada fitur data awal set data. Kernel dapat didefinisikan sebagai suatu fungsi yang memetakan fitur data dari dimensi awal (rendah) ke fitur baru dengan dimensi yang relatif lebih tinggi (Prasetyo, 2014). Pendekatan ini berbeda dengan metode klasifikasi pada umunya yang justru mengurangi dimensi awal untuk menyederhanakan proses dan memberikan akurasi prediksi yang lebih baik. Berikut gambar permasalahan non-linear :


(2)

Gambar 2. 6 SVM-Nonlinear (krisantus, 2007)

Pemetaan kernel dengan cara menghitung dot product dua buah vector di ruang dimensi baru dengan memakai komponen kedua buah vector tersebut di ruang dimensi asal sebagai berikut (Prasetyo, 2014):

( , ) = . ... (2.42) Dan untuk prediksi pada data uji (z) dengan dimensi fitur yang baru dapat diformulasikan (Prasetyo, 2014) :

= . z + = ∑�= � . K , z + ... (2.43) Keterangan :

� ∶ −

∶ −

∶ ∶

∶ −

N adalah jumlah data yang menjadi support vector, adalah support vector, dan z adalah data uji yang akan dilakukan prediksi.

Berikut beberapa pilihan fungsi kernel (Prasetyo, 2014): Tabel 2. 1 Fungsi Kernel

Nama Kernel Definisi Fungsi


(3)

Polynomial K(x,y)= . +

Gaussian RBF K(x,y)=exp −‖ − ‖

.�

Sigmoid K(x,y)=�a�h � . +

Invers Multiquadric K(x,y)=

√‖ − ‖ + Keterangan :

, ∶ ∶

2.1.5 Sequential Minimal Optimization (SMO)

SMO merupakan algoritma yang diperuntukan untuk mengoptimalkan SVM. SMO membantu dalam menyelesaikan persamaan QP SVM (2.39) dengan batasan (2.40) dan (2.41). Ide SMO pada setiap langkahnya adalah memilih dua lagrange multipliers untuk dioptimalkan, jika ditemukan maka update SVM untuk merefleksikan nilai optimal yang baru (Platt, 1998). Permasalahan QP diselesaikan dengan memenuhi kondisi KKT (Karush Kuhn Tucker). Berikut kondisi yang mana QP dapat diselesaikan untuk semua i :

� = <=> ... (2.44) < � < <=> = ... (2.45) � = <=> ... (2.46) Permasalahan QP dapat dilihat seperti pada gambar berikut :


(4)

pada gambar 2.6 terlihat � dan � harus berada dalam batasan � , � , sedangkan ∑�= � menyebabkan � dan � berada dalam garis diagonal, dua batasan tersebut membuat fungsi objective QP menjadi optimum. Hal ini memberikan penjelasan kenapa lagrange multipliers dapat dioptimalkan (Platt, 1998). Pertama akan dihitung � jika ≠ maka akan berlaku aturan berikut (Platt, 1998):

= �ax , � − � ... (2.47) = �i� , + � − � ... (2.48) Jika sama maka berlaku persamaan berikut :

= �ax , � + � − ... (2.49) = �i� , � + � ... (2.50) Turunan kedua fungsi objektif sepanjang garis diagonal dapat dinyatakan sebagai berikut (Platt, 1998) :

� = , − , − , ... (2.51) Untuk menghitung � dapat dilakukan sebagai berikut (Platt, 1998):

� = � − � −� ... (2.52) E merupakan error training yang dapat dihitung sebagai berikut :

� = ∑ = � , + − ... (2.53) Setelah itu dapat dihitung � sebagai berikut :

� = � + � − � , ... (2.54) Dimana � , didapat dengan persamaan berikut :

� , = {� , �, < � < , �

... (2.55) Sedangkan untuk bias yang baru bisa didapatkan dengan persamaan berikut :

= − � − � − � , − � − � , ... (2.56) = − � − � − � , − � − � , ... (2.57)

= {

= , < � < = , < � <


(5)

� ∶

� ∶

∶ � ∶

2.1.6 BDT (Binary Decsision Tree)

Pohon biner merupakan pohon yang terdiri atas sebuah akar yang setiap vertex memiliki maksimal 2 anak, yakni anak sebelah kiri maupun kanan. Berikut aturan mengenai pohon biner :

1. Jika T adalah pohon biner penuh dengan i simpul internal, maka T memiliki i + 1 simpul terminal dan 2i + 1 jumlah simpul.

Berikut adalah contoh binary tree :

Gambar 2. 8 BDT

Pohon biner diatas merupakan pohon yang digunakan untuk menyimpan setiap proses SVM dalam node tree, yang mana pada gambar 2.7 root tree diatas membagi kelas 1,2,3,4,5 menjadi dua kelas yang dimisalkan dengan kelas + dan - sehingga pada setiap node pada tree dapat dilakukan proses pelatihan SVM secara rekursif sampai semua data telah terbagi sesuai kelasnya masing-masing.

2.1.7 Random Subsampling

Metode random subsampling melakukan metode hold-out beberapa kali (misalkan k kali) untuk meningkatkan perkiraan kinerja classifier. Metode hold out merupakan metode yang memecah set data menjadi dua yakni data latih untuk


(6)

training dan data uji untuk testing dengan proporsi tertentu. Andaikan menyatakan akurasi model pada iterasi ke-i. Akurasi keseluruhan dapat ditunjukan oleh formula berikut (Prasetyo, 2014):