Genetic programming for medicinal plant family identification system

PEMROGRAMAN GENETIKA UNTUK SISTEM
IDENTIFIKASI FAMILI TUMBUHAN OBAT

INDRA LAKSMANA

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2013

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul Pemrograman Genetika
untuk Sistem Identifikasi Famili Tumbuhan Obat adalah benar karya saya dengan
arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada
perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya
yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam
teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, September 2013

Indra Laksmana
NIM G651110121

*

Pelimpahan hak cipta atas karya tulis dari penelitian kerjasama dengan pihak
luar IPB harus didasarkan pada perjanjian kerja sama yang terkait.

RINGKASAN
INDRA LAKSMANA. Pemrograman Genetika untuk Sistem Identifikasi Famili
Tumbuhan Obat. Dibimbing oleh YENI HERDIYENI dan ERVIZAL A.M
ZUHUD.
Indonesia kaya akan keanekaragaman hayati, namun kekayaan ini tidak
dimanfaatkan semaksimalnya oleh masyarakat. Sumber daya alam tumbuhan yang
berkasiat obat hanya 4.4 persen yang dimanfaatkan, karena minimnya
pengetahuan dan kurangnya informasi akan potensi tumbuhan obat. Sulitnya
mendapatkan informasi mengenai deskripsi tumbuhan obat menyebabkan
masyarakat tidak dapat mengenali famili atau spesies tumbuhan obat yang ada di
sekitarnya. Pada umumnya informasi tersebut masih berbentuk dokumen teks
yang sulit didapat. Penelitian ini mencoba memanfaatkan informasi penting yang

ada di dalam dokumen untuk mengidentifikasi famili menggunakan pendekatan
heuristik yaitu Genetic programming.
Ciri-ciri botani dalam dokumen dapat digunakan untuk mengidentifikasi
famili tumbuhan obat, tiap-tiap spesies memiliki ciri dan karakteristik yang
berbeda-beda. Gennetic Programming (GP) dapat menentukan karakteristik atau
penciri khusus dari masing-masing famili yang terstruktur ke dalam bentuk tree.
Penerapan Genetic Programming dalam sistem identifikasi famili tumbuhan obat
bertujuan untuk membantu masyarakat dalam mengidentifikasi famili tumbuhan
obat berdasarkan ciri khusus dari tiap spesies tumbuhan yang ada di sekitarnya.
Metode penelitian terdiri atas beberapa tahapan proses yaitu akuisisi data,
boolenaize, pembagian data latih dan data uji, evaluasi dan analisa. Proses
booleanize dinyatakan dengan bilangan biner 1 dan 0. Data hasil proses
booleanize dibagi dua menjadi data latih dan data uji menggunakan metode 5-fold
cross validation. Proses training menggunakan Genetic Programming untuk
mendapatkan individu terbaik, diawali dengan generate rule atau menciptakan
sejumlah individu, lalu individu yang diciptakan dievaluasi yang disebut evaluasi
fitness. Selanjutnya dilakukan proses operasi genetika yang dimulai dengan proses
turnamen, yang bertujuan menyeleksi individu berdasarkan nilai fitness. Semakin
kecil nilai fitness maka individu tersebut mendapatkan peluang untuk terpilih tiap
generasinya. Operasi crossover atau proses rekombinasi dua individu dan operasi

mutasi atau perubahan satu bagian dari individu, kedua operasi ini bertujuan
menyempurnakan individu.
Individu terbaik merupakan solusi yang dicari yaitu berbentuk aturan (rule)
klasifikasi dalam mengidentifikasi tumbuhan obat. Aturan klasifikasi terbaik
dengan rata-rata akurasi sebesar 86.47% diperoleh pada parameter populasi
sebanyak 10.000, jumlah node sebanyak 24 node. Node terdiri atas Function set
(AND, OR, NOR) dan terminal set (atribut/penciri). Selain itu, aturan klasifikasi
terbaik diperoleh pada probabilitas crosover sebesar 0.9 dan probabilitas mutasi
sebesar 0.1 serta jumlah generasi sebanyak 10 generasi. Proses training
menghasilkan tiga rule dalam bentuk tree, rule ini menunjukkan struktur ciri yang
membedakan dari masing-masing famili. Ketiga rule ini dapat dimanfaatkan
masyarakat dalam mengidentifikasi tumbuhan obat.
Kata kunci: booleanizing, Genetic Programming, tumbuhan obat

SUMMARY
INDRA LAKSMANA. Genetic Programming for Medicinal Plant Family
Identification System. Supervised by YENI HERDIYENI and ERVIZAL A.M
ZUHUD.
Indonesia is rich of biodiversity, but this richness is not fully utilized by the
public. Due to lack of knowledge and information about medicinal plant, there are

only 4.4 percent of the natural resources medicinal plants that been utilized.
Difficulties in obtaining information about medicinal plants description caused
people could not recognize the family or species of the medicinal plant in their
environment. Generally, that information exists as text document form which is
hard to be accessed. This study tries utilized critical information inside the
document to identify the families of plant using heuristical approach, genetic
programming.
The botanical characteristic inside a document can be used to identify
medicinal plant’s family, as every species has different characteristic and
attributes. The Genetic Programming (GP) is able to determine the charasteristic
or special feature of each family that is structurized into a tree form. The
application of Genetic Programming in medicinal plant’s family identification
system was aimed to assist the people in identifying medicinal plant’s family
based on special appearance of each plant species on their environment.
This research method consist of several phase of process, i.e. data
acquisition, data booleanize, data partition into training and testing data,
evaluation, and analysis. The booleanize process stated by binary numbers 1 and 0.
The data as the result of booleanize process was divided into two, which are the
training and testing data using 5-fold cross validation method. The training
process used Genetic Programming to get the best individual, started by a

generate rule or creating a number of individuals, and then those individuals was
evaluated by an evaluation process called fitness evaluation. After that, genetical
operation process was implemented, started by turnament process, which had an
objective to select individual based on fitness value. The smaller fitness value gets
the higher chances to be chosen on each generation. The crossover operation of
recombining process at two individuals and development mutation operation from
part of the individual was aimed to fleshing out the individual.
The best individual is merely the expected solution, in the form of
classification rule in identifying medicinal plants. The best classification rule with
an average accuracy of 86.47% was obtained by population parameter of 10 000,
and nodes of 24. Nodes consisted of function set (AND, OR, NOR) and terminal
set (attribute/ special mark). In addition, the best classification rules also obtained
by setting the crossover probability of 0.9, mutation probability of 0.1 and
generation set to 10. The process of the training produced three rules in form of
tree, which showed feature structure that differentiate each family. Those could be
useful to identify the medicinal plants by public.
Key words: booleanize, Genetic Programming, medicinal plants

© Hak Cipta Milik IPB, Tahun 2013
Hak Cipta Dilindungi Undang-Undang

Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan
IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apa pun tanpa izin IPB

PEMROGRAMAN GENETIKA UNTUK SISTEM
IDENTIFIKASI FAMILI TUMBUHAN

INDRA LAKSMANA

Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Komputer
pada
Program Studi Ilmu Komputer

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR
BOGOR
2013

Penguji Luar Komisi pada Ujian Tesis: Dr Wisnu Ananta Kusuma, ST MT

Judul Tesis : Pemrograman Genetika untuk Sistem Identifikasi Famili Tumbuhan
Obat
: Indra Laksmana
Nama
: G651110121
NIM

Disetujui oleh
Komisi Pembimbing

eni Herdiyeni, SSi MKom
Ketua

Prof Dr If Ervizal A.M Zuhud, MS

Anggota

Diketahui oleh

Ketua Program Studi
Ilmu Komputer

Tanggal Ujian: 16 September 2013

Tanggal Lulus:

3 0 SEP 2013

Judul Tesis : Pemrograman Genetika untuk Sistem Identifikasi Famili Tumbuhan
Obat
Nama
: Indra Laksmana
NIM
: G651110121


Disetujui oleh
Komisi Pembimbing

Dr Yeni Herdiyeni, SSi MKom
Ketua

Prof Dr Ir Ervizal A.M Zuhud MS
Anggota

Diketahui oleh

Ketua Program Studi
Ilmu Komputer

Dekan Sekolah Pascasarjana

Dr Yani Nurhadriyani, SSi MT

Dr Ir Dahrul Syah, MScAgr


Tanggal Ujian: 16 September 2013

Tanggal Lulus:

PRAKATA
Alhamdulillahi rabbil’alamin, puji dan syukur penulis panjatkan kehadirat
Allah SWT, karena hanya dengan pertolongan dan rahmat-Nya maka tesis ini
dapat diselesaikan. Tesis ini disusun dalam rangka memenuhi salah satu syarat
dalam menyelesaikan studi Magister pada Program Studi Ilmu Komputer Fakultas
MIPA, Institut Pertanian Bogor.
Bantuan berbagai pihak banyak penulis terima selama proses penyelesaian
tesis ini, karena itu pada kesempatan ini penulis menyampaikan rasa hormat dan
ucapan terima kasih yang tulus serta penghargaan yang setinggi-tingginya kepada:
1. Ibu Dr Yeni Herdiyeni, SSi MKom, selaku ketua komisi pembimbing, Bapak
Prof Dr Ir Ervizal A.M Zuhud, MS selaku anggota komisi pembimbing yang
telah meluangkan waktu, pikiran serta keiklasan dalam membimbing dan
memberikan arahan, masukan serta dorongan dalam penyelesaian tesis ini.
2. Bapak Dr Ir Agus Buono MSi MKom selaku ketua departemen Ilmu
Komputer serta Ibu Dr Yani Nurhadriyani, SSi MT dan Bapak Toto
Haryanto, MKom selaku ketua dan sekretaris Program Studi Ilmu Komputer,

Sekolah Pascasarjana IPB yang telah membantu selama penulisan menempuh
pendidikan di Program Studi Ilmu Komputer.
3. Direktorat Jendral Pendidikan Tinggi Depdikbud RI atas bantuan berupa
beasiswa pendidikan BPPS.
4. Direktur Politeknik Negeri Pertanian Payakumbuh atas ijin dan kesempatan
yang diberikan kepada penulis untuk melanjutkan jenjang pendidikan S2.
5. Teman-teman Tim CI, lima sekawan dan seluruh rekan kuliah di Program
Studi Ilmu Komputer atas dukungan, kebersamaan dan semangat saling
menguatkan untuk menyelesaikan pendidikan ini dengan sebaik-baiknya.
6. Ayahhanda H Iskandar Anwar dan ibunda Hj Masnidar, ayah mertua H
Syamsu dan ibunda mertua Hj Yusniar, Istri tercinta Rosda Syelly, MKom,
ananda Vella Syifa Laksmana dan Farrel Alfaro Laksmana dan segenap sanak
saudara atas do’a, dukungan dan motivasi yang diberikan selama ini.
7. Semua pihak yang telah membantu dan memberikan masukan dalam
penelitian hingga tersusun tesis ini.
Semoga hasil penelitian ini dapat bermanfaat bagi pembangunan ilmu
pengetahuan serta bagi masyarakat luas.

Bogor, September 2013
Indra Laksmana

i

DAFTAR ISI
DAFTAR TABEL

ii

DAFTAR GAMBAR

iii

DAFTAR LAMPIRAN

iii

1 PENDAHULUAN
Latar Belakang
Tujuan Penelitian
Manfaat Penelitian
Ruang Lingkup Penelitian

1
2
2
2

2 TINJAUAN PUSTAKA
Taksonomi
Teknik Identifikasi
Morfologi Tumbuhan
Tumbuhan Obat
Klasifikasi
Heuristik
Genetic Programming
Inisialisasi Populasi
K-Fold Cross-Validation
Confusion Matrix

3
3
4
10
10
10
11
12
14
14

3 METODE PENELITIAN
Akuisisi Data
Proses Booleanize
Pembagian Data
Proses Genetic Programming
Evaluasi
Spesifikasi Perangkat Keras dan Perangkat Lunak

16
17
17
18
20
20

4 HASIL DAN PEMBAHASAN
Booleanize
Hasil Aturan Klasifikasi
Evaluasi

21
25
29

5 SIMPULAN DAN SARAN
Simpulan
Saran

33
33

DAFTAR PUSTAKA

34

LAMPIRAN

36

RIWAYAT HIDUP

40

ii

DAFTAR TABEL
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38

Kategori dan golongan tumbuhan
Confusion matrix
Skenario pembagian data
Pembagian data tiap famili
Booleanize habitus
Booleanize bulu atau rambut
Booleanize tata letak daun
Booleanize komposisi daun
Booleanize bentuk ujung daun
Booleanize bentuk tepi daun
Booleanize bentuk daun
Booleanize pertulangan daun
Booleanize daun penumpu
Booleanize percabangan batang
Booleanize bentuk percabangan
Booleanize kulit dalam batang
Booleanize jejak daun
Booleanize rongga dalam batang
Booleanize kelengkapan bunga
Booleanize tata bunga
Booleanize komposisi bunga
Booleanize bentuk bunga
Booleanize komposisi buah
Booleanize substrat tumbuhan
Booleanize sifat hidup tumbuhan
Booleanize cara hidup tumbuhan
Booleanize bantuk akar tumbuhan
Booleanize akar berumbi
Booleanize aromatic
Nilai parameter yang digunakan
Aturan famili Lamiaceae
Aturan famili Apiaceae
Aturan famili Euphorbiaceae
Confussion matrix fold 1
Confussion matrix fold 2
Confussion matrix fold 3
Confussion matrix fold 4
Coufussion matrix fold 5

3
15
18
18
21
21
21
22
22
22
22
22
22
23
23
23
23
23
23
23
23
24
24
24
24
24
24
25
25
25
26
27
28
29
30
30
31
31

iii

DAFTAR GAMBAR
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

Daun lengkap dan daun tidak lengkap
Bentuk daun penumpu
Daun tunggal
Daun majemuk
Bentuk ujung daun
Bentuk pangkal daun
Bentuk susunan tulang daun
Bentuk tepi daun
Bentuk-bentuk daun dengan bagian terlebar di tengah
Bentuk daun dengan bagian terlebar di bawah tengah daun
Bentuk daun dengan bagian yang terlebar di atas tengah daun
Bentuk yang dari pangkal ke ujung sama lebarnya
Flowchart Genetic Programming
Contoh struktur pohon Genetic Programming
K-fold cross-validation
Metode penelitian
Contoh model atau aturan identifikasi
Contoh operasi crossover
Contoh operasi mutasi

4
5
5
5
6
6
7
7
7
8
8
8
12
12
14
16
18
19
19

DAFTAR LAMPIRAN
1 Hasil Booleanize seluruh data
2 Akurasi Pengujian

36
39

1 PENDAHULUAN
Latar Belakang
Indonesia sebagai negara tropis kaya akan keanekaragaman hayati, memiliki
lebih dari 38.000 spesies tanaman (Bappenas 2003). Groombridge dan Jenkins
(2002) mencatat sebanyak 22.500 spesies tumbuhan obat tersebar di Indonesia,
hanya 4.4 persen dari sumber daya tumbuhan obat tersedia yang dimanfaatkan.
Salah satu penyebabnya adalah kurangnya informasi dan minimnya pengetahuan
masyarakat akan potensi tumbuhan obat yang ada di sekitarnya. Masyarakat telah
mencoba untuk mengklasifikasikan tumbuhan obat dengan cara manual, seperti
menggunakan herbarium yang dibantu dengan informasi teks melalui dokumen,
paper dan literatur tertulis lainnya. Informasi di dalam teks dokumen banyak
misalnya informasi botani, ekologi, distribusi, budidaya, manfaat, kandungan
kimia dan masih banyak informasi lainnya yang akan menyulitkan
pengklasifikasian secara manual. Proses ini membutuhkan waktu yang lama dan
pemahaman khusus, faktor inilah yang menyulitkan masyarakat dalam
pengidentifikasian tumbuhan obat, salah satunya indentifikasi famili. Oleh sebab
itu dibutuhkan suatu aturan, struktur atau sistem untuk mempermudah dan
mempercepat dalam mengidentifikasi famili tumbuhan obat yaitu dengan
melakukan pendekatan heuristik.
Metode heuristik telah banyak diterapkan oleh peneliti sebelumnya dalam
berbagai hal. Stadler (2001) menerapkan metode heuristik untuk membuat basis
data lebih terstruktur dan menjadikannya dalam bentuk tree atau graf. Setiap node
merepresentasikan dokumen, satu node dengan node yang lain dihubungkan
dengan edge yang diberi label dengan nilai kemiripan antar dokumen. Yuningsih
(2009) telah menerapkan metode heuristik dengan Genetic Algorithm (GA) dalam
proses pencarian citra yang terbukti 8.89 kali lebih cepat dari pada sistem tanpa
implementasi heuristik.
Genetic Programming (GP) adalah pengembangan dari GA yang
merupakan algoritme pencarian heuristik, didasari atas mekanisme evolusi
biologis. Walker (2001) menjelaskan bahwa GP merupakan pemrograman
berakurasi tinggi, menjadikan komputer cerdas dapat menyelesaikan masalah
secara otomatis. Yuan et al. (2007) telah membandingkan metode GP dengan
beberapa metode lain (Rank Boost, BM25, Rank-SVM) dan menyarankan
penggunaan metode GP untuk menangani masalah Information Retrieval (IR). GP
secara otomatis memberikan fungsi ranking yang mendefinisikan tingkat relevansi
terhadap query, agar informasi yang diberikan sesuai dengan kebutuhan pengguna.
Penelitian ini mencoba mengambil informasi penting yang ada di dalam
dokumen teks dan menerapkan GP untuk mengidentifikasi famili tumbuhan obat.
Pendekatan heuristik dengan Genetic Programming diharapkan mampu
membentuk suatu aturan atau hirarki dalam mengidentifikasi famili tumbuhan
obat, agar proses identifikasi lebih cepat, mudah dan terstruktur.

2

Tujuan Penelitian
Menerapkan Genetic Programming (GP) untuk menentukan aturan terbaik
dalam mengidentifikasi famili tumbuhan obat berdasarkan bentuk karakteristiknya,
serta menganalisis kinerja metode tersebut dengan pengujian tingkat akurasi dari
aturan yang didapat.
Manfaat Penelitian
Sistem identifikasi famili tumbuhan obat ini diharapkan dapat membantu
masyarakat dengan mudah mengenali famili tumbuhan obat yang berada
disekitarnya dan mengetahui ciri khusus dari tiap-tiap familinya.
Ruang Lingkup Penelitian
Penelitian ini menggunakan tiga famili tumbuhan obat yaitu famili
Lamiaceae, Apiaceae dan Euphorbiaceae. Tiga famili ini menggunakan 63 atribut
yang terdiri atas 8 aspek fisik atau penciri tumbuhan yaitu habitus, daun, batang,
bunga, buah, akar, aromatik dan habitat. Semua atribut dijadikan sebagai terminal
set. Metode heuristik yang diterapkan adalah Genetic Programming menggunakan
fungsi booleanize.

2 TINJAUAN PUSTAKA
Taksonomi
Lahirnya ilmu taksonomi dikarenakan jumlah makhluk hidup yang begitu
banyak. Unsur utama menjadi lingkup taksonomi tumbuhan adalah pengenalan
(identifikasi) yang didalamnya tercakup pemberian nama dan penggolongan atau
klasifikasi. Taksonomi berasal dari kata yunani, taxis berarti penyusunan atau
penataan atau taxon berarti setiap unit yang digunakan dalam klasifikasi obyek
biologi dan nomos berarti hukum atau aturan. Kata taksonomi ini dikemukakan
pertama kali oleh Decandolle pada tahun 1813, ahli taksonomi berkebangsaan
Prancis. Kode Internasional Tatanama Tumbuhan (KTT) menyatakan bahwa
setiap tumbuhan (individu) tergolong dalam 7 tingkatan takson berurutan dari
bawah ke atas dengan istilah: jenis (species), marga (genus), suku (familia),
bangsa (ordo), kelas (classis), devisi (devisio) dan dunia (regnum) (Tjitrosoepomo
1993). Tujuh kategori dan golongan tumbuhan seperti ditunjukkan pada Tabel 1.
Tabel 1 Kategori dan golongan tumbuhan
Kategori
Kingdom
Divisio
Classis
Ordo
Familia
Genus
Species

Golongan
Kerajaan
Devisi
Kelas
Ordo
Famili
Genus
Spesies

Taksonomi atau sistematika tumbuh-tumbuhan adalah ilmu tentang
klasifikasi (penggolongan), nomenklatur (tata nama) dan identifikasi (pengenalan)
tumbuh-tumbuhan. Taksonomi tumbuhan merupakan ilmu dasar bagi dendrologi.
Dendrologi adalah ilmu yang mempelajari sifat-sifat dan taksonomi, penyebaran,
ekologi serta kegunaan (Fahutan 2004).
Teknik Identifikasi
Dua macam identifikasi tumbuhan, yaitu identifikasi tumbuhan yang belum
dikenal oleh dunia ilmu pengetahuan dan identifikasi tumbuhan telah dikenal oleh
dunia ilmu pengetahuan. Secara umum dikenal empat cara yang bisa ditempuh
dalam kegiatan identifikasi tumbuhan yaitu: (1) menanyakan identitas tumbuhan
yang tidak dikenal, langsung kepada ahli. (2) mencocokkan dengan specimen atau
herbarium yang telah diidentifikasi. (3) mencocokkan dengan candra dan gambar
dalam buku-buku flora atau monografi. (4) menggunakan kunci identifikasi atau
kunci determinasi (Fahutan 2004 ).

4

Morfologi Tumbuhan
Morfologi tumbuhan merupakan cabang ilmu tumbuhan yang telah berdiri
sendiri. Morfologi tumbuhan mempelajari bentuk dan susunan tubuh tumbuhan
baik bagian-bagian, bentuk maupun fungsinya. Morfologi tumbuhan dipisahkan
menjadi morfologi luar (morfologi saja) dan morfologi dalam (anatomi tumbuhan).
Secara klasik tumbuhan terdiri atas tiga organ dasar yaitu akar (radix), batang
(caulis) dan daun (folium). Organ-organ lain dapat digolongkan sebagai organ
sekunder karena terbentuk dari modifikasi organ dasar seperti bunga, buah, biji
dan umbi (Tjitrosoepomo 2009)
Daun (folium)
Daun lengkap mempunyai bagian-bagian seperti upih daun atau pelepah
daun (vagina), tangkai daun (petiolus) dan helaian daun (lamina). Sedangkan
daun yang tidak lengkap memiliki beberapa kemungkinan: (1) daun hanya terdiri
atas tangkai dan helaian saja; (2) daun terdiri atas upih dan helaian saja; (3) daun
hanya terdiri atas helaian saja, tanpa upih dan tangkai sehingga daun melekat dan
duduk pada batang; (4) daun hanya terdiri atas tangkai saja yang merupakan suatu
helaian daun semu atau palsu. Seperti ditunjukkan pada Gambar 1 daun lengkap
dan daun tidak lengkap.

Gambar 1 Daun lengkap dan daun tidak lengkap
(Sumber Tjitrosoepomo 2009)
Selain bagian-bagian tersebut di atas dan kemungkinan lengkap atau
tidaknya bagian-bagian daun, daun pada suatu tumbuhan seringkali punya alatalat tambahan atau pelengkap berupa:
1. Daun penumpu (stipula)
Daun penumpu umumnya terletak berlekatan dengan tangkai daun di
pangkal daun (adnatae stipulae), ketiak daun (intrapetiolaris stipula) dan di
antara dua tangkai daun (stipula interpetiolaris). Daun penumpu berguna untuk
melindungi kuncup yang masih kecil. Bentuk daun penumpu seperti ditunjukkan
pada Gambar 2.

5

Gambar 2 Bentuk daun penumpu
(Sumber staf laboratorium ekologi hutan IPB 2004)
2. Tata letak daun (phyllotaxy)
Tata letak daun adalah bagaimana daun tersusun pada rantingnya, ada tiga
bentuk tata letak daun terdiri atas: (Fahutan 2004)
- Opposite (berhadapan, bersilang); daun berpasangan pada ketinggian
yang sama, satu pada masing-masing sisi ranting
- Alternate (berseling, spiral); hanya satu helai daun melekat pada setiap
buku dan nampak daun-daun itu ditata dalam spiral mengitari ranting.
- Verticillate, whorled (berkarang, melingkar); lebih dari satu daun pada
buku yang sama
3. Komposisi daun
Satu daun adalah daun yang terdiri atas tangkai dan helaiannya, berdasarkan
hal tersebut komposisi daun ada dua jenis yaitu daun tunggal dan daun majemuk
(Fahutan 2004)
a. Daun tunggal (single leaf), daun dengan satu helai daun seperti ditunjukkan
pada Gambar 3

Gambar 3 Daun tunggal
(Sumber staf laboratorium ekologi hutan IPB 2004)
b. Daun majemuk, terdiri atas dua atau lebih helai daun yang melekat pada
tangkai persekutuan, seperti ditunjukkan pada Gambar 4

Gambar 4 Daun majemuk
(Sumber staf laboratorium ekologi hutan IPB 2004)

6

4. Helaian daun (lamina)
Tumbuhan yang banyak jenis ragamnya mempunyai daun dan helaian
berbeda-beda pula, baik mengenai bentuk, ukuran, maupun warnanya. Tidak
mudah untuk menemukan dua jenis tumbuhan yang helaian daunnya persis sama
bentuk dan warnanya. Banyak yang mencoba membandingkan bentuk helaian
daun untuk memperoleh kepastian mengenai jenis tumbuhan (Tjitrosoepomo
2009). Sifat-sifat daun yang perlu mendapat perhatian di antaranya adalah ujung
daun (apex folii) seperti ditunjukkan pada Gambar 5, pangkal daun (basis) seperti
ditunjukkan pada Gambar 6, susunan tulang daunnya (nervatio atau venatio)
seperti ditunjukkan pada Gambar 7 dan tepi daunnya (margo) seperti ditunjukkan
pada Gambar 8.

a. runcing

b. meruncing

e. romping

d. membulat

c.tumpul

f. terbelah

g. berduri

Gambar 5 Bentuk ujung daun

a. runcing

b. meruncing

e. romping/rata

d. membulat

c. tumpul

f. berlekuk

Gambar 6 Bentuk pangkal daun

7

b. menjari

a. menyirip

c. melengkung

d. sejajar

Gambar 7 Bentuk susunan tulang daun

a. rata

b.bergerigi

d. bergiri

e. beringgit

f. berombak

c bergerigi ganda

Gambar 8 Bentuk tepi daun
5. Bentuk daun (circumscriptio)
Bentuk daun berdasarkan letak bagian daun yang terlebar digolongkan
menjadi empat:
a. Bagian yang terlebar terdapat di tengah-tengah helaian daun, seperti bulat dan
bundar (orbicularis), seperti perisai (peltatus), jorong (ovalis ellipticus), bulat
memanjang (oblongus), lanset (lanceolatus), yang bentuknya seperti
ditunjukkan pada Gambar 9.

a. orbicularis

b. peltatus

c. ovalis
d. oblongus e. lanceolatus
ellipticus

Gambar 9 Bentuk-bentuk daun dengan bagian terlebar di tengah
b. Bagian yang terlebar terdapat di bawah pertengahan helaian daun, seperti bulat
telur (ovatus), segitiga sama kaki (triangularis), segitiga sama sisi (deltoideus),

8

belah ketupat (rhomboideus), yang bentuknya seperti ditunjukkan pada
Gambar 10.

b. triangularis

a. ovatus

c. deltoideus

d. rhomboideus

Gambar 10 Bentuk daun dengan bagian terlebar di bawah tengah daun
c. Bagian yang terlebar terdapat di atas tengah helaian daun, seperti bulat telur
sungsang (obovatus), jantung sungsang (obcordatus), segitiga terbalik
(cuneatus), sudip atau spatel atau solet (spathulatus), yang bentuknya seperti
ditunjukkan pada Gambar 11.

a. obovatus

b. obcordatus

c. cuneatus

d. spathulutus

Gambar 11 Bentuk daun dengan bagian yang terlebar di atas tengah daun
d. Tidak ada bagian yang terlebar atau dari pangkal sampai ujung sama lebar,
seperti garis (liniaris), pita (ligulatus), pedang (ensiformis), paku atau dabus
(subulatus), jarum (acerosus), bentuknya seperti ditunjukkan pada Gambar 12.

a. liniaris

b. ligulatus

c. ensiformis

d. subulatus

e. acerosus

Gambar 12 Bentuk yang dari pangkal ke ujung sama lebarnya

9

Batang (caulis)
Batang umumnya mempunyai sifat-sifat berikut:
1. Umumnya berbentuk panjang bulat seperti silinder atau dapat pula
mempunyai bentuk lain, akan tetapi selalu bersifat aktinomorf.
2. Terdiri atas ruas-ruas yang masing-masing dibatasi oleh buku-buku dan pada
buku-buku ini terdapat daun.
3. Tumbuhnya biasanya keatas menuju cahaya matahari.
4. Selalu bertambah panjang di ujungnya, oleh sebab itu sering dikatakan bahwa
batang mempunyai pertumbuhan yang tidak terbatas.
5. Membentuk percabangan, selama hidup tumbuhan tidak digugurkan, kecuali
kadang-kadang cabang atau ranting yang kecil.
6. Umumnya tidak berwarna hijau, kecuali tumbuhan yang umurnya pendek.
Batang suatu tumbuhan ada bercabang dan ada yang tidak, cara percabangan
ada bermacam-macam, biasanya dibedakan tiga macam percabangan yaitu:
1. Monopodial yaitu jika batang pokok selalu tampak jelas, karena lebih besar
dan lebih panjang (lebih cepat pertumbuhannya) dari pada cabang-cabangnya.
2. Simpodial yaitu jika batang pokok sukar ditemukan, karena dalam
perkembangannya menghentikan pertumbuhannya atau kalah besar atau kalah
cepat pertumbuhannya dibandingkan dengan cabang-cabangnya.
3. Mengarpu atau dikotom yaitu cara percabangan setiap kali menjadi dua
cabang yang sama besar.
Bunga (flos)
Pada suatu tumbuhan ada kalanya hanya terdapat satu bunga saja atau
berbunga tunggal atau terpisah-pisah (flores sparsi), tetapi pada umumnya pada
suatu tumbuhan dapat ditemukan banyak bunga atau bunga berkumpul
membentuk suatu rangkaian dengan susunan yang beraneka ragam, satu rangkaian
bunga itu disebut dengan bunga majemuk. Bunga majemuk dibedakan dalam tiga
golongan
1. Bunga majemuk tak berbatas (inflorescentia racemosa, inflorescentia
botryoides atau inflorescentia centripetala) yaitu bunga mejemuk yang ibu
tangkainya dapat tumbuh terus dan mempunyai susunan acropetal (semakin
muda semakin dekat dengan ibu tangkai). Bunga ini akan mekar berturutturut dari bawah ke atas dan terakhir mekar adalah bunga yang menutupi ibu
tangkainya.
2. Bunga majemuk berbatas (inflorescentia cymosa atau inflorescentia
centrifuga, inflorescentia definita) yaitu bunga majemuk yang ibu tangkainya
selalu tertutup dengan satu bunga, sehingga ibu tangkai mempunyai
pertumbuhan terbatas. Bunga yang terdapat di sumbu pokok atau ibu tangkai
mekar terlebih dahulu, sehinga pemekaran bunga dari tengah ke pinggir.
3. Bunga majemuk campuran (inflorescentia mixta) yaitu bunga majemuk yang
memperlihatkan baik sifat bunga majemuk tak berbatas maupun sifat bunga
majemuk berbatas.

10

Tumbuhan Obat
Tumbuhan obat merupakan spesies tumbuhan mempunyai khasiat obat,
tergolong dalam 3 kelompok, yaitu: (1) tumbuhan obat tradisional merupakan
spesies tumbuhan yang telah dipercayai oleh masyarakat mempunyai khasiat obat
dan telah digunakan sebagai bahan baku obat tradisional, (2) tumbuhan obat
modern merupakan spesies tumbuhan secara ilmiah telah dibuktikan mengandung
senyawa bioaktif berkhasiat obat dan penggunaannya dapat dipertanggungjawabkan secara medis dan (3) tumbuhan obat potensial merupakan spesies
tumbuhan mengadung senyawa atau bahan bioaktif berkhasiat obat, tetapi belum
dibuktikan secara medis atau penggunaannya sebagai bahan obat tradisional sulit
ditelusuri (Zuhud et al. 1994).
Menurut Winarto (2007), definisi umum tumbuhan obat dapat diterima
semua pihak adalah tumbuhan berkhasiat sebagai obat dan digunakan sebagai obat.
Berkhasiat obat berarti mengandung zat aktif yang berfungsi mengobati penyakit
tertentu.
Tumbuhan obat terdiri atas beberapa macam habitus. Habitus berbagai
spesies tumbuhan menurut Tjitrosoepomo (1988) adalah sebagai berikut:
1. Pohon merupakan tumbuhan berkayu yang tinggi besar, memiliki satu batang
yang jelas dan bercabang jauh dari permukaan tanah.
2. Perdu merupakan tumbuhan berkayu yang tidak terlalu besar dan bercabang
dekat dengan permukaan tanah atau di dalam tanah.
3. Semak merupakan tumbuhan berkayu yang mengelompok dengan anggota
yang sangat banyak membentuk rumpun, tumbuh pada permukaan tanah dan
tingginya dapat mencapai 1 m.
4. Herba merupakan tumbuhan tidak berkayu dengan batang lunak dan berair.
5. Liana merupakan tumbuhan berkayu, yang batangnya menjalar/memanjat
pada tumbuhan lain.
6. Epifit merupakan tumbuhan yang menumpang pada tumbuhan lain sebagai
tempat hidupnya.
Klasifikasi
Klasifikasi merupakan proses pencarian model atau fungsi yang dapat
menggambarkan dan membedakan kelas data dari suatu objek yang diketahui
label kelasnya. Model dihasilkan dari serangkaian proses analisis pembelajaran
dan pengujian. Data yang telah diketahui kelasnya dalam proses pembelajaran
disebut sebagai data latih yang digunakan untuk membuat suatu model klasifikasi.
Proses pengujian adalah tahap pengujian data dengan model klasifikasi untuk
mengetahui akurasi model klasifikasi tersebut. Jika akurasi cukup besar, maka
model tersebut dapat digunakan untuk mengidentifikasi data yang belum diketahui
kelasnya (Han dan Kamber 2001).
Heuristik
Heuristik berasal dari bahasa Yunani yaitu Heuriskein yang berarti mencari
atau menemukan. Heuristik adalah kriteria, metode atau prinsip-prinsip untuk
mencari beberapa alternatif atau tindakan yang paling efektif dalam mencapai
tujuan tertentu (Pearl 1984). Heuristik membuat sistem pencarian lebih terstruktur

11

dan metode ini dapat menemukan solusi terbaik dari sekian banyak kemungkinan
solusi, tanpa harus menelusuri ke seluruh kemungkinan solusi yang ada.
Genetic Programming
Genetic Programming pertama kali diperkenalkan oleh Jhon R. Koza,
terinspirasi dari pemikiran Jhon Holland yang menciptakan Genetic Algorithm
pada tahun 1975. Algoritme yang dibuat berdasarkan teori evolusi Charles
Darwin. Tahun 1992 Koza menerapkan Algoritme Genetika untuk membuat
sistem atau program komputer yang mampu membuat programnya sendiri
(Automatic Programming). Metode tersebut dinamakan Genetic Programming
(Lukas 2008), Genetic Programming menciptakan hirarki atau struktur aturan ke
dalam bahasa komputer lisp, skema draf sebagai solusinya (Koza 1992).
Genetic Programming adalah pengembangan dari Genetic Algorithm (GA)
yang merupakan algoritme pencarian heuristik. Algoritme ini merupakan
pencarian yang didasari mekanisme sistem natural yakni genetik dan seleksi alam.
Variabel solusi di dalam Genetic Programming dikodekan ke struktur string yang
merepresentasikan barisan gen, merupakan karakteristik dari solusi. Himpunan ini
disebut populasi. Semua individu dalam populasi merupakan representasi dari
solusi. Bagian dari individu disebut sebagai kromosom. Kromosom-kromosom
tersebut berevolusi dalam suatu proses iterasi yang berkelanjutan disebut sebagai
generasi di setiap generasi. Individu dievaluasi berdasarkan suatu fungsi evaluasi
sehingga generasi dalam Genetic Programming akan konvergen pada individu
terbaik, dengan harapan ini merupakan solusi optimal.
Genetic Programming menurut Poli et al. (2008) merupakan suatu evolusi
teknik komputasi secara otomatis untuk menyelesaikan suatu masalah tanpa perlu
diberitahu secara jelas apa yang harus dilakukan dengan menentukan bentuk atau
struktur solusi di awal masalah. Genetic Programming lebih bersifat dinamis
dibandingkan dengan Genetic Algorithm.
Individu pada penelitian ini merupakan representasi model atau hirarki
dokumen berdasarkan famili tumbuhan obat. Populasi merupakan sejumlah aturan
yang dibentuk secara acak. Setiap aturan akan dievaluasi berdasarkan fitness
tertentu. Proses Genetic Programming secara keseluruhan seperti ditunjukkan
pada Gambar 13. Ada tiga langkah utama dalam operasi Genetic Programming:
1. Populasi awal dibuat secara acak dengan setiap individu memiliki ukuran
sama.
2. Langkah ini akan dilakukan sampai nilai fitness tercapai atau jumlah generasi
terpenuhi.
a. Evaluasi fitness setiap individu dalam populasi,
b. Membuat populasi baru untuk generasi selanjutnya sebanyak M individu
hingga jumlah individu terbaik i sama dengan M, berdasarkan fitness
yang dihasilkan lakukan operasi genetika berikut, dengan peluang yang
telah ditentukan.
i. operasi reproduksi (Pr).
ii. operasi mutasi (Pm).
iii. operasi rekombinasi (Pc).
3. Individu terbaik akan dihasilkan atau dicetak.

12

Gen :=0

Inisialisasi Populasi

Kriteria Berhenti
Terpenuhi?

Ya

Mencetak
Hasil

Tidak
Evaluasi Fitnes Individu

Selesai

i :=0
Ya
Gen := Gen+1

i=M?
Tidak

Pr

Membuat Probabilitas
Genetic Operasi

Pm

Pc

Mengambil satu
individu berdasarkan
nilai fitnes

Mengambil dua
individu berdasarkan
nilai fitnes

Mengambil satu
individu berdasarkan
nilai fitnes

i:=i+1
Reproduksi

Crossover

Mutation

Copy Kedalam
Populasi Baru

Masukkan Offspring
Kedalam populasi
baru

Masukkan Mutant
Kedalam populasi
baru

i:=i+1

Gambar 13 Flowchart Genetic Programming
(Koza 1992)
Inisialisasi Populasi
Inisialisasi populasi dilakukan setelah menentukan function set dan terminal
set. Bentuk primitif dari Genetic Programming adalah himpunan fungsi (function
set) dan himpunan argumen (terminal set). Terminal set menyediakan nilai bagi
sistem sedangkan function set memproses nilai yang ada dalam sistem. Function
set dan terminal set tersebut akan membentuk nodes bagian dari struktur pohon
yang menjadi representasinya (Lukas 2008), seperti ditunjukkan pada Gambar 14.

Gambar 14 Contoh struktur pohon Genetic Programming
(Lukas 2008)

13

Terminal set dalam GP merupakan masukan untuk program yang akan
dibentuk, terdiri atas konstanta, variabel dan fungsi yang tidak membutuhkan
argumen (zero-argument function). Function set dalam GP merupakan fungsi
yang mengolah masukan dari terminal set. Function set dapat berupa fungsi yang
umum digunakan dalam struktur pemrograman atau fungsi khusus dibuat sesuai
dengan permasalahan yang ingin diselesaikan. Beberapa contoh dari function set
yang bisa digunakan dalam GP antara lain:
1. Fungsi boolean, sebagai contoh: AND, OR, NOT.
2. Fungsi aritmatika, sebagai contoh: ADD, SUB, MUL, DIV.
3. Fungsi kondisional, sebagai contoh: IF, IF ELSE, SWITCH CASE.
4. Fungsi perulangan, sebagai contoh: WHILE..DO, REPEAT…UNTIL,
FOR…DO.
5. Subroutine, gabungan fungsi-fungsi dasar atau bahkan fungsi yang ditentukan
sendiri sesuai dengan permasalahan yang dihadapi.
Inisialisasi populasi awal akan menjadi dasar pengembangan populasi untuk
generasi berikutnya. Dua metode yang umumnya digunakan untuk
menginisialisasi populasi yaitu metode full dan grow (Luke 2000).
Struktur pohon yang dihasilkan dengan metode inisialisasi grow akan
berbentuk tidak beraturan karena semua bagian node dari struktur pohon program
tersebut dibuat secara acak dari function set dan terminal set. Sementara pada
metode inisialisasi full, pertama hanya memilih function set untuk menempati
bagian node dari struktur pohon sampai mendekati kedalaman maksimal yang
sudah ditentukan. Setelah itu hanya dipilih terminal untuk menempati bagian node
sisanya sehingga setiap cabang dari struktur pohon akan mencapai kedalaman
maksimal. Dengan metode full, setiap struktur pohon dihasilkan akan memiliki
struktur simetris satu sama lain
Fungsi Fitness
Fitness function merupakan suatu fungsi yang digunakan untuk mengukur
nilai optimal suatu individu. Nilai fitness adalah suatu nilai yang menyatakan baik
atau tidak suatu solusi. Nilai fitness ini yang akan dijadikan referensi dalam
mencapai nilai optimal, jika nilai fitness tinggi maka akan bertahan hidup,
sedangkan jika nilai fitness rendah maka akan mati dalam siklus evolusi (Poli et
al. 2008)
Operator Genetika
Operator genetika yang digunakan dalam GP adalah pindah silang, mutasi
dan reproduksi (Carvalho et al. 2012):
a. Proses pindah silang (crossover)
Proses pindah silang pada GP adalah menukarkan sebagian struktur pohon
dari dua buah individu (parent) dengan titik potong yang dipilih secara acak.
Parent dipilih berdasarkan probabilitas dari nilai fitness.
b. Proses mutasi
Proses mutasi pada GP dilakukan dengan memilih secara acak satu bagian
dari struktur pohon suatu individu dan mengganti bagian tersebut dengan fungsi

14

atau argumen yang terdapat pada fungsi set ataupun terminal set yang sudah
ditentukan ataupun bisa juga berupa suatu bagian struktur pohon lainnya.
c. Proses reproduksi
Proses reproduksi pada GP tidak ada yang khusus, suatu individu dipilih
secara acak dan kemudian dibuat salinannya untuk disertakan dalam populasi
berikutnya.
K-Fold Cross-Validation
K-fold Cross-validation digunakan untuk melakukan pelatihan dan
pengujian dengan data yang terbagi ke dalam K bagian sama rata dan dilakukan
sebanyak K iterasi. Jika jumlah data (N) tidak tepat habis dibagi oleh K, maka
bagian akhir akan memiliki data yang lebih daripada bagian K-1 lainnya. Setiap
iterasi, K secara bergantian akan menjadi data uji dan bagian K-1 digunakan
sebagai data latih. Ilustrasi k-fold Cross-validation seperti ditunjukkan pada
Gambar 15 (Bramer 2007).

Gambar 15 K-fold cross-validation
(Bramer 2007)
Confusion Matrix
Confusion matrix merupakan sebuah tabel untuk memprediksi benar dan
salah dokumen terklasifikasi dari model yang didapat. Confusion matrix
digunakan untuk menentukan kinerja suatu model klasifikasi. Tingkat akurasi
hasil prediksi didapat dari jumlah true positive, true negative, false positive, dan
false negative seperti ditunjukkan pada Tabel 2.

15

Tabel 2 Confusion matrix (Davis dan Goadrich 2006)

Predicted
class

Positif
Negatif

Actual class
Positif
Negatif
TP
FP
FN
TN

dengan:
1. TP (True Positive), yaitu jumlah data pada kelas positif terklasifikasi dengan
benar.
2. TN (True Negative), yaitu jumlah data pada kelas negarif, benar terklasifikasi
sebagai kelas negatif.
3. FP (False Positive), yaitu jumlah data pada kelas positif tetapi tidak
terklasifikasi sebagai kelas positif.
4. FN (False Negative), yaitu jumlah data pada kelas negatif tetapi terklasifikasi
sebagai kelas positif.
sehingga:
Akurasi = TP+TN / (TP+FP+FN+TN)

(1)

3 METODE PENELITIAN
Tahapan pada proses penelitian ini terdiri atas akuisisi data, booleanize,
pembagian data (latih dan uji), Genetic Programming, hasil aturan klasifikasi dan
evaluasi, seperti ditunjukkan pada Gambar 16.
Akuisisi
data
Booleanize

Pembagian data

Data uji

Data latih
Genetic Programming

Generate rule

Evaluasi fitness

Apakah stop
condition terpenuhi

Ya

Hasil

Tidak

Operasi genetika
Evaluasi

Gambar 16 Metode penelitian
Akuisisi Data
Data yang digunakan berbentuk dokumen teks berbahasa Indonesia.
Dokumen berisi informasi mengenai jenis tumbuhan obat, dokumen tersebut
dimiliki oleh bagian Konservasi Keanekaragaman Tumbuhan, Departemen
Konservasi Sumber Daya Hutan dan Ekowisata, Fakultas Kehutanan IPB.
Dokumen tersebut berbentuk buku dengan judul “Acuan Umum Tumbuhan Obat
Indonesia” jilid I sampai dengan jilid X yang disusun oleh Fakultas Kehutanan
IPB bekerja sama dengan Fakultas Kehutanan UGM. Data yang diambil terdiri
atas tiga famili tumbuhan obat yaitu famili Lamiaceae sebanyak 26 spesies, Famili
Apiaceae sebanyak 24 spesies dan famili Euphorbiaceae sebanyak 31 spesies.
Famili yang digunakan memiliki kemiripan atau kesamaan yang cukup
dekat yaitu memiliki kesamaan sifat morfologi (tumbuhan berbunga). Selain itu,
berdasarkan jumlah spesies pada dokumen yang dimiliki, tiga famili ini memiliki
banyak spesies. Spesies yang digunakan pada famili Lamiaceae adalah Coleus
amboinicus, Leonurus sibiricus, Hyptis suaveolens, Coleus scutellarioides, Coleus
tuberosus, Leucas lavandulifolia, Rosmarinus officianalis, Salvia coccinea, Salvia

17

splendens, Orthosiphon aristatus, Ajuga reptans, Ocimum basilicum, Hyptis
brevipes, Ocimum sanctum, Pogostemon cabin, Menthe arvensis, Thymus
serpylum, Thymus vulgaris, Mesona palustris, Clerodendrum paniculatum,
Lavandula officinalis, Gomphostemma javanicum, Mentha arvensis, Mentha
pulegium, Pogostemon Heyneanus, Pogostemon hortensis. Spesies famili
Apiaceae adalah Centella asiatica, Apium graveolens, Foeniculum vulgare,
Eryngium foetidum, Hydrocotyle sibthorpioides, Daucus carota, Coriandrum
sativum, Pimpinella alpine, Trachyspermum ammi, Petrosolinum crispum, Carum
roxburghianum, Pimpinella anisum, Carum copticum, Eryngium bromeliaefolium,
eryngium foetidum, cuminum cyminum, Pimpinella saxifrage, Aegopodium
podagraria, Angelica sylvestris, Anthriscus sylvestris, Chaerophyllum temulentum,
Heracleum sphondylium, Meum athamanticum, Torilis japonica. Spesies famili
Euphorbiaceae adalah Acalypha australis, Jatropha podagrica, Jatropha
gossypifolia, Euphorbia pulcherrima, Codiacum variegatum, Excoecaria
cochinchinensis, Euphorbia plumerioides, Acalypha wilkesiana, Antidesma
bunius, Croton tiglium, Bridelia ovate, Glochidion rubrum, Acalypha hispida,
Richinus communis, Baccaurea racemosa, Acalypha indiaca, Euphorbia tiraculli,
Acalypha microphylla, Phyllanthus acidus, Jatropha curcas, Aleurites moluccana,
Euphorbia milli, Pedilanthus tithymaloides, Euphorbia antiquorum, Sauropus
androgynous, Phyllanthus emblica, Manihot utilissima, Phyllanthus reticulatus,
Phyllanthus niruri, Euphorbia prostate, Euphorbia hirta.
Proses Booleanize
Proses booleanize merupakan proses pengkodean atribut. Atribut ini didapat
dari proses pemilihan penciri berdasarkan ciri morfologi dalam dokumen
tumbuhan obat. Berdasarkan 8 aspek fisik seperti habitus, daun, batang, bunga,
buah, akar, aromatik dan habitat, maka terpilih 63 atribut penciri yang akan
dikodekan menjadi X0, X1 sampai dengan X62. Informasi setiap spesies akan
diubah ke nilai biner berupa angka 0 dan 1 berdasarkan atribut penciri yang
digunakan. Angka 0 menunjukkan tidak adanya ciri tersebut pada suatu spesies,
sebaliknya 1 menunjukkan suatu spesies memiliki ciri tersebut di dalam dokumen.
Pembagian Data
Dokumen hasil booleanize dibagi berdasarkan famili menjadi data latih dan
data uji dengan proporsi masing-masing adalah 80% dan 20%. Pembagian data
. Data dipisah
tersebut menggunakan metode k-fold cross validation dengan
menjadi lima bagian. Empat subset data latih digunakan sebagai input pelatihan
dalam pengidentifikasian dan satu subset data uji digunakan untuk menguji model
hasil pelatihan. Skenario pembagian data seperti ditunjukkan pada Tabel 3 dan 4.

18

Tabel 3 Skenario pembagian data
Fold

Data
Data latih
Data uji
Data latih
Data uji
Data latih
Data uji
Data latih
Data uji
Data latih
Data uji

Fold 1
Fold 2
Fold 3
Fold 4
Fold 5

Subset
S1, S 2, S 3, S 4
S5
S 1, S2, S3, S5
S4
S1, S2, S4, S5
S3
S1, S3, S4, S5
S2
S2, S3, S4, S5
S1

Tabel 4 Pembagian data tiap famili
Famili
Lamiaceae
Apiaceae
Euphorbiaceae
Total

S1 S2 S3 S4 S5 Total
5
5
5
5
6
26
5
5
5
5
4
24
6
6
6
6
7
31
16 16 16 16 17
81

Proses Genetic Programming
Bentuk primitif Genetic Programming adalah himpunan fungsi (function
set) yaitu AND, OR, NOR dan himpunan argumen (terminal set) yaitu atribut hasil
booleanize. Proses yang dilakukan adalah sebagai berikut:
a. Generate rule
Tahapan generate rule atau inisialisasi generasi yaitu menciptakan sejumlah
individu. Individu terdiri atas function set dan terminal set yang dibangkitkan
secara acak, dengan ketentuan kedalaman dan jumlah node yang dibatasi. Satu
individu menggambarkan satu bentuk model atau aturan yang akan dicari. Contoh
model atau aturan seperti ditunjukkan Gambar 17.
OR

XOR

OR
X27

AND

X45

X4

X6

XOR

OR
X9

X61

X44

Gambar 17 Contoh model atau aturan identifikasi
b. Evaluasi fitness
Proses evaluasi fitness adalah menghitung jumlah kesalahan individu dalam
memprediksi, yaitu memprediksi dua kelas (kelas benar dan kelas salah). Kelas
dicari bernilai 1 (benar) dan 0 (salah) untuk kelas yang lainnya. Semakin kecil

19

nilai fitness maka semakin sedikit jumlah kesalahan dalam suatu individu atau
semakin baik individu yang terbentuk. Dalam penelitian ini nilai fitness diperoleh
dari pengujian data booleanize ke dalam aturan atau individu yang terbentuk.
c. Operasi genetika
Proses operasi genetika diawali dengan seleksi terhadap aturan
menggunakan metode tournament. Pemenang tournament adalah individu yang
memiliki nilai fitness terkecil, selanjutnya dilakukan operasi elitisme, crossover
dan mutasi. Operasi elitisme yaitu menyalin individu pemenang tournament ke
dalam populasi baru atau generasi baru. Operasi crossover adalah pertukaran
sebagian struktur pohon (gen) dari dua buah individu (parent) dengan titik potong
yang dipilih secara acak. Ilustrasi operasi crossover seperti ditunjukkan pada
Gambar 18. Operasi mutasi memilih secara acak satu bagian dari struktur pohon
(kromosom) dalam satu individu dan mengganti bagian tersebut dengan function
set atau terminal set sesuai pada bagian yang terpilih. Proses mutasi seperti
ditunjukkan pada Gambar 19.
AND

OR

AND

X4

OR

X8

X3

AND

X19

X10

AND

X6

X4

AND

OR

AND

X4

X3

AND

X8

X4

OR

AND

X19

X3

X3

X6

X10

Gambar 18 Contoh operasi crossover
AND

AND

AND

AND

X4

x15
x8

X2

AND

AND

X1

x8

X4

X2

X1

Gambar 19 Contoh operasi mutasi
d. Stop condition
Stop condition dalam proses GP adalah generasi maksimum. Proses terus
berulang ke tahap evaluasi fitness, operasi genetika hingga generasi maksimum
terpenuhi.
Model atau aturan klasifikasi yang dihasilkan dari proses GP adalah
individu dengan jumlah kesalahan terkecil atau individu dengan nilai fitness
terkecil dari generasi terakhir (Stop condition terpenuhi). Satu model atau aturan
hanya digunakan untuk satu kelas.

20

Evaluasi
Evaluasi dilakukan untuk menentukan tingakat kaurasi atau kinerja dari
setiap model klasifikasi yang dihasilkan. Tingkat akurasi didapat dari jumlah
benar hasil prediksi dibandingkan dengan jumlah data uji untuk masing-masing
fold. Satu fold terdiri atas tiga kelas. Proses evaluasi ini menggunakan confusion
matrix.
Spesifikasi Perangkat Keras dan Perangkat Lunak
Alat yang digunakan dalam penelitian ini terdiri dari perangkat keras dan
perangkat lunak dengan spesifikasi sebagai berikut:
a. Software yang digunakan:
Sistem Operas: Sistem Operasi Windows 7 Ultimate 32-bit.
Tools dan pemrograman : Notepad++, C# dan Library Small GP.
b. Hardware yang digunakan:
Processor Intel Pentium Core i3 2,10GHz, DDR3 4.00GB dan HDD 500GB.

4 HASIL DAN PEMBAHASAN
Data yang dimiliki sejumlah 81 spesies. Terdiri atas 26 spesies famili
Lamiaceae, 24 sepesies Apiaceae, 31 sepesies Euphorbiaceae. Spesies masingmasing famili memiliki ciri-ciri yang menggambarkan ciri khusus dari familinya.
Ciri khusus ini akan dijadikan suatu aturan kasifikasi dalam mengidentifikasi
tumbuhan.
Booleanize
Atribut yang terdiri atas 63 penciri yang dikodekan menjadi X0 sampai
dengan X62. Atribut penciri ini diambil berdasarkan morfologi tumbuhan obat
seperti daun, batang, akar, bunga, buah dan kecendrungan hidup tumbuhan seperti
habitat, aroma yang khas, dan habitus. Hasil Booleanize berdasarkan 63 ciri yang
terpilih dari 81 spesies, seperti ditunjukkan pada Lampiran 1.
a. Habitus
Penampakan luar dan sifat tumbuh dari suatu tumbuhan digunakan sebagai
atribut penciri habitus. Penciri habitus seperti pohon, perdu, semak, herba, liana
dan berbulu. Booleanize dari atribut penciri ini seperti ditunjukkan pada Tabel 5
dan 6
Tabel 5 Booleanize habitus
Nama
Herba/ terna
Semak/ Perdu
Liana
Pohon

X0 X1 X2 X3
1
0
0
0
0
1
0
0
0
0
1
0
0
0
0
1

Tabel 6 Booleanize bulu atau rambut
Berbulu/ rambut
Ada
Tidak

X4
1
0

b. Daun
Daun merupakan organ tumbuhan yang mudah dikenali. Aspek daun yang
penting dikaji adalah tata letak daun, komposisi daun, bentuk daun, pertulangan
daun dan daun penumpu. Booleanize untuk daun seperti ditunjukkan pada Tabel 7
sampai dengan 13.
Tabel 7 Booleanize tata letak daun
Tata letak
Berseling
Berhadapan
Melingkar

X5 X6 X7
1
0
0
0
1
0
0
0
1

22

Tabel 8 Booleanize komposisi daun
Komposisi
Tunggal
Majemuk

X8 X9
0
1
1
0

Tabel 9 Booleanize bentuk ujung daun
Ujung daun
Runcing
Meruncing
Membulat
Membelah
Tumpul

X10 X11 X12 X13 X14
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1

Tabel 10 Booleanize bentuk tepi daun
Tepi daun
X15 X16 X17
Rata
1
0
0
Bergerigi
0
1
0
Bergelombang
0
0
1

Tabel 11 Booleanize bentuk daun
Bentuk daun
X18 X19 X20 X21 X22 X23
Bulat/bulat telur
1
0
0
0
0
0
Memanjang
0
1
0
0
0
0
(Lanset/jorong/oblong)
Segitiga
0
0
1
0
0
0
Jarum
0
0
0
1
0
0
Liniaris
0
0
0
0
1
0
Menjari
0
0
0
0
0
1

Tabel 12 Booleanize pertulangan daun
Pertulangan daun
Menyirip
Menjari
Melengkung
Sejajar

X24 X25 X26 X27
1
0
0
0
0
1
0
0
0
0
1
0
0
0
0
1

Tabel 13 Booleanize daun penumpu
Daun penumpu
Ada
Tidak

X28
1
0

c. Batang
Ciri umum batang terletak pada rongga batang, percabangan atau bentuk
percabangan, kulit dalam dan permukaan batang atau ranting. Booleanize batang
seperti ditunjukkan pada Tabel 14 sampai dengan 18.

23

Tabel 14 Booleanize percabangan batang
Percabangan
Monopodial
Simpodial

X29 X30
1
0
0
1

Tabel 15 Booleanize bentuk percabangan
Bentuk percabangan
Plagiotropik
Orthotropik

X31
1
0

X32
0
1

Tabel 16 Booleanize kulit dalam batang
Kuit dalam
Getah putih
Getah kuning
Getah merah
Getah hitam

X33 X34 X35 X36
1
0
0
0
0
1
0
0
0
0
1
0
0
0
0
1

Tabel 17 Booleanize jejak daun
Jej