Klasifikasi Formula Jamu Berdasarkan Khasiat Menggunakan Oblique Decision Tree dengan Optimasi Menggunakan Algoritme Genetika

KLASIFIKASI FORMULA JAMU BERDASARKAN KHASIAT
MENGGUNAKAN OBLIQUE DECISION TREE DENGAN
OPTIMASI MENGGUNAKAN ALGORITME GENETIKA

DELLY FAHLEVI MEIDIKA

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Klasifikasi Formula
Jamu Berdasarkan Khasiat Menggunakan Oblique Decision Tree Dioptimasi
Algoritme Genetika adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi
mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Juli 2014
Delly Fahlevi Meidika
NIM G64100041

ABSTRAK
DELLY FAHLEVI MEIDIKA. Klasifikasi Formula Jamu Berdasarkan Khasiat
Menggunakan Oblique Decision Tree dengan Optimasi Menggunakan Algoritme
Genetika. Dibimbing oleh WISNU ANANTA KUSUMA dan RUDI HERYANTO.
Indonesia kaya akan keragaman hayati termasuk berbagai macam tanaman
obat yang dapat digunakan sebagai jamu. Penggunaan tanaman sebagai bahan
pengobatan atau jamu masih terbatas. Hal ini disebabkan masih sulitnya akses
terhadap informasi tanaman obat yang umumnya didapat dari buku/dokumen teks
dan pengetahuan yang didapat secara turun temurun. Salah satu informasi penting
yang dibutuhkan adalah khasiat yang dimiliki oleh jamu berdasarkan tanaman obat
yang menyusunnya. Penelitian ini bertujuan melakukan klasifikasi khasiat jamu
berdasarkan komposisi tanaman menggunakan oblique decision tree dengan
optimasi menggunakan Algoritme Genetika. Hasil dari metode ini berupa sebuah
pohon keputusan yang merepresentasikan penciri jenis tanaman terhadap suatu

khasiat. Pendekatan menggunakan data 231 tanaman mampu memberikan akurasi
sebesar 94.47%.
Kata kunci: algoritme genetika, jamu, khasiat, klasifikasi, oblique decision tree

ABSTRACT
DELLY FAHLEVI MEIDIKA. Classification of Jamu Formulas Based on Efficacy
Using Oblique Decision Tree Optimized by Genetic Algorithm. Supervised by
WISNU ANANTA KUSUMA and RUDI HERYANTO.
Indonesia is rich in biodiversity, consisting of a wide variety of medicinal
plants. However, the use of plants as a medicinal or herbal medicine is still limited.
It is difficult to find the information of medicinal plants which are generally
obtained from a rare book/text document or inherited knowledge from generation
to generation. One of the most important information is to determine the efficacy
of an herbal formula based on medicinal plants that composing it. This research
aims to develop a classification system based on the composition of medicinal
efficacy of plants using oblique decision tree optimized by Genetic Algorithm. The
result of decision tree determine plant identifier for each efficacy. The proposed
method with data set of 231 plants is able to obtain 94.47% accuracy.
Keywords: classification, efficacy, genetic algorithm, herbal, oblique decision tree


KLASIFIKASI FORMULA JAMU BERDASARKAN KHASIAT
MENGGUNAKAN OBLIQUE DECISION TREE DENGAN
OPTIMASI MENGGUNAKAN ALGORITME GENETIKA

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

Penguji:
Dr Heru Sukoco, MSi MT

Judul Skripsi : Klasifikasi Formula Jamu Berdasarkan Khasiat Menggunakan

Oblique Decision Tree dengan Optimasi Menggunakan Algoritme
Genetika
Nama
: Delly Fahlevi Meidika
NIM
: G64100041

Disetujui oleh

Dr Wisnu Ananta Kusuma, MT
Pembimbing I

Rudi Heryanto, MSi
Pembimbing II

Diketahui oleh

Dr Ir Agus Buono, MSi MKom
Ketua Departemen


Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah yang berjudul “Klasifikasi Formula Jamu
Berdasarkan Khasiat Menggunakan Oblique Decision Tree dengan Optimasi
Menggunakan Algoritme Genetika” ini berhasil diselesaikan. Tema yang dipilih
dalam penelitian ini merupakan pengembangan dari proyek Praktik Kerja Lapangan
(PKL) Departemen Ilmu Komputer yang penulis lakukan di Pusat Studi Biofarmaka
LPPM IPB.
Terima kasih penulis ucapkan kepada Bapak Dr Wisnu Ananta Kusuma, MT
dan Bapak Rudi Haryanto, MSi selaku pembimbing, Bapak Dr Heru Sukoco, SSi
MT selaku penguji, serta seluruh dosen dan staf di Departemen Ilmu Komputer. Di
samping itu, penulis menyampaikan terima kasih kepada teman-teman terdekat
penulis, rekan-rekan Ilkomerz khususnya Pixels 47, teman-teman satu bimbingan
(Alfat, Yuda, Gerry, Huda dan Bang Dan) yang telah saling memberi semangat dan
bantuannya untuk menyelesaikan penelitian. Ungkapan terima kasih yang terutama
penulis sampaikan kepada kedua orang tua penulis, Nanang Kusmana dan Sri
Suprihatin, kakak dan adik penulis serta seluruh keluarga, atas segala doa dan kasih
sayangnya.

Semoga karya ilmiah ini bermanfaat.

Bogor, Juli 2014
Delly Fahlevi Meidika
NIM G64100041

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

PENDAHULUAN


1

Latar Belakang

1

Perumusan Masalah

1

Tujuan Penelitian

2

Manfaat Penelitian

2

Ruang Lingkup Penelitian


2

METODE

2

Data Penelitian

2

Tahapan Penelitian

3

Akuisisi Data

3

Praproses Data


3

Proses Booleanize

5

Pembagian data

5

Oblique Decision Tree – Genetic Algorithm

5

Evaluasi

7

Lingkungan Pengembangan


7

HASIL DAN PEMBAHASAN

7

Hasil
Pembahasan
SIMPULAN DAN SARAN

7
11
13

Simpulan

13

Saran


13

DAFTAR PUSTAKA

13

LAMPIRAN

15

RIWAYAT HIDUP

22

DAFTAR TABEL
1
2
3
4
5
6
7

Data I khasiat formula jamu
Data II khasiat formula jamu
Ilustrasi proses booleanize
Nilai parameter percobaan
Nilai akurasi set data
Confusion matrix Data I
Confusion matrix Data II

4
4
5
7
8
8
9

DAFTAR GAMBAR
1
2
3
4
5
6
7
8

Skema tahapan penelitian
Skema optimasi algoritme genetika
Ilustrasi proses crossover
Grafik akurasi tiap khasiat pada Data I dan Data II
Perbandingan akurasi metode PLS-DA, SVM dan ODT-GA
Tree keluaran hasil proses ODT-GA
Contoh potongan tree setelah divisualkan dalam bentuk asli
Contoh potongan tree hasil pruning

3
6
6
9
10
11
11
12

DAFTAR LAMPIRAN
1
2
3
4
5

Screenshot aplikasi
Pengkodean tanaman
Contoh sebagian data formula jamu
Decision tree hasil ODT-GA
Daftar tanaman yang berpengaruh pada khasiat

15
17
19
20
21

PENDAHULUAN
Latar Belakang
Pengetahuan tentang obat herbal tradisional yang diolah menjadi jamu
menjadi warisan budaya yang telah turun temurun diwariskan antar generasi. Bahan
alami penyusun jamu dapat berupa akar, daun, kayu dan buah-buahan. Menurut
Mahady (2001), penggunaan jamu sebagai pengobatan alternatif mengalami
peningkatan. Orang-orang mulai mempertimbangkan jamu sebagai obat yang aman
dan manjur yang telah terbukti secara empiris selama ratusan tahun.
Upaya sistematis dengan menggunakan pendekatan statistik untuk
menemukan hubungan antara komposisi dan khasiat jamu telah dilakukan oleh
Afendi et al. (2012). Penelitian ini menunjukan bahwa formula jamu dengan
khasiatnya memiliki aktivitas farmakologi tertentu. Dikembangkan pula hipotesis
dalam penelitian ini bahwa suatu formula jamu terdiri atas tanaman utama dengan
khasiat utamanya dan tanaman pendukung dengan sekurangnya harus memiliki
karakteristik analgesik, antimikroba, dan anti-peradangan. Dalam penelitian
tersebut digunakan metode Partial Least Squares Discriminant Analysis (PLS-DA)
untuk mengembangkan model klasifikasi formula jamu.
Dalam penelitian lain yang dilakukan oleh Fitriawan (2013), dikembangkan
sistem klasifikasi formula jamu dengan khasiatnya menggunakan teknik Support
Vector Machine (SVM). SVM adalah salah satu teknik machine learning yang
mampu mengklasifikasikan masalah di dunia nyata dengan hasil akurasi yang tinggi
(Byun dan Lee 2003). Penelitian ini memberikan hasil yang lebih baik
dibandingkan dengan metode PLS-DA pada data yang melalui data cleaning.
Pada penerapan kedua metode diatas dalam melakukan klasifikasi formula
jamu, masih sering terdapat perbedaan dalam hasil klasifikasinya, sehingga
dibutuhkan satu cara klasifikasi formula jamu dengan metode lain untuk
menghasilkan pendekatan sistem yang lebih akurat. Salah satu metode yang dapat
diterapkan adalah Oblique Decision Tree optimized by Genetic Algorithm (ODTGA). Metode ini menghasilkan aturan-aturan atau rules yang terangkum menjadi
sebuah pohon keputusan. Metode ini juga memiliki beberapa kelebihan, seperti
fleksibel dalam skala hingga dimensi besar dan dapat diimplementasikan secara
paralel (Cantú-Paz dan Kamath 2003).
Hasil dari penelitian ini akan dibandingkan dengan penelitian sebelumnya
yang menggunakan PLS-DA (Afendi et al. 2012) dan SVM (Fitriawan 2013). Juga
akan dilakukan perbandingan antara daftar tanaman yang berpengaruh terhadap
suatu khasiat tertentu hasil keluaran dari metode VFI5. Diharapkan dengan adanya
metode ini dapat menjadi dasar untuk mengembangkan sistem klasifikasi khasiat
formula jamu baru yang lebih akurat.

Perumusan Masalah
Adapun masalah yang akan diangkat dalam penelitian ini adalah pencarian
rules tanaman dengan menggunakan ODT-GA untuk klasifikasi khasiat formula
jamu tertentu. Dari perbandingan dengan metode PLS-DA dan SVM diharapkan

2
metode ODT-GA dapat menjadi sebuah metode yang baik untuk memprediksi
khasiat formula jamu baru.

Tujuan Penelitian
Tujuan dari penelitian ini adalah membuat model klasifikasi tanaman
berdasarkan khasiat jamu dengan menggunakan metode ODT-GA. Nilai akurasi
model yang diperoleh akan dibandingkan dengan nilai akurasi dari metode PLSDA dan SVM. Selanjutnya menganalisis model tersebut dan membandingkan
dengan hasil dari keluaran metode VFI5.

Manfaat Penelitian
Hasil dari dilakukannya penelitian ini diharapkan dapat menjadi sebuah
teknik baru dalam pengembangan sistem untuk menentukan formula jamu
berdasarkan khasiat. Pada akhirnya, hasil dari penelitian ini dapat digunakan
sebagai model penentuan formula jamu beserta khasiatnya.

Ruang Lingkup Penelitian
Ruang lingkup dalam penelitian ini adalah:
1 Menggunakan data yang sama dengan penelitian sebelumnya (Fitriawan 2013)
yaitu data reduksi yang terdiri atas 2748 formula jamu dari 231 jenis tanaman.
2 Implementasi metode menggunakan metode ODT-GA menggunakan perangkat
lunak Keel Tool 2.0.

METODE
Penelitian ini menggunakan metode ODT-GA sebagai pembuat model untuk
klasifikasi. Tahapan pada penelitian ini terdiri atas akuisisi data, booleanize,
praproses data, pembagian data, ODT-GA dan evaluasi.

Data Penelitian
Data yang digunakan pada penelitian ini sama dengan data yang digunakan
pada penelitian oleh Fitriawan (2013) yaitu sejumlah 2748 formula jamu disertai
dengan komposisi dari 231 jenis tanaman. Data ini adalah data yang telah melalui
praproses data oleh Fitriawan (2013) dari jumlah awal 6533 formula jamu. Data
merupakan formula jamu yang terdaftar di Badan Pengawasan Obat dan Makanan
(Badan POM).

3
Tahapan Penelitian
Tahapan-tahapan yang dilakukan pada penelitian ini terdiri atas akuisisi data,
booleanize, praproses data, pembagian data, pembuatan model dengan metode
ODT-GA dan evaluasi. Alur penelitian dapat dilihat pada Gambar 1.

Gambar 1 Skema tahapan penelitian
Akuisisi Data
Data terdiri atas 2748 formula jamu yang terdaftar di Badan Pengawasan Obat
dan Makanan (Badan POM) dengan disertai komposisi masing-masing jamu dari
231 jenis tanaman. Keseluruhan data jamu masuk kedalam tepat satu kelas khasiat
dari total 9 kelas khasiat. Keseluruhan kelas khasiat dapat dilihat pada Tabel 1. Data
ini kemudian disebut sebagai Data I atau data asli.

Praproses Data
Pada data penelitian ini ditemukan masalah imbalance data, yaitu tidak
seimbangnya persebaran jumlah data pada masing-masing kelas. Ini dapat
mempengaruhi ketepatan dalam proses klasifikasi (Chawla et al. 2002). Untuk itu
akan dilakukan praproses data untuk over-sampling dengan metode Synthetic
Minority Over-sampling Technique (SMOTE). Digunakannya metode ini untuk

4
Tabel 1 Data I khasiat formula jamu
Nama Khasiat
Urinary related problems
Disorder of apetite
Disorder of mood and behavior
Gastrointestinal disorders
Female reproductive organ problems
Muskuloskeletal and connective tissue disorders
Pain and inflammation
Espiratory disease
Wounds and skin infections

Kode
Khasiat
E1
E2
E3
E4
E5
E6
E7
E8
E9

Jumlah
formula jamu
66
228
19
720
377
798
292
105
143

over-sampling karena dengan metode ini dapat menambah akurasi proses
klasifikasi untuk kelas yang memiliki jumlah data sedikit (kelas minor).
Penggunaan metode SMOTE dikombinasikan dengan random under-sampling
akan menghasilkan hasil klasifikasi yang lebih baik dibandingkan hanya undersampling biasa (Chawla et al. 2002).
Tahapan pertama dari proses ini adalah dengan membangkitkan data buatan
pada kelas minor. Data dibangkitkan dengan memilih beberapa tetangga terdekat
secara acak dari kelas minor, selanjutnya dilakukan proses perhitungan terhadap
beberapa data pilihan tersebut hingga didapatkan data buatan baru. Proses tersebut
dilakukan sampai seluruh kelas minor mencapai jumlah kelas minimal yang
ditentukan. Setelah proses pembangkitan data buatan, dilakukan proses
penghapusan secara acak terhadap kelas yang memiliki data melebihi jumlah yang
telah ditentukan. Proses ini disebut random under-sampling.
Pada penerapan SMOTE dan under-sampling digunakan bantuan perangkat
lunak Weka 3.6. Data yang telah dilakukan praproses ini kemudian disebut Data II
dan ditunjukan seperti pada Tabel 2.

Tabel 2 Data II khasiat formula jamu
Nama Khasiat
Urinary related problems
Disorder of apetite
Disorder of mood and behavior
Gastrointestinal disorders
Female reproductive organ problems
Muskuloskeletal and connective tissue disorders
Pain and inflammation
Espiratory disease
Wounds and skin infections
.

Kode
Khasiat
E1
E2
E3
E4
E5
E6
E7
E8
E9

Jumlah
formula jamu
305
305
305
305
305
305
305
305
305

5
Proses Booleanize
Dalam proses booleanize dikodekan atribut jenis tanaman yang terdiri 231
tanaman dari P001 sampai P465 dengan biner 0 dan 1 pada setiap formula jamu.
Pengkodean ini mengikuti pengkodean penelitian sebelumnya (Fitriawan 2013).
Angka 0 menunjukan di dalam formula jamu tidak terdapat tanaman tersebut
sebaliknya angka 1 menunjukan adanya tanaman tersebut dalam formula jamu
seperti ditunjukan pada Tabel 3.
Tabel 3 Ilustrasi proses booleanize
Formula Jamu
J0001
J0002

J2747
J2748

P001
0
0

0
0

P002
0
0

0
0








P465
0
0

0
0

Khasiat
E5
E5
...
E4
E4

Pembagian data
Data dibagi menjadi data latih dan data uji pada setiap set data. Pembagian
data menggunakan k-fold cross validation dengan nilai k=5 dan k=10. Untuk nilai
k=5, data dibagi menjadi 5 subset, yaitu fold 1, fold 2, fold 3, fold 4 dan fold 5.
Pelatihan data dilakukan dengan 4 subset fold dan diuji dengan 1 subset fold.
Dilakukan pengulangan sebanyak 5 kali sampai setiap subset telah menjadi fold
pelatih dan fold penguji. Begitu pula dengan nilai k=10 data akan dibagi menjadi
10 subset dan diproses mirip seperti k=5.
Oblique Decision Tree – Genetic Algorithm
Decision tree atau pohon keputusan merupakan salah satu metode machine
learning yang cukup popular untuk melakukan klasifikasi. Kebanyakan algoritme
pohon keputusan dalam proses pemisahan node menggunakan hyperplane yang
paralel dengan salah satu sumbu, sehingga sering disebut axis-parallel. Berbeda
dengan oblique decision tree, hyperplane yang dibentuk tidak selalu paralel dengan
sumbu. Dalam beberapa kasus hal ini membuat tree yang dihasilkan lebih akurat.
Pendekatan algoritme genetika digunakan pada pembuatan pohon keputusan
untuk menemukan pemisah node atau hyperplane yang cocok. Pada kebanyakan
algoritme, proses penentuan pemisah ditentukan melalui proses heuristik Greedy
Search. Pada kasus ini dilakukan optimasi dengan algoritme genetika untuk
mengganti proses greedy search. Tree direpresentasikan dalam bentuk gen yang
memiliki nilai berupa node untuk selanjutnya dilakukan proses sesuai dengan
algoritme genetika. Alur optimasi menggunakan algoritme genetika ditunjukan oleh
Gambar 2.

6
Pada penelitian ini digunakan algoritme genetika dengan prinsip pairwise
tournament selection tanpa adanya replacement atau penggantian. Digunakan juga
uniform crossover dengan nilai 1 tanpa adanya proses mutasi. Ilustrasi proses
crossover ditunjukan oleh Gambar 3. Sedangkan nilai parameter yang akan diujikan
adalah nilai k pada fold validation dan nilai jumlah generasi seperti ditunjukan pada
Tabel 4. Nilai yang berbeda untuk mengetahui nilai parameter mana yang paling
optimal dengan diperoleh nilai akurasi yang paling tinggi. Implementasi Oblique
Decision Tree dioptimasi algoritme genetika ini menggunakan perangkat lunak
Keel Tool 2.0 (Alcalá-Fdez et al. 2009).

Gambar 2 Skema optimasi algoritme genetika

Individu 1
Individu 2
Individu 1
Individu 2

Sebelum crossover
P371
P300
E7
E3
P386
P304
P001
E2
E4
P210
Setelah crossover
P371
P300 E7
E3
P210
P304
P001 E2
E4
P386
Gambar 3 Ilustrasi proses crossover

E7
E2

E7
E5

E2
E7

E5
E7

7
Tabel 4 Nilai parameter percobaan
Parameter
k-fold validation
Jumlah generasi

Nilai parameter
5, 10
25, 50, 100

Evaluasi
Evaluasi dilakukan untuk menentukan nilai akurasi atau kinerja dari model
klasifikasi yang dihasilkan. Nilai akurasi didapat dari jumlah benar hasil prediksi
dibandingkan dengan jumlah data uji. Proses evaluasi ini menggunakan confusion
matrix.
akurasi =

∑ data uji benar
×100%
∑ data uji

Selain dihitung nilai akurasinya, dari model klasifikasi berupa decision tree
yang dihasilkan juga akan diperiksa nilai kedekatannya dengan data tanaman yang
paling berpengaruh terhadap suatu khasiat tertentu dari metode VFI5. Decision tree
yang akan digunakan, sebelumnya telah dilakukan proses pruning, untuk
menghilangkan atau mengurangi noise yang kemungkinan ada saat training data
(Han dan Kamber 2006).

Lingkungan Pengembangan
Proses analisis dilakukan menggunakan perangkat lunak Weka 3.6 dan library
komputasi Keel Tool 2.0 (Alcalá-Fdez et al. 2009). Implementasi Sistem klasifikasi
Formula Jamu Berdasarkan Khasiat Menggunakan Oblique Decision Tree
Dioptimasi Algoritme Genetika pada penelitian ini berbasis web dengan
menggunakan PHP sebagai bahasa pemrograman dan menggunakan MySQL
sebagai database management system.

HASIL DAN PEMBAHASAN
Hasil
Setiap set data yang telah dilakukan percobaan dengan penggantian nilai
parameter memberikan hasil berupa akurasi yang ditunjukan pada Tabel 5. Nilai
akurasi tertinggi untuk Data I (data tanpa praproses data) adalah 94.47% dengan
nilai parameter k=10 dan jumlah generasi=50; nilai akurasi tertinggi untuk Data II
(data dengan praproses data) adalah 95.19% dengan nilai parameter k=10 dan
jumlah generasi=50. Masing-masing parameter dengan nilai akurasi tertinggi pada

8
tiap set data akan digunakan untuk analisis selanjutnya.
Tabel 5 Nilai akurasi set data
Data

Nilai k

Data I

5
10
5
10

Data II

Jumlah generasi
25
50
100
93.56% 94.25% 94.21%
93.41% 94.47% 94.29%
93.34% 94.75% 94.50%
94.39% 95.19% 94.83%

Nilai akurasi dari Data I dengan nilai parameter yang telah ditentukan dapat
dihitung dari confusion matrix yang disajikan pada Tabel 6.
Tabel 6 Confusion matrix Data I
Khasiat
Prediksi
E1
E2
E3
E4
E5
E6
E7
E8
E9

akurasi =

Khasiat aktual
E1
56
0
0
0
0
6
0
0
0

E2
0
217
4
0
22
0
0
0
0

E3
0
0
8
0
0
1
0
0
0

E4
3
3
2
719
5
4
5
1
6

E5
0
6
3
0
346
3
0
5
1

E6
3
0
2
0
0
763
2
6
4

E7
2
0
0
1
3
19
281
8
5

E8
1
0
0
0
0
0
1
82
3

E9
1
2
0
0
1
2
3
3
124

5 +217+8+719+346+763+281+82+124
×100% = 94.47%
2748

Nilai akurasi yang didapatkan pada Data I adalah sebesar 94.47%, nilai yang
sudah cukup baik untuk membuat model klasifikasi. Confusion matrix untuk Data
II disajikan pada Tabel 7.
Dari perhitungan akurasi pada Tabel 7, didapat nilai akurasi sebesar 95.19%.
Nilai akurasi ini lebih tinggi dari Data I karena pada Data II telah dilakukan telah
dilakukan praproses balancing data dari data asli. Data yang persebarannya belum
merata diseimbangkan dengan metode SMOTE dan under-sampling. Praproses ini
berhasil meningkatkan nilai akurasi dibandingkan dengan Data I.

akurasi =

303+289+304+291+273+283+284+295
×100% = 9 .19%
2748

9
Tabel 7 Confusion matrix Data II
Khasiat aktual

Khasiat
Prediksi
E1
E2
E3
E4
E5
E6
E7
E8
E9

E1
303
0
0
1
2
6
0
0
0

E2
0
289
0
0
18
0
0
1
0

E3
0
7
304
1
5
2
4
7
2

E4
0
5
0
291
2
0
2
1
0

E5
1
4
1
0
273
0
1
0
3

E6
1
0
0
0
0
283
0
1
2

E7
0
0
0
2
0
8
291
9
3

E8
0
0
0
0
3
4
3
284
0

E9
0
0
0
10
2
2
4
2
295

Pada Gambar 4 terlihat kedua penyebaran akurasi masing-masing khasiat dari
Data I dan Data II. Data I memiliki akurasi lebih baik pada 5 dari 9 khasiat
dibanding Data II. Tapi ketika akurasi khasiat Data II yang lebih baik, selisih
akurasinya cukup jauh. Bisa dilihat seperti pada khasiat Disorder of mood and
behavior Data I hanya memberikan nilai akurasi kurang dari setengah dari nilai
akurasi yang diberikan Data II. Ini dikarenakan pada khasiat Disorder of mood and
behavior termasuk kelas minor, atau kelas yang memiliki jumlah formula jamu
sedikit dengan hanya 19 formula jamu. Pada Data II yang telah dilakukan proses
balancing SMOTE, berhasil menaikan nilai akurasi dari kelas Disorder of mood
and behavior yang merupakan kelas minor.

100

90
80
Akurasi (%)

70
60
50

Data I

40

Data II

30
20
10
0
E1

E2

E3

E4

E5 E6
Khasiat

E7

E8

E9

Gambar 4 Grafik akurasi tiap khasiat pada Data I dan Data II

10
Ketika dilakukan perbandingan akurasi antar metode seperti pada Gambar 5,
nilai akurasi metode SVM masih yang tertinggi dengan 95.34%, selanjutnya
tertinggi kedua adalah metode ODT-GA dengan akurasi 95.19% dan terakhir
metode PLS-DA dengan akurasi 94.21%. Akurasi dari ketiga metode tidak begitu
terlampau jauh, selisih terbesar hanya 1.13% ini membuat akurasi ketiga metode
tidak berbeda nyata. Meskipun nilai akurasi metode ODT-GA masih kalah ketika
dibandingkan akurasi metode SVM, tapi dalam hal ini metode ODT-GA memiliki
kelebihan yaitu dapat memberikan daftar tanaman yang berpengaruh terhadap suatu
khasiat tertentu yang tidak dapat diberikan oleh SVM. Hal ini dapat membantu
dalam pengambilan pilihan tanaman awal apa saja untuk suatu khasiat tertentu.
100
99

Akurasi (%)

98
97
96
95
94
93
92
91

PLS-DA

SVM

ODT-GA

Gambar 5 Perbandingan akurasi metode PLS-DA, SVM dan ODT-GA
Model klasifikasi yang dihasilkan dari metode ODT-GA adalah pohon
keputusan dalam bentuk teks. Tree yang dihasilkan berbentuk binary tree sehingga
setiap node selain leaf pasti memiliki tepat 2 node anak. Tree ini dibentuk dari
aturan IF-Else yang bersarang. Contoh potongan tree yang dihasilkan dapat dilihat
pada Gambar 6.
Tree yang berbentuk teks kemudian diolah menjadi bentuk visual tree asli
secara manual sehingga akan didapatkan bentuk tree seperti pada Gambar 6. Tree
yang dihasilkan memiliki kedalaman=38 dan jumlah leaf=141. Pada tree yang
dihasilkan masih perlu dilakukan proses pruning atau pemangkasan, karena masih
didapat node-node yang tidak efektif. Seperti pada Gambar 4, karena anak-kiri dari
node P386 berupa leaf (E7), kedua anak P001 berupa leaf (E7 dan E7), dan kesemua
leaf dalam satu keturunan tertentu memiliki nilai yang sama, maka satu keturunan
tersebut dapat dihilangkan dan diganti dengan nilai pada leaf-nya. Contoh, setelah
dilakukan pruning, maka potongan tree pada Gambar 6 akan menjadi seperti
potongan tree pada Gambar 7. Tree hasil pruning memiliki kedalaman=30 dan
jumlah leaf = 94.

11

Gambar 6 Tree keluaran hasil proses ODT-GA

Gambar 7 Contoh potongan tree setelah divisualkan dalam bentuk asli

Pembahasan
Dari model klasifikasi yang dihasilkan (tree) dapat diperoleh tanaman apa
saja yang berpengaruh dalam suatu khasiat tertentu. Hal itu dapat diketahui dengan

12

Gambar 8 Contoh potongan tree hasil pruning
melihat tanaman apa yang merupakan induk dari leaf-kiri suatu khasiat. Contoh
sederhana bisa dilihat dari Gambar 5, induk dari leaf-kiri E7 adalah P300, ini berarti
salah satu tanaman yang berpengaruh di khasiat Pain and inflammation (E7) adalah
Panax pseudoginseng (P300).
Daftar tanaman yang berpengaruh pada suatu khasiat tertentu yang dihasilkan
lalu dibandingkan dengan daftar tanaman yang berpengaruh pada suatu khasiat
tertentu yang dihasilkan oleh metode Voting Feature Interval 5 (VFI5) yang telah
ditemukan sebelumnya. Dari hasil perbandingan, kesemua tanaman yang
berpengaruh hasil dari metode ODT-GA terdapat di tanaman yang berpengaruh
hasil dari metode VFI5.
Evaluasi menggunakan data tanaman yang berpengaruh di suatu khasiat hasil
dari metode VFI5 juga dilakukan pada tree hasil pemodelan ODT-GA. Dari 94
leaves yang ada dalam tree terdapat 11 perbedaan dalam penentuan tanaman yang
berpengaruh atau tidak terhadap suatu khasiat, atau dapat dikatakan metode ODTGA memiliki kesamaan dalam klasifikasi dengan metode VFI5 sebesar 86.17%.
Selain menghasilkan daftar tanaman yang berpengaruh terhadap suatu khasiat,
model tree ini juga dapat menghasilkan beberapa tanaman yang tidak berpengaruh
signifikan atau tidak direkomendasikan terhadap suatu khasiat. Ini dimungkinkan
karena pada data formula jamu, tanaman tersebut tidak pernah dipakai atau sangat
sedikit sekali dipakai untuk tujuan khasiat tertentu. Terdapat 14 tanaman yang
diindikasikan tersebut. Itu ditunjukan dengan suatu tanaman menjadi induk dari
leaf-kanan suatu khasiat. Ketika dibandingkan dengan hasil dari metode VFI5,
hanya ada 5 tanaman yang beririsan atau diindikasikan sama. Kelima tanaman itu
adalah tanaman Areca catechu dan Ficus deltoidea pada khasiat Disorder of apetite,
Panax pseudoginseng pada khasiat Disorder of mood and behavior, Trigonella
foenum-graecum pada khasiat Muskuloskeletal and connective tissue disorders, dan
Imperata cylindrical pada khasiat Espiratory disease.

13

SIMPULAN DAN SARAN
Simpulan
Penelitian ini berhasil membuat model klasifikasi formula jamu berdasarkan
khasiat dengan metode oblique decision tree dengan optimasi menggunakan
algoritme genetika. Akurasi yang didapat dari metode ini sebesar 94.47% dan
dengan data yang telah dilakukan proses penyeimbangan data, nilai akurasi menjadi
bertambah menjadi 95.19 %. Dari hasil model klasifikasi yang berupa tree, didapat
sejumlah tanaman yang berpengaruh dan yang tidak berpengaruh signifikan
terhadap suatu khasiat tertentu. Ini dapat menjadi salah satu rujukan dalam
formulasi jamu berdasarkan komposisi tanaman untuk mencapai suatu khasiat.
Saran
Saran untuk penelitian selanjutnya adalah menambah jumlah data latih untuk
setiap kelas sampai pada batas yang cukup atau memadai untuk membuat suatu
model, sehingga dapat meningkatkan nilai akurasi keseluruhan sistem. Selanjutnya
dengan melakukan perbaikan pada saat melakukan praproses data, seperti
menggunakan metode SMOTEBoost.
Penelitian selanjutnya tentang metode ODT-GA bisa juga dilakukan dengan
memakai set data yang variabel penciri tiap kelasnya merupakan mayoritas atau
dominan dibanding variabel yang bukan penciri. Sehingga ODT-GA dapat lebih
baik dalam membuat model, tree yang dihasilkan pun akan lebih sederhana.

DAFTAR PUSTAKA
Afendi FM, Darusman LK, Morita AH, Altaf-Ul-Amin M, Takahashi H, Nakamura
K, anaka K, Kanaya S. 2012. Efficacy prediction of jamu formulations by
PLS Modeling. Curr Comput Aided Drug Des. 9(1):46-59. PubMed PMID:
23106776.
Alcalá-Fdez J, Sánchez L, García S, del Jesus MJ, Ventura S, Garrell JM, Otero J,
Romero C, Bacardit J, Rivas VM, Fernández JC, Herrera F. KEEL: A
Software Tool to Assess Evolutionary Algorithms to Data Mining Problems.
Soft Computing 13:3 (2009) 307-318
Byun H, Lee SW. 2003. A survey on pattern recognition application of support
vector machines. Int J Patt Recogn Artif Intell. 17(3):459-486.
Cantú-Paz E, Kamath C. 2003. Inducing oblique decision trees with evolutionary
algorithms. IEEE Transactions on Evolutionary Computation 7:1 54-68.

14
Chawla NV, Bowyer KW, Hall LO, Kegelmeyer PW. 2002. SMOTE: Synthetic
Minority Over-sampling Technique. Journal of Artificial Intelligence
Research 16: 321-357.
Fitriawan A. 2013. Sistem Klasifikasi Khasiat Formula Jamu dengan Metode
Support Vector Machine [Skripsi]. Bogor (ID) : Institut Pertanian Bogor.
Han J, Kamber M. 2006. Data Mining Concepts and Techniques 2nd Ed. San
Francisco (US) : Morgan Kaufmann Pub.
Mahady GB. 2001. Global harmonization of herbal health claim. J Nutr. 131:
1120S-1123S.

15
Lampiran 1 Screenshot aplikasi
Tampilan memilih efikasi/khasiat

Tampilan memilih formula

16
Tampilan hasil yang formula yang diharapkan sesuai dengan khasiat

Tampilan hasil yang formula yang diharapkan tidak sesuai dengan khasiat

17
Lampiran 2 Pengkodean tanaman
P001
P002
P003
P004
P006
P007
P008
P013
P020
P021
P026
P029
P031
P033
P034
P040
P042
P044
P045
P048
P053
P055
P059
P061
P066
P067
P068
P072
P073
P075
P080
P081
P082
P091
P095
P096
P097
P098
P099
P101
P106
P107
P110

Foeniculum vulgare
Clausena anisum-olens
Litsea chinensis
Glycyrrhiza uralensis
Imperata cylindrica
Phellodendron chinense
Zanthoxylum acanthopodium
Elaeocarpus grandiflora
Garcinia atroviridis
Tamarindus indica
Atractylodis Macrocephala
Zingiber purpureum
Allium fistulosum
Allium cepae
Allium sativum
Pluchea indica
Pachyrrhizus erosus
Strychnos ligustrina
Merremia mammosa
Cimicifuga racemosa
Tinospora tuberculata
Pandanus conoideus
Clerodendron squamatum
Piper retrofractum
Santalum album
Cordyceps sinensis
Syzygium aromaticum
Prunus cerasus
Phyllanthus acidus
Clematis chinensis
Cibotium barometz
Theobroma cacao
Cola nitida
Gynura segetum
Achillea santolina
Graptophyllum pictum
Plantago major
Punica granatum
Glochidion rubrum
Harpagophytum procumbens
Syzygium cumini
Echinacea purpurea
Forsythia suspensa

P176
P180
P181
P182
P183
P185
P187
P188
P189
P190
P191
P193
P194
P198
P199
P200
P201
P202
P203
P206
P207
P209
P210
P211
P212
P214
P215
P218
P220
P221
P223
P224
P226
P231
P233
P234
P236
P239
P241
P243
P244
P245
P247

Amomum compactum
Sauropus androgynus
Usnea misaminensis
Aquilaria sinensis
Cinnamomum camphora
Cinnamomum cullilawan
Cinnamomum cassia
Melaleuca leucadendra
Parameria laevigata
Caesalpinia sappan
Grewia salutaris
Psophocarpus tetragonolobus
Elettaria speciosa
Parkia roxburghii
Soya max
Strobilanthes crispus
Typhonium flagelliforme
Cocos nucifera
Rheum tanguticum
Carthamus tinctorius
Aleurites moluccana
Phyllanthus emblica
Piper cubeba
Murraya paniculata
Canangium odoratum
Kaempferia galanga
Tagetes erecta
Terminalia catappa
Cassia alata
Coriandrum sativum
Cinchona succirubra
Trigonella foenum-graecum
Cola acuminata
Portulaca oleracea
Orthosiphon stamineus
Kaempferia angustifolia
Curcuma longa
Cucurbita pepo
Piper nigrum
Ocimum sanctum
Alpinia galanga
Vetiveria zizanioides
Lavandula angustifolia

P321
P322
P323
P324
P325
P328
P329
P332
P333
P334
P336
P339
P340
P342
P345
P347
P349
P351
P352
P355
P360
P362
P363
P364
P366
P367
P369
P370
P371
P374
P375
P377
P378
P379
P382
P386
P389
P390
P392
P397
P400
P403
P404

Prunus persica
Stachytarpheta jamaicensis
Hydrocotyle asiatica
Illicium verum
Carica papaya
Areca catechu
Pinus merkusii
Pygeum africanum
Prunus armeniaca
Mentha arvensis
Euchresta horsfieldii
Lepiniopsis ternatensis
Alstonia scholaris
Pimpinella pruatjan
Helicteres isora
Notopterygium incisum
Ceiba pentandra
Rubia cordifolia
Trifolium pratense
Hibiscus sabdariffa
Laminaria japonica
Hedyotis corymbosa
Abrus precatorius
Syzygium polyanthum
Salvia coccinea
Cistanches salsa
Hemigraphis colorata
Andrographis paniculata
Moschosma polystachium
Symplocos odoratissima
Serenoa repens
Brassica nigrae
Nasturtium indicum
Schisandra chinensis
Apium graveolens
Blumea balsamifera
Cassia angustifolia
Cymbopogon nardus
Crataegus pinnatifida
Sida rhombifolia
Silybum marianum
Cinnamomum sintok
Piper betle

18
P111
P112
P113
P115
P116
P118
P119
P120
P122
P123
P126
P128
P129
P132
P136
P138
P139
P140
P142
P144
P145
P147
P149
P155
P159
P160
P161
P162
P166
P167
P168
P171
P173
P175

Dioscorea opposite
Smilax zeylanica
Polygonum multiflorum
Gaultheria punctata
Justicia gendarussa
Ligusticum acutilobum
Garcinia cambogia
Sanguisorba officinalis
Borreria hispida
Commiphora myrrha
Panax ginseng
Angelica sinensis
Eleutherococcus senticosus
Equisetum debile
Asarum sieboldii
Magnolia officinalis
Coleus scutellarioides
Ruta angustifolia
Zea mays
Zingiber officinale
Zingiber officinale
Psidium guajava
Anacardium occidentale
Guazuma ulmifolia
Citrus amblycarpa
Citrus sinensis
Citrus aurantium
Citrus hystrix
Nigella sativa
Cassia siamea
Terminalia bellirica
Baeckea frutescens
Phaseolus radiatus
Ipomoea reptana

P250
P252
P254
P255
P256
P258
P259
P263
P266
P269
P270
P276
P277
P278
P279
P280
P281
P282
P283
P292
P295
P299
P300
P303
P307
P308
P309
P311
P314
P315
P316
P318
P319
P320

Vitex trifolia
Zingiber zerumbet
Zingiber aromaticum
Languas galanga
Leucas lavandulifolia
Polygala glomerata
Aloe vera
Eriobotrya japonica
Phaleria papuana
Galla lusitania
Quercus lusitanica
Massoia aromatica
Pistacia lentiscus
Rosa chinensis
Jasminum sambac
Morinda citrifolia
Phyllanthus urinaria
Mentha piperita
Cucumis sativus
Artemisia cina
Messua ferrea
Pogostemon cablin
Panax pseudoginseng
Eclipta prostrata
Costus speciosus
Oryza sativa
Sophora japonica
Myristica fragrans
Pandanus amaryllifolius
Vanilla planifolia
Momordica charantia
Eurycoma longifolia
Euphorbia thymifolia
Euphorbia hirta

P407
P409
P410
P411
P415
P418
P421
P424
P426
P427
P428
P429
P431
P432
P434
P435
P436
P438
P439
P440
P443
P444
P445
P446
P447
P449
P450
P452
P456
P459
P462
P463
P464
P465

Talinum paniculatum
Sparganium stoloniferum
Spirulina
Nyctanthes arbor-tritis
Spatholobus suberectus
Ficus deltoidea
Elephantopus scaber
Theae sinensis
Melaleuca alternifolia
Cyperus rotundus
Thymus vulgaris
Lantana camara
Sonchus arvensis
Curcuma heyneana
Curcuma aeruginosa
Kaempferia pandurata
Curcuma xanthorrhiza
Curcuma zedoaria
Fritillaria cirrhosa
Solanum verbacifolium
Solanum lycopersicum
Tetranthera brawas
Paeonia suffruticosa
Cassia fistula
Tribulus terrestris
Wolfiporia extensa
Sesbania grandiflora
Valeriana javanica
Salix alba
Daucus carota
Epimedium brevicornum
Pausinystalia yohimbe
Olea europaea
Alisma orientalis

19
Lampiran 3 Contoh sebagian data formula jamu
P444 P445 P446 P447 P449 P450 P452 P456 P459 P462 P463 P464 P465 Efficacy
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
1
0
0
1
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu
0
0
0
0
0
0
0
0
0
0
0
0
0 satu

20
Lampiran 4 Decision tree hasil ODT-GA

21
Lampiran 5 Daftar tanaman yang berpengaruh pada khasiat
Khasiat

Tanaman yang berpengaruh

Urinary related
problems

Imperata cylindrica, Plantago major, Smilax zeylanica,
Zea mays, Strobilanthes crispus, Serenoa repens,
Sonchus arvensis, Solanum lycopersicum, Paeonia
suffruticosa
Guazuma ulmifolia, Laminaria japonica, Curcuma
heyneana, Curcuma aeruginosa
Baeckea frutescens, Ipomoea reptana, Leucas
lavandulifolia, Carica papaya, Valeriana javanica
Pluchea indica, Punica granatum, Ligusticum
acutilobum, Baeckea frutescens, Parameria laevigata,
Kaempferia angustifolia, Ocimum sanctum, Quercus
lusitanica, Artemisia cina, Trifolium pratense, Piper
betle, Nyctanthes arbor-tritis, Ficus deltoidea
Justicia gendarussa, Zingiber officinale, Massoia
aromatica, Myristica fragrans, Euchresta horsfieldii,
Cyperus rotundus, Epimedium brevicornum
Foeniculum vulgare, Syzygium aromaticum,
Graptophyllum pictum, Zingiber officinale, Parkia
roxburghii, Typhonium flagelliforme, Cinchona
succirubra, Panax pseudoginseng, Helicteres isora
Clausena anisum-olens, Glycyrrhiza uralensis,
Echinacea purpurea, Amomum compactum, Piper
cubeba, Kaempferia galanga, Eriobotrya japonica,
Euphorbia hirta, Illicium verum, Abrus precatorius,
Nasturtium indicum, Thymus vulgaris, Salix alba
Tinospora tuberculata, Santalum album, Aleurites
moluccana, Trigonella foenum-graecum, Aloe vera,
Mentha piperita, Curcuma heyneana

Disorder of apetite
Disorder of mood
and behavior
Female
reproductive organ
Problems

Muskuloskeletal
and connective
tissue disorders
Pain and
inflammation

Espiratory disease

Wounds and skin
infections

22

RIWAYAT HIDUP
Penulis lahir di Kota Bandung pad 30 Mei 1992. Penulis merupakan putra
kedua dari tiga bersaudara pasangan Nanang Kusmana dan Sri Suprihatin. Penulis
menamatkan sekolah menengah di Kabupaten Indramayu yaitu SMAN 1 Sindang
pada tahun 2010 dan kemudian melanjutkan pendidikan di Institut Pertanian Bogor
pada tahun yang sama melalui jalur Undangan Seleksi Masuk IPB (USMI).
Selain melaksanakan kegiatan akademik, penulis juga pernah aktif di
beberapa kegiatan seperti menjadi asisten praktikum mata kuliah Algoritme dan
Pemrograman pada tahun 2012 serta mata kuliah Penerapan Komputer pada tahun
2013. Penulis melaksanakan kegiatan praktik kerja lapangan di Pusat Studi
Biofarmaka pada tahun 2013 dengan mengembangkan Sistem Informasi Jamu
Herbal (Si IJAH). Penulis juga aktif di beberapa organisasi seperti Ikatan Keluarga
dan Mahasiswa Darma Ayu Bogor (IKADA), BEM FMIPA 2012, BEM KM IPB
2013 dan LSM Inovasi untuk Indonesia.