Sistem Klasifikasi Khasiat Formula Jamu dengan Metode Support Vector Machine

SISTEM KLASIFIKASI KHASIAT FORMULA JAMU
DENGAN METODE SUPPORT VECTOR MACHINE

ARIES FITRIAWAN

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Sistem Klasifikasi
Khasiat Formula Jamu dengan Metode Support Vector Machine adalah benar
karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam
bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang
berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari
penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di
bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.
Bogor, Juni 2013

Aries Fitriawan
NIM G64090063

ABSTRAK
ARIES FITRIAWAN. Sistem Klasifikasi Khasiat Formula Jamu dengan Metode
Support Vector Machine. Dibimbing oleh WISNU ANANTA KUSUMA dan
RUDI HERYANTO.
Jamu adalah obat yang dibuat dari bahan-bahan alami seperti akar-akaran,
daun-daunan, kayu-kayuan, dan buah-buahan. Komposisi jamu biasanya
didasarkan pada data empiris atau pengalaman pribadi. Jamu terdiri atas banyak
variasi formula sehingga proses klasifikasi jamu berdasarkan komposisi tanaman
masih merupakan permasalahan yang menarik untuk diteliti. Tujuan penelitian ini
adalah membuat sistem klasifikasi khasiat jamu berdasarkan komposisi tanaman
menggunakan metode Support Vector Machine (SVM). Hasil dari penelitian ini
dibandingkan dengan penelitian sebelumnya yang menggunakan metode Partial
Least Squares Discriminant Analysis (PLS-DA). Model terbaik dihasilkan oleh
SVM dengan Radial Basis Function (RBF) kernel. Metode SVM memiliki nilai

akurasi pelatihan 5-fold cross validation lebih tinggi dibandingkan dengan PLSDA untuk data yang sudah direduksi maupun untuk pelatihan menggunakan
balanced dataset.
Kata kunci: jamu, klasifikasi, machine learning, support vector machine.

ABSTRACT
ARIES FITRIAWAN. A Classification System for Jamu Efficacy Using Support
Vector Machine. Supervised by WISNU ANANTA KUSUMA and RUDI
HERYANTO.
Jamu is made from natural materials such as roots, leaves, wood and fruits.
The composition of jamu formula is usually constructed based on empirical data
or personal experiences. Jamu has many variations of formula. Thus, the
classification of jamu efficacy based on its composition of plants remains an
interesting task. The purpose of this research is to develop a classification system
for jamu efficacy based on the composition of plants using Support Vector
Machine (SVM). This method were compared to those of previous research using
Partial Least Squares Discriminant Analysis (PLS-DA). The results show that the
SVM method with Radial Basis Function (RBF) kernel using data reduction and
balanced dataset obtains higher accuracy than those of PLS-DA.
Keywords: classification, jamu, machine learning, support vector machine.


SISTEM KLASIFIKASI KHASIAT FORMULA JAMU
DENGAN METODE SUPPORT VECTOR MACHINE

ARIES FITRIAWAN

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013

Penguji: Dr Farit Mochamad Afendi, SSi MSi
Sony Hartono Wijaya, SKom MKom


Judul Skripsi : Sistem Klasifikasi Khasiat Formula Jamu dengan Metode Support
Vector Machine
Nama
: Aries Fitriawan
NIM
: G64090063

Disetujui oleh

Dr Wisnu Ananta Kusuma, ST MT
Pembimbing I

Rudi Heryanto, SSi MSi
Pembimbing II

Diketahui oleh

Dr Ir Agus Buono, MSi MKom
Ketua Departemen


Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
rahmat dan karunia-Nya sehingga skripsi ini berhasil diselesaikan. Tema yang
dipilih dalam penelitian yang dilaksanakan sejak bulan November 2012 sampai
Mei 2013 ini adalah pendekatan machine learning pada klasifikasi khasiat
formula jamu, dengan judul Sistem Klasifikasi Khasiat Formula Jamu dengan
Metode Support Vector Machine.
Terima kasih penulis ucapkan kepada Bapak Dr Wisnu Ananta Kusuma, ST
MT dan Bapak Rudi Heryanto, SSi MSi atas bimbingannya, Bapak Dr Farit
Mochamad Afendi, SSi MSi dan Bapak Sony Hartono Wijaya, SKom MKom,
yang telah memberikan data dan masukan ide untuk penelitian ini, serta Bapak
Ahmad Ridha, SKom MSc yang telah memberi saran. Ungkapan terima kasih
juga disampaikan kepada kedua orang tua penulis Yuyus Ruslan dan Tati Mulyati
serta adik penulis, Adrie Maulana atas doa, dukungan dan kasih sayangnya. Tidak
lupa penulis mengucapkan terima kasih kepada Aussie Komala Rani dan keluarga
atas bantuan dan dukungannya. Penulis juga mengucapkan terima kasih kepada
Ariny, Aditrian, Gita, Rangga, Papank, Kak Isnan, Kak Chawang serta seluruh
keluarga besar Ilkomerz 46 dan kakak angkatan Ilkomerz 45 dan Ilkomerz 44

yang tidak dapat penulis tuliskan satu demi satu yang secara langsung dan tidak
langsung telah membantu penulis dalam melakukan penelitian ini.
Besar harapan penulis agar laporan penelitian ini dapat dimanfaatkan dan
dikembangkan dengan lebih baik lagi.
Bogor, Juni 2013

Aries Fitriawan

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi


PENDAHULUAN

1

Latar Belakang

1

Perumusan Masalah

2

Tujuan Penelitian

2

Manfaat Penelitian

2


Ruang Lingkup Penelitian

2

METODE

3

Data dan Penyiapan Data

3

Data Balancing

5

K-Fold Cross Validation

5


Pelatihan Support Vector Machine

6

Uji dan Klasifikasi Support Vector Machine

7

Evaluasi dan Perbandingan Hasil

7

Implementasi Sistem

7

HASIL DAN PEMBAHASAN
Hasil
Pembahasan

SIMPULAN DAN SARAN

8
8
12
15

Simpulan

15

Saran

15

DAFTAR PUSTAKA

15

LAMPIRAN


17

RIWAYAT HIDUP

26

DAFTAR TABEL
1 Rincian Percobaan 1 dan Percobaan 2
2 Perbandingan hasil akurasi training dari Data I dan Data II
3 Perbandingan akurasi PLS-DA dengan SVM menggunakan Data I dan
Data II

8
9
10

DAFTAR GAMBAR
1 Skema metode penelitian untuk perbandingan akurasi PLS-DA dengan
SVM
2 Skema metode penelitian untuk mengetahui pengaruh imbalanced data
3 Grafik penyebaran data jamu yang digunakan dalam penelitian
4 Ilustrasi representasi data hubungan antara jamu, tanaman dan khasiat
jamu
5 Contoh ilustrasi pemodelan SVM yang bersifat linear
6 Hasil perbandingan akurasi pencarian nilai d Data I dengan C=1 dan
γ=2 (a), hasil perbandingan akurasi pencarian nilai d Data II dengan
C=2 dan γ=2 (b)
7 Hasil grid search pada model RBF Kernel menggunakan grid.py dari
Data I (a) dan Data II (b)
8 Hasil perbandingan akurasi pencarian nilai d Data III dengan C=0.5 dan
γ=2
9 Hasil grid search pada model RBF Kernel menggunakan grid.py dari
Data III
10 Hasil akurasi training 5-fold cross validation pada setiap jenis data
11 Penyebaran data jamu baru hasil prediksi
12 Ilustrasi pengelompokan data hasil prediksi sistem dengan diagram
irisan

3
3
4
4
7

9
10
11
11
11
14
14

DAFTAR LAMPIRAN
1
2
3
4

Daftar tanaman jamu yang paling signifikan berdasarkan kelasnya
Ilustrasi proses penambahan dan pengurangan data
Langkah dan tampilan penggunaan aplikasi
Hasil prediksi komposisi jamu baru

17
19
22
24

PENDAHULUAN
Latar Belakang
Jamu adalah obat herbal tradisional Indonesia yang terbuat dari bahan alami
seperti akar, daun, kayu, dan buah-buahan. Menurut Mahady (2001), penggunaan
jamu sebagai pengobatan alternatif mengalami peningkatan. Orang-orang mulai
mempertimbangkan jamu sebagai obat yang aman dan manjur yang telah terbukti
secara empiris selama ratusan tahun.
Adam et al. (2006) yang meneliti sel prostat menunjukkan bahwa
penggunaan kombinasi dari beberapa ekstrak tanaman memiliki interaksi sinergi
yang lebih baik daripada hanya menggunakan satu ekstrak tanaman saja. Oleh
sebab itu, jamu memiliki banyak variasi formula. Setiap wilayah di Indonesia
mengembangkan formula jamu sendiri berdasarkan bahan-bahan alami yang ada
di wilayah itu (Beers 2001). Namun, meski secara empiris jamu telah terbukti
dapat menyembuhkan beberapa penyakit, belum ada cukup bukti ilmiah yang
dapat menjelaskan hubungan antara formula atau komposisi tanaman dengan
khasiatnya.
Upaya sistematis untuk menemukan hubungan antara komposisi dan khasiat
jamu telah dilakukan oleh Afendi et al. (2010) dengan menggunakan pendekatan
statistik. Penelitian ini menunjukkan bahwa jamu dengan khasiatnya memiliki
aktivitas farmakologi tertentu. Selanjutnya, Afendi et al. (2010) mengembangkan
hipotesis bahwa formula jamu terdiri atas tanaman utama dan tanaman
pendukung. Tanaman utama memiliki efek langsung pada penyakit sehingga
menjadi tanaman yang langsung dihubungkan dengan khasiat tertentu (Afendi et
al. 2010). Sementara itu, tanaman pendukung didefinisikan paling tidak harus
memiliki tiga karakteristik, yaitu analgesik, antimikroba, dan anti-peradangan.
Afendi et al. (2012) menggunakan metode Partial Least Squares
Discriminant Analysis (PLS-DA) untuk mengembangkan sebuah model
klasifikasi formula jamu. Penelitian tersebut difokuskan pada pengamatan 3138
sampel jamu yang diklasifikasikan ke dalam 9 jenis khasiat. Khasiat yang dapat
diprediksi oleh metode ini adalah urinary related problems (URI), disorder of
apetite (DOA), disorder of mood and behavior (DMB), gastrointestinal disorders
(GST), female reproductive organ problems (FML), muskuloskeletal and
connective tissue disorders (MSC), pain and inflammation (PIN), respiratory
disease (RSP), dan wounds and skin infections (WND). Sampel jamu yang
digunakan mengandung 1 sampai 16 tanaman yang diambil dari 465 tanaman
obat. Dengan demikian, variasi formula jamu yang dihasilkan sangat tinggi. Hasil
klasifikasi menunjukkan bahwa akurasi dengan 5-fold cross validation adalah
71.6%. Akurasi meningkat secara signifikan setelah dilakukan data cleaning
(94.21%) (Afendi et al. 2012).
Dalam bidang ilmu komputer, masalah klasifikasi dapat diselesaikan
dengan menggunakan teknik machine learning, salah satunya dengan
menggunakan Support Vector Machine (SVM). SVM adalah salah satu teknik
machine learning yang mampu mengklasifikasikan problem di dunia nyata
dengan hasil akurasi yang tinggi (Byun dan Lee 2003). Berdasarkan penelitian
yang telah dilakukan, SVM juga mampu menghasilkan akurasi tinggi untuk

2
mengklasifikasikan potongan metagenome dari komunitas kecil mikroba (Kusuma
dan Akiyama 2011). Dalam penelitian ini, akan diterapkan metode SVM untuk
mengklasifikasikan khasiat jamu berdasarkan komposisi tanamannya. Hasil
pengklasifikasian dengan menggunakan SVM pada penelitian ini akan
dibandingkan dengan hasil dari metode PLS-DA yang diperoleh Afendi et al.
(2012). Oleh sebab itu, untuk melakukan perbandingan yang adil, digunakan
dataset yang sama seperti yang digunakan dalam penelitian Afendi et al. (2012).
Pada penelitian ini juga dilakukan teknik undersampling dan oversampling untuk
mengatasi masalah imbalanced dataset pada saat proses pelatihan. Teknik ini
diharapkan dapat menjadi dasar untuk mengembangkan sistem klasifikasi khasiat
formula jamu baru.

Perumusan Masalah
Adapun masalah yang akan diangkat dalam penelitian ini adalah pencarian
metode klasifikasi lain yang dapat digunakan dalam klasifikasi khasiat formula
jamu. Dari perbandingan metode PLS-DA dengan metode SVM diharapkan dapat
menghasilkan sebuah metode terbaik untuk memprediksi khasiat formula jamu
baru.

Tujuan Penelitian
Tujuan dari penelitian ini ialah:
1 menganalisis dan membuat sistem klasifikasi khasiat jamu berdasarkan
komposisi tanaman dengan metode Support Vector Machine (SVM)
2 membandingkan nilai akurasi antara metode SVM dan metode Partial Least
Squares Discriminant Analysis (PLS-DA)
3 menerapkan teknik undersampling dan oversampling untuk mengatasi
permasalahan imbalanced dataset.

Manfaat Penelitian
Hasil dari dilakukannya penelitian ini diharapkan dapat menjadi sebuah
konsep dasar dalam mengembangkan sistem penentuan khasiat formula jamu baru.
Pada akhirnya, hasil dari penelitian ini dapat menjadi dasar dalam menangani
solusi permasalahan pencatatan data jamu beserta khasiatnya di Indonesia.

Ruang Lingkup Penelitian
Ruang lingkup dalam penelitian ini adalah:
1 tanaman yang dikenali terbatas pada 465 jenis tanaman dari 3138 jamu hasil
praproses dari penelitian sebelumnya (Afendi et al. 2010)
2 data reduksi menggunakan data yang sama dengan penelitian sebelumnya,
data ini terdiri atas 231 jenis tanaman dari 2748 jamu (Afendi et al. 2010)

3
3

implementasi metode klasifikasi SVM menggunakan bantuan library LibSVM
3.14 (Hsu et al. 2010).

METODE
Untuk menghasilkan penelitian yang baik, diperlukan sebuah metode dan
rencana penelitian. Skema metode penelitian ini dapat dilihat pada Gambar 1 dan
Gambar 2.

Data dan Penyiapan Data
Data yang digunakan pada penelitian ini menggunakan data yang sama
dengan penelitian yang dilakukan oleh Afendi et al. (2010). Data yang digunakan
terdiri atas data jamu berjumlah 3138 buah jamu yang terdaftar di Badan
Pengawasan Obat dan Makanan (Badan-POM) yang disertai komposisi masingmasing jamu dari 465 jenis tanaman. Data ini telah melalui praproses data dari
jumlah awal 6533 buah jamu. Praproses data yang dikerjakan terdiri atas
penghapusan redudansi data jamu sebanyak 1223 buah jamu. Dari sisa 5310 buah
jamu hanya diambil sebanyak 3138 buah jamu yang dianggap dapat mewakili data
yang dibutuhkan untuk analisis (Afendi et al. 2010) (Data I). Penelitian ini juga
menggunakan data yang telah direduksi melalui proses data cleaning yang
didapatkan dari hasil penelitian sebelumnya. Data ini terdiri atas 231 jenis
tanaman dari 2748 jamu (Data II). Selanjutnya, untuk melihat pengaruh dari
imbalanced data, penelitian ini menggunakan data yang telah melalui proses
pemerataan data yang akan dijelaskan pada bagian Data Balancing. Data ini
terdiri atas 231 jenis tanaman dari 2745 jamu (Data III). Data tersebut tersebar ke
dalam 9 jenis khasiat (lihat Gambar 3).
Data yang digunakan pada penelitian ini merupakan hasil representasi data
dari jamu yang beredar di Indonesia. Data yang digunakan berupa hubungan
antara jamu, tanaman yang digunakan dalam komposisi jamu, dan khasiat dari
jamu tersebut. Komposisi tanaman didefinisikan dengan menetapkan nilai biner
untuk masing-masing tanaman. Jika tanaman tertentu dimasukkan ke dalam
Pengumpulan
dan Praproses
Data

5-Fold
Cross
Validation

Support
Vector
Machine

Model

Evaluasi
Hasil

Implementasi

Gambar 1 Skema metode penelitian untuk perbandingan akurasi PLS-DA
dengan SVM
Praproses
Data

Data
Balancing

5-Fold
Cross
Validation

Support
Vector
Machine

Model

Evaluasi
Hasil

Gambar 2 Skema metode penelitian untuk mengetahui pengaruh imbalanced
data

4

Banyak Data

sampel jamu, nilai pada tanaman ini ditetapkan sebagai 1, sebaliknya penetapan
nilainya adalah 0. Penelitian ini hanya dapat menetapkan nilai fitur dengan nilai
biner karena belum mendapatkan informasi yang lebih akurat dari formulasi
bahan-bahan jamu. Gambar 4 menunjukkan contoh fitur data jamu, J1 sampai JN
mewakili sampel jamu dan P1 sampai Pk mewakili komposisi tanaman yang
digunakan. Sebagai contoh, jamu J2 disusun oleh P2 dan P3 memiliki khasiat yang
diwakili dengan urutan khasiat ke-5 (FML).
Ekstraksi data yang dilakukan pada Data I menghasilkan matriks berukuran
465 x 3138, Data II menghasilkan matriks berukuran 231 x 2748, dan Data III
menghasilkan matriks berukuran 231 x 2745. Data ini kemudian diproses agar
bisa diolah menggunakan LibSVM 3.14 (Hsu et al. 2010).

1000
900
800
700
600
500
400
300
200
100
0

980
840

Data I

798

720

Data II
Data III
398 377

305

72

305
249
228

66

305

311
305

305

305

292 305
107 105

22 19

URI

DOA

DMB

305

GST
FML
MSC
Khasiat Jamu

PIN

RSP

305

159 143

WND

Gambar 3 Grafik penyebaran data jamu yang digunakan dalam penelitian

Gambar 4 Ilustrasi representasi data hubungan
antara jamu, tanaman dan khasiat
jamu

5
Data Balancing
Dari penelitian ini ditemukan masalah imbalanced data pada setiap jenis
data. Imbalanced data terjadi karena penyebaran data setiap kelas yang tidak
sama. Imbalanced data akan mengakibatkan pendekatan pada data set yang tidak
seimbang sehingga membuat hyperplane yang dibentuk berada lebih jauh dari
kelas positifnya (Akbani et al. 2004).
Pada penelitian ini dilakukan oversampling dan undersampling untuk
menangani imbalanced data. Teknik ini dilakukan untuk mengatur ulang jumlah
distribusi dataset sehingga memungkinkan jumlah data yang merata pada setiap
kelas.
Pemerataan jumlah data ini dilakukan pada Data II. Penentuan jumlah data
per kelas diambil dari rata-rata data per kelas pada Data II. Pemerataan jumlah
data per kelas pada Data II yang memiliki jumlah awal 2748 data jamu
menghasilkan jumlah data yang baru sebanyak 2745 data jamu, dengan jumlah
data rata-rata per kelas sebanyak 305 data jamu (Data III).
Dari perbandingan jumlah data dapat dilihat ada kelas yang mendapatkan
penambahan jumlah data dan yang mengalami pengurangan data. Pada penelitian
ini, penambahan data dilakukan dengan pertimbangan sebagai berikut:
1 tidak menggunakan data yang berulang
2 data yang ditambahkan dipilih dari kombinasi komposisi tanaman yang
berjumlah 1 sampai dengan 10 tanaman
3 komposisi tanaman yang dipilih pada setiap kelasnya menyesuaikan dengan
kecenderungan tanaman yang lebih signifikan terhadap khasiatnya, daftar
tanaman ini merupakan hasil dari penelitian yang dilakukan oleh Afendi et al.
(2012) dan dapat dilihat pada Lampiran 1
4 jumlah data dan jumlah tanaman dalam setiap komposisi beragam dan merata
pada setiap kelasnya bergantung pada kekurangan data pada kelas tersebut.
Pengurangan data dilakukan dengan pertimbangan sebagai berikut:
1 penghapusan data yang masih berulang
2 pengurangan data dilakukan merata di setiap kelompok data dengan jumlah
komposisi tanaman tertentu.
Ilustrasi dari proses penambahan dan pengurangan data dapat dilihat pada
Lampiran 2.

K-Fold Cross Validation
Data dilatih dengan metode SVM. Untuk mencari akurasi data latih
digunakan metode pengujian K-fold cross validation dengan nilai K sebesar 5.
Seluruh data set yang ada akan dibagi menjadi lima subset, yaitu: fold 1, fold 2,
fold 3, fold 4, dan fold 5. Pelatihan akan dilakukan secara berulang dan pada
setiap pengulangannya empat fold akan dijadikan data latih dan satu fold akan
dijadikan data uji. Proses ini dilakukan sebanyak lima kali sampai setiap fold
pernah berperan sebagai data latih dan data uji. Dalam setiap pengulangan nilai
akurasi akan dihitung dan akurasi terakhir didapat dari rata-rata nilai akurasi dari
seluruh pengulangan. Hal ini dilakukan dengan tujuan mencari akurasi yang

6
terbaik. Data latih yang digunakan dalam penelitian ini terbagi menjadi tiga, yaitu
Data I, Data II, dan Data III.

Pelatihan Support Vector Machine
Support Vector Machine (SVM) adalah suatu sistem pembelajaran
menggunakan ruang hipotesis dari suatu fungsi linear dalam suatu ruang dimensi
berfitur tinggi. Tujuan utama SVM ialah menemukan fungsi pemisah
(hyperplane) yang terbaik untuk memisahkan dua buah kelas pada input space.
Hyperplane terbaik antara dua kelas dapat ditemukan dengan pengukuran
margin hyperplane yang maksimal antara ruang input non-linear dengan ruang
ciri menggunakan fungsi kernel (Cortes dan Vapnik 1995).
Menurut Byun dan Lee (2003), fungsi kernel yang umum digunakan adalah:
1 linear kernel

2 polynomial kernel
d

3 Radial Basis Function (RBF) kernel
- ‖ - ‖ , dengan

Dari ketiga fungsi kernel tersebut xi merepresentasikan vektor dari setiap
data, d merepresentasikan jumlah derajat dari fungsi polinomial, dan γ
merepresentasikan ukuran rentangan pada kurva gaussian. SVM menerapkan
kernel yang digunakan untuk merepresentasikan data ke dimensi yang lebih tinggi.
Data yang sudah berada di dimensi lebih tinggi tersebut dapat dengan mudah
dipisahkan dengan hyperplane yang linear (Boswell 2002). Hyperplane yang baik
adalah hyperplane yang dapat memaksimumkan jarak antara geometri hyperplane
dengan support vector. Jarak tersebut diistilahkan dengan margin seperti
diilustrasikan pada contoh ilustrasi pemodelan SVM yang bersifat linear (lihat
Gambar 5).
Pelatihan data dilakukan dengan LibSVM 3.14 menggunakan 3 kernel,
yaitu:
1 linear kernel, hanya membutuhkan peubah C
2 polynomial kernel yang membutuhkan peubah C dan d
3 RBF kernel yang membutuhkan peubah C dan γ.
Beberapa peubah yang digunakan merupakan peubah yang hanya digunakan
di LibSVM 3.14. Peubah C dalam LibSVM 3.14 merepresentasikan error penalty
dalam komputasi pembentukan model.
Masing-masing kernel dicoba dengan nilai peubah fungsi kernel yang
diterapkan untuk fungsi polynomial kernel dan RBF kernel. Dari hasil percobaan
akan didapatkan beberapa model SVM yang memiliki akurasi pelatihan 5-fold
cross validation.

7
Vektor kelas +1
Vektor kelas -1

xTxi + b = 1

Support Vectors

xTxi + b = -1

Gambar 5 Contoh ilustrasi pemodelan SVM yang
bersifat linear
Uji dan Klasifikasi Support Vector Machine
Pengujian akan dilakukan dengan menerapkan metode multiclass SVM.
Multiclass SVM merupakan pendekatan metode SVM pada kasus yang memiliki
kelas lebih besar dari 2 kelas. Model yang dihasilkan dari pelatihan SVM akan
digunakan dalam penentuan kelas dengan teknik one-against-one.
Untuk mengklasifikasikan khasiat dari komposisi tanaman jamu diperlukan
suatu model SVM dengan output berupa angka antara 1 sampai 9 sesuai dengan
banyaknya klasifikasi khasiat jamu. Input yang diperlukan bergantung pada
komposisi jamu yang ingin diidentifikasi khasiatnya.

Evaluasi dan Perbandingan Hasil
Evaluasi dan perbandingan hasil dilakukan untuk mengevaluasi kekurangan
dan kelebihan dari metode yang digunakan serta membandingkannya dengan
metode sebelumnya. Perbandingan hasil dapat dilihat dari perbandingan akurasi
metode PLS-DA dengan metode SVM.
Penelitian ini dilakukan dalam 2 tahap. Percobaan 1 dilakukan untuk
mencari model SVM terbaik dan membandingkannya dengan hasil dari PLS-DA.
Percobaan 2 dilakukan untuk menganalisa dan membandingkan pengaruh
balanced dataset terhadap akurasi. Rincian percobaan dapat dilihat pada Tabel 1.

Implementasi Sistem
Implementasi sistem dilakukan dalam lingkungan pengembangan aplikasi
menggunakan bahasa pemrograman PHP, library komputasi LibSVM 3.14, dan
MySQL sebagai database management system.

8
Sistem yang dikembangkan memiliki fungsi melakukan prediksi khasiat
jamu dari formula jamu baru yang dimasukkan oleh pengguna menggunakan
bantuan model hasil training SVM yang tersedia.
Tabel 1 Rincian Percobaan 1 dan Percobaan 2
Jenis
Percobaan

Percobaan 1

Data yang
Digunakan

Data I
Data II

Metode yang
Digunakan

SVM
 Linear Kernel
 Polynomial Kernel
 RBF Kernel

PLS-DA
SVM

Data III

SVM
 Linear Kernel
 Polynomial Kernel
 RBF Kernel

Data I
Data II
Data III

SVM

Data II
Data III

PLS-DA (Data II)
SVM (Data III)

Percobaan 2

Tujuan Percobaan
Mencari model SVM
yang terbaik
 Mencari nilai optimal
C (linear kernel)
 Mencari nilai optimal
d (polynomial kernel)
 Mencari nilai optimal
C dan γ (RBF kernel)
Membandingkan hasil
akurasi PLS-DA dengan
hasil akurasi SVM
dengan model terbaik
Mencari model SVM
yang terbaik untuk data
yang sudah merata
 Mencari nilai optimal
C (linear kernel)
 Mencari nilai optimal
d (polynomial kernel)
 Mencari nilai optimal
C dan γ (RBF kernel)
Membandingkan hasil
akurasi SVM setiap jenis
data
Membandingkan hasil
akurasi PLS-DA (Data
II) dengan hasil akurasi
SVM (Data III)

HASIL DAN PEMBAHASAN
Hasil
Percobaan 1
Langkah awal dalam penelitian ini ialah mengolah data agar dapat
digunakan untuk proses komputasi dengan menggunakan LibSVM 3.14. Data

9
yang digunakan untuk perbandingan perhitungan akurasi ialah Data I dan Data II.
Akurasi yang dicari adalah akurasi hasil 5-fold cross validation.
Setelah data siap untuk diuji menggunakan LibSVM 3.14, dilakukanlah
proses grid search untuk mendapatkan nilai C dan γ yang optimal. Teknik grid
search adalah teknik yang diterapkan oleh LibSVM 3.14 untuk mencari nilai
peubah yang optimal dilihat dari hasil akurasi yang didapatkan menggunakan
perangkat grid.py dari LibSVM 3.14. Untuk linear kernel dicari nilai peubah C
yang optimal, dari hasil pencarian didapatkan nilai C sebesar 1 untuk Data I dan 2
untuk Data II. Untuk polynomial kernel perlu dicari juga nilai d yang optimal.
Pencarian nilai d yang optimal dilakukan dengan percobaan menggunakan 5-fold
cross validation terhadap data dengan rentang nilai d dari 2 sampai 4. Nilai d yang
dipilih adalah nilai d dengan akurasi training tertinggi. Dari perbandingan hasil
percobaan Data I menggunakan nilai C sebesar 1 dan γ sebesar 2 dan Data II
menggunakan nilai C sebesar 2 dan γ sebesar 2, didapatkan nilai d yang sama,
yaitu 2 (lihat Gambar 6). Untuk RBF kernel perlu dicari nilai C dan γ yang
optimal. Dari hasil pencarian menggunakan Data I didapatkan nilai C sebesar 2
dan nilai γ sebesar 0.125, sedangkan Data II didapatkan nilai C sebesar 2 dan nilai
γ sebesar 0.5. Perbandingan hasil grid search pada model RBF kernel
menggunakan grid.py dapat dilihat pada Gambar 7.
Dengan menggunakan nilai dari setiap peubah yang telah didapatkan,
dilakukanlah proses training menggunakan LibSVM 3.14 dengan percobaan pada
3 jenis kernel. Hasil akurasi dari training Data I dan Data II menggunakan metode
5-fold cross validation dapat dilihat pada Tabel 2.
Tabel 2 Perbandingan hasil akurasi training dari Data I dan Data II
Akurasi dari hasil training SVM (%)

Akurasi (%)

Data I (3138 jamu, 465
tanaman)
Data II (2748 jamu, 231
tanaman)

100
80
60
40
20
0

66.63 65.14 63.00

d=2

d=3
(a)

d=4

Linear
kernel

Polynomial
kernel

RBF
kernel

68.19

66.63

71.00

94.32

93.85

95.34

Akurasi (%)

Data

100
80
60
40
20
0

93.85 93.12 92.79

d=2

d=3
(b)

d=4

Gambar 6 Hasil perbandingan akurasi pencarian nilai d Data I
dengan C=1 dan γ=2 (a), hasil perbandingan akurasi
pencarian nilai d Data II dengan C=2 dan γ=2 (b)

10

(a)
(b)
Gambar 7 Hasil grid search pada model RBF Kernel menggunakan
grid.py dari Data I (a) dan Data II (b)
Pada percobaan ini dipilih model terbaik yang dihasilkan oleh RBF kernel,
karena di setiap jenis data RBF kernel selalu menghasilkan akurasi pelatihan yang
tertinggi. Hasil dari setiap akurasi yang dihasilkan oleh model SVM
menggunakan RBF kernel akan digunakan sebagai pembanding dengan metode
PLS-DA. Hasil perbandingan antara metode SVM dengan metode PLS-DA dapat
dilihat pada Tabel 3.
Tabel 3 Perbandingan akurasi PLS-DA dengan
SVM menggunakan Data I dan Data II

Dataset

PLS-DA
(%)

SVM
RBF Kernel
(%)

Data I
Data II

71.60
94.21

71.00
95.34

Percobaan 2
Langkah awal yang dilakukan dalam percobaan ini ialah mencari model
terbaik untuk Data III. Pencarian dilakukan dengan teknik grid search
menggunakan LibSVM 3.14. Untuk linear kernel didapatkan nilai C yang optimal
sebesar 0.5. Pada percobaan menggunakan polynomial kernel menggunakan nilai
C sebesar 0.5 dan γ sebesar 2, Data III mendapatkan nilai d yang optimal sebesar
2. Pada percobaan menggunakan RBF kernel, didapatkan nilai C sebesar 2 dan
nilai γ sebesar 0.5. Hasil perbandingan pencarian nilai d dapat dilihat pada
Gambar 8. Hasil grid search pada model RBF kernel menggunakan grid.py untuk
Data III dapat dilihat pada Gambar 9.
Pada percobaan ini dilakukan proses training menggunakan LibSVM 3.14
dengan percobaan pada 3 jenis kernel menggunakan Data III. Hasil yang

11

Akurasi (%)

didapatkan akan dibandingkan dengan hasil akurasi dari Data I dan Data II. Hasil
perbandingan dari akurasi dapat dilihat pada Gambar 10.

100
80
60
40
20
0

92.53 89.39 88.92

d=2

Gambar 8

d=3

d=4

Hasil perbandingan akurasi
pencarian nilai d Data III
dengan C=0.5 dan γ=2

Gambar 9 Hasil grid search pada model RBF
Kernel menggunakan grid.py dari
Data III

100

Akurasi (%)

80

94.32 94.21
68.19

93.85 92.53
66.63

95.34 95.70
71.00

Data I
Data II
Data III

60
40
20
0
Linear Kernel

Polynomial Kernel
Jenis Model

RBF Kernel

Gambar 10 Hasil akurasi training 5-fold cross validation pada setiap jenis data

12
Dari hasil yang diperoleh, dapat dilihat bahwa model SVM telah
memberikan hasil yang baik. Jika dirata-ratakan dari ketiga model kernel, akurasi
yang diperoleh dari penggunaan Data I sebesar 68.61%, Data II sebesar 94.5%,
dan Data III sebesar 94.15%. Pada penelitian ini dipilih model terbaik yang
dihasilkan oleh RBF kernel, karena di setiap jenis data RBF kernel selalu
menghasilkan akurasi pelatihan yang tertinggi. Hasil dari akurasi Data III
menggunakan RBF kernel akan digunakan sebagai pembanding dengan metode
PLS-DA untuk mengetahui pengaruh dari imbalanced data. Dari hasil penelitian
sebelumnya, PLS-DA memiliki akurasi tertinggi menggunakan Data II sebesar
94.21%. Hasil yang diperoleh dari metode SVM menggunakan Data II memiliki
akurasi sebesar 95.34%, dan hasil terbaik dimiliki oleh metode SVM
menggunakan Data III yang menghasilkan akurasi sebesar 95.70%. Dari hasil
yang didapatkan dapat dilihat penggunaan Data III hasil data balancing memiliki
akurasi yang tertinggi dengan model SVM menggunakan RBF kernel.
Implementasi Sistem
Tahap implementasi sistem menghasilkan program yang dapat memprediksi
komposisi jamu yang baru.Tampilan dan tahapan dalam penggunaan sistem ini
dapat dilihat pada Lampiran 3.

Pembahasan
Percobaan 1
Dilihat dari hasil training 5-fold cross validation, akurasi terbaik didapat
dari model SVM dengan menggunakan RBF kernel. RBF kernel selalu
menghasilkan akurasi tertinggi pada setiap jenis data. Hal ini menunjukkan bahwa
daerah setiap kelas dari data yang digunakan membentuk wilayah yang lebih
cocok dipisahkan dan dipetakan dengan Radial Basis Function (RBF). Dilihat dari
bentuk fungsinya RBF cocok digunakan dalam masalah estimasi fungsi nonlinear. Salah satu keuntungan dari RBF terletak pada penerapannya di hampir
semua dimensi (fleksibilitas). Keuntungan lainnya adalah akurasi yang tinggi dan
konvergensi cepat untuk mendapatkan fungsi sasaran dalam banyak kasus ketika
penyelesaiannya dalam bentuk dimensi data yang sangat padat (Buhmann 2010).
Dilihat dari perbandingan hasil akurasi metode yang dilakukan oleh Afendi
et al. (2012) menggunakan PLS-DA tanpa melakukan data cleaning, metode
SVM memiliki nilai akurasi sedikit lebih rendah. Tingkat akurasi PLS-DA untuk
data ini sebesar 71.6% sedangkan SVM sebesar 71%. Sedangkan untuk data yang
telah direduksi, metode SVM memiliki tingkat akurasi yang lebih tinggi. Tingkat
akurasi PLS-DA sebesar 94.21%, sedangkan metode SVM memiliki nilai akurasi
sebesar 95.34%.
Peningkatan tingkat akurasi pada SVM ini dikarenakan data yang digunakan
telah diproses untuk mendukung hasil prediksi yang lebih baik untuk metode
PLS-DA dengan membuang beberapa jamu dan tanaman yang dianggap tidak
begitu signifikan. Pembuangan data ini dilakukan dengan proses simplifikasi jamu
dengan cara pembuangan data jamu yang hanya mengarah ke satu khasiat dan
diikuti dengan simplifikasi tanaman jamu dengan cara pembuangan jumlah
tanaman yang tidak begitu signifikan dalam penentuan khasiat jamu. Proses data

13
cleaning ini telah dilakukan pada penelitian oleh Afendi et al. (2012) dan tidak
diulangi pada penelitian ini sehingga data yang digunakan sama. Dari hasil
penggunaan data tersebut, dapat dikatakan bahwa SVM memiliki akurasi yang
lebih baik pada penerapan data cleaning terhadap data yang tidak signifikan.
Percobaan 2
Pada penelitian ini masalah imbalanced data yang menyebabkan proses
pelatihan data dengan SVM kurang optimal diatasi dengan melakukan teknik
undersampling dan oversampling. Hasil yang diperoleh dari pelatihan data
menunjukkan bahwa Data III memiliki nilai akurasi yang lebih tinggi dari data
lainnya. Hal ini menggambarkan pengaruh imbalanced data yang dapat
mengurangi hasil dari akurasi data.
Dilihat dari perbandingan hasil akurasi metode penelitian yang dilakukan
oleh Afendi et al. (2012) menggunakan PLS-DA dan metode SVM dengan
imbalanced data, metode SVM dengan jumlah data yang sudah seimbang
memiliki nilai akurasi yang lebih tinggi. Jadi, dari percobaan ini telah dihasilkan
model terbaik yang dicapai dengan melakukan undersampling dan oversampling
dari data yang sudah melalui data cleaning. Tujuan dari prosedur ini ialah untuk
mengatasi efek dari imbalanced data dari data sebelumnya.
Pengujian Prediksi Sistem
Untuk mengetahui hasil prediksi, sistem yang dibuat telah dicoba untuk
memprediksi 50 jenis formula jamu baru yang dapat dilihat pada Lampiran 4.
Model yang digunakan dalam memprediksi formula jamu adalah model yang
dihasilkan dengan RBF kernel. Hasil dari prediksi ini dapat dilihat pada Lampiran
4. Setiap formula jamu yang digunakan memiliki komposisi yang terdiri atas 4
jenis tanaman. Prediksi dilakukan terhadap 3 jenis model, yaitu model yang
dihasilkan dengan menggunakan data latih Data I, Data II, dan Data III. Hasil
prediksi ini diharapkan dapat menjadi pembanding antar model klasifikasi SVM
yang telah dibentuk oleh masing-masing data. Penyebaran kelas hasil prediksi
dapat dilihat pada Gambar 11. Hasil prediksi masih menampilkan hasil yang
beragam untuk setiap model. Model yang dihasilkan dari data latih Data I
menghasilkan hasil prediksi yang dominan pada khasiat GST, Data II dominan
pada khasiat MSC, sedangkan Data III dominan pada khasiat RSP. Penyebaran
dan gambaran irisan hasil prediksi setiap data dapat dilihat pada Gambar 12. Dari
hasil yang ditunjukkan oleh Gambar 10 belum terlihat adanya irisan yang
menghasilkan nilai prediksi yang sama dari semua jenis data. Hasil prediksi yang
diperoleh menghasilkan jumlah data sebesar 30% dari jumlah data yang memiliki
hasil prediksi yang sama antara Data I dengan Data II dan 14% antara Data II
dengan Data III. Hal ini menggambarkan kedekatan bentuk model antara Data I
dengan Data II dan Data II dengan Data III.
Tidak adanya irisan yang sama antara ketiga model data tersebut
menunjukkan bahwa data yang digunakan belum menunjukkan konsistensi pada
setiap model data dalam melakukan prediksi dan masih perlu diuji lebih lanjut.
Oleh sebab itu, pengujian sistem ini adalah upaya untuk memunculkan kandidatkandidat formula jamu baru yang dapat membantu peneliti untuk memilih
kandidat formula jamu untuk diuji secara in-vivo dan in-vitro untuk dibandingkan
dengan hasil prediksi dari setiap model SVM. Setelah sistem dapat dibandingkan

14
dengan pengujian tersebut, model yang terbaik untuk memprediksi formula jamu
yang baru diharapkan dapat diketahui.
45
Data II

35
Banyaknya

41

Data I

40

34

Data III

30

25

25
20
15

10 9

10
5

5

2

3

URI

DOA

2

1

11

3

43

6

0
DMB

GST FML MSC
Khasiat Jamu

PIN

RSP

Gambar 11 Penyebaran data jamu baru hasil prediksi

Data I

Data II

70%

30%
56%
0%
0%

14%
%
86%

Data III
Gambar 12 Ilustrasi pengelompokan data hasil
prediksi sistem dengan diagram
irisan

WND

15

SIMPULAN DAN SARAN
Simpulan
Penelitian ini berhasil membandingkan akurasi sistem klasifikasi khasiat
jamu antara metode SVM dengan PLS-DA. Akurasi metode SVM lebih rendah
dibandingkan dengan metode PLS-DA pada data yang belum direduksi, yaitu
sebesar 71%, tetapi memiliki akurasi yang lebih tinggi pada data yang telah
direduksi, yaitu sebesar 95.34%. Dari hasil tersebut dapat disimpulkan bahwa
metode SVM memberikan kinerja yang lebih baik dari metode PLS-DA pada data
yang telah melalui data cleaning. Terkait dengan masalah imbalanced data,
proses undersampling dan oversampling yang dilakukan mampu meningkatkan
akurasi. Dari hasil tersebut, model SVM yang terbaik dapat diperoleh dari
penerapan data cleaning dan penggunaan data pelatihan yang seimbang.
Penelitian ini juga telah berhasil mengimplementasikan sistem klasifikasi
jamu sederhana dengan metode SVM yang dapat digunakan untuk memprediksi
kandidat-kandidat formula jamu baru. Kandidat yang dihasilkan dari sistem
klasifikasi ini dapat membantu peneliti untuk memilih kandidat formula jamu
yang akan diuji dalam tahap selanjutnya, yaitu uji in vivo dan in vitro.

Saran
Saran untuk penelitian selanjutnya adalah:
1 mencoba penelitian dengan data jamu yang lebih representatif dengan
komposisi berupa persentase formula setiap tanaman
2 menerapkan metode lain untuk menangani masalah imbalanced data pada
metode SVM terhadap data jamu yang digunakan seperti metode SMOTE atau
menerapkan teknik Weighted-SVM agar menghasilkan hasil yang lebih baik
3 menggunakan metode lain untuk mencari nilai akurasi klasifikasi dan prediksi
yang lebih akurat
4 melakukan pengujian in vivo dan in vitro untuk data komposisi jamu baru
untuk mengetahui akurasi prediksi dari setiap model.

DAFTAR PUSTAKA
Adam LS, Navindra PS, Mary LH, Catherine C, David H. 2006. Analysis of the
interactions of botanical extract combinations againts the viability of prostate
cancer cell lines. Evid Based Complement Alternat Med. 3(1): 117-124.
Afendi FM, Darusman LK, Hirai A, Amin MA, Takahashi H, Nakamura K,
Kanaya S. 2010. System biology approach for elucidating the relationship
between Indonesia herbal plants and the efficacy of jamu. Di dalam: Fan W,
Hsu W, Webb GI, Liu B, Zhang C, Gunopulos D, Wu X, editor. 2010 IEEE
International Conference on Data Mining Workshops; 2010 Des 14; Sydney,
Australia. Sydney (AU): Conference Publishing Services.

16
Afendi FM, Darusman LK, Morita AH, Altaf-Ul-Amin M, Takahashi H,
Nakamura K, Tanaka K, Kanaya S. 2012. Efficacy prediction of jamu
formulations by PLS modeling. Curr Comput Aided Drug Des. 9(1):46-59.
PubMed PMID: 23106776.
Akbani R, Kwek S, Japkowicz N. 2004. Applying support vector machines to
imbalanced datasets. Di dalam: Jaime G, Siekmann J, editor. Machine
Learning: ECML; 2004 Sept 20-24; Pisa, Italia. Berlin (DL): Springer-Verlag
Berlin Heidelberg.
Beers SJ. c2001. Jamu the Ancient Indonesian Art of Herbal Healing. Singapore
(SG): Periplus Editions (HK) Ltd.
Boswell D. 2002. Introduction to Support Vector Machine [Internet]. [diacu 2013
Mar 19]. Tersedia dari: http://www.work.caltech.edu/~boswell/IntroTo
SVM.pdf
Buhmann M. 2010. Radial basis function. Scholarpedia, 5(5):9837.
doi:10.4249/scholarpedia.9837.
Byun H, Lee SW. 2003. A survey on pattern recognition application of support
vector machines. Int J Patt Recogn Artif Intell. 17(3):459-486.
Cortes C, Vapnik V. 1995. Support-vector networks. Machine Learning.
20(3):273-297.
Hsu CW, Chang CC, Lin CJ. 2010. A Practical Guide to Support Vector Machine
[Internet].
[diacu
2012
Des
1].
Tersedia
dari
:
http://www.cs.sfu.ca/people/Faculty/teaching/726/spring11/svmguide.pdf
Kusuma WA, Akiyama Y. 2011. Metagenome fragment binning based on
characterization vectors. Di dalam: Proceedings of 2011 International
Conference on Bioinformatics and Biomedical Technology; 2011 Mar 25-27;
Sanya, China. hlm 50-54.
Mahady GB. 2001. Global harmonization of herbal health claim. J Nutr. 131:
1120S-1123S.

17
Lampiran 1 Daftar tanaman jamu yang paling signifikan berdasarkan kelasnya

18
Lampiran 1 lanjutan

(Sumber : Afendi FM, 2012. Statistical Model of Plants Function in Jamu
Medicine, NAIST)

19
Lampiran 2 Ilustrasi proses penambahan dan pengurangan data
1

proses penambahan data

Ilustrasi data awal yang masih memiliki jumlah data kurang dari jumlah rata-rata
(contoh: 10 data)
Kode
Jamu
J001
J002
J003
J004
J005
J006
J007
J008

Jumlah
Tanaman
1
1
1
2
2
3
3
4

*keterangan

P001
1
0
0
1
0
1
1
1

P002 P003
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0

P004

P005

P006

...

P231

0
1
0
1
1
0
1
1

0
0
0
0
0
0
0
0

0
0
0
0
0
1
0
1

...
...
...
...
...
...
...
...

0
0
1
0
1
1
1
1

= tanaman yang signifikan di kelasnya

Penambahan data dilakukan dengan pertimbangan jumlah tanaman yang
digunakan dalam formula dan tanaman yang digunakan merupakan tanaman yang
diambil dari kelompok tanaman yang signifikan di kelasnya serta tidak
menggunakan data yang berulang
Kode
Jamu
J001
J002
J003
xxxx
J004
J005
xxxx
J006
J007
J008

Jumlah
Tanaman
1
1
1
1
2
2
2
3
3
4

*keterangan

P001
1
0
0
0
1
0
1
1
1
1

P002 P003
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0

P004

P005

P006

...

P231

0
1
0
0
1
1
0
0
1
1

0
0
0
0
0
0
0
0
0
0

0
0
0
1
0
0
0
1
0
1

...
...
...

0
0
1
0
0
1
1
1
1
1

...
...
...
...
...

= tanaman yang signifikan di kelasnya
xxxx = data jamu baru yang ditambahkan ke dalam data set

20
Lampiran 2 lanjutan
2

proses pengurangan data

Ilustrasi data awal yang masih memiliki jumlah data lebih dari jumlah rata-rata
yang diinginkan (contoh: 10 data).
Kode
Jumlah
Jamu Tanaman
J001
1
J002
1
J003
1
J004
1
J005
1
J006
1
J007
2
J008
2
J009
2
J010
2
J011
2
J012
3
J013
3
J014
3
J015
3
J016
3
J017
3
J018
4
J019
4
*keterangan

P001
1
0
1
0
0
0
1
0
1
0
1
1
1
1
0
1
1
1
1

P002 P003

P004

0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
0
0
1
1
0
0
0
0
0
0
0
0
0
0
1
0
1
0
1
0
0
0
0
1
0
1
1
0
0
1
0
0
1
= data yang berulang

P005

P006

...

P231

0
0
0
0
0
0
0
0
0
1
0
0
0
1
0
0
0
0
0

0
0
0
0
1
0
0
0
0
0
1
1
0
0
1
0
0
1
1

...
...
...
...
...
...
...
...
...
...

0
0
0
1
0
1
0
1
0
0
0
1
1
0
1
1
0
1
1

...
...
...
...
...
...
...
...

Langkah awal melakukan pengurangan data dengan penghapusan data yang
berulang (redudansi data)
Kode
Jamu
J001
J002
J004
J005
J007
J008
J010
J011
J012
J013
J014
J015

Jumlah
Tanaman
1
1
1
1
2
2
2
2
3
3
3
3

P001
1
0
0
0
1
0
0
1
1
1
1
0

P002 P003
0
0
0
0
0
0
1
0
0
0
0
1

0
0
0
0
0
0
0
0
0
0
1
0

P004

P005

P006

...

P231

0
1
0
0
1
1
0
0
0
1
0
0

0
0
0
0
0
0
1
0
0
0
1
0

0
0
0
1
0
0
0
1
1
0
0
1

...
...
...
...
...
...
...

0
0
1
0
0
1
0
0
1
1
0
1

...
...
...
...

21
Lampiran 2 lanjutan
J017
J018
*keterangan

3
4

1
0
1
1
0
0
1
0
0
1
0
1
= data berlebih pada jumlah tanaman tertentu

...
...

0
1

Setelah penghapusan data yang masih berulang, penghapusan dilakukan pada data
dengan pertimbangan pemerataan jumlah tanaman yang dipakai jika data masih
melebihi nilai rata-rata.
Kode
Jamu
J001
J004
J005
J007
J008
J010
J012
J015
J017
J018

Jumlah
Tanaman
1
1
1
2
2
2
3
3
3
4

P001
1
0
0
1
0
0
1
0
1
1

P002 P003
0
0
0
0
0
1
0
1
0
0

0
0
0
0
0
0
0
0
1
0

P004

P005

P006

...

P231

0
0
0
1
1
0
0
0
1
1

0
0
0
0
0
1
0
0
0
0

0
0
1
0
0
0
1
1
0
1

...
...
...
...
...
...
...
...
...
...

0
1
0
0
1
0
1
1
0
1

22
Lampiran 3 Langkah dan tampilan penggunaan aplikasi
1

pemilihan model SVM yang diinginkan.

2

pemilihan dari tanaman untuk formula jamu baru

3

verifikasi formula jamu

23
Lampiran 3 lanjutan
4

melakukan prediksi dan menampilkan hasilnya

24
Lampiran 4 Hasil prediksi komposisi jamu baru
Tanaman

No.

3

8

Jb0008

Illicium verum

Helicteres isora

9

Jb0009

Eriobotrya
japonica

10

Jb0010

Sida rhombifolia

11

Jb0011

Schisandra
chinensis

Pistacia
lentiscus
Spatholobus
suberectus
Crataegus
pinnatifida

12

Jb0012

Curcuma longa

Piper nigrum

Aloe vera

13

Jb0013

Apium graveolens

Santalum album

14

Jb0014

Aloe vera

Oryza sativa

Jb0001

2

Jb0002

3

Jb0003
Jb0004

Tamarindus
indica
Piper
retrofractum

2

Languas
galanga
Helicteres
isora
Syzygium
cumini
Eclipta
prostrata
Cola
acuminata
Cinchona
succirubra
Quercus
lusitanica
Notopterygium
incisum
Mentha
arvensis
Canangium
odoratum
Phellodendron
chinense

1

Mentha piperita
Gaultheria
punctata
Zanthoxylum
acanthopodium

5

Jb0005

6

Jb0006

Borreria hispida

7

Jb0007

Hydrocotyle
asiatica

Curcuma longa
Terminalia
bellirica
Melaleuca
alternifolia
Panax ginseng
Commiphora
myrrha
Terminalia
bellirica
Syzygium cumini

Lavandula
angustifolia
Punica
granatum

15

Jb0015

Nigella sativa

16

Jb0016

Thymus vulgaris

17

Jb0017

Typhonium
flagelliforme

Piper nigrum

18

Jb0018

Psidium guajava

Curcuma longa

Melaleuca
leucadendra
Kaempferia
pandurata

Zingiber
officinale
Dioscorea
opposite

Myristica
fragrans
Syzygium
aromaticum
Curcuma
xanthorrhiza
Garcinia
atroviridis
Coriandrum
sativum
Anacardium
occidentale

19

Jb0019

20

Jb0020

21

Jb0021

22

Hasil
dari
Model
Data
II
(2748
data
jamu)

Hasil
dari
Model
Data III
(2745
data
jamu,
balance)

5

5

8

6

6

8

7

7

8

6

6

8

6

6

8

5

5

8

5

5

8

4

8

8

4

8

8

6

6

8

5

5

8

5

5

8

9

9

8

9

9

8

4

8

8

5

5

9

Plantago major

6

6

8

Languas galanga

4

5

5

4

6

6

4

6

8

4

6

8

4

6

9

4

6

8

1

6

9

5

6

8

4

5

8

4

9

9

Languas galanga

1

6

8

Aquilaria
sinensis

4

6

8

Jamu
1

4

Hasil
dari
Model
Data I
(3138
data
jamu)

Jb0022

Theae sinensis
Mentha piperita

Zingiber
officinale
Trifolium
pratense
Foeniculum
vulgare
Panax ginseng
Foeniculum
vulgare
Alpinia
galanga
Hydrocotyle
asiatica
Phaleria
papuana
Melaleuca
leucadendra
Psidium
guajava
Phaleria
papuana
Orthosiphon
stamineus
Tamarindus
indica

23

Jb0023

24

Jb0024

25

Jb0025

Curcuma longa

Piper nigrum

26

Jb0026

Psidium guajava

Curcuma longa

27

Jb0027

Tamarindus
indica

Cassia alata

28

Jb0028

Psidium guajava

Caesalpinia
sappan

Phaleria
papuana
Orthosiphon
stamineus

29

Jb0029

Coriandrum
sativum

Morinda
citrifolia

Syzygium
aromaticum

Carica papaya

4

Piper betle
Notopterygium
incisum
Zingiber
officinale
Commiphora
myrrha
Panax
pseudoginseng
Solanum
verbacifolium
Messua ferrea
Echinacea
purpurea
Wolfiporia
extensa
Ocimum sanctum
Parameria
laevigata
Tamarindus
indica
Canangium
odoratum
Theobroma
cacao
Glycyrrhiza
uralensis
Coriandrum
sativum

Curcuma
xanthorrhiza
Hibiscus
sabdariffa
Curcuma longa
Anacardium
occidentale
Garcinia
atroviridis
Morinda
citrifolia
Melaleuca
leucadendra
Garcinia
atroviridis
Cymbopogon
nardus

25
Lampiran 4 lanjutan
30

Jb0030

31

Jb0031

32

Jb0032

33

Jb0033

34

Jb0034

35

Jb0035

36

Jb0036

37

Jb0037

38

Jb0038

Guazuma
ulmifolia
Amomum
compactum
Syzygium
aromaticum
Amomum
compactum
Amomum
compactum
Orthosiphon
stamineus
Guazuma
ulmifolia
Canangium
odoratum

Melaleuca
leucadendra
Aloe vera
Guazuma
ulmifolia
Orthosiphon
stamineus
Melaleuca
leucadendra

Orthosiphon
stamineus
Morinda
citrifolia
Melaleuca
leucadendra
Phaleria
papuana
Languas
galanga
Morinda
citrifolia

Merremia
mammosa
Tamarindus
indica
Cassia alata

2

6

8

4

6

8

2

6

8

4

6

8

4

6

8

4

6

8

2

6

8

5

6

8

Cinchona
succirubra

Aloe vera

Piper betle

Curcuma
xanthorrhiza

Zanthoxylum
acanthopodium
Andrographis
paniculata
Syzygium
aromaticum
Phaleria
papuana
Melaleuca
leucadendra

Mentha piperita

Theae sinensis

Daucus carota

Psidium guajava

4

6

8

Orthosiphon
stamineus
Curcuma
xanthorrhiza

Cassia alata

4

6

9

Psidium guajava

4

6

8

9

6

8

4

6

9

Curcuma longa

4

5

5

Zanthoxylum
acanthopodium

5

6

8

Theae sinensis

4

6

8

Curcuma longa

39

Jb0039

40

Jb0040

41

Jb0041

Aloe vera

42

Jb0042

Psidium guajava

43

Jb0043

Kaempferia
pandurata

Hydrocotyle
asiatica
Syzygium
aromaticum
Phaleria
papuana
Canangium
odoratum
Curcuma
xanthorrhiza

44

Jb0044

Phaleria papuana

Piper betle

45

Jb0045

Tamarindus
indica

Phaleria
papuana

Melaleuca
leucadendra
Zingiber
officinale
Mentha
piperita
Mentha
piperita
Melaleuca
leucadendra
Curcuma
xanthorrhiza
Mentha
piperita

46

Jb0046

Piper betle

Psidium guajava

Piper nigrum

Mentha piperita

5

6

8

47

Jb0047

Phaleria papuana

Mentha piperita

Theae sinensis

Daucus carota

4

6

8

48

Jb0048

Curcuma
xanthorrhiza

Syzygium
aromaticum

Morinda
citrifolia

4

6

8

49

Jb0049

Aloe vera

Mentha piperita

Zingiber
officinale
Merremia
mammosa

Psidium guajava

9

6

8

Tamarindus
indica

4

6

8

50

Jb0050

Psidium guajava

Mentha piperita

Theae sinensis

Merremia
mammosa
Hibiscus
sabdariffa

keterangan indeks prediksi
1 = urinary related problems (URI)
2 = disorder of apetite (DOA)
3 = disorder of mood and behavior (DMB)
4 = gastrointestinal disorders (GST)
5 = female reproductive organ problems (FML)
6 = muskuloskeletal and connective tissue disorders (MSC)
7 = pain and inflammation (PIN)
8 = respiratory disease (RSP)
9 = wounds and skin infections (WND)

26

RIWAYAT HIDUP
Penulis dilahirkan di Lampung Selatan pada tanggal 15 April 1991 dari
pasangan Yuyus Ruslan dan Tati Mulyati. Penulis adalah putra pertama dari dua
bersaudara. Tahun 2009 penulis lulus dari SMA Negeri 5 Bogor dan pada tahun
yang sama penulis lulus seleksi masuk Institut Pertanian Bogor (IPB) melalui
Undangan Seleksi Masuk IPB dan diterima di Departemen Ilmu Komputer,
Fakultas Matematika dan Ilmu Pengetahuan Alam.
Selama mengikuti perkuliahan, penulis aktif menjadi asisten praktikum
Algoritme dan Bahasa Pemrograman pada tahun ajaran 2011/2012 dan
2012/2013, asisten praktikum Basis Data pada tahun ajaran 2011/2012 dan
2012/2013, asisten praktikum Struktur Data pada tahun ajaran 2011/2012, asisten
praktikum Bahasa Pemrograman pada tahun ajaran 2012/2013, dan asisten
praktikum Sistem Pakar pada tahun ajaran 2012/2013. Penulis juga aktif mengajar
mata kuliah Pengantar Matematika, Landasan Matematika, Kalkulus, Kalkulus II,
dan Matematika Diskret di bimbingan belajar Katalis. Kegiatan lain penulis
adalah sebagai assistant sound engineer di salah satu perusahaan entertainment
AAC Indonesia. Pada bulan Juli-Agustus 2012 penulis melaksanakan Praktik
Kerja Lapang di PT. Praisindo Teknologi dan membantu dalam pengembangan
user interface framework untuk aplikasi portofolio management. Penulis juga
mandapatkan peringkat juara ke-2 dalam perlombaan aplikasi Rock Star Dev 2013
kategori New Rock Star Dev bersama tim AppSynthesis pada tahun 2013.