Eksplorasi Metode Klasifikasi Pada Data Biner

RINGKASAN
DIAN RARASSANTI. Eksplorasi Metode Klasifikasi pada Data Biner. Di bawah bimbingan
ERFIANI dan BAGUS SARTONO.
Banyak metode yang dapat diterapkan dalam proses pengklasifikasian suatu data, terlebih lagi
jika data yang dimiliki adalah yang bersifat kuantitatif. Akan tetapi dalam aplikasinya data yang
dipergunakan tidak selamanya bersifat kuantitatif, banyak pula penelitian yang dilakukan memakai
data kualitatif. Salah satu jenis data kualitatif yang sering dijumpai di lapangan dan perlu untuk
dianalisis adalah data biner. Metode-metode pengklasifikasian yang dapat dipergunakan terhadap
data biner masih seringkali menimbulkan berbagai pertanyaan mengenai metode yang cocok
dipakai untuk mengklasifikasikannya. Adapun dasar pengklasifikasian suatu data terbagi menjadi
dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Berdasarkan hal
tersebut, penelitian ini bertujuan untuk mengeksplorasi metode klasifikasi pada data biner dengan
menggunakan data tanaman obat berdasarkan khasiat-khasiat yang dimilikinya.
Hasil klasifikasi yang memberikan hasil terbaik adalah metode Average Linkage within the
New Group dengan ukuran kesamaan Sokal & Sneath 5, yaitu membagi data tanaman obat
berdasarkan khasiatnya menjadi 6 gerombol. Hal ini sesuai dengan hasil klasifikasi pada analisis
asosiasi yang menunjukkan hasil yang serupa. Selain itu, analisis ini pun cenderung membentuk
klasifikasi tanaman yang sesuai dengan kandungan fitokimia pada tanaman obat tersebut.

i


EKSPLORASI METODE KLASIFIKASI PADA DATA
BINER

DIAN RARASSANTI
G14103017

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2007

RINGKASAN
DIAN RARASSANTI. Eksplorasi Metode Klasifikasi pada Data Biner. Di bawah bimbingan
ERFIANI dan BAGUS SARTONO.
Banyak metode yang dapat diterapkan dalam proses pengklasifikasian suatu data, terlebih lagi
jika data yang dimiliki adalah yang bersifat kuantitatif. Akan tetapi dalam aplikasinya data yang
dipergunakan tidak selamanya bersifat kuantitatif, banyak pula penelitian yang dilakukan memakai
data kualitatif. Salah satu jenis data kualitatif yang sering dijumpai di lapangan dan perlu untuk
dianalisis adalah data biner. Metode-metode pengklasifikasian yang dapat dipergunakan terhadap
data biner masih seringkali menimbulkan berbagai pertanyaan mengenai metode yang cocok

dipakai untuk mengklasifikasikannya. Adapun dasar pengklasifikasian suatu data terbagi menjadi
dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Berdasarkan hal
tersebut, penelitian ini bertujuan untuk mengeksplorasi metode klasifikasi pada data biner dengan
menggunakan data tanaman obat berdasarkan khasiat-khasiat yang dimilikinya.
Hasil klasifikasi yang memberikan hasil terbaik adalah metode Average Linkage within the
New Group dengan ukuran kesamaan Sokal & Sneath 5, yaitu membagi data tanaman obat
berdasarkan khasiatnya menjadi 6 gerombol. Hal ini sesuai dengan hasil klasifikasi pada analisis
asosiasi yang menunjukkan hasil yang serupa. Selain itu, analisis ini pun cenderung membentuk
klasifikasi tanaman yang sesuai dengan kandungan fitokimia pada tanaman obat tersebut.

i

EKSPLORASI METODE KLASIFIKASI PADA DATA BINER

DIAN RARASSANTI

Skripsi
sebagai salah satu syarat memperoleh gelar Sarjana Sains
pada Departemen Statistika
Fakultas Matematika dan Pengetahuan Alam

Institut Pertanian Bogor

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2007
ii

RIWAYAT HIDUP
Penulis dilahirkan di Bantul pada tanggal 26 Mei 1985 sebagai anak pertama dari dua
bersaudara, anak dari pasangan Slamet Wiranto dan Sumi Awaliati.
Pada tahun 2003 penulis menyelesaikan pendidikan menengah lanjutan atas di SMU Negeri 5
Bogor sedangkan pada tahun yang sama pula diterima di Departemen Statistika Fakultas
Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor melalui Undangan Seleksi
Masuk IPB (USMI).
Selama mengikuti perkuliahan, penulis ikut serta dalam kegiatan Himpro Gamma Sigma Beta
(GSB) periode 2003/2004 sebagai staf Departemen Kewirausahaan dan periode 2004/2005 sebagai
staf Departemen Eksternal, Keluarga Mahasiswa Muslim Statistika (KAMMUS) periode
2004/2005 sebagai bendahara, dan Decision Centre periode 2006/2007 sebagai sekretaris serta
mengikuti kegiatan internal lainnya pula. Penulis juga mengikuti kegiatan Praktek Lapang di PT.

Capricorn MARS Indotama pada bulan Februari-April 2007.

iv

KATA PENGANTAR
Alhamdulillahirabbil’alamin, segala puji dan syukur dipanjatkan kehadirat Allah SWT atas
segala hidayah, nikmat, dan karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini.
Shalawat serta salam semoga selalu tercurahkan kepada Rasulullah SAW, keluarga, sahabat dan
umatnya hingga akhir zaman.
Karya ilmiah ini berjudul “Eksplorasi Metode Klasifikasi pada Data Biner”. Dalam penelitian
ini dilakukan eksplorasi terhadap data tanaman obat yang diklasifikasikan berdasarkan khasiatnya.
Dari eksplorasi tersebut didapatkan pengklasifikasian tanaman obat menjadi enam klasifikasi. Hal
ini diduga sesuai dengan kandungan fitokimia pada tanaman obat yang berhubungan dengan
khasiat yang dapat disembuhkan tanaman obat tersebut.
Terima kasih penulis sampaikan kepada berbagai pihak yang telah membantu dalam
penyelesaian karya ilmiah ini, yaitu kepada :
1. Ibu Dr. Ir. Erfiani, M.S dan Bapak Bagus Sartono, S.Si, M.Si terima kasih atas segala
bimbingan, saran dan kritik sehingga karya ilmiah ini dapat diselesaikan.
2. Bapak, Ibu, dan dèk Rista yang aku sayangi atas do’a, semangat dan kasih sayang yang
tak pernah berhenti mengalir.

3. Segenap staf pengajar di Departemen Statistika FMIPA IPB terima kasih atas pengajaran
yang diberikan sehingga penulis dapat menyelesaikan studi dan karya ilmiah ini.
4. Seluruh staf pegawai Departemen Statistika FMIPA IPB: bu Markonah, bu Sulis, bu
Dedeh, bang Sudin, mang Dur, mang Herman, pak Ian, bu Aat dan pak Edi yang selalu
setia membantu segala keperluan yang menyangkut penyelesaian karya ilmiah ini.
5. Teman-teman seperjuangan di Statistika 40, terimakasih atas segala kekompakan dan
kerjasama yang sudah diberikan selama empat tahun ini. Terlebih lagi Ema (atas
tumpangan kost-nya selama beberapa bulan terakhir ini), Lala dan Bayu (atas berbagai
bentuk bantuan yang telah diberikan), Ari dan kang masnya, Muti, Daus (teman
seperjuanganku), Riko (atas CD-nya), mas Den (atas semua saran yang sudah diberikan),
Essy, Rina, Edo, dkk, Anggoro dan seluruh teman-temanku tercinta, terima kasih bantuan
dan dukungannya.
6. Mbak Dani’ dan keluarga besarku, mbak Fera, Hurry, the 48’ers, Azzahra crew, juga
Halimuners.
7. Semua kakak kelas 39, 38, 37 dan adik-adik Statistika angkatan 41, 42, dan 43.
8. Semua pihak yang telah memberikan dukungan kepada penulis yang tidak dapat
disebutkan satu per satu.
Penulis menyadari bahwa masih banyak kekurangan dalam karya ilmiah ini. Semoga karya
ilmiah ini dapat bermanfaat.


Bogor, September 2007
Penulis

v

DAFTAR ISI
Halaman
DAFTAR TABEL ........................................................................................................................ vii
DAFTAR GAMBAR ................................................................................................................... vii
DAFTAR LAMPIRAN ................................................................................................................ viii
PENDAHULUAN
Latar Belakang ......................................................................................................................
Tujuan ....................................................................................................................................

1
1

TINJAUAN PUSTAKA
Data biner ..............................................................................................................................
Klasifikasi .............................................................................................................................

Analisis gerombol .................................................................................................................
Analisis asosiasi ....................................................................................................................

1
1
1
3

BAHAN DAN METODE
Bahan .....................................................................................................................................
Metode ...................................................................................................................................

3
3

HASIL DAN PEMBAHASAN
Analisis gerombol .................................................................................................................
Analisis asosiasi ....................................................................................................................
Eksplorasi hasil analisis gerombol dengan analisis asosiasi ................................................


4
4
6

KESIMPULAN ............................................................................................................................

6

DAFTAR PUSTAKA ..................................................................................................................

7

LAMPIRAN .................................................................................................................................

8

vi

DAFTAR TABEL
Halaman

1.

Tabel kontingensi data biner ................................................................................................. 2

2.

Aturan tunggal dari aturan asosiatif ...................................................................................... 5

3.

Klasifikasi dari analisis asosiatif .......................................................................................... 5

DAFTAR GAMBAR
Halaman
1.

Grafik asosiasi (Association Graph) .................................................................................... 5

vii


DAFTAR LAMPIRAN
Halaman

1.

Data tanaman obat berdasarkan khasiat yang dimilikinya .................................................... 8

2.

Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran
jarak Fourfoul Point ............................................................................................................... 11

3.

Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran
jarak Dice ............................................................................................................................... 11

4.

Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran

jarak Jaccard ........................................................................................................................... 12

5.

Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan
ukuran jarak Ochiai ................................................................................................................. 12

6.

Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran
jarak Sokal & Sneath 2 .......................................................................................................... 13

7.

Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran
jarak Sokal & Sneath 5 .......................................................................................................... 13

8.

Hasil klasifikasi analisis gerombol dengan metode perbaikan jarak Complete Linkage ..... 14

9.

Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New
Group dengan ukuran jarak Dice ........................................................................................... 15

10. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New
Group dengan ukuran jarak Ochiai ....................................................................................... 15
11. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New
Group dengan ukuran jarak Sokal & Sneath 5 ...................................................................... 16
12. Dendogram dari kombinasi metode perbaikan jarak Centroid dengan ukuran jarak
Ochiai ..................................................................................................................................... 16
13. Hasil klasifikasi analisis gerombol dengan metode perbaikan jarak Average Linkage
within the New Group dan metode Centroid ......................................................................... 17
14. Tabel aturan asosiasi (association rule) ................................................................................ 18

viii

PENDAHULUAN

TINJAUAN PUSTAKA

Latar Belakang

Data biner

Metode klasifikasi merupakan salah satu
metode analisis yang diperlukan untuk
mengelompokkan objek atau item berdasarkan
kemiripan
sifat
yang
dimilikinya.
Pengklasifikasian dapat diterapkan pada
banyak bidang ilmu pengetahuan, salah satunya
pada bidang yang berkaitan dengan ilmu alam.
Jenis data dalam bidang ilmu alam yang
dianalisis terkadang tidak hanya berupa data
yang bersifat kuantitatif, tetapi juga banyak
ditemukan data yang bersifat kualitatif. Salah
satu jenis data kualitatif yang sering dijumpai
di lapangan dan perlu untuk dianalisis adalah
data biner yang hanya memiliki dua
kemungkinan nilai yaitu sukses dan gagal.
Metode klasifikasi dibidang ilmu alam
sangat
banyak,
akan
tetapi
dasar
pengklasifikasian suatu data hanya terbagi
menjadi dua, yaitu analisis gerombol dan
analisis asosiasi (Ludwig & Reynold 1988).
Analisis gerombol merupakan salah satu
analisis peubah ganda yang bertujuan
mengelompokkan objek berpeubah banyak ke
dalam
kelompok-kelompok
berdasarkan
kemiripan yang dimiliki objek tersebut.
Analisis asosiasi adalah teknik untuk
menemukan aturan asosiasi antara suatu
kombinasi item atau objek. Analisis asosiasi
menjadi terkenal karena aplikasinya untuk
menganalisa isi keranjang belanja di pasar
swalayan, sehingga analisis asosiasi juga sering
disebut dengan istilah basket analysis.
Berdasarkan hal tersebut, dapat diketahui
bahwa kegunaan kedua metode di atas adalah
untuk pengklasifikasian data, dan karena dalam
proses klasifikasi data banyak ditemukan kasus
data
biner,
maka
penelitian
ini
mengetengahkan hasil eksplorasi metode
klasifikasi
pada
data
biner
dengan
menggunakan analisis gerombol dan analisis
asosiasi. Data yang digunakan adalah data
biner tanaman obat berdasarkan khasiat yang
dikandungnya.

Data biner adalah data observasi dimana
nilainya hanya memiliki dua kemungkinan.
Sebagai contoh bahwa pada komponen
peralatan elektronik mungkin bisa rusak atau
tidak, atau pada tanaman obat berkhasiat atau
tidak dalam mengatasi suatu gangguan
kesehatan. Jika pada individu ke-i observasi
tersebut dapat dinyatakan oleh sebuah variabel
acak Yi, maka pada data biner Yi dapat
dinyatakan dengan kode 1 untuk data yang
‘sukses’ dan kode 0 untuk data yang ‘gagal’
(Cox 1970).

Tujuan
Tujuan penelitian ini adalah untuk:
1. Mengeksplorasi metode klasifikasi data
biner dengan analisis asosiasi pada data
tanaman obat.
2. Mengklasifikasikan
tanaman
obat
berdasarkan
khasiatnya
dengan
menggunakan analisis gerombol.

Klasifikasi
Klasifikasi menurut Kamus Besar Bahasa
Indonesia (KBBI) memiliki arti penyusunan
bersistem dalam kelompok atau golongan
menurut kaidah atau standar yang ditetapkan.
Sedangkan pengklasifikasian berarti proses,
cara, atau perbuatan mengklasifikasikan.
Dalam statistika, klasifikasi merupakan salah
satu metode analisis yang dapat diartikan
proses pengelompokan objek berdasarkan
kemiripan masing-masing variabel yang
dimilikinya (Ludwig & Reynold 1988).
Analisis Gerombol
Analisis gerombol adalah salah satu analisis
peubah ganda yang prinsip utamanya adalah
mengklasifikasikan individu yang relatif sama
atau seragam ke dalam suatu gerombol yang
didasarkan pada ukuran kedekatan (ukuran
jarak atau ukuran kesamaan). Objek yang
terletak dalam suatu gerombol memiliki
kemiripan sifat yang lebih besar dibandingkan
dengan objek yang terletak dalam gerombol
lain (Johnson & Wichern 2002). Dan
diharapkan keragaman unit-unit pengamatan
dalam satu gerombol lebih homogen daripada
keragaman antar gerombol.
Pada jenis data biner, ukuran jarak atau
kesamaan dinyatakan dalam bentuk koefisien
kesamaan (similarities coefficient) yang
nilainya berkisar antara 0 sampai 1. Berbeda
dengan konsep jarak untuk data pengukuran,
untuk data biner nilai koefisien yang diperoleh
bukan menunjukkan kuantitas jarak, tetapi
menunjukkan kedekatan dua variabel atau
objek. Nilai yang mendekati satu menunjukkan
kedua objek tersebut sangat mirip, sedangkan
nilai
koefisien
yang
mendekati
nol

1

ad − bc

menunjukkan bahwa kedua objek tersebut tidak
mirip.
Koefisien kesamaan diperoleh dengan
terlebih dahulu dibuat tabel kontingensi 2x2
untuk setiap pasang objek ke-i dan ke-j, seperti
pada Tabel 1 berikut ini (Digby & Kempton
1987):

3.

Tabel 1. Tabel Kontingensi Data Biner
Individu ke-i
Total
1
0
Individu
1
a
b
a+b
ke-j
0
c
d
c+d
Total
a+c
b+d
p
dengan:
p
= total jumlah objek
a
= frekuensi kedua individu bernilai 1
b, c = frekuensi satu objek bernilai 1 dan
objek lainnya bernilai 0
d
= frekuensi kedua individu bernilai 0

4.

Terdapat dua teknik penggerombolan pada
analisis gerombol, yaitu teknik hirarki dan
nonhirarki. Teknik berhirarki digunakan jika
jumlah gerombol yang terbentuk tidak
diketahui sebelumnya, sedangkan teknik
nonhirarki digunakan apabila jumlah gerombol
yang terbentuk sudah ditetapkan dari awal
(Johnson & Wichern 2002). Metode gerombol
berhirarki
dapat
digunakan
untuk
menggerombolkan data biner. Di dalam metode
tersebut terdapat beberapa metode perbaikan
jarak, seperti metode pautan tunggal (Single
Linkage), pautan lengkap (Complete Linkage),
pautan rataan dalam kelompok (Average
Linkage within the New Group), pautan rataan
antar kelompok (Average Linkage between
Merged Group), Centroid, Median, dan Ward
(Johnson & Wichern 2002). Adapun beberapa
tipe ukuran kesamaan yang digunakan pada
data biner, yaitu seperti:
1. Simple Matching
Ukuran
kesamaan
bertipe
ini
merupakan perbandingan objek yang
sepadan terhadap jumlah keseluruhan
objek yang ada. Ukuran ini memberikan
bobot yang sama baik pada objek yang
sepadan maupun yang tidak sepadan.
Rumusnya diformulasikan sebagai berikut:
a+d
p
2. Fourfoul Point
Ukuran kedekatan ini adalah salah satu
bentuk
ukuran
kesamaan
yang
diperuntukan pada data biner. Adapun
formulasinya adalah sebagai berikut:

5.

6.

(a + b )(a + c )(b + d )(c + d )
Jaccard
Nilai koefisien Jaccard adalah suatu
indeks dimana nilai d (0-0 sepadan) tidak
dimasukkan dalam perhitungan. Ukuran
ini pun memberikan bobot yang sama baik
pada objek yang sepadan maupun yang
tidak sepadan. Persamaannya sebagai
berikut:
a
a+b+c
Dice
Ukuran Dice dikenal juga dengan nama
ukuran
Czekanowski
atau
ukuran
Serensen. Ukuran ini sama dengan ukuran
persamaan Jaccard dimana nilai d tidak
dimasukkan dalam perhitungan, akan
tetapi nilai a (1-1 sepadan) diberikan bobot
ganda. Formulasinya adalah:
2a
2a + b + c
Sokal & Sneath 2
Ukuran Sokal & Sneath 2 memberikan
bobot yang sama pada objek yang tidak
sepadan. Masing-masing objek yang tidak
sepadan tersebut diberi bobot ganda.
Namun nilai d tidak dimasukkan dalam
perhitungan. Berikut formulasinya:
a
a + 2(b + c )
Ochiai
Ukuran kesamaan ini diperkenalkan
ditahun 1957. Rumus ukuran kesamaan
Ochiai diformulasikan sebagai berikut:
a
(a + b )(a + c )

7.

8.

Sokal & Sneath 4
Ukuran kesamaan ini didasari oleh
peluang bersyarat dari satu nilai a,
sedangkan nilai objek yang lain dinyatakan
sebagai predictor yang dihitung dari nilai
rata-ratanya. Adapun rumusnya adalah
sebagai berikut:
a (a + b ) + a (a + c ) + d (b + d ) + d (c + d )
4
Sokal & Sneath 5
Ukuran kesamaan ini bebas dari
pengkodean objek-objeknya. Adapun
rumusnya adalah sebagai berikut:
ad

(a + b )(a + c )(b + d )(c + d )

2

Wijayati (2002) menyatakan bahwa metode
klasifikasi terbaik adalah metode perbaikan
jarak Average Linkage within the New Group
dengan simple matching sebagai kombinasi
ukuran kesamaannya.
Analisis Asosiasi
Analisis asosiasi dikenal sebagai salah satu
teknik eksplorasi data yang menjadi langkah
awal dari berbagai teknik eksplorasi data
lainnya. Dasar analisis asosiasi adalah
menemukan aturan asosiasi antar kombinasi
item atau objek. Contoh aturan asosiasi dari
analisa pembelian di suatu pasar swalayan
adalah
bisa
diketahui
berapa
besar
kemungkinan seorang pelanggan membeli roti
bersamaan dengan susu. Dengan pengetahuan
tersebut pemilik pasar swalayan dapat
mengatur
penempatan
barangnya
atau
merancang kampanye pemasaran dengan
memakai kupon diskon untuk kombinasi
barang tertentu (Bajcsy 2002).
Oleh karena itu, analisis asosiasi dapat
didefinisikan sebagai suatu proses untuk
menemukan semua aturan asosiasi yang
memenuhi syarat minimum untuk support
(minimum support) dan syarat minimum untuk
confidence (minimum confidence). Penting
tidaknya suatu aturan asosiasi dapat diketahui
dengan dua ukuran, yaitu support (nilai
penunjang) yang berarti persentase kombinasi
item dalam database dan confidence (nilai
kepastian) yang berarti kuatnya hubungan antar
item dalam aturan asosiasi.
Aturan asosiasi biasanya dinyatakan dalam
bentuk :
{X1} {X2}
(supp = a%, conf = b%)
dengan X1 merupakan item di sebelah kiri
aturan asosiasi (left hand of rule) sedangkan X2
merupakan item di sebelah kanan aturan
asosiasi (right hand of rule). Hal ini berarti b%
dari transaksi di database yang memuat item X1
juga memuat item X2. Sedangkan a% dari
seluruh transaksi yang ada di database memuat
kedua item itu.
Dua tahap dalam mendapatkan aturan
asosiasi (Tan, Steinbach, & Kumar 2004):
• Analisa pola frekuensi tinggi
Tahap ini mencari kombinasi item yang
memenuhi syarat minimum dari nilai
support dalam database.
• Pembentukan aturan asosiasi
Setelah semua pola frekuensi tinggi
ditemukan, barulah dicari aturan asosiasi
yang memenuhi syarat minimum untuk

confidence
dengan
menghitung
confidence aturan asosiasi Xi Xj dimana
i ≠ j dari support pola frekuensi tinggi Xi
dan Xj dengan menggunakan rumus
berikut :
supp X i ∪ X j
Conf (Xi Xj)=
supp( X i )

(

)

BAHAN DAN METODE
Bahan
Data yang digunakan dalam penelitian ini
adalah data tanaman obat-obatan tradisional
berdasarkan khasiat yang terkandung di
dalamnya, yaitu terdiri dari 29 jenis tanaman
obat dengan 95 macam gangguan kesehatan
yang dapat diatasinya. Dari data yang
tercantum, nilai 1 menunjukkan bahwa
tanaman obat ke-i berkhasiat mengatasi
berbagai
gangguan
kesehatan
tertentu,
sedangkan nilai 0 menunjukkan tanaman obat
ke-i tidak berkhasiat mengatasi gangguan
kesehatan tersebut. Data ini diambil dari PSB
(Pusat Studi Biofarmaka) dan dilengkapi
informasi dari pustaka “Atlas Tumbuhan Obat
Indonesia” (Dalimartha 1999, 2000, 2003).
Data yang digunakan terlampir pada Lampiran
1.
Perangkat lunak yang digunakan dalam
penelitian ini adalah SPSS 13.0 for Windows,
Microsoft Excel, dan SAS Enterprise Miner
4.3.
Metode
Dari data tersebut, dilakukan analisis data
dengan menggunakan metode klasifikasi yaitu
analisis gerombol dan analisis asosiasi.
Tahapan analisis data yang dilakukan dalam
penelitian ini adalah:
1. Analisis data menggunakan analisis
gerombol berhirarki dilakukan dengan
menggunakan bantuan perangkat lunak
SPSS 13.0 for Windows. Pada penelitian ini
dikombinasikan 7 metode perbaikan jarak
dan 20 ukuran kesamaan. Tujuh metode
perbaikan jarak yang digunakan adalah:
Single Linkage
Complete Linkage
Average Linkage within the New
Group
Average Linkage between Merged
Group
Centroid
Median
Ward
3

Sementara itu, 20 ukuran kesamaan yang
digunakan adalah:
Simple matching
Fourfoul point
Jaccard
Dice
Sokal & Sneath 1
Sokal & Sneath 2
Sokal & Sneath 3
Sokal & Sneath 4
Sokal & Sneath 5
Ochiai
Russel & Rao
Rogers & Tanimoto
Kulczynski 1
Kulczynski 2
Hamann
Goodman & Kruskal Lambda
Anderberg’s D
Yule’s Y
Yule’s Q
Dispersion
Dengan demikian terdapat 140 kombinasi
metode perbaikan jarak dan ukuran jarak
yang dilakukan.
2. Analisis data dengan analisis asosiasi,
dilakukan pada jumlah level (jumlah item
pada aturan asosiasi yang terbentuk)
sebanyak 2, hal ini disebabkan karena selain
untuk melihat hubungan keeratan antar item
di dalamnya, juga akan mempermudah
penginterpretasian klasifikasi data tanaman
obat berdasarkan khasiatnya tersebut.
Adapun tahapannya adalah sebagai berikut:
• Analisa pola frekuensi tinggi
Mencari kombinasi item yang memenuhi
syarat minimum dari nilai support dalam
database, nilai minimum support yang
digunakan adalah sebesar 4%.
• Pembentukan aturan asosiasi
Langkah selanjutnya adalah mencari
aturan asosiasi yang memenuhi syarat
minimum untuk confidence, nilai
minimum confidence yang digunakan
adalah sebesar 50%.
Sehingga secara keseluruhan analisis ini
dapat diinterpretasikan bahwa 50% dari
transaksi di database yang memuat item di
sebelah kiri aturan asosiasi (left hand of
rule) juga memuat item di sebelah kanan
aturan asosiasi (right hand of rule).
Sedangkan 4% dari seluruh transaksi yang
ada di database memuat kedua item tersebut.
Analisis ini dianalisis menggunakan
perangkat lunak SAS Enterprise Miner 4.3
dan dibantu dengan SPSS 13.0 for Windows.
3. Eksplorasi hasil kedua metode tersebut.

Menginterpretasikan hasil klasifikasi
yang diperoleh kedua metode kemudian
mencari klasifikasi yang sesuai dan serupa
dari kedua metode tersebut.

HASIL DAN PEMBAHASAN
Analisis Gerombol
Metode perbaikan jarak Complete Linkage
dikombinasikan dengan ukuran kesamaan
Ochiai,
dan
Sokal
&
Sneath
5
mengklasifikasikan tanaman obat menjadi 5
gerombol. Sedangkan apabila dikombinasikan
dengan ukuran kesamaan Fourfoul Point, Dice,
Jaccard,
dan
Sokal
&
Sneath
2
mengklasifikasikan tanaman obat menjadi 6
gerombol. Dendrogram kombinasi antara
metode perbaikan jarak Complete Linkage
dapat dilihat pada Lampiran 2-7. Hasil
penggerombolan oleh metode Complete
Linkage dilampirkan pada Lampiran 8.
Hasil pengklasifikasian pada metode
Average Linkage within the New Group yang
dikombinasikan dengan ukuran kesamaan Dice
membentuk 5 gerombol. Sedangkan jika
dikombinasikan dengan ukuran kesamaan
Ochiai dan Sokal & Sneath 5 membentuk 6
gerombol (Lampiran 9-11).
Centroid
Metode
perbaikan
jarak
membentuk 6 gerombol jika dikombinasikan
dengan ukuran kesamaan Ochiai. Dengan
dendrogram terlampir pada Lampiran 12.
Daftar klasifikasi untuk metode perbaikan jarak
Average Linkage within the New Group dan
Centroid terlampir pada Lampiran 13.
Metode perbaikan jarak yang digunakan
pada penelitian ini adalah Average Linkage
within the New Group, Complete Linkage, dan
Centroid. Sedangkan ukuran kesamaannya
adalah Sokal & Sneath 4, Sokal & Sneath 5,
Ochiai, Sokal & Sneath 2, Fourfoul point,
Jaccard, Dice. Jumlah gerombol yang terbentuk
pada penelitian ini sesuai dengan banyaknya
kelompok kandungan fitokimia dari tanaman
obat, yaitu sebanyak 5 atau 6 gerombol. Hal ini
mengidentifikasikan bahwa metode yang
dipergunakan
untuk
melakukan
penggerombolan tanaman obat pada penelitian
ini sudah tepat digunakan.
Analisis Asosiasi
Langkah pertama analisis ini adalah analisa
nilai frekuensi tinggi atau mencari nilai support
dari masing-masing kombinasi rule yang
terbentuk. Pada penelitian ini nilai support
minimumnya ditetapkan sebesar 4% sehingga

4

nilai support yang kurang dari nilai 4%
dihilangkan. Total kombinasi item yang
terbentuk oleh analisis asosiasi pada level 2
adalah sebanyak 102 aturan (rule) asosiasi,
akan tetapi setelah proses analisa frekuensi
tinggi dilakukan, aturan yang memiliki
persentase di atas 4% adalah sebanyak 77
aturan asosiasi yang terlihat pada Gambar 1.

Setelah itu, tanaman-tanaman obat yang lain
diklasifikasikan sesuai dengan right hand of
rule yang terlebih dahulu diurutkan nilai
support
dan
nilai
confidence
yang
menyertainya. Adapun hasil pengklasifikasian
yang terbentuk pada analisis asosiasi ini dapat
dilihat pada Tabel 3.

Keji beling
Buah makasar
Kumis kucing
Daun ungu
Temuputih
Rumput mutiara
Jahe
Tempuyung
Sambung nyawa
Lidah buaya
Temulawak
Kunyit
Cakar ayam
Picisan
Iler
Saga
Sambiloto
Sidaguri
Meniran
Pare
Daun sendok
Jombang

Gambar 1. Grafik Asosiasi (Association Graph)
Dari Gambar 1, terlihat bahwa nilai
confidence ditandai oleh perbedaan bentuk,
sedangkan nilai support ditandai oleh
perbedaan warna, seperti pada sambiloto dan
daun sendok terlihat memiliki asosiasi yang
cukup besar, yaitu dengan support berada di
antara 7.5-8.82% dan confidence di antara 5054.46%, begitu pun tanaman obat yang lainnya.
Nilai ini dapat dilihat secara lebih jelas pada
tabel asosiasi Lampiran 14.
Setelah itu, tahap selanjutnya adalah
mencari aturan asosiasi yang memenuhi syarat
minimum untuk confidence, nilai minimum
confidence yang digunakan adalah sebesar
50%. Dari 77 aturan asosiasi yang terbentuk
tadi kemudian diurutkan berdasarkan left hand
of
rule
untuk
mendapatkan
dasar
pengklasifikasiannya dengan cara mencari
aturan asosiasi yang unik atau tunggal yang
hanya memiliki satu aturan asosiasi saja.
Aturan yang ditemukan adalah:
Tabel 2. Aturan Tunggal dari Aturan Asosiasi
right hand of rule
gerombol left hand of rule
1
temuputih
daun dewa
2
jombang
daun sendok
3
rumput mutiara
pegagan
4
jahe
adas
5
pare
mengkudu

Tabel 3. Klasifikasi dari Analisis Asosiasi
Gerombol
Tanaman obat
1
daun ungu
daun dewa
temuputih
2
kumis kucing
keji beling
daun sendok
jombang
meniran
sambung nyawa
sambiloto
3
buah makasar
saga
cakar ayam
pegagan
picisan
rumput mutiara
4
kunyit
jahe
sidaguri
adas
tempuyung
5
temulawak
mengkudu
pare
5

Gerombol

6

Tanaman obat
iler
lidah buaya
mimba
lengkuas
mahkota dewa

Klasifikasi pertama terbentuk karena daun
ungu dan temuputih memiliki asosiasi yang
kuat yaitu daun dewa sebagai penghubung di
antara keduanya, selain itu asosiasi daun ungu
dan daun dewa memiliki nilai confidence
terbesar dari nilai asosiasi yang lainnya, yaitu
sebesar 85.71% yang berarti bahwa 85.71%
dari khasiat tanaman obat yang memuat daun
ungu juga memuat daun dewa, sedangkan
6.32% dari khasiat tanaman obat memuat
keduanya.
Pada klasifikasi kedua, daun sendok dan
jombang sebagian besar memiliki anggota
tanaman obat yang sama, sehingga daun
sendok, jombang, dan tanaman obat yang sama
di dalamnya dapat dijadikan satu klasifikasi.
Kumis kucing juga dapat dijadikan satu, karena
tanaman obat yang berasosiasi terhadap kumis
kucing sama seperti pada daun sendok dan
jombang, sedangkan oleh karena keji beling
memiliki asosiasi yang kuat dengan daun
sendok dan jombang, maka tanaman ini pun
dapat dimasukkan ke dalam klasifikasi kedua.
Sedangkan klasifikasi ketiga terbentuk
dikarenakan memiliki asosiasi yang kuat, hal
ini terlihat dari nilai confidence & support yang
dimiliki anggota tanaman obat di dalamnya
relatif cukup besar antara satu dengan yang
lainnya. Terlihat pada saga dan pegagan yang
memiliki nilai confidence terbesar ke empat
dari keseluruhan aturan asosiasi.
Klasifikasi keempat terbentuk karena ada
kesamaan asosiasi nilai confidence dan support
antara kunyit dan jahe, yaitu dihubungkan
dengan tanaman adas. Tempuyung dapat
dimasukkan ke dalam klasifikasi ini karena
memiliki nilai confidence dan support yang
cukup kuat dengan adas dan sidaguri.
Pada klasifikasi kelima, masing-masing item
di dalamnya saling memiliki keterkaitan,
sehingga tujuh tanaman obat ini dapat
dimasukan dalam satu gerombol. Seperti dapat
dilihat bahwa mimba hanya berasosiasi dengan
iler, sedangkan antara iler dengan lengkuas,
lidah buaya, dan juga pare dapat
diklasifikasikan ke dalamnya karena memiliki
nilai support dan confidence yang paling besar.
Klasifikasi keenam terbentuk karena pada
77 aturan asosiasi yang dihasilkan tidak
muncul sama sekali tanaman mahkota dewa,

sehingga mahkota dewa dapat membentuk
klasifikasi sendiri.
Eksplorasi Hasil Analisis Gerombol dengan
Analisis Asosiasi
Klasifikasi dengan menggunakan analisis
gerombol yang dihasilkan pada penelitian ini
sesuai dengan Wijayati (2002), yang
menyebutkan bahwa metode perbaikan jarak
terbaik adalah Average Linkage within the New
Group. Sedangkan ukuran kesamaan yang
memberikan klasifikasi yang memuaskan
adalah Sokal & Sneath 5, hal ini didukung oleh
hasil pengklasifikasian analisis asosiasi yang
menunjukkan hasil yang sama pula.
Klasifikasi
yang
dihasilkan
dengan
menggunakan analisis asosiasi memiliki
kemiripan dengan hasil klasifikasi pada analisis
gerombol, yaitu pada kombinasi metode
perbaikan jarak Average Linkage within the
New Group dengan ukuran kesamaan Sokal &
Sneath 5. Sehingga dalam penelitian ini data
tanaman obat dapat diklasifikasikan ke dalam 6
gerombol dimana masing-masing gerombol
yang terbentuk diklasifikasikan berdasarkan
khasiat yang terkandung di dalam tanaman obat
tersebut. Penggerombolan ini pun sesuai
dengan kandungan senyawa fitokimia yang
cenderung dapat dibagi ke dalam 6 kelompok,
yaitu alkaloid, flavonoid, steroid, triterpenoid,
saponin dan tanin.

KESIMPULAN
Eksplorasi metode klasifikasi data biner
tanaman obat-obatan berdasarkan khasiatnya
dapat dilakukan dengan banyak metode. Akan
tetapi dasar dari metode pengklasifikasian
terbagi menjadi dua, yaitu analisis gerombol
dan analisis asosiasi (Ludwig & Reynold
1988). Analisis gerombol yang memberikan
hasil terbaik adalah metode Average Linkage
within the New Group dengan ukuran
kesamaan Sokal & Sneath 5, yaitu membagi
data tanaman obat berdasarkan khasiatnya
menjadi 6 gerombol. Hal ini sesuai dengan
hasil klasifikasi pada analisis asosiasi yang
menunjukkan hasil yang serupa. Selain itu,
analisis ini pun cenderung membentuk
klasifikasi tanaman yang sesuai dengan
kandungan fitokimia pada tanaman obat
tersebut.

6

DAFTAR PUSTAKA
Bajcsy, P. 2002. Introduction to Data Mining
[modul].
Cox, D. R. & Snell E. J. 1996. Analysis of
Binary Data. London: Chapman and Hall.
Dalimartha, S. 1999. Atlas Tumbuhan Obat
Indonesia. Jilid 1. Depok: Puspa Swara.
Dalimartha, S. 2000. Atlas Tumbuhan Obat
Indonesia. Jilid 2. Depok: Puspa Swara.
Dalimartha, S. 2003. Atlas Tumbuhan Obat
Indonesia. Jilid 3. Depok: Puspa Swara.
Digby, P. G. N & R. A. Kempton. 1987.
Multivariate Analysis of Ecological
Communities. New York: Chapman and
Hall.
Johnson, R. A. & Wichern, D. W. 2002.
Applied Multivariate Statistical Analysis.
Ed ke-5. New Jersey: Prentice Hall.
Kamus Besar Bahasa Indonesia. 1989.
Jakarta: Balai Pustaka.
Ludwig, J. A. & Reynold, J. F. 1988.
Statistical Ecology. Canada: J Wiley.
Tan, P.N, M. Steinbach, & V. Kumar. 2004.
Introduction to Data Mining [modul].
Wijayati, A. 2002. Evaluasi Konsep Jarak dan
Metode Penggerombolan untuk Data
Biner
[skripsi].
Bogor:
Fakultas
Matematika dan Ilmu Pengetahuan Alam,
Institut
Pertanian
Bogor.

7

LAMPIRAN

Lampiran 1. Data tanaman obat berdasarkan khasiat yang dimilikinya
NAMA TANAMAN

0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
1
1
0
0
0
0
1
0
0
0
0
1
0

0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
1
0
1
0
0
1
1
0
0
0
0
0
0

0
0
1
0
1
0
0
1
0
0
0
0
0
0
0
0
0
0
0
1
1
0
1
0
0
1
1
1
1
1
1

0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
1
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
1

0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
1
0
1
0
1
1
1
0
0
0
0
0
0

0
0
1
0
0
0
0
0
1
0
1
1
0
0
1
1
0
0
1
1
1
0
1
0
1
0
0
0
0
0
0

0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
1
0
0
0
0
1
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0

0
1
0
0
0
0
1
0
1
0
0
0
1
0
0
0
1
1
1
1
0
1
1
0
1
1
0
0
0
1
1

0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
0
0
0
1
1
0
0
0
0
1
1
1
0
1
1

0
0
0
1
0
0
0
0
0
0
0
1
0
0
1
0
0
1
1
1
0
0
0
0
0
1
1
0
0
0
0

0
0
0
0
0
0
0
0
1
0
0
0
0
1
0
0
0
1
1
1
0
0
1
0
1
1
0
0
0
1
0

1
0
0
0
0
0
1
0
0
1
0
0
0
0
1
1
0
1
0
0
0
0
0
0
0
0
1
1
1
1
0

0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0

0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
1
0
0
0
0
0
0
0
0
0
0
1
0
0
1

0
0
0
0
0
0
0
0
0
1
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
1
1
0
1
0
0
0
0
0
0
1
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
1
1
0
0
1
0
0
0
0
0
0
0
1

0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
1
0
0
0
1
1
1
1
0
1
0
1
0

Temuputih

0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0

Temulawak

0
0
0
0
0
0
0
1
1
1
0
0
1
0
1
1
0
1
1
1
1
0
1
1
0
1
1
1
1
1
1

Tempuyung

0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
1
0
0
0
0
1
0
1
0
0
1
0

Sidaguri
Sambung
Nyawa
Sambiloto
Saga
Rumput
M utiara
Picisan
Pegagan
Pare
Mimba
M eniran
M engkudu
M ahkota
Dewa

0
0
0
0
0
1
0
0
1
1
0
0
0
0
0
0
0
0
0
0
1
0
1
0
0
0
1
1
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
1
0
0
0
0
0
0
0
0

Lidah Buaya

Daun Dewa

0
0
0
0
0
0
1
0
1
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
1
0
0
1
0
1
0

Lengkuas
Kunyit
Kumis
Kucing
Keji Beling
Jombang
Jahe
Iler
Daun Ungu
Daun
Sendok

Cakar Ayam

Alzheimer
Amandel
Anemia
Arthritis
Asam Urat
Asites
Asma
Batu Empedu
Batuk
Batuk/Muntaber Darah
Bau Badan
Bau Mulut
Beri-Beri
Biang Keringat
Bisul
Bronchitis
Cacar
Cacingan
Demam
Diabetes Melitus
Diare
Difteri
Disentri
Flu
Gangg. Haid
Gangg.Pencernaan
Gangg.Penglihatan
Gangg. Sal.Kencing
Gastritis
Gigitan Binatang
Ginjal

Buah
Makasar
Adas

KHASIAT

0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
1
0
0
0

0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0

8

NAMA TANAMAN
Buah
Makasar

Cakar
Ayam

Daun Dewa

Daun
Sendok

Daun Ungu

Iler

Jahe

Jombang

Keji Beling

Kumis
Kucing

Kunyit

Lengkuas

Lidah
Buaya

Mahkota
Dewa

Mengkudu

Meniran

Mimba

Pare

Pegagan

Picisan

Rumput
Mutiara

Saga

Sambiloto

Sambung
Nyawa

Sidaguri

Tempuyung

Temulawak

Temuputih

Gondongan
Gonorhoe
Hamil Anggur
Hepatitis
Hepatoma
Herpes
Hernia
Hiperkolesterolemia
Hipertensi
Impotensi
Infeksi
Insomnia
Jerawat/Flek
Kanker
Kegemukan
Kejang
Kelenjar Getah Bening
Keputihan
Keracunan
Kesemutan
Ketombe
Kista
Kolik
Konstipasi
Kurang Nafsu Makan
Kusta
Leukimia
Luka Bakar
Malaria
Masuk Angin
Memar/Luka
Melancarkan Asi
Mimisan
Pertumbuhan Rambut

Adas

KHASIAT

0
0
0
1
0
0
1
0
1
0
0
1
0
0
0
0
0
0
1
0
0
1
0
0
1
0
0
0
0
1
1
1
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
1
0
0
0

0
0
0
1
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0

0
0
0
0
1
0
0
0
1
0
1
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
1
0
0
1
0
1
0

0
0
0
1
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
1
0
0
0
0
0
0
0
0
0

0
0
0
1
0
0
0
0
1
0
1
0
1
1
0
0
0
0
0
0
0
0
0
0
1
0
1
1
0
0
0
1
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
1
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
1
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
0
0
1
1
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
1
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
1
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
1
0
0
0
0
0
0
1
0
0
0

0
0
0
1
0
0
0
0
1
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
1
0
1
0
0
0
0
0
0
0
0
0
0
1
0
0
1
0
0
0
0
1

0
1
0
1
0
0
0
0
0
1
0
0
0
1
0
0
0
0
0
0
0
0
0
1
1
0
0
1
1
0
0
1
0
1

0
0
1
1
0
1
0
0
1
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
1

1
0
0
1
0
0
0
0
0
0
1
0
0
1
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0

1
0
0
1
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0

0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0

0
0
1
1
0
0
0
0
1
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
1
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
0
0
0

0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
0
0
0

0
0
0
1
0
0
0
1
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
1
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
1
0
9

NAMA TANAMAN

KHASIAT

Adas

Buah
Makasar

Cakar Ayam

Daun Dewa

Daun Sendok

Daun Ungu

Iler

Jahe

Jombang

Keji Beling

Kumis
Kucing

Kunyit

Lengkuas

Lidah Buaya

Mahkota
Dewa

Mengkudu

Meniran

Mimba

Pare

Pegagan

Picisan

Rumput
Mutiara

Saga

Sambiloto

Sambung
Nyawa

Sidaguri

Tempuyung

Temulawak

Temuputih

Mual/ Muntah
Nyeri Otot
Oedema
Patah Tulang
Pegal Linu
Pembengkakan Payudara
Penyakit Kulit
Penyakit Mata
Perdarahan
Perut Kembung
Pikun
Proteinuria
Radang
Radang Prostat
Rambut Rontok
Reumatik
Sakit Gigi/Gusi
Sakit Kepala
Sakit Limpa
Sakit Perut
Sakit Pinggang
Sakit Telinga
Sariawan
Selulit
Sirosis
TBC
Terkilir
Tumor
Usus Buntu
Wasir

1
0
0
0
0
0
0
0
0
1
0
1
0
0
0
1
1
0
0
1
0
1
1
0
0
0
0
0
0
0

0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0

0
0
0
1
0
0
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
0
1
0
0

0
0
0
1
0
1
1
0
1
0
0
0
1
0
0
1
1
0
0
0
0
0
0
0
0
1
0
1
0
1

0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1

0
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0

1
0
0
0
1
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1

0
0
1
0
0
1
1
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
1
0
0
0
1
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
0
0
0
1
0
0
0
0
0
0
0
0
1
0

0
0
0
0
1
0
1
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0

0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
1
1
0
0
0
0
0
0
0
0
0
0
0
1

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

1
0
0
1
0
0
1
0
0
0
0
0
1
0
0
1
1
0
1
1
1
0
1
0
0
0
0
0
0
0

0
1
1
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0

0
0
0
0
1
0
1
0
0
0
0
0
0
0
1
0
1
0
0
0
0
1
0
0
0
1
0
1
0
1

0
0
0
0
0
0
1
0
0
0
0
0
1
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
1

0
1
0
0
0
1
1
1
0
0
0
0
1
1
0
0
0
0
0
1
0
0
1
1
1
0
1
0
0
1

0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
1
0
0
1
0
0
1
0
0
1
0
0
0
0

0
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0

0
1
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
1
0
0
0
0
0
0
0

0
0
0
0
0
0
1
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
1
0
0

0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0

0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
0
0
0
1

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
0
1
1

0
0
0
1
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1

0
0
0
0
0
1
0
0
1
0
1
0
0
0
0
1
0
0
0
1
0
0
0
0
0
0
0
0
0
0

10

Lampiran 2. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran
jarak Fourfoul Point
Rescaled Distance Cluster Combine
C A S E
Label
ILER
PARE
LIDAH BUAYA
MIMBA
MENGKUDU
TEMULAWAK
KUMIS KUCING
MENIRAN
DAUN SENDOK
JOMBANG
KEJI BELING
RUMPUT MUTIARA
SAGA
PEGAGAN
BUAH MAKASAR
CAKAR AYAM
PICISAN
DAUN DEWA
DAUN UNGU
TEMUPUTIH
ADAS
JAHE
LENGKUAS
SIDAGURI
TEMPUYUNG
KUNYIT
SAMBILOTO
SAMBUNG NYAWA
MAHKOTA DEWA

Num
7
19
14
18
16
28
11
17
5
9
10
22
23
20
2
3
21
4
6
29
1
8
13
26
27
12
24
25
15

0
5
10
15
20
25
+---------+---------+---------+---------+---------+

Lampiran 3. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran
jarak Dice
Rescaled Distance Cluster Combine
C A S E
Label
DAUN SENDOK
JOMBANG
MENIRAN
PEGAGAN
MENGKUDU
PARE
LENGKUAS
DAUN DEWA
SAMBILOTO
MIMBA
RUMPUT MUTIARA
SAGA
BUAH MAKASAR
CAKAR AYAM
PICISAN
TEMUPUTIH
DAUN UNGU
ILER
LIDAH BUAYA
KEJI BELING
SIDAGURI
TEMPUYUNG
KUNYIT
KUMIS KUCING
SAMBUNG NYAWA
ADAS
JAHE
TEMULAWAK
MAHKOTA DEWA

Num
5
9
17
20
16
19
13
4
24
18
22
23
2
3
21
29
6
7
14
10
26
27
12
11
25
1
8
28
15

0
5
10
15
20
25
+---------+---------+---------+---------+---------+

Lampiran 4. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran
jarak Jaccard
Rescaled Distance Cluster Combine
C A S E
Label
DAUN SENDOK
JOMBANG
MENIRAN
PEGAGAN
MENGKUDU
PARE
LENGKUAS

Num
5
9
17
20
16
19
13

0
5
10
15
20
25
+---------+---------+---------+---------+---------+

11

DAUN DEWA
SAMBILOTO
MIMBA
RUMPUT MUTIARA
SAGA
BUAH MAKASAR
CAKAR AYAM
PICISAN
TEMUPUTIH
DAUN UNGU
ILER
LIDAH BUAYA
KEJI BELING
SIDAGURI
TEMPUYUNG
KUNYIT
KUMIS KUCING
SAMBUNG NYAWA
ADAS
JAHE
TEMULAWAK
MAHKOTA DEWA

4
24
18
22
23
2
3
21
29
6
7
14
10
26
27
12
11
25
1
8
28
15

Lampiran 5. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran
jarak Ochiai
Rescaled Distance Cluster Combine
C A S E
Label
DAUN SENDOK
JOMBANG
MENIRAN
PEGAGAN
SAMBILOTO
SIDAGURI
TEMPUYUNG
KUNYIT
KUMIS KUCING
SAMBUNG NYAWA
ADAS
JAHE
TEMULAWAK
DAUN DEWA
DAUN UNGU
LIDAH BUAYA
ILER
PARE
MENGKUDU
LENGKUAS
MIMBA
MAHKOTA DEWA
KEJI BELING
RUMPUT MUTIARA
SAGA
BUAH MAKASAR
CAKAR AYAM
PICISAN
TEMUPUTIH

Num
5
9
17
20
24
26
27
12
11
25
1
8
28
4
6
14
7
19
16
13
18
15
10
22
23
2
3
21
29

0
5
10
15
20
25
+---------+---------+---------+---------+---------+

Lampiran 6. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran
jarak Sokal & Sneath 2
Rescaled Distance Cluster Combine
C A S E
Label
DAUN SENDOK
JOMBANG
MENIRAN
PEGAGAN
MENGKUDU
PARE
LENGKUAS
DAUN DEWA
SAMBILOTO
MIMBA
RUMPUT MUTIARA
SAGA
BUAH MAKASAR
CAKAR AYAM
PICISAN
TEMUPUTIH
DAUN UNGU
ILER
LIDAH BUAYA
KEJI BELING
SIDAGURI
TEMPUYUNG
KUNYIT

Num
5
9
17
20
16
19
13
4
24
18
22
23
2
3
21
29
6
7
14
10
26
27
12

0
5
10
15
20
25
+---------+---------+---------+---------+---------+

12

KUMIS KUCING
SAMBUNG NYAWA
ADAS
JAHE
TEMULAWAK
MAHKOTA DEWA

11
25
1
8
28
15

Lampiran 7. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran
jarak Sokal & Sneath 5
Rescaled Distance Cluster Combine
C A S E
Label
DAUN SENDOK
MENIRAN
JOMBANG
SAMBILOTO
PEGAGAN
SIDAGURI
TEMPUYUNG
KUNYIT
KUMIS KUCING
SAMBUNG NYAWA
ADAS
JAHE
LENGKUAS
ILER
PARE
MENGKUDU
LIDAH BUAYA
TEMULAWAK
MIMBA
MAHKOTA DEWA
KEJI BELING
DAUN DEWA
DAUN UNGU
TEMUPUTIH
RUMPUT MUTIARA
SAGA
BUAH MAKASAR
CAKAR AYAM
PICISAN

Num
5
17
9
24
20
26
27
12
11
25
1
8
13
7
19
16
14
28
18
15
10
4
6
29
22
23
2
3
21

0
5
10
15
20
25
+---------+---------+---------+---------+---------+

Lampiran 8. Hasil klasifikasi analisis gerombol dengan metode perbaikan jarak Complete Linkage

Gerombol

Fourfoul Point

1

jombang
meniran
kumis kucing
daun sendok
keji beling

2

buah makasar
daun ungu
cakar ayam
picisan
daun dewa
temuputih

3

iler
lidah buaya
mimba
mengkudu
pare

Complete Linkage
Dice=Jaccard =
Ochiai
Sokal & Sneath 2
jombang
jombang
meniran
meniran
sambiloto
sambiloto
daun sendok
daun sendok
pegagan
pegagan
mengkudu
sidaguri
pare
tempuyung
lengkuas
kunyit
daun dewa
kumis kucing
mimba
sambung nyawa
rumput mutiara
saga
buah makasar
buah makasar
picisan
rumput mutiara
cakar ayam
cakar ayam
temuputih
picisan
saga
temuputih

iler
lidah buaya
keji beling
daun ungu

keji beling

Sokal & Sneath 5
jombang
meniran
sambiloto
daun sendok
pegagan
sidaguri
tempuyung
kunyit
kumis kucing
sambung nyawa

buah makasar
daun ungu
cakar ayam
picisan
daun dewa
temuputih
rumput mutiara
saga
keji beling

13

temulawak
sidaguri
tempuyung
kunyit
sambiloto
sambung nyawa
mahkota dewa
adas
jahe
lengkuas

4

5

6

rumput mutiara
saga
pegagan

sidaguri
tempuyung
kunyit
kumis kucing
sambung nyawa
adas
jahe
temulawak

mahkota dewa

-

adas
jahe
temulawak
daun dewa
daun ungu
lidah buaya
iler
pare
mengkudu
lengkuas
mimba
mahkota dewa

-

adas
jahe
lengkuas
iler
mengkudu
pare
lidah buaya
temulawak
mimba

mahkota dewa

Lampiran 9. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New
Group dengan ukuran jarak Dice
Rescaled Distance Cluster Combine
C A S E
Label
DAUN SENDOK
JOMBANG
MENIRAN
PEGAGAN
SAMBILOTO
DAUN DEWA
SAMBUNG NYAWA
MIMBA
KEJI BELING
RUMPUT MUTIARA
SAGA
BUAH MAKASAR
CAKAR AYAM
PICISAN
MAHKOTA DEWA
DAUN UNGU
ILER
LIDAH BUAYA
TEMULAWAK
MENGKUDU
PARE
ADAS
LENGKUAS
JAHE
SIDAGURI
TEMPUYUNG
KUNYIT
KUMIS KUCING
TEMUPUTIH

Num
5
9
17
20
24
4
25
18
10
22
23
2
3
21
15
6
7
14
28
16
19
1
13
8
26
27
12
11
29

0
5
10
15
20
25
+---------+---------+---------+---------+---------+

Lampiran 10. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New
Group dengan ukuran jarak Ochiai
Rescaled Distance Cluster Combine
C A S E
Label
DAUN SENDOK

Num
5

0
5
10
15
20
25
+---------+---------+---------+---------+---------+

14

JOMBANG
MENIRAN
PEGAGAN
SAMBILOTO
KUMIS KUCING
KEJI BELING
MAHKOTA DEWA
RUMPUT MUTIARA
SAGA
BUAH MAKASAR
CAKAR AYAM
PICISAN
DAUN DEWA
DAUN UNGU
LIDAH BUAYA
ILER
PARE
MENGKUDU
LENGKUAS
SAMBUNG NYAWA
MIMBA
TEMULAWAK
SIDAGURI
TEMPUYUNG
KUNYIT
ADAS
TEMUPUTIH
JAHE

9
17
20
24
11
10
15
22
23
2
3
21
4
6
14
7
19
16
13
25
18
28
26
27
12
1
29
8

Lampiran 11. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New
Group dengan ukuran jarak Sokal & Sneath 5
Rescaled Distance Cluster Combine
C A S E
Label
DAUN SENDOK
MENIRAN
JOMBANG
SAMBILOTO
KUMIS KUCING
SAMBUNG NYAWA
KEJI BELING
MAHKOTA DEWA
BUAH MAKASAR
CAKAR AYAM
PICISAN
RUMPUT MUTIARA
SAGA
PEGAGAN
SIDAGURI
TEMPUYUNG
KUNYIT
ADAS
JAHE
DAUN DEWA
DAUN UNGU
TEMUPUTIH
ILER
PARE
LIDAH BUAYA
MENGKUDU
LENGKUAS
MIMBA
TEMULAWAK

Num
5
17
9
24
11
25
10
15
2
3
21
22
23
20
26
27
12
1
8
4
6
29
7
19
14
16
13
18
28

0
5
10
15
20
25
+---------+---------+---------+---------+---------+

Lampiran 12. Dendogram dari kombinasi metode perbaikan jarak Centroid dengan ukuran jarak
Ochiai
Rescaled Distance Cluster Combine
C A S E
Label
DAUN SENDOK
JOMBANG
PEGAGAN
SAMBILOTO
KUMIS KUCING
MENIRAN
KEJI BELING
SIDAGURI
TEMPUYUNG
ADAS
MENGKUDU
KUNYIT
SAMBUNG NYAWA
JAHE
LENGKUAS
LIDAH BUAYA

Num
5
9
20
24
11
17
10
26
27
1
16
12
25
8
13
14

0
5
10
15
20
25
+---------+---------+---------+---------+---------+

15

TEMULAWAK
ILER
PARE
MIMBA
RUMPUT MUTIARA
SAGA
DAUN DEWA
DAUN UNGU
TEMUPUTIH
BUAH MAKASAR
CAKAR AYAM
PICISAN
MAHKOTA DEWA

28
7
19
18
22
23
4
6
29
2
3
21
15

Lampiran 13. Hasil klasifikasi analisis gerombol dengan metode perbaikan jarak Average Linkage
within the New Group dan metode Centroid
Gerombol
1

2

3

Average Linkage Within the New Group
Sokal &Sneath 5
Ochiai
Dice
daun sendok
daun sendok
daun sendok
meniran
meniran
meniran
sambiloto
sambiloto
sambiloto
jombang
jombang
jombang
sambung nyawa
pegagan
pegagan
kumis kucing
kumis kucing
sambung nyawa
keji beling
keji beling
keji beling
mimba
daun dewa
rumput mutiara
rumput muti