Penggunaan dua tahap metode dan dua tahap penggerombolan pada peubah campuran (studi kasus : tanaman obat)

PENGGUNAAN DUA TAHAP METODE DAN DUA TAHAP
PENGGEROMBOLAN PADA PEUBAH CAMPURAN
(Studi Kasus : Tanaman Obat)

REVI ROSDIANA

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Penggunaan Dua
Tahap Metode dan Dua Tahap Penggerombolan pada Peubah Campuran (Studi
Kasus : Tanaman Obat) adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi
mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada
Institut Pertanian Bogor.
Bogor, Agustus 2014

Revi Rosdiana
NIM G14100108

ABSTRAK
REVI ROSDIANA. Penggunaan Dua Tahap Metode dan Dua Tahap
Penggerombolan pada Peubah Campuran (Studi Kasus : Tanaman Obat).
Dibimbing oleh MUHAMMAD NUR AIDI dan INDAHWATI.
Dua Tahap metode atau TMCM (Two-Step Method for Clustering Mixed
Categorical and Numeric Data) merupakan alat analisis gerombol untuk data
dengan tipe peubah campuran yakni data yang mengandung tipe peubah kategorik
dan tipe peubah numerik. Pada penelitian ini Dua Tahap Metode akan
diaplikasikan pada data tanaman obat yang juga dibandingkan efektifitas
pemakaiannya dengan Dua Tahap Penggerombolan (TwoStep Cluster). Data
tanaman obat tersebut didapatkan dari website resmi Fakultas Farmasi Universitas
Airlangga mengenai Sistem Informasi Tanaman Obat. Tanaman obat yang
digunakan pada penelitian ini berjumlah 149 tanaman obat. Hasil penggerombolan

dengan Dua Tahap Metode menghasilkan 50 gerombol pada analisis HAC dan 3
gerombol dengan analisis K-Means sebagai hasil akhir. Gerombol 1 memiliki 5
tanaman obat, gerombol 2 memiliki 134 tanaman obat sedangkan gerombol 3
memiliki 10 tanaman obat. Hasil penggerombolan dengan Dua Tahap
Penggerombolan didapatkan 3 gerombol dengan 47 tanaman obat pada gerombol
1, 55 tanaman obat pada gerombol 2, dan sebanyak 47 tanaman obat pada
gerombol 3. Hasil pengukuran kebaikan penggerombolan dengan menggunakan
CTM didapatkan bahwa penggerombolan menggunakan Dua Tahap Metode lebih
baik dalam membentuk gerombol dibandingkan dengan Dua Tahap
Penggerombolan.
Kata kunci: Dua Tahap Metode, Dua Tahap Penggerombolan, CTM, HAC, KMeans

ABSTRACT
REVI ROSDIANA. Use of Two-Stage Method and Two-Stage Clustering In
Mixed Variables (Case Study: Medicinal Plants). Guided by MUHAMMAD NUR
AIDI and INDAHWATI.
Two-Stage Method or TMCM (Two-Step Method for Clustering Mixed
Categorical and Numeric Data) is a tool for clusters data analysis with variable
types of data that contain a mixture of the type of categorical variables and the
type of numeric variables. In this study, a Two-Stage Methods will be applied for

data medicinal plants are also compared the effectiveness of its use with TwoStage Clustering (TwoStep Cluster). The medicinal plant data obtained from the
official website of the Faculty of Pharmacy, Airlangga University Medicinal about
Plants Information System. Medicinal plants used in this study amounted to 149
medicinal plants. Results of the Two-Stage Method produce 50 clusters on the
HAC analysis and 3 clusters of K-Means analysis as the final result. Clusters 1
has 5 medicinal plants, clusters 2 has 134 medicinal plants while clusters 3 has 10
medicinal plants. Results of Two-Stage Clustering obtained 3 clusters with 47
medicinal plants in clusters 1, 55 medicinal plants in clusters 2, and as many as 47

medicinal plants in clusters 3. Results goodness measurement clustering using
CTM was found that using the Two-Stage Method better than Two-Stage
Clustering in form clusters.
Keywords: Two-Stage Method, Two-Stage Clustering, CTM, HAC, K-Means

PENGGUNAAN DUA TAHAP METODE DAN DUA TAHAP
PENGGEROMBOLAN PADA PEUBAH CAMPURAN
(Studi Kasus : Tanaman Obat)

REVI ROSDIANA


Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika
di Fakultas Matematika dan Ilmu Pengetahuan Alam IPB

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

Judul Skripsi : Penggunaan Dua Tahap Metode dan Dua Tahap Penggerombolan
Pada Peubah Campuran (Studi Kasus : Tanaman Obat).
Nama
: Revi Rosdiana
NIM
: G14100108

Disetujui oleh


Dr Ir Muhammad Nur Aidi, MS
Pembimbing I

Dr Ir Indahwati, MSi
Pembimbing II

Diketahui oleh

Dr Anang Kurnia, MSi
Ketua Departemen

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala
karena atas berkah dan hidayah-Nya lah, penulis bisa menyelesaikan tugas akhir
ini. Tak lupa solawat serta salam mudah-mudah selalu tercurah limpah kepada
Nabi besar semesta alam, Nabi Muhammad SAW. Pada penelitian ini penulis
mengangkat tema analisis gerombol dan terspesifikasi menjadi perbandingan
metode pada analisis gerombol.

Terima kasih penulis ucapkan kepada Bapak Dr Ir Muhammad Nur Aidi, MS
dan Ibu Dr Ir Indahwati, MSi selaku pembimbing. Di samping itu, penghargaan
penulis sampaikan kepada pengelola web dan jurusan Farmasi Universitas
Airlangga yang telah memberikan informasi data sehingga penulis dapat
melakukan penelitian ini. Ungkapan terima kasih juga disampaikan kepada ayah,
ibu, serta seluruh keluarga, atas dukungan moril dan materil.
Semoga karya ilmiah ini bermanfaat.

Bogor, Agustus 2014
Revi Rosdiana

DAFTAR ISI
DAFTAR TABEL

x

DAFTAR GAMBAR

x


DAFTAR LAMPIRAN

x

PENDAHULUAN

1

Latar Belakang

1

Perumusan Masalah

2

Tujuan Penelitian

2


Manfaat Penelitian

2

Ruang Lingkup Penelitian

2

TINJAUAN PUSTAKA

2

METODE

7

Bahan

7


Prosedur Analisis Data

8

HASIL DAN PEMBAHASAN
SIMPULAN DAN SARAN

9
15

Simpulan

15

Saran

16

DAFTAR PUSTAKA


16

LAMPIRAN

18

RIWAYAT HIDUP

28

DAFTAR TABEL
1
2
3
4
5

Data contoh
Hasil mengubah peubah kategorik dasar menjadi peubah numerik
Hasil pengubahan semua kategori dalam data menjadi angka

Sebaran keanggotaan gerombol
Karakteristik gerombol hasil penggerombolan dengan kedua metode
berdasarkan peubah kategorik dilihat dengan modus
6 Karakteristik gerombol hasil penggerombolan dengan kedua metode
berdasarkan peubah numerik dilihat dengan rataan
7 Simpangan baku masing-masing peubah untuk setiap gerombol

4
5
6
12
13
14
15

DAFTAR GAMBAR
1 Persentase per-kategori (a) peubah ujung daun (Apex folii) dan (b)
peubah pangkal daun (Basis folii)
2 Persentase per-kategori pada peubah (a) susunan tulang daun (Nervatio),
(b) warna daun atas, (c) tepi daun, dan (d) warna daun bawah
3 Persentase per-kategori pada peubah (a) permukaan daun, (b) daging
daun, dan (c) helaian daun

9
10
11

DAFTAR LAMPIRAN
1
2
3
4
5
6
7

Rincian peubah yang digunakan

Angka-angka untuk setiap kategori
Nilai BIC (Bayesian Information Criterion)
Anggota gerombol pada Dua Tahap Metode
Anggota gerombol pada Dua Tahap Penggerombolan
Selang kepercayaan setiap peubah pada gerombol Dua Tahap Metode
Selang kepercayaan setiap peubah pada gerombol Dua Tahap
Penggerombolan

17
18
21
21
22
23
25

PENDAHULUAN
Latar Belakang
Tanaman obat atau biofarmaka didefinisikan sebagai jenis tanaman yang
sebagian, seluruh tanaman dan atau eksudat tanaman tersebut digunakan sebagai
obat, bahan atau ramuan obat-obatan (www.bbpp-lembang.info). Mengenal
tanaman obat merupakan salah satu hal yang penting sehingga pemakaian obat
kimia serta efek sampingnya bisa dikurangi. Tanaman obat sangat beragam
jenisnya, sehingga untuk mempermudah mengenali tanaman-tanaman ini
diperlukan penggerombolan untuk mengetahui tanaman-tanaman obat yang
memiliki karakteristik yang sama.
Metode penggerombolan yang populer saat ini adalah metode
penggerombolan yang menggunakan peubah numerik saja atau kategorik saja.
Data yang digunakan pada umumnya memiliki tipe peubah campuran yaitu
numerik maupun kategorik. Apabila peubah yang digunakan adalah peubah
campuran, maka memerlukan strategi tersendiri. Ketika alat analisis gerombol
bagi salah satu tipe peubah digunakan pada peubah campuran, maka akan
terkendala pada penggunaan jarak yang mengukur kedekatan antar observasi.
Mengingat selama ini yang banyak berkembang adalah metode yang hanya
berfokus pada salah satu tipe peubah saja, maka diperlukan solusi baru analisis
gerombol untuk tipe peubah campuran yang akan dikaji pada penelitian ini. Salah
satu solusi untuk masalah-masalah tersebut adalah penggerombolan Dua Tahap
Metode atau TMCM (Two-Step Method for Clustering Mixed Categorical and
Numeric Data). Pada tahun 2010, Shih et al. menggunakan algoritma ini pada
penggerombolan data yang didapatkan dari National Indonesia Contraceptive
Prevalence Survey tahun 1987.
Penelitian tersebut tergolong penelitian yang menemukan metode baru pada
penggerombolan data dengan peubah campuran mengingat sebelumnya telah
dihasilkan metode penggerombolan untuk data dengan peubah campuran yaitu
dengan Dua Tahap Penggerombolan (TwoStep Cluster). Metode baru, dalam
aplikasinya diharapkan dapat mengurangi kesalahan pembentukan anggota
gerombolnya dari metode lama atau minimal harus sama dengan metode lama.
Perlu adanya evaluasi terhadap kedua metode tersebut untuk melihat keefektifan
keduanya dalam membentuk gerombol.
Kudsiati (2006) dalam penelitiannya, melakukan perbandingan keefektifan
Dua Tahap Penggerombolan dengan metode penggerombolan K-Rataan dengan
data berupa data hasil simulasi dan menyimpulkan bahwa Dua Tahap
Penggerombolan tidak berbeda nyata dengan metode K-Rataan dalam hal akurasi
sebaran ukuran gerombol asal serta salah klasifikasi. Pembandingan metode
penggerombolan untuk data dengan tipe peubah campuran juga dilakukan oleh
Yunianto (2011) membuktikan bahwa Dua Tahap Penggerombolan lebih baik
daripada penggerombolan Komponen Utama Nonlinier. Pada penelitian ini akan
dibandingkan penggerombolan dengan menggunakan Dua Tahap Metode atau
TMCM (Two-Step Method for Clustering Mixed Categorical and Numeric Data)
dan Dua Tahap Penggerombolan (TwoStep Cluster).

2
Perumusan Masalah
Berdasarkan latar belakang di atas, maka perlunya melakukan
penggerombolan tanaman obat yang mempunyai peubah kategorik dan numerik
dengan menggunakan Dua Tahap Metode dan Dua Tahap Penggerombolan agar
didapatkan gerombol yang baik.

Tujuan Penelitian
Tujuan penelitian ini adalah:
1. Mengaplikasikan Dua Tahap Metode atau TMCM (Two-Step Method for
Clustering Mixed Categorical and Numeric Data) dan Dua Tahap
Penggerombolan (TwoStep Cluster) untuk menggerombolkan tanaman obat
berdasarkan karakteristik daun dan syarat tumbuh agar bisa diketahui
tanaman obat yang memiliki karakteristik yang sama.
2. Mengukur kebaikan pembentukan gerombol dengan Dua Tahap Metode atau
TMCM (Two-Step Method for Clustering Mixed Categorical and Numeric
Data) dan Dua Tahap Penggerombolan (TwoStep Cluster) dalam
menggerombolkan data dengan tipe peubah campuran berdasarkan nilai CTM
(Clustering Tightness Measure).

Manfaat Penelitian
Hasil dari penelitian ini dapat dimanfaatkan pada bidang obat-obatan,
sehingga dapat dijadikan acuan dalam mengenal gerombol-gerombol tanaman
obat berdasarkan karakteristik daun dan syarat tumbuh. Selain itu, penelitian ini
juga memiliki manfaat untuk mengetahui metode penggerombolan yang efektif
digunakan pada data dengan peubah campuran.

Ruang Lingkup Penelitian
Penelitian ini hanya ingin mengetahui hasil penggerombolan tanaman obat
berdasarkan karakteristik daun dan syarat tumbuh dengan dua metode yakni Dua
Tahap Metode dan Dua Tahap Penggerombolan.

TINJAUAN PUSTAKA
Dua Tahap Metode atau TMCM (Two-Step Method for Clustering Mixed
Categorical and Numeric Data)
Dua Tahap Metode merupakan salah satu metode yang digunakan untuk
menggerombolkan objek yang memiliki peubah campuran, yaitu peubah kategorik
dan numerik. Metode ini menggunakan prinsip co-occurence. Co-occurence

3
adalah sebuah prinsip yang melihat dua peubah yang memiliki kategori yang
sering muncul secara bersamaan dalam objek yang sama (Shih et al. 2010).
Metode ini melihat keterkaitan hubungan antar objek untuk mendefinisikan
kesamaan antar pasangan objek (Shih et al. 2010). Langkah awal metode ini
adalah menentukan peubah dasar dari peubah kategorik. Peubah dasar adalah
peubah yang memiliki kategori paling banyak (Shih et al. 2010). Matriks M atau
matriks yang menyimpan sifat co-occurence akan dibentuk setelah peubah dasar
terpilih. Informasi pada matriks M akan berguna untuk pembentukan matriks D.
Selanjutnya adalah mencari peubah numerik dasar. Peubah numerik dasar adalah
peubah yang mampu meminimalkan ragam di dalam peubah. Menurut Shih et al.
(2010), ketika objek memiliki kategori yang sama pada peubah kategoriknya,
maka objek tersebut juga akan memiliki nilai numerik yang hampir mirip. Peubah
numerik dasar dapat dicari dengan menggunakan formula :
∑∑
(1)

= Masing-masing nilai dari peubah tersebut, dengan i = 1,2,...,n dan j =1,2,...,n
̅ * = Rataan dari peubah numerik dasar yang terpilih
Langkah tersebut akan menjadi acuan pada pengubahan peubah kategorik
dasar menjadi numerik. Konversi dilakukan dengan melihat pasangan peubah
kategorik pada peubah numerik, kategori yang hanya muncul satu kali akan
memiliki nilai yang sama dengan pasangannya pada peubah numerik, sedangkan
kategori yang terdiri dari banyak pasangan dapat menggunakan nilai rata-ratanya
(Shih et al. 2010). Peubah kategorik selain kategorik dasar dapat diubah kedalam
bentuk numerik dengan :

(2)
dengan d adalah banyaknya kategori pada peubah kategorik dasar, merupakan
nilai kemiripan antara kategori ke dengan kategori pada peubah dasar yang
dihitung berdasarkan
,
merupakan nilai pada peubah numerik dasar.
Selanjutnya, metode penggerombolan Agglomerative dan K-Means dapat
digunakan, sehingga Jarak Euclidean dapat digunakan untuk mengukur kedekatan
antar objek (Fielding 2007).
Matriks M
Matriks M adalah matriks dengan ukuran nxn dengan n adalah banyaknya
kategori dalam semua peubah kategorik. Pembentukan matriks M akan tergantung
pada kemunculan setiap kategori. Adapun bentuk matriks M dapat didefinisikan
sebagai berikut :
[

]

dengan :
ketika
adalah banyaknya kemunculan kategori ke- .
ketika
adalah banyaknya kemunculan kategori ke- dengan kategori kedalam observasi yang sama.
Penjelasan lain dari cara kerja matriks M adalah dengan melihat sifat cooccurence. Kategori dalam satu peubah yang selalu muncul bersama-sama dengan
kategori dalam peubah lain akan dihitung banyaknya, kemudian akan disimpan
kedalam matriks M sesuai dengan indeks matriks. Misalnya, untuk nilai

4
dinyatakan dengan banyak kemunculan kategori 1 dalam data,
dinyatakan
dengan banyak kemunculan bersama-sama kategori 1 dan kategori 2 dalam satu
objek di dalam data, jika diketahui kategori-kategori tersebut muncul bersamaan
maka diberi nilai 1, jika tidak maka diberi nilai 0 (Kaufman dan Rousseeuw 1990).
Matriks D
Matriks D dalah matriks yang berisi informasi kemiripan antar objek
berdasarkan karakteristik peubah kategorik dan peubah dasar. Menurut Shih et al.
(2010) formula yang digunakan yaitu :
|

|

| |

|

|-|

(3)

|

menyatakan kategori dalam peubah dasar,
menyatakan kategori dalam
peubah lain. Matriks D dapat didefinisikan sebagai berikut :
[

]

Setiap nilai pada matriks D didapatkan dengan memasukkan nilai-nilai pada
matriks M pada rumus (3). Nilai
sama saja dengan nilai
ketika
dan
atau ketika menyatakan kategori 1 dan untuk kategori 1, demikian
dengan indeks lainya. Jumlah dan akan sama dengan banyaknya kategori
yang ada dalam data atau ada sebanyak .

Konversi Kategori ke Angka
Misalkan ada 5 objek dengan peubah sebagai berikut :
Tabel 1. Data contoh
Objek
1
2
3
4
5

Peubah W
Tinggi
Sedang
Sedang
Sedang
Tinggi

Peubah X
Cair
Padat
Padat
Gas
Cair

Peubah Y
30
20
25
10
15

Peubah Z
16
23
20
15
25

Untuk membentuk Matriks M yang dibutuhkan adalah menghitung
kemunculan masing-masing kategori setelah sebelumnya dipilih peubah kategorik
dasar. Peubah X terpilih sebagai peubah kategorik dasar karena memiliki 3
kategori dibandingkan dengan peubah kategorik W yang hanya memiliki 2
kategori. Misal
berarti kemunculan kategori ke-1 yang dalam hal ini adalah
kategori tinggi dan bernilai 2 karena muncul 2 kali pada set data di atas. Indeks
pada matriks M berarti kemuculan kategori ke-1 dengan kategori ke-2 yang
dalam hal ini kategori ke-2 adalah sedang, akan diberikan nilai 0 karena kategori
ke-1 dan kategori ke-2 tidak pernah muncul bersamaan dalam satu objek.
Demikian selanjutnya hingga didapatkan matriks M sebagai berikut :

5

[
]
Setelah terbentuk matriks M, maka matriks D bias dibentuk. Dengan
rumus yang telah disebutkan sebelumnya maka untuk mengisi indeks-indeks pada
matriks D dilakukan penghitungan sebagai berikut :

dengan angka 2 pada pembilang adalah indeks
pada matriks M, sedangkan
untuk penyebut didapatkan dari indeks
,
dan
. Begitupula selanjutnya
hingga didapatkan matriks D sebagai berikut :

[
]
Setelah didapatkan matriks D, dilakukan pemilihan peubah numerik yang
akan dijadikan peubah numerik dasar dengan syarat seperti yang telah disebutkan
sebelumnya dengan rumus (1), dalam kasus di atas peubah yang terpilih adalah
peubah Z karena ragamnya terkecil. Selanjutnya adalah mengubah kategorikategori pada peubah kategorik dasar. Angka yang diberikan untuk setiap kategori
adalah angka-angka yang bersesuaian dengan kategori-kategori tersebut pada
peubah Z dengan diambil rata-ratanya, misal untuk kategori cair, angka yang
bersesuaian adalah 16 dan 25 sehingga rata-ratanya 20.5 sehingga kategori cair
dikonversi menjadi angka 20.5, begitupula selanjutnya, dapat dilihat pada tabel
dibawah.
Tabel 2. Hasil mengubah peubah kategorik dasar ke angka
Objek
1
2
3
4
5

Peubah W
Tinggi
Sedang
Sedang
Sedang
Tinggi

Peubah X
20.5
21.5
21.5
15
20.5

Peubah Y
30
20
25
10
15

Peubah Z
16
23
20
15
25

Langkah selanjutnya adalah mengubah kategori-kategori pada peubah
yang bukan merupakan peubah kategorik dasar dengan menggunakan rumus (2),
maka :

sehingga,

6
Tabel 3. Hasil pengubahan semua kategori dalam data
Objek
1
2
3
4
5

Peubah W
20.5
17.4
17.4
17.4
20.5

Peubah X
20.5
21.5
21.5
15
20.5

Peubah Y
30
20
25
10
15

Peubah Z
16
23
20
15
25

Setelah langkah tersebut, maka metode gerombol berhirarkhi dapat
diterapkan sampai diperoleh gerombol sebanyak 1/3 dari banyaknya data. Masingmasing gerombol dihasilkan dari metode gerombol berhirarki akan dianggap
sebagai objek dan digerombolkan kembali dengan metode penggerombolan KMeans.
Dua Tahap Penggerombolan (TwoStep Cluster)
Dua Tahap Penggerombolan merupakan salah satu metode
penggerombolan objek dalam data yang memiliki peubah campuran, yaitu peubah
numerik dan kategorik. Jarak yang digunakan pada Dua Tahap Penggerombolan
adalah jarak Log-likelihood. Jarak antara gerombol i dan j didefinisikan sebagai
berikut Şch opu
:
= + (4)
- (∑
o (̂ ̂ ) ∑ ̂ )
(5)
Setiap simbol s dalam rumus (5) dapat diganti dengan simbol i dan j
disesuaikan dengan rumus (4). Indeks merepresentasikan penggabungan
gerombol i dan j,
adalah banyaknya peubah numerik,
adalah banyaknya
peubah kategorik, ̂ adalah penduga ragam dari peubah numerik ke-k untuk
seluruh set data, ̂ adalah penduga ragam bagi peubah numerik ke-k dalam
gerombol ke-s, dan N merupakan banyaknya objek.
urut Şch opu
:
̂ =-∑
(6)
o

adalah banyaknya kategori untuk peubah kategorik ke-m,
adalah jumlah
observasi dalam gerombol ke-s yang memiliki peubah kategorik m dan l kategori.
Metode dua tahap terdiri dari penggerombolan awal dan penggerombolan optimal.
Penggerombolan awal dilakukan dengan pembentukan Cluster Feature Tree (CF
Tree) atau disebut juga dengan Pohon Ciri Gerombol (Kudsiati 2006). Hasil
pembentukan CF Tree akan dipakai pada penentuan gerombol optimal. Gerombol
optimal yaitu gerombol yang memiliki jarak antar gerombol paling jauh dan jarak
antar objek paling dekat.
Penentuan gerombol optimal dengan AIC (Akaike’s Information Criterion)
dan BIC (Bayesian Information Criterion) untuk menduga jumlah gerombol awal.
Selanjutnya mencari peningkatan jarak terbesar antara dua gerombol terdekat pada
masing-masing tahapan penggerombolan dengan menggunakan Rasio Perubahan
Jarak Gerombol, yaitu :
(7)
dengan :

7
= rasio perubahan jarak terbesar pertama
= rasio perubahan jarak terbesar kedua
dan rumus R(k) sebagai berikut
- /
-

-

(8)
(9)

dengan :
= rasio perubahan jarak
=
o –
=
= jarak jika k gerombol digabungkan dengan - gerombol
Jika rasio perubahan lebih besar dari batas c , jumlah gerombol optimum
ditetapkan sama dengan , selainnya jumlah gerombol optimal sama dengan
maksimum
. Nilai c
, berdasarkan studi simulasi (Bacher et al.
2004). Dua Tahap Penggerombolan menggunakan kriteria BIC (Bayesian
Information Criterion) untuk memilih banyaknya kelompok yang akan dibentuk.
BIC yang dipilih adalah BIC dengan nilai terkecil. Formula yang digunakan
adalah:
o (̂ ̂ ) ∑ ̂
{
o
(10)
- ∑
- ∑
dengan
adalah jumlah kategori untuk peubah kategorik,
peubah kontinu dan
adalah jumlah peubah kategorik.

adalah jumlah

METODE
Penelitian ini berupa pengolahan data yang didapatkan dari website resmi
Fakultas Farmasi Universitas Airlangga mengenai Sistem Informasi Tanaman
Obat (www.ff.unair.ac.id) yang diakses pada tanggal 14 Februari 2014. Penelitian
ini menggunakan statistika deskriptif untuk memperlihatkan kondisi data yang
dilanjutkan dengan analisis gerombol. Analisis gerombol dilakukan terhadap
tanaman obat. Penggerombolan yang dilakukan pada penelitian ini adalah
penggerombolan tanaman obat berdasarkan karakteristik daun dan kecocokan
tumbuh dengan Dua Tahap Metode dan Dua Tahap Penggerombolan.

Bahan
Data tanaman obat yang digunakan adalah karakteristik daun dan kecocokan
tumbuh. Data diperoleh dari website resmi Fakultas Farmasi Universitas
Airlangga di Sistem Informasi Tanaman Obat (www.ff.unair.ac.id). Tanaman obat
yang digunakan berjumlah 149 tanaman obat dengan 17 peubah, 9 peubah
kategorik dan 8 peubah numerik yang selengkapnya disajikan pada Lampiran 1.

8
Prosedur Analisis Data
Dua Tahap Metode berfilosofi bahwa ketika dua item selalu muncul
bersamaan maka terdapat derajat kesamaan yang tinggi antar item tersebut. Dua
Tahap Penggerombolan menggunakan ukuran jarak Euclidean dan Log-likelihood.
Analisis data pada penelitian ini akan menggunakan SPSS 16.0, Minitab 16, dan
Microsoft Excel 2010.
Adapun langkah-langkah analisis gerombol Dua Tahap Metode dan Dua
Tahap Penggerombolan serta pengukuran kebaikan pembentukan gerombol adalah
sebagai berikut:
1. Melakukan penggerombolan dengan Dua Tahap Metode yang terdiri dari
langkah-langkah sebagai berikut :
1.1 Menstandarisasi peubah numerik.
1.2 Memilih peubah kategorik yang akan dijadikan sebagai peubah dasar.
1.3 Membentuk matriks M.
1.4 Membentuk matriks D.
1.5 Mencari peubah numerik dasar.
1.6 Konversi peubah kategorik dasar ke peubah numerik.
1.7 Mengkonversi peubah kategorik lain yang bukan merupakan peubah
kategorik dasar.
1.8 Melakukan penggerombolan dengan menggunakan metode
Hierarchical Agglomerative Clustering (HAC).
1.9 Melakukan penggerombolan dengan menggunakan metode
penggerombolan K-Means.
2. Melakukan penggerombolan menggunakan Dua Tahap Penggerombolan
dengan langkah-langkah sebagai berikut :
1.1 Pre-clustering, yang ditandai dengan pembentukan Pohon Ciri
Gerombol.
1.2 Penggerombolan, yang terdiri dari :
1.2.1 Anggap sub-gerombol yang dihasilkan dari Pre-clustering
sebagai objek, kemudian menghitung jarak antar kumpulan
sub-gerombol yang telah terbentuk pada langkah 1.1
menggunakan jarak Log-likelihood.
1.2.2 Menggabungkan kumpulan sub-gerombol yang memiliki
jarak terkecil, kumpulan sub-gerombol yang telah
bergabung menjadi sebuah gerombol akan mengikuti proses
selanjutnya untuk dicari jarak yang terkecil kembali.
1.2.3 Langkah terus berlanjut hingga diperoleh satu gerombol
akhir (metode Agglomerative).
1.2.4 Melihat gerombol optimal dari rasio perubahan jarak BIC.
3. Hasil penggerombolan menggunakan kedua metode akan dievaluasi
dengan CTM (Cluster Tightness Measure) untuk mengetahui kebaikan
kualitas penggerombolan. Alat ukur ini melibatkan simpangan baku setiap
peubah pada masing-masing gerombol, yaitu dengan rumus sebagai
berikut:


p
( ∑
p

)

(11)

9
dengan adalah banyaknya gerombol; p adalah banyaknya peubah;
adalah simpangan baku pada gerombol ke- untuk peubak ke- ; adalah
simpangan baku seluruh data untuk peubah ke- . Hasil penggerombolan
dengan nilai CTM terkecil dinyatakan memakai metode dengan kualitas
yang baik (Epps dan Ambikairajah 2008).

HASIL DAN PEMBAHASAN
Deskripsi Data
Tanaman obat berujung daun runcing mempunyai persentase terbesar
(50.33%) dan berujung daun rompang merupakan persentase terkecil (0.67%).
Persentase tanaman obat dengan Pangkal daun (Basis folii) runcing sebesar
34.91% merupakan kategori dengan persentase terbesar dan berpangkal daun
bergigi, daun memeluk batang, menyempit masing-masing merupakan persentase
terkecil (0.67%).
Ujung daun (Apex folii)
Runcing
Tumpul
Terbelah
Rompang
Berlekuk

Meruncing
Membulat
Sungut
Berduri

50,33%

Pangkal daun (Basis folii)

Runcing
Rompang
Tumpul
Bergigi
Menyempit
Berpelepah

Membulat
Berlekuk
Meruncing
Daun memeluk batang
Jantung

34,91%
26,17%

28,19%

18,12%
12,08%
0,67%
0,67%
2,01%1,34%
3,36%
1,34%

5,37% 6,71%
3,36%

0,67% 2,01%
0,67% 0,67% 1,34%

(a)
(b)
Gambar 1. Persentase per-kategori (a) peubah Ujung daun (Apex folii) dan (b)
peubah Pangkal daun (Basis folii)
Tanaman obat bertulang daun sirip mempunyai persentase terbesar
(80.54%) sedangkan yang terkecil bertulang daun tidak jelas (1.34%). Tanaman
obat bertepi daun rata berpresentase tinggi (64.43%) namun bertepi daun bergigi,
bercangap, menyirip, berlekuk menjari, dan berbagi, memiliki persentase terendah
(0.67%).

10
Tanaman obat yang berwarna daun bawah hijau muda merupakan
persentase terbesar (61.07%) sedangkan presentase terkecil adalah hijau
keperakan, hijau buram, merah gelap, dan cokelat (0.67%). Tanaman obat yang
berwarna daun atas hijau tua merupakan persentase terbesar (44.31%), sedangkan
persentase terkecil adalah ungu, hijau kekuningan, dan hijau keputihan sebesar
0.67%.
Tepi daun

Susunan tulang daun (Nervatio)
Menyirip
Melengkung
Tidak jelas

Sejajar
Menjari

80,54%

Bertepi rata
Berombak
Bergigi
Berbagi menyirip
Berlekuk menjari

Bergerigi
Beringgit
Bercangap
Berlekuk
Berbagi

64,43%

19,46%
8,05%

4,71%

5,37%

7,38%
1,34%
4,03%
0,67%
0,67%0,67%
0,67%
0,67%

1,34%

(a)
Warna daun atas
Hijau
Ungu
Merah
Hijau kekuningan

Hijau tua
Hijau Muda
Hijau keunguan
Hijau keputihan

43,62% 44,31%

(c)

Warna daun bawah
Hijau
Hijau tua
Merah
Hijau pucat
Merah gelap

Hijau muda
Ungu
Hijau keperakan
Hijau buram
Cokelat

61,07%

26,17%
7,38%
1,34%
0,67%
1,34%
0,67%
0,67%

(b)
Gambar 2.

2,01% 0,67% 0,67%
0,67%
4,71% 1,34% 2,01% 0,67%

(d)

Persentase per-kategori pada peubah (a) Susunan tulang daun
(Nervatio), (b) Warna daun atas, (c) Tepi daun, dan (d) Warna daun
bawah

Tanaman obat yang memiliki permukaan daun halus merupakan
persentase terbesar (29.53%), sedangkan persentase terkecil memiliki permukaan
daun berkerut, kasar bersisik, licin berbulu, dan licin mengkilat merupakan
persentase terkecil (0.67%). Tanaman obat berdaging daun kertas memiliki
persentase paling besar (38.26%), sementara tanaman obat berdaging daun
berbentuk daging memiliki persentase paling kecil (0.67%).

11
Permukaan daun
Licin
Kasap
Gundul
Berbulu kasar
Licin berbulu

Daging daun

Halus
Kasar
Berbulu halus
Kasar bersisik
Licin mengkilat

Kulit/Belulang
Kertas
Tipis lunak

Perkamen
Selaput
Berdaging

29,53%
27,52%
38,26%
26,84%
18,79%

8,72% 10,74%
6,71% 7,38%
4,03%

10,74%

0,67% 2,68%
0,67% 0,67% 0,67%

4,71%

(a)

0,67%

(b)
Helaian daun

Lanset
Bangun bulat telur sungsang
Jorong
Bangun ginjal atau kerinjal

Memanjang
Bulat telur terbalik
Bulat telur
Anak panah

Jantung
Bangun pita
Bulat
Bangun paku/dabus

30,87%
23,49%

20,80%

5,37%

3,36%

4,03%

2,68%

4,03%
1,34%

1,34%

0,67%

0,67%

0,67% 0,67%

(c)
Gambar 3. Persentase per-kategori pada peubah (a) Permukaan daun, (b) Daging
daun, dan (c) Helaian daun
Tanaman obat berhelaian daun jorong merupakan persentase terbesar
(30.87%). Tanaman obat berhelaian daun anak panah, bangun belah ketupat,
bangun garis, dan bangun paku/dabus masing-masing memiliki persentase terkecil
(0.67%).
Dua Tahap Metode atau TMCM (Two-Step Method for Clustering Mixed
Categorical and Numeric Data)
Tahap pertama adalah penentuan peubah kategorik dasar. Adapun peubah
kategorik dasar yang terpilih adalah peubah helaian daun yang memiliki sebanyak
14 kategori, yaitu peubah kategorik yang memiliki kategori terbanyak dalam
penelitian ini peubah kategorik dasar yang terpilih adalah peubah helaian daun.
Setelah melakukan pemilihan peubah kategorik dasar maka dilakukan
pembentukan matriks M, berupa matriks berukuran 85 x 85 yaitu sebanyak
kategori yang ada di dalam data.

12
Informasi pada matriks M akan digunakan untuk membentuk matriks D.
Setelah matriks D terbentuk, dilakukan pemilihan peubah numerik dasar dan yang
terpilih menjadi peubah numerik dasar adalah peubah lebar daun minimum (cm).
Pengubahan kategori-kategori pada peubah helaian daun dapat dilakukan dengan
terpilihnya peubah lebar daun minimum (cm) sebagai peubah numerik dasar.
Setelah peubah kategorik dasar menjadi peubah numerik, maka peubah kategorik
lain dapat diubah menjadi peubah numerik, dapat dilihat pada lampiran 2. Ketika
semua peubah kategorik sudah diubah menjadi peubah numerik, langkah
selanjutnya adalah dilakukan analisis gerombol HAC dan dihasilkan 50 gerombol
yaitu sebanyak 1/3 dari banyaknya objek dalam data.
Hasil dari analisis gerombol HAC yang berupa 50 gerombol, masingmasing gerombol akan dianggap sebagai objek baru dan akan dijadikan input pada
analisis gerombol K-Means dengan dicari rata-rata masing-masing gerombol.
Analisis K-Means menghasilkan 3 gerombol sebagai gerombol akhir.
Gerombol 1 memiliki 5 gerombol dari analisis HAC yang berarti ada 5
tanaman obat, gerombol 2 memiliki 38 gerombol dari analisis HAC yang artinya
ada 134 tanaman obat, dan gerombol 3 memiliki 7 gerombol dari hasil analisis
HAC yang kemudian dapat dikatakan memiliki 10 tanaman obat. Anggota
masing-masing gerombol dapat dilihat pada Lampiran 4.

Dua Tahap Penggerombolan (TwoStep Cluster)
Banyaknya gerombol diambil berdasarkan rasio ukuran jarak tertinggi yaitu
1.458 dengan nilai BIC yang rendah yaitu 5376.479, sehingga didapatlah 3
gerombol, dapat dilihat pada lampiran 3. Adapun distribusi observasi dalam
masing-masing gerombol adalah sebagai berikut :
Tabel 4. Sebaran keanggotaan gerombol

Gerombol

Total

N

Persentase

1

47

31.5%

2
3

55
47
149

36.9%
31.5%
100%

Tabel di atas memperlihatkan bahwa sebanyak 47 tanaman obat masuk ke
gerombol 1, sebanyak 55 tanaman obat terdapat pada gerombol 2 dan sebanyak 47
tanaman obat menjadi anggota gerombol 3. Anggota masing-masing gerombol
yang dihasilkan dengan Dua Tahap Penggerombolan dapat dilihat pada Lampiran
5.

Karakteristik Gerombol
Jika dilihat pada Tabel 5, maka dapat dilihat beberapa penciri gerombol
yang hampir mirip. Gerombol 2 pada Dua Tahap Metode memiliki penciri yang

13
sebagian besar mirip dengan gerombol 3 pada Dua Tahap Penggerombolan, yang
membedakannya hanya pada peubah permukaan daun. Gerombol 3 pada Dua
Tahap Metode memiliki penciri yang sebagian besar mirip dengan gerombol 2
pada Dua Tahap Penggerombolan namun beda pada peubah tepi daun dan warna
daun atas. Gerombol 1 pada Dua Tahap Metode memiliki penciri yang sebagian
besar mirip dengan gerombol 1 pada Dua Tahap Penggerombolan namun beda
pada peubah pangkal daun, warna daun bawah, permukaan daun, dan daging
daun.
Sebesar 60% anggota dari gerombol 1 pada Dua Tahap Metode merupakan
anggota dari gerombol 1 pada Dua Tahap Penggerombolan. Sebesar 83% anggota
dari gerombol 3 pada Dua Tahap Penggerombolan juga merupakan anggota dari
gerombol 2 pada Dua Tahap Metode, sedangkan sebesar 50% anggota dari
gerombol 3 pada Dua Tahap Metode merupakan anggota dari gerombol 2 pada
Dua Tahap Penggerombolan (Lampiran 4 dan Lampiran 5).
Sebanyak empat penciri gerombol pada gerombol 1 berbeda dengan
gerombol 2 pada Dua Tahap Metode yaitu pada peubah X2, X5, X7, dan X9 atau
dapat dikatakan bahwa yang membedakan gerombol 1 dengan gerombol 2 adalah
peubah X2, X5, X7, dan X9, sedangkan hanya tiga penciri gerombol sebagai
pembeda gerombol 1 dan gerombol 3 yaitu pada peubah X4, X7, dan X9.
Sebanyak empat penciri gerombol membedakan gerombol 2 dengan gerombol 3
yaitu pada peubah X2, X4, X7, dan X9. Penciri gerombol 1 pada Dua Tahap
Penggerombolan berbeda sebanyak empat penciri dengan gerombol 2 yaitu pada
peubah X2, X5, X6, dan X9 sehingga peubah-peubah tersebut dapat dikatakan
sebagai peubah yang membedakan gerombol 1 dan gerombol 2 pada Dua Tahap
Penggerombolan ini. Sebanyak empat penciri gerombol juga membedakan
gerombol 1 dengan gerombol 3 pada Dua Tahap Penggerombolan yaitu pada
peubah X5, X6, X7, dan X9. Gerombol 2 dibedakan oleh tiga penciri gerombol
dengan gerombol 3 pada Dua Tahap Penggerombolan yaitu pada peubah X2, X7,
dan X9.
Tabel 5. Karakteristik gerombol hasil penggerombolan dengan kedua metode
berdasarkan peubah kategorik dilihat dengan modus
Peubah
X1
X2
X3
X4
X5
X6
X7
X8
X9

Dua Tahap Metode
1
2
3
Runcing Runcing Runcing
Tumpul
Runcing Tumpul
Menyirip Menyirip Menyirip
Bertepi
Bertepi
Berlekuk
rata
rata
Hijau
Hijau tua Hijau
Hijau
Hijau
Hijau
muda
muda
muda
Licin
Halus
Halus
Kertas
Kertas
Kertas
Bulat
Jantung
Jorong
telur

Dua Tahap Penggerombolan
1
2
3
Runcing Runcing Runcing
Runcing Tumpul
Runcing
Menyirip Menyirip Menyirip
Bertepi
Bertepi
Bertepi
rata
rata
rata
Hijau
Hijau tua Hijau tua
Hijau
Hijau
Hijau
muda
muda
Halus
Halus
Licin
Kertas
Kertas
Kertas
Bulat
Lanset
Jorong
telur

14
Jika dilihat dari urutan rataan dari yang terkecil hingga yang terbesar untuk
masing-masing peubah yang disajikan pada Tabel 6, gerombol 2 pada Dua Tahap
Metode juga memiliki kemiripan dengan gerombol 3 pada Dua Tahap
Penggerombolan. Adapun urutannya adalah peubah X16, X17, X14, X15, X10,
X11, X12, dan X13. Gerombol 3 pada Dua Tahap Metode juga memiliki
kemiripan dengan gerombol 2 pada Dua Tahap Penggerombolan dalam hal urutan
rataan setiap peubah. Berikut urutan rataan dari yang terkecil hingga terbesar,
X16, X14, X17, X15, X10, X11, X12, X13. Gerombol 1 pada Dua Tahap Metode
memiliki kemiripan dengan gerombol 1 pada Dua Tahap Penggerombolan dalam
hal urutan rataan peubah hanya untuk peubah X12 dan X13.
h t
p rc y
u
α %
pr
yang dapat dijadikan penciri antara gerombol 1 dengan gerombol 2 pada Dua
Tahap Metode adalah peubah X16 dan X17 karena selang kepercayaannya tidak
saling tumpang tindih, sedangkan untuk penciri antara gerombol 1 dengan
gerombol 3 adalah peubah X12 dan X16. Penciri antara gerombol 2 dengan
gerombol 3 adalah peubah X11, X12, dan X13 dilihat dari selang kepercayaannya
yang tidak saling tumpang tindih. Pada Dua Tahap Penggerombolan, hanya
terdapat satu penciri untuk gerombol 2 dan gerombol 3 yaitu X16 (Lampiran 7).
Tabel 6. Karakteristik gerombol hasil penggerombolan dengan kedua
metode berdasarkan peubah numerik dilihat dengan rataan
Peubah
X10
X11
X12
X13
X14
X15
X16
X17

Dua Tahap Metode
Dua Tahap Penggerombolan
1
2
3
1
2
3
15.60
21.45
18.90
21.31
19.80
22.36
24.20
30.89
24.80
29.57
30.04
31.18
272.10
92.06 1090.00 159.37 207.31 121.36
930.00 1234.96 2045.00 1280.85 1364.36 1177.53
13.10
9.08
7.10
12.29
6.61
8.76
18.50
19.68
18.85
24.31
16.44
18.54
19.00
3.32
4.60
5.04
3.14
3.77
47.40
7.33
11.00
10.81
8.25
7.82

Evaluasi Kebaikan Pembentukan Gerombol
Seperti yang telah dijelaskan pada metode, pengukur kebaikan pembentukan
gerombol pada penelitian ini akan digunakan CTM (Cluster Tightness Measure).
Hasil analisis memperlihatkan bahwa pembentukan gerombol dengan Dua Tahap
Metode lebih baik daripada Dua Tahap Penggerombolan. Hal ini dibuktikan
dengan nilai CTM dari gerombol yang dibentuk dengan Dua Tahap Metode lebih
kecil dari pada nilai CTM dari gerombol yang dibentuk dengan Dua Tahap
Penggerombolan yaitu sebesar 0.8983 sedangkan nilai CTM dari Dua Tahap
Penggerombolan sebesar 0.9734, dengan simpangan baku masing-masing
gerombol sebagai berikut :

15
Tabel 6. Simpangan baku masing-masing peubah untuk setiap gerombol
Simpangan baku Dua
Tahap Metode
Peubah
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10
X11
X12
X13
X14
X15
X16
X17

Simpangan baku Dua Tahap
Penggerombolan

G1

G2

G3

G1

0.13
0.74
0.00
0.00
0.04
0.34
0.75
0.82
4.75
7.67
4.76
251.00
545.00
10.74
10.79
7.42
28.50

0.62
0.81
0.92
1.07
0.73
0.95
0.80
0.81
1.07
6.13
5.76
189.70
612.70
9.72
20.24
3.50
6.43

0.59
0.63
0.45
1.30
0.62
0.31
0.56
0.92
2.79
3.51
2.97
438.00
703.00
4.18
11.97
4.22
5.96

0.68
0.80
1.02
1.11
0.44
0.71
0.62
0.94
1.63
5.37
6.03
270.20
615.50
12.00
22.96
6.39
12.39

G2
0.51
0.81
0.78
1.25
1.00
1.07
0.82
0.74
0.92
5.83
5.03
424.30
743.00
4.69
14.26
3.48
12.27

G3
0.64
0.80
0.84
1.14
0.37
0.88
0.83
0.67
2.22
6.96
6.62
247.60
555.60
10.07
20.53
3.54
5.55

Simpangan
baku data
keseluruhan
0.61
0.80
0.88
1.16
0.71
0.91
0.79
0.81
1.64
6.13
5.88
329.70
648.80
9.48
19.50
4.65
10.67

SIMPULAN DAN SARAN
Simpulan
Hasil penggerombolan dengan menggunakan Dua Tahap Metode dan Dua
Tahap Penggerombolan pada penelitian ini, keduanya menghasilkan 3 gerombol
sebagai gerombol akhir. Namun, gerombol-gerombol yang dibentuk dengan Dua
Tahap Metode memiliki anggota yang berbeda dengan gerombol-gerombol yang
dibentuk melalui Dua Tahap Penggerombolan. Penggerombolan dengan
menggunakan Dua Tahap Metode menghasilkan 3 gerombol dengan sebanyak 5
tanaman obat pada gerombol 1, 134 tanaman obat pada gerombol 2, dan 10
tanaman obat pada gerombol 3. Sebanyak 47 tanaman obat pada gerombol 1, 55
tanaman obat pada gerombol 2 dan sebanyak 47 tanaman obat pada gerombol 3
merupakan anggota-anggota gerombol dengan Dua Tahap Penggerombolan.
Gerombol 2 pada Dua Tahap Metode memiliki penciri yang sebagian besar mirip
dengan gerombol 3 pada Dua Tahap Penggerombolan, yang membedakannya
hanya pada peubah X7 yaitu permukaan daun. Gerombol 3 pada Dua Tahap
Metode memiliki penciri yang sebagian besar mirip dengan gerombol 2 pada Dua
Tahap Penggerombolan namun beda pada peubah X4 (tepi daun) dan X5 (warna

16
daun atas). Gerombol 1 pada Dua Tahap Metode memiliki penciri yang sebagian
besar mirip dengan gerombol 1 pada Dua Tahap Penggerombolan namun beda
pada peubah X2 (pangkal daun), X6 (warna daun bawah), X7 (permukaan daun),
dan X9 (helaian daun).
Gerombol 1 dengan gerombol 2 pada Dua Tahap Metode dibedakan oleh
peubah X16 (lebar daun minimum) dan X17 (lebar daun maksimum), sedangkan
gerombol 1 dengan gerombol 3 dibedakan oleh peubah X12 (tinggi tanam dari
permukaan laut minimum) dan X16 (lebar daun minimum). Penciri antara
gerombol 2 dengan gerombol 3 adalah peubah X11 (suhu tanam maksimum), X12
(tinggi tanam dari permukaan laut minimum), dan X13 (tinggi tanam dari
permukaan laut maksimum). Pada Dua Tahap Penggerombolan, hanya terdapat
satu penciri untuk gerombol 2 dan gerombol 3 yaitu X16 (lebar daun minimum).
Perbedaan ini menyebabkan hasil penggerombolan kedua metode tersebut
memiliki nilai CTM yang berbeda, yang juga digunakan sebagai nilai
pengevaluasi kebaikan pembentukan gerombol. Pada penelitian ini, pembentukan
gerombol dengan Dua Tahap Metode dinyatakan lebih baik dibandingkan dengan
pembentukan gerombol melalui Dua Tahap Penggerombolan ditunjukan oleh nilai
CTM Dua Tahap Metode yang lebih kecil dibandingkan dengan nilai CTM pada
Dua Tahap Penggerombolan.

Saran
Peneliti selanjutnya supaya bisa membandingkan Dua Tahap Metode
dengan lebih banyak metode penggerombolan untuk data dengan peubah
campuran lainnya. Peneliti selanjutnya bisa menggunakan data yang lebih banyak
jumlah observasinya supaya hasil penggerombolan bisa lebih dilihat
perbedaannya dan bisa menggunakan alat evaluasi yang lain untuk melihat
kebaikan pembentukan gerombol.

DAFTAR PUSTAKA
[BBPP Lembang] Balai Besar Pelatihan Pertanian Lembang. 2014. Potensi
Tanaman Obat Indonesia. [Internet]. [diunduh 2014 Juli 07]. Tersedia pada:
www.bbpp-lembang.info.
[FFUNAIR] Fakultas Farmasi Universitas Airlangga. 2014. Sistem Informasi
Tanaman Obat. [Internet]. [diunduh 2014 Februari 14]. Tersedia pada:
http://www.ff.unair.ac.id/.
Bacher J, Wenzig K, Vogler M. 2004. SPSS TwoStep Cluster – A First Evaluation.
[internet].
[diunduh
2014
Maret
25].
Tersedia
pada:
http://www.statisticalinnovations.com/products/TwoStep.pdf.
Epps J, Ambikairajah E. 2008. Visualisation of Reduced Dimension Microarry
Data Using Gaussian Mixture Model. [internet]. [diunduh 2014 Mei 30].
Tersedia
pada:
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.59.1619.

17
Fielding AH. 2007. Cluster and Classification Techniques for the Biosciences.
New York (US): Cambridge Univ Pr.
Kaufman L, Rousseeuw PJ. 1990. Finding Groups in Data: An Introduction to
Cluster Analysis. New York (US): J Wiley.
Kudsiati. 2006. Pengkajian Keakuratan TwoStep Cluster dalam Menentukan
Banyaknya Gerombol Populasi [skripsi]. Bogor (ID): Institut Pertanian Bogor.
Şch opu
pp y
o t p
ut r
y
for
t fy
u to r ’ Prof
Seria Ştiinţe Economice, Buletinul Universităţii PetrolGaze din Ploieşti. 52(3):66-75.
Shih MY, Jheng JW, Lai LF. 2010. A Two-Step Method for Clustering Mixed
Categorical and Numeric Data. Tamkang Journal of Science and Engineering.
13(1):11-19.
Yunianto Y. 2011. Perbandingan Metode Penggerombolan dengan Komponen
Utama Nonlinier dan Gerombol Dua Langkah pada Data Campuran [skripsi].
Bogor (ID): Institut Pertanian Bogor.

18
Lampiran 1 Rincian peubah yang digunakan
Peubah
X1

Keterangan Peubah
Ujung daun
(Apex folii)

X2

Pangkal daun
(Basis folii)

X3
X4

Susunan tulang daun
(Nervatio)
Tepi daun

X5

Warna daun atas

X6

Warna daun bawah

X7

Permukaan daun

X8

Daging daun

X9

Helaian daun

X10

Suhu tanam
minimum (oc)
Suhu tanam
maksimum ( oc)
Tinggi tanam dari
permukaan laut
minimum (m)
Tinggi tanam dari
permukaan laut
maksimum (m)
Panjang daun
minimum (cm)
Panjang daun
maksimum (cm)

X11
X12

X13

X14
X15

X16
X17

Lebar daun
minimum (cm)
Lebar daun
maksimum (cm)

Kategori
Runcing (a1); Meruncing (a2); Tumpul (a3); Membulat (a4);
Terbelah (a5); Sungut (a6); Rompang (a7); Berduri (a8); Berlekuk
(a9)
Runcing (b1); Membulat (b2); Rompang (b3); Berlekuk (b4);
Tumpul (b5); Meruncing (b6); Bergigi (b7); Daun Memeluk Batang
(b8); Menyempit (b9); Jantung (b10); Berpelepah (b11)
Menyirip (c1); Sejajar (c2); Melengkung (c3); Menjari (c4);
Tidak jelas (c5)
Bertepi rata (d1); Bergerigi (d2); Berombak (d3); Beringgit (d4);
Bergigi (d5); Bercangap (d6); Berbagi menyirip (d7); Berlekuk (d8);
Berlekuk menjari (d9); Berbagi (d10)
Hijau (e1); Hijau tua (e2); Ungu (e3); Hijau muda (e4); Merah (e5);
Hijau keunguan (e6); Hijau kekuningan (e7);
Hijau keputihan (e8)
Hijau (f1); Hijau muda (f2); Hijau tua (f3); Ungu (f4); Merah (f5);
Hijau pucat (f6); Hijau keperakan (f7); Hijau buram (f8);
Merah gelap (f9); Cokelat (f10)
Licin (g1); Halus (g2); Kasap (g3); Kasar (g4); Berbulu halus (g5);
Berbulu kasar (g6); Gundul (g7); Berbulu (g8); Kasar bersisik (g9);
Licin berbulu (g10); Licin mengkilat (g11); Berkerut (g12)
Kulit/Belulang (h1); Perkamen (h2); Kertas (h3); Selaput (h4);
Tipis lunak (h5); Berdaging (h6)
Lanset (i1); Memanjang (i2); Jantung (i3); Bulat telur sungsang (i4);
Bulat telur terbalik (i5); Bangun pita (i6); Jorong (i7); Bulat telur
(i8); Bulat (i9); Bangun ginjal (i10); Anak panah (i11); Bangun
jarum (i12); Bangun paku (i13); Bangun pedang (i14); Bangun belah
ketupat (i15); Bangun garis (i16)
Kontinu
Kontinu
Kontinu

Kontinu
Kontinu
Kontinu
Kontinu
Kontinu

19
Lampiran 2. Angka-angka untuk setiap kategori
Helaian daun
Kategori
Lanset (Lancealatus)
Memanjang (Oblongus)
Jantung (Cordatus)
Bangun bulat telur sungsang (Obovatus)
Bulat telur terbalik (Sudip)
Bangun pita (Ligulatus)
Jorong (Ovalis)
Bulat telur (Ovatus)
Bulat (Orbicularis)
Bangun ginjal atau kerinjal (Reniformis)
Anak panah (Sagitatus)
Bangun paku/dabus (Subulatus)
Bangun belah ketupat (Rhomboideus)
Bangun garis (Linearis)

Ujung daun (Apex folii)
Kategori
Angka
3.24
Runcing (Acutus)
2.95
Meruncing (Acuminatus)
1.98
Tumpul (Obtusus)
0.92
Membulat (Rotundatus)
3.50
Terbelah (Retusus)
1.75
Sungut (Aristatus)
2.25
Rompang (Truncatus)
0.88
Berduri (Mucranutus)
1.57
Berlekuk (Emarginatus)

Pangkal daun (Basis folii)
Kategori
Angka
2.53
Runcing (Acutus)
3.47
Membulat (Rotundatus)
1.30
Rompang (Truncatus)
4.17
Berlekuk (Emarginatus)
2.95
Tumpul (Obtusus)
2.18
Meruncing (Acuminatus)
0.12
Bergigi (Dentatus)
0.12
Daun memeluk batang

Angka
3.64
2.09
9.10
3.92
4.22
6.83
3.46
3.72
7.00
4.50
0.50
0.10
15.00
2.00

20
Menyempit
Jantung (Cordatus)
Berpelepah

0.12
0.28
0.22

Susunan tulang daun (Nervatio)
Kategori
Angka
3.75
Menyirip (Penninervis)
2.21
Sejajar (Rectinervis)
0.58
Melengkung (Cervinervis)
2.33
Menjari (Palminervis)
0.34
Tidak jelas

Tepi daun
Kategori
Bertepi rata (Integer)
Bergerigi (Serratus)
Berombak (Repandus)
Beringgit (Crenatus)
Bergigi (Dentatus)
Bercangap (Fissus)
Berbagi menyirip (Pinnatipartitus)
Berlekuk (Lobatus)
Berlekuk menjari (Palmatilobus)
Berbagi (Partitus)

Warna daun atas
Kategori
Angka
3.18
Hijau
3.26
Hijau tua
0.11
Ungu
1.42
Hijau muda
3.85
Merah
0.22
Hijau keunguan
0.08
Hijau kekuningan
0.26
Hijau keputihan

Angka
3.72
2.19
0.86
0.57
0.07
0.50
0.08
1.08
0.11
1.14

21
Warna daun bawah
Kategori
Angka
2.99
Hijau
3.60
Hijau muda
0.95
Hijau tua
0.25
Ungu
2.45
Merah
1.16
Hijau pucat
0.65
Hijau keperakan
0.26
Hijau buram
0.12
Merah gelap
0.26
Cokelat

Permukaan daun
Kategori
Licin (Laevis)
Halus
Kasap (Scaber)
Kasar
Berbulu halus (Villosus)
Berbulu kasar (Hispidus)
Gundul (Glaber)
Berbulu
Kasar bersisik
Licin berbulu
Licin mengkilat
Berkerut

Angka
3.13
2.64
1.79
1.81
1.85
1.15
1.41
0.46
0.12
0.08
0.08
0.08

Daging daun
Kategori
Kulit/Belulang (Curiaceus)
Perkamen (Perkamenteus)
Kertas (Papyraceus)
Selaput (Membarnaceus)
Tipis lunak (Herbaceus)
Berdaging (Carnosus)

Angka
1.59
2.94
3.40
0.61
2.08
0.26

22
Lampiran 3. Nilai BIC (Bayesian Information Criterion)

Jumlah
Gerombol
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

BIC
4999.38
5155.65
5376.48
5670.26
5983.99
6307.38
6634.79
6983.85
7341.45
7703.03
8067.69
8439.33
8817.51
9203.29
9590.56

Rasio
Ratio
Perubahan
perubahan perubahan
BIC
BIC
jarak

156.28
220.83
293.78
313.74
323.38
327.41
349.06
357.60
361.58
364.66
371.64
378.18
385.78
387.27

1.00
1.41
1.88
2.01
2.07
2.09
2.23
2.29
2.31
2.33
2.38
2.42
2.47
2.48

1.27
1.46
1.14
1.07
1.03
1.19
1.08
1.04
1.03
1.08
1.08
1.10
1.02
1.05

Lampiran 4. Anggota gerombol dari Dua Tahap Metode

Gerombol
Anggota
Gerombol 1 Kuping gajah/Kimpul, Pakis haji, Dadap serep, Temu ireng, Bengle
Gerombol 2 Oleander, Sirsak, Sambiloto, Murbai, Sawo kecik, Ketapang, Jagung, Landep,
Daun ungu, Ki Tajam, Keji Besi, Gandarusa, Manukan, Pletesan, Keji Beling
No.4, Chong Nang, Kisambang, Bayam Merah, Sangkuang, Semplek, Kenanga,
Kaki Kuda, Adas Manis, Lame areuy, Tapak dara, Kopsia, Kayu rapet, Pule
pandak, Kamboja putih, Mondokaki, Ginje, Dlingo, Gaceng, Palem nicobarik,
Sahathavari, Daun seribu, Bandotan, Sembung, Urang aring, Tapak liman,
Prasman, Sambung nyawa, Kamilan/scented mayweed, Daun Beluntas,
Tempuyung, Stevia, Taraksakum/dandelion, Buyung, Kapuk randu, Kendal,
Kompre/Kompri, Daun kupu-kupu, Secang, Awa kudang-kudang, Nyamplung,
Manggis, Jelawe, Udani, Jambu bol/Simpur, Kokain, Croton, Patikan kebo,
Sambang darah, Jarak pagar, Meniran, Katuk, Lobi-lobi, Daun jinten,
Lenglengan, Po o/ menta, Janggelan/Cincau hitam, Selasih/kemangi, Nilam,
Timi, Manis jangan, Adem ati/Kapu ketek, Bawang daun/bawang oncang, Lidah
buaya ,Cakar ayam, Paku hata, Rambut gatal/Barbadaos cherry, Pacar
cina/pacar culam, Mimba, Kayu lanang/songgo langit, Renceh/Mindi , Kecapi,
Mahoni daun besar, Brotowali, Wangkal, Nangka, Awar-awar, Kayu putih,
Cengkeh, Saga, Orok-orok , Cabe jawa, Sirih, Daun sendok, Daun encok, Sereh,
Larasetu, Alang-alang, Jakang, Kelembak, Rumek, Som/Ginseng putih, Olig,

23
Kopi robusta, Mengkudu/Pace, Jeruk nipis, Kemuning , Godong minggu,
Cendana , Sawo ijo/Apel ijo, Gigil, Tembakau , Kola , Jati belanda/ Jati londo ,
Coklat, Senggugu , Jarong lalaki/pecut kuda , Legundi, Lengkuas merah,
Kapulaga, Resah/hanggana, Pacing, Kunyit/kunir, Temu giring, Temulawak,
Temu putih, Kencur, Kecombrang , Lempuyang wangi, Jahe
Gerombol 3 Wortel, Keladi Tikus, Tanganan, Anuma, Seruni, Kecubung gunung, Ambre,
Kembang sepatu, Kina, Digitalis
Lampiran 5. Anggota gerombol dari Dua Tahap Penggerombolan

Gerombol
Gerombol 1

Gerombol 2

Gerombol 3

Anggota
Oleander, Sirsak, Sambiloto, Semplek, Wortel, Kayu rapet, Dlingo, Kuping
gajah/Kimpul, Sahathavari, Anuma, Sembung, Kamilan/scented mayweed,
Tempuyung, Stevia, Kapuk randu, Kendal, Kompre/Kompri, Daun kupu-kupu,
Jelawe, Pakis haji, Jambu bol/Simpur, Timi, Bawang daun/bawang oncang ,
Lidah buaya, Cakar ayam, Kecapi, Cengkeh, Saga, Sereh, Larasetu, Alangalang, Jakang, Som/Ginseng putih, Kina, Mengkudu/Pace, Godong
minggu/inggu, Coklat, Senggugu, Lengkuas merah, Kapulaga, Pacing,
Temulawak, Kencur, Kecombrang, Lempuyang wangi, Jahe, Bengle
Jagung, Daun ungu, Gandarusa, Kisambang, Sangkuang, Kenanga, Kaki Kuda,
Mondokaki, Tanganan, Palem nicobarik, Daun seribu, Bandotan, Seruni, Tapak
liman, Daun Beluntas, Taraksakum/dandelion, Secang , Nyamplung, Udani,
Patikan kebo, Sambang darah, Jarak pagar, Meniran, Katuk, Lobi-lobi, Ambre,
Daun jinten, Janggelan/Cincau hitam, Selasih/kemangi, Nilam, Adem ati/Kapu
ketek, Paku hata, Kembang sepatu, Pacar cina/pacar culam, Kayu
lanang/songgo langit, Renceh/Mindi, Mahoni daun besar, Wangkal, Kayu
putih, Orok-orok, Cabe jawa, Sirih, Daun sendok, Daun encok, Kelembak,
Rumek, Olig, Jeruk nipis, Sawo ijo/Apel ijo, Digitalis, Kecubung gunung,
Tembakau, Kola, Temu ireng, Prasman
Murbai, Sawo kecik, Ketapang, Landep, Ki Tajam, Keji Besi, Manukan,
Pletesan, Keji Beling No.4, Chong Nang, Bayam Merah, Adas Manis, Lame
areuy, Tapak dara, Kopsia, Pule pandak, Kamboja putih, Ginje, Gaceng, Keladi
Tikus, Urang aring, Sambung nyawa, Buyung, Awa kudang-kudang, Manggis,
Kokain, Croton, Lengle