Clustering Jamur Asterinaceae Menggunakan Metode K-Means

CLUSTERING JAMUR ASTERINACEAE MENGGUNAKAN
METODE K-MEANS

RADHEN INTHAN LEOTHRIANSARI VUTACO

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Clustering Jamur
Asterinaceae Menggunakan Metode K-Means adalah benar karya saya dengan
arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada
perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya
yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam
teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.

Bogor, Februari 2014
Radhen Inthan Leothriansari Vutaco
NIM G64096047

ABSTRAK
RADHEN INTHAN LEOTHRIANSARI VUTACO. Clustering Jamur
Asterinaceae Menggunakan Metode K-Means. Dibimbing oleh SRI NURDIATI
dan AZIZ KUSTIYO.
Jamur merupakan salah satu tanaman yang banyak dibudidaya oleh para
petani di daerah dataran tinggi. Jamur adalah makhluk hidup eukariota yang
bersifat heterotrof, yaitu menyerap zat organik dari lingkungannya sehingga
hidupnya bersifat parasit dan saprofit. Keanekaragaman jenis jamur ini
menyebabkan kesulitan untuk membedakan antara jenis yang satu dengan yang
lainnya. Sebelum mengenali jenis jamur dalam hal ini adalah jamur taksa
Australia Asterinaceae, diperlukan suatu pengelompokan atau clustering agar
dapat dikenali berdasarkan cirinya. Dalam pengelompokan jamur ini, ciri yang
dimiliki dikonversi ke dalam bentuk biner. Clustering jamur dengan metode KMeans kemudian digunakan. Dalam clustering ini terdapat tiga tahapan utama,
yaitu normalisasi, metode K-Means, dan penghitungan Indeks Davies Bouldin.
Penelitian ini mendapatkan clustering terbaik pada jumlah cluster 10.
Kata kunci: Indeks Davies Bouldin, jamur Asterinaceae, K-Means.


ABSTRACT
RADHEN INTHAN LEOTHRIANSARI VUTACO. Clustering Fungus
Asterinaceae Using K-Means Methods. Supervised by SRI NURDIATI and AZIZ
KUSTIYO.
Fungi are one of the many cultivated crops by farmers in upland areas.
Fungi are beings who are heterotrophic eukaryotes, which absorbs organic
matter from the environment so that his life is parasitic and saprophyte. Diversity
of these fungi cause difficulty to distinguish between one type and another. Before
identifying fungi taxa Asterinaceae Australia, a grouping or clustering method is
required to recognize the fungi by their characteristics. In grouping these fungi,
characteristics possessed are first converted into binary form. K-Means clustering
method is then utilized. There are three main stages for the clustering purpose,
namely normalization, K-Means method, and Davies Bouldin Index calculation.
The results show that the best clustering is obtained with 10 clusters.
Keywords: Davies Bouldin Index, fungi Asterinaceae, K-Means.

i

CLUSTERING JAMUR ASTERINACEAE MENGGUNAKAN

METODE K-MEANS

RADHEN INTHAN LEOTHRIANSARI VUTACO

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

ii

Penguji: Muhammad Asyhar Agmalaro, SSi, MKom


iii

Judul Skripsi
Nama
NIM

: Clustering Jamur Asterinaceae Menggunakan Metode K-Means
: Radhen Inthan Leothriansari Vutaco
: G64096047

Disetujui oleh:

Dr Ir Sri Nurdiati, MSc
Pembimbing I

Aziz Kustiyo, SSi, MKom
Pembimbing II

Diketahui oleh:


Dr Ir Agus Buono, MSi, MKom
Ketua Departemen

Tanggal Lulus :

iv

PRAKATA
Puji dan syukur penulis panjatkan kehadirat Allah subhanahu wa ta’ala atas
limpahan rahmat dan karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan.
Shalawat serta salam tidak lupa penulis curahkan kepada Nabi Besar Muhammad
shallallahu ‘alaihi wassalam, keluarga, sahabat, serta umatnya hingga akhir
zaman. Tulisan ini merupakan hasil penelitian yang penulis lakukan sejak Oktober
2011 hingga Oktober 2013. Judul yang dipilih dalam penelitian ialah Clustering
Jamur Asterinaceae Menggunakan Metode K-Means.
Terima kasih penulis ucapkan kepada seluruh pihak yang telah membantu
dalam penelitian ini, yaitu:
1 Ayahanda Amin Fauzi, ST, Ibunda Aisyah, Suami Indra Permana, Bidadari
kecil bunda Kayla Dzakirah Almahyra, Kakak R.Anthon.NV, dan Adik
R.Enthan.DV yang telah memberikan cinta, kasih sayang, doa, semangat,

serta dukungan yang begitu berharga.
2 Ibu Dr. Ir. Sri Nurdiati, MSc dan Bapak Aziz Kustiyo, SSi, MKom selaku
pembimbing yang telah banyak memberikan saran, masukan dan dukungan
kepada penulis.
3 Dosen penguji, Bapak Muhammad Asyhar Agmalaro, SSi, MKom atas
saran dan bimbingannya.
4 Rekan-rekan Alih Jenis Ilmu Komputer angkatan 4, atas kerjasamanya
selama penelitian.
5 Rekan-rekan Badan Kepegawaian Daerah Pemerintah Provinsi DKI Jakarta,
khususnya Sub Bidang Data Kepegawaian atas pengertian dan
kerjasamanya.
6 Para sahabat: Sri Rahayu Natasia, Nina Maria Priyatina dan Aokiriduan
Hayyi telah berbagi ilmu dan pengetahuan serta dorongan semangat selama
pengerjaan skripsi.
7 Pihak-pihak lain yang tidak dapat penulis sebutkan satu persatu yang telah
membantu penulis dalam menyelesaikan tugas akhir ini.
Penulis menyadari dalam tugas akhir ini masih banyak kekurangan dan
kesalahan, karena itu penulis mengharapkan kritik dan saran yang membangun.
Harapan penulis semoga penelitian dan tulisan ini bermanfaat untuk pihak-pihak
terkait.

Bogor, Februari 2014
Radhen Inthan Leothriansari Vutaco

v

DAFTAR ISI

DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

PENDAHULUAN


1

Latar Belakang

1

Tujuan Penelitian

1

Manfaat Penelitian

1

Ruang Lingkup Penelitian

1

TINJAUAN PUSTAKA


1

Asterinaceae

1

K-Means

2

Indeks Davies Bouldin

2

METODE PENELITIAN

3

Pengumpulan Data Ciri Jamur


3

Praproses Data

4

Clustering Menggunakan Metode K-Means

4

Analisis Hasil Clustering

4

Lingkungan Implementasi

4

HASIL DAN PEMBAHASAN


5

Pengumpulan Data Ciri Jamur

5

Praproses Data

5

Clustering Menggunakan Metode K-Means

6

Analisis Hasil Clustering

7

SIMPULAN DAN SARAN

12

Simpulan

12

Saran

12

DAFTAR PUSTAKA

12

LAMPIRAN

14

vi

DAFTAR TABEL
1 Hasil pengamatan Indeks Davies Bouldin
2 Hasil clustering dengan 3 cluster
3 Perbandingan kelas Asterinaceae berdasarkan Rahayu (1992) dengan hasil
clustering (k=3)
4 Hasil clustering dengan 5 cluster
5 Perbandingan kelas Asterinaceae berdasarkan Rahayu (1992) dengan hasil
clustering (k=5)
6 Perbandingan kelas Asterinaceae berdasarkan Rahayu (1992) dengan hasil
clustering (k=10)
7 Hasil clustering dengan 10 cluster

6
7
8
9
10
11
10

DAFTAR GAMBAR
1 Diagram tahapan proses penelitian
2 Diagram pengamatan Indeks Davies Bouldin
3 Diagram banyaknya perbedaan hasil clustering

3
7
11

DAFTAR LAMPIRAN
1
2
3
3

Tabel fitur ciri
Kode fitur ciri
Nilai varians dari masing-masing cluster
Tabel fitur ciri yang berbeda

14
17
20
21

1

PENDAHULUAN
Latar Belakang
Asterinaceae merupakan salah satu cendawan yang hidup di permukaan
daun. Di seluruh dunia telah dikenal sebanyak 336 spesies Asterinaceae (Kirk et
al. 2008). Rahayu (1992) telah mendeskripsikan 135 spesies Asterinaceae asal
Australia. Spesies ini dibangun berdasarkan 116 ciri morfologi. Ciri-ciri yang
terdapat pada setiap spesies tersebut terkadang memiliki kemiripan yang
menyebabkan beberapa spesies tersebut saling terkait satu sama lain. Banyaknya
fitur yang dimiliki oleh jamur yang sebagian fitur antar-jamur tersebut memiliki
ciri yang hampir sama, membuat jamur-jamur tersebut harus dikelompokkan
menurut kesamaan ciri fiturnya.
Penerapan clustering menggunakan metode K-Means diharapkan dapat
meminimalisasikan objective function yang di-setting dalam proses clustering,
yang pada umumnya berusaha meminimalkan variasi di dalam suatu cluster dan
memaksimalkan variasi antar-cluster.
Tujuan Penelitian
Tujuan penelitian ini adalah mengimplementasikan metode K-Means dalam
clustering data jamur Asterinaceae dan memperoleh kesamaan karakteristik antarjamur dari hasil clustering menggunakan K-Means.
Manfaat Penelitian
Penelitian ini diharapkan dapat menghasilkan clustering jamur Asterinaceae
secara tepat dan konsisten untuk mengenali jenis jamur serta dapat membantu
pihak terkait dalam menganalisis dan mengelompokkan jamur Asterinaceae
berdasarkan kesamaan karakteristiknya. Penelitian ini juga diharapkan nantinya
dapat dijadikan tahapan praproses klasifikasi untuk penelitian selanjutnya.
Ruang Lingkup Penelitian
Penelitian ini dibatasi pada data jamur Asterinaceae yang akan digunakan
yaitu merupakan data penelitian Rahayu (1992). Data ini terdiri atas 116 fitur ciri
dan 135 spesies jamur.

TINJAUAN PUSTAKA
Asterinaceae
Cendawan merupakan suatu kelompok mikroorganisme yang sangat besar
dan dapat ditemukan pada semua relung ekologi. Menurut Hawksworth (1991),
diperkirakan 1 500 000 spesies cendawan terdapat di dunia dan 69 000 spesies

2
telah dideskripsikan. Pengelompokan spesies cendawan tersebut dilakukan
berdasarkan morfologinya. Asterinaceae merupakan salah satu cendawan yang
hidup di permukaan daun. Di seluruh dunia telah dikenal 336 spesies Asterinaceae
(Kirk et al. 2008). Rahayu (1992) telah mendeskripsikan 135 spesies Asterinaceae
asal Australia.
K-Means
K-Means merupakan algoritme clustering yang digunakan untuk klasifikasi
atau mengelompokkan objek berdasarkan atribut atau fitur ke dalam sejumlah k
kelompok (Teknomo 2006b). Algoritme ini dikembangkan oleh MacQueen pada
tahun 1967. Metode K-Means ini secara umum dilakukan dengan algoritme dasar
sebagai berikut:
1 Tentukan jumlah cluster.
2 Alokasikan data ke dalam cluster secara random.
3 Hitung centroid dari data yang ada di masing-masing cluster.
4 Alokasikan masing-masing data ke centroid terdekat.
5 Kembali ke langkah 3, apabila masih ada data yang berpindah cluster.

Indeks Davies Bouldin
Indeks Davies Bouldin (IDB) digunakan untuk mengukur validasi hasil
clustering sehingga menghasilkan IDB terbaik. IDB terbaik adalah yang
mempunyai nilai minimum atau terkecil. Pengukuran dengan IDB ini
memaksimalkan jarak inter-cluster antara cluster Ci dan Cj dan pada waktu yang
sama mencoba untuk meminimalkan jarak antartitik dalam sebuah cluster. Jika
jarak inter-cluster maksimal berarti kesamaan karakteristik antar-masing-masing
cluster sedikit sehingga perbedaan antar-cluster terlihat lebih jelas. Jika jarak
intra-cluster minimal berarti masing-masing objek dalam cluster tersebut
memiliki tingkat kesamaan karakteristik yang tinggi. Adapun jarak intra-cluster
Sc(Qk) dalam cluster Qk dapat dihitung sebagai berikut:

dengan Nk adalah banyak titik yang termasuk dalam cluster Qk dan Ck adalah
centroid dari cluster Qk. Jarak inter-cluster didefinisikan:

dengan Ck dan Cl adalah centroid cluster k dan cluster l. Di lain pihak, Indeks
Davies Bouldin didefinisikan:

3
dengan nc adalah banyak cluster. Skema clustering yang optimal menurut Indeks
Davies Bouldin ialah yang memiliki Indeks Davies Bouldin minimal (Salazar et
al. 2002).

METODE PENELITIAN
Secara garis besar penelitian ini dilaksanakan dalam lima tahapan, yaitu (1)
pengumpulan data ciri jamur, (2) praproses data, (3) clustering menggunakan
metode K-Means, (4) analisis hasil clustering. Ilustrasi tahapan proses penelitian
disajikan pada Gambar 1.
Pengumpulan data
ciri jamur

Praproses data

Clustering menggunakan
Metode K-Means

Analisis
hasil clustering
Gambar 1 Diagram tahapan proses penelitian
Pengumpulan Data Ciri Jamur
Data yang digunakan dalam penelitian ini berupa data cendawan famili
Asterinaceae. Data cendawan ini merupakan hasil penelitian dari Rahayu (1992),
Departemen Biologi, Fakultas Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Data tersebut didapat dengan menganalisis Asterinaceae yang menumpang pada
tanaman indung (host).
Data pada penelitian Rahayu (1992) memiliki 116 fitur ciri dari 135 spesies
jamur. Dari 116 fitur ciri, ada 12 fitur ciri yang merupakan data kontinu, serta 104
fitur ciri yang merupakan data nominal dan ordinal.
Praproses Data
Praposes data adalah tahapan yang dilakukan untuk memisahkan data
berdasarkan jenis datanya. Ada 2 jenis data pada fitur jamur Asterinaceae ini,
yaitu data nominal dan data numerik. Penelitian ini hanya mengambil data

4
nominal saja. Data numerik ini ditiadakan dengan pertimbangan jumlah data
numerik hanya terdapat pada 12 fitur ciri. Pada tahap ini dilakukan pengkodean
terhadap data. Pengkodean ini dilakukan untuk memudahkan perhitungan jarak
antartitik.
Clustering Menggunakan Metode K-Means
Algoritme K-Means dimulai dengan menentukan jumlah k centroid sesuai
kebutuhan user. Setiap objek diukur jaraknya ke semua centroid. Pengelompokan
dilakukan berdasarkan jarak minimum objek ke salah satu centroid cluster.
Penghitungan jarak pada data nominal digunakan fungsi jarak Hamming
(Hamming distance) dengan rumus berikut (Teknomo 2006a):
Di =

0

jika xi = y

1

selainnya

Setelah didapatkan banyak data yang bernilai 1, maka dihitung
persentasenya dengan rumus:
Banyak data

x 100%
Total seluruh data
Setelah cluster diperoleh, dilakukan penghitungan ulang centroid dengan
mencari nilai tengah dari setiap komponen satu cluster. Setelah didapatkan
centroid baru, jarak objek dengan centroid kembali dihitung. Iterasi pada
algoritme K-Means akan berhenti apabila centroid cluster tidak berubah atau
anggota cluster tetap sama.
Hasil clustering yang diperoleh menggunakan metode K-Means divalidasi
dengan menggunakan Indeks Davies Bouldin (IDB). Clustering dengan hasil IDB
terbaik tersebut merupakan yang paling baik dalam pengelompokan jamur
Asterinaceae ini.
Analisis Hasil Clustering
Tahap ini merupakan tahapan yang memperlihatkan representasi terhadap
cluster yang sudah divalidasi. Representasi tersebut memperlihatkan karakteristik
masing-masing cluster dan centroid dari cluster yang diolah menggunakan
metode K-Means sehingga diperoleh informasi penting mengenai karakteristik
alami data. Informasi penting yang tersembunyi dari hasil cluster diharapkan
bermanfaat sehingga dapat diperoleh penanganan terhadap cluster yang
bersangkutan.
Lingkungan Implementasi
Lingkungan implementasi yang digunakan sebagai berikut:
Perangkat Keras:
- Processor Intel Core 2 Duo
- RAM kapasitas 2 GB
- Harddisk kapasitas 250 GB

5
Perangkat lunak:
- Sistem Operasi Microsoft Windows 7 Ultimate
- MATLAB R2008b
- Microsoft Excel 2007

HASIL DAN PEMBAHASAN
Pengumpulan Data Ciri Jamur
Data fitur ciri Asterinaceae terlampir pada Lampiran 1. Data tersebut
merepresentasikan ciri pembeda antara spesies dan cara pengkodean ciri. Sebagai
contoh, kolom ‘colonies’ terdiri atas 3 kategori pembeda yaitu occurance,
distribution, dan outline. Occurance terdiri atas 2 sub kategori pembeda yaitu
epigenous dan hypogenous, dan keduanya dikodekan dengan 1 atau 0, dengan 1
merepresentasikan present (ada), dan 0 merepresentasikan absent (tidak ada).
Contoh rentetan kode dari Asterina cordylines sebagai representasi data nominal
dapat diartikan sebagai berikut: epigenous ada, hypogenous ada, distribution
singular dan confluent ada, outlines orbicular absent, irregular ada, maka bisa
ditulis dengan: 1,1,1,1,0,1. Untuk data kode karakter dapat dilihat pada Lampiran
2.
Praproses Data
Tahapan praproses data merupakan tahapan lanjutan setelah tahapan
pengumpulan data selesai. Pengkodean dilakukan pada tahap ini. Jamur yang
memiliki ciri yang hanya terdiri atas 2 subkategori fitur ciri mudah untuk
direpresentasikan, sedangkan jamur yang memiliki ciri yang terdiri atas 3 atau
lebih subkategori memerlukan proses lebih lanjut untuk merepresentasikannya.
Misalnya, pada ciri ‘hyphae’ terdapat kategori ‘arrangement’ yang memiliki 4 sub
kategori yang masing-masing subkategori memiliki 4 atribut. Keempat atribut
tersebut pada mulanya diberi simbol angka bilangan real, kemudian diubah
menjadi bilangan biner yang terdiri atas 3 digit. Hasil salah satu terjemahannya
antara lain:
Unilateral → (1) no
(2) less
(3) moderate
(4) more
diterjemahkan ke biner menjadi
1→ 001
2→ 010
3→ 011
4→ 111
Selanjutnya, bilangan biner yang merepresentasikan sub kategori dari satu
fitur ini dipecah antar-digitnya, sehingga subkategori yang tadinya terdiri atas 1
kolom, kini terdiri atas 3 kolom. Hal yang sama dilakukan untuk sub kategori
yang memiliki 3 atau lebih atribut. Pemisahan digit biner untuk beberapa sub

6
kategori ini mengakibatkan jumlah kolom yang tadinya hanya berjumlah 104
kolom berubah menjadi 223 kolom.
Clustering Menggunakan Metode K-Means
Clustering hasil dari praproses data dilakukan dengan menerapkan algoritme
K-Means. Jumlah cluster yang diinginkan dalam algoritme ini menjadi hal
pertama yang ditentukan. Penelitian ini menggunakan 3 cluster. Percobaan
pertama dengan menggunakan 3 cluster, percobaan kedua menggunakan 5 cluster,
dan percobaan ketiga menggunakan 10 cluster. Selanjutnya, ditentukan centroid
lalu dihitung jarak setiap dokumen terhadap setiap centroid dengan jarak
Hamming. Setelah jarak Hamming dari masing-masing karakteristik jamur
didapat, langkah selanjutnya adalah mencari nilai varians dari masing-masing
percobaaan cluster. Nilai varians didapat dari pembagian antara jumlah seluruh
jarak Hamming dan jumlah data dikurang 1. Nilai varians dari masing-masing
percobaan cluster dapat dilihat pada Lampiran 3.
Nilai varians digunakan untuk mencari nilai Indeks Davies Bouldin. Indeks
Davies Bouldin digunakan untuk mengukur validitas hasil clustering dengan
menggunakan K-Means. Hasil dari pengamatan Indeks Davies Bouldin dapat
dilihat pada Tabel 1.
Tabel 1 Hasil pengamatan Indeks Davies Bouldin
Banyaknya Cluster
3
5
10

Indeks Davies Bouldin (IDB)
2.58
3.22
1.71

Pada Tabel 1, Indeks Davies Bouldin untuk percobaan cluster sebanyak 3
cluster memiliki indeks sebesar 2.58. Hal ini menunjukkan bahwa percobaan
dengan 3 cluster tersebut memiliki perbandingan antara jarak antar cluster dan
intra-clusternya sebesar 2.58. Begitu juga percobaan dengan 5 cluster yang
memiliki perbandingan antara jarak antar cluster dan intra-clusternya sebesar
3.22, dan untuk percobaan dengan 10 cluster memiliki perbandingan antara jarak
antar cluster dan intra-clusternya sebesar 1.71. Berdasarkan nilai pada Tabel 1
tersebut, dapat juga digambarkan grafik menurut indeksnya. Gambar grafik
pengamatan Indeks Davies Bouldin bisa dilihat pada Gambar 2. Berdasarkan
Gambar 2 dapat dilihat bahwa Indeks Davies Bouldin paling minimum adalah
1.71 dengan percobaan hasil clustering sebanyak 10 cluster.

7
3.5
3
2.5
2
1.5
1
0.5
0
3

5

10

Gambar 2 Grafik pengamatan Indeks Davies Bouldin
Analisis Hasil Clustering
Hasil clustering dari masing-masing cluster dijabarkan sebagai berikut.
1

Clustering dengan 3 cluster
Hasil clustering dengan 3 cluster dapat dilihat pada Tabel 2.
Tabel 2 Hasil clustering dengan 3 cluster
1
1
12
15
16
17
18
19
20
21
22
23
24
25
26
77
79
88
91
92
93
94
95
96
100
101

Cluster
2
33
34
40
42
43
44
51
52
53
54
55
56
57
58
97
98
99
103
104
105
109
110
111
112
113

3
2
3
4
5
6
7
8
9
10
11
13
14
28
29
83
84
85
118
119
120
130
131
132

1
27
30
35
48
49
50
69
70
71
72
73
74
75
76
102
106
107
108
115
116
117
121
122
123

Cluster
2
59
60
61
62
63
64
65
66
67
68
86
87
89
90
114
124
125
126
127
128
129
133
134
135

3
31
32
36
37
38
39
41
45
46
47
78
80
81
82

8
Kolom yang tidak diberi warna pada Tabel 2 artinya berada di satu kelas
yang sama pada penelitian Rahayu (1992), sedangkan kolom yang diberi
warna artinya berada pada kelas yang berbeda. Ada 9 spesies jamur yang
berada di kelas yang berbeda pada penelitian tersebut. Perbandingan
perbedaan kelas dari hasil clustering dengan hasil penelitian Rahayu (1992)
dapat dilihat pada Tabel 3.
Tabel 3 Perbandingan kelas Asterinaceae berdasarkan
Rahayu (1992) dengan hasil clustering (k=3)
Data
1
12
27
30
35
88
40
78
85

Kelas Asterinaceae berdasarkan
Rahayu (1992)
3
3
3
3
3
2
3
1
2

Hasil
Clustering
1
1
1
1
1
1
2
3
3

Dari Tabel 3 dapat dilihat bahwa hasil clustering pada cluster 1
mempunyai jarak lebih dekat dengan cluster 3 dibandingkan dengan cluster 2.
2 Clustering dengan 5 cluster
Hasil clustering dengan 5 cluster dapat dilihat pada Tabel 4. Sama seperti
yang dibahas sebelumnya, kolom yang tidak diberi warna pada Tabel 5 artinya
berada di satu kelas yang sama pada penelitian Rahayu (1992). Ada 16
spesies jamur yang berada di kelas yang berbeda pada penelitian tersebut.
Perbandingan perbedaan kelas dari hasil clustering dengan hasil penelitian
Rahayu (1992) dapat dilihat pada Tabel 5. Dari Tabel 5 dapat dilihat bahwa
hasil clustering pada cluster 1 dan 2 mempunyai jarak lebih dekat dengan
cluster 5. Hasil clustering pada Cluster 3, 4, dan 5 mempunyai jarak lebih
dekat dengan cluster 2. Data 91, 92, dan 93 berada dalam satu kelas yang
sama pada penelitian Rahayu (1992), tetapi tersebar pada kelas yang berbeda
dalam hasil clustering.

9
Tabel 4 Hasil clustering dengan 5 cluster
1
2
11
12
15
16
17
18
19
20
24
25
26
69
70
93
94
95
96
106
107
108
115
116
117
118
119
120

2
10
33
34
35
37
38
40
41
42
43
44
51
52
53
63
64
65
66
67
68
74
75
76
81
82
83
84
86
87
88
89
90
91
99
101
102
133
134
135

Cluster
3
32
103
104
105
109
110
111

4
1
3
4
21
22
23
27
29
30
36
48
49
50
71
72
73
77
78
79
80
85
92
100
121
122
123

5
5
6
7
8
9
13
14
28
31
39
45
46
47
54
55
56
57
58
59
60
61
62
97
98
112
113
114
124
125
126
127
128
129
130
131
132

10
Tabel 5 Perbandingan kelas Asterinaceae berdasarkan
Rahayu (1992) dengan hasil clustering (k=5)
Data

Kelas Asterinaceae berdasarkan
Rahayu (1992)

Hasil
Clustering

2
11
12
93
10
91
99
32
36
80
85
92
100
28
31
39

4
5
5
5
5
2
2
2
2
2
4
2
2

1
1
1
1
2
2
2
3
4
4
4
4
4
5
5
5

3 Clustering dengan 10 cluster
Hasil clustering dengan 10 cluster dapat dilihat pada Tabel 7. Seperti
yang dibahas sebelumnya, kolom yang tidak diberi warna pada Tabel 6 artinya
berada di satu kelas yang sama pada penelitian Rahayu (1992). Ada 5 spesies
jamur yang berada di kelas yang berbeda pada penelitian tersebut.
Perbandingan perbedaan kelas dari hasil clustering dengan hasil penelitian
Rahayu (1992) dapat dilihat pada Tabel 6.
Tabel 6 Perbandingan kelas Asterinaceae berdasarkan
Rahayu (1992) dengan hasil clustering (k=10)
Data
9
108
32
22
37

Kelas Asterinaceae berdasarkan
Rahayu (1992)
4
2
2
2
3

Hasil
Clustering
1
4
5
6
10

11
Tabel 7 Hasil clustering dengan 10 cluster
1
9
124
125
126
127
128
129

2
21
23
27
28
29
30
31
33
34
35
74
75
76
91
92
93
94
95
96
100
101
102
115
116
117

3
36
38
39
40
41
63
64
65
97
98
99
112
113
114
130
131
132

4
1
2
3
4
8
10
11
51
52
53
80
81
82
83
84
85
86
87
88
89
90
108
118
119
120

Cluster
5
6
32
15
103
16
104
17
105
18
109
19
110
20
111
22
24
25
26
69
70
106
107

7
5
6
7
12
13
14
45
46
47

8
48
49
50
66
67
68
71
72
73
121
122
123
133
134
135

9
77
78
79

10
37
42
43
44
54
55
56
57
58
59
60
61
62

Dari Tabel 7 dapat dilihat bahwa hasil clustering pada cluster 4, 5, dan 6
mempunyai jarak lebih dekat dengan cluster 2. Dan dari perbandingan semua
hasil clustering di atas, dapat digambarkan sebuah diagram mengenai banyaknya
ciri yang berbeda dari masing-masing percobaan clustering seperti yang terlihat
pada Gambar 3.
18
16
14
12
10
8
6
4
2
0
3

5

10

Gambar 3 Diagram banyaknya perbedaan hasil clustering

12
Gambar 3 menunjukkan adanya keterkaitan antara nilai Indeks Davies
Bouldin dan banyaknya spesies yang berbeda cluster dengan penelitian Rahayu
(1992) bahwa semakin kecil nilai Indeks Davies Bouldin semakin sedikit pula
spesies yang berbeda cluster-nya. Hasil terbaik yang didapat adalah yang
memiliki nilai Indeks Davies Bouldin minimum atau perbedaan cluster-nya paling
sedikit, yaitu pada percobaan hasil clustering dengan 10 cluster. Adapun fitur ciri
yang berbeda dengan hasil percobaan clustering (k=10) dapat dilihat pada
Lampiran 4. Lampiran 4 menunjukkan data spesies jamur yang hasil cluster-nya
berbeda dengan hasil penelitian Rahayu (1992) beserta fitur cirinya. Sebagai
contoh, pada data jamur ke-9, pada hasil percobaan seharusnya berada pada
cluster 1, namun pada penelitian Rahayu (1992) berada pada cluster 4. Fitur ciri
yang mempunyai perbedaan bisa dilihat pada Lampiran 4 dengan terjemahan kode
fitur ciri yang dapat dilihat pada Lampiran 2.

SIMPULAN DAN SARAN
Simpulan
Pada penelitian ini, clustering pada jamur Asterinaceae dilakukan dengan
algoritma K-Means berdasarkan fitur cirinya. Percobaan dilakukan dengan 3 kali,
yaitu menggunakan 3 cluster, 5 cluster, dan 10 cluster. Dari ketiga percobaan
tersebut, yang memiliki indeks minimum adalah pada 10 cluster, yang pada 10
cluster tersebut juga memiliki perbedaan cluster paling sedikit dengan penelitian
Manalu (2012).
Saran
Penelitian ini dapat dikembangkan lebih lanjut untuk mendapatkan hasil
cluster yang lebih baik. Hal-hal yang dapat dilakukan misalnya:
1 Menggunakan jumlah cluster yang lebih besar.
2 Menggunakan fitur ciri yang bernilai numerik dan fitur ciri yang bernilai
kontinu kontinu, tidak hanya fitur ciri yang bernilai nominal.

DAFTAR PUSTAKA
Hawksworth DL. 1991. The fungal dimension biodiversity: magnitude,
significance, and conservation. Mycological Research. 95(6): 641-655.
Kirk PM, Cannon PF, Minter DW, Stalpers JA. 2008. Dictionary of The Fungi.
Ed ke-10. Wallingford (UK): CABI Europe.
Rahayu G. 1992. Australian hyphopodiate Asterinaceae: a taxonomic revision
[disertasi]. Armidale (US): Departement of Botany, The University of New
England.

13
Salazar GEJ, Veles AC, Parra MCM, Ortega LO. 2002. A cluster validity index
for comparing non-hierarchical clustering methods. [diunduh 29 Desember
2012]. Tersedia pada: http://citeseer.ist.psu.edu/rd/salazar02cluster.pdf
Saraswati W. 2012. Clustering menggunakan Self Organizing Maps (studi kasus:
data perkembangan anak di Kabupaten Bogor) [skripsi]. Bogor (ID):
Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Teknomo K. 2006a. Hamming Distance. [diunduh 29 Desember 2012]. Tersedia
pada:
http://people.revoledu.com/kardi/tutorial/Similarity/HammingDistance.html
Teknomo K. 2006b. kMean. [diunduh 29 Desember 2012]. Tersedia pada: http://
http://people.revoledu.com/kardi/tutorial/kMean/WhatIs.htm

14
Lampiran 1 Tabel fitur ciri
Colonies
Occurance

1.
2.
3.
4.
5.
6.

Epigenous
Hypogenous
Singular
Confluent
Orbicular
Irregular

Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)

Branching density

13.

Arrangement

14.

Lightbrown
Brown
Darkbrown
Straight
Flexuous
Distinct(2),
indistinct(1)
Numerous(2),
rare(1)
Unilateral

Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)

Septation

7.
8.
9.
10.
11.
12.

15.

Alternate

16.

Opposite to
another branch
Opposite to
hyphopodia
Wide
Acute
Loose
Close

Distribution
Outline
Hyphae
Colour

Distribution

17.
Angles
Network

18.
19.
20.
21.

Hyphopodia
Density

22.

Distribution

23.

Location

Colour

24.
25.
26.
27.

Arrangement

28.

More(4),
moderate(3),
less(2), no(1)
Regular(1),
irregular(0)
Middle
Distal
Intercalary
Darker than
hyphae(1), similar
to hyphae(0)
Cluster

29.

Unilateral

More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)

Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)

More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)

15
Lanjutan
Hyphopodia (lanjutan)
30.

Alternate

31.

Opposite

32.

No septate

33.

1-septate

34.

2-septate

Stigmatopodia
Shape

35.

Cylindrical(1), not
cylindrical(0)

Stigmatocyst
Gross shape

36.
37.

Uniform(1),
versiform(0)
Hemispherical

38.

Ovate

39.

Cylindrical

40.

Vermiform

41.

Ampulliform

42.

Conical

43.

Bifid or tifid

44.

Entire

45.

Sinuous

46.

Lobate

47.

Deeply lobate

48.

Straight

49.

Reflex

50.

Antrorse

More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)

More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)

16
Lanjutan
Stigmatocyst (lanjutan)

Thyriothecia
Initial

Thickness

Outlines

Margins

51.

Subantrorse

52.

Curved

53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.

Lateral on 1 side
Lateral on 2 side
Terminal on stalk
Flat
Slightly convex
Moderately convex
Strongly convex
Orbicular
Ellipsoid
Linear
X or Y
Crenate
Fimbriate short
loose
Fimbriate short
close
Fimbriate long
loose
Fimbriate long
close
Straight
Flexuous
Isodiametric
Rectangular
Stellate cracks
Longitudinal slit
Cell disintegration
Radiate

66.
67.
68.
Cover wall
Cell wall
Opening

Basal wall
Asci
Number
Shape
Number of

Ascopores
Arrangement

69.
70.
71.
72.
73.
74.
75.
76.
77.

More(4), moderate(3),
less(2), no(1)
More(4), moderate(3),
less(2), no(1)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)

78.
79.
80.

Numerous(2),
few(1)
Ovate
Clavate
Ascospores

81.

Hamathecia

Present(1), absent(0)
Present(1), absent(0)
8-spored only(1), 8spored and less(0)
Present(1), absent(0)

82.
83.

Conglobate
Seriate

Present(1), absent(0)
Present(1), absent(0)

17
Lanjutan
Ascopores (lanjutan)
Colour

Constriction

Cell apices

84.
85.
86.
87.
88.
89.
90.

Palebrown
Brown
Darkbrown
Slightly
Moderately
Strongly
Round

91.

Gradually
attenuated
Bent

92.
Cell collapsed

93.

Cell equality

94.

Surface

95.
96.
97.
98.
99.
100.
101.
102.
103.

Location of germination

Germform

104.

Present(1),
absent(0)
Present(1),
absent(0)
Smooth
Granulose
Verrucose
Spinulose
Close to the apices
Middle
Close to the septum
Stigmatocysts
Stigmatocysts with
supporting cell
Primary hyphae

Lampiran 2 Kode fitur ciri
Kode Karakter
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10

Nama Karakter
colonies_epigenous
colonies_hypogenous
colonies_singular
colonies_confluent
colonies_orbicular
colonies_irregular
hyphae_lightbrown
hyphae_brown
hyphae_darkbrown
hyphae_straight

Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Yes(1), no(0)
Yes(1), no(0)
Yes(1), no(0)
On both apices(3), one
apex(2), no(1)
On both apices(3), one
apex(2), no(1)
On both apices(3), one
apex(2), no(1)

Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Present(1), absent(0)
Yes(1), no(0)
Yes(1), no(0)
Yes(1), no(0)
Yes(1), no(0)
Yes(1), no(0)
Yes(1), no(0)

18
Lanjutan
Kode Karakter
X11
X12
X13
X14
X15
X16
X17
X18
X19
X20
X21
X22
X23
X24
X25
X26
X27
X28
X29
X30
X31
X32
X33
X34
X35
X36
X37
X38
X39
X40
X41
X42
X43
X44
X45
X46
X47
X48
X49
X50
X51

Nama Karakter
hyphae_flexuous
hyphae_septation
hyphae_branchingdensity
hyphae_unilateral
hyphae_alternate
hyphae_oppositebranch
hyphae_oppositehyphopodia
hyphae_wide
hyphae_acute
hyphae_loose
hyphae_close
hyphopodia_density
hyphopodia_distribution
hyphopodia_middle
hyphopodia_distal
hyphopodia_intercalary
hyphopodia_colour
hyphopodia_Cluster
hyphopodia_unilateral
hyphopodia_alternate
hyphopodia_opposite
hyphopodia_noseptate
hyphopodia_1septate
hyphopodia_2septate
stigmatopodia_shape
stigmatocysts_grossshape
stigmatocysts_hemispherical
stigmatocysts_ovate
stigmatocysts_cylindrical
stigmatocysts_vermiform
stigmatocysts_ampulliform
stigmatocysts_conical
stigmatocysts_bifid
outlines_entire
outlines_sinuous
outlines_lobate
outlines_deeplylobate
tipdirection_straight
tipdirection_reflex
tipdirection_antrorse
tipdirection_subantrorse

19

Lanjutan
Kode Karakter
X52
X53
X54
X55
X56
X57
X58
X59
X60
X61
X62
X63
X64
X65
X66
X67
X68
X69
X70
X71
X72
X73
X74
X75
X76
X77
X78
X79
X80
X81
X82
X83
X84
X85
X86
X87
X88
X89
X90
X91

Nama Karakter
tipdirection_curved
lateralon_1side
lateralon_2side
Terminalonstalk
thickness_flat
thickness_slightlyconvex
thickness_moderatelyconvex
thickness_stronglyconvex
outlines_orbicular
outlines_ellipsoid
outlines_linear
outlines_XorY
margins_crenate
fimbriate_short_loose
fimbriate_short_close
fimbriate_long_loose
fimbriate_long_close
coverwall_straight
coverwall_flexuous
cellwall_isodiametric
cellwall_rectangular
opening_stellate
opening_longitudinal
opening_celldisintegration
basalwall_radiate
asci_number
shape_ovate
shape_clavate
numberof_ascospores
numberof_hamathecia
arrangement_conglobate
arrangement_seriate
colour_palebrown
colour_brown
colour_darkbrown
constriction_slightly
constriction_moderately
constriction_strongly
apices_round
apices_gradually

20

Lanjutan
Kode Karakter
X92
X93
X94
X95
X96
X97
X98
X99
X100
X101
X102
X103
X104

Nama Karakter
apices_bent
cell_collapsed
cell_equality
surface_smooth
surface_granulose
surface_verrucose
surface_spinulose
close_to_the_apices
germination_midle
close_to_the_septum
Stigmatocysts
with_supporting_cell
primary_hyphae

Lampiran 3 Nilai varians dari masing-masing cluster
Percobaan dengan 3 cluster
var 1
40.73
var 2
44.29
var 3
47.97
Percobaan dengan 5 cluster
var 1
58.61
var 2
52.94
var 3
69.33
var 4
54.20
var 5
56.74
Percobaan dengan 10 cluster
var 1
34.83
var 2
36.29
var 3
42.06
var 4
44.75
var 5
29.83
var 6
31.76
var 7
32.87
var 8
37.92
var 9
4.5
var 10
29

21

Lampiran 4 Tabel fitur ciri yang berbeda
Data Jamur Ke-

Hasil Percobaan Clustering

Ciri yang berbeda

9

Cluster 1

X18, X19, X29, X33, X44, X45,
X46, X48, X50, X51, X67. X71,
X77, X78, X79, X80, X81, X82,
X83, X84, X85, X86, X87, X88,
X89, X90, X90, X91, X92, X93,
X95, X96, X97, X98, X99,
X102, X04

108

Cluster 4

X31, X41, X53, X92

22

Cluster 6

X1, X2, X3, X4, X6, X7, X9,
X10, X11, X12, X14, X15, X16,
X17, X18, X21, X22, X29, X30,
X32, X39, X44, X45, X48, X49,
X50, X52, X54, X58, X60, X64,
X65, X70, X71, X72, X73, X78,
X80, X82, X86, X87, X89, X90,
X91, X95, X99, X100, X104

32

Cluster 5

X2, X8, X9, X10, X11, X14,
X15, X16, X18, X20, X21, X22,
X23, X29, X30, X31, X33, X38,
X39, X41, X43, X44, X46, X47,
X69, X50, X51, X54, X58, X60,
X62, X66, X70, X71, X73, X74,
X80, X81, X85, X86, X87, X9,
X90, X91, X92, X93, X95, X99,
X101, X102, X104

37

Cluster 10

X1, X3, X6, X9, X10, X12, X13,
X16, X17, X18, X20, X22, X23,
X24, X25, X28, X29, X30, X31,
X32, X36, X39, X46, X47, X48,
X51, X54, X55, X59, X60, X67,
X68, X73, X81, X82, X86, X89,
X90, X91, X95, X96, X98, X99

22

RIWAYAT HIDUP
Penulis dilahirkan pada tanggal 27 Juli 1987 di Muara Enim. Penulis
merupakan anak kedua dari tiga bersaudara dari pasangan Bapak Amin Fauzi, ST
dan Ibu Aisyah.
Pada tahun 2005, penulis lulus dari SMA Negeri 1 Muara Enim. Pada tahun
yang sama, penulis lulus seleksi masuk IPB melalui jalur Undangan Seleksi
Masuk IPB. Pada tahun 2008, penulis lulus dari program Diploma Jurusan
Manajemen Informatika Institut Pertanian Bogor. Pada tahun 2009, penulis
melanjutkan program studi Sarjana di Departemen Ilmu Komputer, Institut
Pertanian Bogor, Program Studi Ilmu Komputer. Selama menjalani perkuliahan,
penulis juga bekerja sebagai Pegawai Negeri Sipil pada Badan Kepegawaian
Daerah Pemerintah Provinsi DKI Jakarta Sub Bidang Data Kepegawaian sampai
dengan saat ini.