Identifikasi Daun Shorea Menggunakan K-Nearest Neighbor dengan Ciri Statistical Textures

IDENTIFIKASI DAUN SHOREA MENGGUNAKAN
K-NEAREST NEIGHBOR DENGAN CIRI
STATISTICAL TEXTURES

AOKIRINDUAN HAYYI AOKO QOYYIMA

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Identifikasi Daun
Shorea Menggunakan K-Nearest Neighbor dengan Ciri Statistical Textures adalah
benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan
dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang
berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari
penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di
bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Desember 2013
Aokirinduan Hayyi Aoko Qoyyima
NIM G64096010

ABSTRAK
AOKIRINDUAN HAYYI AOKO QOYYIMA. Identifikasi Daun Shorea
Menggunakan K-Nearest Neighbor dengan Ciri Statistical Textures. Dibimbing
oleh AZIZ KUSTIYO.
Berbagai jenis pohon kelompok Shorea dari suku Dipterocarpaceae
mendominasi hutan hujan dataran rendah di Indonesia. Tiap jenis Shorea
memiliki kegunaan yang berbeda-beda dan merupakan penghasil kayu berkualitas
tinggi dalam industri konstruksi. Penelitian ini membangun suatu sistem
identifikasi daun Shorea menggunakan ekstraksi ciri teksur statistik dengan knearest neighbor sebagai alat pengklasifikasi. Metode statistik menganalisis
distribusi spasial dari nilai keabuan, dengan menghitung fitur lokal pada setiap
titik di dalam citra dan menurunkan kumpulan nilai statistik dari distribusi fitur
lokal tersebut. Perhitungan nilai-nilai level keabuan menghasilkan enam
parameter, yaitu mean, standar deviasi, smoothness, third moment, uniformity, dan
entropy. Penelitian ini menggunakan 10 jenis daun Shorea. Akurasi terbesar dari

penelitian ini yaitu sebesar 90%.
Kata kunci: k-nearest neighbor, Shorea, statistical textures

ABSTRACT
AOKIRINDUAN HAYYI AOKO QOYYIMA. Shorea Leaves Identification
Using K-Nearest Neighbor with Statistical Textures Feature. Supervised by AZIZ
KUSTIYO.
Various species of Shorea from Dipterocarpaceae family are dominating the
lowland rain forests in Indonesia. Each species of Shorea has a unique function
and can produce a high qualified timber in the construction industry. This research
built an identification system of Shorea leaves using the statistical textures feature
extraction with k-nearest neighbor as classifier. Statistical methods were utilized
to analyze the spatial distribution of gray level values, by computing local features
at each point in the image and deriving a set of statistical values from the
distribution of the local features. The calculation of gray level values resulted in
six parameters, namely mean, standard deviation, smoothness, third moment,
uniformity, and entropy. A highest accuracy of 90% was obtained for the
identification of 10 species of Shorea.
Keywords: k-nearest neighbor, Shorea, statistical textures


IDENTIFIKASI DAUN SHOREA MENGGUNAKAN
K-NEAREST NEIGHBOR DENGAN CIRI
STATISTICAL TEXTURES

AOKIRINDUAN HAYYI AOKO QOYYIMA

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013

Penguji:
1 Mushtofa, SKom, MSc

2 Karlina Khiyarin Nisa, SKom, MT

Judul Skripsi : Identifikasi Daun Shorea Menggunakan K-Nearest Neighbor
dengan Ciri Statistical Textures
Nama
: Aokirinduan Hayyi Aoko Qoyyima
NIM
: G64096010

Disetujui oleh

Aziz Kustiyo, SSi, MKom
Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi, MKom
Ketua Departemen

Tanggal Lulus:


Judul Skripsi: IdentifIkasi Daun Shorea Menggunakan K-Nearest Neighbor
dengan eiri Statistical Textures
Nama
: Aokirinduan Hayyi Aoko Qoyyima
NIM
: G64096010

Disetujui oleh

Aziz Kustiyo, SSi,_ .MKom
Pembimbing
...

Diketahui

Tanggal Lulus: .1 B DEC

2013


....

イQN M セ@

6feif

.

.

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
limpahan rahmat dan karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan.
Judul yang dipilih dalam penelitian yang dilaksanakan sejak bulan Oktober 2011
ini ialah Identifikasi Daun Shorea Menggunakan K-Nearest Neighbor dengan Ciri
Statistical Textures.
Terima kasih penulis ucapkan kepada seluruh pihak yang telah membantu
dalam penelitian ini, di antaranya yaitu:
1 Ayahanda H Rusmawi Baksin, Ibunda Hj Tri Hastuti, dan Kakak Karinduan
Sitti Hayyu Koyyumi yang telah memberikan cinta, kasih sayang, doa, serta

dukungan yang tidak terkira.
2 Yudi Esa Febriadi yang telah memberikan dukungan, doa, motivasi, dan kasih
sayang kepada penulis.
3 Bapak Aziz Kustiyo, SSi, MKom selaku pembimbing yang telah banyak
memberikan saran, ide, dan motivasi.
4 Dosen penguji, Bapak Mushtofa, SKom, MSc dan Ibu Karlina Khiyarin Nisa,
SKom, MT atas saran dan bimbingannya.
5 Pihak Kebun Raya Bogor atas pemberian sampel daun Shorea.
6 Sahabat-sahabat, Agung Tresna, Anela Febrid Yunita, Dewi Susanti, Hasrul
Adiputra, Haswanti, dan Nina Maria yang telah memberikan bantuan,
dukungan, doa, dan saran selama penelitian ini berlangsung.
7 Teman-teman satu bimbingan, Alita Wulan Dini, Iman Akbar Ramadhan, Lina
Herlina, dan Yuni Purnamasari, terima kasih atas kerjasamanya.
8 Teman-teman Alih Jenis Ilmu Komputer angkatan 4, atas kerjasamanya selama
penelitian.
Semoga karya ilmiah ini bermanfaat.

Bogor, Desember 2013
Aokirinduan Hayyi Aoko Qoyyima


DAFTAR ISI
DAFTAR TABEL

vii

DAFTAR GAMBAR

vii

DAFTAR LAMPIRAN

viii

PENDAHULUAN

1

Latar Belakang

1


Tujuan Penelitian

1

Ruang Lingkup Penelitian

2

TINJAUAN PUSTAKA

2

Shorea

2

Histogram

2


Statistical Textures

3

Confusion Matrix

3

Box Plot

3

METODE

4

Data Citra Daun

4


Praproses

5

Ekstraksi Ciri Tekstur

5

Pembagian Data Latih dan Data Uji

7

KNN

7

Hasil Prediksi

8

Lingkungan Pengembangan

8

HASIL DAN PEMBAHASAN

9

Data Citra Daun

9

Praproses

9

Ekstraksi Ciri Tekstur

11

Pembagian Data Latih dan Data Uji

17

KNN

18

Perbandingan dengan Penelitian Terkait

25

SIMPULAN DAN SARAN

26

DAFTAR PUSTAKA

27

LAMPIRAN

28

RIWAYAT HIDUP

46

DAFTAR TABEL
1
2
3
4
5
6
7
8
9
10
11

Pengaturan jarak pengambilan citra
Penetapan rentang nilai histogram
Pembagian citra latih dan uji berdasarkan pengundian
Confusion matrix percobaan 1 untuk k=8
Hasil kuadrat jarak pada data uji seminis kedua saat k=8
Hasil kuadrat jarak pada data uji leprosula pertama saat k=8
Confusion matrix percobaan 2 untuk k=7
Hasil kuadrat jarak pada data uji leprosula pertama saat k=7
Hasil kuadrat jarak pada data uji materialis pertama saat k=7
Hasil kuadrat jarak pada data uji palembanica pertama saat k=7
Perbandingan dengan penelitian terkait

9
10
18
19
19
20
23
23
24
24
25

DAFTAR GAMBAR
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

Confusion matrix untuk dua kelas
Penjelasan box plot
Diagram alir sistem
Diagram alir KNN
Citra jenis Shorea
Alur praproses
Pemotongan histogram untuk kelas javanica
Box plot mean tipe 1
Box plot standar deviasi tipe 1
Box plot smoothness tipe 1
Box plot third moment tipe 1
Box plot uniformity jenis 1
Box plot entropy tipe 1
Box plot mean tipe 2
Box plot standar deviasi tipe 2
Box plot smoothness tipe 2
Box plot third moment tipe 2
Box plot uniformity tipe 2
Box plot entropy tipe 2
Grafik akurasi percobaan 1
Box plot mean antara seminis dan johorensis
Box plot mean antara leprosula dan materialis
Grafik akurasi percobaan 2
Box plot mean antara leprosula dan javanica

3
4
5
7
9
10
10
12
12
13
13
14
14
15
15
16
16
17
17
18
20
21
22
25

DAFTAR LAMPIRAN
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36

Contoh citra dan histogram dari masing-masing kelas
Contoh data tekstur statistik dari masing-masing kelas
Contoh data tekstur statistik ternormalisasi dari masing-masing kelas
Confusion matrix percobaan 1 untuk k = 1
Confusion matrix percobaan 1 untuk k = 2
Confusion matrix percobaan 1 untuk k = 3
Confusion matrix percobaan 1 untuk k = 4
Confusion matrix percobaan 1 untuk k = 5
Confusion matrix percobaan 1 untuk k = 6
Confusion matrix percobaan 1 untuk k = 7
Confusion matrix percobaan 1 untuk k = 9
Confusion matrix percobaan 1 untuk k = 10
Box plot standar deviasi (posisi nilai 70.06) antara seminis dan
johorensis
Box plot smoothness (posisi nilai 0.07) antara seminis dan johorensis
Box plot third moment (posisi nilai -3.49) antara seminis dan johorensis
Box plot uniformity (posisi nilai 0.014) antara seminis dan johorensis
Box plot entropy (posisi nilai 6.74) antara seminis dan johorensis
Box plot standar deviasi (posisi nilai 68.08) antara leprosula dan
materialis
Box plot smoothness (posisi nilai 0.06) antara leprosula dan materialis
Box plot third moment (posisi nilai -4.02) antara leprosula dan
materialis
Box plot uniformity (posisi nilai 0.017) antara leprosula dan materialis
Box plot entropy (posisi nilai 6.40) antara leprosula dan materialis
Confusion matrix percobaan 2 untuk k = 1
Confusion matrix percobaan 2 untuk k = 2
Confusion matrix percobaan 2 untuk k = 3
Confusion matrix percobaan 2 untuk k = 4
Confusion matrix percobaan 2 untuk k = 5
Confusion matrix percobaan 2 untuk k = 6
Confusion matrix percobaan 2 untuk k = 8
Confusion matrix percobaan 2 untuk k = 9
Confusion matrix percobaan 2 untuk k = 10
Box plot standar deviasi (posisi nilai 0.54) antara leprosula dan
javanica
Box plot smoothness (posisi nilai 0.34) antara leprosula dan javanica
Box plot third moment (posisi nilai 0.25) antara leprosula dan javanica
Box plot uniformity (posisi nilai 0.31) antara leprosula dan javanica
Box plot entropy (posisi nilai 0.60) antara leprosula dan javanica

28
31
31
32
32
32
33
33
33
34
34
34
35
35
36
36
37
37
38
38
39
39
40
40
40
41
41
41
42
42
42
43
43
44
44
45

PENDAHULUAN
Latar Belakang
Hutan hujan dataran rendah di Indonesia didominasi oleh jenis-jenis
Dipterokarpa (Dipterocarpaceae). Dalam program pengembangan hutan tanaman
industri (HTI), jenis-jenis pohon suku Dipterokarpa terutama dari kelompok
Shorea spp seperti meranti merah dan beberapa jenis meranti kuning serta meranti
putih termasuk jenis-jenis yang diprioritaskan untuk dikembangkan sebagai
penghasil kayu bangunan berkualitas tinggi (Istomo et al. 1999).
Berdasarkan perihal tersebut, penelitian ini akan membangun suatu sistem
yang dapat digunakan untuk mengidentifikasi Shorea, dikarenakan begitu
banyaknya jenis dari Shorea yang memiliki kegunaan yang berbeda-beda. Hal ini
bertujuan agar tidak terjadi kesalahan dalam penggunaan kayu di dalam
kehidupan. Identifikasi tanaman dapat ditentukan berdasarkan ciri morfologi,
bentuk, dan tekstur.
Pada penelitian ini organ tumbuhan yang akan diamati adalah daun, karena
daun merupakan salah satu organ vegetatif tumbuhan yang tidak bergantung pada
musim dengan beberapa karakteristik yang dapat diamati. Selain itu, daun sangat
cocok sebagai alat identifikasi tanaman karena jumlah daun yang sangat
berlimpah dan selalu ada setiap waktu.
Proses identifikasi dilakukan dengan menggunakan teknik image
processing. Setelah itu, akan dilakukan proses pengklasifikasian terhadap
serangkaian citra masukan. Penelitian ini menggunakan objek citra daun Shorea
dengan menerapkan metode statistical textures untuk ekstraksi ciri tekstur.
Metode statistik menganalisis distribusi spasial dari nilai keabuan, dengan
menghitung fitur lokal pada setiap titik di dalam citra, dan menurunkan kumpulan
nilai statistik dari distribusi fitur lokal tersebut (Ojala dan Pietikäinen 2004).
Penelitian sebelumnya terkait dengan ekstraksi ciri tekstur dengan metode
statistical textures telah dilakukan oleh Muhtadan (2009), yang melakukan
penelitian mengenai ekstraksi ciri cacat pengelasan pada citra digital film
radiografi menggunakan geometric invariant moment dan statistical texture. Dari
penelitian tersebut, didapatkan enam parameter yang mampu menghasilkan nilai
yang berbeda untuk mewakili masing-masing jenis cacat pengelasan.
Pengklasifikasi yang akan digunakan dalam penelitian ini adalah k-nearest
neighbor (KNN). Nurjayanti (2011) melakukan identifikasi jenis Shorea
menggunakan metode KNN dan menggunakan karakteristik morfologi daun
sebagai bahan identifikasi.

Tujuan Penelitian
Tujuan penelitian ini adalah melakukan identifikasi terhadap sepuluh jenis
Shorea menggunakan ciri tekstur dengan menggunakan algoritme KNN.
Penelitian ini juga bertujuan untuk menghitung tingkat akurasi hasil prediksi dari
proses klasifikasi.

2
Ruang Lingkup Penelitian
Ruang lingkup penelitian ini yaitu:
1 Data diperoleh dari hasil pengambilan citra daun Shorea menggunakan kamera
digital. Objek citra merupakan koleksi daun Shorea yang berada di Kebun
Raya Bogor.
2 Citra daun yang digunakan adalah citra daun bagian atas.
3 Faktor pencahayaan saat pengambilan citra tidak dirancang.
4 Tekstur statistik yang digunakan yaitu mean, standar deviasi, smoothness, third
moment, uniformity, dan entropy.

TINJAUAN PUSTAKA
Shorea
Shorea (meranti) merupakan salah satu marga dari suku Dipterocarpaceae.
Secara harfiah, Dipterocarpaceae berasal dari kata latin, yaitu di=dua,
carpa=carpus=sayap, yang berarti buah bersayap dua. Shorea (jenis-jenis
meranti, bangkirai, dan balau) biasanya memiliki sayap bervariasi antara 2-5
sayap. Jenis-jenis Dipterokarpa tumbuh secara alami di sebagian besar daerah
Kalimantan, Sumatera, Jawa, Nusa Tenggara, Bali, Sulawesi, dan Maluku.
Sumatera menempati urutan ke dua setelah Kalimantan dalam hal kekayaan jenis
dan penyebaran jenis endemik di dunia (Tata et al. 2008). Shorea memiliki sekitar
194 jenis. Penyebarannya meliputi satu jenis di Jawa, satu atau dua jenis di
Sulawesi, tiga jenis di Maluku dan sisanya menyebar ke arah timur sampai
Maluku (Indonesia) dan tidak meluas ke Cina bagian selatan (Newman et al.
1999).
Ciri-ciri diagnostik utama Shorea adalah pohon sangat besar dengan kulit
kayu dalam berlapis-lapis atau coklat merah gelap. Pohon hampir selalu besar,
batang utama tinggi dan dua silindris. Tangkai daun berukuran sekitar 0.5-2.5 cm.
Daun berukuran panjang 4-18 cm dan lebar 2-8 cm, pangkal daun biasanya
simetris, permukaan bawah daun bila diraba licin, pertulangan sekunder bersisip,
berjumlah sekitar 7-25 pasang (Newman et al. 1999).

Histogram
Histogram derajat keabuan sebuah citra digital pada selang [0, L-1]
n , dengan
adalah derajat keabuan
merupakan sebuah fungsi diskret
yang ke-k dan n adalah jumlah piksel keabuan pada citra yang memiliki tingkat
dengan k = 0, 1, . . . , L 1. Melakukan normalisasi histogram merupakan
penerapan umum, yaitu dengan cara membagi setiap komponen dengan jumlah
seluruh piksel dalam citra, yang dinotasikan dengan produk MN, dengan M dan N
merupakan ukuran baris dan kolom citra. Sehingga normalisasi histogram yaitu:
(1)

3
dengan k = 0, 1, 2, ..., L 1. P( ) adalah estimasi dari probabilitas kejadian level
intensitas
pada suatu citra. Penjumlahan dari seluruh komponen suatu
normalisasi histogram sama dengan satu (Gonzalez dan Woods 2008).

Statistical Textures
Suatu pendekatan penting untuk melakukan deskripsi region adalah
menghitung kandungan teksturnya (texture content). Meskipun tidak ada definisi
formal mengenai tekstur, namun deskriptor ini memberikan pengukuran properti
seperti kehalusan (smoothness), kekasaran (coarseness), dan keteraturan
(regularity). Terdapat tiga prinsip pendekatan untuk mendeskripsikan tekstur
region yaitu statistik, struktural, dan spektral (Gonzales dan Woods 2008).
Pendekatan statistikal merupakan salah satu pendekatan mudah untuk
mendeskripsikan tekstur yaitu dengan menggunakan momen statistik dari
histogram intensitas suatu citra atau region (Muhtadan 2009).

Confusion Matrix
Confusion matrix merupakan alat yang berguna untuk menganalisis sebaik
apakah pengklasifikasi yang digunakan dalam mengenali tuples dari kelas yang
berbeda. Confusion matrix untuk dua kelas ditunjukkan pada Gambar 2 (Han dan
Kamber 2006).

Gambar 1 Confusion matrix untuk dua kelas
Jika terdapat m kelas, confusion matrix adalah suatu tabel yang setidaknya
berukuran m
m. Masukan
pada m baris dan m kolom pertama
mengindikasikan jumlah tuples dari kelas i yang telah diberi label oleh
pengklasifikasi sebagai kelas j (Han dan Kamber 2006).

Box Plot
Box plot merupakan teknik grafis univariat yang sangat berguna. Box plot
biasanya digambarkan secara vertikal, akan tetapi format horizontal juga
dimungkinkan. Box plot sangat baik dalam menyajikan informasi tentang tendensi
sentral, simetri dan kecondongan, serta pencilan. Gambar 1 merupakan penjelasan
mengenai notasi-notasi box plot. Box plot terdiri dari kotak persegi panjang yang
memuat 50 persen data, dengan atas dan bawah dibatasi oleh hinge yang masingmasing merepresentasikan kuartil Q3 dan Q1. Interquartile range (IQR) adalah
ukuran penyebaran data. Semakin tinggi atau semakin lebar IQR (tergantung pada
penggambaran box plot) menunjukkan data semakin menyebar. Garis melintang

4
pada kotak menunjukkan median, dan serat (whisker) yang menghubungkan
hinges dikedua sisi merepresentasikan data terkecil dan data terbesar. Pencilan
(outlier) didefinisikan sebagai suatu pengamatan yang tampak bertentangan atau
tidak konsisten terhadap pengamatan yang lain (Tukey 1979).

Gambar 2 Penjelasan box plot

METODE
Gambar 3 merupakan alur proses dari metode penelitian ini. Secara umum,
metode penelitian terdiri atas pengumpulan data penelitian, praproses, ekstraksi
ciri tekstur, pembagian data latih dan data uji, penyimpanan vektor fitur data latih
maupun uji, pengklasifikasian data uji dengan KNN, dan tahap terakhir yaitu hasil
prediksi.
Data Citra Daun
Jenis Shorea yang akan digunakan dalam penelitian ini terdiri atas sepuluh
spesies. Klasifikasi Shorea dibagi mendadi sepuluh kelas. Label kelas sesuai
dengan jenis Shorea yang akan digunakan. Untuk masing-masing kelas digunakan
sepuluh buah citra, sehingga total keseluruhan citra adalah 100 buah. Citra daun
Shorea yang digunakan pada penelitian ini diakuisisi sendiri dari Kebun Raya
Bogor.
Teknik pengambilan citra dilakukan dengan menggunakan kamera digital.
Daun diletakkan di atas kertas putih sebagai latar belakang. Jarak pengambilan
citra dibedakan tergantung pada ukuran citra daun. Proses seleksi terhadap citra
daun Shorea juga dilakukan, berdasarkan bentuk dan struktur daun. Pada
penelitian ini, pencahayaan pada saat pengambilan citra tidak dirancang.

5
Mulai

Citra Daun

Praproses

Ekstraksi Ciri
Tekstur

Data Latih

Data Uji

Simpan Vektor Fitur
dan Label Kelas

Simpan Vektor Fitur
dan Label Kelas

KNN

Hasil
Prediksi

Selesai

Gambar 3 Diagram alir sistem

Praproses
Sebelum masuk ke dalam tahap ekstraksi ciri, terlebih dahulu dilakukan
praproses untuk citra. Tahap praproses citra dilakukan untuk mempersiapkan citra
yang akan digunakan sebelum masuk tahap ekstraksi.
Citra masukan untuk untuk ekstraksi tekstur adalah citra grayscale. Citra
grayscale tersebut akan diubah ukurannya menjadi lebih kecil dari citra hasil
pemotretan awal. Setelah itu, dari citra grayscale tersebut akan dicari nilai
histogramnya. Nilai histogram tersebut akan dinormalisasi terlebih dahulu, dengan
cara membagi frekuensi setiap nilai derajat keabuan dengan jumlah seluruh piksel
dalam citra. Proses manipulasi histogram juga akan dilakukan. Manipulasi
tersebut yaitu penghilangan warna background dengan cara mengambil rentang
nilai derajat keabuan tertentu.

Ekstraksi Ciri Tekstur
Ekstraksi ciri tekstur akan dilakukan dengan menggunakan metode
statistical textures. Metode ini akan menghasilkan enam nilai ekstraksi tekstur
yaitu intensitas rerata, kontras rerata, smoothness, third moment, uniformity, dan
entropy. Di bawah ini merupakan penjelasan dari masing-masing ekstraksi yang
telah disebutkan (Leng et al. 2010).

6
1 Perhitungan pertama adalah mean , yang merepresentasikan intensitas rerata.
Anggaplah bahwa z adalah variabel acak yang melambangkan intensitas, dan
merupakan histogramnya, dengan
( merupakan
jumlah tingkat intensitas yang berbeda).


(2)

2 Perhitungan ke dua adalah standar deviasi
intensitas.

Perhitungan standar deviasi

yang menunjukkan kontras



(3)

diperoleh dengan mengakarkan nilai dari ragam.


(4)

3 Perhitungan ketiga adalah smoothness. Ragam
atau juga yang biasa
disebut momen ke dua merupakan bagian penting dalam deskripsi tekstur.
Momen tersebut adalah pengukuran kontras intensitas yang dapat memberikan
deskripsi kehalusan relatif (relative smoothness).
( ⁄

)

(5)

Nilai Ragam
dinormalisasi, karena nilai ragam cenderung menjadi besar
untuk citra grayscale, maka ragam ini dapat dinormalisasi dengan interval [0,
1].
4 Perhitungan keempat adalah third moment (momen ketiga). Momen ketiga
merupakan pengukuran dari kecondongan (skewness) histogram. Nilai third
moment ini juga dinormalisasi.


(6)

5 Perhitungan kelima adalah keseragaman (uniformity).


(7)

memiliki rentang nilai [0, 1] dan penjumlahanya sama dengan 1, pengukuran
adalah maksimum untuk suatu citra dengan semua tingkat keabuannya sama
(keseragaman maksimal).
6 Perhitungan terakhir yaitu average entropy atau entropi rerata. Entropi adalah
pengukuran variabilitas dan bernilai 0 untuk citra yang konstan.


(8)

Tiap ciri statistical textures akan dilakukan proses normalisasi, yaitu dengan
cara membagi setiap nilai dengan nilai terbesar dari himpunan nilai yang ada.
Normalisasi ini dilakukan per ciri tekstur. Hal ini dilakukan agar perbedaan nilai

7
antar ciri tekstur statistik tidak terlalu jauh. Semua ciri tekstur statistik yang telah
dinormalisasi akan memiliki rantang nilai dari nol sampai satu. Masing-masing
ciri statistical textures ini akan dibuat box plot.

Pembagian Data Latih dan Data Uji
Seluruh data hasil ekstraksi ciri tekstur dibagi menjadi data latih dan data
uji. Presentasi data latih dan data uji pada penelitian ini adalah 80%-20%, yang
dipilih secara acak.

KNN
K-nearest neighbor adalah salah satu contoh instance-based learning,
dengan set data pelatihan (training set) disimpan, sehingga klasifikasi untuk
record baru yang belum terklasifikasi dapat ditemukan hanya dengan
membandingkannya dengan record paling mirip dalam training set (Larose 2005).
Tahap pelatihan algoritme ini hanya menyimpan vektor fitur dan label kelas dari
sampel pelatihan (Mirkes 2011).
Teknik klasifikasi dari KNN diterapkan pada data latih yang tersedia.
Gambar 3 merupakan diagram alir dari algoritme KNN.
Mulai

Tentukan k (Jumlah
Tetangga Terdekat)

Hitung Jarak Data Uji Ke
Training Set
Urutkan k Data
Berdasarkan Jarak
Terkecil

Tentukan Prediksi Kelas
Data Uji Berdasarkan
Label Kelas Mayoritas

Selesai

Gambar 4 Diagram alir KNN
 Tentukan k (jumlah tetangga terdekat)
Variabel k merupakan jumlah tetangga terdekat dalam klasifikasi. Variabel k
merupakan bilangan bulat positif. Pada penelitian ini akan digunakan beberapa
nilai k.

8
 Hitung jarak data uji ke training set
Jarak yang digunakan dalam penilitian ini adalah jarak Euclidean. Tahap ini
merupakan perhitungan jarak terdekat untuk setiap data uji. Perhitungan jarak
bertujuan untuk mengetahui ukuran kedekatan antara data uji dan latih. Di
bawah ini merupakan rumus jarak Euclidean:
√∑

(9)

dengan x = , , ....,
dan y = , , ....,
merepresentasikan atribut nilai
m dari dua record (Larose 2005).
 Urutkan k data berdasarkan jarak terkecil
Setelah perhitungan jarak telah dilakukan, maka akan ada k jarak terkecil. Dari
k jarak terkecil tersebut, urutkan data dengan jarak terkecil hingga terbesar, lalu
berikan peringkat untuk masing-masing data.
 Tentukan prediksi kelas data uji berdasarkan label kelas mayoritas
Penentuan prediksi kelas data uji didasarkan pada label kelas mayoritas pada k.
Setelah pemeringkatan data dilakukan, maka akan ditemukan label kelas
terbanyak. Label kelas dengan frekuensi terbanyak merupakan hasil kelas
prediksi untuk data uji.

Hasil Prediksi
Hasil prediksi merupakan output dari sistem. Hasil prediksi ini sangat
berpengaruh kepada tingkat akurasi sistem. Mayoritas data uji diharapkan akan
diklasifikasikan ke kelas yang benar, sehingga akurasi sistem akan menjadi baik.
Akurasi dari suatu classifier pada suatu kumpulan data uji yang diberikan adalah
persentase dari tuple kumpulan data uji yang diklasifikasikan dengan benar oleh
classifier tersebut. Label kelas terkait dari setiap tuple data uji dibandingkan
dengan hasil pembelajaran prediksi kelas dari classifier untuk tuple tersebut (Han
dan Kamber 2006).

Lingkungan Pengembangan
Perangkat lunak yang digunakan dalam penelitian yaitu:
 Windows Vista Home Basic.
 MATLAB R2008b version 7.7.0.471.
 Microsoft Excel 2010.
Perangkat keras yang digunakan dalam penelitian yaitu:
 Processor Intel Core 2 Duo CPU 2.00 GHz.
 RAM 2 GB.

(10)

9

HASIL DAN PEMBAHASAN
Data Citra Daun
Citra yang digunakan adalah sampel daun Shorea milik Kebun Raya Bogor.
Ada sepuluh jenis Shorea yang diidentifikasi, yaitu Shorea seminis, pinanga,
leprosula, marcoptera, materialis, lepida, johorensis, javanica, platycados, dan
palembanica. Sepuluh jenis Shorea tersebut masing-masing terdiri atas sepuluh
citra. Ukuran asli citra yaitu 3648 2736 yang diakuisisi menggunakan kamera
digital. Pada Gambar 5 disajikan contoh citra untuk masing-masing jenis Shorea.

Gambar 5 Citra jenis Shorea
Pada saat pengambilan citra, daun masih melekat pada rantingnya.
Pengaturan jarak saat pengambilan citra juga dibedakan berdasarkan jenisnya.
Pengaturan jarak antara kamera dengan daun dicantumkan pada Tabel 1.
Tabel 1 Pengaturan jarak pengambilan citra
Jarak kamera ke daun
Jenis Shorea
± 20 – 22 cm
lepida, platyclados
± 25 cm
marcoptera, johorensis
± 27 – 30 cm
pinanga, leprosula, materialis
± 30 cm
palembanica
± 32 cm
seminis, javanica

Praproses
Ukuran citra asli akan mengalami proses pengubahan ukuran, yaitu yang
semula berukuran 3648 2736 direduksi menjadi seperlima lebih kecil dari aslinya
menjadi 548 730 piksel. Format citra yang digunakan adalah JPG. Citra akan
diubah menjadi grayscale. Selanjutnya, nilai histogram akan dicari untuk masing-

10
masing citra grayscale yang telah direduksi. Gambar 6 merupakan contoh alur
praproses dari salah satu citra dari jenis seminis. Contoh histogram dari masingmasing kelas dapat dilihat pada Lampiran 1.

Gambar 6 Alur praproses
Penghilangan warna background dilakukan dengan cara mengambil rentang
nilai tertentu dari histogram yang merupakan perpotongan antara citra daun
dengan latar belakang. Rentang nilai untuk masing-masing kelas berbeda-beda.
Gambar 7 merupakan contoh ilustrasi dari pemotongan histogram untuk salah satu
citra dari kelas javanica.

Gambar 7 Pemotongan histogram untuk kelas javanica
Pengambilan rentang nilai ditetapkan dengan mengamati perpotongan yang
terjadi pada histogram asli dari suatu citra. Penetapan rentang nilai untuk masingmasing kelas dapat dilihat pada Tabel 2.
Tabel 2 Penetapan rentang nilai histogram
Rentang nilai
0 - 120
0 - 150
0 - 160
0 - 180

Kelas
platyclados
lepida, javanica
pinanga, leprosula, materialis
seminis, marcoptera, johorensis, palembanica

11
Pada Gambar 6, terlihat titik perpotongan terjadi pada saat derajat keabuan
bernilai 150, maka untuk kelas javanica akan diambil nilai derajat keabuan dari 0150 saja. Untuk nilai derajat keabuan lebih dari 150 tidak digunakan. Semua citra
dalam satu kelas cenderung memiliki pola yang sama untuk penyebaran nilai
derajat keabuannya.

Ekstraksi Ciri Tekstur
Ekstraksi ciri tekstur dilakukan metode statistical textures yang
menghasilkan enam nilai ekstraksi tekstur yaitu intensitas rerata (mean), kontras
rerata (standar deviasi), smoothness, third moment, uniformity, dan entropy.
Keenam ciri tekstur tersebut disimpan dalam suatu vektor baris. Contoh data
tekstur statistik dari masing-masing kelas terdapat pada Lampiran 2, sedangkan
contoh data tekstur statistik yang telah dinormalisasi dari masing-masing kelas
terdapat pada Lampiran 3.
Pada tahap pelatihan, dibuat suatu matriks yang berisi kumpulan data
pelatihan yang telah ditentukan label atau kelasnya untuk mengarahkan ciri-ciri
tekstur statistik pada data uji. Matriks ini disebut dengan training set. Data
pelatihan pada training set ini berupa 80 record tekstur statistik. Tiap record
memiliki nilai mean, standar deviasi, smoothness, third moment, uniformity, dan
entropy untuk tiap kelas. Ukuran matriks training set ini yaitu 80 6. Setelah
ekstraksi ciri dilakukan untuk semua citra, dibuat boxplot untuk masing-masing
ciri tekstur statistik. Hal ini dilakukan untuk mengetahui penyebaran data dari ciri
tekstur statistik tersebut. Ada dua tipe box plot yang akan dibuat. Tipe 1 yaitu box
plot yang diperoleh dari histogram citra grayscale asli, sedangkan tipe 2 yaitu box
plot yang diperoleh dari histogram citra grayscale dengan penghilangan warna
background dan normalisasi nilai statistcal textures.
Tipe 1: Box plot yang diperoleh dari histogram citra grayscale asli


Mean
Nilai mean terbesar berdasarkan Gambar 8 terletak pada kelas lepida dengan
nilai mean sebesar 223.26. Nilai mean terkecil berada pada kelas javanica
dengan nilai mean sebesar 139.83.

12

Gambar 8 Box plot mean tipe 1


Standar Deviasi
Nilai standar deviasi terbesar berdasarkan Gambar 9 terletak pada kelas
leprosula, dengan nilai standar deviasi sebesar 83.90. Nilai standar deviasi
terkecil berada pada kelas platyclados dengan nilai standar deviasi sebesar
35.42.

Gambar 9 Box plot standar deviasi tipe 1


Smoothness
Nilai smoothness terbesar berdasarkan Gambar 10 terletak pada kelas
leprosula, dengan nilai smoothness sebesar 0.097. Nilai smoothness terkecil
berada pada kelas platyclados dengan nilai smoothness sebesar 0.018.

13

Gambar 10 Box plot smoothness tipe 1


Third Moment
Nilai third moment terbesar berdasarkan Gambar 11 terletak pada kelas
johorensis, dengan nilai third moment sebesar 0.22. Nilai third moment
terkecil berada pada kelas palembanica dengan nilai third moment sebesar
- .

Gambar 11 Box plot third moment tipe 1


Uniformity
Nilai uniformity terbesar berdasarkan Gambar 12 terletak pada kelas lepida,
dengan nilai uniformity sebesar 0.46. Nilai uniformity terkecil berada pada
kelas javanica dengan nilai uniformity sebesar 0.007.

14

Gambar 12 Box plot uniformity jenis 1


Entropy
Nilai entropy terbesar berdasarkan Gambar 13 terletak pada kelas javanica,
dengan nilai entropy sebesar 7.36. Nilai entropy terkecil berada pada kelas
lepida dengan nilai entropy sebesar 3.09.

Gambar 13 Box plot entropy tipe 1
Tipe 2: Box plot yang diperoleh dari histogram citra grayscale dengan
penghilangan warna background dan normalisasi nilai statistcal
textures


Mean
Nilai mean terbesar berdasarkan Gambar 14 terletak pada kelas johorensis
dengan nilai mean sebesar 1. Nilai mean terkecil berada pada kelas
platyclados dengan nilai mean sebesar 0.04.

15

Gambar 14 Box plot mean tipe 2


Standar Deviasi
Nilai standar deviasi terbesar berdasarkan Gambar 15 terletak pada kelas
marcoptera, dengan nilai standar deviasi sebesar 1. Nilai standar deviasi
terkecil berada pada kelas platyclados dengan nilai standar deviasi sebesar
0.207.

Gambar 15 Box plot standar deviasi tipe 2


Smoothness
Nilai smoothness terbesar berdasarkan Gambar 16 terletak pada kelas pinanga,
dengan nilai smoothness sebesar 1. Nilai smoothness terkecil berada pada
kelas platyclados dengan nilai smoothness sebesar 0.09.

16

Gambar 16 Box plot smoothness tipe 2


Third Moment
Nilai third moment terbesar berdasarkan Gambar 17 terletak pada kelas
seminis, dengan nilai third moment sebesar 1. Nilai third moment terkecil
berada pada kelas platyclados dengan nilai third moment sebesar 0.05.

Gambar 17 Box plot third moment tipe 2


Uniformity
Nilai uniformity terbesar berdasarkan Gambar 18 terletak pada kelas
materialis, dengan nilai uniformity sebesar 1. Nilai uniformity terkecil berada
pada kelas javanica dengan nilai uniformity sebesar 0.03.

17

Gambar 18 Box plot uniformity tipe 2


Entropy
Nilai entropy terbesar berdasarkan Gambar 19 terletak pada kelas johorensis,
dengan nilai entropy sebesar 1. Nilai entropy terkecil berada pada kelas
platyclados dengan nilai entropy sebesar 0.15.

Gambar 19 Box plot entropy tipe 2

Pembagian Data Latih dan Data Uji
Tabel 3 di bawah ini merupakan rincian citra latih dan citra uji yang
digunakan dalam sistem. Pembagian citra latih dan citra uji dilakukan secara acak
melalui proses pengundian.

18
Tabel 3 Pembagian citra latih dan uji berdasarkan pengundian
Data latih
Data uji
Kelas
Citra keCitra keSem
1, 2, 3, 4, 6, 7, 8, 10
5, 9
Pin
1, 2, 3, 4, 5, 8, 9, 10
6, 7
Lep
1, 2, 3, 5, 7, 8, 9, 10
4, 6
Mar
1, 2, 4, 6, 7, 8, 9, 10
3, 5
Mat
1, 2, 4, 5, 7, 8, 9, 10
3, 6
Lei
2, 3, 4, 5, 6, 7, 9, 10
1, 8
Joh
2, 3, 4, 5, 7, 8, 9, 10
1, 6
Jav
2, 3, 4, 5, 6, 8, 9, 10
1, 7
Plt
1, 3, 4, 5, 7, 8, 9, 10
2, 6
Pal
1, 2, 4, 5, 7, 8, 9, 10
3, 6

KNN
Jumlah tetangga terdekat (k) yang digunakan dalam penitian ini yaitu
sepuluh, dari k=1 sampai k=10. Enam ciri tekstur statistik pada data uji akan
dihitung jaraknya dengan 480 ciri tekstur statistik pada training set. Perhitungan
jarak dilakukan per tekstur. Dalam penelitian ini dilakukan dua percobaan.
Percobaan pertama dilakukan tanpa melakukan pemotongan terhadap histogram
dan nilai statistical textures tidak dinormalisasi. Percobaan ke dua dilakukan
dengan melakukan pemotongan terhadap histogram dan nilai statistical textures
dinormalisasi.
Percobaan 1 tanpa penghilangan warna background dan normalisasi

Akurasi

Percobaan pertama dilakukan dengan menggunakan nilai histogram dari
citra asli, tanpa dilakukan manipulasi di dalamnya. Gambar 20 merupakan grafik
akurasi dari percobaan 1 untuk nilai k=1 sampai k=10.
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
k=1 k=2 k=3 k=4 k=5 k=6 k=7 k=8 k=9 k=10
Nilai k

Gambar 20 Grafik akurasi percobaan 1

19
Berdasarkan Gambar 20, nilai k yang menghasilkan akurasi terbesar yaitu
k=8 dengan akurasi sebesar 90%, sedangkan akurasi terkecil yaitu 70% yang
diperoleh pada saat k=1, k=2, k=4, dan k=10.
Untuk mengetahui data mana saja yang salah diklasifikasi, berikut ini
merupakan confusion matrix dari hasil klasifikasi percobaan 1 menggunakan k=8.
Confusion matrix untuk nilai k yang lain dapat dilihat pada Lampiran 4 sampai
Lampiran 12.
Tabel 4 Confusion matrix percobaan 1 untuk k=8
Kelas
aktual
Sem
Pin
Lep
Mar
Mat
Lei
Joh
Jav
Plt
Pal

Sem
1
0
0
0
0
0
0
0
0
0

Pin
0
2
0
0
0
0
0
0
0
0

Lep
0
0
1
0
0
0
0
0
0
0

Kelas hasil prediksi
Mar Mat Lei Joh
0
0
0
1
0
0
0
0
0
1
0
0
2
0
0
0
0
2
0
0
0
0
2
0
0
0
0
2
0
0
0
0
0
0
0
0
0
0
0
0

Jav
0
0
0
0
0
0
0
2
0
0

Plt
0
0
0
0
0
0
0
0
2
0

Pal
0
0
0
0
0
0
0
0
0
2

Berdasarkan Tabel 4, kelas yang berhasil diklasifikasikan dengan sempurna
untuk setiap citra uji yaitu pinanga, marcoptera, materialis, lepida, johorensis,
javanica, platyclados, dan palembanica. Sementara itu dua kelas yang tidak
sempurna diklasifikasi yaitu seminis dan leprosula. Untuk kelas seminis citra uji
yang salah diklasifikasi merupakan citra uji kedua dan diklasifikasi sebagai kelas
johorensis.
Pada Tabel 5, data uji kedua dari kelas seminis mengalami penyebaran pada
kuadrat jarak. Untuk kelas seminis, hanya satu record yang memiliki kedekatan
jarak, dan berada pada peringkat terakhir (peringkat delapan), padahal citra uji
tersebut berasal dari kelas yang sama. Sementara itu, untuk kelas johorensis
terdapat dua record yang memiliki jarak terdekat dengan data uji, dan kelas inilah
yang diprediksi sebagai hasil prediksi.
Tabel 5 Hasil kuadrat jarak pada data uji seminis kedua saat k=8
Peringkat Kelas prediksi
Kuadrat jarak
1
Palembanica
11.6128
2
Johorensis
18.7406
3
Leprosula
24.8129
4
Pinanga
26.2261
5
Johorensis
26.4702
6
Leprosula
27.0349
7
Marcoptera
36.2030
8
Seminis
41.9431

20
Penjelasan mengenai mengapa hasil prediksi menghasilkan kelas johorensis,
sedangkan selain johorensis terdapat leprosula yang memiliki dua record yang
menghasilkan jarak yang memiliki kedekatan dengan data uji. Hal itu
dikarenakan, peringkat johorensis lebih bagus dibandingkan dengan leprosula,
yaitu 2 dan 5 banding 3 dan 6.
Untuk kelas leprosula citra uji yang salah diklasifikasi merupakan citra uji
pertama dan diklasifikasi sebagai kelas materialis. Pada perbandingan kelas
leprosula dengan materialis, tidak terlalu terjadi penyebaran pada kuadrat jarak.
Dari kelas materialis terdapat empat record yang menghasilkan jarak yang
memiliki kedekatan dengan data uji, sementara itu dari kelas leprosula sendiri
tidak ada record yang menghasilkan jarak terdekat. Hal ini berarti, data uji
pertama dari kelas leprosula memiliki nilai yang jauh berbeda dengan data
leprosula pada training set. Pada Tabel 6 disajikan peringkat dari hasil kuadrat
jarak pada kasus ini.
Tabel 6 Hasil kuadrat jarak pada data uji leprosula pertama saat k=8
Peringkat Kelas prediksi
Kuadrat jarak
1
Javanica
2.5085
2
Materialis
8.0333
3
Materialis
12.2653
4
Javanica
13.1611
5
Materialis
14.2764
6
Pinanga
15.5700
7
Materialis
17.0026
8
Javanica
36.6947
Analisis kesalahan yang terjadi pada kelas seminis dan leprosula dapat
dilihat pada box plot perbandingan antara kelas aktual dan kelas prediksi dari
masing-masing kelas yang mengalami salah prediksi. Hal itu dilakukan untuk
melihat posisi data uji yang salah diprediksi antara kelas aktual dan kelas prediksi
tersebut untuk masing-masing ciri tekstur statistik.
Di bawah ini merupakan box plot perbandingan antara kelas seminis (kelas
aktual) dengan kelas johorensis (kelas prediksi) untuk ciri tekstur mean. Posisi
nilai mean data uji pada Gambar 21 ditandai dengan garis putus-putus.

Gambar 21 Box plot mean antara seminis dan johorensis

21
Gambar di atas menunjukkan bahwa posisi nilai mean data uji seminis
pertama yaitu 178.50 berada pada lower whisker dan menyinggung lower whisker
dari kelas johorensis. Hal itu berarti nilai mean data uji tersebut lebih rendah dari
kumpulan nilai mean yang berada dalam bidang IQR. Tekstur statistik selain
mean, sebagian besar juga menunjukkan bahwa posisi data uji dalam box plot
berada pada lower whisker atau upper whisker, kecuali untuk uniformity dan
entropy. Untuk standar deviasi dan smoothness, posisi data uji berada pada upper
whisker end (nilai tertinggi dalam himpunan). Box plot perbandingan antara kelas
seminis dengan kelas johorensis untuk ciri tekstur yang lain dapat dilihat pada
Lampiran 13 sampai Lampiran 17.
Berdasarkan fakta tersebut, kesalahan yang terjadi pada kasus ini diprediksi
karena data uji seminis ini memiliki nilai yang jauh dari data nilai mean dominan
atau nilai mean yang terletak dalam bidang IQR dalam kelas seminis. Hal ini
sangat berpengaruh, karena perhitungan KNN didasarkan pada kedekatan jarak
antara data uji dengan himpunan data latih. Data uji ini juga tidak begitu memiliki
kedekatan yang signifikan dengan kelas johorensis, karena posisi data uji tersebut
jika ditinjau dari kelas johorensis sendiri, tidak juga berada dalam bidang IQR.
Hal ini relevan dengan hasil kuadrat jarak pada Tabel 5 yang menunjukkan
penyebaran kuadrat jarak yang terjadi pada kasus ini.
Selanjutnya yaitu analisis kesalahan yang terjadi pada kelas leprosula
berdasarkan box plot. Gambar 22 merupakan box plot perbandingan antara kelas
leprosula (kelas aktual) dengan kelas materialis (kelas prediksi) untuk ciri tekstur
mean. Posisi nilai mean data uji pada Gambar 22 ditandai dengan garis putusputus.

Gambar 22 Box plot mean antara leprosula dan materialis
Gambar di atas menunjukkan bahwa posisi nilai mean data uji leprosula
pertama yaitu 163.36 berada pada lower whisker end dan menyinggung upper
whisker dari kelas materialis. Hal itu berarti nilai mean data uji tersebut
merupakan yang terendah pada kelas leprosula.
Seperti halnya kasus seminis di atas, kesalahan yang terjadi pada kasus ini
diprediksi karena nilai mean dari data uji leprosula ini memiliki nilai yang jauh
dari nilai mean dominan atau nilai mean yang terletak dalam IQR dalam kelas
leprosula. Berdasarkan Gambar 22 pula dapat dilihat bahwa nilai mean dari data
uji ini cenderung memiliki kedekatan dengan kelas materialis. Hal ini dapat
dilihat dari ukuran kotak (bidang IQR) dari box plot. Pada kelas leprosula, ukuran

22
kotak lebih panjang, sedangkan pada kelas materialis ukuran kotak lebih kecil.
Hal itu berarti nilai mean pada kelas leprosula memiliki penyebaran nilai mean
yang luas atau memiliki rentang yang lebih besar dibandingkan dengan nilai mean
pada kelas materialis, yang menyebabkan kesalahan prediksi dalam kasus ini.
Nilai tekstur statistik lain yang berada pada lower whisker yaitu standar
deviasi dan smoothness. Untuk nilai third moment, uniformity, dan entropy berada
dalam IQR. Meskipun nilai ketiga tekstur tersebut termasuk ke dalam 50% dari
himpunan data, hal itu tidak berpengaruh banyak dalam kontribusi untuk
menentukan kuadrat jarak akhir dalam kasus ini. Box plot perbandingan antara
kelas leprosula dan kelas materialis untuk ciri tekstur yang lain dapat dilihat pada
Lampiran 18 sampai Lampiran 22.
Percobaan 2 dengan penghilangan warna background dan normalisasi

Akurasi

Percobaan ke dua dilakukan dengan menggunakan nilai histogram yang
telah dimanipulasi. Manipulasi dilakukan dengan cara mengambil rentang nilai
tertentu dari nilai derajat keabuan. Setelah histogram dimanipulasi, nilai statistical
textures juga akan dinormalisasi dengan cara membagi nilai tekstur statistik
dengan nilai yang terbesar yang terdapat dalam himpunan data. Normalisasi ini
dilakukan per tekstur. Gambar 23 merupakan grafik akurasi dari percobaan 2
untuk nilai k=1 sampai k=10.
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
k=1 k=2 k=3 k=4 k=5 k=6 k=7 k=8 k=9 k=10
Nilai k

Gambar 23 Grafik akurasi percobaan 2
Berdasarkan Gambar 20, nilai k yang menghasilkan akurasi terbesar yaitu
k=7, k=9, dan k=10 dengan akurasi sebesar 75%, sedangkan akurasi terkecil yaitu
60% yang diperoleh pada saat k=3, k=4, dan k=6. Percobaan 2 menghasilkan
akurasi 15% lebih rendah dibandingkan dengan percobaan 1 yang menghasilkan
akurasi tertinggi sebesar 90% pada saat k=8. Tidak terjadinya peningkatan akurasi
bisa dipengaruhi oleh faktor pencahayaan yang tidak seragam sehingga
berpengaruh pada histogram yang dihasilkan.
Untuk mengetahui data mana saja yang salah diklasifikasi, berikut ini
merupakan confusion matrix dari hasil klasifikasi percobaan 2 dengan

23
menggunakan k=7. Confusion matrix untuk masing-masing k dapat dilihat pada
Lampiran 23 sampai Lampiran 31.
Tabel 7 Confusion matrix percobaan 2 untuk k=7
Kelas
aktual
Sem
Pin
Lep
Mar
Mat
Lei
Joh
Jav
Plt
Pal

Sem
2
0
0
0
0
0
0
0
0
1

Pin
0
2
0
0
2
0
0
0
0
0

Lep
0
0
0
0
0
0
0
0
0
0

Kelas hasil prediksi
Mar Mat Lei Joh
0
0
0
0
0
0
0
0
0
1
0
0
2
0
0
0
0
0
0
0
0
0
2
0
0
0
0
2
0
0
0
0
0
0
0
0
0
0
0
0

Jav
0
0
1
0
0
0
0
2
0
0

Plt
0
0
0
0
0
0
0
0
2
0

Pal
0
0
0
0
0
0
0
0
0
1

Berdasarkan Tabel 7, kelas yang berhasil diklasifikasikan dengan sempurna
untuk setiap citra uji yaitu seminis, pinanga, marcoptera, lepida, johorensis,
javanica, dan platyclados. Sementara itu tiga kelas yang tidak sempurna
diklasifikasi yaitu leprosula, materialis, dan palembanica. Seluruh citra uji untuk
kelas leprosula dan materialis gagal diklasifikasi dengan benar. Citra uji pertama
dari kelas leprosula diklasifikasi menjadi kelas javanica, sedangkan citra uji ke
dua diklasifikasi menjadi kelas materialis. Tabel 8 menjelaskan peringkat dari
hasil kuadrat jarak yang terjadi pada kelas leprosula untuk data uji pertama pada
saat k=7.
Pada Tabel 8, tidak ada satu pun record yang memiliki kedekatan dengan
kelas leprosula, sedangkan dari kelas javanica terdapat empat record yang
menghasilkan jarak terdekat dengan data uji. Hal ini berarti, data uji pertama dari
kelas leprosula memiliki nilai yang jauh berbeda dengan data leprosula pada
training set dan lebih memiliki kedekatan dengan data javanica pada training set.
Tabel 8 Hasil kuadrat jarak pada data uji leprosula pertama saat k=7
Peringkat Kelas prediksi
Kuadrat jarak
1
Javanica
0.00336
2
Javanica
0.00701
3
Materialis
0.00758
4
Javanica
0.00842
5
Javanica
0.01584
6
Materialis
0.02687
7
Palembanica
0.03778
Seluruh citra uji dari kelas materialis diklasifikasi menjadi kelas pinanga.
Tabel 10 menjelaskan peringkat dari hasil kuadrat jarak yang terjadi pada kelas
materialis untuk data uji pertama pada saat k=7.
Untuk data uji pertama dari kelas materialis, pada Tabel 10 terjadi kasus seri
seperti pada percobaan 1, yaitu kelas pinanga dan materialis sama-sama memiliki

24
tiga jarak terdekat. Peringkat pinanga lebih bagus dibandingkan dengan
materialis, yaitu 1, 2 dan 6, sedangkan materialis yaitu 4, 5 dan 7.
Tabel 9 Hasil kuadrat jarak pada data uji materialis pertama saat k=7
Peringkat Kelas prediksi
Kuadrat jarak
1
Pinanga
0.00001
2
Pinanga
0.00005
3
Leprosula
0.00014
4
Materialis
0.00014
5
Materialis
0.00015
6
Pinanga
0.00070
7
Materialis
0.00077
Untuk kelas palembanica, citra uji yang gagal diklasifikasi merupakan citra
uji pertama, yang diklasifikasi menjadi kelas seminis. Tabel 12 merupakan daftar
peringkat dari hasil kuadrat jarak yang terjadi untuk data uji pertama dari kelas
palembanica.
Tabel 10 Hasil kuadrat jarak pada data uji palembanica pertama saat k=7
Peringkat Kelas prediksi
Kuadrat jarak
1
Palembanica
0.00346
2
Seminis
0.00901
3
Marcoptera
0.01001
4
Palembanica
0.01566
5
Seminis
0.01949
6
Seminis
0.03581
7
Marcoptera
0.04369
Berdasarkan Tabel 12, data uji pertama dari kelas palembanica memiliki
nilai yang cukup dekat dengan kelas seminis, marcoptera, dan palembanica
sendiri. Dari kelas seminis menghasilkan tiga record jarak terkecil, sedangkan
untuk kelas palembanica dan marcoptera masing-masing menghasilkan dua
record.
Analisis kesalahan berdasarkan box plot dilakukan untuk kelas leprosula
saja, karena kecendrungan pola box plot yang sama pada ke tiga kelas yang
mengalami kesalahan prediksi. Gambar 24 merupakan box plot perbandingan
antara kelas leprosula (kelas aktual) dengan kelas javanica (kelas prediksi) untuk
ciri tekstur mean. Posisi nilai mean data uji pada Gambar 24 ditandai dengan garis
putus-putus. Posisi nilai mean data uji leprosula pertama yaitu 0.308 berada pada
lower whisker end yang berarti merupakan nilai mean terkecil dari kelas
leprosula.

25

Gambar 24 Box plot mean antara leprosula dan javanica
Gambar di atas menunjukkan bahwa posisi nilai mean data uji leprosula
menyinggung bidang IQR dari kelas javanica. Hal ini berarti tampak jelas bahwa
nilai mean dari data latih ini lebih memiliki keseragaman dengan kelas javanica,
bukan dengan kelas leprosula yang merupakan kelas aktualnya, sehingga data uji
ini mengalami kesalahan prediksi. Bukan hanya posisi dari nilai mean saja,
hampir semua posisi dari nilai tekstur statistik lainnya, kecuali uniformity, yang
menyinggung bidang IQR dari kelas javanica. Box plot perbandingan antara kelas
leprosula dan kelas javanica untuk ciri tekstur yang lain dapat dilihat pada
Lampiran 32 sampai Lampiran 36.

Perbandingan dengan Penelitian Terkait
Penelitian yang terkait dengan penelitian ini adalah penilitian dari
Nurjayanti (2011) dan Ramadhan (2012). Perbandingan ini dilakukan berdasarkan
pada objek penelitian, ekstraksi fitur, pengklasifikasi yang digunakan, dan akurasi
yang didapatkan. Di bawah ini merupakan tabel perbandingan dengan penelitian
sejenis yang telah dilakukan sebelumnya.
Tabel 11 Perbandingan dengan penelitian terkait
Nama peneliti
Objek penelitian
Ekstraksi fitur
Pengklasifikasi
Nurjayanti
5 jenis daun
Morfologi daun
KNN
(2011)
Shorea
Ramadhan
(2012)

Citra 10 jenis
daun Shorea

 Discrete wavelet
transform
 Model warna hue
saturation value
(HSV)

Backpropagation
neural network

Data daun Shorea yang diteliti oleh Nurjayanti (2011) adalah Shorea
multiflora, palembanica, balengaran, lepida, dan assamica. Karakteristik
morfologi daun yang digunakan yaitu panjang daun, lebar daun, bentuk tulang
daun, dan lain-lain. Citra daun Shorea yang diteliti oleh Ramadhan (2012) sama

26
dengan penelitian ini. Discrete wavelet transform yang digunakan yaitu DWT
Daubechies dan Haar.
Penelitian ini menghasilkan akurasi lebih rendah dibandingkan dengan dua
penelitian tersebut. Akurasi tertinggi dalam penelitian ini yaitu 90% dan terendah
yaitu 70%. Akurasi untuk penelitian Nurjayanti (2011) yaitu 100%. Nurjayanti
(2011) mendapatkan nilai akurasi sebesar 100% diperoleh karena terdapat fiturfitur morfologi daun yang bersifat nominal/kategori. Fitur-fitur nominal tersebut
yaitu bentuk tulang daun, permukaaan daun, ujung daun, dan pangkal daun. Nilai
dari fitur-fitur nominal tersebut diinputkan secara manual. Sementara pada
penelitian ini, nilai-nilai fitur diperoleh berdasarkan histogram citra grayscale
yang dipengaruhi oleh banyak faktor, seperti pencahayaan, kekontrasan citra, dan
lain-lain. Penelitian Ramadhan (2012) memperoleh akurasi tertinggi sebesar
93.3% dan terendah sebesar 33.33% yang menggabungkan DWT Haar dan
Daubechies, serta ekstraksi warna HSV.

SIMPULAN DAN SARAN
Simpulan
Pada penelitian ini, identifikasi sepuluh jenis Shorea dilakukan
menggunakan algoritme KNN berdasarkan enam fitur tekstur statistik, yaitu mean,
standar deviasi, smoothness, third moment, uniformity, dan entropy. Penelitian ini
dilakukan dengan dua kali percobaan. Percobaan pertama yaitu tanpa
menghilangkan warna background pada histogram citra grayscale dan tanpa
normalisasi nilai statistical textures. Percobaan pertama ini menghasilkan akurasi
tertinggi pada saat nilai k=8 dengan akurasi sebesar 90%. Kesalahan prediksi
terjadi pada Shorea jenis seminis dan leprosula. Percobaan kedua yaitu dengan
menghilangkan warna background pada histogram citra grayscale dan dengan
normalisasi nilai statistical textures. Percobaan kedua ini menghasilkan akurasi
tertinggi pada saat nilai k=7, k=9, dan k=10, dengan akurasi sebesar 75%.
Kesalahan prediksi terjadi pada Shorea jenis leprosula, materialis, dan
palembanica.

Saran
Pada penelitian ini masih memiliki beberapa kekurangan yang dapat
diperbaiki pada pene