Identifikasi Varietas Durian Berdasarkan Tekstur Daun Menggunakan K-Nearest Neighbor Dengan Ciri Statistical Textures

IDENTIFIKASI VARIETAS DURIAN BERDASARKAN TEKSTUR
DAUN MENGGUNAKAN K-NEAREST NEIGHBOR DENGAN
CIRI STATISTICAL TEXTURES

ROSITA TRI INDRATI

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2016

PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI
SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Identifikasi Varietas Durian Berdasarkan
Tekstur Daun Menggunakan K-Nearest Neighbor dengan ciri Statistical Textures adalah benar
karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun
kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya
yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

Bogor, Maret 2016
Rosita Tri Indrati
NIM G64124066

PERNYATAAN MENGENAI DISERTASI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Identifikasi Varietas
Durian Berdasarkan Tekstur Daun Menggunakan K-Nearest Neighbor dengan ciri
Statistical Textures adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi
mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Maret 2016
Rosita Tri Indrati
NIM G64124066

ABSTRAK

ROSITA TRI INDRATI. Identifikasi Varietas Durian Berdasarkan Tekstur Daun
Menggunakan K-Nearest Neighbor dengan Ciri Statistical Textures. Dibimbing
oleh Aziz Kustiyo.
Durian (Durio zibethinus Murray) adalah salah satu komoditas yang
memiliki nilai ekonomi yang tinggi di Indonesia. Nilai ekonomi durian
dipengaruhi oleh keunggulan yang dimiliki setiap varietasnya. Oleh sebab itu
identifikasi tanaman durian merupakan hal yang sangat penting. Pada penelitian
ini, identifikasi dilakukan berdasarkan citra daun dari empat varietas durian.
Metode klasifikasi yang digunakan adalah K-Nearest Neighbor dengan ekstraksi
ciri statistical textures. Penelitian ini menghasilkan akurasi tertinggi sebesar
67,5% menggunakan 6 ciri statistical textures. Pada penelitian ini paling sulit
teridentifikasi varietas Sukun. Varietas Sukun mempunyai kemiripan ke varietas
Bakul dan Matahari.
Kata Kunci: daun, Statistical textures, durian, identifikasi, K-Nearest Neighbor.

ABSTRACT
ROSITA TRI INDRATI. Durian Plant Identification Using K-Nearest Neighbor
and Statistical Textures. Supervised by Aziz Kustiyo.
Durian (Durio zibethinus Murray) is one of the valuable fruit in
Indonesia. It economic value is depends on the superiority of each varieties.

Therefore it is important to identify the variety of durian’s plant. In this research,
the identification of was performed by K-Nearest Neighbor classification and
statistical textures extraction based its leaf image. The highest accuracy of this
research was 67.5% using four durian’s varieties and was of 6 statistical textures
feature. The most difficult identify in this reseach was Sukun varieties. Sukun
varieties has similarities with Bakul and Matahari.
keyword : leaf, Statistical textures, durian, identification, K-Nearest Neighbor.

IDENTIFIKASI VARIETAS DURIAN BERDASARKAN TEKSTUR
DAUN MENGGUNAKAN K-NEAREST NEIGHBOR DENGAN
CIRI STATISTICAL TEXTURES

ROSITA TRI INDRATI

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer


DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2016

Penguji:
1 Toto Haryanto, S.Kom, M.Si
2 Dr. Wisnu Ananta Kusuma, ST MT

Judul Skripsi : Identifikasi Varietas Durian Berdasarkan Tekstur Daun
Menggunakan K-Nearest Neighbor dengan Ciri Statistical Textures
Nama
: Rosita Tri Indrati
NIM
: G64124066

Disetujui oleh

Aziz Kustiyo, SSi MKom

Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi MKom
Ketua Departemen

Tanggal Lulus :

PRAKATA
Segala puji dan syukur penulis panjatkan kepada Allah Subhanahu Wa
Ta’ala atas segala karunia-Nya sehingga penulis dapat menyelesaikan tugas akhir
yang berjudul Identifikasi Varietas Durian Berdasarkan Tekstur Daun
Menggunakan K-Nearest Neighbor dengan Ciri Statistical Textures.
Terima kasih penulis ucapkan kepada:
1
Kedua orang tua serta seluruh keluarga yang telah memberikan dukungan,
perhatian dan doa sehingga penulis dapat menyelesaikan karya ilmiah ini.
2
Bapak Aziz Kustiyo, SSi MKom selaku pembimbing yang telah banyak

memberikan pengarahan, saran dan bimbingannya.
3
Bapak Dr. Wisnu Ananta Kusuma, ST MT dan Bapak Toto Haryanto, SKom
MSi selaku penguji atas saran dan pengarahannya.
4
Teman-teman satu bimbingan Nicky Astriyanti, Ineke Kusumawati,
Nurchoiriyati, Puguh dan Arif Mujahidin terima kasih atas bantuan dan
kerjasamanya.
5
Teman-teman alih jenis ILKOM angkatan 7 terima kasih atas dukungan dan
kebersamaannya.
6
Jajaran Staf dan Dosen Pengajar Ilmu Komputer atas segala bantuannya.
7
Semua pihak yang telah memberikan bantuan selama peneliian yang tidak
bisa penulis sebutkan satu persatu.
Semoga karya ilmiah ini bermanfaat.

Bogor, Maret 2016
Rosita Tri Indrati


DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

PENDAHULUAN

1

Latar Belakang


1

Perumusan Masalah

1

Tujuan Penelitian

2

Manfaat Penelitian

2

Ruang Lingkup Penelitian

2

Lingkungan Pengembangan


2

METODE

2

Studi Pustaka

2

Pengumpulan Data

3

Praproses

3

Ekstraksi Tekstur


4

Pembagian Data Latih dan Data Uji

6

Klasifikasi K-NN

7

Evaluasi

7

HASIL DAN PEMBAHASAN
Ekstraksi Ciri Tekstur

7
7


Percobaan 1: Klasifikasi dengan semua ciri

10

Percobaan 2: Klasifikasi dengan pemilihan ciri

10

Analisis Kesalahan

12

SIMPULAN DAN SARAN

13

Simpulan

13

Saran

14

DAFTAR PUSTAKA

14

LAMPIRAN

15

RIWAYAT HIDUP

15

DAFTAR TABEL
1
2
3
4
5
6
7
8
9
10
11
12
13

Bentuk k-fold cross validation
Confusion matrix seluruh fold percobaan 1 untuk k = 3
Confusion matrix seluruh fold percobaan 2 untuk k = 3
Confusion matrix k = 1
Confusion matrix k = 5
Confusion matrix k = 7
Confusion matrix k = 9
Confusion matrix k = 11
Confusion matrix k = 1
Confusion matrix k = 5
Confusion matrix k = 7
Confusion matrix k = 9
Confusion matrix k = 11

6
10
11
15
15
15
16
16
16
16
16
17
17

DAFTAR GAMBAR
1
2
3
4
5
6

Tahapan Metode Penelitian
Ilustrasi praproses (a) Citra daun durian asli, (b) Citra daun hasil
grayscale
Grafik akurasi percobaan 1
Grafik akurasi percobaan 2
Grafik perbandingan percobaan 1 dan percobaan 2
Pola box plot dari perhitungan masing-masing varietas (a)minimum
(b)maksimum (c)rentang (d)mean (e)median (f)Standar deviasi (g) Q1
(h) Q3 (i) Interval quartile range (j) skewness (k) kurtosis

3
4
10
11
12

13

DAFTAR LAMPIRAN
1
2
3

Contoh citra daun asli dari setiap varietas durian.
Confusion matrix percobaan 1 k = 1, 5, 7, 9 dan 11
Confusion matrix percobaan 2 k = 1, 5, 7, 9 dan 11

15
15
16

PENDAHULUAN
Latar Belakang
Durian atau disebut Durio Zibethinus sering mendapat julukan sebagai The
King of the Fruite atau rajanya buah. Hal ini dikarenakan buah durian memiliki
rasa yang nikmat dan aroma yang tajam. Banyaknya peminat dari buah durian
menjadikan komoditas durian sangat potensial untuk dikembangkan. Keunggulan
yang dimiliki oleh durian tersebut memiliki nilai ekonomi yang tinggi. Durian
memiliki banyak jenis, namun tidak semua jenis durian merupakan varietas yang
unggul.
Identifikasi tumbuhan adalah untuk mengenali suatu tumbuhan dari
pencarian kemiripan dari fitur (ciri) yang dimiliki tumbuhan lainnya (Salasa et al.
2013). Identifikasi varietas tersebut akan sangat membantu petani dalam
memperoleh bibit yang sangat unggul dan tepat, dan akan sangat menunjang
pengelolaan dalam pembibitan selanjutnya.
Beberapa varietas durian memiliki kemiripan satu sama lain. Kemiripan
tersebut antara lain terjadi pada morfologi daun. Penelitian yang terkait dengan
identifikasi durian berdasarkan morfologi dilakukan oleh Syahrudin (2012)
dengan menggunakan daun sebagai objek penelitian. Bagian daun dipilih karena
mudah didapatkan serta tidak berpengaruh oleh musim dan lingkungan sekitar.
Maka dari itu pada penelitian ini menggunakan morfologi dengan menggunakan
daun sebagai ciri identifikasi.
Pertiwi (2014) pernah melakukan penelitian identifikasi varietas durian
menggunakan ekstraksi fitur daun bagian atas untuk 9 varietas durian. Penelitian
tersebut menggunakan metode ekstraksi tekstur Gray Level Co-occurence Matrix
(GLCM) dan metode klasifikasi Probabilistic Neural Network (PNN)
mendapatkan akurasi sebesar 33.33 % menggunakan citra daun utuh dan 76.67 %
menggunakan citra daun yang dilakukan proses cropping.
Pada penelitian ini akan dilakukan identifikasi varietas durian berbasis citra
daun menggunakan K-Nearest Neighbor (K-NN) dan ciri statistical textures
seperti yang dilakukan oleh Hayyi(2013). Penelitian tersebut mengidentifikasi 10
jenis daun shorea dengan menggunakan enam parameter yang diperoleh dari
ekstraksi ciri statictical textures memperoleh akurasi tertinggi sebesar 90%.
Pengklasifikasi yang akan digunakan dalam penelitian ini adalah K-Nearest
Neighbor. Penelitian menggunakan K-NN telah dilakukan untuk identifikasi
Shorea berdasarkan karakteristik morfologi daun sebagai bahan identifikasi
memperoleh akurasi sebesar 100% (Nurjayanti 2011). Dalam penelitian tersebut
K-NN merupakan teknik yang mampu mengelompokkan data uji ke dalam kelas
label dengan mencari data latih yang relatif sama dengan data uji (Han et al.
2011).
Perumusan Masalah
Perumusan masalah pada penelitian ini adalah bagaimana menerapkan
metode ekstraksi tekstur menggunakan perhitungan nilai statistical textures dan
K-NN sebagai klasifikasi untuk pengenalan varietas durian berasarkan citra daun
durian.

2

Tujuan Penelitian
Tujuan penelitian ini adalah mengimplementasikan identifikasi varietas
durian dengan menggunakan parameter ciri statistik menggunakan klasifikasi KNN.
Manfaat Penelitian
Manfaat dari penelitian ini ialah untuk memudahkan petani dalam
mengidentifikasi varietas durian yang berdasarkan citra daun
Ruang Lingkup Penelitian
1
2
3
4

Ruang lingkup pada penelitian ini antara lain:
Citra yang digunakan adalah citra hasil akuisisi menggunakan citra
mikroskop digital daun durian bagian bawah.
Varietas durian yang digunakan dalam penelitian ini adalah Bakul, Matahari,
Sukun dan Kendil.
Ektraksi tekstur menggunakan hitungan nilai statistik.
Penelitian dilakukan untuk mengidentifikasi varietas durian.
Lingkungan Pengembangan

Pada penelitian ini menggunakan spesifikasi perangkat keras dan perangkat
lunak sebagai berikut:
1
2
3
1
2

Perangkat keras:
Processor Intel ® Core™ i5 CPU 2.50 GHz.
Memori 4 GB
Hard disk 500 GB
Perangkat lunak:
Sistem operasi Microsoft Windows 7 Ultimate 64 bit.
Matlab 7.11.0.584 (R2010b)

METODE
Penelitian ini dilakukan dengan melalui beberapa tahapan proses. Tahapantahapan yang dilakukan dapat dilihat pada Gambar 1.
Studi Pustaka
Pada tahap studi literatur hal yang dilakukan adalah mengumpulkan dan
mempelajari pustaka atau bacaan yang berkaitan dengan penelitian serta mengkaji
metode-metode yang dapat diterapkan pada penelitian. Teori dan penerapan
metode K-NN, serta yang menyangkut pemrosesan citra daun. Sumber pustaka
pada tahap ini adalah buku, paper penelitian, dan skripsi.

3

Mulai

Studi Pustaka

Pengumpulan data
(Citra Daun)
Praproses
Ekstraksi ciri (Statistik)

Penentuan Data Latih
dan Data Uji

Data uji

Data Latih

Klasifikasi dengan K-NN

Evaluasi
Selesai

Gambar 1 Tahapan Metode Penelitian
.
Pengumpulan Data
Data yang digunakan pada penelitian ini berasal dari Warso Durian Farm,
yang terletak di Desa Cihideung Kabupaten Bogor. Citra daun yang digunakan
sebanyak 40 citra dengan masing-masing varietas sebanyak 10 citra dalam format
BMP. Ukuran citra daun terbesar yang digunakan dalam penelitian ini adalah 640
x 480 piksel. Usia daun yang digunakan pada penelitian ini tidak diketahui.
Varietas durian yang digunakan dalam penelitian ini adalah durian bakul,
matahari, sukun dan kendil.
Praproses
Tahap praproses citra dilakukan untuk mempersiapkan citra yang digunakan
sebelum masuk ke dalam tahap ekstraksi. Citra daun merupakan citra RGB,
sebelum dilakukan ekstraksi ciri terlebih dahulu citra diubah menjadi citra

4

grayscale. Grayscale digunakan untuk menyederhanakan model citra. Fungsi
format ini adalah untuk memudahkan proses selanjutnya karena menggunakan
RGB, nilai yang dihasilkan akan beragam (Yanti 2012). Gambar 2 menunjukan
ilustrasi proses praposes. Lampiran 1 menunjukan beberapa citra daun asli dari
setiap varietas durian.

(b)

(a)

Gambar 2 Ilustrasi praproses (a) Citra daun durian asli, (b) Citra daun hasil
grayscale
Ekstraksi Tekstur
Ekstraksi ciri tekstur akan dilakukan dengan menggunakan metode
statistical textures. Metode ini akan menghasilkan 11 nilai ekstraksi tekstur.
Dibawah ini merupakan penjelasan dari masing-masing ekstraksi yang akan
diperoleh (Walpole 1995):
1
Perhitungan nilai minimum, disini mencari nilai gray level terendah dari
citra yang telah di praproses grayscale.
2
Perhitungan nilai maksimum, disini mencari nilai gray level tertinggi dari
citra yang telah di praproses grayscale.
3
Perhitungan rentang (range) diperoleh dari selisih atara nilai maksimum
dengan minimum.
4
Perhitungan rata-rata(mean) dapat dihitung sebagai berikut:

+
+ ⋯+
̅=
=

5

Dengan :
̅
: rata-rata hitung (mean)

: Jumlah semua nilai gray level setiap citra
: nilai data setiap gray level
: banyaknya data dari semua gray level
Perhitungan median adalah menentukan letak data setelah data itu disusun
menurut urutan lainnya. Untuk mencari nilai median :
= nilai yang ke

6

+

Dengan:
n
: banyaknya data dari semua gray level
Perhitungan standar deviasi. Standar deviasi atau bisa juga simpangan baku
digunakan untuk mengetahui keragaman suatu data-data dari hasil
pengamatan. Jika nilai standar deviasi yang didapat besar maka data-data
memiliki keberagaman atau berbeda-beda (heterogen). Sementara jika hasil
perhitungan didapat nilai standar deviasi rendah maka data-data memiliki

5

kesamaan atau nilainya tidak jauh berbeda (homogen). Rumus dari standar
deviasi adalah sebagai berikut :
=

7

8

9

10


̅

Dengan :
: Standar deviasi
: nilai data gray level ke-i
̅
: rata-rata hitung (mean)
n
: banyaknya data dari semua gray level
Perhitungan kuartil 25% (Q1). Jika sekumpulan data dibagi 4 bagian yang
sama banyak, sesudah disusun menurut urutan nilainya, maka bilangan
pembaginya disebut kuartil. kuartil dapat dihitung dengan rumus :
Untuk n ganjil
Untuk n genap
� =

+
4

� =�

� =

+
4

� =�

+ /

Dengan :

: kuartil ke-i
: banyaknya data dari semua gray level

: wakil data perolehan
Perhitungan kuartil 75%(Q3) dapat dihitung dengan rumus:
Untuk n ganjil
Untuk n genap
+ /

Dengan :

: kuartil ke-i
: banyaknya data dari semua gray level

: wakil data perolehan
Perhitungan interval quartile range. Nilai tersebut diperoleh dengan cara :
IQR = Q3 – Q1
Dengan :

: kuartil ke-1

: kuartil ke-3
Perhitungan skewness merupakan pengukuran dari kecondongan histogram.
Rumus skewness adalah sebagai berikut:
�=

̅

Dengan :
̅
: rata-rata hitung (mean)
: Modus
: banyaknya data dari semua gray level

6

11


: derajat kecondongan histogram citra
Bila
:
 � = 0, maka distribusi gray level setiap citra simetri
 � < 0, maka distribusi gray level setiap citra miring ke kiri (negative)
 � = 0, maka distribusi gray level setiap citra miring ke kanan (positif)
Perhitungan kurtosis menggambarkan keruncingan atau kerataan suatu
distribusi data dibandingkan dengan distribusi normal. Terdapat 3 tingkat
atau jenis kurtosis, yaitu : leptokurtis, mesokurtis, dan platikustis. Rumus
kurtosis adalah sebagai berikut


�4 =

̅

Dengan :
�4
: koefisien kurtosis
: banyaknya data dari semua gray level
: nilai data setiap gray level
̅
: rata-rata hitung (mean)
: standar deviasi

Pembagian Data Latih dan Data Uji
Pada tahap ini data citra dibagi menjadi dua bagian, yaitu data uji dan data
latih. Data latih digunakan untuk melakukan pelatihan statistic textures,
sedangkan data uji digunakan untuk pengujian K-NN. Data citra yang digunakan
adalah 40 citra mikroskop digital dengan satu varietas durian diwakili oleh 10
citra. Tabel 1 menampilkan ilustrasi pembagian data dengan k-fold cross
validation.
Tabel 1 Bentuk k-fold cross validation
Fold

Citra Daun setiap varietas
1

2

3

4

5

1
2
3
4
5
Keterangan :

= data uji

= data latih

6

7

8

9

10

7

Klasifikasi K-NN
Klasifikasi berguna untuk menentukan kelas dari data uji berdasarkan data
latih. Metode klasifikasi pada penelitian ini adalah K-NN, dengan nilai K = 1, 3, 5
dan 7. Langkah-langkah klasifikasi K-NN (Saharkiz 2009):
1
Pilih parameter K tetangga terdekat.
2
Hitung jarak data uji dengan semua data latih. Rumus jarak yang biasa
digunakan adalah jarak Euclidean.
= √∑

3
4
5

Dengan :
d : jarak data uji dan data latih
: fitur ke-i dari data uji, dengan i=1,2,…,n
: fitur ke-i dari data latih, dengan i=1,2,…,n
n : banyaknya fitur data uji dan data latih yang digunakan
Urutkan jarak tersebut dan tetapkan tetangga terdekat berdasarkan jarak keK.
Periksa kelas dari tetangga terdekat.
Tentukan kelas untuk data uji dari mayoritas kelas tetangga terdekat.
Evaluasi

Kinerja K-NN akan ditentukan dan dibandingkan melalui besaran akurasi
yang berhasil dicapai. Satuan akurasi dinyatakan dalam persen (%), akurasi dapat
dihitung dengan persamaan berikut:
=





HASIL DAN PEMBAHASAN
Ekstraksi Ciri Tekstur
Ekstraksi ciri tekstur dilakukan dengan metode statistical textures yang
menghasilkan sebelas nilai ekstraksi tekstur yaitu minimum, maksimum, rentang,
rata-rata, median, standar deviasi, kuartil pertama (25%), kuartil ketiga (75%),
interval quartile range, skewness, dan kurtosis. Lalu dibuat suatu matriks yang
berisi kumpulan data yang telah ditentukan label atau kelasnya untuk
mengarahkan ke ciri-ciri statisik. Ukuran matriks tersebut adalah 40x11. Tabel 2
menampilkan contoh hasil nilai perhitungan statistik setiap varietas citra.

8

Tabel 2 Contoh Hasil Nilai Perhitungan Statistik
Kelas
Nilai Ciri Statistik
1
2
3
4
5
6
7
8
9
10
11
Bakul
47 243 196 155
158 20.8 144 169 25 -.061 3.76
Matahari 6 255 249 151.9 155 28.8 135 172 37 -0.45 3.44
Sukun
7 255 248 153.2 160
34
135 178 43 -0.74 3.48
Kendil
10 255 245 154.1 157 23.4 141 169 28 -0.56 3.85
Dengan : (1)Minimum (2)Maksimum (3)Rentang (4)Rata-Rata (5)Median
(6)Standar Deviasi (7)Q1 (8)Q3 (9)Interval Quartile Range
(10)Skewness (11)Kurtosis
Berdasarkan ektraksi ciri tekstur tersebut dilakukan untuk semua citra,
dibuat box plot untuk masing-masing ciri tekstur statistik. Hal ini dilakukan untuk
mengetahui penyebaran data dari ciri tekstur statistic tersebut. Gambar 3 akan
memperlihatkan box plot dari setiap ciri statistik.

(a)

(c)

(e)

(b)

(d)

(f)

9

(g)

(i)

(h)

(j)

(k)
Gambar 3 Pola box plot dari perhitungan masing-masing varietas (a)minimum
(b)maksimum (c)rentang (d)mean (e)median (f)Standar deviasi (g) Q1 (h)
Q3 (i) Interval quartile range (j) skewness (k) kurtosis
Penelitian ini terdiri atas 2 percobaan. Percobaan pertama dilakukan
dengan memakai semua ciri statistik untuk pengujian K-NN, sedangkan
percobaan kedua memilih hanya enam ciri statistic. Ciri yang terpilih dilihat dari
nilai penyebaran data yang berbeda atau nilainya tidak saling berdekatan antara
varietas satu dengan lainnya yang ada pada box plot Gambar 3. Keenam ciri
statistik tersebut antara lain minimum, standar deviasi, kuartil 1, interval quartile
range, skewness dan kurtosis.

10

Percobaan 1: Klasifikasi dengan semua ciri
Percobaan pertama dilakukan dengan menggunakan semua ciri. Gambar 4
merupakan grafik rata-rata akurasi dari percobaan 1 untuk k = 1, 3, 5, 7, 9 dan 11
100

Akurasi (%)

80
60

62,5

57,5

55

58,5

57,5

57,5

5

7

9

11

40
20
0
1

3

nilai k

Gambar 4 Grafik akurasi percobaan 1
Berdasarkan Gambar 4, nilai k yang menghasilkan rata-rata akurasi terbesar
yaitu k = 3 dengan akurasi sebesar 62.5%, sedangkan akurasi terkecil yaitu 55%
pada k = 5. Untuk mengetahui data mana saja yang salah diklasifikasi pada
akurasi, berikut ini merupakan confusion matrix dari hasil klasifikasi percobaan 1
menggunakan k =3. Confusion matrix untuk nilai k yang lain dapat dilihat pada
Lampiran 2.
Tabel 3 Confusion matrix seluruh fold percobaan 1 untuk k = 3
Kelas
Asal
Bakul
Matahari
Sukun
Kendil

Bakul
7
2
3

Kelas hasil prediksi
Matahari
Sukun
1
6
3
3
5

Kendil
2
1
7

Berdasarkan Tabel 2 dapat disimpulkan bahwa banyak citra yang ada
sangat mirip satu sama lain. Dari tabel tersebut diketahui varitas yang tepat
diklasifikasi hanya 25 dari yang seharusnya tepat 40. Varietas yang paling banyak
di prediksi adalah Bakul dan Kendil. Pada Bakul mempunyai kemiripan mengarah
ke Sukun dan Kendil sedangkan pada Kendil mempunyai kemiripan mengarah ke
Bakul. Varietas yang paling tidak tepat di prediksi yaitu varietas Sukun yang lebih
mengarah ke Matahari dan Bakul.
Percobaan 2: Klasifikasi dengan pemilihan ciri
Percobaan pertama dilakukan dengan menggunakan beberapa ciri. Ciri yang
terpilih diliat nilai penyebaran nilai ekstraksi citra pada box plot Gambar 3. Ciriciri yang terpilih yaitu minimum, standar deviasi, kuartil 1, interval quartile
range, skewness dan kurtosis. Gambar 5 merupakan grafik rata-rata akurasi dari
percobaan 1 untuk k = 1, 3, 5, 7, 9 dan 11

Akurasi (%)

11

100
90
80
70
60
50
40
30
20
10
0

67,5

65

62

60

60

5

7

9

11

55

1

3

nilai k

Gambar 5 Grafik akurasi percobaan 2
Berdasarkan Gambar 5, nilai k yang menghasilkan rata-rata akurasi terbesar
yaitu k = 3 dengan akurasi sebesar 67.5%, sedangkan akurasi terkecil yaitu 55%
dengan k = 1. Untuk mengetahui data mana saja yang salah diklasifikasi pada
akurasi tertinggi. Tabel 4 merupakan confusion matrix dari hasil klasifikasi
percobaan 2 menggunakan k =3. Confusion matrix untuk nilai k yang lain dapat
dilihat pada Lampiran 3.
Tabel 4 Confusion matrix seluruh fold percobaan 2 untuk k = 3
Kelas
Bakul
Matahari
Sukun
Kendil

Bakul
8
2
2

Kelas hasil prediksi
Matahari
Sukun
6
3

3
5

Kendil
2
1
8

Berdasarkan Tabel 4 dapat disimpulkan bahwa banyak citra yang ada sangat
mirip satu sama lain. Dari tabel tersebut diketahui varitas yang tepat diklasifikasi
hanya 27 dari yang seharusnya tepat 40. Varietas yang paling tepat di prediksi
yaitu Bakul dan mempunyai kemiripan pada Kendil. Varietas yang paling tidak
tepat yaitu varietas Sukun yang mempunyai kemiripan ke Bakul dan Matahari.
Bisa dilihat dari box plot sebelumnya data citra memang penyebarannya sangat
mirip. Gambar 6 merupakan grafik kedua percobaan di atas dilihat dari rata-rata
akurasi pada percobaan 1 dan percobaan 2.

12

80
67,5
62,5

70
Akurasi (%)

60

57,5
55

65
55

62
58,5

57,560

57,560

50
40

Percobaan 1

30

Percobaan 2

20
10
0
1

3

5

7

9

11

Nilai k

Gambar 6 Grafik perbandingan percobaan 1 dan percobaan 2
Dapat dilihat pada Gambar 6 perbandingan akurasi antara percobaan 1
dengan percobaan tidak terlalu jauh. Dilihat dari k pada percobaan 1 tiap k
mengalami naik pada k = 3 dan kemudian mulai turun hingga k=11. Sama seperti
percobaan 1 akurasi pada tiap k mengalami kenaikan pada k =3 lalu turun hingga
k =11. Dapat dilihat akurasi tertinggi dari percobaan 1 dan percobaan 2 terdapat di
k = 3.
Analisis Kesalahan
Pada confusion matrix (Tabel 3) dan (Tabel 4) banyak varietas durian
mengalami salah identifikasi sebagai varietas durian lainnya. Kedua percobaan
tersebut memiliki akurasi kurang baik yaitu sekitar 60%. Kedua percobaan
tersebut diketahui bahwa varietas Bakul yang paling banyak prediksi benar dan
mempunyai kemiripan mengarah ke Kendil begitu sebaliknya. Pada kedua
percobaan tersebut dapat diketahui bahwa sukun mempunyai kemiripan ke Bakul
dan Matahari. Kemiripan tersebut bisa dilihat dari pola boxplot. Gambar 7
menunjukan fiur-fitur boxplot yang termasuk ke dalam masing-masing pola.

(a)

(b)

13

(c)

(d)

(e)
Gambar 7 Pola box plot dari perhitungan masing-masing varietas (a)minimum
(b)Standar deviasi (c) Q1(d) skewness (e) kurtosis
Dapat dilihat pada Gambar 7 penyebaran nilai antara kelas satu dan lainnya
hampir mirip. Pada pola kelas Bakul dengan kelas Kendil nilainya hampir sejajar
dan nilai tersebut dilihat dari Tabel (2) dan Tabel (3) yang memang memiliki
kemiripan satu sama lainnya. Begitu pula pada kelas Matahari dan Sukun pola
boxplot mempunyai kemiripan satu sama lain sehingga pada confusion matrix
prediksi untuk kelas tersebut sama-sama mengarah ke kelas matahari ke sukun
begitu sebaliknya.

SIMPULAN DAN SARAN
Simpulan
Berdasarkan penelitian yang telah dilakukan, dapat diambil kesimpulan
bahwa penggunaan metode klasifikasi k-NN dengan ekstraksi tekstur statistical
textures kurang tepat pada penelitian ini dikarenakan kelemahan k-NN yaitu
pembelajaran berdasarkan jarak tidak jelas mengenai jenis jarak apa yang harus
digunakan dan atribut mana yang harus digunakan untuk mendapatkan hasil yang
terbaik. Hasil percobaan pada penelitian ini dengan semua ciri rata-rata akurasi
terbesar hanya sampai 62.5% pada k =3 dengan menggunakan semua ciri tekstur
dan 67.5% untuk pemilihan hanya enam ciri. Pemilihan ciri berpengaruh dalam

14

penelitian ini. Pada penelitian ini k pada klasifikasi K-NN yang semakin besar
akan mengurangi akurasi sehingga lebih baik menggunakan k yang kecil.
Saran
Pada penelitian ini masih memiliki beberapa kekurangan yang dapat
diperbaiki pada penelitian selanjutnya. Adapun beberapa saran untuk penelitian
selanjutnya yaitu :
1
Menggunakan pelatihan JST Propagasi balik supaya data akan mendapatkan
pelatihan terlebih dahulu mungkin akan menambah akurasi menjadi lebih
besar.
2
Pada k-NN perhitungan jarak menggunakan selain Euclidean seperti
cityblock, cosine, correlation atau hamming.

DAFTAR PUSTAKA
Han J, Kamber M, Pei J. 2011. Data Mining Concepts and Techniques. Ed Ke-3.
Massachusets : Morgan Kaufmann.
Hayyi A. 2014. Identifikasi Daun Shorea Menggunakan K-Nearest Neighbor
dengan Ciri Statistical Textures.[skripsi]. Bogor(ID): Institut Pertanian Bogor
Nurjayanti B. 2011. Identifikasi Shorea menggunakan k-Nearest Neighbor
berdasarkan karakteristik morfologi daun [skripsi]. Bogor(ID) : Institut
Pertanian Bogor
Pertiwi N. 2014. Identifikasi Varietas Durian berdasarkan Tekstur Daun dengan
Metode Ekstraksi GLCM menggunakan PNN[skripsi]. Bogor(ID): Institut
Pertanian Bogor.
Salasa KAN, Ashari S, Herlina N. 2013. Identifikasi tanaman durian mirip durian
bido di kecamatan Wonosalam kabupatem Jombang dengan metode isozim dan
morfologi. Jurnal Produksi Tanaman. 1(5):427-433.
Syahrudin K. 2012. Analisis Keragaman Beberapa Genotipe Durian (Durio
zibethinus murr.) menggunakan Penanda Morfologi dan Molekular (ISSR)
[tesis]. Bogor(ID): Institut Pertanian Bogor.
Walpole, Ronald E. 1995. Pengantar Statistika. Edisi ke-3. Jakarta : PT. Gramedia
Pustaka Utama.
Yanti PP. 2012. Identifikasi Freycinetia berbasis Citra Anatomi Epidermis Daun
menggunakan K-Nearest Neighbor [skripsi]. Bogor(ID) : Institut Pertanian
Bogor.

15

Lampiran 1 Contoh citra daun asli dari setiap varietas durian.

Durian Bakul

Durian Matahari

Durian Sukun

Durian Kendil
Lampiran 2 Confusion matrix percobaan 1 k = 1, 5, 7, 9 dan 11
Tabel 5 Confusion matrix k = 1
Kelas
Bakul
Matahari
Sukun
Kendil

Bakul
5

Kelas hasil prediksi
Matahari
Sukun
7
4

2
3

Kendil
5

3
4
7

Tabel 6 Confusion matrix k = 5
Kelas
Bakul
Matahari
Sukun
Kendil

Bakul
8

Kelas hasil prediksi
Matahari
Sukun
5
4
2

2
3

4
4

Kendil
2
1
5

Tabel 7 Confusion matrix k = 7
Kelas
Bakul
Matahari
Sukun
Kendil

Bakul
8
2
2

Kelas hasil prediksi
Matahari
Sukun
6
4
2

2
4

Kendil
2
2
2
6

16

Tabel 8 Confusion matrix k = 9
Kelas
Bakul
Matahari
Sukun
Kendil

Bakul
8
1
2
2

Kelas hasil prediksi
Matahari
Sukun
5
4
2

3
4

Kendil
2
1
6

Tabel 9 Confusion matrix k = 11
Kelas
Bakul
Matahari
Sukun
Kendil

Bakul
8

Kelas hasil prediksi
Matahari
Sukun
6
4
3

2
2

3
4

Kendil
2
1
5

Lampiran 3 Confusion matrix percobaan 2 k = 1, 5, 7, 9 dan 11
Tabel 10 Confusion matrix k = 1
Kelas
Bakul
Matahari
Sukun
Kendil

Bakul
6

Kelas hasil prediksi
Matahari
Sukun
6
5
1

1
3

3
4

Kendil
4
1
6

Tabel 11 Confusion matrix k = 5
Kelas
Bakul
Matahari
Sukun
Kendil

Bakul
8

Kelas hasil prediksi
Matahari
Sukun
6
2
1

2
3

Kendil
2

4
6
6

Tabel 12 Confusion matrix k = 7
Kelas
Bakul
Matahari
Sukun
Kendil

Bakul
8
2
4

Kelas hasil prediksi
Matahari
Sukun
8
2
2

1
6

Kendil
2
1
4

17

Tabel 13 Confusion matrix k = 9
Kelas
Bakul
Matahari
Sukun
Kendil

Bakul
8

Kelas hasil prediksi
Matahari
Sukun
7
2
3

2
3

2
6

Kendil
2
1
4

Tabel 14 Confusion matrix k = 11
Kelas
Bakul
Matahari
Sukun
Kendil

Bakul
8
2
3

Kelas hasil prediksi
Matahari
Sukun
7
4
2

2
4

Kendil
2
1
5

18

RIWAYAT HIDUP
Penulis lahir pada tanggal 2 Mei 1991 di Tangerang. Penulis merupakan
anak terakhir dari tiga bersaudara dari pasangan Warto dan Rusmini. Pada tahun
2009, penulis lulus dari SMAN 3 Kota Tangerang. Pada tahun yang sama, penulis
melanjutkan pendidikan di program Diploma IPB pada program keahlian
manajemen informatika. Pada tahun 2012, penulis melanjutkan studi Program S1
Ilmu Komputer Alih Jenis, Departemen Ilmu Komputer, Fakultas Matematika dan
Ilmu Pengetahuan Alam, Institut Pertanian Bogor.