Implementasi Algoritme Modified K-Nearest Neighbor (MKNN) untuk Diagnosis Penyakit Tanaman Cengkeh

  

Vol. 2, No. 12, Desember 2018, hlm. 7149-7156 http://j-ptiik.ub.ac.id

Implementasi Algoritme Modified K-Nearest Neighbor (MKNN) untuk

Diagnosis Penyakit Tanaman Cengkeh

1 2 3 Rizaldy Amsyar , Nurul Hidayat , Rizal Setya Perdana

  Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya 1 2 3 Email: [email protected], [email protected], [email protected]

  

Abstrak

  Tanaman cengkeh memiliki nilai ekonomi tinggi dan merupakan salah satu komoditas ekspor hasil perkebunan Indonesia, di daerah Wonosalam Kabupaten Jombang terdapat kebun cengkeh yang kurang terawat karena pemilik yang tidak setiap saat ada di kebun, dan dengan demikian tanaman rentan terkena penyakit dan berkurangnya hasil panen dari cengkeh tersebut. dibutuhkan sebuah cara untuk membantu petani untuk mengetahui jenis penyakit yang menyerang tanaman cengkeh tersebut, maka dibuatlah sistem diagnosis tanaman cengkeh dengan menggunakan algoritme Modified K

  • – Nearest Neighbor (MKNN). Sistem diagnosis akan memberikan informasi penyakit tanaman cengkeh berdasarkan masukan berupa gejala-gejala yang dapat diamati dari tanaman. Algoritme MKNN adalah pengembangan dari algoritme KNN dengan menambahkan proses perhitungan nilai validasi data latih dan Weight Voting. Perhitungan validasi bertujuan untuk mengatasi permasalahan data yang menyimpang pada algoritme KNN agar tidak terjadi bias dan Weight Voting bertujuan untuk menghitung bobot dari data. Hasil akurasi dari sistem diagnosis tanaman cengkeh menggunakan algoritme MKNN adalah sebesar 96.67%.

  Kata kunci: tanaman cengkeh, sistem diagnosis, data mining, modified k-nearest neighbor

Abstract

  

Clove plant have high economic value and one of many export commodity of Indonesian plantation

product, in Wonosalam region Jombang Regency there are less well groomed clove farm because the

owners are not at all the times in the farm, and thus the plant susceptible to disease and reduced yields

from the clove harvest. Needed a way to help farmers to know the types of diseases that attack the clove

plants, then made a clove plant diagnosis system using the algorithm Modified K - Nearest Neighbor

(MKNN). The diagnostic system will provide clove plant disease information based on inputs of

observable symptoms of the plant. MKNN algorithm is the development of KNN algorithm by adding

calculation process of data training validation and weight voting. Validation calculation aims to

overcome the problem of data that deviates on the KNN algorithm in order to avoid bias and weight

voting aims to calculate the weight of the data. Accuracy of clove plant diagnosis system using MKNN

algorithm is 96.67%.

  Keywords: clove plant, system diagnosis, data mining, modified k-nearest neighbor

  yang cukup, produksi cengkeh di Indonesia 1. selalu menunjukkan grafik yang naik turun yang

   PENDAHULUAN tergantung oleh siklus tertentunya.

  Tanaman cengkeh sejak dulu sudah Cengkeh juga memiliki kerumitan dalam dibudidayakan di Indonesia, Nilai ekonomi dari penanamannya dan sering terkena penyakit, produksi cengkeh ini cukup tinggi, hasilnya yang penyakit cengkeh juga beragam dan memiliki paling banyak digunakan adalah bunga kering kriteria serta penangan yang berbeda-beda, serta sebagai bahan baku rokok kretek dan rempah tidak semua masalah dapat diatasi secara praktis rempah masakan. Indonesia sendiri merupakan oleh petani. Di kecamatan Wonosalam negara produksi cengkeh serta konsumsi Kabupaten Jombang terdapat perkebunan cengkeh, serta cengkeh dapat tumbuh subur di cengkeh yang rata-rata dimiliki oleh orang luar

  Indonesia Karena iklim yang panas dan matahari

  Fakultas Ilmu Komputer Universitas Brawijaya

7149 terkena cacar daun akan terlihat tidak subur dan

  Phyllosticta syzgii , karena itu jika cengkeh

  2.2 Penyakit Cengkeh

  BPKC dikarenakan cacar daun ini dapat ditemui hampir diseluruh tempat produksi hasil cengkeh. Pada cacar daun cengkeh penyebabnya adalah

  2. Cacar Daun Cengkeh (CDC) Cacar daun dapat di golongkan sebagai penyakit kedua yang termasuk berbahaya selain

  3

  bantuan serangga dari tanaman yang terserang ke tanaman yang sehat. Beberapa ciri-ciri tanaman yang terjangkit penyakit ini seperti daun yang mendadak berguguran, lalu di pucuknya banyak ranting yang mati. Untuk penyakit ini bias berlangsung dari minggu sampai beberapa bulan. Untuk perawatan dari penyakit ini yang pertama dapat dilakukan sanitasi kebun dan penyemprotan Hindola fulfa dengan menggunakan insektisida kontak dengan interval sekitar 6 minggu sekali untuk tanaman yang masih bias diselamatkan. Kedua dapat dilakukan penyuntikan antibiotic oksitetasklin (OTC) sebanyak 6 gr/100 ml air dilakukan setiap

  pseudomonas syzgii ini menyebar dengan

  1. Bakteri Pembuluh Kayu Cengkeh (BPKC) Penyakit yang menyerang tanaman cengkeh ketika masa berbuah awal atau baru dewasa dan siap produktif, penyakit ini tergolong penyakit yang sangat merusak. Penyakit yang disebabkan

  Penyakit yang menyerang tanaman cengkeh menyebabkan tanaman cengkeh kurang produktif bahkan dapat menyebabkan gagal panen bagi petani. Serta cengkeh juga rentan terkena penyakit dan penanganan untuk masing- masing penyakit berbeda, adapun beberapa penyakit yang sering ditemui berdasarkan data yang didapat dari pakar:

  Cengkeh merupakan tanaman tropis dengan nama latin Eugenia aromatica yang merupakan tanaman asli Indonesia. Tanaman ini tumbuh optimal pada 300

  2.1 Cengkeh

  2. LANDASAN KEPUSTAKAAN

  • – 4500 mm/tahun. Persebaran perkebunan cengkeh di Indonesia paling banyak dari Sulawesi, berdasarkan survey oleh Kementerian Pertanian Republik Indonesia luas lahan yang digunakan untuk perkebunan cengkeh di Indonesia mencapai 510.00 Ha dengan total produksi nasional 122.134 Ton.

  Algoritme Modified K-Nearest Neighbor atau MKNN merupakan salah satu cara untuk melakukan klasifikasi dan memberikan hasil diagnosis, alasan menggunakan algoritme ini karena memiliki keunggulan untuk mengklasifikasikan data gejala penyakit dengan data uji yang ada. MKNN memiliki penambahan prosedur dalam melakukan klasifikasi, dengan adanya menghitung nilai validitas dari data latih dan proses Weight Voting untuk menghitung Weight dari tetangga terdekatnya. Dengan adanya 2 proses baru diharapkan dapat memperbaiki kekurangan pada algoritme K-NN (Wafiyah, 2017). Algoritme MKNN masih lebih unggul dibandingkan dengan algoritme KNN, banyaknya data latih mempengaruhi hasil kinerja dari algoritme tersebut, apabila data semakin banyak maka hasilnya semakin baik (Mutrofin, 2016).

  tsukamoto , Naïve bayes, K-Nearest Neighbor.

  Klasifikasi merupakan salah satu bagian dari data mining yang berutujuan menggali nilai- nilai atau informasi dari sekumpulan data (Nikam, 2015). Dengan melakukan klasifikasi suatu jenis penyakit dapat diketahui polanya berdasarkan data yang ada, yaitu gejala gejala penyakit cengkeh yang terlihat pada tanaman tersebut seperti bagaimana kondisi daun, batang, akar dan buahnya. Dari situ dapat dilakukan proses klasifikasi menggunakan computer dengan menggunakan algoritme seperti fuzzy

  Permasalahan yang muncul karena pemilik perbekebunan yang tidak selalu ada di tempat, banyak tanaman cengkeh yang rusak karena kurangnya perwatan dan penanganan dari penyakit. Hal itu dapat menyebabkan kerugian bagi pemilik perkebunan cengkeh. Tentunya sebelum terkena penyakit tanaman cengkeh menunjukkan gejala-gejala yang dapat diamati dan langsung dilakukan penanganan. Oleh karena itu diperlukan ahli yang dapat memberikan pengetahuan mengenai hal-hal yang menyangkut dengan tanaman cengkeh. Namun pengetahuan tentang penyakit cengkeh memiliki kendala seperti perlunya konsultasi pada ahli untuk setiap masalah yang menjadikannya kurang efektif dan dapat berdampak pada kualitas produksi sampai gagal panen. Pada hal-hal seperti inilah petani serta pemilik perkebunan memerlukan suatu alat bantu yang dapat melakukan diagnosis serta memberi informasi mengenai penyakit dari tanaman cengkeh.

  daerah, dan mereka tidak secara langsung ikut merawat perkebunan cengkeh tersebut.

  • – 600 mdpl dengan suhu rata- rata 22° - 30°C dan curah hujan sekitar 1500
  • – 4 bulan sekali. Ketiga dapat dilakukan pemupukan kombinasi N dan K.
  • – 10 hari sekali, selain itu sanitasi kebun juga harus dijaga, daun, ranting dan biji dari tanaman yang terkena penyakit sebaiknya di kumpulkan dan di bakar.

  di bagian daunnya terdapat bekas yang menonjol, hal ini menyebabkan tanaman kekurangan nutrisi karena kemampuan untuk melakukan fotosintesis berkurang. Pengendalian dari penyakit Cacar Daun Cengkeh dapat dilakukan penyemprotan fungsida dengan interval 7

  : Data Training : Data uji

  =1

  1 ∑ ( ( ), ( ( ( ))))

  ( ) =

  berdekatan. Kemudian hasil perbandingan kelas tadi akan di total dan kemudian dibagi dengan k. persamaan dari validasi data training ditunjukkan seperti persamaan 2.

  training dengan kelas dari tetangga yang

  Pada algoritme Modified K-NN semua data latih harus divalidasi, pada tahap ini nilai validasi didapat dengan membandingkan kelas dari data

  2.6 Validasi Data Training

  Algoritme Modified K-NN menggunakan nilai perhitungan Weight Voting terbesar untuk menentukan kelas dari suatu data yang belum diketahui. Nilai dari Weight juga dipengaruhi oleh nilai validasi. Maka dengan ditambahnya perhitungan nilai validasi dan Weight Voting ini dapat mengungguli akurasi dari penggunaan algoritme K-NN(putri, 2017).

  Voting untuk menghitung bobot dari data.

  Modified K-NN merupakan pengembangan dari algoritme KNN dengan penambahan beberapa proses yakni perhitungan nilai validasi data latih dan Weight Voting atau pembobotan. Perhitungan nilai validasi bertujuan untuk mengatasi permasalahan data yang menyimpang pada algoritme KNN sehingga kurangnya bias dari data latih (Mutrofin, 2016) dan Weight

  2.5 Algoritme Modified K-NN

  (1) Keterangan: ( , ) : Euclidean Distance dari data Training x dan data uji y.

  3. Jamur Akar Putih (JAP) Untuk penyakit jamur akar putih didapat dari pakar bahwa penyebabnya adalah

  2 =1

  ( , ) = √∑ ( − )

  tadi akan dihitung sampai dengan menentukan kelas dari data masukan atau data uji. Adapun persamaan dari algoritme KNN ini ada pada persamaan 1.

  Euclidean

  Kebanyakan algoritme ini digunakan karena dapat mencarari solusi dari permasalahan klasifikasi data. Pada KNN terdapat beberapa keunggulan seperti mudah dipahami dan memiliki proses training yang cepat. Adapun proses dari KNN ini adalah dengan mencari jarak terdekat menggunakan Euclidean Distance antar tetangganya, dari namanya KNN yang berarti k tetangga terdekat, dibutuhkan nilai k untuk berapa banyak titik-titik tetangga yang berdekatan yang akan digunakan untuk melakukan proses perhitungan. Setelah itu nilai

  2.4 Algoritme KNN

  data pada data latih. Selajutnya pada tahap kedua model yang diekstrak di test dengan data latih tersebut untuk mengukur performa dan akurasi dari klasifikasi tersebut. Sehingga klasifikasi menentukan kelas dari sebuah data yang kelasnya tidak diketahui dengan menggunakan data latih sebagai acuan untuk menentukan kelasnya.

  machine dan naive bayes dengan menggunakan

  Klasifikasi merupakan sebuah teknik pada data mining yang dapat memproses data yang besar, teknik yang sering digunakan untuk melakukan analisis dari data latih yang sudah ada sehingga kesalahan ketika melakukan klasifikasi bisa berkurang (Nikam, 2015). Klasifikasi umumnya memiliki 2 tahap utama, tahap pertama model dibuat menggunakan algoritma klasifikasi seperti algoritme ID3, C4.5, fuzzy, K-Nearest Neighbot, support vector

  2.3 Klasifikasi

  seperti pada akar dan batang dekat akar terdapat pertumbuhan rhizomorph yang menyerupai kipas berwarna putih, oleh karena itu dinamakan jamur akar putih. Akibatnya akar menjadi lunak dan basah dan jika dibiarkan akar tanaman akan busuk. Dan bagian permukaan daun yang terlihat kasar dan melengkung kebawah tidak seperti cengkeh biasanya kemudian berubah menjadi kecoklatan. Ada beberapa cara perawatan apabila tanaman yang terkena jamur akar putih yaitu dengan melakukan kultur teknis pada perkebunan atau dapat melakukan pemupukan, terakhir dapat di bantu dengan menanam jenis kacang-kacangan didekat tanaman untuk mencegah penyakit ini.

  Rigidoporus sp , dan gejala yang dapat diamati

  (2)

2.7 Weight Voting

  Euclidean dan

  3.1 Pengumpulan Data

  Pada penelitian ini digunakan data yang didapat diperoleh dengan melakukan wawancara kepada ahli dari tanaman cengkeh di kecamatan Wonosalam Kabupaten Jombang, didapatkan data berjumlah 61 dan 11 jenis gejala yang sudah diberi nilai untuk tiap parameternya sesuai dengan pengetahuan dari narasumber dan penyakit tanaman cengkeh serta bagaimana penanganan untuk masing-masing penyakit. Untuk rincian gejala yang didapatkan tersebut ada pada tabel 1.

  Tabel 1. Gejala dan Kode Gejala No Gejala pada tanaman Kode gejala

  1

  ( ) = ( ) ×

  ditambah untuk menghindari penyebut dibagi dengan 0. Hasil klasifikasi Modified K-NN ditentukan dengan mengambil nilai perhitungan yang terbesar. Untuk persamaannya dapat ditulis seperti persamaan 4.

  Perhitungan Weight Voting adalah salah satu tahap di algoritme Modified K-NN, pada masing masing data dihitung bobotnya menggunakan 1/( + ) yang mana merupakan jarak

  Gambar 1. Diagram Alir Penelitian

  Keterangan: = nilai kelas data training = nilai kelas data training

  ( , ) = {1 = 0 ≠ (3)

  1, sedangkan jika kelasnya berbeda maka bernilai 0. Persamaan dari fungsi didefinisikan seperti persamaan 3.

  : Kelas tetangga terdekat ke-i data Kemudian fungsi disini digunakan sebagai pembanding kelas dari data a dan data b, apabila kelas keduanya sama maka nilai fungsi adalah

  ( )

  : Kelas dari data

  ( )

  Keterangan : Banyaknya tetangga

  • (4)

   METODOLOGI

  : Euclidean Distance dari data uji : 0.5 3.

  Keterangan: ( ): Hasil Validitas data ke-i

  1 Ranting yang ada di pucuk batang kering dan mati G-1

  2 Daun berguguran dari pucuk ke akar G-2

  3 Percabangan pohon mudah layu tiba-tiba G-3

  4 Daun yang sudah tua warnanya kuning G-4

  5 Batang tanaman kering G-5

  6 Ditemui bercak melepuh pada daun yang masih muda/merah G-6

  7 Ada titik hitam di bagian yang melepuh G-7

  8 Daun yang berada di bawah lebih banyak bercak cacar dari daun yang ada di atas G-8

  9 Daun tiba-tiba layu, kering dan kemudian rontok G-9

  10 Benang-benang miselium dari jamur ditemui pada bagian akar G-10

  11 Bagian akar mulai membusuk G-11

  Pada bagian ini membahas mengenai metodologi yang digunakan dalam penulisan skripsi ini, bagaimana proses pengumpulan data serta bagaimana bentuk data yang digunakan dalam pengerjaan penelitian ini. adapun proses tahapan penelitian ditunjukkan gambar 1.

  4.

  4.1.1 PERANCANGAN Proses Klasifikasi Modified K-Nearest Neighbor (MKNN) Pada bagian ini menjelaskan bagaimana

  Pada tahap klasifikasi Modified K-NN

  tahap-tahap perancangan dalam pembuatan

  berguna untuk mengetahui hasil diagnosis dari

  sistem yang nantinya akan digunakan untuk

  sistem yang mana didapat dari masukan

  melakukan diagnosis dan memberikan solusi

  pengguna dari gejala-gejala lalu dilakukan

  kepada pengguna. Adapun diagram dari

  perhitungan matematis untuk mencari kesamaan perancangan seperti gambar 2. dari masukan tadi dengan data training. Untuk klasifikasi ini mulai dengan menentukan nilai k atau jumlah tetangga yang terdekat, kemudian dihitung euclidean distance antar data training, dilakukan ranking dengan nilai terkecil dari tiap data tadi, lalu dicari validitas untuk setiap data

  training , setelah itu disini data uji mulai di

  gunakan dengan menghitung euclidean distance dari data uji dengan data training, tahap terakhir adalah menghitung weight voting dari data uji dan hasilnya adalah nilai weight yang paling besar. Tahap-tahap proses modified K-NN seperti gambar 4.

  Gambar 2. Diagram Perancangan Sistem

4.1 Perancangan Proses

  Sistem yang dibuat ini adalah sistem diagnosis penyakit, sebelum melakukan klasifikasi dibutuhkan beberapa masukan dari pengguna yang nantinya akan digunakan untuk melakukan perhitungan oleh sistem dan kemudian hasilnya berupa jenis penyakit. Masukan tadi berupa 11 gejala penyakit dari tanaman cengkeh. Perancangan proses dapat dilihat pada gambar 3.

  Gambar 4. Diagram Proses Klasifikasi

  4.1.2 Proses Perhitungan Euclidean Distance

  Tidak seperti algoritme K-NN yang menghitung euclidean distance sebanyak 1 kali, pada algoritme Modified K-NN akan dihitung sebanyak 2, yang pertama antar data training dengan dirinya sendiri, kemudian yang kedua antar data uji dan data training. Perhitungan

  euclidean yang pertama berguna untuk mencari

  nilai validasi dari data training dan yang kedua digunakan untuk mengetahui weight dari data masukan atau data uji yang nantinya akan di

  Gambar 3. Diagram Alir Sistem klasifikasi cenderung ke kelas penyakit yang mana. Untuk tahap perhitungan euclidean

  distance seperti gambar 5.

  Gambar 5. Perhitungan Jarak Euclidean

  Validitas disini berguna untuk mencari kesamaan kelas dari setiap data pada data

  training . Nilai-nilai kesamaan ini bertujuan

  untuk mengetahui apakah kelas dari jumlah tetangga yang terdekat dari sebuah titik itu sama atau tidak, nilai validitas ini dipengaruhi oleh banyaknya nilai k, semakin banyak nilai k maka validitas dari sebuah data bisa bernilai kecil. Untuk mendapatkan nilai validitas dimulai setelah didapat jarak euclidean kemudian di urutkan berdasarkan terkecil yang berarti terdekat sebanyak k, kemudian akan dibandingkan kesamaan dari kelas dari data latih dan data uji, apabila kelasnya sama maka nilainya 1, sedangkan jiba tidak sama maka nilainya 0, setelah itu seluruh nilai kesamaan tadi akan di jumlah kemudian dibagi dengan k. Didapatkan nilai validitas, untuk proses perhitungannya seperti gambar 6.

  Gambar 6. Diagram Alir Perhitungan Validitas

  4.1.4 Proses Perhitungan Weight Voting Weight Voting atau pembobotan berguna

  untuk mendapatkan hasil akhir dari klasifikasi

  Modified K-NN (MKNN). Klasifikasi didapat

  dengan mencari Weight Voting terbesar dengan menggunakan persamaan (4), nilai validitas dan nilai eculidean data latih dan data uji digunakan untuk mendapatkan hasil akhir dari sistem. Proses perhitungan Weight Voting dijelaskan pada gambar 7 Diagram Alir Perhitungan Weight

4.1.3 Proses Perhitungan Validitas

  Voting .

  5. PENGUJIAN DAN ANALISIS

  Dengan diselesaikannya implementasi dari sistem maka dilanjutkanlah dengan melakukan pengujian serta memberikan analisis terhadap hasil diagnosis sistem yang sudah dibangun. Untuk pengujian yang digunakan disini adalah pengujian akurasi. Diagnosis sistem dibandingkan dengan diagnosis dari ahli yang sudah ada di data training. Untuk pengujian berdasarkan nilai k dan jumlah data training, untuk nilai k antara 2 samai 7 dan data training berjumlah 20, 40 dan 60.

  Gambar 7. Diagram Alir Perhitungan Weight Voting

  5.1 dilihat di gambar 8. Pengujian 20 Data Latih

  Hasil pengujian yang didapat seperti pada tabel 3.

  Tabel 2. Hasil Akurasi 20 Data Latih Nilai k Akurasi 2 85% 3 90% 4 90% 5 90% 6 90% Gambar 8. Grafik Hasil Pengujian Akuras 7 90%

  Akurasi yang didapat dari sistem ketika

  5.2

  menggunakan k bernilai 2 dan data sebanyak 20

   Pengujian 40 Data Latih

  adalah 85%, yang mana berarti sistem Hasil pengujian yang didapat seperti pada mendiagnosis 17 data yang benar dari total 20. tabel 4.

  Kemudian berlanjut dengan k bernilai 3 sampai

  Tabel 3. Hasil Akurasi 40 Data Latih dengan k bernilai 7 didapatkan akurasi 90%.

  Nilai k Akurasi Untuk pengujian k bernilai 3 sampai 7 didapat bahwa data yang tidak sesuai sama semua.

  2 95%

  Kemudian akurasi ketika k bernilai 2 sampai

  3 95%

  dengan k bernilai 7 dengan data sebanyak 40

  4 95%

  adalah sebesar 95% yakni 38 dari 40 data yang sesuai. Untuk pengujian 40 data meskipun grafik

  5 95%

  persentase akurasi terlihat datar namun hasil

  6 95%

  diagnosis yang salah berbeda beda. Selanjutnya

  7 95%

  pada pengujian akurasi dengan 60 data didapat juga besaran akurasi yang stagnan sebesar

  96.67% atau 58 data sesuai dari 60 data, pada 60 data ditemukan juga bahwa data yang tidak Hasil pengujian yang didapat seperti pada sesuai juga berbeda beda dari tiap nilai k. tabel 5.

  5.3 Pengujian 40 Data Latih

  Tabel 4. Hasil Akurasi 60 Data Latih 6.

   Kesimpulan Nilai k Akurasi

  Dengan selesainya pengujian dan analisis

  2 96.67%

  dari penelitian ini dapat disimpulkan hasil akhir

  3 96.67% dan tujuan skripsi ini yang berdasar dari rumusan

  masalah, maka disimpulkan sebagai berikut:

  4 96.67% 1.

  Algoritme Modified K-Neares Neighbor

  5 96.67%

  dapat digunakan melakukan proses

  6 96.67%

  klasifikasi terhadap penyakit yang ada pada tanaman cengkeh, klasifikasi yang

  7 96.67%

  dilakukan dengan menggunakan masukan dari pengguna yang berupa 11 gejala penyakit cengkeh kemudian sistem yang

  5.4 Analisis Pengujian

  dibangun akan melakukan klasifikasi Setelah dilakakukannya pengujian maka dengan menggunakan algoritme Modified akan dibuat analisi terhadap pengujian itu tadi,

  K-NN tahap awal dimulai dengan dari pengujian tersebut diketahui bahwa nilai k menghitung euclidean distance antar data tidak terlalu berpengaruh terhadap akurasi dari latih kemudian hasil dari tiap euclidean hasil diagnosis sistem. Kemudian semakin tersebut diambil nilai terkecil sebanyak k, banyak data training maka akurasi akan semakin kemudian setelah didapat nilai terkecil dari besar, karena data yang benar juga semakin

  euclidean akan dicari nilai dari validasi yang

  banyak. Hasil akurasi dari pengujian dapat didapat dari membandingkan nilai kelas dari data training dengan nilai kelas dari data training yang digunakan dapat memberikan yang terdekat, jika kelas keduanya bernilai hasil yang berbeda-beda dari tiap k yang sama maka hasilnya adalah 1 dan apabila digunakan. tidak maka hasilnya 0, kemudian dibandingkan sampai dengan jumlah DAFTAR PUSTAKA tetangga terdekatnya sama dengan nilai k.

  Nikam, S.S., 2015. A Comparative Study of Nilai total validitas akan dijumlah dengan

  Classification Techniques in Data semua nilai validasi dan dibagi dengan nilai Mining Algorithms. Oriental Journal of

  k dan menghasilkan nilai validitas. Setelah Computer Science & Technology , 13-

  itu masukan berupa gejala diambil untuk 19. dihitung jarak euclideannya dengan data

  Putri, M.B.P., 2017. Diagnosis Penyakit Kulit latih yang ada, setelah didapat akan dihitung Pada Kucing Menggunakan Metode

  Weight Voting dengan menggunakan nilai Modified K-Nearest Neighbor.

  validitas dan euclidean data uji yang sudah Mutrofin, S., 2016. Optimasi Teknik Klasifikasi dilakukan sebelumnya. Hasil Weight Voting

  Modified K Nearest Neighbor

  yang terbesar adalah hasil diagnosis dari Menggunakan Algorima Genetika. sistem yang dibangun.

  , 1-5.

  Jurnal Gamma 2.

  Sedangkan untuk akurasi dari sistem setelah Wafiyah, F., 2017. Implementasi Algoritma dilakukan pengujian serta analisis dapat

  Modified K-Nearest Neighbor (MKNN)

  diambil kesimpulan bahwa: untuk Klasifikasi Penyakit demam.

  a.

  Ketika data training yang digunakan

  Jurnal Pengembangan Teknologi

  sebanyak 60 dihasilkan akurasi sistem

  Informasi dan Ilmu Komputer , Volume

  96.67%, setelah itu akurasi terbesar 1, 1210-1219. kedua diperoleh dengan data training sebanyak 40 dengan besaran akurasi 95% lalu untuk rata-rata akurasi terkecil di dapat dengan data training berjumlah 20 dan akurasi 89.16%.

  b.

  Akurasi yang terendah didapat dari nilai k=2 dengan jumlah data sebanyak 20 menghasilkan nilai akurasi 85%. Adapun saran yang ingin penulis berikan untuk melakukan pengembangan kedepan mengenai diagnosis penyakit untuk tanaman cengkeh berdasarkan penelitian yang sudah dilakukan penulis sampaikan adapun sarannya yaitu:

  1. Karena Penulis menggunakan data gejala yang bernilai 1 dan 0 saja, sebaiknya nilai dari gejala-gejala pada data training lebih bervariasi dan tidak bernilai 1 dan 0 saja agar diagnosis dari sistem dapat lebih baik.

  2. Penulis juga merasa bahwa data yang dimiliki kurang banyak, maka dengan menambahkan jumlah data training yang digunakan diharapkan menghasilkan akurasi yang lebih baik.

  3. Lebih baik lagi jika ada pencarian nilai k optimal dengan menggunakan Algoritma Genetik sehingga nilai k dari sistem akan selalu menghasilkan nilai yang optimal, karena pada penelitian ini nilai k juga kurang begitu berpengaruh banyak terhadap akurasi dari sistem. Diharapkan dengan adanya variasi dari data dan lebih banyaknya data