Klasifikasi Kelompok Varietas Unggul Padi Menggunakan Modified K- Nearest Neighbor

  Vol. 2, No. 8, Agustus 2018, hlm. 2392-2399 http://j-ptiik.ub.ac.id

  

Klasifikasi Kelompok Varietas Unggul Padi Menggunakan Modified K-

Nearest Neighbor

1) 2) 3)

  

Aldion Cahya Imanda , Nurul Hidayat , M. Tanzil Furqon

  Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email:

  

ABSTRAK

  Varietas Unggul merupakan jenis varietas padi yang dihasilkan dari persilangan varietas unggul padi lokal. Tujuannya yaitu untuk menghasilkan varietas padi unggulan terbaik. Dalam perkembangannya, varietas unggul padi menjadi komponen penting dalam peningkatan produksi padi nasional. Setiap jenis varietas unggul padi memiliki ekosistem atau media tanam yang berbeda sehingga diperlukan pengklasifikasian varietas. Klasifikasi varietas direkayasa dengan mengadaptasi data mining. Pada penelitian ini digunakan metode Modified K-Nearest Neighbor (MKNN) untuk memprediksi kelas suatu data. Berdasarkan pengujian yang telah dilakukan didapatkan nilai rata-rata akurasi maksimum sebesar 79,96% dan nilai akurasi minimum sebesar 51,2%.

  Kata Kunci: varietas unggul padi, prediksi, Modified K-Nearest Neighbor, data mining, akurasi.

  

ABSTRACT

Supreme varieties is a kind of varieties that produced from the cross of local supreme varieties. The

main idea is to produce the best rice varieties. Nowadays the supreme varieties becoming an national

important production component which is each of varie ties have their own ecosystem. That’s why the

classification system is required. Classification engineered by adapting from data mining. The method

that used is Modified K-Nearest Neighbor to predict a class from unclassified data. Based on the test

that have been done the highest accuracy is 79,96% and the minimum accuracy is 51,2%.

  Keywords: supreme varieties, prediction, Modified K-Nearest Neighbor, data mining, accuracy.

  Kelompok VUB tersebut yaitu Inpa (Inbrida

1. PENDAHULUAN

  Padi) dan Hipa (Hibrida Padi). Khusus untuk Inbrida Padi, representasi ekosistem

  Padi merupakan tanaman pangan yang dikonsumsi secara umum oleh masyarakat ditunjukkan dengan suku kata tambahan di Indonesia. Upaya peningkatan produksi ujung inpa, yaitu sebagai berikut: Inpari = Inbrida Padi Sawah Irigasi, Inpara = Inbrida. pertanian umumnya padi masih dan akan tetap menjadi kebutuhan bangsa ini mengingat Padi Rawa (rawa pasang surut/lebak), dan

  Inpago = Inbrida Padi Gogo. (Balai Besar semakin meningkatnya kebutuhan pangan beras sejalan dengan meningkatnya penduduk Penelitian Tanaman Padi, 2015). dan kualitas hidup masyarakat. Setiap jenis varietas unggul padi memiliki ekosistem atau media tanam yang berbeda.

  Varietas unggul merupakan komponen pendukung yang berperan penting dalam Petani perlu mengetahui tergolong dalam jenis peningkatan produksi padi nasional. Kontribusi apakah benih yang ditanam sehingga peningkatan produksi tetap terjaga. Oleh karena nyata varietas unggul tercermin dari pencapaian swasembada beras pada tahun 1984 dan 2007. itu, diperlukan pengklasifikasian varietas padi. Dukungan terhadap swasembada beras tersebut Klasifikasi benih padi direkayasa dengan mengadaptasi salah satu bidang ilmu dalam tetap berlanjut hingga tahun 2016 ini dengan dilepasnya berbagai varietas unggul padi oleh bidang informatika yaitu data mining. Data Badan Penelitian dan Pengembangan Pertanian mining adalah proses menemukan hubungan atau keterkaitan yang memiliki arti ataupun melalui Balai Besar Penelitian Tanaman Padi.

  Fakultas Ilmu Komputer Universitas Brawijaya pola dengan cara memeriksa kumpulan data dalam jumlah besar dan tersimpan di dalam media penyimpanan dengan menggunakan teknik pengenalan pola, seperti teknik statistik dan matematika (Alfian, 2013).

  Metode yang digunakan dalam penelitian ini yaitu metode Modified K-Nearest Neighbor (MKNN). Dalam penelitian yang dilakukan oleh Parvin, MKNN adalah modifikasi dari algoritma KNN yang diberi tambahan beberapa proses, yaitu validasi data latih dan weight

  Penelitian ini bertujuan untuk menentukan tingkat resiko penyakit lemak darah. Parameter yang digunakan ada empat, yaitu kolesterol total, kolesterol HDL, kolesterol LDL, dan trigliserida. Hasil dari sistem yaitu tingkat resiko penyakit berupa kelas yang terdiri dari tiga kelas, yaitu Normal, Tinggi, dan Waspada. Akurasi yang didapat dari metode MKNN pada penelitian ini yaitu 73,55% dan tertinggi 85,81% (Kumalasari, 2014).

  Metode K-Nearest Neighbor (KNN)”.

  Masih dengan metode yang sama yaitu KNN, penelitian yang dilakukan oleh Riska Yessivirna diberi judul “Klasifikasi Suara Berdasarkan Gender (Jenis Kelamin) dengan

  3. Hasil akurasi tertinggi yang diperoleh yaitu sebesar 66,48%.

  keluaran sistem nanti berupa kelas yang terdiri dari 3 kelas, yaitu Kelas 1, Kelas 2, dan Kelas

  phenols , proanthocyanins, color intensity, hue, OD280/OD315 of diluted wines , prolines. Hasil

  total phenols , flavonoids , nonflavanoid

  malic acid , ash, alkalinity of ash, magnesium,

  ”. Penelitian ini bertujuan untuk mengklasifikasikan minuman anggur agar dapat membantu peran pakar dalam proses pelabelan kelas. Jumlah data sebanyak 165 dan fitur yang digunakan ada 13, yaitu alkohol,

  Nearest Neighbor (KNN) untuk Klasifikasi Data Wine

  Penelitian berikutnya yaitu penelitian dari Azhar Arandika pada tahun 2014. Penelitian tersebut berjudul “Implementasi Algoritma K-

  Neighbor (MKNN) untuk Menentukan Tingkat Resiko Penyakit Lemak Darah (Profil Lipid)”.

  voting . Perbandingan tingkat akurasi metode

  Penelitian pertama yang dikaji yaitu penelitian dari Noviana Ayu Kumalasari pada tahun 2014. Judul penelitiannya yaitu “Implementasi Algoritma Modified K-Nearest

  2.1 Kajian Pustaka

  2. DASAR TEORI

  untuk pengklasifikasian ada delapan, yaitu umur tanaman, kerontokan, kerebahan, tekstur nasi, rata-rata hasil, potensi hasil, ketahanan terhadap hama, dan ketahanan terhadap penyakit.

  Klasifikasi Kelompok Varietas Unggul Padi Menggunakan Modified K-Nearest Neighbor (MKNN), di mana parameter yang digunakan

  Berdasarkan uraian tersebut maka dilakukanlah penelitian ini dengan judul

  Sedangkan metode MKNN digunakan pada penelitian oleh Kumalasari pada penentuan tingkat resiko penyakit lemak darah. Akurasi minimal yang didapat metode MKNN pada kasus tersebut sebesar 73,55% dan akurasi maksimal sebesar 85,81% (Kumalasari, 2014).

  persentase akurasi sebesar 84,93% (Yessivirna, 2013).

  Support Vector Machine (SVM) dengan

  Pada penelitian sebelumnya yang dilakukan oleh Yessivirna, metode KNN yang digunakan untuk mengklasifikasi suara berdasar gender memiliki persentase akurasi minimal sebesar 71,5% dan maksimal 76,2%. Metode yang sama digunakan pada penelitian oleh Arandika berjudul Implementasi Algoritma K-Nearest Neighbor untuk Klasifikasi Data Wine. Persentase akurasi yang didapat pada penelitian tersebut sebesar 66,48%. Sementara itu, metode berbeda digunakan oleh Hardono dalam penelitian berjudul Klasifikasi Kondisi Penderita Penyakit Hepatitis. Metode yang digunakan yaitu

  MKNN dengan KNN yang lama pada beberapa dataset didapatkan tingkat akurasi yang lebih baik dengan metode MKNN daripada KNN (Parvin, 2008).

  Penelitian ini dibuat dengan tujuan agar komputer dapat membedakan suara laki-laki dan perempuan. Dengan kemampuan tersebut, komputer yang memiliki sistem keamanan berdasar suara akan mencapai tingkatan yang lebih tinggi yaitu dengan tidak hanya mengenali kata, tetapi juga ditambah dengan pencocokan karakteristik suara. Penelitian yang memiliki akurasi tertinggi sebesar 76,2% ini hanya memerlukan satu input yaitu berkas suara berformat .wav. Sampel suara yang digunakan adalah suara orang dewasa yang melafalkan kata “Aku” secara normal.

  Penelitian berkaitan dengan klasifikasi yang menggunakan metode selain KNN dan MKNN yaitu dilakukan oleh Jendi Hardono. Judul penelitian tersebut adalah “Klasifikasi Kondisi Penderita Penyakit Hepatitis Dengan Menggunakan Metode Support Vector Machine (SVM)”. Penelitian yang bertujuan untuk menggolongkan kondisi seseorang ini memiliki akurasi sebesar 84,93%. Parameter yang digunakan terdiri dari 19 fitur dengan 1 kelas, dan jumlah data sebanyak 155. Data fitur berupa age, sex, steroid, antiviral, fatigue,

  malaise, anorexia, liver, big, liver, firm, spleen, palpable, spiders, ascites, varices, bilirubin, alk, phosphate, SGOT, albumin, protime, hystologi, serta kelas berupa live atau die.

  Data mining adalah proses menemukan

  hubungan atau keterkaitan yang memiliki arti ataupun pola dengan cara memeriksa kumpulan data dalam jumlah besar dan tersimpan di dalam media penyimpanan dengan menggunakan teknik pengenalan pola, seperti teknik statistik dan matematika (Ardhi, 2013). Saat suatu oraganisasi baik itu perusahaan atau suatu institusi mempunyai banyak data, tidak menutup kemungkinan banyak sekali informasi yang dapat diperoleh dari banyaknya data tersebut. Data mining akan menghasilkan suatu pengetahuan baru yang belum diketahui secara manual dari sekumpulan data.

  Tujuan data mining yaitu untuk mengekstrak pengetahuan dan wawasan melalui analisis data dalam jumlah besar. Dengan memanfaatkan data mining, suatu perusahaan dapat memperoleh informasi penting dari gudang data (data warehouse). Sebagai contoh, yaitu memprediksi target pemasaran suatu produk, dengan melakukan klasifikasi terhadap tingkat penghasilan konsumen, kebiasaan pembeli, dan karakteristik lainnya. Data mining mengeksplorasi basis data untuk menemukan pola-pola yang belum pernah ditemui.

  2.3 Klasifikasi

  Klasifikasi adalah sebuah metode untuk mengelompokkan data. Klasifikasi juga dapat diartikan sebagai pengelompokan data atau objek baru ke dalam kelas atau kategori berdasarkan variabel-variabel tertentu (Septianto, 2015). Klasifikasi merupakan teknik data mining yang melihat atribut dari kelompok data yang sudah didefinisikan sebelumnya. Atribut-atribut tersebut digunakan sebagai variabel dalam penentuan kelas suatu objek baru. Tujuan klasifikasi yaitu untuk menentukan kelas dari suatu objek yang belum diketahui kelasnya dengan akurat.

  Terdapat beberapa tahapan dalam klasifikasi yaitu pembangunan model, penerapan model, dan evaluasi. Pembangunan model dilakukan berdasarkan data latih yang telah memiliki atribut dan kelas data. Kemudian data-data tersebut diadaptasi untuk menentukan kelas dari data atau objek yang baru. Setelah menerapkan model, maka tahap berikutnya yaitu evaluasi. Tahap ini meliputi bagaimana tingkat akurasi yang didapat dari pembangunan dan penerapan model terhadap data baru. Jika tingkat akurasi sesuai dengan yang diinginkan, maka model yang telah dibangun tersebut dapat dilanjutkan untuk analisa data lebih lanjut (Kumalasari, 2014).

2.2 Data Mining

  Proses klasifikasi terdiri dari dua fase, yaitu fase learning dan fase testing. Fase

  Learning yaitu fase di mana sebagian data yang

  kelas datanya telah diketahui dijadikan model untuk sistem yang akan dibangun. Sedangkan fase testing yaitu fase di mana model yang sudah terbentuk diuji dengan sebagian data lainnya untuk mengetahui akurasi dari model tersebut. Bila akurasinya mencukupi, maka model ini dapat digunakan untuk memprediksi kelas data yang belum diketahui.

  2.4 Modified K-Nearest Neighbor

  Hamid Parvin memperkenalkan algoritma pengembangan dari KNN yang dapat mengatasi rendahnya tingkat akurasi yang diperoleh dari metode KNN dalam papernya yang berjudul

  MKNN: Modified K-Nearest Neighbor (2008).

  Metode pengembangan tersebut dimulai dari melakukan pra-proses pada data latih,

  ( , ) = {1 = 0 ≠

  di mana:

  2. Weight Voting

  latih. S akan bernilai 1 jika label kategori a sama dengan label kategori b. S bernilai 0 jika label kategori a tidak sama dengan label kategori b.

  a dan b adalah label kelas kategori suatu data

  Melalui Persamaan (2) ditunjukkan bahwa

  di mana: a = kelas pada data latih b = kelas selain a pada data latih

  (2)

  kemudian menghitung validitas dari setiap sampel pada data latih. Kemudian klasifikasi pada objek baru dilakukan dengan melakukan

  Fungsi S digunakan untuk menghitung kesamaan antara titik x dan data ke-I tetangga terdekat. Persamaan untuk mendefinisikan fungsi S terdapat dalam Persamaan (2).

  label (x) : kelas data x label N i (x) : label kelas titik terdekat data x

  k : jumlah titik terdekat

  =1 (1)

  dari metode KNN yang menggunakan k tetangga terdekat dan hasil perhitungan dari jarak masing-masing data. Dalam persamaan (3).

  1 ∑ ( ( ), ( ( ( ))))

  ( )

  ( ) =

  1

  (3)

  Karena adanya validasi pada data latih, metode MKNN dapat menghasilkan akurasi yang lebih tinggi dari KNN. Metode MKNN ini mengoptimalkan data latih yang memiliki validitas tinggi dan memiliki jarak terdekat dengan data uji, sehingga jika terdapat data yang tidak stabil, hal itu tidak banyak berpengaruh dalam pemberian label atau kelas pada objek. Secara garis besar terdapat dua proses utama dalam metode MKNN, yaitu validasi data latih dan weight voting (Parvin, 2010).

  Sedikit memodifikasi metode KNN, jika KNN melakukan klasifikasi objek berdasarkan kelas mayoritas dari nilai k dan jarak terdekat objek, maka MKNN memvalidasi data latih terlebih dahulu setelah menghitung jarak, dan setelah itu melakukan weighting untuk setiap data uji sebelum mengklasifikasikan objek ke dalam kelas tertentu (Akbar, 2016). Validasi dalam hal ini digunakan untuk mencari jumlah titik yang memiliki kategori atau label yang sama pada semua data latih, kemudian hasilnya akan digunakan sebagai informasi tambahan mengenai data tersebut.

  Dalam tahapannya, metode M-KNN ini menambahkan beberapa proses, yaitu validasi data latih dan weight voting. Tujuan utamanya yaitu menentukan referensi prediksi sistem terhadap kelas data yang akan diuji.

  menggunakan validitas sebagai faktor perkalian (Parvin, 2008).

  weighted K-NN yang mana weight ini

  Weight Voting adalah salah satu variasi

1. Validasi Data Latih

  menentukan referensi terbaik sebagai prediksi sistem terhadap kelas suatu data. Persamaan yang digunakan untuk menghitung validitas dari setiap data didefinisikan pada Persamaan (1).

  weight voting . Validasi digunakan untuk

  Pada metode M-KNN setiap data latih harus divalidasi. Validitas setiap data tergantung pada setiap tetangganya. Setelah dihitung validitas tiap data maka nilai validitas tersebut akan digunakan pada penghitungan

  di mana d adalah jarak Euclidean dan ∝ merupakan nilai regulator smoothing. Dalam penelitian ini,

  ∝ menggunakan ∝ = 0.5. Weight

  voting ini kemudian dijumlahkan setiap

  kelasnya dan kelas dengan jumlah terbesar yang akan dipilih menjadi sebuah keputusan.

  Pada metode MKNN, masing-masing k tetangga terdekat dihitung menggunakan persamaan 2.2. Setelah itu, nilai validitas setiap data yang telah dihitung sebelumnya dikalikan dengan hasil weight voting berdasarkan jarak. Sehingga dalam metode MKNN didapatkan persamaan weight voting pada Persamaan (4).

  • 0.5

  4.1.2 Analisa Kebutuhan Masukan

  Studi Literatur Pengumpulan data Analisis dan Perancangan Implementasi Sistem

  Berdasarkan pengetahuan dari pakar, didapatkan pembobotan dari beberapa kriteria

  pakar untuk selanjutnya ditransfer ke dalam basis pengetahuan.

  engineer berusaha menyerap pengetahuan dari

  Akuisisi pengetahuan adalah akumulasi, transfer, dan transformasi keahlian dalam menyelesaikan masalah dari sumber pengetahuan ke dalam program komputer (Akbar, 2016). Dalam tahap ini knowledge

  4.2.1 Akuisisi Pengetahuian

  Pada tahap ini akan digambarkan pembuatan sistem, yaitu dengan akuisisi pengetahuan, dan memodelkan sistem dengan diagram alir atau flowchart. Proses yang digambarkan pada perancangan ini yaitu proses sistem secara umum dan proses MKNN.

  4.2 Perancangan Sistem

  Keluaran yang diharapkan dari sistem ini adalah hasil klasifikasi berdasarkan kriteria yang dimasukkan user. Hasil klasifikasi sistem kemudian dibandingkan dengan data asli. Perbandingan hasil dari sistem dengan data asli dihitung sehingga didapat tingkat akurasi.

  4.1.3 Analisa Kebutuhan Keluaran

  Masukan yang dibutuhkan sistem adalah kriteria varietas yang akan diklasifikasi dan nilai k. Dari kedua masukan tersebut, sistem akan memproses perhitungan berdasar algoritma MKNN.

  Pada tahap ini direpresentasikan user yang menggunakan sistem. Sistem diperuntukkan bagi semua user tanpa klasifikasi tingkatan. Semua user dapat melakukan proses klasifikasi kelompok varietas unggul padi.

  ( ) = ( ) ×

  4.1.1 Identifikasi Pengguna

  Analisis kebutuhan perangkat lunak mencakup kegiatan yang diperlukan sistem, antara lain identifikasi pengguna, penjelasan kebutuhan masukan, proses, dan keluaran.

  4.1 Analisis Kebutuhan Perangkat Lunak

  Pada penelitian ini perancangan dilakukan dalam lima tahap secara umum, yaitu terdiri dari: 1) analisis kebutuhan perangkat lunak, 2) perancangan sistem, 3) contoh perhitungan manual, 4) perancangan antarmuka, dan 5) perancangan pengujian.

  4. PERANCANGAN

  Metodologi pada penelitian ini dilakukan dalam beberapa tahap yang ditunjukkan pada Gambar 1.

  3. METODOLOGI PENELITIAN

  berpengaruh terhadap data yang mempunyai nilai validitas lebih tinggi dan paling dekat dengan data. Selain itu, perkalian validitas dengan jarak data mengatasi dapat kelemahan antara jarak setiap data dengan weight yang memiliki banyak masalah dalam outlier. Oleh karena itu, metode M-KNN secara signifikan akan lebih kuat daripada metode KNN tradisional yang hanya didasarkan pada jarak (Parvin, 2010).

  A Modification on K-Nearest Neighbor Classifier , teknik weight voting ini

  Menurut penelitian Hamid Parvin yang berjudul

  (4) di mana: W (i) : weighted voting ke-i Validitas(i) : nilai validitas d : jarak Euclidean

  1

  Pengujian Sistem Kesimpulan Gambar 1 - Metodologi Penelitian

  4 30,1 52,3 90,4 57,6

  yang dibutuhkan sistem. Pembobotan tersebut

  Tabel 2

  • Hasil Pengujian Pengaruh Nilai k (lanjutan) ditunjukkan pada Tabel 1.

  5 28,5 54,7 90,4 57,8 6 41,2 59,5 90,4 63,7 Tabel 1 - Tabel Bobot Kriteria

  7 39,6 40,4 95,2 58,4 Kriteria Subkriteria Nilai

  <=100 hari (cepat)

  9 8 39,6 35,7 90,4 55,2 >100 & <125

  7 9 39,6 38 85,7 54,4 (normal

  >125 lama

  5 10 39,6 33,3 80,9 51,2 Tahan, Toleran, 9 11 36,5

  38 85,7 53,4 Kuat Sedang, Agak

  7 Mudah, Rentan

  4 Pada pengujian pengaruh nilai k ini, Tahan, Toleran,

  9

  dihasilkan rata-rata nilai akurasi. Rata-rata

  Kuat

  akurasi tertinggi didapat pada waktu k = 3 yaitu

  Sedang, Agak

  7

  sebesar 69,5%. Sementara rata-rata terendah

  Mudah, Rentan

  4 Pulen 8 didapat pada waktu k = 10 yaitu sebesar 51,2%. Agak pulen

  7 Hal ini disebabkan karena pada metode Agak pera

  6

  penghitungan jarak, ketika nilai k kecil maka

  Pera

  5

  jumlah ketetanggaan yang dihitung juga

  >= 7 t/ha GKG

  8

  sedikit. Sebaliknya, jika nilai k besar maka

  >= 6 t/ha & < 7

  7

  jumlah ketetanggaan yang dihitung semakin

  t/ha GKG

  banyak. Persebaran data juga sangat

  < 6 t/ha

  4 mempengaruhi hasil perhitungan. >= 8 t/ha GKG

  8 >= 7 t/ha GKG &

  7 Grafik Hasil <8 t/ha GKG Pengujian Pengaruh Nilai k

  < 7 t/ha

  6 Tahan

  9 100

  Agak tahan

  7

  80 Rentan

  4 i

  60 Tahan

  9 ras u

  Agak tahan

  7

  40 Ak Rentan

  4

  20

5. PENGUJIAN DAN ANALISIS

  2

  3

  4

  5

  6

  7 8 9 10 11

  Dalam pengujian ini terdapat 84 dataset

  Nilai k

  yang dapat diolah menjadi data latih maupun

  data latih 25% data latih 50%

  data uji. Pengujian dilakukan untuk mengetahui hasil akurasi dari implementasi yang telah data latih 75% rata-rata akurasi dilakukan.

  Gambar 2

  • – Grafik Hasil Pengujian Pengaruh Nilai k

  5.1 Pengujian Pengaruh Nilai k Tabel 2

  • Hasil Pengujian Pengaruh Nilai k

  5.2 Pengujian Pengaruh Data Latih Nilai Jumlah Data Latih Rata-

  Seimbang dan Data Latih Tidak k rata

  Seimbang terhadap Akurasi 25% 50% 75% Akurasi

  (%)

  Pada pengujian Pengaruh Data Latih

  2 42,8 61,9 90,4

65 Seimbang dan Data Latih Tidak Seimbang

  terhadap Akurasi ini, didapatkan rata-rata

  3 44,4 69 95,2 69,5

  akurasi tertinggi pada kategori data tidak seimbang, yaitu sebesar 79,96%. Sedangkan

  Hasil Pengujian Pengaruh Data

  rata-rata akurasi terendah didapatkan pada

  Latih Seimbang dan kategori data seimbang yaitu sebesar 48,32%. Data Latih Tidak Seimbang Hasil pengujian dimodelkan pada Tabel 3.

  100 Tabel 3 – Hasil Pengujian Pengaruh Data Latih

  80 Seimbang dan Tidak Seimbang terhadap Akurasi (%)

  60 i

  Jenis Jm Jm Akurasi (%) Pengujian ke- Rat ras

  40 u

  Data l. l. a

  1

  2

  3

  4

5 Ak D.

D. Aku

  20 La Uji rasi tih (%)

  28

  32

  36

  28

  12

  50 50 41,6

  50 50 48,3 Jumlah Data

  2 66, 58,

  32

  12

  50 75 66,6 63,3 data latih seimbang

  6

  3 data latih tidak seimbang

  36 12 58, 83, 83,3

  75 75 74,9

  3

  3

  8 Gambar 3

  • Hasil Pengujian Pengaruh Data Latih

  28

  12

  50 50 41,6

  75 50 53,3 Seimbang dan Data Latih Tidak Seimbang

  2

  32 12 58,

  50

  50

  50 50 51,6

  6. KESIMPULAN

  3

  6 Berdasarkan hasil perancangan, 83, 83, 91, 79,9

  36

  12 50 91,6

  implementasi, dan pengujian yang dilakukan

  3

  3

  6

  6

  pada penelitian klasifikasi kelompok varietas unggul padi, terdapat beberapa kesimpulan, Berdasarkan hasil pengujian data latih yaitu: seimbang dan tidak seimbang, akurasi yang

  1. Metode Modified K-Nearest Neighbor didapat secara umum meningkat pada kedua dapat diimplementasikan untuk jenis data. Pada saat data latih seimbang, terjadi mengklasifikasi varietas unggul padi peningkatan nilai akurasi dari 48,32% dengan dengan menggunakan delapan parameter, jumlah data latih sebanyak 28, menjadi 63,3% yaitu umur, kerontokan, kerabahan, dengan penambahan jumlah data latih menjadi tekstur nasi, rata-rata hasil, potensi hasil,

  32. Akurasi tertinggi didapat ketika jumlah data ketahanan terhadap hama, dan ketahanan latih berjumlah 36, yaitu sebesar 74,98%. terhadap penyakit.

  2. Rata-rata akurasi tertinggi pada penelitian Jika pada persebaran data latih seimbang ini yaitu sebesar 79,96%, sedangkan rata- nilai akurasi yang didapat cenderung mengalami peningkatan secara stabil, berbeda rata akurasi terendah sebesar 51,2%.

  Tingkat akurasi yang dihasilkan metode dengan pengujian yang dilakukan pada

  Modified K-Nearest Neighbor ini adalah

  persebaran data latih tidak seimbang. Pada pengujian data latih tidak seimbang, terjadi dipengaruhi oleh beberapa faktor, yaitu: a. Penambahan atau pengurangan nilai penurunan nilai akurasi dari 53,32% dengan

  k .

  jumlah data latih 28, menjadi 51,66% dengan

  b. Penambahan atau pengurangan jumlah data latih 32. Namun pada saat data latih jumlah data latih. ditambah menjadi 36, nilai akurasi meningkat drastis yaitu sebesar 79,96%.

  c. Pengelompokan data latih seimbang dan data latih tidak seimbang.

7. DAFTAR PUSTAKA

  Alfian, Ardhi. 2013. Pencarian Asosiasi Topik dalam Ayat Al- Qur’an dengan

  Menerapkan Algoritma Multipass Direct Hashing and Prunning (M- DHP). Skripsi . Universitas Brawijaya, Malang.

  Kumalasari, Noviana Ayu. 2014. Implementasi Algoritma Modified K-Nearest Neighbor (MKNN) untuk Menentukan Tingkat Resiko Penyakit Lemak Darah (Profil Lipid). Skripsi . Universitas Brawijaya, Malang.

  Parvin, Hamid. 2008. MKNN: Modified K-

  Nearest Neighbor . Proceedings of

  the World Congress on Engineering and Computer Science. San Francisco, USA. Yessivirna, Riska. 2013. Klasifikasi Suara

  Berdasarkan Gender (Jenis Kelamin) dengan Metode K-Nearest Neighbor (KNN) . Skripsi. Program

  Teknologi Informasi dan Ilmu Komputer Universitas Brawijaya, Malang.

  Septianto, Ryan Hendy. 2015. Diagnosa Penyakit Tanaman Kopi Arabika dengan Metode Modified K-Nearest Neighbor (MK-NN). Skripsi. Universitas Brawijaya, Malang.

  Akbar, Deby Faisol. 2016. Implementasi

  Metode Modified K-Nearest Neighbor (MK-NN) Pada Sistem Diagnosa Penyakit Paru-paru Anak . Skripsi . Universitas Brawijaya, Malang.