Deteksi Penyakit Kucing dengan Menggunakan Modified K-Nearest Neighbor Teroptimasi (Studi Kasus: Puskeswan Klinik Hewan dan Satwa Sehat Kota Kediri)

  

Vol. 1, No. 11, November 2017, hlm. 1295-1301 http://j-ptiik.ub.ac.id

Deteksi Penyakit Kucing dengan Menggunakan Modified K-Nearest

  

Neighbor Teroptimasi

(Studi Kasus: Puskeswan Klinik Hewan dan Satwa Sehat Kota Kediri)

1 2 3 Fitri Dwi Astuti , Dian Eka Ratnawati , Agus Wahyu Widodo

  Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya, Malang 65145, Indonesia

  1

  

  3 Email: fitridwiastuti725@gmail.com, a_wahyu_w@ub.ac.id

Abstrak

  Kucing merupakan hewan yang banyak dipelihara oleh masyarakat, sehingga saat ini terdapat berbagai penemuan yang berhubungan dengan penyakit kucing yang disebabkan oleh banyak faktor. Pengetahuan dan pemahaman mengenai gejala-gejala yang terjadi pada kucing menjadi faktor yang penting, sehingga masyarakat bisa lebih mengantisipasi terjadinya penyakit yang lebih parah. Dengan beberapa permasalahan yang telah dijelaskan sebelumnya kemudian memberikan ide untuk dibangun sebuah aplikasi “Deteksi Penyakit pada Kucing”. Dalam penelitian ini metode yang digunakan adalah

  

Modified K-Nearest Neighbor , tetapi metode tersebut memiliki kelemahan pada nilai k yang bias,

  sehingga tingkat akurasi yang dihasilkan terkadang kurang maksimal. Dengan adanya permasalahan ini, maka pada penelitian ini algoritme genetika digunakan untuk optimasi nilai k pada metode

  

modified K-Nearest Neighbor . Data yang digunakan dalam penelitian ini adalah data kucing sakit pada

  Puskeswan Klinik Hewan dan Satwa Sehat Kota Kediri dengan jumlah data latih sebanyak 105 dan data uji sebanyak 35. Dari semua data tersebut akan diklasifikasi ke dalam 7 kelas dengan 19 kriteria gejala penyakit. Hasil akurasi Modified K-Nearest Neighbor menggunakan algoritme genetika untuk k optimal 1 adalah 100%. Dari hasil tersebut maka aplikasi deteksi penyakit kucing menggunakan metode Modified K-Nearest Neighbor teroptimasi dapat digunakan oleh masyarakat untuk mengenali penyakit-penyakit pada kucing.

  Kata kunci : algoritma genetika, penyakit kucing, MKNN

Abstract

Cats are animals that are widely nurtured by people, so there are now many findings related

to cat disease caused by many factors. Knowledge and understanding of the symptoms that occur in

the cat to be an important factor, so that people can better anticipate the occurrence of more severe

disease. With some of the problems that have been described before then give the idea to built an

application "Deteksi Penyakit Kucing". In this study the method used is Modified K-Nearest Neighbor,

but the method has a weakness in the biased k value, so the accuracy of the resulting level sometimes

less than the maximum. Given the problem, the genetic algorithm is used to optimize k value in the

Modified K-Nearest Neighbor method. Data used in this research is cat disease data at Puskeswan

Klinik Hewan dan Satwa Sehat of Kediri with amount of training data as many as 105 and test data

counted 35. From all data will be classified into 7 class with criterion as much as 19. Accuracy result

of Modified K-Nearest Neighbor using genetic algorithm for optimal k 1 is 100%. From these results

the application of cat disease detection with optimal k value can be used by the public to recognize

diseases in cats.

  Keywords : genetic algorithm, cat disease, MKNN 1.

  berbagai penemuan yang berhubungan dengan

   PENDAHULUAN

  Kucing merupakan hewan yang banyak penyakit kucing dimana terdapat banyak bakteri dipelihara oleh masyarakat. Jenis kucing yang dan virus yang disebabkan oleh faktor biasa dipelihara adalah kucing ras seperti lingkungan, iklim atau suhu, bahkan karena anggora dan persia. Pada saat ini terdapat

  Fakultas Ilmu Komputer Universitas Brawijaya

1295 kontak langsung dengan inang atau induk virus (Paryati,2013).

  Dengan berbagai macam penyakit yang dapat menyerang kucing terkadang masyarakat tidak dapat mengenali penyakit berdasarkan gejala yang terjadi. Hal tersebut menyebabkan penanganan untuk penyakit akan lambat sehingga akan membahayakan bagi kucing jika terjangkit penyakit kronis yang dapat menyebabkan kematian (Harun, 2013). Dengan beberapa permasalahan maka dibuatlah sebuah aplikasi untuk mengklasifikasi jenis penyakit pada kucing. Klasifikasi merupakan proses untuk mengidentifikasi obyek penelitian ke dalam sebuah kelas, grup, atau kategori berdasarkan ketentuan dan karakteristik obyek yang telah ditentukan sebelumnya (Simanjuntak, Mahmudy & Sutrisno, 2014) . Beberapa penyakit yang akan diklasifikasi sebanyak 7 penyakit diantaranya adalah calicivirus, panleukopenia virus, scabies, ringworm, cacingan, enteritis dan gastritis. Dari beberapa metode yang dapat digunakan untuk klasifikasi salah satu yang sering digunakan adalah metode Modified K-Nearest Neighbor (Mutrofin, Ginardi & Fatichah, - ).

  Algoritma Modified K-Nearest Neighbor atau yang biasa disebut MKNN merupakan pengembangan dari metode K-Nearest

  Menghitung validitas data latih.

  Keterangan : Different (x i ,y i ): Jarak antar data latih x i : Data latih yang pertama y i : Data latih kedua 3.

  ( , ) = (1)

  2. Mencari jarak data kategorikal antara data latih dari tiap gejala.

  1. Menentukan data latih, testing dan nilai k.

  dilakukan dengan tahapan- tahapan sebagai berikut:

  Nearest Neighbor

  Perhitungan dengan metode modified K-

  klasifikasi data uji sesuai dengan tag tetangganya. Pada MKNN terdapat dua pemrosesan, yaitu validasi untuk data latih dan pembobotan KNN (Parvin, Alizadeh&Minaei- Bidgoli, 2008).

  Neighbor . Konsep utama dari metode ini adalah

  2.2 Metode Modified K-Nearest Neighbor

  Metode Modified K-Nearest Neighbor atau yang biasa disebut MKNN merupakan pengembangan performasi dari metode K- Nearest Neighbor.

  Penyakit yang sering menyerang kucing untuk studi kasus pada Puskeswan, Klinik Hewan dan Satwa Sehat Kota Kediri dibagi ke dalam dua kategori yaitu penyakit kulit dan penyakit dalam. Penyakit kulit yang digunakan sebagai salah satu klasifikasi penyakit pada sistem adalah scabies dan ringworm, sedangkan penyakit dalam yang digunakan sebagai klasifikasi penyakit pada sistem adalah calici virus, panleukopenia virus, gastritis, enteritis dan cacingan. Dari semua penyakit kucing yang akan diklasifikasi akan dibagi menjadi 2 kategori yaitu penyakit dalam dan penyakit kulit. Penyakit kulit yang dimaksud pada penelitian ini adalah penyakit yang menyerang kulit dari kucing, yaitu scabies dan ringworm. Penyakit Dalam yang dimaksud dalam penelitian ini adalah penyakit yang menyerang tubuh kucing bagian dalam, yaitu calici virus, panleukopenia virus, enteritis, gastritis dan cacingan.

  2.1 Penyakit Kucing

  2. TINJAUAN PUSTAKA

  Nearest Neighbor dan ketiga bagaimana hasil yang diperoleh dari implementasi sebelumnya.

  deteksi penyakit kucing, kedua bagaimana algoritme genetika diterapkan untuk mengoptimasi nilai k pada metode Modified K-

  Modified K-Nearest Neighbor untuk kasus

  Terdapat beberapa permasalahan yang akan diselesaikan dalam penelitian ini yang pertama bagaimana implementasi metode

  . Dengan menggunakan algoritme genetika ini diharapkan diperoleh nilai k optimal yang nantinya akan memberikan tingkat akurasi yang lebih baik dari sistem. Sehingga sistem dapat dijadikan acuan bagi masyarakat dalam mendekteksi penyakit pada kucing.

  modified K-Nearest Neighbor

  Dengan adanya permasalahan nilai k yang bias pada metode modified K-Nearest Neighbor kemudian digunakanlah sebuah algoritme genetika untuk optimasi nilai k pada metode

  Pemikiran utama dari metode ini adalah klasifikasi data uji yang sesuai dengan tag tetangganya. MKNN terdiri dari dua proses, yang pertama adalah pemrosesan validasi untuk data latih dan yang kedua adalah penerapan pembobotan KNN (Parvin, Alizadeh&Minaei-Bidgoli, 2008). Pada metode MKNN juga memiliki kelemahan, yaitu nilai k yang bias dan komputasi yang kompleks. Sehingga tingkat akurasi yang dihasilkan terkadang kurang optimal.

  0 if x i =y i 1 otherwise

  ( ) =

  1

  crossover adalah sebagai berikut: 0 if x i =y i 1 otherwise

  kromosom-2. Dari proses crossover diharapkan memiliki keberhasilan tinggi maka digunakan crossover rate sebesar 0,8. Jika dimisalkan dua parent terpilih adalah 01001 dan 00111, maka hasil

  random pada index 0 hingga panjang

  dalam penelitian ini dibuat

  crossover

  4. Proses Crossover dari dua kromosom terpilih, titik potong untuk proses

  parent , misalkan yang terpilih adalah kromosom 9 dan 5.

  3. Proses seleksi dilakukan untuk mendapatkan dua kromosom sebagai

  2. Inisialisasi populasi awal, Misalkan populasi yang diinginkan adalah 4 maka secara random kromosom yang dibangkitkan adalah sebanyak 4 buah. Representasi kromosom yang digunakan adalah biner. Misalkan kromosom yang dibangkitkan adalah 0 1 1 1 atau dalam nilai desimalnya adalah 7.

  1. Menentukan data latih dan data uji yang akan diproses menggunakan MKNN.

  Langkah-langkah optimasi MKNN menggunakan algoritme genetika antara lain:

  Gambar 1. Flowchart Sistem

  Perancangan sistem untuk optimasi metode MKNN menggunakan algoritme genetika secara singkat dapat dilihat pada Gambar 1.

  3.2 Optimasi Metode MKNN Menggunakan Algoritme Genetika

  Dinas Pertanian dan Ketahanan Pangan Kota Kediri.

  Data yang digunakan dalam pembangunan perangkat lunak adalah data gejala penyakit dan data kucing penderita penyakit. Data diperoleh dari melalui studi literatur dan wawancara dengan pakar. Pengumpulan data dilakukan pada salah satu klinik hewan milik

  (GMKNN) (Parvin, Alizadeh&Minaei-Bidgoli, 2008).

  ∑ ( ( ), ( ( )))

  =1

  (2) Keterangan : i: Jumlah data latih k: Jumlah tetangga terdekat data latih dari similaritas yang terbaik Ni: Banyaknya label kelas 4. Mencari jarak data kategorikal antara data uji dan data latih dari tiap gejala.

  ( , ) =

  (3) Keterangan : D (x,y): Jarak dari data uji dan data latih x i : Data uji y i : Data latih 5. Menghitung weight voting berdasarkan nilai validitas dan jarak data uji.

  ( ) = ( ) ×

  1 ( )+

  (4) Keterangan : W : Bobot µ : Nilai smoothing(pemulusan)

  6. Mengurutkan weight voting dari nilai terbesar ke terkecil.

  7.

  8. Mendapatkan hasil penyakit dengan nilai weight voting

2.3 Metode Genetic Modified K-Nearest

  Neighbor

  Optimasi yang akan dilakukan pada metode modified K-Nearest Neighbor adalah pada parameter nilai k yang digunakan. Sehingga selanjutnya metode modified K-

  Nearest Neighbor dinamakan Genetic Modified K-Nearest Neigbor

3. PERANCANGAN SISTEM

3.1 Data

  0 1 0 | 0 1 0 1 0 1 1 = 11 0 0 1| 1 1 5. Proses mutasi dengan mengambil 1 kromosom, titik proses mutasi dalam penelitian ini adalah random. Jika dimisalkan kromosom terpilih adalah 00011 dengan mutation rate sebesar 0,2, maka hasil mutasi adalah sebagai berikut:

  0 0 1 1 0 0 0 0 1 = 1 6. Melakukan proses evaluasi dari semua kromosom awal(parent) dan kromomom

  Gambar 2. Implementasi Halaman Home

  hasil(offspring). Proses evaluasi dilakukan dengan menghitung nilai fitness untuk Halaman deteksi berisi tentang form input semua kromosom berdasarkan nilai rata- gejala penyakit kucing yang akan diisi oleh rata validitas pada setiap nilai k sehingga pengguna. Data gejala yang dimasukkan akan fitness = rata-rata validitas. digunakan sebagai data uji yang kemudian akan diproses oleh aplikasi untuk mendapatkan hasil

  7. seleksi kromosom-kromosom Proses kelas data uji. Antarmuka halaman deteksi dengan nilai terbaik sejumlah banyaknya dapat dilihat pada Gambar 3. populasi. Kemudian proses 1-8 akan diulang hingga iterasi yang ditentukan untuk menghasilkan nilai k optimal.

  8. Mencari jarak dari antara data latih dari tiap gejala.

  9. Menghitung nilai validitas dari semua data latih menggunakan persamaan 2.

  10. Menghitung jarak data uji dengan semua data latih menggunakan persamaan 3.

  11. Menghitung weight voting dengan menggunakan nilai validitas pada k optimal dan nilai jarak data uji menggunakan persamaan 4.

  12. Mendapatkan hasil weight voting terbesar

  Gambar 3. Implementasi Halaman Deteksi yang akan digunakan sebagai hasil deteksi.

  Halaman informasi berisi tentang 4.

   IMPLEMENTASI

  informasi secara singkat dari beberapa penyakit kucing yang dijadikan sebagai kelas pada Implementasi antarmuka pada penelitian ini terdiri dari beberapa halaman utama yaitu aplikasi, antara lain penyakit calici virus, panleukopenia virus, enteritis, gastritis, halaman home, proses GA, deteksi, data dan cacingan, scabies dan ringworm. Pada halaman informasi. Implementasi halaman home dapat dilihat pada Gambar 2. informasi juga menampilkan penjelasan mengenai beberapa gejala pada penyakit.

  Implementasi antarmuka untuk halaman informasi dapat dilihat pada Gambar 4. Gambar 4. Implementasi Halaman Informasi 5.

  Beberapa parameter yang digunakan pada pengujian ukuran populasi antara lain:

  ITNE S S POPSIZE

  Hasil dari peningkatan rata-rata nilai fitness pada pengujian ukuran populasi ini dapat dilihat pada Gambar 7.

  Banyak generasi = 10 3. Crossover rate = 0,8 4. Mutation rate = 0,2

  1. Ukuran Populasi = 5-60 2.

PENGUJIAN DAN PEMBAHASAN

  • R ATA F

  5.1 Hasil Pengujian Verifikasi Sistem

  2. Pengujian ukuran populasi.

  1. Pengujian verifikasi sistem.

  5 1 0 1 5 2 0 3 0 5 0 6 0 R ATA

  0,94 0,95 0,96 0,97 0,98 0,99

  Hasil pengujian ukuran generasi dapat dilihat pada Gambar 6.

  Crossover rate = 0,8 8. Mutation rate = 0,2

  6. Banyak generasi = 10-100 7.

  5. Ukuran Populasi = 30

  Pengujian ukuran generasi bertujuan untuk mengetahui pengaruh ukuran generasi terhadap solusi terbaik atau nilai fitness terbaik untuk kasus deteksi penyakit kucing ini. Pengujian ukuran generasi dilakukan dengan beberapa parameter algoritma genetia yang dibuat statis atau tetap. Parameter-parameter yang digunakan adalah sebagai berikut.

  5.3 Hasil Pengujian Generasi

  Berdasarkan hasil tersebut dapat dilihat bahwa pada ukuran populasi 5 menuju ukuran 30 mengalami peningkatan rata-rata fitness meskipun nilainya hanya berselisih sedikit. Pada ukuran populasi 30 hingga 60 dapat dilihat pada ukuran ini nilai fitness terbaik yang diambil dari masing masing pengujian memiliki nilai yang sama, hal ini menjelaskan bahwa nilai k yang dihasilkan sudah konvergen.

  Gambar 5. Grafik Hasil Pengujian Ukuran Populasi

  3. Pengujian ukuran generasi.

  Pengujian verifikasi sistem bertujuan untuk mengetahui apakah hasil deteksi data uji pada

  4. Pengujian kombinasi cr dan mr.

  5. Pengujian akurasi

  Beberapa pengujian ang digunakan pada penelitian ini antara lain:

  5.2 Hasil Pengujian Ukuran Populasi

  Dari hasil pengujian verifikasi pada Tabel 1 dapat dilihat bahwa hasil perhitungan manual dan hasil deteksi oleh sistem adalah sama, sehingga sistem bisa dikatakan valid untuk kasus deteksi penyakit kucing ini.

  0,133333

  Calici Virus 0,133333 Calici Virus

  Deteksi Weight Voting Deteksi Weight Voting

  Tabel 1. Hasil Pengujian Verifikasi Manual Sistem

  deteksi oleh sistem deteksi yang telah dibuat. Hasil pengujian verifikasi dapat dilihat pada Tabel 1.

Tabel 4.5 yang diperoleh dalam perhitungan manual memiliki hasil yang sama dengan hasil

  Pengujian ukuran populasi dilakukan untuk mengetahui pengaruh ukuran populasi terhadap solusi terbaik atau nilai fitness terbaik pada permasalahan deteksi penyakit kucing ini.

  • R ATA F

5.4 Hasil Pengujian Kombinasi Cr dan Mr

  optimasi. Pengujian akurasi bertujuan untuk mengetahui apakah hasil optimasi nilai k menggunakan algoritme genetika memang benar-benar merupakan nilai k optimal, hal tersebut dapat dilihat pada hasil pengujian dengan nilai k 1 hingga 5 menggunakan

  ITNES S CR DAN MR P E N G U J I A N U K U R A N K O M B I N A S I C R D A N M R

  0 , 6 0 , 8 0 , 9 0 , 4 0 , 2 0 , 1 R ATA

  ITNE S S GENERASI P E N G U J I A N U K U R A N G E N E R A S I 0,96 0,97 0,98 0,99

  R ATA

  1 1 0 2 0 3 0 5 0 6 0 1 0 0

  random yang dilakukan. Hasil pengujian data 0,9 0,95

  Pengujian menggunakan data latih dan data uji yang diambil secara random yang diproses dengan nilai k optimal dari proses algoritme genetika, tujuan dari pengujian data ini untuk mengetahui rata-rata tingkat akurasi yang diperoleh dari 5 kali pengujian data

  1 100% 2 94,29% 3 88,57% 4 91,43% 5 88,57%

  Tabel 3. Hasil Pengujian Akurasi MKNN K Akurasi

  Modified K-Nearest Neighbor pada Tabel 3.

  Nearest Neighbor tanpa melalui proses

  Pengujian akurasi juga dilakukan untuk menguji akurasi pada metode Modified K-

  1 100%

  Tabel 2. Hasil Pengujian Akurasi GMKNN K Akurasi

  Pengujian akurasi dilakukan untuk mengetahui tingkat akurasi data uji terhadap nilai k yang diambil secara random dan k optimal yang diperoleh dari proses algoritme genetika. Nilai k optimal dari implementasi algoritme genetika pada penelitian ini adalah k = 1, sehingga k inilah yang akan digunakan dalam proses Modified K-Nearest Neighbor untuk melakukan pengujian tingkat akurasi. Data uji yang digunakan sejumlah 35 data uji, data diperoleh dari Klinik Hewan dan Satwa Sehat Kota Kediri. Hasil Pengujian akurasi dapat dilihat pada Tabel 2.

  5.5 Hasil Pengujian Akurasi

  • R ATA F

  Berdasarkan hasil pengujian kombinasi cr dan mr pada Gambar 9 dapat dilihat bahwa kombinasi yang dapat digunakan untuk mendapatkan hasil rata-rata fitness terbaik adalah cr = 0,4 dan mr = 0,8 atau cr = 0,2 dan mr = 0,8.

  Gambar 7 Hasil Pengujian Ukuran Cr dan Mr

  Ukuran Generasi = 10 Pengujian terhadap kombinasi nilai cr dan mr ini dilakukan masing-masing 10 kali pengujian pada setiap kombinasi nilai cr dan mr. Hasil dari pengujian kombinasi nilai cr dan mr dapat dilihat pada Gambar 7.

  Pengujian crossover rate(cr) dan mutation rate(mr) bertujuan untuk mengetahui kombinasi nilai cr dan mr yang sesuai untuk mendapatkan nilai fitness terbaik. Dalam pengujian kombinasi cr dan mr parameter-parameter lain dibuat statis atau tetap. Nilai parameter algoritme genetika yang digunakan adalah sebagai berikut.

  Pada ukuran generasi 50 dapat dilihat bahwa fitness terbaik dari 10 kali pengujian memiliki nilai yang sama atau sudah dalam kondisi konvergen.

1. Ukuran Populasi = 50 2.

  Fakultas Ilmu Komputer, Universitas Brawijaya Gambar 6. Hasil Pengujian Ukuran Generasi

  Fakultas Ilmu Komputer, Universitas Brawijaya

  Modification on K-Nearest Neighbor Classification . San Francisco. USA.

  DENGAN OTOMATISASI NILAI K PADA PENGKLASIFIKASIAN PENYAKIT TANAMAN KEDELAI. Universitas Brawijaya: Malang.

  IMPLEMENTASI

  Simanjuntak, T. H., Mahmudy, W. F., & Sutrisno, 2014.

  Paryati. 2013. SISTEM PAKAR BERBASIS WEB UNTUK MENDIAGNOSA PENYAKIT KUCING. UPN : Yogyakarta.

  OPTIMASI TEKNIK KLASIFIKASI MODIFIED K-NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA. Unipdu : Jombang.

  Mutrofin, Siti. Izzah, Abidatul. dkk. 2014.

  . Institut Teknologi Sepuluh November : Surabaya.

  Teknik Genetic Modified K-Nearest Neighbor Untuk Estimasi Hasil Produksi Gula Tebu Berdasarkan Nilai Klorofil Daun Tebu

  Mutrofin, Siti., Ginardi, R. V. Hari., & Fatichah, Chastine.

  Manajemen Informatika dan Komputer Bina Sarana Informatika: Tangerang

  Diagnosa Penyakit Pada Kucing . Akademi

  Harun, Muhamad. 2013. Aplikasi Sistem Pakar

  Parvin, Hamid., Alizadeh, Hosein., and Minae- Bidgoli, Behrouz. 2008. MKNN:

  latih dan data uji random dapat dilihat pada Tabel 4.

  7. DAFTAR PUSTAKA

  untuk nilai k 1 hingga 5 menghasilkan nilai akurasi terbaik ketika nilai k=1, hal ini menunjukkan bahwa algoritme genetika dapat digunakan untuk mencari nilai k optimal pada kasus deteksi penyakit kucing pada penelitian ini dengan tingkat akurasi untuk nilai k=1. Hasil rata- rata akurasi terhadap nilai k optimal dengan data latih dan data uji yang diambil secara random pada 5 kali proses percobaan adalah 100%.

  Nearest Neighbor

  Dari hasil uji coba metode Modified K-

  Mutation rate = 0,2 3. Hasil yang didapatkan dari proses optimasi pada metode MKNN adalah k optimal=1,

  Ukuran Generasi = 10 c. Crossover rate = 0,8 d.

  Ukuran populasi = 50 b.

  2. Algoritme genetika dapat digunakan untuk melakukan optimasi terhadap parameter nilai k pada metode MKNN dengan perhitungan nilai fitness diambil dari rata- rata validitas semua data latih terhadap nilai k. Nilai parameter yang digunakan pada proses algoritme genetika untuk mendapatkan fitness terbaik adalah sebagai berikut : a.

  Nilai k yang digunakan dalam sistem yaitu k=1 dengan tingkat akurasi hasil data uji sebesar 100%.

  1. Metode MKNN dapat digunakan dalam permasalahan deteksi penyakit kucing.

  Kesimpulan yang diperoleh pada penelitian ini antara lain:

  1 100% 2 100% 3 100% 4 100% 5 100% Rata-rata akurasi 100%

  Tabel 4. Hasil Pengujian Akurasi MKNN Pengujian ke- Akurasi