Implementasi Algoritma Modified K-Nearest Neighbor (MKNN) untuk Klasifikasi Penyakit Demam

  

Vol. 1, No. 10, Oktober 2017, hlm. 1210-1219 http://j-ptiik.ub.ac.id

Implementasi Algoritma Modified K-Nearest Neighbor (MKNN) untuk

Klasifikasi Penyakit Demam

1 2 3 Fakihatin Wafiyah , Nurul Hidayat , Rizal Setya Perdana

  Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya 1 2 3 Email: 135150207111028@mail.ub.ac.id, ntayadih@ub.ac.id, rizalespe@ub.ac.id

  

Abstrak

  Demam merupakan indikator awal untuk beberapa penyakit antara lain demam berdarah, tifoid dan malaria disertai gejala yang mirip, antara lain nyeri otot, gangguan pencernaan, kondisi lidah serta pembesaran pada hati dan limpa. Kemiripan gejala dari masing-masing penyakit sering menimbulkan kesulitan dalam mendapatkan anamnese (diagnosa sementara) sehingga pasien mendapatkan penanganan awal yang kurang tepat. Untuk menangani masalah tersebut diperlukan teknologi untuk mendapatkan diagnosa sementara dengan menerapkan salah satu metode klasifikasi yaitu Modified K-

  (MKNN). Metode tersebut mempelajari pola dari data hasil pemeriksaan sebelumnya

  Nearest Neighbor

  berdasarkan 15 gejala penyakit dengan proses perhitungan jarak eucledian, perhitungan nilai validitas dan perhitungan weighted voting yang hasil akhirnya digunakan untuk penetapan kelas klasifikasi berdasarkan nilai K yang telah ditentukan. Berdasarkan hasil pengujian terhadap perubahan nilai K, perubahan jumlah data latih dan perubahan komposisi data latih didapatkan rata-rata akurasi untuk pengujian pengaruh nilai K terhadap akurasi sebesar 88.55%. Nilai rata-rata akurasi yang didapatkan dari pengujian pengaruh variasi jumlah data latih adalah 92.42%. Pengujian pengaruh komposisi data latih terhadap akurasi mendapatkan nilai rata-rata akurasi sebesar 87.89%. Pengujian pengaruh komposisi data latih dan data uji terhadap akurasi mendapatkan nilai rata-rata akurasi sebesar 96.35%.

  

Kata Kunci: Modified K-Nearest Neighbor (MKNN), klasifikasi, demam, Malaria, Tifoid, Demam Berdarah

(DBD)

  

Abstract

Fever is an early indicator for some diseases such as dengue fever, typhoid and malaria accompanied

by similar symptoms, including muscle pain, indigestion, tongue condition and enlargement of the liver

and spleen. Similar symptoms of each disease cause difficulties in getting anamnese (temporary

diagnosis) so that patients get the inadequate initial treatment. Handling the problem, technology is

needed to obtain a temporary diagnosis by applying one of the classification method of Modified K-

Nearest Neighbor (MKNN). The method studied the pattern of previous examination data based on 15

symptoms of disease with eucledian distance calculation process, calculation of validity value and

weighted voting calculation that the end result is used for class classification determination based on

predetermined value of K. Testing of the value of K get the accuracy of 88.55%. The average value of

accuracy obtained from testing of variation in the amount of training data is 92.42%. Testing the

influence of the composition of train data get the average value of accuracy of 87.89%. Testing the

influence of the composition of train data and test data get the average value of accuracy of 96.35%.

  

Keyword: Modified K-Nearest Neighbor (MKNN), classification, fever, Malaria, Typhoid, Dengue Fever (DHF)

  bahawa tubuh sedang melakukan perlawan 1. terhadap zat-zat berbahaya. Beberapa penyakit

   PENDAHULUAN

  selalu diawali dengan demam disertai gejala lain Demam adalah peningkatan suhu tubuh di o antara lain meningitis, infeksi saluran atas 36 C yang disebabkan oleh faktor infeksi pernapasan, infeksi saluran kandung kemih, atau faktor non infeksi (Dinarello dan Gelfand, demam berdarah, demam tifoid dan malaria. 2005). Demam merupakan hal yang sering

  Ketiga jenis penyakit ini memiliki beberapa terjadi pada manusia dan merupakan indikator indikator untuk diagnosa klinis antara lain,

  Fakultas Ilmu Komputer Universitas Brawijaya

1210

  fuzzy, artificial neural network, support vector machine dan K-nearest neighbor .

  2.2 Klasifikasi

  Proses penentuan kelas untuk data uji berdasarkan model fungsi dan parameter- parameter data yang telah ditentukan pada tahap perancangan.

  b) Implementasi Model

  Proses membangun solusi untuk menyelesaikan masalah berdasarkan data yang telah terklasfikasi (Data latih).

  a) Perancangan Model

  Klasifikasi menggunakan algoritma- algoritma tersebut secara umum dilakukan berdasarkan 3 tahapan yaitu:

  Demam, nyeri otot, gangguan pencernaan, kondisi lidah serta pembesaran pada hati dan limpa (Annisa, 2016). Kemiripan gejala dari masing-masing penyakit sering menimbulkan kesulitan dalam mendapatkan anamnese (diagnosa sementara) sehingga pasien mendapatkan penanganan awal yang kurang tepat dan semakin memperburuk kondisi pasien (Hariman, 2014).

  Klasifikasi adalah teknik untuk merancang fungsi berdasarkan hasil pengamatan dari data dan atribut dari data tersebut sehingga dapat dilakukan pemetaan terhadap data yang belum memiliki kelas kedalam data yang telah terklasifikasi sesuai dengan aturan-aturan yang diberikan. Terdapat banyak algoritma yang digunakan untuk mengklasfikasi data, antara lain

  Demam berhubungan dengan peningkatan suhu tubuh disertai peningkatan produksi sitoken pirogen yang berfugsi untuk mengatasi rangsang, antara lain peradangan, infeksi disebabkan bakteri dan virus serta rangasangan pirogenik. Demam merupakan gejala awal untuk penyakit-penyakit yang membutuhkan penanganan serius, antara lain demam berdarah, tifoid dan malaria.

  Proses yang bertujuan untuk melakukan evaluasi terhadap hasil implementasi model fungsi dalam mengklasifikasikan data uji berdasarkan parameter-paramter yang telah ditetapkan.

2. TINJAUAN PUSTAKA

  2.3 Normalisasi Data

  MKNN merupakan algoritma yang dikembangkan dari algoritma KNN, algoritma MKNN menambahkan proses baru untuk melakukan klasifikasi yaitu, perhitungan nilai validitas untuk mempertimbangkan validitas antar data latih dan pehitungan weighted voting untuk menghitung bobot dari masing-masing terdekat. Penambahan 2 proses baru dalam MKNN diharapkan dapat memperbaiki setiap kesalahan pada proses K-NN.

  Implementasi algoritma MKNN untuk klasifikasi demam bertujuan untuk memudahkan ahli medis dalam memperoleh anamnese (diagnosa sementara) dengan cara mengklasfikasi gejala-gejala yang dialami oleh pasien dengan K data tetangga terdekat untuk mendapatkan nilai akurasi yang tinggi.

  metode tersebut seperti, Fuzzy K-Nearest Neighbor (FK-NN).

  Nearest Neighbor (MKNN), Naïve Bayes, Fuzzy Tsukamoto atau gabungan antara dua metode-

  Kemajuan teknologi telah membantu menyelesaikan permasalahan di berbagai bidang terutama bidang kesehatan, kesalahan dalam melakukan diagnosa dapat dicegah dengan mempelajari pola dari data hasil pemeriksaan pasien demam berdarah, demam tifoid dan malaria sehingga gejala-gejala tersebut dapat diklasifikasikan berdasarkan kedekatan antara data lama dengan data baru. Proses klasfikasi menggunakan komputer dapat diterapkan dengan menggunakan beberapa algoritma, antara lain K-Nearest Neighbor, Modified K-

  c) Evaluasi Model

2.1 Demam

  C dan dikatakan demam jika suhu di atas diatas 37.2 C Demam terjadi sebagai bentuk rangsang terjadinya perubahan pada pusat termoregulasi yang terletak dalam hipotalamus anterior.

  Normalisasi data merupakan proses awal yang dilakukan dalam tahap klasifikasi dengan melakukan pensklaan nilai atribut dari data sehingga berada pada range tertentu (Panjaitan, 2013). Proses normalisasi pada dataset dilakukan dengan tujuan agar persebaran data merata dan meningkatkan nilai akurasi sistem. Pada penelitian menggunakan neuro fuzzy untuk klasifikasi inventori berdasarkan analisa ABC dijelaskan bahwa hasil pengujian pada data

  Suhu tubuh merupakan gambaran keseimbangan tubuh mengenai proses produksi dan pelepasan panas yang diatur dalam otak (hipotalamus). Suhu tubuh dalam kondisi normal jika berada dalam suhu 36.5 C

  • – 37.2

  (3) Dimana:

  : label kelas titik terdekat x Fungsi S digunakan untuk menghitung kesamaan antara titik x dan data ke-i dari tetangga terdekat. Yang dituliskan dalam persamaan di bawah ini mendefinisikan fungsi S pada persamaan 4.

  =0

  masukan ternomalisasi dan tidak ternormalisasi menunjukkan hasil yang cukup berbeda hal ini ditunjukkan dengan perbedaan hasil klasifikasi dan mempengaruhi derajat keanggotaan dari data dengan pusat kelasnya (Darmanto, 2012). Terdapat beberapa cara teknik normalisasi antara

  : jumlah titik terdekat

  ( )

  : kelas x

  ( ( ))

  ( , ) = {1 = 0 ≠

  ( ) =

  (4) Keterangan: a = kelas a pada data training. b = kelas lain selain a pada data training.

  s = nilai dari data masukan min( ) = nilai minimum seluruh data max( ) = Nilai maksimum seluruh data

  (1) Dimana:

  ′ = s−min( ) max( )−min( )

  Berikut adalah persamaan 1 untuk teknik min- max normalization.

  min-max normalization, z-score normalization, decimal scaling dan sigmoidal normalization.

  1 ∑ ( ( ), ( ( )))

2.4 Algoritma Modified K-Nearest Neighbor (MKNN)

  Dalam algoritma MKNN, setiap data pada data training harus divalidasi terlebih dahulu pada awalnya. Validitas setiap data tergantung pada setiap tetangganya. Proses validasi dilakukan untuk semua data pada data training. Setelah dihitung validitas tiap data maka nilai validitas tersebut digunakan sebagai informasi lebih mengenai data tersebut. Persamaan yang digunakan untuk menghitung nilai validitas pada setiap data training adalah seperti persamaan dibawah ini Persamaan 3.

  ( ) = ( )

  Tahapan yang dilakukan pada penelitian ini ditunjukkan pada gambar 1 berupa Diagram Alir Metodologi Penelitian.

  3. METODOLOGI

  Teknik weighted voting ini mempunyai pengaruh yang lebih penting terhadap data yang mempunyai nilai validitas lebih tinggi dan paling dekat dengan data. Selain itu, dengan mengalikan validitas dengan jarak dapat mengatasi kelemahan dari setiap data yang mempunyai jarak dengan weight yang memiliki banyak masalah dalam outlier. Jadi, algoritma MKNN diusulkan secara signifikan lebih kuat daripada metode KNN tradisional yang didasarkan hanya pada jarak. (Parvin, 2008).

  : Nilai Validitas : Jarak Euclidean

  ( )

  : Perhitungan Weight Voting

  ( )

  Dimana:

  1

  Dalam metode MKNN, pertama weight masing-masing tetangga dihitung dengan menggunakan 1 / (de + 0.5). Kemudian, Validitas dari tiap data pada data training dikalikan dengan weighted berdasarkan pada jarak Euclidian. Dalam metode MKNN, weight voting tiap tetangga Persamaan 5.

  2.4.2 Perhitungan Nilai Validitas

  2.4.3 Perhitungan Weighted Voting

  Algoritma modified k-nearest neighbor (MKNN) merupakan pengembangan dari metode KNN dengan penambahan beberapa proses yaitu, perhitungan nilai validitas dan perhitungan bobot. Algoritma k-nearest

  neighbor (KNN) merupakan algoritma clustering yang sangat sederhana dengan cara

  mengelompokkan data baru dengan K tetangga terdekat.

  2.4.1 Perhitungan Jarak Eucledian

  • (5)

  Untuk mendefinisikan jarak antara dua titik yaitu titik pada data training (x) dan titik pada data testing (y) maka digunakan rumus Euclidean, seperti yang ditunjukkan pada persamaan 2

  ( , ) = √∑ ( − =0 )

  2

  (2) dengan d adalah jarak antara titik pada data training x dan titik data testing y yang akan diklasifikasi, dimana x=x1,x2,…,xi dan y=y1,y2,…,yi dan I merepresentasikan nilai atribut serta n merupakan dimensi atribut.

  Gambar 2 Alur Perancangan

  4.1 Analisa Kebutuhan Proses Gambar 1 Diagram Alir Metodologi Penelitian

  Tahap awal sistem adalah melakukan

3.1 Data Penelitian

  normalisasi data latih dan data uji. Tahap Kedua sistem melakukan perhitungan jarak eucledian Data yang digunakan dalam penelitian antara data latih dari sistem dengan data uji merupakan jenis data sekunder berupa data yang untuk menentukan jenis demam yaitu, demam didapatkan dari pihak Rumah Sakit Umum berdarah, demam tifoid dan demam malaria. Daerah Selasih, Kota Riau, Indonesia dan

  Untuk mendukung hasil klasifikasi dilakukan dijadikan sebagai data dalam pengujian perhitungan validitas lalu mencari weighted algoritma MKNN. Data yang digunakan adalah

  voting sehingga didapatkan nilai tertinggi setelah

  data yang telah diarsipkan sebelumnya oleh perhitungan weighted voting untuk mengetahui RSUD Selasih Pangkalan Kerinci Riau dan hasil klasifikasi. Perancangan proses dapat dipergunakan untuk tujuan penelitian. ditunjukkan oleh gambar 3

  Penelitian ini dilakukan menggunakan 15 gejala penyakit beserta bobot untuk masing-masing START gejala dalam beberapa tingkatan dengan total data sebanyak 133 data pasien penderita penyakit demam berdarah, tifoid dan malaria. Input Data Gejala Demam 4.

   PERANCANGAN

  Perancangan berisi penjelasan mengenai Normalisasi Data kebutuhaan yang diperlukan untuk membangun sebuah sistem yang memiliki fungsi dalam klasfikasi penyakit demam menggunakan Proses Klasifikasi MKNN algoritma MKNN. Pada gambar 2 ditunjukkan dalam diagram perancangan. Klasifikasi Demam Output Data END

  Gambar 3 Alur Sistem

  4.2 Perancangan Proses Normalisasi Data

  Data yang digunakan dalam proses klasifikasi demam merupakan data pasien beserta bobot untuk setiap gejala demam. Data tersebut diproses dalam tahap normalisasi untuk memperkecil jarak antar masing-masing data. Proses normalisasi dilakukan pada setiap data uji dan dan latih. Proses normalisasi dijelaskan dalam diagram 4. Sistem melakukan pemrosesan data latih dan data uji untuk gejala penyakit demam yang dimasukkan oleh pengguna. Proses perulangan dilakukan oleh sistem sampai menghasilkan data-data yang ternormalisasi. Normalisasi Data Dataset_pasiendemam START

  For x=1 to jumlah dataset For y=1 to jumlah gejala NormalisasiDataset x)/ (max y =(dataset x, y-min HasilNormalisasi – min y) Y Gambar 5 Diagram Alir Proses Klasifikasi MKNN X

  4.3.1 Menghitung Jarak Eucledian

  Perhitungan jarak eucledian dilakukan END dilakukan dalam 2 tahapan yaitu menghitung nilai jarak eucledian antar data latih serta

  Gambar 4 Diagram Alir Proses Normalisasi

  menghitung nilai jarak eucledian antar data latih dan data uji. Proses perhitungan jarak ditunjukan

4.3 Perancangan Sistem Klasifikasi

  pada gambar 6 Klasifikasi demam menggunakan metode Euclidean Start MKNN melalui beberapa tahap yaitu, memasukkan data set gejala demam yang telah Dataset_pasiendemam dinormalisasi, menghitung jarak eucledian, For x = 1 to datalatih mengambil sejumlah K tetangga terdekat berdasarkan hasil perhitungan jarak eucledian, menghitung nilai validitas data latih dan For y = 1 to dataLatih menghitung weighted voting. Proses klasifikasi Inisialisasi Jumlah data eucledianDataLatih=0 ditunjukkan pada gambar 5 JumlahDataEucledianDataLatih+(normal JumlahDataEucledianDataLatih= For z = 1 to Jumlah Parameter EucledianDataLatih=sqrt(jumla normalisasiDataLatih[y][z]^2) isasiDataLatih[x][y]- z heuclediandatalatih ) y x

  Return Gambar 6 Diagram Alir Perhitungan Jarak

  Eucledian

  Start

  4.3.2 Menghitung Nilai Validitas Weight Voting

  Proses perhitungan validitas bertujuan untuk EuclideanDataUji[x] melakukan validasi setiap data latih yang dan Validitas [x] digunakan dalam sistem yang ditunjukkan pada gambar 7. Tahap awal adalah melakukan For x=1 to dataLatih perhitungan jarak eucledian antar data latih lalu mengambil sejumlah K tetangga terdekat berdasarkan hasil jarak eucledian yang terkecil. For y = 1 to DataUji Tahap selanjutnya adalah melakukan perbandingan kelas untuk data latih tersebut. Hasil perbandingan tersebut kemudian Weightvoting = validitas [x][y]*(1/ dijumlahkan dan dibagi dengan nilai K yang eucledianDataUji[x][y]*0.5) telah ditentukan. Hitung Validitas EucledianDataLatih dan nilai_K START Weightvoting [x][y] y asort (euclediandatalatih) For x=1 to datalatih Return x For y=1 to nilai_k-1 Gambar 8 Diagram Alir Perhitungan Weighted For z=y+1 to nilai_k Voting 5.

   IMPLEMENTASI Datalatih[indexurutvaliditaslatih[y]][diagnosis]= =datalatih[indexurutvaliditaslatih[z]][diagnosis]

  5.1 Implementasi Halaman Data Latih

  Sistem menampilkan 100 data latih pasien K[z]=1 K[y]=1 klasifikasi. Data pasien terdiri atas ID pasien dan yang digunakan untuk menyusun fungsi Y Z pada pasien seperti pada gambar 9. bobot 15 gejala berdasarkan hasil pemeriksaan

  Menjumlahkan seluruh Validitas[x]=sum/nilai k nilai pada variabel K X Return Gambar 7 Diagram Alir Perhitungan Validitas

  4.3.3 Menghitung Weighted Voting

  Proses perhitungan weighted voting

  Gambar 9 Halaman Data Latih Pasien

  dijelaskan dalam diagram alir 8 dimulai dari memasukkan nilai jarak eucledian antara data

  5.2 Implementasi Halaman Data Uji

  latih dan data uji serta nilai validiatas untuk selanjutnya dilakukan perulangan sampai Halaman sistem yang menampilkan data uji mendapatkan nilai dari perhitungan weighted pasien yang digunakan untuk proses pengujian voting . metode MKNN dalam mengklasifikasikan demam. Data uji memiliki data yang sama dengan tabel data latih terdiri atas ID pasien dan 15 gejala beserta bobot seperti pada gambar 10

  Gambar 10 Halaman Data Uji Pasien

  Pengujian terhadap nilai K dilakukan menggunakan nilai K yang bervariasi, yaitu nilai K = 3, K = 5, K = 7, K = 10, K = 20 dan K = 30 dengan jumlah data latih yang berbeda, yaitu 50, 70 dan 100 data latih. Grafik hasil pengujian ditunjukkan pada gambar 13

  20

  10

  7

  5

  3

  0,00% 20,00% 40,00% 60,00% 80,00% 100,00%

  Grafik pada gambar 13 menunjukkan bahwa pada pengujian ini nilai akurasi tertinggi dari nilai K = 3 dan K =7. Pengujian terhadap nilai K menunjukkan tingkat akurasi yang berbeda sehingga dapat diketahui bahwa perubahan nilai K dapat mempengaruhi akurasi sistem untuk

  Gambar 13 Grafik Hasil Pengujian Pengaruh Nilai K

  a) Hasil pengujian Akurasi berdasarkan Nilai K

  5.3 Implementasi Proses Perhitungan MKNN

  Pengujian dilakukan untuk mengetahui pengaruh perubahan nilai K, pengaruh perubahan total data latih dan pengaruh perubahan komposisi data latih terhadap akurasi sistem.

  Gambar 12 Halaman Pengujian 6. PENGUJIAN

  Halaman pengujian pada sistem menampilkan hasil klasifikasi demam untuk semua data uji sesuai dengan nilai yang didapatkan dari perhitungan weighted voting. Hasil Klasifikasi dalam halaman pengujian ditampilkan sesuai dengan nilai K yang ditentukan lalu ditampilkan banyak data dengan sesuai nilai K dengan nilai tertinggi pada masing-masing penyakit seperti yang ditunjukkan padahal gambar 12

  5.3 Implementasi Hasil Klasifikasi

  Gambar 11 Halaman Proses Perhitungan MKNN

  perhitungan weighted voting seperti pada gambar 11.

  eucledian antara data latih dan data uji,

  Proses klasifikasi demam menggunakan metode MKNN terdiri atas beberapa tahap, antara normalisasi data latih, normalisasi data uji, perhitungan jarak eucledian data latih, perhitungan nilai validitas, perhitungan jarak

  30 Pengujian Pengaruh Nilai K terhadap Akurasi mengklasifikasi demam. Nilai K yang semakin tinggi menyebabkan akurasi menurun hal ini disebabkan oleh beberapa hal antara lain mempengaruhi kesesuaian data, nilai K yang tinggi menyebabkan nilai validitas data latih rendah dan perbandingan data dari hasil weighted voting semakin banyak sehingga menyebabkan kesalahan sistem dalam melakukan klasifikasi. Total rata-rata akurasi untuk pengujian K adalah 88.55%.

  b) Hasil pengujian Akurasi berdasarkan Jumlah Data Latih

  92,00% 93,00% 94,00% 95,00% 96,00% 97,00% 98,00%

  30 T, 20 M, 20 D

  20 T , 30 M , 20 D

  30 T, 20 M, 20 D

  100,00%

  Pengaruh Pengujian Jumlah Data Latih 80,00% 85,00% 90,00% 95,00%

  70 Data Latih 100 Data Latih

  50 Data Latih

  30 Data Latih

  Pengujian komposisi dilakukan menggunakan 133 data pasien namun dilakukan perubahan terhadap komposisi data latih dan data uji. Pengujian pertama dilakukan dengan komposisi 100 data latih dan 33 data uji. Pengujian kedua dilakukan dengan komposisi 80 data latih dan 53 data uji serta pengujian ketiga dilakukan dengan komposisi data latih 70 dan 63

  Pengujian pengaruh jumlah data dengan 4 variasi data latih yaitu 30 data latih, 50 data latih, 70 data latih dan 100 data latih dengan menggunakan nilai K = 3 dan 33 data uji. Grafik hasil pengujian ditunjukkan pada gambar 14.

  d) Hasil pengujian Akurasi berdasarkan Komposisi Data Latih

  Hasil pengujian menunjukkan bahwa komposisi data latih untuk memberikan pengaruh terhadap proses klasifikasi demam. Pada 3 skenario komposisi data latih cenderung dominan pada satu kelas sehingga hasil akurasi sangat bervariasi. Skenario pertama dengan hasil akurasi 93.94%, skenario kedua menghasilkan akurasi 90.90% dan skenario ketiga menghasilkan akurasi 87.89%. Akurasi tertinggi didapatkan dari skenario terakhir dengan komposisi data seimbang yaitu 96.97%. Nilai akurasi yang tinggi disebabkan karena komposisi data yang digunakan merata dan tidak dominan pada kelas tertentu.

  Gambar 15 Grafik Hasil Pengujian Pengaruh Komposisi Data Latih

  20 Tifoid, 20 Malaria dan 30 Demam Berdarah (DBD). Skenario terakhir menggunakan komposisi data latih seimbang terdiri atas 25 Tifoid, 25 Malaria dan 25 Demam Berdarah (DBD). Pengujian dilakukan menggunakan nilai K =10 dan mendapatkan hasil akurasi sistem seperti yang ditunjukkan pada gambar 15

  Skenario ketiga komposisi data latih terdiri atas

  Pengujian komposisi dilakukan menggunakan 70 data latih dengan ketentuan beberapa, yaitu skenario pertama komposisi data latih terdiri atas 30 Tifoid, 20 Malaria dan 20 Demam Berdarah (DBD). Skenario kedua komposisi data latih terdiri atas 20 Tifoid, 30 Malaria dan 20 Demam Berdarah (DBD).

  c) Hasil pengujian Akurasi berdasarkan Komposisi Data Latih

  Hasil pengujian menunjukkan bahwa jumlah data latih mempengaruhi akurasi sistem dalam melakukan klasifikasi demam. Hal ini ditunjukkan dengan dengan hasil akurasi sebesar 93.94% dari pengujian menggunakan 30 data latih, 50 data latih dan 70 Data Latih. Pengujian menggunakan 100 data latih mendapatkan akurasi tertinggi sebesar 96.97%. Pengujian menggunakan skenario ini menunjukkan nilai akurasi rendah jika data latih yang digunakan tidak banyak. Proses klasifikasi menggunakan algoritma MKNN dilakukan dengan mempelajari pola dari data latih sehingga jumlah data latih yang rendah menyebabkan sistem kurang menemukan pola dari data latih untuk melakukan klasifikasi.

  Gambar 14 Grafik Hasil Pengujian Pengaruh Jumlah Data Latih

  25 T, 25 M, 25 D Pengaruh Pengujian Komposisi Data Latih data latih. Pengujian dilakukan menggunakan demam dapat memberikan anamnese nilai K = 3, K = 5, K =7 dan K = 10 dan (diagnosa awal) terhadap 3 jenis demam, mendapatkan hasil akurasi sistem seperti yang yaitu demam berdarah, tifoid dan malaria. ditunjukkan pada gambar 16

  2. Hasil klasifikasi kelas pada algoritma

  MKNN diambil berdasarkan nilai tertinggi

  Pengaruh Pengujian Komposisi

  setelah proses perhitungan weighted voting

  Data Latih dan Data Uji

  dan nilai K yang telah ditentukan .

  97,50% 3.

  Pengujian akurasi dilakukan dalam 3 tahap,

  97,00%

  yaitu pengujian terhadap nilai K, pengujian terhadap jumlah data latih dan pengujian

  96,50%

  terhadap kompoisi data latih untuk

  96,00%

  mengetahui pengaruh perubahan nilai K dan perubahan data latih terhadap akurasi

  95,50%

  sistem dengan penjelasan sebagai berikut:

  95,00% a.

  Nilai rata-rata akurasi pengujian perngaruh nilai K terhadap akurasi

  94,50%

  adalah 88.55% dengan akurasi

  94,00%

  tertinggi pada pengujian nilai K = 3 dengan akurasi sebesar 94.95%.

  93,50% b.

  Nilai rata-rata akurasi pengujian

  93,00%

  pengaruh jumlah data latih terhadap

  100 Data

  80 Data Latih

  70 Data Latih akurasi adalah 92.42%. Latih dan 33 dan 53 Data dan 63 Data c.

  Data Uji Uji Uji Nilai rata-rata akurasi pengujian

  komposisi data latih terhadap akurasi adalah 87.89% dengan nilai akurasi

  Gambar 16 Grafik Hasil Pengujian Pengaruh

  tertinggi sebesar 96.97% untuk

  Komposisi Data Latih dan Data Uji

  pengujian komposisi data seimbang 25 Hasil pengujian menunjukkan bahwa

  Tifoid, 25 Malaria dan 25 Demam komposisi data latih untuk memberikan Berdarah. pengaruh terhadap proses klasifikasi demam.

  d.

  Nilai rata-rata akurasi pengujian Pada 3 skenario komposisi data latih dan data uji pengaruh jumlah data latih dan data uji yang sangat bervariasi sehingga mempengaruhi terhadap akurasi adalah 96.35%. Nilai tingkat akurasi. Skenario pertama dengan hasil akurasi tertinggi didapatkan dari akurasi 94.69%, skenario kedua menghasilkan pengujian dengan komposisi 70 data akurasi 97.16% dan skenario ketiga latih dan 63 data uji dengan nilai menghasilkan akurasi 97.21%. Akurasi tertinggi akurasi 97.21%. didapatkan dari skenario terakhir dengan

  Saran yang dapat diberikan untuk komposisi data latih lebih banyak namun hampir pengembangan penelitian ini selanjutnya antara seimbang dengan data uji yaitu 97.21%. Akurasi lain: yang tinggi dengan komposisi data latih 70 data a. Menambahkan kategori penyakit dengan dan dan data uji 63 data dapat disebabkan karena gejala demam disertai gejala lain. jarak antar data yang dekat sehingga dengan

  b. Menambahkan data gejala yang lebih pengujian menggunakan komposisi seimbang bervariasi baik dari pemeriksaan secara mendapat akurasi yang lebih baik dalam fisik dan pemeriksaan non fisik. penelitian menggunakan data ini.

  c. Mengembangkan metode serta menggabungkan metode lain karena

  dalam memecahkan permasalahan ini, metode MKNN bukan satu-satunya Berdasarkan penelitian untuk melakukan metode yang dapat digunakan. klasifikasi demam menggunakan metode pada

7. KESIMPULAN

  d. Sistem juga dapat dikembangkan dengan

  proses perancangan, implementasi dan menentukan nilai K dan komposisi jumlah pengujian maka dapat diambil kesimpulan data latih dan data uji yang optimal untuk sebagai berikut: mendapatkan akurasi yang lebih baik

  .

  1. Implementasi algoritma MKNN untuk klasifikasi demam berdasarkan 15 gejala

DAFTAR PUSTAKA

  Universitas Diponogero. Panjaitan, A., Hidayat, B & Sujatmoko, K.,

  Modified K-nearest neighbor filters for simple implementation . 2000 IEEE

  International Symposium on Circuits and Systems. Emerging Technologies for the 21st Century. Proceedings (IEEE Cat No.00CH36353), Geneva. pp. 568- 565 vol.4.

  Hadisaputro, S., 1991. Tropical Disease Update.

  Laboratorium Ilmu Penyakit Dalam FK Undip. Semarang. Hariman, I & Noviar, A., 2014. Sistem Pakar

  untuk Mendiagnosa Penyakit DBD (Demam Berdarah Dengue) dengan Metode Forward Chaining Berbasis Web . Sekolah Tinggi Manajemen

  Informatika dan Ilmu Komputer LPKIA. Hasan, H., 2007. Analisis Faktor Risiko

  Kejadian Malaria di Puskesmas Sukamerin di Kecamatan Sungai Serut Kota Bengkulu Propinsi Bengkulu. S2.

  2013. Analisis Diskriminan Linear

  Manson’s Tropical Disease . China: Saunders Elsevier.

  dalam Klasifikasi Data pada Teori Informasi dengan Metode Cross Validation . S1. Universitas Telkom.

  Parvin, H., Alizadeh, H & Bidgoli, B., 2008.

  MKNN: Modified K-Nearest Neighbor .

  Proceedings of the World Congress on Engineering and Computer Science 2008. San Fransisco. USA Zainuddin, S., Hidayat, N & Soebroto, A., 2014.

  Penerapan Algoritma Modified K- Nearest Neighbor (M-KNN) pada Pengklasifikasian Tanaman Kedelai .

  S1. Universitas Brawijaya. Tersedia di

  

  [Diakses 2 Februari 2017]

  Gevorkian, D, Egiazarian, K & Astola, J., 2000.

  Annisa, C.D., Putri, R.R & Marji., 2016. Sistem

  Pakar Diagnosa Awal Penyakit DBD, Malaria dan Tifoid menggunakan Metode Fuzzy K-Nearest Neighbor (FKNN). S1. Universitas Brawijaya.

  Wang, Zhaohui Jiang and Huanqing Feng. 2005. Phosphorylation Site

  Tersedia di [Diakses 2 Februari 2017]

  Arista, R.B.et al., n.d. Deteksi Penyakit Demam

  Berdarah, Tifus dan Demam Biasa berdasarkan gejalanya . S1. Universitas

  Brawijaya.

  B. G. H. Gorte., 2008. Improving spectral image

  classifications by incorporating context data using likelihood vectors

  . Fifth International Conference on Image Processing and its Applications.

  Edinburgh. pp. 251-255. Ao Li, Lirong Wang, Yunzhou Shi, Minghui

  Prediction with A Modified k-Nearest Neighbor Algorithm and BLOSUM62 Matrix . IEEE Engineering in Medicine and Biology 27th Annual Conference.

  Berdarah Dengue (DBD) . S1. Fakultas

  Shanghai. Darmanto, E & Hartati, S., 2012. Neuro Fuzzy

  untuk Klasifikasi Inventori berdasarkan analisa ABC . Seminar Nasional

  Informatika 2012. UPN Veteran Yogyakarta. Yogyakarta. Departemen Kesehatan Indonesia, 2013.

  Penyakit Malaria dan TBC menyebabkan 170.000 kematian setiap tahun di Indonesia . Jakarta.

  Departemen Kesehatan Republik Indonesia, 2008a. Perkembangan Kejadian DBD di

  Indonesia 2004-2007 . Tersedia di

   > (Diakses tanggal 1 Januari 2017)

  Fransisca, S & Gabriela, P., 2000. Demam

  Kedokteran. Universitas Wijaya Kusuma. Gillepsie, CJSH., 2009.