Modified k-Nearest Neighbor Identifikasi Diabetic Retinopathy Melalui Citra Retina Menggunakan Modified K-Nearest Neighbor

2.4.5. Variance Variance digunakan untuk mengukur persebaran diantara mean kombinasi antara piksel referensi dengan piksel tetangga. Variance dihitung dengan menggunakan persamaan 2.12. 2.12 2.4.6. Correlation Correlation digunakan untuk menghitung keterkaitan piksel yang memiliki level keabuan i dengan piksel yang memiliki level keabuan j. Correlation dihitung dengan menggunakan persamaan 2.13. 2.13 dimana dan ditunjukkan pada persamaan 2.14 dan persamaan 2.15. 2.14 2.15

2.5. Modified k-Nearest Neighbor

Modified k-Nearest Neighbor MkNN merupakan pengembangan dari metode k- Nearest Neighbor kNN. Jika kNN mengklasifikasikan data pengujian berdasarkan skor tertinggi dari beberapa kelas pada k data pelatihan dengan jarak terdekat, maka Universitas Sumatera Utara MkNN mengklasifikasikan data pengujian berdasarkan bobot tertinggi dari beberapa kelas pada k data pelatihan tervalidasi dengan jarak terdekat Parvin, 2008. Dengan adanya validasi pada data pelatihan, MkNN mampu mengklasifikasikan data pengujian dengan lebih baik. Validitas memberikan informasi lebih banyak tentang keadaan data pelatihan pada ruang fitur, bukan hanya label kelas dari masing-masing data pelatihan saja. MkNN memberikan kesempatan yang lebih besar kepada data pelatihan yang memiliki validitas yang lebih tinggi dan memiliki jarak yang dekat dengan data pengujian, sehingga pemberian label atau kelas pada data pengujian tidak terlalu terpengaruh terhadap data yang tidak begitu stabil Parvin, 2008. MkNN terdiri dari dua tahapan. Tahapan pertama adalah menghitung validitas data pelatihan. Tahapan selanjutnya adalah mengklasifikasikan data pengujian dengan menggunakan gabungan dari weighted kNN dan validitas dari data pelatihan yang telah didapat sebelumnya. Validitas data dari tiap data pelatihan tergantung dari data pelatihan lain yang menjadi tetangganya. Tahapan yang dilakukan untuk melakukan validasi data pelatihan adalah sebagai berikut. 1. Tentukan nilai H, dimana H merupakan banyaknya data pelatihan y yang bertetangga dengan data pelatihan x. Nilai H adalah 10 dari jumlah data pelatihan Parvin, 2008. 2. Hitung jarak antara data pelatihan x dengan semua data pelatihan lainnya y menggunakan Euclidean distance yang ditunjukkan pada persamaan 2.16. 2.16 Dimana : = jarak dari data x ke data y = elemen ke-i dari data x = elemen ke-i dari data y n = jumlah elemen dari data x dan data y Universitas Sumatera Utara 3. Ambil H buah data pelatihan y yang memiliki jarak terdekat dengan data pelatihan x. 4. Hitung validasi data pelatihan x menggunakan persamaan 2.17. 2.17 Dimana : = validitas data ke-x = jumlah data tetangga = kelas dari data pelatihan ke-x = kelas dari data pelatihan ke-y = fungsi similaritas data Fungsi similaritas ditunjukkan pada persamaan 2.18. 2.18 Setelah validasi semua data pelatihan didapatkan, klasifikasi dari data pengujian bisa dilakukan. Adapun langkah untuk mengklasifikasi data pengujian adalah sebagai berikut. 1. Tentukan nilai dari k, dimana k adalah jumlah data pelatihan dengan jarak terdekat yang digunakan sebagai pembanding dalam mengklasifikasikan data pengujian. 2. Hitung jarak antara data pengujian dengan semua data pelatihan menggunakan rumus Euclidean distance pada persamaan 2.9. 3. Ambil k buah data pelatihan yang memiliki jarak terdekat. 4. Hitung bobot dari masing-masing k data pelatihan dengan persamaan 2.19. 2.19 Universitas Sumatera Utara Dimana: = bobot dari data pelatihan ke-x = validitas dati data pelatihan ke-x = jarak dari data pengujian ke data pelatihan x 5. Jumlahkan bobot data pelatihan yang memiliki kelas yang sama. Kelas dengan bobot tertinggi merupakan kelas dari data pengujian.

2.6. Penelitian Terdahulu