2.4.5. Variance
Variance digunakan untuk mengukur persebaran diantara mean kombinasi antara piksel referensi dengan piksel tetangga. Variance dihitung dengan menggunakan
persamaan 2.12.
2.12
2.4.6. Correlation
Correlation digunakan untuk menghitung keterkaitan piksel yang memiliki level keabuan i dengan piksel yang memiliki level keabuan j. Correlation dihitung dengan
menggunakan persamaan 2.13.
2.13
dimana dan
ditunjukkan pada persamaan 2.14 dan persamaan 2.15.
2.14
2.15
2.5. Modified k-Nearest Neighbor
Modified k-Nearest Neighbor MkNN merupakan pengembangan dari metode k- Nearest Neighbor kNN. Jika kNN mengklasifikasikan data pengujian berdasarkan
skor tertinggi dari beberapa kelas pada k data pelatihan dengan jarak terdekat, maka
Universitas Sumatera Utara
MkNN mengklasifikasikan data pengujian berdasarkan bobot tertinggi dari beberapa kelas pada k data pelatihan tervalidasi dengan jarak terdekat Parvin, 2008.
Dengan adanya
validasi pada
data pelatihan,
MkNN mampu
mengklasifikasikan data pengujian dengan lebih baik. Validitas memberikan informasi lebih banyak tentang keadaan data pelatihan pada ruang fitur, bukan hanya label kelas
dari masing-masing data pelatihan saja. MkNN memberikan kesempatan yang lebih besar kepada data pelatihan yang memiliki validitas yang lebih tinggi dan memiliki
jarak yang dekat dengan data pengujian, sehingga pemberian label atau kelas pada data pengujian tidak terlalu terpengaruh terhadap data yang tidak begitu stabil Parvin,
2008. MkNN terdiri dari dua tahapan. Tahapan pertama adalah menghitung
validitas data pelatihan. Tahapan selanjutnya adalah mengklasifikasikan data pengujian dengan menggunakan gabungan dari weighted kNN dan validitas dari data
pelatihan yang telah didapat sebelumnya. Validitas data dari tiap data pelatihan tergantung dari data pelatihan lain yang
menjadi tetangganya. Tahapan yang dilakukan untuk melakukan validasi data pelatihan adalah sebagai berikut.
1. Tentukan nilai H, dimana H merupakan banyaknya data pelatihan y yang
bertetangga dengan data pelatihan x. Nilai H adalah 10 dari jumlah data pelatihan Parvin, 2008.
2. Hitung jarak antara data pelatihan x dengan semua data pelatihan lainnya y
menggunakan Euclidean distance yang ditunjukkan pada persamaan 2.16.
2.16
Dimana : = jarak dari data x ke data y
= elemen ke-i dari data x = elemen ke-i dari data y
n = jumlah elemen dari data x dan data y
Universitas Sumatera Utara
3. Ambil H buah data pelatihan y yang memiliki jarak terdekat dengan data
pelatihan x. 4.
Hitung validasi data pelatihan x menggunakan persamaan 2.17.
2.17
Dimana : = validitas data ke-x
= jumlah data tetangga = kelas dari data pelatihan ke-x
= kelas dari data pelatihan ke-y = fungsi similaritas data
Fungsi similaritas ditunjukkan pada persamaan 2.18.
2.18
Setelah validasi semua data pelatihan didapatkan, klasifikasi dari data pengujian bisa dilakukan. Adapun langkah untuk mengklasifikasi data pengujian
adalah sebagai berikut. 1.
Tentukan nilai dari k, dimana k adalah jumlah data pelatihan dengan jarak terdekat yang digunakan sebagai pembanding dalam mengklasifikasikan data
pengujian. 2.
Hitung jarak antara data pengujian dengan semua data pelatihan menggunakan rumus Euclidean distance pada persamaan 2.9.
3. Ambil k buah data pelatihan yang memiliki jarak terdekat.
4. Hitung bobot dari masing-masing k data pelatihan dengan persamaan 2.19.
2.19
Universitas Sumatera Utara
Dimana: = bobot dari data pelatihan ke-x
= validitas dati data pelatihan ke-x = jarak dari data pengujian ke data pelatihan x
5. Jumlahkan bobot data pelatihan yang memiliki kelas yang sama. Kelas dengan
bobot tertinggi merupakan kelas dari data pengujian.
2.6. Penelitian Terdahulu