Teknik Pengolahan Data Tahap – Tahap Penelitian
Setelah menghitung jarak dari setiap instance, tahap selanjutnya adalah mencari k tetangga terdekat, dengan asumsi k = 7. K melambangkan
jangkauan suatu instance terhadap tetangganya. Maka, dicari 7 tetangga terdekat dari setiap instance.
Gambar 3.4
Tujuh tetangga terdekat dari tiap instance Selanjutnya mencari nilai PCL dari tiap instance. PCL adalah nilai
probabilitas class label dari instance T dengan class label dari k tetangga terdekat. PCL dihitung dengan cara membagi jumlah tetangga terdekat instance
T yang mempunyai class label yang sama termasuk instance T sendiri dengan nilai k. Misalkan ada 7 tetangga terdekat dari instance T termasuk
dirinya dari sebuah dataset dengan class label x dan y, dimana 5 dari tetangga terdekat mempunyai class label x dan sisanya mempunyai class label y.
Instance T dengan class label y mempunyai nilai PCL 27. Class label yang
digunakan adalah nilaiisi dari atribut STATUS.
Tabel 3.2 Hasil perhitungan PCL tiap instance
PCL
PCL7 Dev vDev
Kdist
vKdist
COF 1
7 1.00
2 7
1.00 3
7 1.00
4 7
1.00 5
7 1.00
6 2
0.29 7
2 0.29
8 3
0.43 9
3 0.43
10 3
0.43 11
5 0.71
12 7
1.00 13
5 0.71
Kemudian meranking list top N dari instance dengan nilai PCL terkecil. Misalkan top N = 5, maka dicari 5 instance dengan nilai PCL terkecil.
Ranking top N dapat dilihat pada tabel 3.3. Instance yang di-bold adalah instance
dengan nilai PCL terkecil. Selanjutnya mencari nilai DeviationT dan KDistT
dari instance pada top N berdasarkan rumus 2.4 dan 3.5.
Tabel 3.3 Hasil perhitungan Deviation dan KDist
dari tiap instance
PCL
PCL7 Dev vDev
Kdist
vKdist
COF 1
7 1.00 13.55
0.90 11.31 0.77
2 7
1.00 13.32 0.89 11.17
0.73 3
7 1.00 12.90
0.86 10.38 0.47
4 7
1.00 14.19 0.95 11.60
0.87 5
7 1.00 13.66
0.91 10.97 0.66
6 2