Teknik Pengolahan Data Tahap – Tahap Penelitian
Setelah menghitung jarak dari setiap
instance
, tahap selanjutnya adalah mencari k tetangga terdekat, dengan asumsi k = 7. K melambangkan
jangkauan suatu
instance
terhadap tetangganya. Maka, dicari 7 tetangga terdekat dari setiap
instance
.
Gambar 3.4 Tujuh tetangga terdekat dari tiap
instance
Selanjutnya mencari nilai
PCL
dari tiap
instance
.
PCL
adalah nilai probabilitas
class label
dari
instance
T dengan
class label
dari k tetangga terdekat. PCL dihitung dengan cara membagi jumlah tetangga terdekat
instance
T yang mempunyai
class label
yang sama termasuk
instance
T sendiri dengan nilai k. Misalkan ada 7 tetangga terdekat dari
instance
T termasuk dirinya dari sebuah dataset dengan
class label
x dan y, dimana 5 dari tetangga terdekat mempunyai
class label
x dan sisanya mempunyai
class label
y.
Instance
T dengan
class label
y mempunyai nilai
PCL
27.
Class label
yang digunakan adalah nilaiisi dari atribut STATUS.
Tabel 3.2 Hasil perhitungan PCL tiap
instance
PCL
PCL7 Dev vDev
Kdist
vKdist
COF 1
7 1.00
2 7
1.00 3
7 1.00
4 7
1.00 5
7 1.00
6 2
0.29 7
2 0.29
8 3
0.43 9
3 0.43
10 3
0.43 11
5 0.71
12 7
1.00 13
5 0.71
Kemudian meranking list
top N
dari
instance
dengan nilai
PCL
terkecil. Misalkan
top N
= 5, maka dicari 5
instance
dengan nilai
PCL
terkecil. Ranking
top N
dapat dilihat pada tabel 3.3.
Instance
yang di-
bold
adalah
instance
dengan nilai
PCL
terkecil. Selanjutnya mencari nilai
DeviationT
dan
KDistT
dari
instance
pada
top N
berdasarkan rumus 2.4 dan 3.5.
Tabel 3.3 Hasil perhitungan
Deviation
dan
KDist
dari tiap
instance
PCL
PCL7 Dev vDev
Kdist
vKdist
COF 1
7 1.00 13.55
0.90 11.31 0.77
2 7
1.00 13.32 0.89 11.17
0.73 3
7 1.00 12.90
0.86 10.38 0.47
4 7
1.00 14.19 0.95 11.60
0.87 5
7 1.00 13.66
0.91 10.97 0.66
6 2