Gambar 4.4 Contoh formula mencari jarak 3. Menghitung PCL
PCLProbability of
Class Label
adalah nilai
probabilitasbanyaknya kemunculan class label yang sama dengan instance
T dibandingkan k tetangga terdekatnya. PCL dihitung dengan cara membagi jumlah tetangga terdekat instance T yang mempunyai class
label yang sama termasuk instance T sendiri dengan nilai k. Formula
menghitung PCL dalam Microsoft Excel adalah sebagai berikut : =cell1k
Gambar 4.5 Contoh formula menghitung PCL
4. Meranking List Top N Outlier Dari Instance Dengan Nilai PCLT,K
Terkecil
Setelah menghitung nilai PCL, data diranking secara kecil ke
besar berdasarkan nilai PCLT,K terkecil sesuai dengan masukan top N.
Top N adalah jumlah instances yang dideteksi sebagai outlier yang
diurutkan secara kecil ke besar. Misalkan masukan top N = 10, maka akan
diranking 10 instance dengan nilai PCLT,K terkecil. Untuk meranking instance
, digunakan fitur Sort Filter dalam Microsoft Excel.
Gambar 4.6 Contoh meranking kecil ke besar berdasarkan nilai PCLT,K
terkecil
5. Menghitung Nilai DeviationT¸ NormDeviationT, KdistT, Dan
NormKdistT
Kemudian instance yang berada di top N dihitung nilai DeviationT
¸ NormDeviationT
, KdistT
, dan
NormKdistT berdasarkan rumus 2.1, 2.2, dan 2.3. DeviationT adalah seberapa
besar nilai instance T yang menyimpang dari subset DCL. KDist adalah jarak antara instance T pada dataset D dengan K tetangga terdekat,
seberapa dekat nilai K instance tetangga terdekat dengan instance T. Sedangkan NormDeviationT adalah nilai deviation yang sudah
ternormalisasi dan NormKDistT adalah nilai KDist yang sudah
ternormalisasi. Formula menghitung DeviationT¸ NormDeviationT, KdistT
, dan NormKdistT dalam Microsoft Excel adalah sebagai berikut :
a. Mencari Deviation =cell1+cell2+cell3+...+celln
Gambar 4.7 Contoh formula menghitung Deviation
b. Mencari NormDeviationT =cell1-mincellmaxcell-mincell
Gambar 4.8 Contoh formula menghitung NormDeviationT
c. Mencari Kdist = cell1+cell2+cell3+...+celln
Gambar 4.9 Contoh formula menghitung Kdist
d. Mencari NormKDistT =cell1-mincellmaxcell-mincell