Teknik Pengolahan Data Tahap – Tahap Penelitian

Setelah menghitung jarak dari setiap instance, tahap selanjutnya adalah mencari k tetangga terdekat, dengan asumsi k = 7. K melambangkan jangkauan suatu instance terhadap tetangganya. Maka, dicari 7 tetangga terdekat dari setiap instance. Gambar 3.4 Tujuh tetangga terdekat dari tiap instance Selanjutnya mencari nilai PCL dari tiap instance. PCL adalah nilai probabilitas class label dari instance T dengan class label dari k tetangga terdekat. PCL dihitung dengan cara membagi jumlah tetangga terdekat instance T yang mempunyai class label yang sama termasuk instance T sendiri dengan nilai k. Misalkan ada 7 tetangga terdekat dari instance T termasuk dirinya dari sebuah dataset dengan class label x dan y, dimana 5 dari tetangga terdekat mempunyai class label x dan sisanya mempunyai class label y. Instance T dengan class label y mempunyai nilai PCL 27. Class label yang digunakan adalah nilaiisi dari atribut STATUS. Tabel 3.2 Hasil perhitungan PCL tiap instance PCL PCL7 Dev vDev Kdist vKdist COF 1 7 1.00 2 7 1.00 3 7 1.00 4 7 1.00 5 7 1.00 6 2 0.29 7 2 0.29 8 3 0.43 9 3 0.43 10 3 0.43 11 5 0.71 12 7 1.00 13 5 0.71 Kemudian meranking list top N dari instance dengan nilai PCL terkecil. Misalkan top N = 5, maka dicari 5 instance dengan nilai PCL terkecil. Ranking top N dapat dilihat pada tabel 3.3. Instance yang di-bold adalah instance dengan nilai PCL terkecil. Selanjutnya mencari nilai DeviationT dan KDistT dari instance pada top N berdasarkan rumus 2.4 dan 3.5. Tabel 3.3 Hasil perhitungan Deviation dan KDist dari tiap instance PCL PCL7 Dev vDev Kdist vKdist COF 1 7 1.00 13.55 0.90 11.31 0.77 2 7 1.00 13.32 0.89 11.17 0.73 3 7 1.00 12.90 0.86 10.38 0.47 4 7 1.00 14.19 0.95 11.60 0.87 5 7 1.00 13.66 0.91 10.97 0.66 6 2

0.29 0.50

0.00 10.53 0.52

7 2

0.29 0.50

0.00 9.81

0.28 8

3 0.43

0.77 0.02

8.96 0.01

9 3

0.43 0.76

0.02 8.93

0.00 10

3 0.43

1.48 0.07

8.95 0.01

11 5 0.71 14.70 0.98 11.35 0.78 12 7 1.00 14.32 0.95 11.74 0.91 13 5 0.71 14.98 1.00 12.01 1.00 Setelah menghitung nilai Deviation dan KDist dari tiap instance pada top N , tahap selanjutnya adalah menghitung COF Class Outlier Factor dari instance pada top N berdasarkan rumus 2.4. Kemudian meranking tiap instance pada list top N berdasarkan nilai COF terkecil. Tabel 3.4 Hasil perhitungan COF dari tiap instance PCL PCL7 Dev vDev Kdist vKdist COF 7 2.00 0.29

0.50 0.00

9.81 0.28

2.28 6 2.00

0.29 0.50

0.00 10.53 0.52

2.52 10 3.00

0.43 1.48

0.07 8.95

0.01 2.94

9 3.00 0.43

0.76 0.02

8.93 0.00

2.98 8 3.00

0.43 0.77

0.02 8.96

0.01 2.99

11 5.00 0.71 14.70 0.98 11.35 0.78 4.80 13 5.00 0.71 14.98 1.00 12.01 1.00 5.00 3 7.00 1.00 12.90 0.86 10.38 0.47 6.61 5 7.00 1.00 13.66 0.91 10.97 0.66 6.75 2 7.00 1.00 13.32 0.89 11.17 0.73 6.84 1 7.00 1.00 13.55 0.90 11.31 0.77 6.87 4 7.00 1.00 14.19 0.95 11.60 0.87 6.92 12 7.00 1.00 14.32 0.95 11.74 0.91 6.96 Dari tabel di 3.4, ditemukan instance yang menjadi outlier yaitu instance nomor 7, 6, 10, 9, dan 8. Dimana nasabah no. 7 dan 6 meminjam dengan jumlah cukup besar dibandingkan dengan tetangga terdekatnya dan menunggak sebanyak 6 kali. Sedangkan nasabah no. 10, 9, dan 8 mempunyai jumlah pinjaman yang terkecil tetapi mempunyai tunggakan sebanyak 4 – 5 kali.