Teknik Pengolahan Data Tahap – Tahap Penelitian

Setelah menghitung jarak dari setiap instance , tahap selanjutnya adalah mencari k tetangga terdekat, dengan asumsi k = 7. K melambangkan jangkauan suatu instance terhadap tetangganya. Maka, dicari 7 tetangga terdekat dari setiap instance . Gambar 3.4 Tujuh tetangga terdekat dari tiap instance Selanjutnya mencari nilai PCL dari tiap instance . PCL adalah nilai probabilitas class label dari instance T dengan class label dari k tetangga terdekat. PCL dihitung dengan cara membagi jumlah tetangga terdekat instance T yang mempunyai class label yang sama termasuk instance T sendiri dengan nilai k. Misalkan ada 7 tetangga terdekat dari instance T termasuk dirinya dari sebuah dataset dengan class label x dan y, dimana 5 dari tetangga terdekat mempunyai class label x dan sisanya mempunyai class label y. Instance T dengan class label y mempunyai nilai PCL 27. Class label yang digunakan adalah nilaiisi dari atribut STATUS. Tabel 3.2 Hasil perhitungan PCL tiap instance PCL PCL7 Dev vDev Kdist vKdist COF 1 7 1.00 2 7 1.00 3 7 1.00 4 7 1.00 5 7 1.00 6 2 0.29 7 2 0.29 8 3 0.43 9 3 0.43 10 3 0.43 11 5 0.71 12 7 1.00 13 5 0.71 Kemudian meranking list top N dari instance dengan nilai PCL terkecil. Misalkan top N = 5, maka dicari 5 instance dengan nilai PCL terkecil. Ranking top N dapat dilihat pada tabel 3.3. Instance yang di- bold adalah instance dengan nilai PCL terkecil. Selanjutnya mencari nilai DeviationT dan KDistT dari instance pada top N berdasarkan rumus 2.4 dan 3.5. Tabel 3.3 Hasil perhitungan Deviation dan KDist dari tiap instance PCL PCL7 Dev vDev Kdist vKdist COF 1 7 1.00 13.55 0.90 11.31 0.77 2 7 1.00 13.32 0.89 11.17 0.73 3 7 1.00 12.90 0.86 10.38 0.47 4 7 1.00 14.19 0.95 11.60 0.87 5 7 1.00 13.66 0.91 10.97 0.66 6 2

0.29 0.50

0.00 10.53 0.52

7 2

0.29 0.50

0.00 9.81

0.28 8

3 0.43

0.77 0.02

8.96 0.01

9 3

0.43 0.76

0.02 8.93

0.00 10

3 0.43

1.48 0.07

8.95 0.01

11 5 0.71 14.70 0.98 11.35 0.78 12 7 1.00 14.32 0.95 11.74 0.91 13 5 0.71 14.98 1.00 12.01 1.00 Setelah menghitung nilai Deviation dan KDist dari tiap instance pada top N , tahap selanjutnya adalah menghitung COF Class Outlier Factor dari instance pada top N berdasarkan rumus 2.4. Kemudian meranking tiap instance pada list top N berdasarkan nilai COF terkecil. Tabel 3.4 Hasil perhitungan COF dari tiap instance PCL PCL7 Dev vDev Kdist vKdist COF 7 2.00 0.29

0.50 0.00

9.81 0.28

2.28 6 2.00

0.29 0.50

0.00 10.53 0.52

2.52 10 3.00

0.43 1.48

0.07 8.95

0.01 2.94

9 3.00 0.43

0.76 0.02

8.93 0.00

2.98 8 3.00

0.43 0.77

0.02 8.96

0.01 2.99

11 5.00 0.71 14.70 0.98 11.35 0.78 4.80 13 5.00 0.71 14.98 1.00 12.01 1.00 5.00 3 7.00 1.00 12.90 0.86 10.38 0.47 6.61 5 7.00 1.00 13.66 0.91 10.97 0.66 6.75 2 7.00 1.00 13.32 0.89 11.17 0.73 6.84 1 7.00 1.00 13.55 0.90 11.31 0.77 6.87 4 7.00 1.00 14.19 0.95 11.60 0.87 6.92 12 7.00 1.00 14.32 0.95 11.74 0.91 6.96 Dari tabel di 3.4, ditemukan instance yang menjadi outlier yaitu instance nomor 7, 6, 10, 9, dan 8. Dimana nasabah no. 7 dan 6 meminjam dengan jumlah cukup besar dibandingkan dengan tetangga terdekatnya dan menunggak sebanyak 6 kali. Sedangkan nasabah no. 10, 9, dan 8 mempunyai jumlah pinjaman yang terkecil tetapi mempunyai tunggakan sebanyak 4 – 5 kali.

Dokumen yang terkait

Deteksi outlier menggunakan Algoritma Local Outlier Probability : studi kasus data akademik mahasiswa Program Studi Teknik Informatika Universitas Sanata Dharma.

0 5 265

Deteksi outlier menggunakan Algoritma Connectivity Based Outlier Factor : studi kasus data akademik mahasiswa Teknik Informatika Universitas Sanata Dharma.

0 4 252

Deteksi outlier pada data campuran numerik dan kategorikal menggunakan algoritma Enhanced Class Outlier Distance Based (ECODB) : studi kasus data kredit BPR XYZ.

0 4 106

Deteksi Outlier menggunakan algoritma Block-Based Nested-Loop : studi kasus data akademik mahasiswa Program Studi Teknik Informatika Universitas Sanata Dharma.

0 2 202

Deteksi outlier menggunakan algoritma Block-based Nested Loop (studi kasus: data akademik mahasiswa prodi PS Universitas XYZ).

1 5 6

Deteksi outlier menggunakan algoritma Naive Nested Loop (studi kasus : data akademik mahasiswa program studi PS Universitas XYZ).

0 0 4

Deteksi outlier menggunakan Algoritma Connectivity Based Outlier Factor studi kasus data akademik mahasiswa Teknik Informatika Universitas Sanata Dharma

1 8 250

Deteksi outlier menggunakan Algoritma Local Outlier Probability studi kasus data akademik mahasiswa Program Studi Teknik Informatika Universitas Sanata Dharma

1 9 263

Penerapan metode enhanced class outlier distance based untuk identifikasi outlier pada data hasil ujian nasional, indeks integritas dan akreditasi sekolah menengah atas

1 6 143

Deteksi outlier menggunakan algoritma local outlier factor : studi kasus data akademik mahasiswa TI Universitas Sanata Dharma - USD Repository

0 0 241