Atribut ini berisi keterangan berapa kali debitur menunggak mengangsur bunga. Atribut ini bertipe numerik.
k. TUNG_POKOK Atribut ini berisi jumlah total kredit yang ditunggak oleh
debitur. Atribut ini bertipe numerik. l. TUNG_BUNGA
Atribut ini berisi jumlah total bunga yang ditunggak oleh debitur. Atribut ini bertipe numerik.
m. GAJIPENDAPATAN Atribut ini berisi jumlah gaji atau pendapatan debitur tiap
bulan. Atribut ini bertipe numerik. n. JML_TANGGUNGAN
Atribut ini berisi jumlah anggota keluarga yang ditanggung oleh debitur. Atribut ini bertipe numerik.
o. UANG_DIBAWA Atribut ini berisi jumlah nominal uang yang dibawa
pulangdiperoleh debitur setiap bulannya. Atribut ini bertipe numerik.
p. STATUS_PINJAMAN Atribut ini berisi keterangan apakah debitur saat mengajukan
kredit telah melakukan peminjaman kredit di bank lain atau tidak. Atribut ini bertipe kategorikal.
q. JML_SETORANBULAN
Atribut ini berisi besar jumlah setoran yang harus diangsur debitur di bank lain setiap bulannya jika debitur saat
mengajukan kredit telah melakukan peminjaman kredit di bank lain. Atribut ini bertipe numerik.
r. POKOK_BLN Atribut ini berisi jumlah kredit yang harus diangsur debitur
setiap bulan. Atribut ini bertipe numerik. s. BUNGA_BLN
Atribut ini berisi jumlah bunga yang harus diangsur debitur setiap bulan. Atribut ini bertipe numerik.
t. KOLBI1 Atribut ini adalah atribut yang digunakan untuk menyatakan
status kredit debitur. Dimana nilai 1 berarti debitur mengangsur dengan baik lancar, 2 berarti debitur sedikit
tersendat dalam mengangsur kurang lancar, 3 berarti debitur cukup tersendat dalam mengangsur kredit diragukan, dan 4
berarti debitur berhenti mengangsur macet. Atribut ini merupakan class label pada data debitur tersebut.
Gambar 4.1 Atribut pada data debitur setelah tahap seleksi data
2. Pengisian Missing Value
Di dalam dataset debitur yang telah mengalami seleksi atribut terdapat
missing value
pada kolom
GAJIPENDAPATAN, JML_TANGGUNGAN, UANG _DIBAWA, STATUS_PINJAMAN,
JML_SETORANBULAN, baris 1, 18, 37, 38, 42, 50, dan 96. Untuk mengatasi hal ini, kolom yang kosong akan diisi dengan means untuk data
dengan atribut numerik dan diisi dengan mode untuk data dengan atribut kategorikal Hewahi dan M. K. Saad, 2007. Hasil pengisian missing value
dapat dilihat di lampiran 3.
Gambar 4.2 Isi data debitur setelah tahap pengisian missing value
3. Normalisasi Data
Setelah mengisi missing value secara manual dengan teknik means
dan mode, dilakukan proses normalisasi atribut. Proses ini dilakukan karena adanya perbedaan range nilai dari tiap
– tiap atribut sehingga perlu dilakukan normalisasi agar data memiliki nilai yang
tepat dan sama untuk ditambang. Atribut – atribut tersebut akan
dinormalisasi agar mempunyai range nilai 0 - 1. Hasil normalisasi dapat dilihat di lampiran 4. Proses normalisasi menggunakan metode min-max
normalization sebagai berikut :
4.6 Dimana,
v’ : nilai yang sudah ternormalisasi v
: nilai lama yang belum ternormalisasi min
: nilai minimum dari suatu instance max
: nilai maksimum dari suatu instance NewMax
: nilai minimum baru dari suatu instance NewMin
: nilai maksimum baru dari suatu instance
Berikut contoh proses normalisasi data :
Tabel 4.1 Contoh atribut pada dataset debitur sebelum normalisasi
UMUR NOM_PINJ
SB JW
NJOP_NT POKOK_BLN
BUNGA_BLN 39
30,000,000 11.4
50 3,344,778
600,000 285,000
50 15,000,000
7.2 60
3,229,280 250,000
90,000 52
27,000,000 9.6
40 4,110,556
675,000 216,000
49 21,000,000
9.6 60
3,827,169 350,000
168,000
49 30,000,000
9.6 60
3,803,224 500,000
240,000 47
30,000,000 9.6
60 3,984,900
500,000 240,000
51 21,000,000
9.6 50
3,819,900 420,000
168,000
Tabel 4.2 Contoh atribut pada dataset debitur setelah normalisasi
vumur vnom_pinj
vsb vjw
vnjop_nt vpokok_bln
vbunga_bln
0.00 1.00 1.00 0.50
0.13 0.77
1.00 0.85
0.00 0.00 1.00 0.00
-0.31 0.00
1.00 0.80 0.57 0.00
1.00 1.00
0.65 0.77
0.40 0.57 1.00 0.68
0.00 0.40
0.77 1.00 0.57 1.00
0.65 0.46
0.77 0.62
1.00 0.57 1.00 0.86
0.46 0.77
0.92 0.40 0.57 0.50
0.67 0.22
0.40
C. Penambangan Data Dengan Microsoft Excel
Data yang telah mengalami pemrosesan akan ditambang berdasarkan algoritma ECODB. Penambangan data menggunakan Microsoft Excel. Rumus
algoritma ECODB akan diterapkan dalam bentuk formula Microsoft Excel.
1. Menormalisasi Data
Sebelum ditambang, data yang telah mengalami pemrosesan awal akan dinormalisasi terlebih dahulu. Proses normalisasi ini dilakukan
dengan tujuan membuat data memiliki nilai yang tepat dan sama untuk ditambang. Atribut
– atribut tersebut akan dinormalisasi agar mempunyai range
nilai 0 – 1. Proses normalisasi menggunakan metode min-max
normalization seperti pada rumus 4.6. Formula normalisasi dalam
Microsoft Excel adalah sebagai berikut : =cell1-mincellmaxcell-mincell1-0+0
Gambar 4.3 Contoh formula normalisasi data
2. Mencari Jarak Dari Tiap Data Dengan Menggunakan Fungsi Jarak Mixed Euclidian Distance
Setelah menormalisasi data, dicari jarak dari tiap data dengan menggunakan fungsi jarak mixed euclidian distance. Pada fungsi ini setiap
instance bertipe kategorikal akan diberi nilai 0 jika mempunyai kategori
yang sama dan diberi nilai 1 jika mempunyai kategori yang berbeda, sedangkan atribut numerik akan dihitung berdasarkan rumus 5. Formula
mencari jarak dalam Microsoft Excel adalah sebagai berikut : =SQRTIFcell1=cell2,0,12+cell3-cell42+cell5-
cell62+cell7-cell82+cell9- cell102+IFcell11=cell12,0,12+cell13-cell142+
cell15-cell162+cell17-cell182+cell19-cell202+ cell21-cell222+cell23-cell242+cell25-cell262+
cell27-cell282+cell29-cell302+cell31-cell322+ cell33-cell342+IFcell35=cell36,0,12+cell37-cell382
Gambar 4.4 Contoh formula mencari jarak 3. Menghitung PCL
PCLProbability of
Class Label
adalah nilai
probabilitasbanyaknya kemunculan class label yang sama dengan instance
T dibandingkan k tetangga terdekatnya. PCL dihitung dengan cara membagi jumlah tetangga terdekat instance T yang mempunyai class
label yang sama termasuk instance T sendiri dengan nilai k. Formula
menghitung PCL dalam Microsoft Excel adalah sebagai berikut : =cell1k
Gambar 4.5 Contoh formula menghitung PCL
4. Meranking List Top N Outlier Dari Instance Dengan Nilai PCLT,K
Terkecil
Setelah menghitung nilai PCL, data diranking secara kecil ke
besar berdasarkan nilai PCLT,K terkecil sesuai dengan masukan top N.
Top N adalah jumlah instances yang dideteksi sebagai outlier yang
diurutkan secara kecil ke besar. Misalkan masukan top N = 10, maka akan
diranking 10 instance dengan nilai PCLT,K terkecil. Untuk meranking instance
, digunakan fitur Sort Filter dalam Microsoft Excel.
Gambar 4.6 Contoh meranking kecil ke besar berdasarkan nilai PCLT,K
terkecil
5. Menghitung Nilai DeviationT¸ NormDeviationT, KdistT, Dan
NormKdistT
Kemudian instance yang berada di top N dihitung nilai DeviationT
¸ NormDeviationT
, KdistT
, dan
NormKdistT berdasarkan rumus 2.1, 2.2, dan 2.3. DeviationT adalah seberapa
besar nilai instance T yang menyimpang dari subset DCL. KDist adalah jarak antara instance T pada dataset D dengan K tetangga terdekat,
seberapa dekat nilai K instance tetangga terdekat dengan instance T. Sedangkan NormDeviationT adalah nilai deviation yang sudah
ternormalisasi dan NormKDistT adalah nilai KDist yang sudah
ternormalisasi. Formula menghitung DeviationT¸ NormDeviationT, KdistT
, dan NormKdistT dalam Microsoft Excel adalah sebagai berikut :
a. Mencari Deviation =cell1+cell2+cell3+...+celln
Gambar 4.7 Contoh formula menghitung Deviation
b. Mencari NormDeviationT =cell1-mincellmaxcell-mincell
Gambar 4.8 Contoh formula menghitung NormDeviationT
c. Mencari Kdist = cell1+cell2+cell3+...+celln
Gambar 4.9 Contoh formula menghitung Kdist
d. Mencari NormKDistT =cell1-mincellmaxcell-mincell
Gambar 4.10 Contoh formula menghitung NormKDistT
6. Menghitung Nilai COF Class Outlier Factor
Tahap selanjutnya adalah menghitung COF Class Outlier Factor
dari setiap instance yang berada di list top N. COF adalah derajat dari suatu instance T untuk dikategorikan sebagai outlier. COF dihitung
berdasarkan rumus 2.4. Formula menghitung COF dalam Microsoft Excel adalah sebagai berikut :
=kcell1-cell2+cell3
Gambar 4.11 Contoh formula menghitung COF Class Outlier Factor
7. Mengurutkan List Top N Secara Kecil Ke Besar Sesuai Nilai COF
Tahap terakhir adalah mengurutkan list top N secara kecil ke besar sesuai nilai COF. Misalkan masukan top N = 10, maka akan diranking 10
instance dengan nilai COF terkecil. Untuk meranking instance, digunakan
fitur Sort Filter dalam Microsoft Excel.
Gambar 4.12 Contoh meranking kecil ke besar berdasarkan nilai COF terkecil
D. Hasil Deteksi Outlier Berdasarkan Algoritma ECODB Dengan Microsoft
Excel
Hasil deteksi outlier berdasarkan algoritma ECODB menggunakan Microsoft Excel dengan masukan k dan top N yang berubah
– ubah dapat ditampilkan dalam bentuk tabel
– tabel di bawah. Dimana k adalah jumlah tetangga terdekat dari suatu instances, sedangkan top N adalah jumlah
instances yang dideteksi sebagai outlier yang diurutkan secara kecil ke besar
berdasarkan nilai COF Class Outlier Factor. COF adalah nilai probabilitasderajat sebuah instance dapat menjadi outlier. Outlier adalah data
dengan nilai COF terendah. Class outlier adalah instances yang mempunyai derajat tinggi sebagai outlier. Jumlah class outlier ditentukan berdasarkan
masukan top N, jika top N = 10 maka akan ada 10 instances yang yang mempunyai derajat tinggi sebagai outlier.
Tabel 4.3
Hasil deteksi outlier dengan masukan k dan top N yang berubah – ubah
k Top N
Min COF 7
10 36, 92, 53, 96, 39, 64, 56, 24, 23, 37
20 36, 92, 53, 96, 65, 39, 64, 73, 97, 56, 24, 23, 88, 69,
87, 37, 27, 26, 25, 38 30
36, 92, 53, 96, 65, 39, 64, 73, 97, 56, 24, 23, 88, 69, 87, 37, 90, 27, 26, 25, 38, 55, 84, 63, 83, 15,, 70,
41, 1, 42
40 36, 92, 53, 96, 65, 39, 64, 73, 97, 56, 24, 23, 88, 69,
87, 37, 90, 27, 26, 25, 38, 55, 84, 63, 83, 15, 70, 41, 1, 42, 13, 46, 14, 33, 45, 60, 30, 44, 49, 32
50 36, 39, 53, 92, 96, 23, 24, 37, 56, 64, 65, 69, 73, 87,
88, 97, 25, 26, 27, 38, 55, 90, 42, 1, 15, 41, 63,70, 83,84, 13, 14, 30, 32, 33, 44, 45, 46, 49, 60, 61, 77,
80, 81, 82, 91, 94, 95, 2, 3
17 10
36,53, 39, 73, 64, 24, 56, 23, 69, 37 20
36, 53, 39, 92, 73, 64, 94, 97, 24, 56, 88, 23, 69, 87, 37, 96, 38, 55, 25, 26
30 36, 53, 39, 92, 73, 64, 94, 97, 24, 56, 88, 23, 69, 87,
37, 96, 38, 55, 27, 25, 26, 42, 65, 90, 17, 18, 13, 15, 11, 14
40 36, 53, 39, 92, 73, 64, 94, 97, 24, 56, 88, 23, 69, 87,
37, 96, 38, 55, 27, 25, 26, 42, 65, 90, 17, 18, 13, 15, 82, 70, 11, 14, 80, 19, 45, 12, 41, 16, 75, 1
50 36, 53, 39, 92, 73, 64, 94, 97, 24, 56, 88, 23, 69, 87,
37, 96, 38, 55, 27, 25, 26, 42, 65, 90, 17, 18, 13, 15, 82, 70, 11, 14, 80, 19, 45, 12, 41, 16, 75, 1, 83, 50,
81, 31, 52, 34, 84, 28, 29, 35
27 10
36, 53, 92, 64, 73, 94, 97, 24, 37, 39 20
36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87, 96, 38, 55, 25, 26, 42
30 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87,
96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 13, 14, 15, 16
40 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87,
96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 18, 13, 14, 15, 16, 91, 8, 70, 19, 10, 2, 28, 12, 1
50 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87,
96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 18, 13, 14, 15, 16, 91, 8, 70, 19, 10, 2, 50, 63, 31, 34, 59,
41, 45, 48, 28, 29, 35, 12, 1
37 10
36, 53, 92, 64, 73, 94, 97, 24, 37, 39 20
36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87, 96, 38, 55, 25, 26, 42
30 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87,
96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 13, 14, 15, 16
40 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87,
96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 18, 13,
14, 15, 16, 91, 8, 70, 19, 10, 2, 28, 12, 1 50
36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87, 96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 18, 13,
14, 15, 16, 91, 8, 70, 19, 10, 2, 50, 63, 31, 34, 59, 41, 45, 48, 28, 29, 35, 12, 1
47 10
94, 97, 36, 88, 37, 96, 53, 38, 39, 42 20
94, 97, 36, 88, 37, 96, 64, 53, 56, 69, 87, 38, 39, 42, 92, 73, 23, 24, 55, 25
30 94, 97, 36, 88, 37, 96, 64, 53, 56, 69, 87, 38, 39, 42,
92, 73, 23, 24, 55, 27, 25, 26, 65, 90, 45, 76, 80, 82, 91, 43
40 94, 97, 36, 88, 37, 96, 64, 53, 56, 69, 87, 38, 39, 42,
92, 73, 23, 24, 55, 27, 25, 26, 65, 90, 45, 76, 80, 82, 91, 43, 51, 83, 66, 70, 18, 14, 16, 3, 11, 12
50 94, 97, 36, 88, 37, 96, 64, 53, 56, 69, 87, 38, 39, 42,
92, 73, 23, 24, 55, 27, 25, 26, 65, 90, 45, 76, 80, 82, 91, 43, 51, 83, 66, 70, 18, 14, 16, 63, 71, 62, 34, 44,
49, 60, 35, 3, 17, 11, 12, 19
COF adalah nilai probabilitasderajat sebuah instance dapat menjadi outlier. Outlier adalah data dengan nilai COF terendah. Class outlier
adalah instances yang mempunyai derajat tinggi sebagai outlier. Untuk dapat mengetahui pengaruh k dan top N dalam proses deteksi outlier menggunakan
algoritma ECODB, dapat dilihat dari perubahan nilai COF berdasarkan masukan k dan top N yang berubah
– ubah. Karena nilai COF bergantung pada masukan top N, maka untuk
memudahkan perbandingan dari hasil deteksi, nilai COF ditampilkan dalam bentuk rata
– ratameans. Kolom min COF dan max COF dapat digunakan untuk melihat seberapa jauh jarak nilai means terhadap min COF dan max
COF . Dari tabel 4.8, dapat dilihat bahwa semakin tinggi nilai masukan k dan
top N , maka semakin tinggi pula nilai COF.
Tabel 4.4 Nilai rata
– rata COF berdasarkan masukan k dan top N yang berubah - ubah
k Top N
Min COF
Max COF
Means COF
7 10
0.99 2.84
1.77 20
0.99 3.14
2.06 30
0.99 4.81
2.78 40
0.99 5.55
3.445 50
0.99 6.22
3.89
17 10
2.39 5.7
4.15 20
2.39 9.95
5.6 30
2.39 33.62
12.69 40
2.39 35.93
18.31 50
2.39 38.43
21.89
27 10
3.82 8.56
6.8 20
3.82 16.31
10.13 30
3.82 84.47
31.71 40
3.82 92.06
46.02 50
3.82 92.15
55.23
37 10
10.53 16.39
14.01 20
10.53 26.66
18.51 30
10.53 163.44
59.07 40
10.53 168.64
85.81 50
10.53 168.72
102.38
47 10
13.53 27.73
22.53 20
13.53 33.78
26.44 30
13.53 254.62
93.35 40
13.53 261.42
135.35 50
13.53 268.13
161.76
COF adalah nilai probabilitasderajat sebuah instance dapat menjadi outlier
. Outlier adalah data dengan nilai COF terendah. Nilai COF dan class outlier
dengan masukan k = 7 dan top N yang berubah – ubah dapat
ditampilkan dalam tabel sebagai berikut :
Tabel 4.5 Nilai COF dengan k = 7 dan top N = 10
Class PCL COF 36
3 1
0.99 92
3 1
1.04 53
2 1
1.08 96
4 1
1.38 39
3 1
1.58 64
2 2
2.03 56
3 2
2.12 24
2 2
2.13 23
2 2
2.14 37
4 2
2.44
Tabel 4.6 Nilai COF dengan k = 7 dan top N = 20
Class
PCL COF
36 3
1 0.99
92 3
1 1.04
53 2
1 1.08
96 4
1 1.38
65 1
2 1.44
39 3
1 1.58
64 2
2 2.03
73 2
2 2.03
97 3
2 2.11
56 3
2 2.12
24 2
2 2.13
23 2
2 2.14
88 3
2 2.14
69 2
2 2.17
87 2
2 2.18
37 4
2 2.44
27 3
3 3.12
26 3
3 3.13
25 3
3 3.14
38 4
3 3.5
Tabel 4.7 Nilai COF dengan k = 7 dan top N = 30
Class
PCL COF
36 3
1 0.99
92 3
1 1.04
53 2
1 1.08
96 4
1 1.38
65 1
2 1.44
39 3
1 1.58
64 2
2 2.03
73 2
2 2.03
97 3
2 2.11
56 3
2 2.12
24 2
2 2.13
23 2
2 2.14
88 3
2 2.14
69 2
2 2.17
87 2
2 2.18
37 4
2 2.44
90 1
3 2.49
27 3
3 3.12
26 3
3 3.13
25 3
3 3.14
38 4
3 3.5
55 3
3 3.84
84 1
5 4.44
63 1
5 4.45
83 1
5 4.45
15 1
5 4.47
70 1
5 4.48
41 1
5 4.52
1 1
5 4.6
42 4
4 4.81
Tabel 4.8 Nilai COF dengan k = 7 dan top N = 40
Class
PCL COF
36 3
1 0.99
92 3
1 1.04
53 2
1 1.08
96 4
1 1.38
65 1
2 1.44
39 3
1 1.58
64 2
2 2.03
73 2
2 2.03
97 3
2 2.11
56 3
2 2.12
24 2
2 2.13
23 2
2 2.14
88 3
2 2.14
69 2
2 2.17
87 2
2 2.18
37 4
2 2.44
90 1
3 2.49
27 3
3 3.12
26 3
3 3.13
25 3
3 3.14
38 4
3 3.5
55 3
3 3.84
84 1
5 4.44
63 1
5 4.45
83 1
5 4.45
15 1
5 4.47
70 1
5 4.48
41 1
5 4.52
1 1
5 4.6
42 4
4 4.81
13 1
6 5.44
46 1
6 5.44
14 1
6 5.45
33 1
6 5.47
45 1
6 5.47
60 1
6 5.47
30 1
6 5.49
44 1
6 5.49
49 1
6 5.49
32 1
6 5.55
Tabel 4.9 Nilai COF dengan k = 7 dan top N = 50
Class
PCL COF
36 3
1 0.99
39 3
1 1.58
53 2
1 1.08
92 3
1 1.04
96 4
1 1.38
23 2
2 2.14
24 2
2 2.13
37 4
2 2.44
56 3
2 2.12
64 2
2 2.03
65 1
2 1.44
69 2
2 2.17
73 2
2 2.03
87 2
2 2.18
88 3
2 2.14
97 3
2 2.11
25 3
3 3.14
26 3
3 3.13
27 3
3 3.12
38 4
3 3.5
55 3
3 3.84
90 1
3 2.49
42 4
4 4.81
1 1
5 4.6
15 1
5 4.47
41 1
5 4.52
63 1
5 4.45
70 1
5 4.48
83 1
5 4.45
84 1
5 4.44
13 1
6 5.44
14 1
6 5.45
30 1
6 5.49
32 1
6 5.55
33 1
6 5.47
44 1
6 5.49
45 1
6 5.47
46 1
6 5.44
49 1
6 5.49
60 1
6 5.47
61 1
6 5.42
77 1
6 5.44
80 1
6 5.46
81 1
6 5.46
82 1
6 5.47
91 1
6 5.46
94 3
6 5.54
95 1
6 5.54
2 1
7 6.22
3 1
7 6.16
Nilai COF dengan masukan k = 17 dan top N yang berubah – ubah
dapat ditampikan dalam tabel sebagai berikut :
Tabel 4.10 Nilai COF dengan k = 17 dan top N = 10
Class
PCL COF
36 3
1 2.38
53 2
1 2.52
39 3
1 2.98
73 2
2 4.91
64 2
2 4.92
24 2
2 5.06
56 3
2 5.06
23 2
2 5.08
69 2
2 5.12
37 4
2 5.3
Tabel 4.11 Nilai COF dengan k = 17 dan top N = 20
Class
PCL COF
36 3
1 2.38
53 2
1 2.52
39 3
1 2.98
92 3
2 4.89
73 2
2 4.91
64 2
2 4.92
94 3
2 4.93
97 3
2 4.97
24 2
2 5.06
56 3
2 5.06
88 3
2 5.06
23 2
2 5.08
69 2
2 5.12
87 2
2 5.12
37 4
2 5.3
96 4
3 7.74
38 4
3 7.81
55 3
3 8.11
25 3
4 9.94
26 3
4 9.94
Tabel 4.12 Nilai COF dengan k = 17 dan top N = 30
Class
PCL COF
36 3
1 2.38
53 2
1 2.52
39 3
1 2.98
92 3
2 4.89
73 2
2 4.91
64 2
2 4.92
94 3
2 4.93
97 3
2 4.97
24 2
2 5.06
56 3
2 5.06
88 3
2 5.06
23 2
2 5.08
69 2
2 5.12
87 2
2 5.12
37 4
2 5.3
96 4
3 7.74
38 4
3 7.81
55 3
3 8.11
27 3
4 9.92
25 3
4 9.94
26 3
4 9.94
42 4
4 10.57
65 1
9 21.4
90 1
10 23.86
17 1
11 26.21
18 1
11 26.22
13 1
12 28.7
15 1
12 28.72
11 1
13 31.07
14 1
13 31.13
Tabel 4.13 Nilai COF dengan k = 17 dan top N = 40
Class
PCL COF
36 3
1 2.38
53 2
1 2.52
39 3
1 2.98
92 3
2 4.89
73 2
2 4.91
64 2
2 4.92
94 3
2 4.93
97 3
2 4.97
24 2
2 5.06
56 3
2 5.06
88 3
2 5.06
23 2
2 5.08
69 2
2 5.12
87 2
2 5.12
37 4
2 5.3
96 4
3 7.74
38 4
3 7.81
55 3
3 8.11
27 3
4 9.92
25 3
4 9.94
26 3
4 9.94
42 4
4 10.57
65 1
9 21.4
90 1
10 23.86
17 1
11 26.21
18 1
11 26.22
13 1
12 28.7
15 1
12 28.72
82 1
13 31.04
70 1
13 31.06
11 1
13 31.07
14 1
13 31.13
80 1
14 33.47
19 1
14 33.49
45 1
14 33.49
12 1
14 33.5
41 1
14 33.51
16 1
14 33.53
75 1
14 33.61
1 1
14 33.62
Tabel 4.14 Nilai COF dengan k = 17 dan top N = 50
Class
PCL COF
36 3
1 2.38
53 2
1 2.52
39 3
1 2.98
92 3
2 4.89
73 2
2 4.91
64 2
2 4.92
94 3
2 4.93
97 3
2 4.97
24 2
2 5.06
56 3
2 5.06
88 3
2 5.06
23 2
2 5.08
69 2
2 5.12
87 2
2 5.12
37 4
2 5.3
96 4
3 7.74
38 4
3 7.81
55 3
3 8.11
27 3
4 9.92
25 3
4 9.94
26 3
4 9.94
42 4
4 10.57
65 1
9 21.4
90 1
10 23.86
17 1
11 26.21
18 1
11 26.22
13 1
12 28.7
15 1
12 28.72
82 1
13 31.04
70 1
13 31.06
11 1
13 31.07
14 1
13 31.13
80 1
14 33.47
19 1
14 33.49
45 1
14 33.49
12 1
14 33.5
41 1
14 33.51
16 1
14 33.53
75 1
14 33.61
1 1
14 33.62
83 1
15 35.89
50 1
15 35.9
81 1
15 35.9
31 1
15 35.91
52 1
15 35.91
34 1
15 35.92
84 1
15 35.92
28 1
15 35.93
29 1
15 35.93
35 1
15 35.95
Dengan masukan k = 27 dan top N yang berubah – ubah, nilai COF
dapat ditampikan dalam tabel sebagai berikut :
Tabel 4.15 Nilai COF dengan k = 27 dan top N = 10
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
Tabel 4.16
Nilai COF dengan k = 27 dan top N = 20
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
88 3
3 11.77
23 2
3 11.81
69 2
3 11.84
87 2
3 11.85
96 4
3 12.03
38 4
3 12.09
55 3
3 12.4
25 3
4 15.67
26 3
4 15.67
42 4
4 16.31
Tabel 4.17 Nilai COF dengan k = 27 dan top N = 30
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
88 3
3 11.77
23 2
3 11.81
69 2
3 11.84
87 2
3 11.85
96 4
3 12.03
38 4
3 12.09
55 3
3 12.4
56 3
4 15.63
25 3
4 15.67
26 3
4 15.67
42 4
4 16.31
27 3
5 19.51
65 1
17 65.13
90 1
19 72.86
17 1
21 80.56
11 1
21 80.57
13 1
21 80.6
14 1
21 80.61
15 1
21 80.61
16 1
21 80.61
Tabel 4.18 Nilai COF dengan k = 27 dan top N = 40
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
88 3
3 11.77
23 2
3 11.81
69 2
3 11.84
87 2
3 11.85
96 4
3 12.03
38 4
3 12.09
55 3
3 12.4
56 3
4 15.63
25 3
4 15.67
26 3
4 15.67
42 4
4 16.31
27 3
5 19.51
65 1
17 65.13
90 1
19 72.86
17 1
21 80.56
11 1
21 80.57
18 1
21 80.57
13 1
21 80.6
14 1
21 80.61
15 1
21 80.61
16 1
21 80.61
91 1
22 84.35
8 1
22 84.36
70 1
22 84.36
19 1
22 84.42
10 1
23 87.91
2 1
23 88.19
28 1
23 88.23
12 1
23 88.28
1 1
23 88.35
Tabel 4.19 Nilai COF dengan k = 27 dan top N = 50
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
88 3
3 11.77
23 2
3 11.81
69 2
3 11.84
87 2
3 11.85
96 4
3 12.03
38 4
3 12.09
55 3
3 12.4
56 3
4 15.63
25 3
4 15.67
26 3
4 15.67
42 4
4 16.31
27 3
5 19.51
65 1
17 65.13
90 1
19 72.86
17 1
21 80.56
11 1
21 80.57
18 1
21 80.57
13 1
21 80.6
14 1
21 80.61
15 1
21 80.61
16 1
21 80.61
91 1
22 84.35
8 1
22 84.36
70 1
22 84.36
19 1
22 84.42
10 1
23 87.91
2 1
23 88.19
50 1
23 88.19
63 1
23 88.19
31 1
23 88.21
34 1
23 88.21
59 1
23 88.21
41 1
23 88.22
45 1
23 88.22
48 1
23 88.22
28 1
23 88.23
29 1
23 88.23
35 1
23 88.24
12 1
23 88.28
1 1
23 88.35
Dengan masukan k = 37 dan top N yang berubah – ubah, nilai COF
dapat ditampikan dalam tabel sebagai berikut :
Tabel 4.20 Nilai COF dengan k = 37 dan top N = 10
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
Tabel 4.21 Nilai COF dengan k = 37 dan top N = 20
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
88 3
3 11.77
23 2
3 11.81
69 2
3 11.84
87 2
3 11.85
96 4
3 12.03
38 4
3 12.09
55 3
3 12.4
25 3
4 15.67
26 3
4 15.67
42 4
4 16.31
Tabel 4.22 Nilai COF dengan k = 37 dan top N = 30
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
88 3
3 11.77
23 2
3 11.81
69 2
3 11.84
87 2
3 11.85
96 4
3 12.03
38 4
3 12.09
55 3
3 12.4
56 3
4 15.63
25 3
4 15.67
26 3
4 15.67
42 4
4 16.31
27 3
5 19.51
65 1
17 65.13
90 1
19 72.86
17 1
21 80.56
11 1
21 80.57
13 1
21 80.6
14 1
21 80.61
15 1
21 80.61
16 1
21 80.61
Tabel 4.23 Nilai COF dengan k = 37 dan top N = 40
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
88 3
3 11.77
23 2
3 11.81
69 2
3 11.84
87 2
3 11.85
96 4
3 12.03
38 4
3 12.09
55 3
3 12.4
56 3
4 15.63
25 3
4 15.67
26 3
4 15.67
42 4
4 16.31
27 3
5 19.51
65 1
17 65.13
90 1
19 72.86
17 1
21 80.56
11 1
21 80.57
18 1
21 80.57
13 1
21 80.6
14 1
21 80.61
15 1
21 80.61
16 1
21 80.61
91 1
22 84.35
8 1
22 84.36
70 1
22 84.36
19 1
22 84.42
10 1
23 87.91
2 1
23 88.19
28 1
23 88.23
12 1
23 88.28
1 1
23 88.35
Tabel 4.24
Nilai COF dengan k = 37 dan top N = 50
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
88 3
3 11.77
23 2
3 11.81
69 2
3 11.84
87 2
3 11.85
96 4
3 12.03
38 4
3 12.09
55 3
3 12.4
56 3
4 15.63
25 3
4 15.67
26 3
4 15.67
42 4
4 16.31
27 3
5 19.51
65 1
17 65.13
90 1
19 72.86
17 1
21 80.56
11 1
21 80.57
18 1
21 80.57
13 1
21 80.6
14 1
21 80.61
15 1
21 80.61
16 1
21 80.61
91 1
22 84.35
8 1
22 84.36
70 1
22 84.36
19 1
22 84.42
10 1
23 87.91
2 1
23 88.19
50 1
23 88.19
63 1
23 88.19
31 1
23 88.21
34 1
23 88.21
59 1
23 88.21
41 1
23 88.22
45 1
23 88.22
48 1
23 88.22
28 1
23 88.23
29 1
23 88.23
35 1
23 88.24
12 1
23 88.28
1 1
23 88.35
Berdasarkan masukan k = 47 dan top N yang berubah – ubah, nilai
COF dapat ditampikan dalam tabel sebagai berikut :
Tabel 4.25 Nilai COF dengan k = 47 dan top N = 10
Class
PCL COF
94 3
2 13.48
97 3
2 13.52
36 3
3 20.08
88 3
3 20.27
37 4
3 20.54
96 4
3 20.55
53 2
4 26.93
38 4
4 27.34
39 3
4 27.36
42 4
4 27.73
Tabel 4.26 Nilai COF dengan k = 47 dan top N = 20
Class
PCL COF
94 3
2 13.48
97 3
2 13.52
36 3
3 20.08
88 3
3 20.27
37 4
3 20.54
96 4
3 20.55
64 2
4 26.91
53 2
4 26.93
56 3
4 27
69 2
4 27.07
87 2
4 27.07
38 4
4 27.34
39 3
4 27.36
42 4
4 27.73
92 3
5 33.6
73 2
5 33.63
23 2
5
33.73
24 2
5
33.74
55 3
5 34.4
25 3
6
40.48
Tabel 4.27
Nilai COF dengan k = 47 dan top N = 30
Class
PCL COF
94 3
2 13.48
97 3
2 13.52
36 3
3 20.08
88 3
3 20.27
37 4
3 20.54
96 4
3 20.55
64 2
4 26.91
53 2
4 26.93
56 3
4 27
69 2
4 27.07
87 2
4 27.07
38 4
4 27.34
39 3
4 27.36
42 4
4 27.73
92 3
5 33.6
73 2
5 33.63
23 2
5
33.73
24 2
5
33.74
55 3
5 34.4
27 3
6
40.44
25 3
6
40.48
26 3
6
40.48
65 1
33 221.06
90 1
34 227.79
45 1
36 241.19
76 1
37 247.9
80 1
37 247.9
82 1
37 247.9
91 1
37 247.9
43 1
37 247.91
Tabel 4.28 Nilai COF dengan k = 47 dan top N = 40
Class
PCL COF
94 3
2 13.48
97 3
2 13.52
36 3
3 20.08
88 3
3 20.27
37 4
3 20.54
96 4
3 20.55
64 2
4 26.91
53 2
4 26.93
56 3
4 27
69 2
4 27.07
87 2
4 27.07
38 4
4 27.34
39 3
4 27.36
42 4
4 27.73
92 3
5 33.6
73 2
5 33.63
23 2
5
33.73
24 2
5
33.74
55 3
5 34.4
27 3
6
40.44
25 3
6
40.48
26 3
6
40.48
65 1
33 221.06
90 1
34 227.79
45 1
36 241.19
76 1
37 247.9
80 1
37 247.9
82 1
37 247.9
91 1
37 247.9
43 1
37 247.91
51 1
38 254.61
83 1
38 254.61
66 1
38 254.62
70 1
38 254.62
18 1
38
254.69
14 1
38
254.71
16 1
38
254.75
3 1
39 261.39
11 1
39 261.41
12 1
39
261.41
Tabel 4.29 Nilai COF dengan k = 47 dan top N = 50
Class
PCL COF
94 3
2 13.48
97 3
2 13.52
36 3
3 20.08
88 3
3 20.27
37 4
3 20.54
96 4
3 20.55
64 2
4 26.91
53 2
4 26.93
56 3
4 27
69 2
4 27.07
87 2
4 27.07
38 4
4 27.34
39 3
4 27.36
42 4
4 27.73
92 3
5 33.6
73 2
5 33.63
23 2
5
33.73
24 2
5
33.74
55 3
5 34.4
27 3
6
40.44
25 3
6
40.48
26 3
6
40.48
65 1
33 221.06
90 1
34 227.79
45 1
36 241.19
76 1
37 247.9
80 1
37 247.9
82 1
37 247.9
91 1
37 247.9
43 1
37 247.91
51 1
38 254.61
83 1
38 254.61
66 1
38 254.62
70 1
38 254.62
18 1
38
254.69
14 1
38
254.71
16 1
38
254.75
63 1
39 261.32
71 1
39 261.32
62 1
39 261.33
34 1
39 261.34
44 1
39 261.34
49 1
39 261.34
60 1
39 261.34
35 1
39 261.36
3 1
39 261.39
17 1
39
261.4
11 1
39 261.41
12 1
39
261.41
19 1
39
261.41
E. Kesimpulan Hasil Percobaan Perhitungan Dengan Masukan K dan Top N
Yang Berubah - Ubah
Dari hasil percobaan perhitungan dengan masukan k dan top N yang tertera pada tabel di atas, dapat disimpulkan sebagai berikut :
1. Berdasarkan percobaan perhitungan menggunakan algoritma
ECODB, dapat diketahui bahwa semakin besar nilai k, semakin tinggi pula nilai COF. Hal ini dikarenakan bertambahnya jumlah
tetangga terdekat dari tiap instance yang kemudian membuat nilai Kdist bertambah.
2. Berdasarkan percobaan perhitungan menggunakan algoritma
ECODB dengan masukan k dan top n yang berbeda – beda, dapat
diketahui bahwa penentuan nilai k dan top n bergantung pada
besarnya dataset, jumlah class label dan distribusi kelas. Semakin besar dataset dan jumlah class label, semakin besar pula
masukan nilai k dan top n untuk mendapatkan hasil deteksi yang optimal.
3. Nilai k yang terlalu kecil akan menyebabkan tahap pengelompokan data berdasarkan tetangga terdekat menjadi tidak
optimal. Data yang termasuk tetangga terdekat suatu instances dapat ‘terbuang’ dari kelompoknya. Sedangkan nilai k yang
terlalu besar akan menyebabkan data luar menjadi satu kelompok dengan suatu instances.
4. Nilai top N yang terlalu kecil akan menyebabkan data yang mempunyai derajat tinggi sebagai outlier tidak terdeteksi sebagai
class outlier . Sedangkan nilai top N yang terlalu besar akan
menyebabkan data yang bukan outlier ikut terdeteksi sebagai outlier
.
F.
Kesimpulan Hasil Pengujian Review dan Validitas oleh Pengguna
Berdasarkan hasil pengujian hasil percobaan perhitungan pada data yang kerap muncul sebagai outlier pada masukan k dan top N yang berbeda
– beda dan hasil analisa menurut pengguna petugas BPR XYZ, dapat
disimpulkan bahwa : 1. Debitur 36 dinyatakan sebagai outlier karena memiliki
tunggakan pokok yang cukup besar padahal mempunyai jaminan tanah senilai Rp 12.000.000,- dan pendapatan yang cukup besar
yakni Rp 11.400.000,-. Jumlah tanggungan keluarga debitur juga kecil yaitu 1 orang. Debitur sebelumnya pernah
mengajukan kredit di BPR XYZ sebanyak 3 kali dan mampu mengangsur kredit dengan lunas. Debitur 36 mengajukan kredit
sebesar Rp 6.000.000,- dan tidak sedang mengangsur kredit di bank lain.
2. Debitur 92 dinyatakan sebagai outlier karena memiliki tunggakan pokok yang besar padahal mempunyai jaminan tanah
senilai Rp 40.000.000,- dan pendapatan yang relatif besar yakni Rp 8.937.500,-. Jumlah tanggungan keluarga debitur 92
sebanyak 2 orang. Debitur 92 mengajukan kredit sebesar Rp 20.000.000,- dan tidak sedang mengangsur kredit di bank lain.
3. Debitur 53 dinyatakan sebagai outlier karena memiliki tunggakan pokok yang besar padahal mempunyai jaminan tanah
senilai Rp 40.000.000,- dan pendapatan yang cukup besar yakni Rp 16.600.000,-. Debitur sebelumnya pernah mengajukan kredit
di BPR XYZ sebanyak 1 kali dan mampu mengangsur kredit dengan lunas. Debitur 53 mengajukan kredit sebesar Rp
20.000.000,- dan tidak sedang mengangsur kredit di bank lain. 4. Debitur 73 dinyatakan sebagai outlier karena memiliki
tunggakan pokok yang besar padahal mempunyai jaminan tanah senilai Rp 14.000.000,- dan pendapatan yang besar yakni Rp
24.000.000,-. Debitur sebelumnya pernah mengajukan kredit di
BPR XYZ sebanyak 1 kali dan mampu mengangsur kredit dengan lunas. Debitur 73 mengajukan kredit sebesar Rp
7.000.000,- dan tidak sedang mengangsur kredit di bank lain. 5. Debitur 96 dinyatakan sebagai outlier karena memiliki
tunggakan bunga yang besar sebanyak 55 kali padahal mempunyai jaminan BPKB senilai Rp 26.000.000,- dan
pendapatan yang besar yakni Rp 10.500.000,-. Jumlah tanggungan keluarga debitur 96 sebanyak 2 orang. Debitur 96
mengajukan kredit sebesar Rp 13.000.000,- dan tidak sedang mengangsur kredit di bank lain.
6. Debitur 39 dinyatakan sebagai outlier karena memiliki tunggakan pokok yang besar padahal mempunyai jaminan tanah
senilai Rp 70.750.000,- dan pendapatan yang besar yakni Rp 139.520.000,-. Debitur sebelumnya pernah mengajukan kredit di
BPR XYZ sebanyak 3 kali dan mampu mengangsur kredit dengan lunas. Jumlah tanggungan keluarga debitur 39 sebanyak
3 orang. Debitur 39 mengajukan kredit sebesar Rp 50.000.000,-. 7. Debitur 64 dinyatakan sebagai outlier karena memiliki
tunggakan pokok cukup besar padahal mempunyai jaminan tanah senilai Rp 48.000.000,- dan pendapatan yang besar yakni
Rp 34.400.000,-. Debitur sebelumnya pernah mengajukan kredit di BPR XYZ sebanyak 1 kali dan mampu mengangsur kredit
dengan lunas. Debitur 64 mengajukan kredit sebesar Rp 24.000.000,- dan tidak sedang mengangsur kredit di bank lain.
8. Debitur 24 dinyatakan sebagai outlier karena memiliki tunggakan pokok dan tunggakan bunga yang besar padahal
mempunyai gaji tetap setiap bulan yang relatif besar yakni Rp 2.096.299,- dan jangka waktu mengangsur yang lama yaitu 40
bulan. Debitur 24 mengajukan kredit sebesar Rp 10.000.000,- dan tidak sedang mengangsur kredit di bank lain. Debitur
– debitur lain yang berprofesi sebagai pegawai dan mempunyai
gaji yang hampir sama cenderung mampu melunasi kredit bahkan untuk jumlah kredit yang lebih tinggi.
9. Debitur 23 dinyatakan sebagai outlier karena memiliki tunggakan pokok dan tunggakan bunga yang besar padahal
mempunyai gaji tetap setiap bulan yang relatif besar gaji tetap setiap bulan yang relatif besar yakni Rp 3.043.672,- dan jangka
waktu mengangsur yang lama yaitu 40 bulan. Debitur 23 mengajukan kredit sebesar Rp 10.000.000,- dan tidak sedang
mengangsur kredit di bank lain. Debitur – debitur lain yang
berprofesi sebagai pegawai dan mempunyai gaji yang hampir sama cenderung mampu melunasi kredit bahkan untuk jumlah
kredit yang lebih tinggi. 10. Debitur 37 dinyatakan sebagai outlier karena memiliki
tunggakan pokok yang sangat besar padahal mempunyai