Atribut ini berisi keterangan berapa kali debitur menunggak mengangsur bunga. Atribut ini bertipe numerik.
k. TUNG_POKOK
Atribut ini berisi jumlah total kredit yang ditunggak oleh debitur. Atribut ini bertipe numerik.
l. TUNG_BUNGA
Atribut ini berisi jumlah total bunga yang ditunggak oleh debitur. Atribut ini bertipe numerik.
m. GAJIPENDAPATAN
Atribut ini berisi jumlah gaji atau pendapatan debitur tiap bulan. Atribut ini bertipe numerik.
n. JML_TANGGUNGAN
Atribut ini berisi jumlah anggota keluarga yang ditanggung oleh debitur. Atribut ini bertipe numerik.
o. UANG_DIBAWA
Atribut ini berisi jumlah nominal uang yang dibawa pulangdiperoleh debitur setiap bulannya. Atribut ini bertipe
numerik. p.
STATUS_PINJAMAN Atribut ini berisi keterangan apakah debitur saat mengajukan
kredit telah melakukan peminjaman kredit di bank lain atau tidak. Atribut ini bertipe kategorikal.
q. JML_SETORANBULAN
Atribut ini berisi besar jumlah setoran yang harus diangsur debitur di bank lain setiap bulannya jika debitur saat
mengajukan kredit telah melakukan peminjaman kredit di bank lain. Atribut ini bertipe numerik.
r. POKOK_BLN
Atribut ini berisi jumlah kredit yang harus diangsur debitur setiap bulan. Atribut ini bertipe numerik.
s. BUNGA_BLN
Atribut ini berisi jumlah bunga yang harus diangsur debitur setiap bulan. Atribut ini bertipe numerik.
t. KOLBI1
Atribut ini adalah atribut yang digunakan untuk menyatakan status kredit debitur. Dimana nilai 1 berarti debitur
mengangsur dengan baik lancar, 2 berarti debitur sedikit tersendat dalam mengangsur kurang lancar, 3 berarti debitur
cukup tersendat dalam mengangsur kredit diragukan, dan 4 berarti debitur berhenti mengangsur macet. Atribut ini
merupakan
class label
pada data debitur tersebut.
Gambar 4.1 Atribut pada data debitur setelah tahap seleksi data 2. Pengisian
Missing Value
Di dalam
data set
debitur yang telah mengalami seleksi atribut terdapat
missing value
pada kolom
GAJIPENDAPATAN, JML_TANGGUNGAN, UANG _DIBAWA, STATUS_PINJAMAN,
JML_SETORANBULAN, baris 1, 18, 37, 38, 42, 50, dan 96. Untuk mengatasi hal ini, kolom yang kosong akan diisi dengan
means
untuk data dengan atribut numerik dan diisi dengan
mode
untuk data dengan atribut kategorikal Hewahi dan M. K. Saad, 2007. Hasil pengisian
missing value
dapat dilihat di lampiran 3.
Gambar 4.2 Isi data debitur setelah tahap pengisian
missing value
3. Normalisasi Data
Setelah mengisi
missing value
secara manual dengan teknik
means
dan
mode
, dilakukan proses normalisasi atribut. Proses ini dilakukan karena adanya perbedaan
range
nilai dari tiap – tiap atribut
sehingga perlu dilakukan normalisasi agar data memiliki nilai yang tepat dan sama untuk ditambang. Atribut
– atribut tersebut akan dinormalisasi agar mempunyai
range
nilai 0 - 1. Hasil normalisasi dapat dilihat di lampiran 4. Proses normalisasi menggunakan metode
min-max normalization
sebagai berikut :
4.6 Dimana,
v’ : nilai yang sudah ternormalisasi
v
: nilai lama yang belum ternormalisasi
min
: nilai minimum dari suatu
instance max
: nilai maksimum dari suatu
instance NewMax
: nilai minimum baru dari suatu
instance NewMin
: nilai maksimum baru dari suatu
instance
Berikut contoh proses normalisasi data :
Tabel 4.1 Contoh atribut pada dataset debitur sebelum normalisasi
UMUR NOM_PINJ
SB JW
NJOP_NT POKOK_BLN
BUNGA_BLN 39
30,000,000 11.4
50 3,344,778
600,000 285,000
50 15,000,000
7.2 60
3,229,280 250,000
90,000 52
27,000,000 9.6
40 4,110,556
675,000 216,000
49 21,000,000
9.6 60
3,827,169 350,000
168,000
49 30,000,000
9.6 60
3,803,224 500,000
240,000 47
30,000,000 9.6
60 3,984,900
500,000 240,000
51 21,000,000
9.6 50
3,819,900 420,000
168,000
Tabel 4.2 Contoh atribut pada dataset debitur setelah normalisasi
vumur vnom_pinj
vsb vjw
vnjop_nt vpokok_bln
vbunga_bln
0.00 1.00 1.00 0.50
0.13 0.77
1.00 0.85
0.00 0.00 1.00 0.00
-0.31 0.00
1.00 0.80 0.57 0.00
1.00 1.00
0.65 0.77
0.40 0.57 1.00 0.68
0.00 0.40
0.77 1.00 0.57 1.00
0.65 0.46
0.77 0.62
1.00 0.57 1.00 0.86
0.46 0.77
0.92 0.40 0.57 0.50
0.67 0.22
0.40
C. Penambangan Data Dengan Microsoft Excel
Data yang telah mengalami pemrosesan akan ditambang berdasarkan algoritma ECODB
.
Penambangan data menggunakan Microsoft Excel. Rumus algoritma ECODB akan diterapkan dalam bentuk formula Microsoft Excel.
1. Menormalisasi Data
Sebelum ditambang, data yang telah mengalami pemrosesan awal akan dinormalisasi terlebih dahulu. Proses normalisasi ini dilakukan
dengan tujuan membuat data memiliki nilai yang tepat dan sama untuk ditambang. Atribut
– atribut tersebut akan dinormalisasi agar mempunyai
range
nilai 0 – 1. Proses normalisasi menggunakan metode
min-max normalization
seperti pada rumus 4.6. Formula normalisasi dalam Microsoft Excel adalah sebagai berikut :
=cell1-mincellmaxcell-mincell1-0+0
Gambar 4.3 Contoh formula normalisasi data 2. Mencari Jarak Dari Tiap Data Dengan Menggunakan Fungsi Jarak
Mixed Euclidian Distance
Setelah menormalisasi data, dicari jarak dari tiap data dengan menggunakan fungsi jarak
mixed euclidian distance
. Pada fungsi ini setiap
instance
bertipe kategorikal akan diberi nilai 0 jika mempunyai kategori yang sama dan diberi nilai 1 jika mempunyai kategori yang berbeda,
sedangkan atribut numerik akan dihitung berdasarkan rumus 5. Formula
mencari jarak dalam Microsoft Excel adalah sebagai berikut : =SQRTIFcell1=cell2,0,12+cell3-cell42+cell5-
cell62+cell7-cell82+cell9- cell102+IFcell11=cell12,0,12+cell13-cell142+
cell15-cell162+cell17-cell182+cell19-cell202+ cell21-cell222+cell23-cell242+cell25-cell262+
cell27-cell282+cell29-cell302+cell31-cell322+ cell33-cell342+IFcell35=cell36,0,12+cell37-cell382
Gambar 4.4 Contoh formula mencari jarak 3. Menghitung PCL
PCL
Probability of
Class Label
adalah nilai
probabilitasbanyaknya kemunculan
cla ss label
yang sama dengan
instance
T dibandingkan k tetangga terdekatnya. PCL dihitung dengan cara membagi jumlah tetangga terdekat
instance
T yang mempunyai
class label
yang sama termasuk
instance
T sendiri dengan nilai k. Formula menghitung PCL dalam Microsoft Excel adalah sebagai berikut :
=cell1k
Gambar 4.5 Contoh formula menghitung PCL 4. Meranking List
Top N Outlier
Dari
Instance
Dengan Nilai
PCLT,K
Terkecil
Setelah menghitung nilai PCL, data diranking secara kecil ke
besar berdasarkan nilai
PCLT,K
terkecil sesuai dengan masukan
top N
.
Top N
adalah jumlah
instances
yang dideteksi sebagai
outlier
yang diurutkan secara kecil ke besar. Misalkan masukan
top N
= 10, maka akan
diranking 10
instance
dengan nilai
PCLT,K
terkecil. Untuk meranking
instance
, digunakan fitur Sort Filter dalam Microsoft Excel.
Gambar 4.6 Contoh meranking kecil ke besar berdasarkan nilai
PCLT,K
terkecil
5. Menghitung Nilai
DeviationT
¸
NormDeviationT
,
KdistT
, Dan
NormKdistT
Kemudian instance yang berada di
top N
dihitung nilai
DeviationT
¸
NormDeviationT
,
KdistT
, dan
NormKdistT
berdasarkan rumus 2.1, 2.2, dan 2.3.
DeviationT
adalah seberapa besar nilai
instance
T yang menyimpang dari subset DCL.
KDist
adalah jarak antara
instance
T pada dataset D dengan K tetangga terdekat, seberapa dekat nilai K
instance
tetangga terdekat dengan
instance
T. Sedangkan
NormDeviationT
adalah nilai
deviation
yang sudah ternormalisasi dan
NormKDistT
adalah nilai
KDist
yang sudah
ternormalisasi. Formula menghitung
DeviationT
¸
NormDeviationT
,
KdistT
, dan
NormKdistT
dalam Microsoft Excel adalah sebagai berikut :
a. Mencari
Deviation
=cell1+cell2+cell3+...+celln
Gambar 4.7 Contoh formula menghitung
Deviation
b. Mencari
NormDeviationT
=cell1-mincellmaxcell-mincell
Gambar 4.8 Contoh formula menghitung
NormDeviationT
c. Mencari
Kdist
= cell1+cell2+cell3+...+celln
Gambar 4.9 Contoh formula menghitung
Kdist
d. Mencari
NormKDistT
=cell1-mincellmaxcell-mincell
Gambar 4.10 Contoh formula menghitung
NormKDistT
6. Menghitung Nilai COF
Class Outlier Factor
Tahap selanjutnya adalah menghitung
COF Class Outlier
Factor
dari setiap
instance
yang berada di list
top N
. COF adalah derajat dari suatu
instance
T untuk dikategorikan sebagai
outlier
. COF dihitung berdasarkan rumus 2.4. Formula menghitung COF
dalam Microsoft Excel adalah sebagai berikut :
=kcell1-cell2+cell3
Gambar 4.11 Contoh formula menghitung COF
Class Outlier Factor
7. Mengurutkan List
Top N
Secara Kecil Ke Besar Sesuai Nilai
COF
Tahap terakhir adalah mengurutkan list
top N
secara kecil ke besar sesuai nilai COF. Misalkan masukan
top N
= 10, maka akan diranking 10
instance
dengan nilai COF terkecil. Untuk meranking
instance
, digunakan fitur Sort Filter dalam Microsoft Excel.
Gambar 4.12 Contoh meranking kecil ke besar berdasarkan nilai COF terkecil
D. Hasil Deteksi
Outlier
Berdasarkan Algoritma ECODB Dengan Microsoft Excel
Hasil deteksi
outlier
berdasarkan algoritma ECODB menggunakan Microsoft Excel dengan masukan k dan
top N
yang berubah – ubah dapat
ditampilkan dalam bentuk tabel – tabel di bawah. Dimana k adalah jumlah
tetangga terdekat dari suatu
instances
, sedangkan
top N
adalah jumlah
instances
yang dideteksi sebagai
outlier
yang diurutkan secara kecil ke besar berdasarkan nilai COF
Cla ss Outlier Factor
. COF adalah nilai probabilitasderajat sebuah
instance
dapat menjadi
outlier
.
Outlier
adalah data dengan nilai COF terendah.
Class outlier
adalah
instances
yang mempunyai derajat tinggi sebagai
outlier
. Jumlah
class outlier
ditentukan berdasarkan masukan
top N
, jika
top N
= 10 maka akan ada 10
instances
yang yang mempunyai derajat tinggi sebagai
outlier
.
Tabel 4.3 Hasil deteksi
outlier
dengan masukan k dan
top N
yang berubah – ubah
k
Top N
Min COF 7
10 36, 92, 53, 96, 39, 64, 56, 24, 23, 37
20 36, 92, 53, 96, 65, 39, 64, 73, 97, 56, 24, 23, 88, 69,
87, 37, 27, 26, 25, 38 30
36, 92, 53, 96, 65, 39, 64, 73, 97, 56, 24, 23, 88, 69, 87, 37, 90, 27, 26, 25, 38, 55, 84, 63, 83, 15,, 70,
41, 1, 42
40 36, 92, 53, 96, 65, 39, 64, 73, 97, 56, 24, 23, 88, 69,
87, 37, 90, 27, 26, 25, 38, 55, 84, 63, 83, 15, 70, 41, 1, 42, 13, 46, 14, 33, 45, 60, 30, 44, 49, 32
50 36, 39, 53, 92, 96, 23, 24, 37, 56, 64, 65, 69, 73, 87,
88, 97, 25, 26, 27, 38, 55, 90, 42, 1, 15, 41, 63,70, 83,84, 13, 14, 30, 32, 33, 44, 45, 46, 49, 60, 61, 77,
80, 81, 82, 91, 94, 95, 2, 3
17 10
36,53, 39, 73, 64, 24, 56, 23, 69, 37 20
36, 53, 39, 92, 73, 64, 94, 97, 24, 56, 88, 23, 69, 87, 37, 96, 38, 55, 25, 26
30 36, 53, 39, 92, 73, 64, 94, 97, 24, 56, 88, 23, 69, 87,
37, 96, 38, 55, 27, 25, 26, 42, 65, 90, 17, 18, 13, 15, 11, 14
40 36, 53, 39, 92, 73, 64, 94, 97, 24, 56, 88, 23, 69, 87,
37, 96, 38, 55, 27, 25, 26, 42, 65, 90, 17, 18, 13, 15, 82, 70, 11, 14, 80, 19, 45, 12, 41, 16, 75, 1
50 36, 53, 39, 92, 73, 64, 94, 97, 24, 56, 88, 23, 69, 87,
37, 96, 38, 55, 27, 25, 26, 42, 65, 90, 17, 18, 13, 15, 82, 70, 11, 14, 80, 19, 45, 12, 41, 16, 75, 1, 83, 50,
81, 31, 52, 34, 84, 28, 29, 35
27 10
36, 53, 92, 64, 73, 94, 97, 24, 37, 39 20
36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87, 96, 38, 55, 25, 26, 42
30 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87,
96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 13, 14, 15, 16
40 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87,
96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 18, 13, 14, 15, 16, 91, 8, 70, 19, 10, 2, 28, 12, 1
50 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87,
96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 18, 13, 14, 15, 16, 91, 8, 70, 19, 10, 2, 50, 63, 31, 34, 59,
41, 45, 48, 28, 29, 35, 12, 1
37 10
36, 53, 92, 64, 73, 94, 97, 24, 37, 39 20
36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87, 96, 38, 55, 25, 26, 42
30 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87,
96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 13, 14, 15, 16
40 36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87,
96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 18, 13,
14, 15, 16, 91, 8, 70, 19, 10, 2, 28, 12, 1 50
36, 53, 92, 64, 73, 94, 97, 24, 37, 39, 88, 23, 69, 87, 96, 38, 55, 56, 25, 26, 42, 27, 65, 90, 17, 11, 18, 13,
14, 15, 16, 91, 8, 70, 19, 10, 2, 50, 63, 31, 34, 59, 41, 45, 48, 28, 29, 35, 12, 1
47 10
94, 97, 36, 88, 37, 96, 53, 38, 39, 42 20
94, 97, 36, 88, 37, 96, 64, 53, 56, 69, 87, 38, 39, 42, 92, 73, 23, 24, 55, 25
30 94, 97, 36, 88, 37, 96, 64, 53, 56, 69, 87, 38, 39, 42,
92, 73, 23, 24, 55, 27, 25, 26, 65, 90, 45, 76, 80, 82, 91, 43
40 94, 97, 36, 88, 37, 96, 64, 53, 56, 69, 87, 38, 39, 42,
92, 73, 23, 24, 55, 27, 25, 26, 65, 90, 45, 76, 80, 82, 91, 43, 51, 83, 66, 70, 18, 14, 16, 3, 11, 12
50 94, 97, 36, 88, 37, 96, 64, 53, 56, 69, 87, 38, 39, 42,
92, 73, 23, 24, 55, 27, 25, 26, 65, 90, 45, 76, 80, 82, 91, 43, 51, 83, 66, 70, 18, 14, 16, 63, 71, 62, 34, 44,
49, 60, 35, 3, 17, 11, 12, 19
COF adalah nilai probabilitasderajat sebuah
instance
dapat menjadi
outlier
.
Outlier
adalah data dengan nilai COF terendah.
Class outlier
adalah
instances
yang mempunyai derajat tinggi sebagai
outlier
. Untuk dapat mengetahui pengaruh k dan
top N
dalam proses deteksi
outlier
menggunakan algoritma ECODB, dapat dilihat dari perubahan nilai COF berdasarkan
masukan k dan
top N
yang berubah – ubah.
Karena nilai COF bergantung pada masukan
top N
, maka untuk memudahkan perbandingan dari hasil deteksi, nilai COF ditampilkan dalam
bentuk rata – rata
means
. Kolom
min COF
dan
max COF
dapat digunakan untuk melihat seberapa jauh jarak nilai
means
terhadap
min COF
dan
max COF
. Dari tabel 4.8, dapat dilihat bahwa semakin tinggi nilai masukan k dan
top N
, maka semakin tinggi pula nilai COF.
Tabel 4.4 Nilai rata
– rata COF berdasarkan masukan k dan
top N
yang berubah - ubah
k
Top N
Min COF
Max COF
Means COF
7 10
0.99 2.84
1.77 20
0.99 3.14
2.06 30
0.99 4.81
2.78 40
0.99 5.55
3.445 50
0.99 6.22
3.89
17 10
2.39 5.7
4.15 20
2.39 9.95
5.6 30
2.39 33.62
12.69 40
2.39 35.93
18.31 50
2.39 38.43
21.89
27 10
3.82 8.56
6.8 20
3.82 16.31
10.13 30
3.82 84.47
31.71 40
3.82 92.06
46.02 50
3.82 92.15
55.23
37 10
10.53 16.39
14.01 20
10.53 26.66
18.51 30
10.53 163.44
59.07 40
10.53 168.64
85.81 50
10.53 168.72
102.38
47 10
13.53 27.73
22.53 20
13.53 33.78
26.44 30
13.53 254.62
93.35 40
13.53 261.42
135.35 50
13.53 268.13
161.76
COF adalah nilai probabilitasderajat sebuah
insta nce
dapat menjadi
outlier
.
Outlier
adalah data dengan nilai COF terendah. Nilai COF dan
class outlier
dengan masukan k = 7 dan
top N
yang berubah – ubah dapat
ditampilkan dalam tabel sebagai berikut :
Tabel 4.5 Nilai COF dengan k = 7 dan
top N
= 10
Class PCL COF 36
3 1
0.99 92
3 1
1.04 53
2 1
1.08 96
4 1
1.38 39
3 1
1.58 64
2 2
2.03 56
3 2
2.12 24
2 2
2.13 23
2 2
2.14 37
4 2
2.44
Tabel 4.6 Nilai COF dengan k = 7 dan
top N
= 20
Class
PCL COF
36 3
1 0.99
92 3
1 1.04
53 2
1 1.08
96 4
1 1.38
65 1
2 1.44
39 3
1 1.58
64 2
2 2.03
73 2
2 2.03
97 3
2 2.11
56 3
2 2.12
24 2
2 2.13
23 2
2 2.14
88 3
2 2.14
69 2
2 2.17
87 2
2 2.18
37 4
2 2.44
27 3
3 3.12
26 3
3 3.13
25 3
3 3.14
38 4
3 3.5
Tabel 4.7 Nilai COF dengan k = 7 dan
top N
= 30
Class
PCL COF
36 3
1 0.99
92 3
1 1.04
53 2
1 1.08
96 4
1 1.38
65 1
2 1.44
39 3
1 1.58
64 2
2 2.03
73 2
2 2.03
97 3
2 2.11
56 3
2 2.12
24 2
2 2.13
23 2
2 2.14
88 3
2 2.14
69 2
2 2.17
87 2
2 2.18
37 4
2 2.44
90 1
3 2.49
27 3
3 3.12
26 3
3 3.13
25 3
3 3.14
38 4
3 3.5
55 3
3 3.84
84 1
5 4.44
63 1
5 4.45
83 1
5 4.45
15 1
5 4.47
70 1
5 4.48
41 1
5 4.52
1 1
5 4.6
42 4
4 4.81
Tabel 4.8 Nilai COF dengan k = 7 dan
top N
= 40
Class
PCL COF
36 3
1 0.99
92 3
1 1.04
53 2
1 1.08
96 4
1 1.38
65 1
2 1.44
39 3
1 1.58
64 2
2 2.03
73 2
2 2.03
97 3
2 2.11
56 3
2 2.12
24 2
2 2.13
23 2
2 2.14
88 3
2 2.14
69 2
2 2.17
87 2
2 2.18
37 4
2 2.44
90 1
3 2.49
27 3
3 3.12
26 3
3 3.13
25 3
3 3.14
38 4
3 3.5
55 3
3 3.84
84 1
5 4.44
63 1
5 4.45
83 1
5 4.45
15 1
5 4.47
70 1
5 4.48
41 1
5 4.52
1 1
5 4.6
42 4
4 4.81
13 1
6 5.44
46 1
6 5.44
14 1
6 5.45
33 1
6 5.47
45 1
6 5.47
60 1
6 5.47
30 1
6 5.49
44 1
6 5.49
49 1
6 5.49
32 1
6 5.55
Tabel 4.9 Nilai COF dengan k = 7 dan
top N
= 50
Class
PCL COF
36 3
1 0.99
39 3
1 1.58
53 2
1 1.08
92 3
1 1.04
96 4
1 1.38
23 2
2 2.14
24 2
2 2.13
37 4
2 2.44
56 3
2 2.12
64 2
2 2.03
65 1
2 1.44
69 2
2 2.17
73 2
2 2.03
87 2
2 2.18
88 3
2 2.14
97 3
2 2.11
25 3
3 3.14
26 3
3 3.13
27 3
3 3.12
38 4
3 3.5
55 3
3 3.84
90 1
3 2.49
42 4
4 4.81
1 1
5 4.6
15 1
5 4.47
41 1
5 4.52
63 1
5 4.45
70 1
5 4.48
83 1
5 4.45
84 1
5 4.44
13 1
6 5.44
14 1
6 5.45
30 1
6 5.49
32 1
6 5.55
33 1
6 5.47
44 1
6 5.49
45 1
6 5.47
46 1
6 5.44
49 1
6 5.49
60 1
6 5.47
61 1
6 5.42
77 1
6 5.44
80 1
6 5.46
81 1
6 5.46
82 1
6 5.47
91 1
6 5.46
94 3
6 5.54
95 1
6 5.54
2 1
7 6.22
3 1
7 6.16
Nilai COF dengan masukan k = 17 dan
top N
yang berubah – ubah
dapat ditampikan dalam tabel sebagai berikut :
Tabel 4.10 Nilai COF dengan k = 17 dan
top N
= 10
Class
PCL COF
36 3
1 2.38
53 2
1 2.52
39 3
1 2.98
73 2
2 4.91
64 2
2 4.92
24 2
2 5.06
56 3
2 5.06
23 2
2 5.08
69 2
2 5.12
37 4
2 5.3
Tabel 4.11 Nilai COF dengan k = 17 dan
top N
= 20
Class
PCL COF
36 3
1 2.38
53 2
1 2.52
39 3
1 2.98
92 3
2 4.89
73 2
2 4.91
64 2
2 4.92
94 3
2 4.93
97 3
2 4.97
24 2
2 5.06
56 3
2 5.06
88 3
2 5.06
23 2
2 5.08
69 2
2 5.12
87 2
2 5.12
37 4
2 5.3
96 4
3 7.74
38 4
3 7.81
55 3
3 8.11
25 3
4 9.94
26 3
4 9.94
Tabel 4.12 Nilai COF dengan k = 17 dan
top N
= 30
Class
PCL COF
36 3
1 2.38
53 2
1 2.52
39 3
1 2.98
92 3
2 4.89
73 2
2 4.91
64 2
2 4.92
94 3
2 4.93
97 3
2 4.97
24 2
2 5.06
56 3
2 5.06
88 3
2 5.06
23 2
2 5.08
69 2
2 5.12
87 2
2 5.12
37 4
2 5.3
96 4
3 7.74
38 4
3 7.81
55 3
3 8.11
27 3
4 9.92
25 3
4 9.94
26 3
4 9.94
42 4
4 10.57
65 1
9 21.4
90 1
10 23.86
17 1
11 26.21
18 1
11 26.22
13 1
12 28.7
15 1
12 28.72
11 1
13 31.07
14 1
13 31.13
Tabel 4.13 Nilai COF dengan k = 17 dan
top N
= 40
Class
PCL COF
36 3
1 2.38
53 2
1 2.52
39 3
1 2.98
92 3
2 4.89
73 2
2 4.91
64 2
2 4.92
94 3
2 4.93
97 3
2 4.97
24 2
2 5.06
56 3
2 5.06
88 3
2 5.06
23 2
2 5.08
69 2
2 5.12
87 2
2 5.12
37 4
2 5.3
96 4
3 7.74
38 4
3 7.81
55 3
3 8.11
27 3
4 9.92
25 3
4 9.94
26 3
4 9.94
42 4
4 10.57
65 1
9 21.4
90 1
10 23.86
17 1
11 26.21
18 1
11 26.22
13 1
12 28.7
15 1
12 28.72
82 1
13 31.04
70 1
13 31.06
11 1
13 31.07
14 1
13 31.13
80 1
14 33.47
19 1
14 33.49
45 1
14 33.49
12 1
14 33.5
41 1
14 33.51
16 1
14 33.53
75 1
14 33.61
1 1
14 33.62
Tabel 4.14 Nilai COF dengan k = 17 dan
top N
= 50
Class
PCL COF
36 3
1 2.38
53 2
1 2.52
39 3
1 2.98
92 3
2 4.89
73 2
2 4.91
64 2
2 4.92
94 3
2 4.93
97 3
2 4.97
24 2
2 5.06
56 3
2 5.06
88 3
2 5.06
23 2
2 5.08
69 2
2 5.12
87 2
2 5.12
37 4
2 5.3
96 4
3 7.74
38 4
3 7.81
55 3
3 8.11
27 3
4 9.92
25 3
4 9.94
26 3
4 9.94
42 4
4 10.57
65 1
9 21.4
90 1
10 23.86
17 1
11 26.21
18 1
11 26.22
13 1
12 28.7
15 1
12 28.72
82 1
13 31.04
70 1
13 31.06
11 1
13 31.07
14 1
13 31.13
80 1
14 33.47
19 1
14 33.49
45 1
14 33.49
12 1
14 33.5
41 1
14 33.51
16 1
14 33.53
75 1
14 33.61
1 1
14 33.62
83 1
15 35.89
50 1
15 35.9
81 1
15 35.9
31 1
15 35.91
52 1
15 35.91
34 1
15 35.92
84 1
15 35.92
28 1
15 35.93
29 1
15 35.93
35 1
15 35.95
Dengan masukan k = 27 dan
top N
yang berubah – ubah, nilai COF
dapat ditampikan dalam tabel sebagai berikut :
Tabel 4.15 Nilai COF dengan k = 27 dan
top N
= 10
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
Tabel 4.16 Nilai COF dengan k = 27 dan
top N
= 20
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
88 3
3 11.77
23 2
3 11.81
69 2
3 11.84
87 2
3 11.85
96 4
3 12.03
38 4
3 12.09
55 3
3 12.4
25 3
4 15.67
26 3
4 15.67
42 4
4 16.31
Tabel 4.17 Nilai COF dengan k = 27 dan
top N
= 30
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
88 3
3 11.77
23 2
3 11.81
69 2
3 11.84
87 2
3 11.85
96 4
3 12.03
38 4
3 12.09
55 3
3 12.4
56 3
4 15.63
25 3
4 15.67
26 3
4 15.67
42 4
4 16.31
27 3
5 19.51
65 1
17 65.13
90 1
19 72.86
17 1
21 80.56
11 1
21 80.57
13 1
21 80.6
14 1
21 80.61
15 1
21 80.61
16 1
21 80.61
Tabel 4.18 Nilai COF dengan k = 27 dan
top N
= 40
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
88 3
3 11.77
23 2
3 11.81
69 2
3 11.84
87 2
3 11.85
96 4
3 12.03
38 4
3 12.09
55 3
3 12.4
56 3
4 15.63
25 3
4 15.67
26 3
4 15.67
42 4
4 16.31
27 3
5 19.51
65 1
17 65.13
90 1
19 72.86
17 1
21 80.56
11 1
21 80.57
18 1
21 80.57
13 1
21 80.6
14 1
21 80.61
15 1
21 80.61
16 1
21 80.61
91 1
22 84.35
8 1
22 84.36
70 1
22 84.36
19 1
22 84.42
10 1
23 87.91
2 1
23 88.19
28 1
23 88.23
12 1
23 88.28
1 1
23 88.35
Tabel 4.19 Nilai COF dengan k = 27 dan
top N
= 50
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
88 3
3 11.77
23 2
3 11.81
69 2
3 11.84
87 2
3 11.85
96 4
3 12.03
38 4
3 12.09
55 3
3 12.4
56 3
4 15.63
25 3
4 15.67
26 3
4 15.67
42 4
4 16.31
27 3
5 19.51
65 1
17 65.13
90 1
19 72.86
17 1
21 80.56
11 1
21 80.57
18 1
21 80.57
13 1
21 80.6
14 1
21 80.61
15 1
21 80.61
16 1
21 80.61
91 1
22 84.35
8 1
22 84.36
70 1
22 84.36
19 1
22 84.42
10 1
23 87.91
2 1
23 88.19
50 1
23 88.19
63 1
23 88.19
31 1
23 88.21
34 1
23 88.21
59 1
23 88.21
41 1
23 88.22
45 1
23 88.22
48 1
23 88.22
28 1
23 88.23
29 1
23 88.23
35 1
23 88.24
12 1
23 88.28
1 1
23 88.35
Dengan masukan k = 37 dan
top N
yang berubah – ubah, nilai COF
dapat ditampikan dalam tabel sebagai berikut :
Tabel 4.20 Nilai COF dengan k = 37 dan
top N
= 10
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
Tabel 4.21 Nilai COF dengan k = 37 dan
top N
= 20
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
88 3
3 11.77
23 2
3 11.81
69 2
3 11.84
87 2
3 11.85
96 4
3 12.03
38 4
3 12.09
55 3
3 12.4
25 3
4 15.67
26 3
4 15.67
42 4
4 16.31
Tabel 4.22 Nilai COF dengan k = 37 dan
top N
= 30
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
88 3
3 11.77
23 2
3 11.81
69 2
3 11.84
87 2
3 11.85
96 4
3 12.03
38 4
3 12.09
55 3
3 12.4
56 3
4 15.63
25 3
4 15.67
26 3
4 15.67
42 4
4 16.31
27 3
5 19.51
65 1
17 65.13
90 1
19 72.86
17 1
21 80.56
11 1
21 80.57
13 1
21 80.6
14 1
21 80.61
15 1
21 80.61
16 1
21 80.61
Tabel 4.23 Nilai COF dengan k = 37 dan
top N
= 40
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
88 3
3 11.77
23 2
3 11.81
69 2
3 11.84
87 2
3 11.85
96 4
3 12.03
38 4
3 12.09
55 3
3 12.4
56 3
4 15.63
25 3
4 15.67
26 3
4 15.67
42 4
4 16.31
27 3
5 19.51
65 1
17 65.13
90 1
19 72.86
17 1
21 80.56
11 1
21 80.57
18 1
21 80.57
13 1
21 80.6
14 1
21 80.61
15 1
21 80.61
16 1
21 80.61
91 1
22 84.35
8 1
22 84.36
70 1
22 84.36
19 1
22 84.42
10 1
23 87.91
2 1
23 88.19
28 1
23 88.23
12 1
23 88.28
1 1
23 88.35
Tabel 4.24 Nilai COF dengan k = 37 dan
top N
= 50
Class
PCL COF
36 3
1 3.81
53 2
1 3.97
92 3
2 7.76
64 2
2 7.79
73 2
2 7.79
94 3
2 7.79
97 3
2 7.83
24 2
2 7.94
37 4
2 8.14
39 3
2 8.26
88 3
3 11.77
23 2
3 11.81
69 2
3 11.84
87 2
3 11.85
96 4
3 12.03
38 4
3 12.09
55 3
3 12.4
56 3
4 15.63
25 3
4 15.67
26 3
4 15.67
42 4
4 16.31
27 3
5 19.51
65 1
17 65.13
90 1
19 72.86
17 1
21 80.56
11 1
21 80.57
18 1
21 80.57
13 1
21 80.6
14 1
21 80.61
15 1
21 80.61
16 1
21 80.61
91 1
22 84.35
8 1
22 84.36
70 1
22 84.36
19 1
22 84.42
10 1
23 87.91
2 1
23 88.19
50 1
23 88.19
63 1
23 88.19
31 1
23 88.21
34 1
23 88.21
59 1
23 88.21
41 1
23 88.22
45 1
23 88.22
48 1
23 88.22
28 1
23 88.23
29 1
23 88.23
35 1
23 88.24
12 1
23 88.28
1 1
23 88.35
Berdasarkan masukan k = 47 dan
top N
yang berubah – ubah, nilai
COF dapat ditampikan dalam tabel sebagai berikut :
Tabel 4.25 Nilai COF dengan k = 47 dan
top N
= 10
Class
PCL COF
94 3
2 13.48
97 3
2 13.52
36 3
3 20.08
88 3
3 20.27
37 4
3 20.54
96 4
3 20.55
53 2
4 26.93
38 4
4 27.34
39 3
4 27.36
42 4
4 27.73
Tabel 4.26 Nilai COF dengan k = 47 dan
top N
= 20
Class
PCL COF
94 3
2 13.48
97 3
2 13.52
36 3
3 20.08
88 3
3 20.27
37 4
3 20.54
96 4
3 20.55
64 2
4 26.91
53 2
4 26.93
56 3
4 27
69 2
4 27.07
87 2
4 27.07
38 4
4 27.34
39 3
4 27.36
42 4
4 27.73
92 3
5 33.6
73 2
5 33.63
23 2
5
33.73
24 2
5
33.74
55 3
5 34.4
25 3
6
40.48
Tabel 4.27 Nilai COF dengan k = 47 dan
top N
= 30
Class
PCL COF
94 3
2 13.48
97 3
2 13.52
36 3
3 20.08
88 3
3 20.27
37 4
3 20.54
96 4
3 20.55
64 2
4 26.91
53 2
4 26.93
56 3
4 27
69 2
4 27.07
87 2
4 27.07
38 4
4 27.34
39 3
4 27.36
42 4
4 27.73
92 3
5 33.6
73 2
5 33.63
23 2
5
33.73
24 2
5
33.74
55 3
5 34.4
27 3
6
40.44
25 3
6
40.48
26 3
6
40.48
65 1
33 221.06
90 1
34 227.79
45 1
36 241.19
76 1
37 247.9
80 1
37 247.9
82 1
37 247.9
91 1
37 247.9
43 1
37 247.91
Tabel 4.28 Nilai COF dengan k = 47 dan
top N
= 40
Class
PCL COF
94 3
2 13.48
97 3
2 13.52
36 3
3 20.08
88 3
3 20.27
37 4
3 20.54
96 4
3 20.55
64 2
4 26.91
53 2
4 26.93
56 3
4 27
69 2
4 27.07
87 2
4 27.07
38 4
4 27.34
39 3
4 27.36
42 4
4 27.73
92 3
5 33.6
73 2
5 33.63
23 2
5
33.73
24 2
5
33.74
55 3
5 34.4
27 3
6
40.44
25 3
6
40.48
26 3
6
40.48
65 1
33 221.06
90 1
34 227.79
45 1
36 241.19
76 1
37 247.9
80 1
37 247.9
82 1
37 247.9
91 1
37 247.9
43 1
37 247.91
51 1
38 254.61
83 1
38 254.61
66 1
38 254.62
70 1
38 254.62
18 1
38
254.69
14 1
38
254.71
16 1
38
254.75
3 1
39 261.39
11 1
39 261.41
12 1
39
261.41
Tabel 4.29 Nilai COF dengan k = 47 dan
top N
= 50
Class
PCL COF
94 3
2 13.48
97 3
2 13.52
36 3
3 20.08
88 3
3 20.27
37 4
3 20.54
96 4
3 20.55
64 2
4 26.91
53 2
4 26.93
56 3
4 27
69 2
4 27.07
87 2
4 27.07
38 4
4 27.34
39 3
4 27.36
42 4
4 27.73
92 3
5 33.6
73 2
5 33.63
23 2
5
33.73
24 2
5
33.74
55 3
5 34.4
27 3
6
40.44
25 3
6
40.48
26 3
6
40.48
65 1
33 221.06
90 1
34 227.79
45 1
36 241.19
76 1
37 247.9
80 1
37 247.9
82 1
37 247.9
91 1
37 247.9
43 1
37 247.91
51 1
38 254.61
83 1
38 254.61
66 1
38 254.62
70 1
38 254.62
18 1
38
254.69
14 1
38
254.71
16 1
38
254.75
63 1
39 261.32
71 1
39 261.32
62 1
39 261.33
34 1
39 261.34
44 1
39 261.34
49 1
39 261.34
60 1
39 261.34
35 1
39 261.36
3 1
39 261.39
17 1
39
261.4
11 1
39 261.41
12 1
39
261.41
19 1
39
261.41
E. Kesimpulan Hasil Percobaan Perhitungan Dengan Masukan K dan
Top N
Yang Berubah - Ubah
Dari hasil percobaan perhitungan dengan masukan k dan top N yang tertera pada tabel di atas, dapat disimpulkan sebagai berikut :
1. Berdasarkan percobaan perhitungan menggunakan algoritma
ECODB, dapat diketahui bahwa semakin besar nilai k, semakin tinggi pula nilai COF. Hal ini dikarenakan bertambahnya jumlah
tetangga terdekat dari tiap
instance
yang kemudian membuat nilai
Kdist
bertambah. 2.
Berdasarkan percobaan perhitungan menggunakan algoritma
ECODB dengan masukan k dan
top n
yang berbeda – beda, dapat
diketahui bahwa penentuan nilai k dan
top n
bergantung pada
besarnya dataset, jumlah
class label
dan distribusi kelas. Semakin besar dataset dan jumlah
cla ss label
, semakin besar pula masukan nilai k dan
top n
untuk mendapatkan hasil deteksi yang optimal.
3. Nilai k yang terlalu kecil akan menyebabkan tahap
pengelompokan data berdasarkan tetangga terdekat menjadi tidak optimal. Data yang termasuk tetangga terdekat suatu
instances
dapat ‘terbuang’ dari kelompoknya. Sedangkan nilai k yang terlalu besar akan menyebabkan data luar menjadi satu kelompok
dengan suatu
instances
. 4.
Nilai
top N
yang terlalu kecil akan menyebabkan data yang mempunyai derajat tinggi sebagai
outlier
tidak terdeteksi sebagai
class outlier
. Sedangkan nilai
top N
yang terlalu besar akan menyebabkan data yang bukan
outlier
ikut terdeteksi sebagai
outlier
.
F.
Kesimpulan Hasil Pengujian
Review
dan Validitas oleh Pengguna
Berdasarkan hasil pengujian hasil percobaan perhitungan pada data yang kerap muncul sebagai
outlier
pada masukan k dan
top N
yang berbeda –
beda dan hasil analisa menurut pengguna petugas BPR XYZ, dapat disimpulkan bahwa :
1. Debitur 36 dinyatakan sebagai
outlier
karena memiliki tunggakan pokok yang cukup besar padahal mempunyai jaminan
tanah senilai Rp 12.000.000,- dan pendapatan yang cukup besar
yakni Rp 11.400.000,-. Jumlah tanggungan keluarga debitur juga kecil yaitu 1 orang. Debitur sebelumnya pernah
mengajukan kredit di BPR XYZ sebanyak 3 kali dan mampu mengangsur kredit dengan lunas. Debitur 36 mengajukan kredit
sebesar Rp 6.000.000,- dan tidak sedang mengangsur kredit di bank lain.
2. Debitur 92 dinyatakan sebagai
outlier
karena memiliki tunggakan pokok yang besar padahal mempunyai jaminan tanah
senilai Rp 40.000.000,- dan pendapatan yang relatif besar yakni Rp 8.937.500,-. Jumlah tanggungan keluarga debitur 92
sebanyak 2 orang. Debitur 92 mengajukan kredit sebesar Rp 20.000.000,- dan tidak sedang mengangsur kredit di bank lain.
3. Debitur 53 dinyatakan sebagai
outlier
karena memiliki tunggakan pokok yang besar padahal mempunyai jaminan tanah
senilai Rp 40.000.000,- dan pendapatan yang cukup besar yakni Rp 16.600.000,-. Debitur sebelumnya pernah mengajukan kredit
di BPR XYZ sebanyak 1 kali dan mampu mengangsur kredit dengan lunas. Debitur 53 mengajukan kredit sebesar Rp
20.000.000,- dan tidak sedang mengangsur kredit di bank lain. 4.
Debitur 73 dinyatakan sebagai
outlier
karena memiliki tunggakan pokok yang besar padahal mempunyai jaminan tanah
senilai Rp 14.000.000,- dan pendapatan yang besar yakni Rp 24.000.000,-. Debitur sebelumnya pernah mengajukan kredit di
BPR XYZ sebanyak 1 kali dan mampu mengangsur kredit dengan lunas. Debitur 73 mengajukan kredit sebesar Rp
7.000.000,- dan tidak sedang mengangsur kredit di bank lain. 5.
Debitur 96 dinyatakan sebagai
outlier
karena memiliki tunggakan bunga yang besar sebanyak 55 kali padahal
mempunyai jaminan BPKB senilai Rp 26.000.000,- dan pendapatan yang besar yakni Rp 10.500.000,-. Jumlah
tanggungan keluarga debitur 96 sebanyak 2 orang. Debitur 96 mengajukan kredit sebesar Rp 13.000.000,- dan tidak sedang
mengangsur kredit di bank lain. 6.
Debitur 39 dinyatakan sebagai
outlier
karena memiliki tunggakan pokok yang besar padahal mempunyai jaminan tanah
senilai Rp 70.750.000,- dan pendapatan yang besar yakni Rp 139.520.000,-. Debitur sebelumnya pernah mengajukan kredit di
BPR XYZ sebanyak 3 kali dan mampu mengangsur kredit dengan lunas. Jumlah tanggungan keluarga debitur 39 sebanyak
3 orang. Debitur 39 mengajukan kredit sebesar Rp 50.000.000,-. 7.
Debitur 64 dinyatakan sebagai
outlier
karena memiliki tunggakan pokok cukup besar padahal mempunyai jaminan
tanah senilai Rp 48.000.000,- dan pendapatan yang besar yakni Rp 34.400.000,-. Debitur sebelumnya pernah mengajukan kredit
di BPR XYZ sebanyak 1 kali dan mampu mengangsur kredit
dengan lunas. Debitur 64 mengajukan kredit sebesar Rp 24.000.000,- dan tidak sedang mengangsur kredit di bank lain.
8. Debitur 24 dinyatakan sebagai
outlier
karena memiliki tunggakan pokok dan tunggakan bunga yang besar padahal
mempunyai gaji tetap setiap bulan yang relatif besar yakni Rp 2.096.299,- dan jangka waktu mengangsur yang lama yaitu 40
bulan. Debitur 24 mengajukan kredit sebesar Rp 10.000.000,- dan tidak sedang mengangsur kredit di bank lain. Debitur
– debitur lain yang berprofesi sebagai pegawai dan mempunyai
gaji yang hampir sama cenderung mampu melunasi kredit bahkan untuk jumlah kredit yang lebih tinggi.
9. Debitur 23 dinyatakan sebagai
outlier
karena memiliki tunggakan pokok dan tunggakan bunga yang besar padahal
mempunyai gaji tetap setiap bulan yang relatif besar gaji tetap setiap bulan yang relatif besar yakni Rp 3.043.672,- dan jangka
waktu mengangsur yang lama yaitu 40 bulan. Debitur 23 mengajukan kredit sebesar Rp 10.000.000,- dan tidak sedang
mengangsur kredit di bank lain. Debitur – debitur lain yang
berprofesi sebagai pegawai dan mempunyai gaji yang hampir sama cenderung mampu melunasi kredit bahkan untuk jumlah
kredit yang lebih tinggi. 10.
Debitur 37 dinyatakan sebagai
outlier
karena memiliki tunggakan pokok yang sangat besar padahal mempunyai