46
BAB III PEMBAHASAN
A. Sumber Data
Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel peminjam dengan jaminan sertifikat tanah, tunjuk, dan Buku Pemilik Kendaraan
Bermotor BPKB serta 25 file excel laporan nominatif pinjaman perbulan dimana setiap file mewakili satu bulan. Data peminjam adalah data mengenai status
peminjam, pendapatan keluarga, pengeluaran keluarga, usaha, tempat tinggal, agunan, dan info-info lain yang mencakup 5C yang digunakan sebagai
pertimbangan pemberian kredit. Data laporan nominatif pinjaman perbulan adalah data mengenai besar pinjaman, sisa pinjaman, bunga, angsuran, kolektibilitas, dan
info-info lain yang berkaitan dengan angsuran perbulan. Rentang waktu dari data peminjam adalah Januari 2011 - Maret 2016 dan rentang waktu pada data laporan
nominatif pinjaman perbulan adalah Januari 2014 - Maret 2016. Daftar atribut pada kedua data dapat dilihat pada lampiran 1.
Data yang digunakan adalah data peminjam yang telah melunasi pinjaman dan peminjam yang bermasalah. Pengumpulan data dilakukan secara manual yaitu
pada data laporan nominatif pinjaman perbulan dipilih data yang mempunyai nilai bakidebet 0 artinya peminjam telah melunasi pinjaman dan data yang mempunyai
nilai kolektibilitas 2-4 artinya peminjam bermasalah dalam mengangsur pinjaman. Hasil pemilihan pada data laporan nominatif pinjaman perbulan tersebut kemudian
dihubungkan dengan file peminjam dengan primary key yaitu No.Anggota diperoleh sebanyak 1.076 dataset.
47 Pada data peminjam dan data laporan nominatif pinjaman perbulan tidak
semua atribut digunakan. Atribut yang digunakan pada data peminjam adalah sebagai berikut:
a. No.Anggota digunakan sebagai primary key,
b. pekerjaan adalah pekerjaan peminjam ketika melakukan permohonan
pinjaman, c.
No KTP adalah Nomer Kartu Tanda Kependudukan peminjam, d.
pekerjaan istrisuami adalah pekerjaan suami atau istri peminjam ketika melakukan permohonan pinjaman,
e. pendapatan keluarga adalah jumlah pendapatan peminjam ditambah dengan
jumlah pendapatan suami atau istri peminjam, f.
pengeluaran keluarga adalah jumlah pengeluaran keluarga perbulan untuk memenuhi kebutuhan hidup,
g. pinjaman adalah besar pinjaman yang dilakukan,
h. kemampuan angsuran adalah kemampuan peminjam untuk mengangsur,
i. jangka waktu adalah jumlah waktu untuk mengembalikan pinjaman,
j. agunan adalah jaminan yang diberikan oleh peminjam,
k. status agunan adalah status kepemilikan jaminan,
l. nilai jaminan adalah besar nominal uang yang setara dengan jaminan,
m. tujuan adalah tujuan digunakannya dana pinjaman,
n. tanggal peminjaman adalah tanggal dimana peminjam melakukan pinjaman.
Atribut yang digunakan pada data laporan nominatif pinjaman perbulan adalah sebagai berikut:
48 a.
No.Anggota digunakan sebagai primary key, b.
kolektibilitas adalah status kelancaran peminjam dalam mengangsur pinjaman.
Atribut-atribut lain yang tidak digunakan adalah atribut yang telah terwakili oleh atribut yang digunakan, atribut yang tidak ada kaitannya dengan
pengklasifikasian, atribut yang nilainya terlalu beragam, dan atribut yang sering tidak mempunyai isian, sehingga atribut tersebut tidak diperlukan pada penelitian
ini. Contoh data yang telah dikumpulkan dapat dilihat pada lampiran 2. Setelah data lengkap maka tahap selanjutnya mempersiapkan data tersebut untuk proses data
mining yaitu preprocessing yang terdiri dari Data Cleaning, Data Integration, Data Selection, Data Transformation.
B. Pembersihan Data Data Cleaning dan Integrasi Data Data Integration