Sumber Data ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES.

46 BAB III PEMBAHASAN

A. Sumber Data

Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel peminjam dengan jaminan sertifikat tanah, tunjuk, dan Buku Pemilik Kendaraan Bermotor BPKB serta 25 file excel laporan nominatif pinjaman perbulan dimana setiap file mewakili satu bulan. Data peminjam adalah data mengenai status peminjam, pendapatan keluarga, pengeluaran keluarga, usaha, tempat tinggal, agunan, dan info-info lain yang mencakup 5C yang digunakan sebagai pertimbangan pemberian kredit. Data laporan nominatif pinjaman perbulan adalah data mengenai besar pinjaman, sisa pinjaman, bunga, angsuran, kolektibilitas, dan info-info lain yang berkaitan dengan angsuran perbulan. Rentang waktu dari data peminjam adalah Januari 2011 - Maret 2016 dan rentang waktu pada data laporan nominatif pinjaman perbulan adalah Januari 2014 - Maret 2016. Daftar atribut pada kedua data dapat dilihat pada lampiran 1. Data yang digunakan adalah data peminjam yang telah melunasi pinjaman dan peminjam yang bermasalah. Pengumpulan data dilakukan secara manual yaitu pada data laporan nominatif pinjaman perbulan dipilih data yang mempunyai nilai bakidebet 0 artinya peminjam telah melunasi pinjaman dan data yang mempunyai nilai kolektibilitas 2-4 artinya peminjam bermasalah dalam mengangsur pinjaman. Hasil pemilihan pada data laporan nominatif pinjaman perbulan tersebut kemudian dihubungkan dengan file peminjam dengan primary key yaitu No.Anggota diperoleh sebanyak 1.076 dataset. 47 Pada data peminjam dan data laporan nominatif pinjaman perbulan tidak semua atribut digunakan. Atribut yang digunakan pada data peminjam adalah sebagai berikut: a. No.Anggota digunakan sebagai primary key, b. pekerjaan adalah pekerjaan peminjam ketika melakukan permohonan pinjaman, c. No KTP adalah Nomer Kartu Tanda Kependudukan peminjam, d. pekerjaan istrisuami adalah pekerjaan suami atau istri peminjam ketika melakukan permohonan pinjaman, e. pendapatan keluarga adalah jumlah pendapatan peminjam ditambah dengan jumlah pendapatan suami atau istri peminjam, f. pengeluaran keluarga adalah jumlah pengeluaran keluarga perbulan untuk memenuhi kebutuhan hidup, g. pinjaman adalah besar pinjaman yang dilakukan, h. kemampuan angsuran adalah kemampuan peminjam untuk mengangsur, i. jangka waktu adalah jumlah waktu untuk mengembalikan pinjaman, j. agunan adalah jaminan yang diberikan oleh peminjam, k. status agunan adalah status kepemilikan jaminan, l. nilai jaminan adalah besar nominal uang yang setara dengan jaminan, m. tujuan adalah tujuan digunakannya dana pinjaman, n. tanggal peminjaman adalah tanggal dimana peminjam melakukan pinjaman. Atribut yang digunakan pada data laporan nominatif pinjaman perbulan adalah sebagai berikut: 48 a. No.Anggota digunakan sebagai primary key, b. kolektibilitas adalah status kelancaran peminjam dalam mengangsur pinjaman. Atribut-atribut lain yang tidak digunakan adalah atribut yang telah terwakili oleh atribut yang digunakan, atribut yang tidak ada kaitannya dengan pengklasifikasian, atribut yang nilainya terlalu beragam, dan atribut yang sering tidak mempunyai isian, sehingga atribut tersebut tidak diperlukan pada penelitian ini. Contoh data yang telah dikumpulkan dapat dilihat pada lampiran 2. Setelah data lengkap maka tahap selanjutnya mempersiapkan data tersebut untuk proses data mining yaitu preprocessing yang terdiri dari Data Cleaning, Data Integration, Data Selection, Data Transformation.

B. Pembersihan Data Data Cleaning dan Integrasi Data Data Integration