Penerapan fuzzy C-means clustering pada data nasabah bank.

(1)

ABSTRAK

Debitur atau nasabah bank memang merupakan aset yang sangat penting dalam lembaga keuangan atau bank. Bukan tanpa alasan pihak bank memperhatikan profil nasabah, karena bagaimanapun juga hal ini merupakan bagian yang sangat penting sebagai dokumentasi bank dan siap jika dibutuhkan sewaktu – waktu. Profil nasabah itu sendiri berisi tentang identitas seseorang yang juga menjelaskan kondisi seseorang. Beberapa hal yang dimaksud diantaranya adalah data tentang pekerjaan, data pribadi, data keluarga dan lain sebagainya. Dengan data nasabah yang lengkap, maka pastinya proses pendataan juga akan semakin mudah. Bahkan pihak bank pun harus lebih meneliti setiap nasabah yang masuk terutama jika mereka menghendaki untuk mengajukan kredit. Banyak kasus yang terjadi di bank adalah adanya non performing loan atau kredit macet. Itulah sebabnya pihak bank harus lebih teliti sebelum mengabulkan permohonan kredit.

Pada tugas akhir ini akan di terapkan algoritma Fuzzy C-Means (FCM) untuk mengelompokkan data nasabah bank. Hasil tugas akhir ini yaitu sebuah perangkat lunak yang dapat digunakan sebagai alat bantu untuk pengelompokkan data nasabah bank menggunakan algoritma FCM. Pengujian terhadap sistem ini adalah pengujian menggunakan hasil banding antara sistem dengan uji manual dan uji validalitas.

Berdasarkan hasil pengujian menggunakan hasil banding dengan 15 data dengan nilai jumlah cluster (c) sebanyak 2, pemangkat atau pembobot (w) sebanyak 2, banyak iterasi (i) sebanyak 10 serta toleransi error (e) sebanyak 0.00001, maka dapat disimpulkan bahwa sistem pengelompokan ini dapat menghasilkan keluaran yang sesuai dengan yang diharapkan pengguna. Serta dapat disimpulkan bahwa algoritma FCM dapat mengelompokkan sekumpulan data bertipe numerik.


(2)

ABSTRACT

Debtor or the bank customer is a very important asset in the financial institution or bank. Not without reason the banks pay attention to the customer's profile, but in any case this is a very important part as documentation bank and is ready if needed at any - time. Customer profile itself contains the identity of a person who also describes the condition of a person. Some of those mentioned include data on employment, personal data, family data, and so on. With complete customer data, then of course the data collection process will also be easier. Even the banks must be examined every customer that goes especially if they want to apply for credit.Many cases that occurred in the bank is the existence of non-performing loans or bad credit. That is why the bank should be more careful before granting the loan application.

In this final project will apply the Fuzzy C-Means (FCM) algorithm to segment customer data bank. The results of this thesis is a software that can be used as a tool for grouping data bank customers using FCM algorithm. Testing of the system is to use the results of comparative testing between systems with manual test and the validity test.

Based on test results using the results of the appeal by the 15 data values cluster number (c) by 2, rank or weighting (w) by 2, many iterations (i) 10 as well as the tolerance error (e) of 0.00001, it can beconcluded that the clustering system can produce output that corresponds to the expected users. As well as it can be concluded that the FCM algorithm can segment the data set numeric type.


(3)

i

PENERAPAN FUZZY C-MEANS CLUSTERING PADA DATA NASABAH BANK

HALAMAN JUDUL

SKRIPSI

Diajukan Untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika

Oleh :

Pryscilia Angeline Tanjung NIM : 125314086

PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA YOGYAKARTA


(4)

ii

THE APPLICATION OF FUZZY C-MEANS CLUSTERING ON BANK CUSTOMER DATA

A THESIS

HALAMAN JUDUL (BAHASA INGGRIS)

Presented as Partial Fulfillment of the Requirements

To Obtain the Sarjana Komputer Degree

In Informatics Engineering Study Program

By :

Pryscilia Angeline Tanjung NIM : 125314086

INFORMATICS ENGINEERING STUDY PROGRAM DEPARTMENT OF INFORMATICS ENGINEERING

FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY

YOGYAKARTA 2016


(5)

iii


(6)

iv


(7)

v

HALAMAN PERSEMBAHAN DAN MOTTO

“Janganlah takut, sebab Aku menyertai engkau, janganlah

bimbang, sebab Aku ini Allahmu; Aku meneguhkan, bahkan

akan menolong engkau; Aku akan memegang engkau

dengan tangan kanan-

Ku yang membawa kemenangan. “ –

Yesaya 41 : 10

“Akuilah Dia dalam segala lakumu, maka Ia akan

meluruskan jalanmu” –

Amsal 3:6

“God will make a way when there seems to be no way.”

Skripsi ini penulis persembahkan untuk :

Tuhan Yesus Kristus

Mama Anatasia Rinie Natan

Papa Benno Kakerissa

Papa Anghany Tanjung

Nadine Tamina Benesia Kakerissa

Kong Ais, Guama Santje dan Keluarga Besar Natan


(8)

vi

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa tugas akhir yang saya tulis tidak mengandung atau memuat hasil karya orang lain, kecuali yang telah disebutkan dalam daftar pustaka dan kutipan selayaknya karya ilmiah.

Yogyakarta, 31 Agustus 2016

Penulis


(9)

vii

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma Yogyakarta :

Nama : Pryscilia Angeline Tanjung

NIM : 125314086

Demi pengembangan ilmu pengetahuan, saya memberikan kepada perpustakaan Universitas Sanata Dharma karya ilmiah yang berjudul:

PENERAPAN FUZZY C-MEANS CLUSTERING PADA DATA NASABAH BANK Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan kepada perpustakaan Universitas Sanata Dharma Yogyakarta hak untuk menyimpan, mengalihkan dalam bentuk media lain, mengelola dalam bentuk pangkalan data, mendistribusikan secara terbatas, dan mempublikasikan di internet atau media lain untuk kepentingan akademis tanpa meminja ijin dari saya maupun memberikan royalti kepada saya selama tetap mencantumkan nama saya sebagai penulis. Demikian pernyataan yang saya buat dengan sebenarnya.

Dibuat di Yogyakarta,

Pada tanggal: 31 Agustus 2016 Yang menyatakan,


(10)

viii

KATA PENGANTAR

Puji syukur kepada Tuhan Yesus kristus, karena pada akhirnya penulis dapat menyelesaikan penelitian tugas akhir ini yang berjudul “Penerapan Fuzzy C-Means Clustering Pada Data Nasabah Bank.

Dalam menyelesaikan seluruh penyusunan tugas akhir ini, penulis tak lepas dari doa, bantuan, dukungan, dan motivasi dari banyak pihak. Oleh karena itu, penulis ingin mengucapkan banyak terima kasih kepada :

1. Tuhan Yesus Kristus yang selalu memberikan berkat, anugerah, kekuatan, hikmat serta kasih-Nya yang berlimpah sehingga penulis dapat menyelesaikan tugas akhir ini.

2. Kedua Orang tua saya, Anatasia Rinie Natan dan Benno Kakerissa atas doa, kasih sayang, perhatian, kepercayaan, dukungan baik moral maupun finansial yang diberikan kepadaku.

3. Papa Anghany Tanjung, untuk segala dukungan dalam bentuk doa dan saran yang selalu diberikan kepadaku.

4. Adikku tersayang, Nadine Tamina Benesia Kakerissa, serta para sepupuku Vania, Clarissa dan Zuriel yang selalu memberi keceriaan dalam penyusunan tugas akhir. 5. Tanteku Ronna Natan dan keluarga besar Natan, yang selalu memberikan

semangat, doa dan motivasi dalam penyusunan tugas akhir ini.

6. Bapak Sudi MungkasiS.Si.,M.Math.Sc.,Ph.D selaku Dekan Fakultas Sains dan Teknologi Universitas Sanata Dharma Yogyakarta.

7. Ibu Dr.Anatasia Rita selaku Ketua Program Studi Teknik Informatika Universitas Sanata Dharma Yogyakarta.

8. Bapak Eko Hari Parmadi S.Si., M.Kom. selaku Dosen Pembimbing yang telah dengan sabar membimbing dan memberikan motivasi dalam pengerjaan tugas akhir penulis.

9. Romo Dr. C Kuntoro Adi, S.J. M.A., M.Sc. selaku Dosen Pembimbing Akademik. 10. Seluruh Dosen dan Karyawan jurusan Teknik Informatika Universitas Sanata


(11)

ix

11. Keluarga PMK Apostolos, Lika, Yere, Nenu, Dovan, Anggit, Kintan, Kiki, Putra, Anna, Rely, Agni, Mbak Yudist, Kak Defidan teman – teman apostolos yang lain terimakasih atas doa, dan dukungan kalian bagi penulis.

12. Untuk sahabat – sahabatku Imas, Dhesty, Nita, Itha, Aldy, Astrid, Liadan Riris terima kasih untuk persahabatan yang terjalin selama perkuliahan ini.

13. Novi, Tia, Mbak Tri, Jay dan seluruh teman – teman TI angkatan 2012 untuk bantuannya, kebersamaannya selama pengerjaan tugas akhir ini dan menjalani masa perkuliahan.

14. Serta semua pihak yang telah membantu penyusunan tugas akhir ini yang tidak dapat disebutkan satu persatu.

Penulis menyadari bahwa penulisan laporan tugas akhir ini masih memiliki banyak kekurangan. Untuk itu, penulis sangat membutuhkan saran dan kritik untuk perbaikan di masa yang akan datang. Semoga penulisan laporan tugas akhir ini berguna dan bermanfaat bagi semua pihak.

Yogyakarta, 31 Agustus 2016


(12)

x ABSTRAK

Debitur atau nasabah bank memang merupakan aset yang sangat penting dalam lembaga keuangan atau bank. Bukan tanpa alasan pihak bank memperhatikan profil nasabah, karena bagaimanapun juga hal ini merupakan bagian yang sangat penting sebagai dokumentasi bank dan siap jika dibutuhkan sewaktu – waktu.Profil nasabah itu sendiri berisi tentang identitas seseorang yang juga menjelaskan kondisi seseorang. Beberapa hal yang dimaksud diantaranya adalah data tentang pekerjaan, data pribadi, data keluarga dan lain sebagainya. Dengan data nasabah yang lengkap, maka pastinya proses pendataan juga akan semakin mudah. Bahkan pihak bank pun harus lebih meneliti setiap nasabah yang masuk terutama jika mereka menghendaki untuk mengajukan kredit. Banyak kasus yang terjadi di bank adalah adanya non performing loan atau kredit macet. Itulah sebabnya pihak bank harus lebih teliti sebelum mengabulkan permohonan kredit.

Pada tugas akhir ini akan di terapkan algoritma Fuzzy C-Means (FCM) untuk mengelompokkan data nasabah bank. Hasil tugas akhir ini yaitu sebuah perangkat lunak yang dapat digunakan sebagai alat bantu untuk pengelompokkan data nasabah bank menggunakan algoritma FCM. Pengujian terhadap sistem ini adalah pengujian menggunakan hasil banding antara sistem dengan uji manual dan uji validalitas.

Berdasarkan hasil pengujian menggunakan hasil banding dengan 15 data dengan nilai jumlah cluster (c) sebanyak 2, pemangkat atau pembobot (w) sebanyak 2, banyak iterasi (i) sebanyak 10 serta toleransi error (e) sebanyak 0.00001, maka dapat disimpulkan bahwa sistem pengelompokan ini dapat menghasilkan keluaran yang sesuai dengan yang diharapkan pengguna. Serta dapat disimpulkan bahwa algoritma FCM dapat mengelompokkan sekumpulan data bertipe numerik.


(13)

xi ABSTRACT

Debtor or the bank customer is a very important asset in the financial institution or bank. Not without reason the banks pay attention to the customer's profile, but in any case this is a very important part as documentation bank and is ready if needed at any - time. Customer profile itself contains the identity of a person who also describes the condition of a person. Some of those mentioned include data on employment, personal data, family data, and so on. With complete customer data, then of course the data collection process will also be easier. Even the banks must be examined every customer that goes especially if they want to apply for credit.Many cases that occurred in the bank is the existence of non-performing loans or bad credit. That is why the bank should be more careful before granting the loan application.

In this final project will apply the Fuzzy C-Means (FCM) algorithm to segment customer data bank. The results of this thesis is a software that can be used as a tool for grouping data bank customers using FCM algorithm. Testing of the system is to use the results of comparative testing between systems with manual test and the validity test.

Based on test results using the results of the appeal by the 15 data values cluster number (c) by 2, rank or weighting (w) by 2, many iterations (i) 10 as well as the tolerance error (e) of 0.00001, it can beconcluded that the clustering system can produce output that corresponds to the expected users. As well as it can be concluded that the FCM algorithm can segment the data set numeric type.


(14)

xii DAFTAR ISI

HALAMAN JUDUL... i

HALAMAN JUDUL (BAHASA INGGRIS) ... ii

HALAMAN PERSETUJUAN ... iii

HALAMAN PENGESAHAN ... iv

HALAMAN PERSEMBAHAN DAN MOTTO ... v

PERNYATAAN KEASLIAN KARYA ... vi

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS ... vii

KATA PENGANTAR ... viii

ABSTRAK ... x

ABSTRACT ... xi

DAFTAR ISI ... xii

DAFTAR GAMBAR ... xvi

DAFTAR TABEL... xvii

BAB I PENDAHULUAN ... 1

1.1. Latar Belakang Masalah ... 1

1.2. Rumusan Masalah ... 2

1.3. Batasan Masalah ... 2

1.4. Tujuan dan Manfaat ... 3

1.5. Metodologi Penelitian ... 3

1.6. Sistematika Penulisan ... 5

BAB II LANDASAN TEORI... 7

2.1 Penambangan Data ... 7

2.1.1 Pengertian Penambangan Data ... 7

2.1.2 Teknik dalam Penambangan Data ... 8

2.1.3 Tujuan Penambangan Data... 8

2.1.4 Knowledge Discovery in Databases (KDD) ... 9

2.1.5 Konsep Clustering ... 11

2.2 Fuzzy C-Means(FCM)... 12

2.2.1 Algoritma Fuzzy C-Means(FCM) ... 12


(15)

xiii

2.3 Silhouette Index ... 18

2.4 Bank ... 19

2.4.1 Pengertian Bank ... 19

2.4.2 Jenis – jenis Bank ... 20

2.4.3 Fungsi Bank ... 20

2.5 Nasabah ... 21

2.5.1 Pengertian Nasabah... 21

2.6 Kredit ... 22

2.6.1 Pengertian Kredit ... 22

2.6.2 Unsur – unsur Kredit ... 22

2.7 Notasi Pemodelan Sistem ... 23

2.7.1 Use Case Diagram ... 23

2.7.1.1 Simbol Use Casedan Aktor ... 23

2.7.1.2 Relasi (Relationship) ... 24

2.7.2 Pemodelan Proses ... 25

BAB III METODOLOGI PENELITIAN ... 27

3.1 Gambaran Umum... 27

3.2 Desain Penelitian ... 27

3.2.1 Studi Pustaka ... 27

3.2.2 Data ... 27

3.2.3 Perancangan Aplikasi... 28

3.3 Kebutuhan Perangkat Lunak dan Keras ... 32

3.3.1 Kebutuhan Perangkat Lunak ... 32

3.3.2 Kebutuhan Perangkat Keras ... 33

BAB IV PERANCANGAN SISTEM ... 34

4.1 Analisis Kebutuhan ... 34

4.1.1 Identifikasi sistem ... 34

4.2 Desain Logikal (Logical Design)... 35

4.2.1 Desain Proses ... 35

4.2.1.1 Use Case Diagram ... 35

4.2.1.2 Input Sistem ... 36

4.2.1.3 Proses Sistem ... 36


(16)

xiv

4.2.1.5 Desain Proses Umum Sistem ... 37

4.2.1.6 Diagram Aktivitas (Activity Diagram)... 38

4.2.1.7 Diagram Kelas (Class Diagram) ... 40

4.2.1.8 Diagram Konteks (Context Diagram) ... 40

4.3 Desain Fisikal (Physical Design)... 41

4.3.1 Desain Manajemen Dialog ... 41

4.3.1.1 Halaman Utama... 41

4.3.1.2 Halaman Input Berkas atau Data ... 41

4.3.1.3 Halaman Fuzzy C-Means ... 42

4.3.1.4 Halaman Panduan... 43

BAB V IMPLEMENTASI SISTEM DAN ANALISA HASIL ... 44

5.1 Implementasi Sistem ... 44

5.1.1 Implementasi Tampilan Antarmuka ... 45

5.1.1.1 Halaman Utama... 45

5.1.1.2 Halaman Input Data ... 45

5.1.1.3 Halaman Fuzzy C-Means ... 48

5.1.1.4 Halaman Panduan... 51

5.1.2 Implementasi Kelas... 52

5.1.2.1 Implementasi Kelas HalamanUtama ... 52

5.1.2.2 Implementasi Kelas HalamanInputData ... 53

5.1.2.3 Implementasi Kelas FuzzyCMeans ... 55

5.1.2.4 Implementasi Kelas HalamanFuzzyCMeans ... 58

5.1.2.5 Implementasi Kelas Panduan ... 60

5.2 AnalisisHasil... 60

5.2.1 Pengujian Algortima FCM pada Sistem ... 61

5.2.2 Pengujian Perbandingan Hasil Secara Manual dan Sistem ... 62

5.2.3 Pengujian Perubahan nilai Pemangkat / Pembobot (w) ... 63

5.2.4 Pengujian Kualitas cluster menggunakan Silhouette Index ... 70

5.3 Kelebihan dan Kekurangan Sistem ... 71

5.3.1 Kelebihan Sistem ... 71

5.3.2 Kekurangan Sistem ... 72

BAB VI KESIMPULAN DAN SARAN ... 73


(17)

xv

6.2 SARAN ... 73 DAFTAR PUSTAKA ... 75 LAMPIRAN ... 78


(18)

xvi

DAFTAR GAMBAR

Gambar 2. 1 Proses Knowledge Discovery in Databases (Han & Kamber, 2006) ... 10

Gambar 2. 2 Simbol Use Case... 23

Gambar 2. 3 Simbol Aktor ... 24

Gambar 2. 4 Simbol kesatuan luar / external agent ... 25

Gambar 2. 5 Simbol Arus data ... 26

Gambar 2. 6 Simbol Proses ... 26

Gambar 2. 7 Simbol Data Store ... 26

Gambar 4. 1Use Case Diagram ... 36

Gambar 4. 2 Proses Umum Sistem ... 37

Gambar 4. 3 Activity Diagram Input Data ... 38

Gambar 4. 4 Activity Diagram Proses Clustering ... 38

Gambar 4. 5 Activity Diagram Seleksi Atribut ... 39

Gambar 4. 6 Activity Diagram Simpan hasil clustering ... 39

Gambar 4. 7 Diagram Kelas ... 40

Gambar 4. 8 Diagram Konteks ... 41

Gambar 4. 9 Halaman Utama ... 41

Gambar 4. 10 Halaman Input Data ... 42

Gambar 4. 11 Halaman Fuzzy C-Means ... 42

Gambar 4. 12 Halaman Panduan ... 43

Gambar 5. 1 Halaman Utama ... 45

Gambar 5. 2 Halaman Input Data ... 46

Gambar 5. 3 Halaman Input Data (berkas .xls atau .csv) ... 46

Gambar 5. 4 Halaman Input Data (hapus atribut)... 47

Gambar 5. 5 Halaman Input Data (hasil hapus atribut) ... 48

Gambar 5. 6 Halaman Fuzzy C-Means ... 49

Gambar 5. 7Halaman Fuzzy C-Means (Clustering)... 50

Gambar 5. 8 Halaman Fuzzy C-Means (Simpan Hasil Clustering) ... 51

Gambar 5. 9 Halaman Panduan ... 52


(19)

xvii

DAFTAR TABEL

Tabel 2. 1 Data kunjungan wisata bulan Januari dari tahun 2006 – 2010 ... 14

Tabel 2. 2Komponen Perhitungan ... 14

Tabel 2. 3 Perhitungan Manual (Bangkitkan nilai random) ... 15

Tabel 2. 4 Perhitungan Manual (Hitung Pusat cluster - 1)... 15

Tabel 2. 5 Perhitungan Manual (Hitung Pusat cluster - 2)... 15

Tabel 2. 6 Perhitungan Manual (Hitung Pusat cluster - 3)... 15

Tabel 2. 7 Perhitungan Manual (Pusat Cluster yang baru) ... 16

Tabel 2. 8 Perhitungan Manual (Hitung fungsi objektif (cluster 1)) ... 16

Tabel 2. 9 Perhitungan Manual (Hitung fungsi objektif (cluster 2)) ... 16

Tabel 2. 10 Perhitungan Manual (Hitung fungsi objektif (cluster 3)) ... 17

Tabel 2. 11 Perhitungan Manual (Hitung nilai Total P1, P2, P3) ... 17

Tabel 2. 12 Perhitungan Manual (Memperbaharui Matriks Partisi) ... 17

Tabel 2. 13 Hasil akhir perhitungan fuzzy c-means ... 18

Tabel 3. 1Tabel Atribut Data ... 27

Tabel 3. 2 Tabel Seleksi Atribut ... 29

Tabel 3. 3 Tabel Jumlah Cluster ... 29

Tabel 3. 4 Tabel Matriks Nilai Random... 30

Tabel 3. 5 Tabel Hitung Pusat Cluster ... 79

Tabel 3. 6 Tabel Hitung Fungsi Objektif ... 80

Tabel 3. 7 Tabel Perubahan Matriks ... 83

Tabel 5. 1 Tabel nama kelas yang diimplementasikan ... 44

Tabel 5. 2 Hasil perbandingan data uji manual dengan Sistem ... 63

Tabel 5. 3 Uji perubahan nilai pemangkat / pembobot (w) dengan jumlah galat = 0.00001 dan maks iterasi = 10. ... 64

Tabel 5. 4 Uji perubahan nilai pemangkat / pembobot (w) dengan jumlah galat = 0.01 dan maks iterasi = 100. ... 65

Tabel 5. 5 Uji perubahan nilai pemangkat / pembobot (w) dengan jumlah galat = 0.00001 dan maks iterasi = 100. ... 67


(20)

xviii

Tabel 5. 6 Uji perubahan nilai pemangkat / pembobot (w) dengan jumlah galat = 0.01 dan maks iterasi = 10. ... 68 Tabel 5. 7 Hasil Uji Kualitas clusterSilhouette Index per cluster... 70 Tabel 5. 8 Data sampel yang di uji ... 85 Tabel 5. 9 Uji Kualitas cluster menggunakan Silhouette Index dengan data cluster 1 terhadap data cluster 2. ... 86 Tabel 5. 10Uji Kualitas cluster menggunakan Silhouette Index dengan data cluster 2 terhadap data cluster 1. ... 87 Tabel 5. 11 Tabel Data Cluster untuk Uji Kualitas clusterSilhouette Index ... 88


(21)

1 BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

Bank memiliki peranan yang sangat penting dalam menggerakkan roda perekonomian nasional. Sebagaimana umumnya negara berkembang, sumber pembiayaan dunia usaha di Indonesia masih di dominasi oleh penyaluran kredit perbankan yang diharapkan dapat mendorong pertumbuhan ekonomi. Kegiatan perkreditan dapat terjadi dalam segala aspek kehidupan manusia. Dengan demikian majunya perekonomian di masyarakat, maka kegiatan perkreditan semakin mendesak kegiatan perekonomian yang dilaksanakan secara tunai.Kegiatan perkreditan ini meliputi semua aspek ekonomi baik di bidang produksi, distribusi, konsumsi, perdagangan, investasi, maupun bidang jasa dalam bentuk uang tunai, barang dan jasa. Dengan demikian, kegiatan perkreditan dapat dilakukan antar individu – individu dengan badan usaha atau antar badan usaha (Wahyudi, 2003).

Individu – individu tersebut disebut dengan debitur atau nasabah bank memang merupakan aset yang sangat penting dalam lembaga keuangan atau bank. Meskipun demikian, ada beberapa hal yang benar-benar harus diperhatikan pada setiap nasabah atau calon nasabah agar tidak ada hal – hal yang tidak diinginkan terjadi di kemudian hari. Bukan tanpa alasan pihak bank memperhatikan profil nasabah, karena bagaimanapun juga hal ini merupakan bagian yang sangat penting sebagai dokumentasi bank dan siap jika dibutuhkan sewaktu – waktu.

Meskipun hal ini tampaknya sepele, tapi kenyataannya mengenali profil nasabah merupakan hal yang penting dalam dunia perbankan. Itu sebabnya ketika seseorang akan mendaftar menjadi nasabah baru, maka akan diminta untuk mengisi formulir terlebih dahulu dengan lengkap, jelas dan sebenar - benarnya.Profil nasabah itu sendiri berisi tentang identitas seseorang yang juga menjelaskan kondisi seseorang. Melalui profil inilah, pihak bank bisa mengetahui tentang berbagai hal mengenai nasabah itu sendiri. Beberapa hal yang dimaksud diantaranya adalah data tentang pekerjaan, data pribadi, data keluarga dan lain sebagainya. Melalui formulir yang diisi dengan lengkap


(22)

biasanya pihak bank akan bisa melakukan identifikasi terhadap kondisi nasabah dengan lebih mudah. Hal inilah yang merupakan salah satu dari tujuan mengetahui profil nasabah sehingga tidak perlu dipertanyakan lagi bahwa profil memang mempunyai peran sangat penting. Dengan data nasabah yang lengkap, maka pastinya proses pendataan juga akan semakin mudah. Bahkan pihak bank pun harus lebih meneliti setiap nasabah yang masuk terutama jika mereka menghendaki untuk mengajukan kredit. Banyak kasus yang terjadi di bank adalah adanya non performing loan atau kredit macet. Itulah sebabnya pihak bank harus lebih teliti sebelum mengabulkan permohonan kredit.

Dari latar belakang tersebut, penulis tertarik untuk menerapkan algoritma Fuzzy C-Means clusteringpada data nasabah bankdengan cara membagi data menjadi kelompok – kelompok yang dapat membantu kegiatan perbankan terlebih dalam melihat profil nasabah ketika nasabah baru ingin melakukan kredit berdasarkan data nasabah bank, serta dapat digunakan sebagai media dan acuan untuk dapat dimanfaatkan secara optimal terutama dalam kegiatan perbankan pada umumnya dengan menggunakan algoritma Fuzzy C-Means clustering.

1.2. Rumusan Masalah

Berdasarkan uraian dari latar belakang masalah, dapat dirumuskan sebuah permasalahan yaitu :

1. Bagaimana menerapkan Fuzzy C-Means clustering untuk melihat profil data nasabah bank?

2. Apakah penerapan algoritma Fuzzy C-Means clustering dapat dipergunakan pada data profil nasabah bank dengan memberikan validalitas yang baik?

1.3. Batasan Masalah

Penyusunan tugas akhir ini dibatasi oleh beberapa hal, sebagai berikut :

1. Metode yang digunakan dalam penelitian ini adalah metode clustering algoritma Fuzzy C-Means clustering.


(23)

3. Atribut – atribut clusteringnya berupa jumlah pinjaman, angsuran, dan jangka waktu pinjaman.

4. Atribut dari data berupa jumlah pinjaman, angsuran, agunan, nilai agunan, jangka waktu pinjaman, tunggakan pokok dan tunggakan bunga. 5. Aplikasi dibuat menggunakan pemograman Java berbasisdekstop.

1.4. Tujuan dan Manfaat

1. Tujuan dari penelitian ini adalah membantu, mendesain, mengimplementasikan algoritma Fuzzy C-Means clustering untuk mengelompokkan nasabah bank berdasarkan profil dari nasabah bank yang akan melakukan kredit dengan atribut – atribut yang diperolehdari data nasabah bankBPR dengan menggunakan algoritma Fuzzy C-Means clustering.

2. Manfaat dari penelitian ini adalah memberikan gambaran tentang langkah – langkah implementasi algoritma Fuzzy C-Means clustering dalam menghasilkan pengelompokan profil nasabah bank berdasarkan atribut dari data nasabah bank serta menjadi referensi bagi penelitian yang berkaitan dengan clustering nasabah bank yang lebih lanjut lagi.

1.5. Metodologi Penelitian

Metode yang digunakan untuk merancang sistem dan menyelesaikan permasalahan adalah dengan cara sebagai berikut :

1. Survei Awal

Dilakukan survei awal dengan mengunjungi sebuah Bank Perkreditan Rakyat di DIY untuk mengadakan wawancara untuk memperoleh data mengenai hal – hal yang berhubungan dengan sistem aplikasi yang akan dibuat.

2. Studi Pustaka

Metode ini digunakan untuk mencari dan mempelajari informasi – informasi serta cara kerja yang berkaitan dengan algoritma Fuzzy C-Means.


(24)

3. Pengembangan Aplikasi

Pada tahap ini penulis menggunakan metode Knowledge Discovery in Database (KDD) yang ditulis oleh Jiawei Han, Micheline Kamber dan Jian Pei. Adapun metode KDD mempunyai tahapan – tahapan sebagai berikut :

a. Data Cleaning

Pada tahap ini merupakan proses dimana data yang tidak dibutuhkan atau pengganggu (noise) dan data yang tidak konsisten akan dihapus.

b. Data integration

Pada tahap ini merupakan proses dimana bermacam – macam data dari berbagai sumber akan digabungkan menjadi satu kesatuan.

c. Data Selection

Pada tahap ini merupakan proses dimana untuk melakukan analisis, data relevan akan diperoleh dari database.

d. Data Transformation

Pada tahap ini merupakan proses dimana data diubah (transformasi) atau digabungkan sehingga menjadi tepat untuk ditambang dengan misalnya melakukan operasi penjumlahan atau penggabungan.

e. Data Mining

Pada tahap ini merupakan proses pokok dimana metode cerdas dilaksanakan untuk menggali pola dari data.

f. Pattern Evaluation

Pada tahap ini merupakan proses identifikasi pola yang sungguh menarik menampilkan basis pengetahuan dalam suatu ukuran ketertarikan dengan menggunakan uji evaluasi Silhouette Index.

g. Knowledge Presentation

Pada tahap ini merupakan proses dimana teknik menampilkan suatu gambaran dan pengetahuan digunakan untuk


(25)

menampilkan hasil tambang dari pengetahuan kepada pengguna.

4. Analisis Hasil

Pada tahap ini dilakukan validasi terhadap hasil pengujian sistem aplikasi terhadap hasil perhitungan manual yang dilakukan dengan Microsoft Excel dan pembahasan uji kualitas clusterSilhouette Index (SI).

1.6. Sistematika Penulisan

Tugas akhir ini disusun dalam suatu laporan yang dibagi secara sistematis menjadi 6 bab, adapun ringkasannya sebagai berikut :

a. Bab I : Pendahuluan

Bab ini memuat latar belakang masalah, rumusan masalah, batasan masalah, tujuan penelitian, metodologi penelitian dan sistematika penulisan.

b. Bab II : Landasan Teori

Bab ini menguraikan berbagai teori yang di dapatkan dari sumber pustaka yang digunakan untuk penyusunan tugas akhir, antara lain yaitu penambangan data, konsep clustering, algoritma fuzzy c-means clustering, bank, kredit, serta Silhouette index.

c. Bab III : Metodologi Penelitian

Bab ini berisi tentang gambaran umum sistem yang akan dibangun, data yang digunakan, desain penelitian, kebutuhan perangkat keras dan perangkat lunak.

d. Bab IV : Perancangan Sistem

Bab ini menjelaskan tentang proses – proses perancangan sistem yang akan dibangun, meliputi analisa sistem, use case diagram, serta perancangan sistem seperti desain umum sistem, diagram ER (Entity Relationship), context diagram, activity diagram, dan rancangan antar muka.


(26)

Bab ini berisi tentang implementasi perancangan antarmuka dan analisa dari hasil pembuatan sistem, yakni membahas tentang hasil pengujian yang dilakukan pada sistem untuk mencari kekurangan sistem.

f. Bab VI : Kesimpulan dan Saran

Bab ini berisi kesimpulan yang menguraikan pernyataan singkat yang dijabarkan dari hasil analisis kegiatan atau riset implementasi dalam penyusunan tugas akhir. Saran – saran memuat langkah – langkah kegiatan dalam riset atau metode pengembangan yang belum dilakukan dalam riset namun dirasa akan memperbaiki kinerja sistem jika langkah – langkah tersebut dilaksanakan pada riset mendatang.


(27)

7 BAB II LANDASAN TEORI 2.1 Penambangan Data

2.1.1 Pengertian Penambangan Data

Penambangan data atau data miningadalah serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data (Pramudiono, 2007). Penambangan data didefinisikan sebagai proses menemukan pola-pola dalam data. Proses ini otomatis atau seringnya semi otomatis. Pola yang ditemukan harus penuh arti dan pola tersebut memberikan keuntungan, biasanya keuntungan secara ekonomi. Data yang dibutuhkan dalam jumlah besar (Witten & Frank, 2005). Secara sederhana, penambangan data adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar (Davies & Beynon, 2004). Penambangan data sering juga disebut knowledge discovery in database (KDD), adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. Keluaran dari penambangan data ini bisa dipakai untuk memperbaiki pengambilan keputusan di masa depan (Santoso, 2007).

Menurut Tan et.al (2006),data mining adalah teknologi yang memadukan metode analisis data tradisional dengan algoritma yang canggih untuk memproses volume data yang besar. Dalam bukunya disebutkan bahwa penambangan data adalah proses menemukan informasi yang berguna dari repositori data yang besar secara otomatis.

Namun tidak semua tugas menemukan informasi dapat dicari menggunakan penambangan data. Meski tugas-tugas seperti yang penting dan mungkin melibatkan penggunaan algoritma yang canggih dan struktur data, tetap harus mengandalkan teknik ilmu komputer tradisional dan fitur yang jelas dari data. Hal ini perlu dalam membuat struktur indeks untuk secara efisien mengatur dan mengambil informasi. Meskipun demikian, teknik penambangan data telah digunakan untuk meningkatkan sistem pencarian informasi.


(28)

2.1.2 Teknik dalam Penambangan Data

Teknik dalam penambangan data terbagi atas dua kategori utama, yaitu prediktif dan deskriptif. Kategori prediktif bertujuan untuk memprediksi nilai dari atribut tertentu berdasarka pada nilai dari atribut-atribut lain. Sedangkan kategori deskriptif bertujuan untuk menurunkan pola-pola(korelasi, trend, cluster, trayektori dan anomali) yang meringkas hubungan yang pokok dalam data. Berikut adalah teknik dalam penambangan data :

1. Asosiasi

Asosiasi adalah pencarian aturan-aturan asosiasi yang menunjukkan kondisi-kondisi nilai atribut yang sering terjadi bersama-sama dalam sekumpulan data. Asosiasi sering digunakan untuk menganalisa market basket dan data transaksi.

2. Klasifikasi

Klasifikasi adalah proses menemukan model (fungsi) yang menjelaskan dan membedakan kelas-kelas atau konsep, dengan tujuan agar model yang diperoleh dapat digunakan untuk memprediksikan kelas atau objek yang memiliki label kelas yang tidak diketahui.

3. Clustering

Berbeda dengan klasifikasi, clustering dapat digunakan untuk menentukan atau menganalisis objek data dimana label kelas tidak diketahui dengan cara mengelompokkan data untuk membentuk kelas baru.

4. Outlier

Outlier merupakan objek data yang tidak mengikuti perilaku umum dari data. Outlier dapat dianggap sebagai noise atau pengecualian. Analisis data outlier dinamakan outlier mining. Teknik ini berguna dalam fraud detection dan rare events analysis.

2.1.3 Tujuan Penambangan Data

Tujuan dari data mining (Hoffer et.al, 2007)adalah : 1. Explanatory


(29)

Untuk menjelaskan beberapa kondisi penelitian, seperti mengapa penjualan truk pick-up meningkat di Colorado.

2. Confirmatory

Untuk mempertegas hipotesis, seperti halnya dua kali pendapatan keluarga lebih suka dipakai untuk membeli peralatan keluarga dibandingkan dengan satu kali pendapatan keluarga.

3. Exploratory

Untuk menganalisa data yang memiliki hubungan yang baru. Misalnya, pola apa yang cocok untuk kasus penggelapan kartu kredit.

2.1.4 Knowledge Discovery in Databases (KDD)

Penambangan data tidak dapat terpisahkan dari proses knowledge discovery in databases atau biasa disebut dengan KDD. Proses KDD merupakan sebuah proses mengubah data mentah menjadi suatu informasi yang berguna. KDD sendiri masih memiliki beberapa proses didalamnya, yaitu data cleaning, data integration, data selection, data transformation, data mining, pattern evaluation, dan knowledge presentation (Han & Kamber, 2006).


(30)

Gambar 2. 1 Proses Knowledge Discovery in Databases (Han & Kamber, 2006)

1) Data cleaning

Data cleaning merupakan proses membuang duplikasi data, memeriksa data yang tidak konsisten, dan memperbaiki kesalahan pada data, seperti kesalahan penulisan. Data cleaning juga akan mempengaruhi hasil informasi dari teknik data mining karena data yang ditangani akan berkurang jumlah dan kompleksitasnya.

2) Data integration

Proses menambah data yang sudah ada dengan data atau informasi lain yang relevan atau bisa disebut juga merupakan penggabungan data dari berbagai database kedalam satu database baru yang dibutuhkan oleh KDD.


(31)

Tahapan cleaning dan integration pada KDD mengasumsikan bahwa integrator data harus menghapus noise dari data awal secara paralel dengan mengintegrasikan beberapa data set.

3) Data selection

Pemilihan data yang relevan dan dapat dilakukan analisis dari data operasional. Data hasil pemilihan disimpan dalam database yang terpisah.

4) Data transformation

Proses tranformasi data kedalam bentuk format tertentu sehingga data tersebut sesuai untuk proses data mining. Sebagai contoh beberapa metode standar seperti analisis asosiasi dan clustering hanya bisa menerima input data kategorikal.

5) Data mining

Proses mencari pola atau informasi menarik dengan menggunakan teknik, metode atau algoritma tertentu.

6) Pattern evaluation

Mengidentifikasi pola-pola yang benar-benar menarik dari hasil data mining. Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai atau tidak.

7) Knowledge presentation

Menampilkan pola informasi yang dihasilkan dari proses data mining, visualisasi ini membantu mengkomunikasikan hasil data mining dalam bentuk yang mudah dimengerti.

2.1.5 Konsep Clustering

Pada dasarnya clustering merupakan suatu metode untuk mencari dan mengelompokkan data yang memiliki kemiripan karakteristik (similarity) antara satu data dengan data yang lain. Tujuan utama dari metode clustering adalah pengelompokan sejumlah data/obyek ke dalam cluster (group) sehingga dalam setiap cluster akan berisi data yang semirip mungkin (Santoso, 2007).


(32)

Clustering melakukan pengelompokan data yangdidasarkan pada kesamaan antar objek, oleh karena ituklasterisasi digolongkan sebagai metode unsupervisedlearning.

Karakteristik terpenting dari hasil clustering yang baik adalah suatu instance data dalam suatu cluster lebih “mirip” dengan instance yang lain di dalam cluster tersebut daripada dengan instance di luar dari cluster itu. Ukuran kemiripan (similarity measure) tersebut bisa bermacam – macam dan mempengaruhi perhitungan dalam menentukan anggota suatu cluster. Jadi tipe data yang akan di-cluster juga menentukan ukuran apa yang tepat untuk digunakan dalam suatu algoritma.

2.2 Fuzzy C-Means(FCM)

Fuzzy clustering adalah salah satu teknik untuk menentukan cluster optimal dalam suatu ruang vektor yang didasarkan pada bentuk normal Euclidian untuk jarak antar vektor. Ada beberapa algoritma clustering data, salah satu diantaranya adalah Fuzzy C-Means (FCM). Fuzzy C-Means (FCM) adalah suatu teknik pengclusteran data yang mana keberadaan tiap – tiap titik data dalam suatu cluster yang ditentukan oleh derajat keanggotaan. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 1981.

Konsep dasar FCM, pertama kali adalah menentukan pusat cluster, yang akan menandai lokasi rata – rata untuk tiap – tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat. Tiap – tiap titik data memiliki derajat keanggotaan untuk tiap – tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap – tiap titik data secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimisasi fungsi obyektif yang menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut.

2.2.1 Algoritma Fuzzy C-Means(FCM)

Algoritma dari Fuzzy C-Means adalah sebagai berikut (Kusumadewi, 2004) :


(33)

Input data yang akan di cluster X, berupa matriks berukuran n x m (n = jumlah sampel data, m = atribut setiap data). Xij = data sampel

ke-i (i = 1,2,...,n), atribut ke-j (j = 1,2,...,m). b) Tentukan :

Jumlah cluster = c;

 Pangkat / Pembobot = w;

 Maksimum iterasi = MaxIter;

 Error terkecil yang diharapkan = ξ  Fungsi obyektif awal = P0 = 0;

 Iterasi awal = t = 1;

c) Bangkitkan Bilangan Random

Bangkitkan bilangan random μik, i = 1,2,...,n; k = 1,2,...,c; sebagai

elemen – elemen matriks partisi awal U. Hitung jumlah setiap kolom (atribut) :

Qj = μik

=1

… … … …(2.1)

dengan j = 1,2,...,m. Hitung :

� = �

� … … … …(2.2)

d) Hitung Pusat Cluster ke-k

Hitung pusat cluster ke-k : Vkj, dengan k = 1,2,...,c; dan j = 1,2,...,m.

Vkj =

μik w ∗Xij

=1

μ=1 ik w

e) Hitung Fungsi Obyektif

Hitung fungsi obyektif pada iterasi ke-t, Pt :

Pt = Xij − Vkj 2 m

j=1

μik w c

k=1 n

i=1

… … … …(2.3)

f) Hitung Perubahan Matriks


(34)

� = Xij− Vkj

2 =1

−1 −1

Xij − Vkj 2 =1

−1 −1

=1

… … … …(2.4)

dengan i = 1,2,...,n; dan k = 1,2,...,c; g) Cek Kondisi Berhenti

 Jika ( | Pt – Pt-1 | < ξ ) atau (t > MaxIter) maka berhenti;  Jika tidak: t = t + 1, ulangi langkah 4.

2.2.2 Contoh Penerapan Algoritma FCM

Berikut contoh penerapan perhitungan FCM pada kasus kunjungan wisata di Yogyakarta, dengan data wisata yang digunakan sebagai sampel perhitungan, yaitu (Yehuda, 2012):

Tabel 2. 1 Data kunjungan wisata bulan Januari dari tahun 2006 – 2010

Januari

i 2006 2007 2008 2009 2010

1. (Kraton Yogyakarta) 45.540 31.723 43.103 47.486 58.235 2. (Taman Sari) 4.104 5.422 5.424 22.292 12.575 3. (Gembira Loka) 43.783 45.357 51.066 88.967 86.857 4. (Purawisata) 8.615 13.246 11.346 9.460 13.215

Berdasarkan data dari tabel 2.1 ditentukan beberapa komponen perhitungan yang ditunjukkan dalam tabel 2.2 sebagai berikut.

Tabel 2. 2Komponen Perhitungan

No Komponen Perhitungan Keterangan

1. Banyaknya cluster yang diinginkan c = 3

2. Pangkat (pembobot) w = 2

3. Maksimum Iterasi T = 1

4. Error terkecil e = 0,01

5. Fungsi Objektif awal P0 = 0


(35)

Tabel 2. 3 Perhitungan Manual (Bangkitkan nilai random)

μik Xij

i k1 k2 k3 2006 2007 2008 2009 2010

1 0,8 0,2 0 45.540 31,723 43.103 47.486 58.235

2 0,1 0,9 0 4.104 5.422 5.424 22.292 12.575

3 0 0,8 0,2 43.783 45.357 51.066 88.967 86.857

4 0 1 0 8.615 13.246 11.346 9.460 13.215

Tabel 2.3 merupakan tahap selanjutnya yaitu melakukan perhitungan manual fuzzy c-means. Bangkitkan matriks Uik dengan komponen i =

banyaknya data; k = banyak cluster (memiliki nilai acak dari 0 - 1).

Kemudian langkah selanjutnya adalah menghitung pusat cluster seperti pada algoritma yang ditunjukkan pada tabel 2.4 - 2.6 berikut.

Tabel 2. 4 Perhitungan Manual (Hitung Pusat cluster - 1)

i μik1

w μ

ik1 w

* Xi1 μik1

w

* Xi2 μik1

w

* Xi3 μik1

w

* Xi4 μik1

w * Xi5 1 0,64 29088 20302.72 27585.92 30391.04 37270.4

2 0,01 41.04 54.22 54.24 222.92 125.75

3 0 0 0 0 0 0

4 0 0 0 0 0 0

Jmlh 0,65 29129.04 20356.94 27640.16 30613.96 37396.15

Tabel 2. 5 Perhitungan Manual (Hitung Pusat cluster - 2)

i μik2

w μ

ik2 w

* Xi1 μik2

w

* Xi2 μik2

w

* Xi3 μik2

w

* Xi4 μik2

w * Xi5 1 0,04 1818 1268.92 1724.12 1899.44 2329.4

2 0,81 3324.24 4391.82 4393.44 18056.52 10185.75

3 0,64 28021.12 29028.48 32682.24 56938.88 55588.48

4 1 8615 13246 11346 9460 13215

Jmlh 2,49 41778.36 47935.22 50145.8 86354.84 81318.63

Tabel 2. 6 Perhitungan Manual (Hitung Pusat cluster - 3)

i μik3

w μ

ik3 w

* Xi1 μik3

w

* Xi2 μik3

w

* Xi3 μik3

w

* Xi4 μik3

w * Xi5

1 0 0 0 0 0 0


(36)

3 0,04 1751.32 1814.28 2042.64 3558.68 3474.28

4 0 0 0 0 0 0

Jmlh 0,04 1751.32 1814.28 2042.64 3558.68 3474.28

Pada tabel 2.4 – 2.6 ditunjukkan bagaimana cara mendapatkan pusat cluster dengan menggunakan algortima ke-d. Dimana angka acak dipangkatkan dua, kemudian hasil dari angka acak yang telah diberi pembobot dua di kalikan dengan data kunjungan wisata. Masing – masing kolom kemudian di jumlahkan untuk menentukan pusat cluster yang baru. Pusat cluster yang baru ditunjukkan pada tabel 2.7 berikut.

Tabel 2. 7Perhitungan Manual (Pusat Cluster yang baru)

Vkj 1 2 3 4 5

1 44813,908 31318,369 42523,323 47098,4 57532,538

2 16778,458 19291,253 20138,876 34680,659 32658,084

3 43783 45357 51066 88967 86857

Langkah berikutnya adalah menghitung fungsi objektif dengan menggunakan algoritma ke-e. Seperti ditunjukkan pada tabel 2.8 berikut.

Tabel 2. 8 Perhitungan Manual (Hitung fungsi objektif (cluster 1))

i (Xi1 – Vi1)2 (Xi2 – Vi1)2 (Xi3 – Vi1)2 (Xi4 – Vi1)2 (Xi5 – Vi1)2 Total P1 1 404613,4239 163726,0594 336025,3351 150233,76 493452,213 1548050,8

2 1657296584 670621939,3 1376359773 615357481 2021180265 6,314E+09

3 1062770,67 197083153,9 72977329,01 1752979666 859924044,5 2,884E+09

4 1310360918 326610529,6 972025474,2 1416649155 1964044215 5,99E+09

Jumlah 1,522E+10

Tabel 2. 9 Perhitungan Manual (Hitung fungsi objektif (cluster 2))

i (Xi1 – Vi2) 2

(Xi2 – Vi2) 2

(Xi3 – Vi2) 2

(Xi4 – Vi2) 2

(Xi5 – Vi2) 2

Total P2 1 822057330,3 155548479,9 527351014 163976767,6 654178614,8 2,323E+09

2 160641881,3 191243795,8 216527561 153478862,8 403330276,5 1,125E+09


(37)

4 66642042,76 36061134,37 77214659,59 636081622 378033528,5 1,194E+09

Jumlah 1,289E+10

Tabel 2. 10 Perhitungan Manual (Hitung fungsi objektif (cluster 3))

i (Xi1 – Vi3) 2

(Xi2 – Vi3) 2

(Xi3 – Vi3) 2

(Xi4 – Vi3) 2

(Xi5 – Vi3) 2

Total P3 1 2778889 185885956 63409369 1720673361 819218884 2,792E+09

2 1574423041 1594804225 2083192164 4445555625 158130625 9,856E+09

3 1916951089 2057257449 2607736356 7915127089 7544138449 2,204E+09

4 1236788224 1031116321 1577678400 6321363049 4172378,17 1,017E+09

Jumlah 4,486E+10

Tabel 2. 11 Perhitungan Manual (Hitung nilai Total P1, P2, P3)

i Cluster 1 Cluster 2 Cluster 3 P Cluster

Total P1 Ui1w P1 Total P2 Ui2w P2 Total P3 Ui3w P3

1 1548050,791 0,64 990752,51 2,323E+09 0,04 92924488 2,792E+09 0 0 93915240,8

2 6340816042 0,01 63408160 1,125E+09 0,81 911430126 9,856E+09 0 0 974838286

3 2884026964 0 0 8,252E+09 0,64 5,281E+09 2,204E+09 0,04 881648417 6162787655

4 5989690292 0 0 1,194E+09 1 36061134 1,017E+09 0 378033529 1194132988

Jumlah 8425674170

Langkah berikutnya ialah memperbaharui nilai U atau atau memperbaharui nilai matriks dengan hitung pada algoritma ke-f yang ditunjukkan pada tabel 2.12 berikut.

Tabel 2. 12 Perhitungan Manual (Memperbaharui Matriks Partisi)

i LT U1 U2 U3

1 5116626716 0,000302553 0,454031989 0,545665458

2 17322144099 0,366052609 0,064958609 0,568988782

3 33177017455 0,086928458 0,748719767 0,284351775

4 17354941652 0,345128806 0,068806511 0,586064683

Tabel 2.12 merupakan data yang nantinya akan menentukan hasil cluster. Jika perhitungan pada algoritma terakhir atau menghitung kondisi berhenti dengan membagi antara LT dan jumlah total masing – masing


(38)

cluster sudah didapat maka akan dilakukan pembulatan satu angka dibelakang desimal sesuai dengan Error terkecil yang ditentukan pertama kali. Berikut hasil clustering ditunjukkan pada tabel 2.13.

Tabel 2. 13 Hasil akhir perhitungan fuzzy c-means

C1 C2 C3

0,0 0,5 0,5

0,4 0 0,6

0,1 0,7 0,2

0,3 0,1 0,6

2.3 Silhouette Index

Jika DBI digunakan untuk mengukur validasi seluruh cluster dalam set data, maka Silhouette Index (SI) dapat digunakan untuk memvalidasi baik sebuah data, cluster tunggal (satu cluster dari sejumlah cluster), atau bahkan keseluruhan cluster. Metode ini paling banyak digunakan untuk memvalidasi cluster yang menggabungkan nilai kohesi dan separasi. Untuk menghitung nilai SI dari sebuah data ke-i, ada 2 komponen yaitu ai dan bi. aiadalah rata – rata

jarak ke-i terhadap semua data lainnya dalam satu cluster, sedangkan bi

didapatkan dengan menghitung rata – rata jarak data ke-i terhadap semua data dari clusteryang lain tidak dalam satu cluster dengan data ke-i, kemudian yang terkecil ([Tan et al, 2006], [Petrovic, 2003]).

Berikut formula untuk menghitung ai :

= 1

− 1 ( , �)

�=1

�≠

, = 1,2,…, … … … …(2.5)

( , ) adalah jarak data ke-i dengan data ke-r dalam satu clusterj, sedangkan adalah jumlah data dalam cluster ke-j.


(39)

= min

=1,…,

1

( , )

�=1

�≠

, = 1, 2,…, … … … …(2.6)

Untuk mendapatkan Silhouette Index (SI) data ke-i menggunakan persamaan berikut :

�� = −

max{ , }… … … …(2.7)

Nilai ai mengukur seberapa tidak mirip sebuah data dengan cluster

yang diikutinya, nilai yang semakin kecil menandakan semakin tepatnya data tersebut berada dalam cluster tersebut. Nilai bi yang besar menandakan

seberapa jeleknya data terhadapcluster yang lain. Nilai SI yang didapat dalam rentang [-1, +1]. Nilai SI yang mendekati 1 menandakan bahwa data tersebut semakin tepat berada dalam cluster tersebut. Nilai SI negatif (ai> bi)

menandakan bahwa data tersebut tidak tepat berada dalam cluster tersebut (karena lebih dekat ke cluster yang lain).SI bernilai 0 (atau mendekati 0) berarti data tersebut posisinya berada di perbatasan di antara dua cluster.

Untuk nilai SI dari sebuah cluster didapatkan dengan menghitung rata – rata nilai SI semua data yang bergabung dalam cluster tersebut, seperti pada persamaan berikut :

�� = 1 ��

=1

… … … …(2.8)

2.4 Bank

2.4.1 Pengertian Bank

Menurut Undang – Undang No. 10 Tahun 1998, Bank ialah badan usaha yang menghimpun dana dari masyarakat dalam bentuk simpanan dan juga menyalurkannya kepada masyarakat dalam bentuk kredit atau juga bentuk – bentuk lainnya dalam rangka untuk meningkatkan taraf hidup rakyat banyak.


(40)

2.4.2 Jenis – jenis Bank a. Bank Sentral

Bank Sentral ialah jenis bank yang bertugas untuk menerbitkan uang kertas dan juga uang logam untuk dijadikan sebagai alat pembayaran yang sah di dalam suatu negara dan juga mempertahankan konversi yang dimaksud terhadap emas maupun perak maupun keduanya.

b. Bank Umum

Bank Umum ialah jenis bank yang bukan saja dapat untuk meminjamkan ataupun menginvestasikan berbagai jenis tabungan yang diperolehnya, namun tetapi juga dapat memberikan pinjaman dari menciptakan sendiri suatu uang giral.

c. Bank Perkreditan Rakyat (BPR)

Bank Perkreditan Rakyat ialah jenis bank yang melaksanakan kegiatan usaha dengan secara konvensional maupun yang didasarkan pada suatu prinsip syariah yang dalam kegiatannya tidak dapat memberikan jasa di dalam lalu lintas pembayaran.

d. Bank Syariah

Bank Syariah ialah jenis bank yang beroperasi dengan berdasarkan prinsip bagi hasil maupun sesuai dengan kaidah ajaran islam mengenai hukum riba.

2.4.3 Fungsi Bank

a. Fungsi Bank Sebagai Agent Of Trust

Fungsi bank sebagai agent of trust ialah suatu lembaga yang berlandaskan pada suatu kepercayaan. Dasar utama pada kegiatan perbankan yaitu kepercayaan, baik itu sebagai penghimpun dana ataupun penyaluran dana. Dalam hal tersebut, masyarakat akan mau menyimpan dana – dananya di bank apabila dilandasi dengan kepercayaan.

b. Fungsi Bank Sebagai Agent Of Development

Fungsi bank sebagai agent of development ialah suatu lembaga yang memobilisasi dana berguna untuk pembangunan ekonomi suatu


(41)

negara. Kegiatan bank tersebut berupa penghimpun dan juga penyalur dana sangatlah diperlukan bagi lancarnya suatu kegiatan perekonomian di sektor riil. Dalam hal tersebut bank memungkinkan masyarakat itu untuk melakukan kegiatan untuk investasi, distribusi dan juga kegiatan konsumsi barang serta jasa, mengingat bahwa kegiatan investasi, distribusi dan juga konsumsi tidak terlepas dari adanya penggunaan uang.

c. Fungsi Bank Sebagai Agent Of Services

Fungsi bank sebagai agent of services ialah merupakan lembaga yang memberikan suatu pelayanan kepada masyarakat. Dalam hal tersebut bank memberikan jasa pelayanan perbankan kepada masyarakat agar masyarakat tersebut merasa aman dan juga nyaman dalam menyimpan dananya itu. Jasa yang ditawarkan di dalam bank tersebut sangat erat kaitannya dengan suatu kegiatan perekonomian masyarakat secara umum.

2.5 Nasabah

2.5.1 Pengertian Nasabah

Dalam peraturan Bank Indonesia No. 7/7/ PBI 2005 jo No. 10/10 PBI/2008 tentang penyelesaian pengaduan nasabah pasal 1 angka 2 yang dimaksud dengan nasabah atau mitra adalah pihak yang menggunakan jasa bank, termasuk pihak yang tidak memiliki rekening namun memanfaatkan jasa bank untuk melakukan transaksi keuangan. Didalam UU No. 10 Tahun 1998 tentang perbankan dimuat tentang jenis dan pengertian nasabah. Dalam pasal 1 angka 17 disebutkan bahwa pengertian nasabah yaitu pihak yang menggunakan jasa bank.

Menurut Djaslim Saladin dalam bukunya “Dasar-Dasar Manajemen Pemasaran Bank” yang dikutip dari “Kamus Perbankan” menyatakan bahwa “Nasabah atau mitra adalah orang atau badan yang mempunyai rekening simpanan atau pinjaman pada bank”.

Komaruddin dalam “Kamus Perbankan” menyatakan bahwa “Nasabah adalah seseorang atau suatu perusahaan yang mempunyai


(42)

rekening koran atau deposito atau tabungan serupa lainnya pada sebuah bank”.

Dari uraian diatas dapat disimpulkan bahwa karakter nasabah atau mitra yaitu orang atau badan yang mempunyai rekening simpanan atau deposito atau tabungan atau pinjaman pada bank dimana orang atau badan tersebut mempunyai sifat, sikap dan tindakan yang jujur dan bertanggung jawab atau kebiasaan untuk melakukan hal-hal yang baik yang membedakan seseorang dari orang lain.

2.6 Kredit

2.6.1 Pengertian Kredit

Istilah kredit berasal dari bahasa Yunani “Credere” yang berarti kepercayaan, oleh karena itu dasar dari kredit adalah kepercayaan. Seseorang atau semua badan yang memberikan kredit (kreditur) percaya bahwa penerima kredit (debitur) di masa mendatang akan sanggup memenuhi segala sesuatu yang telah dijanjikan itu dapat berupa barang, uang atau jasa (Thomas. S, dkk, 1998).

2.6.2 Unsur – unsur Kredit

Kredit yang diberikan oleh suatu lembaga kredit merupakan pemberian kepercayaan. Berdasarkan hal tersebut di atas, maka unsur – unsur kredit adalah (Thomas. S, dkk, 1998) :

a. Kepercayaan

Kepercayaan, yaitu keyakinan dari si pemberi kredit bahwa prestasi yang diberikannya baik dalam bentuk uang, barang, atau jasa akan benar – benar diterimanya kembali dalam jangka waktu tertentu di masa yang akan datang.

b. Waktu

Waktu, yaitu masa yang memisahkan antara pemberian prestasi dengan kontra prestasi yang akan datang. Dalam unsur waktu ini, terkadang pengertian nilai argo dari uang yaitu uang yang ada sekarang lebih tinggi dari nilai uang yang akan diterima pada masa yang akan datang.


(43)

c. Degree of Risk

Degree of Risk, yaitu suatu tingkat risiko yang akan dihadapi sebagai akibat dari adanya jangka waktu yang memisahkan antara pemberian prestasi dengan kontra prestasi yang akan diterima kemudian hari.

d. Prestasi

Prestasi, yaitu objek kredit yang tidak saja diberikan dalam bentuk uang, tetapi juga dalam bentuk barang atau jasa.

2.7 Notasi Pemodelan Sistem 2.7.1 Use Case Diagram

Use case diagram adalah diagram yang menggambarkan interaksi antara sistem dengan sistem eksternal dan pengguna. Use case diagram akan menggambarkan secara grafikal pengguna sistem dan cara user berinteraksi dengan sistem (Whitten, 2004).

2.7.1.1 Simbol Use Casedan Aktor

Use case digambarkan secara grafik dengan bentuk elips horizontal dengan nama user case tertera dibawah atau didalam elips.

Gambar 2. 2 Simbol Use Case

Aktor merupakan segala sesuatu yang dibutuhkan untuk berinteraksi dengan sistem untuk mengubah informasi. Aktor dapat berupa orang, organisasi atau sistem informasi yang lain atau juga mungkin adalah suatu waktu kejadian.


(44)

Gambar 2. 3 Simbol Aktor 2.7.1.2 Relasi (Relationship)

Relasi digambarkan dengan sebuah garis diantara dua simbol di dalam usecase diagram. Arti relasi dapat berbeda antara satu dengan yang lainnya tergantung pada bagaimana cara garis digambarkan dan tipe simbol apa yang disambungkan.

Ada beberapa jenis relasi yang digunakan untuk menggambarkan use case diagram yaitu :

1. Association

Associationadalah relasi antara aktor dan sebuah use case dimana terjadi interaksi diantara keduanya.

2. Extends

Extendsyaitu sebuah relasi antara extension use case dan use case yang di-extend. Exetension use case adalah sebuahuse case yang berisi langkah – langkah yang diekstrak dari sebuah use case yang lebih kompleks agar menjadi use case lebih sederhana dan kemudian diberikan tambahan fungsinya.

3. Uses atau includes

Uses atau includesyaitu sebuah relasi antara abstract use case dan use case yang mengurangi redundansi antara satu atau lebih use case dengan cara mengkombinasikan langkah – langkah yang umum ditemukan dalam case-nya.

4. Depend on

Depend onyaitu sebuah relasi use caseyang menentukan bahwa use case yang lain harus dibuat sebelum current use case dan dapat menentukan urutan dimana use case tidak perlu untuk dikembangkan. Digambarkan sebagai garis anak panah yang


(45)

dimulai dari satu use case dan menunjuk ke use case yang bergantung padanya. Setiap relasi depends on diberi label <<depends on>>”.

5. Inheritance

Inheritanceyaitu sebuah relasi use case yang tingkah laku pada umumnya menggambarkan dua aktor yang menginisiasi use case yang mana yang ditugaskan dan dieksplorasi dalam abstrak aktor yang baru untuk mengurangi redundansi. Aktor yang lain dapat menurunkan interaksi dari abstrak aktor. Relasi ini digambarkan dengan garis anak panah yang dimulai pada satu aktor dan menunjuk ke abstrak aktor yang memiliki interaksi turunan dari aktor yang pertama.

2.7.2 Pemodelan Proses

Pemodelan proses (Whitten et.al, 2004) adalah teknik yang digunakan untuk mengorganisasikan dan mendokumentasikan proses dari sistem. Data Flow Diagram (DFD) merupakan sebuah model proses yang digunakan untuk menggambarkan aliran data yang melalui sebuah sistem dan proses yang digunakan untuk menggambarkan aliran data yang melalui sebuah sistem dan proses yang dibentuk oleh sistem. Berikut adalah simbol – simbol yang digunakan dalam DFD :

1. Kesatuan luar (external agent / enternal entity)

Kesatuan luar (external agent / enternal entity) merupakan suatu kesatuan yang berbeda di luar sistem yang sedang dikembangkan yang akan memberikan input atau menerima output dari sistem. Suatu kesatuan luar dapat disimbolkan dengan notasi kotak bujur sangkar.

Entity


(46)

2. Arus data (data flow)

Arus data (data flow) yang mengalir diantara proses, penyimpanan data dan kesatuan luar. Arus data adalah data yang menjadi input ke proses atau output dari sebuah proses. Arus data dapat berbentuk formulir atau dokumen yang digunakan oleh proses, laporan tercetak yang dihasilkan oleh sistem, tampilan atau output di layar komputer, surat/memo, blangko isian, transmisi data. Arus data diberi simbol garis dengan anak panah.

Gambar 2. 5 Simbol Arus data 3. Proses

Proses merupakan kegiatan atau kerja yang dilakukan orang, mesin atau komputer dari suatu hasil arus data yang masuk ke dalam proses untuk dihasilkan arus data yang keluar dari proses.Suatu proses dapat ditunjukkan dengan simbol persegi panjang dengan sudut – sudut yang tumpul.

Process

Gambar 2. 6 Simbol Proses

4. Simpanan data (Data store)

Simpanan data (Data store) dapat berupa file / database di sistem komputer, arsip/catatan manual, tabel acuan, agenda buku. Dinamai dengan kata benda.


(47)

27 BAB III

METODOLOGI PENELITIAN

3.1 Gambaran Umum

Penelitian ini bertujuan untuk membangun sebuah sistem yang mampu melakukan proses pengelompokan data nasabah bank menggunakan metode clustering pada teori data mining (penambangan data) dengan algoritma Fuzzy C-Means. Data nasabah bank diperoleh dari sebuah Bank Perkreditan Rakyat di daerah DIY. Data yang digunakan berisi jumlah pinjaman, tunggakan pokok, tunggakan bunga, angsuran, nilai agunan, agunan dan jangka waktu pinjaman. Hasil yang diharapkan dalam sistem ini adalah dapat mempermudah kinerja perbankan dalam proses mengelompokkan data nasabah bank menggunakan algoritma Fuzzy C-Means clustering.

3.2 Desain Penelitian 3.2.1 Studi Pustaka

Studi pustaka dilakukan dengan membaca buku, jurnal serta sumber lain yang berkaitan dengan data mining clustering khususnya clustering fuzzy c-means.

3.2.2 Data

Data yang Digunakan

Data yang digunakan adalah data nasabak bank BPR. Data nasabah bank yang dimaksud meliputi jumlah pinjaman, tunggakan pokok, tunggakan bunga, angsuran, nilai agunan, agunan dan jangka waktu pinjaman.

Tabel 3. 1Tabel Atribut Data

Nama Atribut Keterangan

Jumlah Pinjaman Besar pinjaman yang di pinjam

Tunggakan Pokok Besar tunggakan pokok kredit tanpa

angsuran yang telah jatuh tempo

Tunggakan Bunga Besar tunggakan bunga kredit angsuran atau tanpa angsuran yang telah jatuh tempo


(48)

Angsuran Biaya yang harus dibayarkan setiap bulan selama peminjaman

Nilai Agunan Besar nilai jaminan yang diserahkan debitur

Agunan Nama nilai jaminan yang diserahkan debitur

Jangka Waktu Pinjaman Jangka waktu jatuh tempo pinjaman

Teknik Pengumpulan Data

Teknik pengumpulan data yang digunakan adalah wawancara dan seleksi data. Wawancara dilakukan dengan melakukan tanya jawab dengan salah satu karyawan bank BPR. Melalui wawancara tersebut penulis dapat memperoleh data nasabah bank. Setelah data nasabah bank telah diperoleh kemudian diolah penulis untuk memperoleh profil data nasabah yang ingin melakukan kredit dengan ketentuan tertentu, seperti berapa besar agunan yang dimiliki dengan pinjaman yang akan dilakukan.

3.2.3 Perancangan Aplikasi

Metodologi yang digunakan dalam penelitian ini adalah metode Knowledge Discovery in Database (KDD). Metode KDD memiliki beberapa tahapan sebagai berikut :

a. Pembersihan Data (Data Cleaning)

Pada tahap pertama ini dilakukan proses pembersihan data untuk menghilangkan data yang tidak dibutuhkan atau pengganggu (noise) seperti data yang tidak terisi dan data yang tidak konsisten.

b. Integrasi Data (Data Integration)

Pada tahap selanjutnyaadalah proses penggabunganbermacam – macam data dari berbagai sumber menjadi satu kesatuan.Data yang ada sudah terdapat dalam 1 file sehingga tahap ini tidak dilakukan. c. Seleksi Data (Data Selection)

Pada tahap ini adalah seleksi data dari atribut yang tidak terpakai. Proses seleksi ini dilakukan dengan memilih atribut yang relevan yaitu atribut yang bertipe numerikuntuk digunakan dalam penelitian, dan menghapus atribut yang bertipe non numerik atau yang tidak


(49)

diperlukan dalam penelitian ini. Atribut yang dapat dilanjutkan untuk penelitian adalah :

Tabel 3. 2 Tabel Seleksi Atribut

Nama Atribut Jumlah Pinjaman Tunggakan Pokok Tunggakan Bunga Angsuran

Nilai Agunan

Jangka Waktu Pinjaman

d. Transformasi Data (Data Transformation)

Pada tahap ini merupakan proses dimana data diubah (transformasi) atau digabungkan sehingga menjadi tepat untuk ditambang dengan misalnya melakukan operasi penjumlahan atau penggabungan. Beberapa metode data mining membutuhkan format data yang khusus sebelum bisa diaplikasikan. Pada tahap ini tidak dilakukan tahap transformasi, dikarenakan metode yang digunakan tidak membutuhkan format yang khusus.

e. Data Mining

Pada tahap ini merupakan proses utama saat metode diterapkan untuk mengekstraksi pola data, menemukan knowledgeberharga dan tersembunyi dari data. Pada proses saat ini digunakan aplikasi Microsoft Excel.

1. Menentukan Jumlah Cluster

Tahap ini menentukan jumlah cluster(c), pangkat untuk matriks partisi (w), maksimum iterasi (MaxIter), error terkecil yang diharapkan (ξ), fungsi obyektif awal (P0=0),

dan iterasi awal (t = 1).

Tabel 3. 3 Tabel Jumlah Cluster


(50)

Jumlah cluster c = 2 Pangkat untuk matriks partisi w = 2

Maksimum Iterasi MaxIter = 10 Error terkecil yang diharapakan Ξ = 1e-05

Fungsi objektif awal P0 = 0

Iterasi Awal t = 1

2. Bangkitkan Nilai Random

Tahap ini bangkitkan bilangan random μik, i=1,2,...,n;

k=1,2,...,c sebagai elemen matriks partisi awal U.

Tabel 3. 4 Tabel Matriks Nilai Random Step 2

Matriks Partisi Awal

0,41 0,86

0,28 0,12

0,73 0,28

0,18 0,17

0,03 0,03

0,12 0,74

0,47 0,36

0,31 0,94

0,91 0,71

0,89 0,69

0,49 0,53

0,38 0,2

0,24 0,16

0,26 0,01

0,49 0,93

3. Hitung Pusat Cluster ke-k

Hitung pusat cluster ke-k : Vkj, dengan k = 1,2,...,c; dan j =

1,2,...,m.

Vkj =

μik w ∗Xij

=1

μ=1 ik w … … … … …

(3.1) Dengan :


(51)

μik= derajat keanggotaan untuk data sampel ke-i pada clsuter

ke-k.

W = pangkat / pembobot. Xij = data ke-i, atribut ke-j.

Tabel yang berisi hitung pusat cluster ini terlampir pada lampiran 1.

4. Hitung Fungsi Objektif

Hitung fungsi objektif pada iterasi ke-t menggunakan persamaan berikut :

Pt = Xij− Vkj 2

m

j=1

μik w c

k=1 n

i=1

… … … … …(3.2)

dengan :

Vkj = pusat cluster ke-k untuk atirbut ke-j

μik = derajat keanggotaan untuk data sampel ke-i pada cluster

ke-k

W = pangkat / pembobot. Xij = data ke-i, atribut ke-j

Pt = fungsi objektif pada iterasi ke-t

Tabel yang berisi hitung fungsi objektif ini terlampir pada lampiran 2.

5. Hitung Perubahan Matriks

Hitung perubahan matriks partisi menggunakan persamaan berikut :

� =

Xij − Vkj 2 =1

−1 −1

Xij − Vkj 2 =1

−1 −1

=1

… … … … …(3.3)

Dengan i = 1,2,...,n; dan k = 1,2,...,c. Dimana :


(52)

μik = derajat keanggotaan untuk data sampel ke-i pada cluster

ke-k.

W = pangkat / pembobot. Xij = data ke-i, atribut ke-j

Tabel yang berisi hitung perubahan matriks ini terlampir pada lampiran 3.

6. Cek Kondisi Berhenti Jika :

(|Pt– Pt-1|< ξ)

Atau

(t > MaxIter)

Maka berhenti. Jika tidak: t = t+1, ulangi langkah ke-4.

f. Evaluasi Pola (Pattern Evaluation)

Pada tahap ini akan dilakukan evaluasi pola dari hasil penamabangan data. Sistem aplikasi clusteringini menggunakan algoritma Fuzzy C-Meansyang akan menghasilkan data nasabah bank yang telah di kelompokkan. Selanjutnya akan dilihat dan dievaluasi kembali apakah hasil clustering sudah sesuai dengan hasil yang sebenarnya sehingga dapat melakukan evaluasi hasil clustering menggunakan uji kualitascluster dengan Silhouette Index (SI).

g. Presentasi Pengetahuan (Knowledge Presentation)

Pada tahap ini mempresentasikan atau menampilkan hasil dari pola yang sudah di dapatkan. Hasil akan di tampilkan dalam sistem aplikasi clustering berbentuk dekstop dengan bahasa Java yang dirancang dengan desain antarmuka yang mudah di pahami oleh pengguna.

3.3 Kebutuhan Perangkat Lunak dan Keras 3.3.1 Kebutuhan Perangkat Lunak

Perangkat lunak yang digunakan dalam pembuatan aplikasi ini adalah Sistem Operasi Windows 8. JDK 1.7, dan NetBeans IDE 7.2.


(53)

3.3.2 Kebutuhan Perangkat Keras

Perangkat keras yang digunakan untuk membuat aplikasi ini adalah Laptop dengan spesifikasi processor Intel Core i5, RAM 4 GB, HDD 500 GB.


(54)

34 BAB IV

PERANCANGAN SISTEM 4.1 Analisis Kebutuhan

4.1.1 Identifikasi sistem

Kegiatan perkreditan ini meliputi semua aspek ekonomi baik di bidang produksi, distribusi, konsumsi, perdagangan, investasi, maupun bidang jasa dalam bentuk uang tunai, barang dan jasa. Dengan demikian, kegiatan perkreditan dapat dilakukan antar individu – individu dengan badan usaha atau antar badan usaha (Wahyudi, 2003).Individu – individu tersebut disebut dengan debitur atau nasabah bank memang merupakan aset yang sangat penting dalam lembaga keuangan atau bank. Meskipun demikian, ada beberapa hal yang benar-benar harus diperhatikan pada setiap nasabah atau calon nasabah agar tidak ada hal – hal yang tidak diinginkan terjadi di kemudian hari. Bukan tanpa alasan pihak bank memperhatikan profil nasabah, karena bagaimanapun juga hal ini merupakan bagian yang sangat penting sebagai dokumentasi bank dan siap jika dibutuhkan sewaktu – waktu.

Itu sebabnya ketika seseorang akan mendaftar menjadi nasabah baru, maka akan diminta untuk mengisi formulir terlebih dahulu dengan lengkap, jelas dan sebenar-benarnya. Profil nasabah itu sendiri berisi tentang identitas seseorang yang juga menjelaskan kondisi seseorang. Melalui profil inilah, pihak bank bisa mengetahui tentang berbagai hal mengenai nasabah itu sendiri. Beberapa hal yang dimaksud diantaranya adalah data tentang pekerjaan, data pribadi, data keluarga dan lain sebagainya. Melalui formulir yang diisi dengan lengkap biasanya pihak bank akan bisa melakukan identifikasi terhadap kondisi nasabah dengan lebih mudah. Dengan data nasabah yang lengkap, maka pastinya proses pendataan juga akan semakin mudah. Bahkan pihak bank pun harus lebih meneliti setiap nasabah yang masuk terutama jika mereka menghendaki untuk mengajukan kredit. Banyak kasus yang terjadi di bank adalah adanya non performing loan atau


(55)

kredit macet. Itulah sebabnya pihak bank harus lebih teliti sebelum mengabulkan permohonan kredit.

Sistem ini merupakan implementasi algoritma Fuzzy C-Means clustering untuk melakukan proses pengelompokan atau disebut clustering. Data yang digunakan dalam sistem ini merupakan data yang sudah siap untuk di cluster. Data yang digunakan adalah data nasabah bank BPR di DIY. Data tersebut meliputi jumlah pinjaman, tunggakan pokok, tunggakan bunga, angsuran, nilai agunan, agunan dan jangka waktu pinjaman. Sistem ini bertujuan untuk membantu dan mempermudah bank dalam proses pengelompokkan nasabah bank yang ingin melakukan kredit berdasarkan data nasabah bank dengan menggunakan algoritma Fuzzy C-Means clustering.

4.2 Desain Logikal (Logical Design) 4.2.1 Desain Proses

4.2.1.1 Use Case Diagram

Diagram use case digunakan untuk menggambarkan interaksi antara pengguna dengan sistem. Pengguna dalam sistem ini hanya ada satu, yang diinisialisasikan dengan “operator”. Interaksi yang dapat dilakukan oleh pengguna pada sistem ini adalah memasukkan data yang berekstensi .xls atau .csv , kemudian interaksi berikutnya adalah seleksi atribut, kemudian interaksi proses clustering dengan memasukkan nilai c,w,i dan e. Interaksi berikutnya adalah simpan hasil clustering, kemudian interaksi yang terakhir adalah lihat panduan. Gambar dari use case diagram ditunjukkan pada Gambar 4.1 berikut.


(56)

Operator

Input data .xls atau .csv

System

Seleksi atribut

<< depends on >> << exten

ds >>

<< extends >> Simpan hasil clustering Proses clustering

Input c, w, i, e

Lihat Panduan

Gambar 4. 1Use Case Diagram

4.2.1.2 Input Sistem

Sistem clustering menggunakanFuzzy C-Means clustering hanya dapat menerima masukan dari pengguna berupa file dengan eksrensi .xls atau .csv yang berisi data nasabah bank.

4.2.1.3 Proses Sistem

Sistem ini akan mengimplementasikan algoritma Fuzzy C-Means clustering untuk mengelompokan data nasabah bank BPR berdasarkan jumlah pinjaman, tunggakan pokok, tunggakan bunga, angsuran, nilai agunan, agunan dan jangka waktu pinjaman. Proses yang pertama, pengguna memasukkan data yang akan diolah dalam berntuk file berekstensi .xls atau .csv. Kemudian proses yang kedua, pengguna dapat melakukan seleksi atribut tertentu yang tidak diperlukan dan kemudian di hapus. Proses yang ketiga ialah, pengguna harus memasukan jumlah cluster (c), jumlah pembobot (w), maksimum iterasi (MaxIter), dan toleransi kesalahan (e). Kemudian sistem akan melakukan proses clustering menggunakan algoritma Fuzzy C-Means.


(1)

18 9500000 24 5000000 416800 150000 566800

AB 2999 SN HND NC11A3C A/T 2011 HTM SLVR

19 8500000 12 5000000 359500 132200 491700

AB 6432 SN YMH 28 D (MIO/AL 115 S) A/T 2011 HIJAU

20 10000000 12 5000000 416700 75000 491700 AB 2723 UJ HND NF 125 TD 2011 HTM 21 15000000 24 5000000 208400 75000 283400 AB 6550 E YMH 45P(BYSON) 2012 PTH

22 10000000 24 5000000 208400 75000 283400

AB 6055 RN HND NC110AIC A/T 2011 HTM SLVR

23 15000000 18 5000000 277800 75000 352800

AB 5542 FE HND NC12A1CF A/T 2014 WHT SLVR

24 9500000 24 5500000 229200 46200 275400 AB 3947 XZ YMH 54P A/T 2013 HTM

25 9500000 24 5500000 229200 82500 311700 AB 2261 LF YMH 5D9 (VEGA ZR) 11 MRH MRN

26 10000000 18 6000000 333400 90000 423400

AB 6482 EU HND NC110A1C A/T 2011 HTM SLVR

27 10000000 12 6000000 500000 90000 590000

AB 2305 HZ KWSK AN 125 L 2007 MRH,AB 3075 WG YMH 5TLMIO 2006 HTM

28 11000000 24 6000000 500000 180000 680000 AB-6934-KJ HND NC11B3C A/T 12 HTM

29 12000000 24 6000000 250000 90000 340000

AB 4772 XQ YMH 54P(CAST WHEEL)A/T 13 PTH

30 11500000 18 6000000 333400 90000 423400

AB 2305 DT YMH28 D (MIO /AL 115 S)A/T 2009 HTM ,AB 3915 KU HND NF 100 D 01 HTM

31 11500000 24 6500000 270900 97500 368400

AB 2203 SH, YMH MIO / AL 115S A/T, 2009, MRH MARUN/ AB 3536 BI, HND 28D NF 100 SLD, 2005,HTM

32 11000000 24 6500000 270900 97500 368400

AB-2435-SI SZK UD 110 EE 2012 MRH HTM ,AB-3251-GI KWSK AN 130 B 07 ABU2 33 11000000 12 6500000 541700 97500 639200 AD 6772 BJ HND ACH1M21B04 A/T 2014


(2)

WHITE RED

34 0 24 7000000 1458500 525000 1983500 AB 3092 EE HND CB15A1RRF M/T 2014 HTM 35 13000000 18 7500000 833400 225000 1058400 AB 2673 F YMH 45 P (BYSON) 2010 BIRU

36 14500000 24 8500000 354200 127100 481300

AD 3217 GQ HND NC12A1CF A/T 2012 WHT SLVR ,AD 6030 TC HND NF 125 D NF 125 D 04 HTM

37 18000000 24 9000000 375000 135000 510000 AB 2930 HQ KWSK KR 150 K CKD 2009 HTM

38 18000000 24 10000000 416700 150000 566700

AB 5312 OY HND CB15A1RRF M/T 2014 WHITE RED

39 28000000 24 15000000 4150000 1800000 5950000 AB-8976-AH SZK KBNS 90 PTH

40 30465000 36 15000000 416700 225000 641700

SHM NO 5779 BALECATUR GAMPING SLEMAN DIY

41 27000000 24 15000000 1250000 450000 1700000 AD 8118 RC SZK KATANA SH 1989 ABU2 42 25000000 24 15000000 1250000 450000 1700000

AD 1807 YJ SZK SUPER CARRY ST 100 1995 HTM

43 0 60 16000000 533400 480000 1013400

AB 2836 HE YMH 5MX 05 BRU AB 2231 JA YMH 4D7 07 BRU

44 64811000 36 17000000 1416900 765000 2181900

SHM NO.2888 PANDOWOHARJO SLEMAN SLEMAN DIY 237 M2

45 40000000 36 20000000 555600 300000 855600

SHM NO.3334 CONDONGCATUR DEPOK SLEMAN DIY 168 M2

46 40000000 36 20000000 1111200 559600 1670800 AB 8385 N DAIHATSU F 69 1989 HIJAU 47 50000000 36 25000000 694500 375000 1069500

SHM NO.1147 TAMANAN BANGUNTAPAN BANTUL DIY 402 M2

48 41800000 48 25000000 1041800 449100 1490900

SHM NO 01815 SUMBERADI MLATI SLEMAN DAERAH ISTIMEWA YOGYAKARTA Luas 753 M2


(3)

49 50000000 24 25000000 1041700 375000 1416700 AB 1239 NZ TYT KF 40 1994 BR MTLK

50 55000000 36 27500000 2291700 1155000 3446700 AB 1462 KQ HND CIVIC SR4GM 94 MRH MTLK 51 50000000 48 35000000 2916800 1960000 4876800

SHM NO.1654 /DONOKERTO TURI SLEMAN DIY/480 M2

52 51393000 60 40000000 2666800 2400000 5066800

SHM NO.02345/TRIMURTI SRANDAKAN BANTUL DIY/ 849 M2

53 80000000 36 40000000 2222400 1200000 3422400

SHM NO.6026 SIDOKARTO GODEAN SLEMAN DIY 364 M2

54 96000000 43 48000000 659200 0 659200

SHM NO.470 SLUKE SLUKE REMBANG JAWA TENGAH 1773 M2

55 110835000 60 50000000 2500200 2250000 4750200

SHM NO.2569 /BANGUNJIWO KASIHAN BANTUL DIY/112m2

56 95000000 30 57000000 1900000 712500 2612500

B 7124 FI NISSAN GRAND LIVINA XV AT 2007 HTM MTLK

57 150000000 60 70000000 3500100 3150000 6650100

SHM NO.3442 /SUKOHARJO NGAGLIK SLEMAN DIY/743 M2

58 98000000 30 70000000 7000200 2940000 9940200

SHM NO.2311 NGABEYAN KARTOSURO SUKOHARJO JAWA TENGAH 100 M2 59 117500000 12 75000000 18750000 2925000 21675000

AB 1461 YQ NSSN ERANO KINGSROAD K3 2005 HTM MTLK SLVR

60 135000000 12 80000000 6666700 1120000 7786700

B 118 SMD TYT NEW AVANZA VELOZ 1,5 A/T 2012 PTH

61 175200000 36 82500000 9166800 4620000 13786800

SHM NO.6910 SARDONOHARJO NGAGLIK SLEMAN DAERAH ISTIMEWA YOGYAKARTA Luas 830 M2

62 135000000 36 90000000 7500000 3510000 11010000

SHM NO 105 GUMUL KARANGNONGKO KLATEN JAWA TENGAH 769 M2


(4)

63 200000000 60 100000000 5000100 4500000 9500100

SHM NO.2622/WIDODOMARTANI NGEMPLAK SLEMAN DIY /421 m2

64 160000000 36 100000000 2777800 1400000 4177800

SHM NO.2336 CONDONGCATUR DEPOK SLEMAN DIY 683 M2

65 165000000 36 100000000 5555600 2800000 8355600 AB 1258 UQ TYT INNOVA G 07 HTM MTLK 66 474000000 60 100000000 1666700 1400000 3066700

SHM NO 13648 CONDONGCATUR DEPOK SLEMAN DIY Luas 384 M2

67 256200000 60 100000000 3333400 2800000 6133400

SHM NO 3058 SIDOMOYO GODEAN SLEMAN DAERAH ISTIMEWA YOGYAKARTA LUAS 343 M2

68 952000000 48 150000000 3125000 1950000 5075000

SHM NO 09736 BANGUNTAPAN

BANGUNTAPAN BANTUL DIY L 184 M2 69 1120000000 60 150000000 32500000 27300000 59800000

SHM NO.2293 SHM NO 2296 SHM NO 2294 SHM NO 6883 SHM NO 3626 SHM NO 3628

70 225000000 60 175000000 8750100 6562500 15312600

SHM NO 372 KEMBARAN KEBUMEN

KEBUMEN JAWA TENGAH 372 AB 1592 Z SZK FRS 92 HJU MTL

71 297000000 48 180000000 11250000 7020000 18270000

SHM NO.3671 MINOMARTANI NGAGLIK SLEMAN DAERAH ISTIMEWA YOGYAKARTA Luas 267 M2

72 400000000 36 200000000 105554800 49400000 154954800

SHM NO.02469/SRIMULYO PIYUNGAN BANTUL DIY/58 M2, SHM

NO.1573/JOGOTIRTO BERBAH SLEMAN DIY/424 M2

73 322000000 60 215000000 7166800 4730000 11896800

SHGB NO. 1841 BALECATUR GAMPING SLEMAN DIY 124 M2 NYONYA LIANA


(5)

DIY 182 M2 75 891250000 60 225000000 2162400 4062600 6225000

SHM NO 843 SINDUHARJO NGAGLIK SLEMAN DIY Luas 233 M2

76 480000000 60 250000000 4166700 2750000 6916700

SHM NO 424 TIRTOMARTANI KALASAN SLEMAN DIY LUAS 480 M2

77 420000000 6 300000000 6125000 20000000 26125000

SHM NO.M.1896/Wrb YUNI PURWANTI 156 M2 SHM NO.M.381/Wrb SURONO 120 M2

78 700000000 60 350000000 17500200 15750000 33250200

SHM NO 2492 Rjw REJOWINANGUN KOTAGEDE YOGYAKARTA DAERAH ISTIMEWA YOGYAKARTA 238 M2 79 665000000 60 400000000 20000100 15600000 35600100

SHM NO.8795 CC DPK SLM DIY 100 M2, R 8757 FB TYT AVANZA 1300 G 07 SLVR MTLK

80 1192500000 60 450000000 30000000 23400000 53400000

SHM NO.341 KEBONDALEMKIDUL

PRAMBANAN KLATEN JAWA TENGAH Luas 171 M2

81 711000000 60 450000000 7500000 5850000 13350000

SHM NO 344 PURWOMARTANI KALASAN SLEMAN DAERAH ISTIMEWA YOGYAKARTA L 230 M2

82 625000000 60 500000000 33333600 26500000 59833600

SHM NO.05672 SHM NO 6842 AB 1744 HA TYT AVNZ 1300 G F601RMGMMFJJ 09 ABU ABU MTLK

83 3000000000 72 500000000 13889000 10000000 23889000

SHGB NO.00042 Luas 60 M2 SHGB NO.00044 60 M2

84 1820000000 60 500000000 33333600 26000000 59333600

SHBG NO 02006 CC DPK SLM DIY Luas131 M2, AB 1200 KH TYT RUSH 1,5 G 13 HTM

85 1120000000 6 650000000 650000000 52000000 702000000

SHM NO.2293 SHM NO 2296 SHM NO 2294 SHM NO 6883 SHM NO 3626 SHM NO 3628


(6)

86 1253750000 60 700000000 35000100 27300000 62300100

SHM NO.5810 Luas 463 M2 SHM NO 1764 Luas 177 M2 SHM NO 1763 Luas 363 M2

87 1351000000 60 800000000 7974200 14159200 22133400

SHM NO 7134 SINDUADI MLATI SLEMAN DIY L 386 M2

88 1275000000 6 850000000 850000000 60000000 910000000

SHM NO.2797 BANYURADEN GAMPING SLEMAN DAERAH ISTIMEWA YOGYAKARTA L 1093 M2

89 2624000000 48 900000000 18750000 11700000 30450000

SHGB 740 SINDUHARJO NGAGLIK SLEMAN DAERAH ISTIMEWA YOGYAKARTA Luas 261 M2

90 2223700000 60 900000000 30000000 24300000 54300000

SHM NO.2709 L 602M2,SHM NO2710 L

517M2,SHM NO 1170 L 734M2,SHM NO 1171 L 394M2