Model Segmentasi Pelanggan Dengan Kernel K-Means Clustering Berbasis Customer Relationship Management (CRM)
MODEL SEGMENTASI PELANGGAN DENGAN KERNEL
K-MEANS CLUSTERING BERBASIS CUSTOMER
RELATIONSHIP MANAGEMENT (CRM)
TESIS
ABDUL HARIS LUBIS
117038030
PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2013
MODEL SEGMENTASI PELANGGAN DENGAN KERNEL
K-MEANS CLUSTERING BERBASIS CUSTOMER
RELATIONSHIP MANAGEMENT (CRM)
TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Magister Teknik Informatika
ABDUL HARIS LUBIS
117038030
PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2013
PERSETUJUAN Judul Tesis : MODEL SEGMENTASI PELANGGAN DENGAN KERNEL K-MEANS CLUSTERING BERBASIS CUSTOMER RELATIONSHIP MANAGEMENT (CRM) Nama Mahasiswa : ABDUL HARIS LUBIS Nomor Induk Mahasiswa : 117038030 Program Studi : Magister (S2) Teknik Informatika Fakultas : Ilmu Komputer Dan Teknologi Informasi Universitas Sumatera Utara Komisi Pembimbing : Pembimbing 2 Pembimbing 1 Prof. Dr. Drs. Iryanto, M.Si Prof. Dr. Herman Mawengkang Diketahui / Disetujui oleh Program Studi Magister (S2) Teknik Informatika Ketua, Prof. Dr. Muhammad Zarlis . NIP : 195707011986011003
PERNYATAAN
MODEL SEGMENTASI PELANGGAN DENGAN KERNEL
K-MEANS CLUSTERING BERBASIS CUSTOMER
RELATIONSHIP MANAGEMENT (CRM)
TESIS
Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 23 Agustus 2013 ABDUL HARIS LUBIS NIM : 117038030
PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di bawah ini: Nama : ABDUL HARIS LUBIS Nim : 117038030
Program Studi : Magister ( S2) Teknik Informatika Jenis Karya Ilmiah : TESIS
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty
free Right) atas Tesis saya yang berjudul:
MODEL SEGMENTASI PELANGGAN DENGAN KERNEL
K-MEANS CLUSTERING BERBASIS CUSTOMER
RELATIONSHIP MANAGEMENT (CRM)
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non- Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan Tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta.
Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 23 Agustus 2013 ABDUL HARIS LUBIS NIM : 117038030
Telah diuji pada Tanggal : 23 Agustus 2013 PANITIA PENGUJI TESIS Ketua : Prof. Dr. Herman Mawengkang Anggota :
1. Prof. Dr. Iryanto, M.SI
2. Prof. Dr. Muhammad Zarlis
3. Prof. Dr. Tulus
4. Dr. Marwan Ramli, M.S
RIWAYAT HIDUP DATA PRIBADI
Nama lengkap berikut gelar : Abdul Haris Lubis, ST Tempat dan Tanggal Lahir : Medan, 01 Maret 1967 Alamat Rumah : Jl. Klambir V
Komp.Graha Indah Kelapa Gading Blok J-9 Deli Serdang
Telepon / HP : 085359825635 Email
Instansi Tempat Bekerja : PT. Pos Indonesia (Persero) Kantor Area – I Sumatera Utara - Aceh
Alamat Kantor : Jl. HM Yamin SH No. 44 Medan 20231 Telepon / Fax : 061-4570053 Fax: 061-4551161
DATA PENDIDIKAN
SD : SD Negeri No. 060900 Tamat : 1980 SLTP : SMP Pembangun Medan Tamat : 1983 SLTA : STM Negeri – 4 Medan Tamat : 1986
S1 : ISTP - Medan Tamat : 2003 S2 : Teknik Informatika USU Tamat : 2013
KATA PENGANTAR
Segala puja dan puji syukur kehadirat ALLAH SWT karena dengan rahmat dan karunia-NYA sehingga tesis ini dapat diselesaikan melalui bimbingan, arahan, dan bantuan yang telah diberikan dari berbagai pihak khususnya pembimbing, pembanding, para dosen, teman-teman mahasiswa Program Studi Magister (S2) Teknik Informatika Fakultas Ilmu Komputer Dan Teknologi Informasi Universitas Sumatera Utara.
Tesis ini merupakan salah satu syarat yang harus dipenuhi oleh setiap mahasiswa untuk mendapat gelar Magister Komputer. Dengan selesainya tesis ini, perkenankanlah penulis mengucapkan terima kasih banyak kepada :
1. Bapak Prof. Dr. Herman Mawengkang, selaku Ketua Komisi Pembimbing 2. Bapak Prof. Dr. Iryanto, M.Si, selaku anggota Komisi Pembimbing yang dengan penuh perhatian telah memberikan dorongan, bimbingan, kritik dan saran sehingga penulis dapat menyelesaikan tesis ini.
3. Bapak Prof. Dr. Muhammad Zarlis, Ketua Program studi Magister Teknik Informatika sebagai pembanding yang cukup banyak memberikan saran yang berharga dalam perbaikan tesis.
4. Bapak Prof. Dr. Tulus, sebagai Pembanding yang telah memberikan saran, masukan dan arahan yang baik demi penyelesaian tesis ini.
5. Bapak Dr. Marwan Ramli, M.Si, sebagai pembanding yang telah banyak memberikan kritikan yang membangun sehingga selesainya tesis ini.
6. Bapak Drs. Gustap PM Marpaung, SH, sebagai Manajer Pengembangan Ritel Kantor Area - I Sumut-Aceh PT. Pos Indonesia (Persero) yang telah memberikan izin kepada penulis untuk mengikuti program Magister Teknik Informatika USU.
7. Ayahanda (alm) H. Zainuddin Lubis dan Ibunda (Alm) Hj. Rukiyah Samosir, yang semasa hidup mereka senantiasa memberikan curahan kasih sayang, dukungan, do’a kepada penulis, budi baik ini tidak dapat dibalas hanya diserahkan kepada ALLAH SWT.
8. Isteriku Ety Fitriani dan anak-anakku tercinta Herry Arie Chandra dan Amalina Shadrina atas segala keizinan, do’a serta dorongan moril kepada penulis.
9. Bapak / Ibu Pegawai administrasi Program studi Magister Teknik Informatika USU 10. Semua pihak yang telah memberikan bantuan dalam penyelesaian tesis ini.
Terima kasih atas segala bantuan dan dukungan yang telah diberikan sehingga pada akhirnya dapat mengantarkan penulis menyelesaikan pendidikan Magister Teknik Informatika. Dalam penyusunan tesis ini penulis telah berusaha sebaik-baiknya, akan tetapi mungkin masih terdapat banyak kekurangan, karena itu penulis mengharapkan adanya kritik dan saran yang membangun guna penyempurnaan.
Medan, Agustus 2013 Penulis, Abdul Haris Lubis 117038030
ABSTRAK
Tesis ini mengusulkan sebuah model aturan dalam menentukan pelanggan terbaik dan potensial Kantor Pos Medan. Hingga saat ini dalam menentukan pelanggan terbaik dan potensial menjadi persoalan di Instansi-instansi baik pemerintah maupun swasta khususnya yang bergerak dibidang jasa. Faktor- faktor yang berpengaruh secara dominan dalam menentukan pelanggan terbaik dan potensial masih belum dapat ditentukan secara pasti. Saat ini manajemen Kantor Pos Medan masih menggunakan secara manual dalam menentukan pelanggan terbaiknya, sehingga sangat mungkin terjadi kesalahan pada prosedur yang sudah berjalan. Hal ini akan berpengaruh terhadap hasil keputusan yang akan diambil oleh pihak manajemen Kantor Pos Medan. Untuk itu sangat penting dibuat sebuah model aturan untuk menentukan pelanggan terbaik dan potensial yang dapat digunakan pihak manajemen sebagai sistem pendukung dalam pengambilan keputusan. Data yang digunakan dalam penelitian ini berasal dari database Kantor Pos Medan tahun 2011 – bulan maret 2013. Dalam tesis ini algoritma Kernel K-Means Clustering telah digunakan untuk mendapatkan suatu model aturan menentukan pelanggan terbaik dan potensial Kantor Pos Medan. Model aturan yang diperoleh menunjukkan bahwa katagori pelanggan terbaik dapat diperoleh jika transaksinya banyak dan besar uangnya sedang dan tinggi.
Kata kunci : kernel k-means clustering, model aturan, menentukan
CUSTOMER SEGMENTATION MODEL USING KERNEL K-MEANS CLUSTERING BASED ON CUSTOMER RELATIONSHIP
MANAGEMENT (CRM)
ABSTRACTThis thesis proposes a rule model in determining the best and potensial customers of Post Office Medan. Nowadays, determining the best and potensial customer is an issue, both for government agencies and the private sector especially for service firms. Until now, the dominant influencing factors in determining the best and potensial customers remain uncertain. Currently, the Post Office Medan use the manual method in determining its best customers. Hence, it encounter the errors in its existing procedures. Furthermore, it affect the decision making of management of Post Office Medan. It is urgent to establish a role model to determine the best and potensial customers for reliable decision-making system. The data used in this study obtained from database field of Post Office Medan from 2011 to Mrch 2013. The Kernel K-Means Clustering algorithm used to obtain a model rule determine the best and potensial customers of Post Office Medan. The rule model show that the category of best customers can be determined from a large transaction, as well as the medium to hight amount of money.
Keywords : kernel k-means clustering, rules model, determine
DAFTAR ISI
Halaman
LEMBARAN JUDUL LEMBARAN PENGESAHAN
i
ABSTRAK
ii
ABSTACT
iii
DAFTAR ISI
iv
DAFTAR GAMBAR
viii
DAFTAR TABEL x DAFTAR LAMPIRAN xi
BAB I. PENDAHULUAN 1
1.1.1 Latar Balakang Masalah 1.2.
6 Perumusan Masalah 1.3.
7 Batasan Masalah 1.4.
7 Tujuan Penelitian 1.5.
7 Manfaat Penelitian
BAB II. TINJAUAN PUSTAKA 8 2.1.
8 Pendahuluan 2.2. DataWarehouse 9 2.3.
12 Data Mining
2.3.1. Manfaat Data Mining
13
2.3.2 Tahapan Data Mining 14
2.3.3. Penambangan Data (Data Mining) 16
2.3.4 Evaluasi pola dan presentasi Pengetahuan 16
2.3.5 Fungsi-fungsi 16
2.3.6 Penerapan Data Mining 17
2.3.7 CRISP-DM 19
2.4. Customer Relationship Management (CRM)
2.4.1. Teknologi CRM
22
2.4.2. Data Mining Dalam Kerangka Kerja CRM 24 2.5.
25 Clustering
2.5.1. Algoritma Klasifikasi K-Means
26
2.5.2. Clustering Hirarkhi
27
2.5.3. Clustering Partisional
28 2.6.
29 Metode Klasifikasi Fuzzy RFM 2.7.
30 Riset - Riset Terkait 2.8.
33 Persamaan Dengan Riset-Riset Lain 2.9.
34 Perbedaan Dengan Riset – Riset Lain 2.10.
34 Kontribusi Riset
BAB III. METODOLOGI PENELITIAN 35
3.1. Pendahuluan
35
3.2. Rancangan Penelitian
35
3.3. Pra Pemrosesan Data (Preprocessing Data) 36
3.4. Deployment
40
3.5. Prosedur Penelitian
41
3.6. Diagram Aktivitas Penelitian
42
3.7. Tempat dan Waktu Penelitian
43
3.8. Jadwal Penelitian
43 BAB IV. HASIL DAN PEMBAHASAN 44
4.1. Pendahuluan
44
4.2. Hasil Transformasi Data 44
4.3. Cluster Model
47
4.4. Cluster Data Berdasarkan Katagori Terbaik 51
4.5. Analisis Cluster 52
4.5.1 Anggota Cluster Berdasarkan Katagori 52
4.5.1.1 Perhitungan Centroid Awal dengan 3 Nilai Centroid 52
4.5.1.2 Perhitungan Jarak Iterasi Pertama 3 Centroid Cluster 53 Nilai Tahun 2013
BAB IV. HASIL DAN PEMBAHASAN 54
4.5.1.3 Perhitungan Jarak Iterasi Pertama 3 Centroid Cluster 54 Nilai Tahun 2012
4.5.1.4 Perhitungan Jarak Iterasi Pertama 3 Centroid Cluster 55 Nilai Tahun 2011
4.5.1.5 Perhitungan Jarak Iterasi Kedua 3 Centroid Cluster 56 Nilai Tahun 2013
4.5.1.6 Perhitungan Jarak Iterasi Kedua 3 Centroid Cluster 57 Nilai Tahun 2012
4.5.1.7 Perhitungan Jarak Iterasi Kedua 3 Centroid Cluster 58 Nilai Tahun 2011
4.5.1.8 Tabel Hasil Akhir Perhitungan 59
4.5.1.9 Perhitungan Centroid Awal Deangan 2 Nilai Centroid 60
4.5.1.10 Perhitungan Jarak Iterasi Pertama 2 Centroid Cluster 61 Nilai Tahun 2013
4.5.1.11 Perhitungan Jarak Iterasi Pertama Cluster Nilai 62 Tahun 2012
4.5.1.12 Perhitungan Jarak Iterasi Pertama 2 Centroid Cluster 63 Nilai Tahun 2011
4.5.1.13 Perhitungan Jarak Iterasi Kedua 2 Centroid Cluster 64 Nilai Tahun 2013
4.5.1.14 Perhitungan Jarak Iterasi Kedua 2 Centroid Cluster 65 Nilai Tahun 2012
4.5.1.15 Perhitungan Jarak Iterasi Kedua 2 Centroid Cluster 66 Nilai Tahun 2011
4.5.1.16 Perhitungan Hasil Akhir 2 Iterasi Dengan 2 Centroid 67
4.5.2 Interpretasi Cluster 68
4.5.2.1 Nilai Anggota Pada Cluster Pertama (C0) Setelah 68 Di Cluster
4.5.2.2 Nilai Anggota Pada Cluster Pertama (C1) Setelah 69 Di Cluster
4.5.2.3 Nilai Anggota Pada Cluster Pertama (C2) Setelah 69 Di Cluster
4.5.3 Analisis Cluster 70
4.5.3.1 Pengukuran Validitas Dengan Nilai SSE 70
4.5.3.2 Model Aturan (Model Rule) 71
BAB V. KESIMPULAN DAN SARAN 73
5.1 Kesimpulan 73
5.2 Saran 73
DAFTAR GAMBAR Nomor Gambar J u d u l Halaman
57
4.7 Perhitungan Jarak Iterasi Pertama 3 Centroid Cluster Tahun 2013
53
4.8 Perhitungan Jarak Iterasi Pertama 3 Centroid Cluster Tahun 2012
54
4.9 Perhitungan Jarak Iterasi Pertama 3 Centroid Cluster Tahun 2011
55
4.10 Perhitungan Jarak Iterasi Kedua 3 Centroid Tahun 2013
56
4.11 Perhitungan Jarak Iterasi Kedua 3 Centroid Tahun 2012
4.12 Perhitungan Jarak Iterasi Kedua 3 Centroid Tahun 2011
4.6 Nilai Centroid Awal Dengan 3 Centroid
58
4.13 Tabel Hasil Akhir Perhitungan
59
4.14 Perhitungan Centroid Awal Untuk 2 Nilai Centroid
60
4.15 Perhitungan Iterasi Pertama Cluster Nilai Tahun 2013
61
4.16 Perhitungan Iterasi Pertama Cluster Nilai Tahun 2012
62
4.17 Perhitungan Iterasi Pertama Cluster Nilai Tahun 2011
52
51
2.1 Arsitektur Data Warehouse
3.2 Prosedur Penelitian
11
2.2 Tahap-tahap Knowledge Discovery in Database
15
2.3 Siklus Hidup CRISP-DM
19
2.4 Kerangka Kerja Teknik Data Mining Dalam CRM
25
3.1 Tampilan Aplikasi Data Mining
40
41
4.5 Segmentasi Pelanggan Berdasarkan Transaksi
3.3 Gambar Aktivitas Kerja Penelitian
42
4.1 Hasil Transformasi Data Pada Tampilan Aplikasi
45
4.2 Hasil Segmentasi Pelanggan
48
4.3 Persentase Layanan
49
4.4 Hasil Clustering Dalam Data View
50
63
Nomor Gambar J u d u l Halaman
4.18 Perhitungan Iterasi Kedua Cluster Nilai Tahun 2013
64
4.19 Perhitungan Iterasi Kedua Cluster Nilai Tahun 2012
65
4.20 Perhitungan Iterasi Kedua Cluster Nilai Tahun 2011
66
4.21 Perhitungan Hasil Akhir 2 Iterasi Dengan 2 Centroid
67
4.22 Perhitungan Nilai SSE Pada 2 Nilai Centroid
70
DAFTAR TABEL Nomor Tabel J u d u l Halaman
4.5 Nilai Awal Iterasi Untuk 3 Dan 2 Centroid
4.10 Model Aturan (Model Rule)
69
4.9 Nilai Anggota Tahun 2012, Tahun 2012, Tahun 2011 pada (C2)
69
4.8 Nilai Anggota Tahun 2013, Tahun 2012, Tahun 2011 Pada (C1)
68
4.7 Nilai Anggota Tahun 2013, Tahun 2012, Tahun 2011 Pada (C0)
68
4.6 Data Transaksi Pelanggan Sebelum Di Cluster
53
47
2.1 Penelitian Yang Telah Dilakukan
4.4 Cluster Nodel Berdasarkan Monetary
46
4.3 Katagorisasi Atribut
46
4.2 Attribut Yang Digunakan Untuk Segmentasi Pelanggan
45
4.1 Attribut Yang Belum DiKatagorisasikan
3.2 Domain Nilai Untuk Masing-masing Himpunan Fuzzy RFM 39
37
3.1 Data Parsial Dari Database Kantor Pos Medan
33
71