Model Segmentasi Pelanggan Dengan Kernel K-Means Clustering Berbasis Customer Relationship Management (CRM)

  

MODEL SEGMENTASI PELANGGAN DENGAN KERNEL

K-MEANS CLUSTERING BERBASIS CUSTOMER

RELATIONSHIP MANAGEMENT (CRM)

TESIS

  

ABDUL HARIS LUBIS

117038030

PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

  

UNIVERSITAS SUMATERA UTARA

MEDAN

2013

  

MODEL SEGMENTASI PELANGGAN DENGAN KERNEL

K-MEANS CLUSTERING BERBASIS CUSTOMER

RELATIONSHIP MANAGEMENT (CRM)

TESIS

  

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah

Magister Teknik Informatika

ABDUL HARIS LUBIS

117038030

  

PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

  

2013

  PERSETUJUAN Judul Tesis : MODEL SEGMENTASI PELANGGAN DENGAN KERNEL K-MEANS CLUSTERING BERBASIS CUSTOMER RELATIONSHIP MANAGEMENT (CRM) Nama Mahasiswa : ABDUL HARIS LUBIS Nomor Induk Mahasiswa : 117038030 Program Studi : Magister (S2) Teknik Informatika Fakultas : Ilmu Komputer Dan Teknologi Informasi Universitas Sumatera Utara Komisi Pembimbing : Pembimbing 2 Pembimbing 1 Prof. Dr. Drs. Iryanto, M.Si Prof. Dr. Herman Mawengkang Diketahui / Disetujui oleh Program Studi Magister (S2) Teknik Informatika Ketua, Prof. Dr. Muhammad Zarlis . NIP : 195707011986011003

  

PERNYATAAN

MODEL SEGMENTASI PELANGGAN DENGAN KERNEL

K-MEANS CLUSTERING BERBASIS CUSTOMER

RELATIONSHIP MANAGEMENT (CRM)

  

TESIS

  Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.

  Medan, 23 Agustus 2013 ABDUL HARIS LUBIS NIM : 117038030

  

PERNYATAAN PERSETUJUAN PUBLIKASI

KARYA ILMIAH UNTUK KEPENTINGAN

AKADEMIS

  Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di bawah ini: Nama : ABDUL HARIS LUBIS Nim : 117038030

  Program Studi : Magister ( S2) Teknik Informatika Jenis Karya Ilmiah : TESIS

  Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty

  free Right) atas Tesis saya yang berjudul:

MODEL SEGMENTASI PELANGGAN DENGAN KERNEL

K-MEANS CLUSTERING BERBASIS CUSTOMER

RELATIONSHIP MANAGEMENT (CRM)

  Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non- Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan Tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta.

  Demikian pernyataan ini dibuat dengan sebenarnya.

  Medan, 23 Agustus 2013 ABDUL HARIS LUBIS NIM : 117038030

  Telah diuji pada Tanggal : 23 Agustus 2013 PANITIA PENGUJI TESIS Ketua : Prof. Dr. Herman Mawengkang Anggota :

  1. Prof. Dr. Iryanto, M.SI

  2. Prof. Dr. Muhammad Zarlis

  3. Prof. Dr. Tulus

  4. Dr. Marwan Ramli, M.S

RIWAYAT HIDUP DATA PRIBADI

  Nama lengkap berikut gelar : Abdul Haris Lubis, ST Tempat dan Tanggal Lahir : Medan, 01 Maret 1967 Alamat Rumah : Jl. Klambir V

  Komp.Graha Indah Kelapa Gading Blok J-9 Deli Serdang

  Telepon / HP : 085359825635 Email

  Instansi Tempat Bekerja : PT. Pos Indonesia (Persero) Kantor Area – I Sumatera Utara - Aceh

  Alamat Kantor : Jl. HM Yamin SH No. 44 Medan 20231 Telepon / Fax : 061-4570053 Fax: 061-4551161

DATA PENDIDIKAN

  SD : SD Negeri No. 060900 Tamat : 1980 SLTP : SMP Pembangun Medan Tamat : 1983 SLTA : STM Negeri – 4 Medan Tamat : 1986

  S1 : ISTP - Medan Tamat : 2003 S2 : Teknik Informatika USU Tamat : 2013

KATA PENGANTAR

  Segala puja dan puji syukur kehadirat ALLAH SWT karena dengan rahmat dan karunia-NYA sehingga tesis ini dapat diselesaikan melalui bimbingan, arahan, dan bantuan yang telah diberikan dari berbagai pihak khususnya pembimbing, pembanding, para dosen, teman-teman mahasiswa Program Studi Magister (S2) Teknik Informatika Fakultas Ilmu Komputer Dan Teknologi Informasi Universitas Sumatera Utara.

  Tesis ini merupakan salah satu syarat yang harus dipenuhi oleh setiap mahasiswa untuk mendapat gelar Magister Komputer. Dengan selesainya tesis ini, perkenankanlah penulis mengucapkan terima kasih banyak kepada :

  1. Bapak Prof. Dr. Herman Mawengkang, selaku Ketua Komisi Pembimbing 2. Bapak Prof. Dr. Iryanto, M.Si, selaku anggota Komisi Pembimbing yang dengan penuh perhatian telah memberikan dorongan, bimbingan, kritik dan saran sehingga penulis dapat menyelesaikan tesis ini.

  3. Bapak Prof. Dr. Muhammad Zarlis, Ketua Program studi Magister Teknik Informatika sebagai pembanding yang cukup banyak memberikan saran yang berharga dalam perbaikan tesis.

  4. Bapak Prof. Dr. Tulus, sebagai Pembanding yang telah memberikan saran, masukan dan arahan yang baik demi penyelesaian tesis ini.

  5. Bapak Dr. Marwan Ramli, M.Si, sebagai pembanding yang telah banyak memberikan kritikan yang membangun sehingga selesainya tesis ini.

  6. Bapak Drs. Gustap PM Marpaung, SH, sebagai Manajer Pengembangan Ritel Kantor Area - I Sumut-Aceh PT. Pos Indonesia (Persero) yang telah memberikan izin kepada penulis untuk mengikuti program Magister Teknik Informatika USU.

  7. Ayahanda (alm) H. Zainuddin Lubis dan Ibunda (Alm) Hj. Rukiyah Samosir, yang semasa hidup mereka senantiasa memberikan curahan kasih sayang, dukungan, do’a kepada penulis, budi baik ini tidak dapat dibalas hanya diserahkan kepada ALLAH SWT.

  8. Isteriku Ety Fitriani dan anak-anakku tercinta Herry Arie Chandra dan Amalina Shadrina atas segala keizinan, do’a serta dorongan moril kepada penulis.

  9. Bapak / Ibu Pegawai administrasi Program studi Magister Teknik Informatika USU 10. Semua pihak yang telah memberikan bantuan dalam penyelesaian tesis ini.

  Terima kasih atas segala bantuan dan dukungan yang telah diberikan sehingga pada akhirnya dapat mengantarkan penulis menyelesaikan pendidikan Magister Teknik Informatika. Dalam penyusunan tesis ini penulis telah berusaha sebaik-baiknya, akan tetapi mungkin masih terdapat banyak kekurangan, karena itu penulis mengharapkan adanya kritik dan saran yang membangun guna penyempurnaan.

  Medan, Agustus 2013 Penulis, Abdul Haris Lubis 117038030

  

ABSTRAK

  Tesis ini mengusulkan sebuah model aturan dalam menentukan pelanggan terbaik dan potensial Kantor Pos Medan. Hingga saat ini dalam menentukan pelanggan terbaik dan potensial menjadi persoalan di Instansi-instansi baik pemerintah maupun swasta khususnya yang bergerak dibidang jasa. Faktor- faktor yang berpengaruh secara dominan dalam menentukan pelanggan terbaik dan potensial masih belum dapat ditentukan secara pasti. Saat ini manajemen Kantor Pos Medan masih menggunakan secara manual dalam menentukan pelanggan terbaiknya, sehingga sangat mungkin terjadi kesalahan pada prosedur yang sudah berjalan. Hal ini akan berpengaruh terhadap hasil keputusan yang akan diambil oleh pihak manajemen Kantor Pos Medan. Untuk itu sangat penting dibuat sebuah model aturan untuk menentukan pelanggan terbaik dan potensial yang dapat digunakan pihak manajemen sebagai sistem pendukung dalam pengambilan keputusan. Data yang digunakan dalam penelitian ini berasal dari database Kantor Pos Medan tahun 2011 – bulan maret 2013. Dalam tesis ini algoritma Kernel K-Means Clustering telah digunakan untuk mendapatkan suatu model aturan menentukan pelanggan terbaik dan potensial Kantor Pos Medan. Model aturan yang diperoleh menunjukkan bahwa katagori pelanggan terbaik dapat diperoleh jika transaksinya banyak dan besar uangnya sedang dan tinggi.

  Kata kunci : kernel k-means clustering, model aturan, menentukan

CUSTOMER SEGMENTATION MODEL USING KERNEL K-MEANS CLUSTERING BASED ON CUSTOMER RELATIONSHIP

  

MANAGEMENT (CRM)

ABSTRACT

  This thesis proposes a rule model in determining the best and potensial customers of Post Office Medan. Nowadays, determining the best and potensial customer is an issue, both for government agencies and the private sector especially for service firms. Until now, the dominant influencing factors in determining the best and potensial customers remain uncertain. Currently, the Post Office Medan use the manual method in determining its best customers. Hence, it encounter the errors in its existing procedures. Furthermore, it affect the decision making of management of Post Office Medan. It is urgent to establish a role model to determine the best and potensial customers for reliable decision-making system. The data used in this study obtained from database field of Post Office Medan from 2011 to Mrch 2013. The Kernel K-Means Clustering algorithm used to obtain a model rule determine the best and potensial customers of Post Office Medan. The rule model show that the category of best customers can be determined from a large transaction, as well as the medium to hight amount of money.

  Keywords : kernel k-means clustering, rules model, determine

DAFTAR ISI

  Halaman

  LEMBARAN JUDUL LEMBARAN PENGESAHAN

  i

  ABSTRAK

  ii

  ABSTACT

  iii

DAFTAR ISI

  iv

  DAFTAR GAMBAR

  viii

  DAFTAR TABEL x DAFTAR LAMPIRAN xi

BAB I. PENDAHULUAN 1

1.1.

  1 Latar Balakang Masalah 1.2.

  6 Perumusan Masalah 1.3.

  7 Batasan Masalah 1.4.

  7 Tujuan Penelitian 1.5.

  7 Manfaat Penelitian

  BAB II. TINJAUAN PUSTAKA 8 2.1.

  8 Pendahuluan 2.2. DataWarehouse 9 2.3.

  12 Data Mining

  2.3.1. Manfaat Data Mining

  13

  2.3.2 Tahapan Data Mining 14

  2.3.3. Penambangan Data (Data Mining) 16

  2.3.4 Evaluasi pola dan presentasi Pengetahuan 16

  2.3.5 Fungsi-fungsi 16

  2.3.6 Penerapan Data Mining 17

  2.3.7 CRISP-DM 19

2.4. Customer Relationship Management (CRM)

  2.4.1. Teknologi CRM

  22

  2.4.2. Data Mining Dalam Kerangka Kerja CRM 24 2.5.

  25 Clustering

  2.5.1. Algoritma Klasifikasi K-Means

  26

  2.5.2. Clustering Hirarkhi

  27

  2.5.3. Clustering Partisional

  28 2.6.

  29 Metode Klasifikasi Fuzzy RFM 2.7.

  30 Riset - Riset Terkait 2.8.

  33 Persamaan Dengan Riset-Riset Lain 2.9.

  34 Perbedaan Dengan Riset – Riset Lain 2.10.

  34 Kontribusi Riset

BAB III. METODOLOGI PENELITIAN 35

  3.1. Pendahuluan

  35

  3.2. Rancangan Penelitian

  35

  3.3. Pra Pemrosesan Data (Preprocessing Data) 36

  3.4. Deployment

  40

  3.5. Prosedur Penelitian

  41

  3.6. Diagram Aktivitas Penelitian

  42

  3.7. Tempat dan Waktu Penelitian

  43

  3.8. Jadwal Penelitian

  43 BAB IV. HASIL DAN PEMBAHASAN 44

  4.1. Pendahuluan

  44

  4.2. Hasil Transformasi Data 44

  4.3. Cluster Model

  47

  4.4. Cluster Data Berdasarkan Katagori Terbaik 51

  4.5. Analisis Cluster 52

  4.5.1 Anggota Cluster Berdasarkan Katagori 52

  4.5.1.1 Perhitungan Centroid Awal dengan 3 Nilai Centroid 52

  4.5.1.2 Perhitungan Jarak Iterasi Pertama 3 Centroid Cluster 53 Nilai Tahun 2013

BAB IV. HASIL DAN PEMBAHASAN 54

  4.5.1.3 Perhitungan Jarak Iterasi Pertama 3 Centroid Cluster 54 Nilai Tahun 2012

  4.5.1.4 Perhitungan Jarak Iterasi Pertama 3 Centroid Cluster 55 Nilai Tahun 2011

  4.5.1.5 Perhitungan Jarak Iterasi Kedua 3 Centroid Cluster 56 Nilai Tahun 2013

  4.5.1.6 Perhitungan Jarak Iterasi Kedua 3 Centroid Cluster 57 Nilai Tahun 2012

  4.5.1.7 Perhitungan Jarak Iterasi Kedua 3 Centroid Cluster 58 Nilai Tahun 2011

  4.5.1.8 Tabel Hasil Akhir Perhitungan 59

  4.5.1.9 Perhitungan Centroid Awal Deangan 2 Nilai Centroid 60

  4.5.1.10 Perhitungan Jarak Iterasi Pertama 2 Centroid Cluster 61 Nilai Tahun 2013

  4.5.1.11 Perhitungan Jarak Iterasi Pertama Cluster Nilai 62 Tahun 2012

  4.5.1.12 Perhitungan Jarak Iterasi Pertama 2 Centroid Cluster 63 Nilai Tahun 2011

  4.5.1.13 Perhitungan Jarak Iterasi Kedua 2 Centroid Cluster 64 Nilai Tahun 2013

  4.5.1.14 Perhitungan Jarak Iterasi Kedua 2 Centroid Cluster 65 Nilai Tahun 2012

  4.5.1.15 Perhitungan Jarak Iterasi Kedua 2 Centroid Cluster 66 Nilai Tahun 2011

  4.5.1.16 Perhitungan Hasil Akhir 2 Iterasi Dengan 2 Centroid 67

  4.5.2 Interpretasi Cluster 68

  4.5.2.1 Nilai Anggota Pada Cluster Pertama (C0) Setelah 68 Di Cluster

  4.5.2.2 Nilai Anggota Pada Cluster Pertama (C1) Setelah 69 Di Cluster

  4.5.2.3 Nilai Anggota Pada Cluster Pertama (C2) Setelah 69 Di Cluster

  4.5.3 Analisis Cluster 70

  4.5.3.1 Pengukuran Validitas Dengan Nilai SSE 70

  4.5.3.2 Model Aturan (Model Rule) 71

BAB V. KESIMPULAN DAN SARAN 73

  5.1 Kesimpulan 73

  5.2 Saran 73

  DAFTAR GAMBAR Nomor Gambar J u d u l Halaman

  57

  4.7 Perhitungan Jarak Iterasi Pertama 3 Centroid Cluster Tahun 2013

  53

  4.8 Perhitungan Jarak Iterasi Pertama 3 Centroid Cluster Tahun 2012

  54

  4.9 Perhitungan Jarak Iterasi Pertama 3 Centroid Cluster Tahun 2011

  55

  4.10 Perhitungan Jarak Iterasi Kedua 3 Centroid Tahun 2013

  56

  4.11 Perhitungan Jarak Iterasi Kedua 3 Centroid Tahun 2012

  4.12 Perhitungan Jarak Iterasi Kedua 3 Centroid Tahun 2011

  4.6 Nilai Centroid Awal Dengan 3 Centroid

  58

  4.13 Tabel Hasil Akhir Perhitungan

  59

  4.14 Perhitungan Centroid Awal Untuk 2 Nilai Centroid

  60

  4.15 Perhitungan Iterasi Pertama Cluster Nilai Tahun 2013

  61

  4.16 Perhitungan Iterasi Pertama Cluster Nilai Tahun 2012

  62

  4.17 Perhitungan Iterasi Pertama Cluster Nilai Tahun 2011

  52

  51

  2.1 Arsitektur Data Warehouse

  3.2 Prosedur Penelitian

  11

  2.2 Tahap-tahap Knowledge Discovery in Database

  15

  2.3 Siklus Hidup CRISP-DM

  19

  2.4 Kerangka Kerja Teknik Data Mining Dalam CRM

  25

  3.1 Tampilan Aplikasi Data Mining

  40

  41

  4.5 Segmentasi Pelanggan Berdasarkan Transaksi

  3.3 Gambar Aktivitas Kerja Penelitian

  42

  4.1 Hasil Transformasi Data Pada Tampilan Aplikasi

  45

  4.2 Hasil Segmentasi Pelanggan

  48

  4.3 Persentase Layanan

  49

  4.4 Hasil Clustering Dalam Data View

  50

  63

  Nomor Gambar J u d u l Halaman

  4.18 Perhitungan Iterasi Kedua Cluster Nilai Tahun 2013

  64

  4.19 Perhitungan Iterasi Kedua Cluster Nilai Tahun 2012

  65

  4.20 Perhitungan Iterasi Kedua Cluster Nilai Tahun 2011

  66

  4.21 Perhitungan Hasil Akhir 2 Iterasi Dengan 2 Centroid

  67

  4.22 Perhitungan Nilai SSE Pada 2 Nilai Centroid

  70

  DAFTAR TABEL Nomor Tabel J u d u l Halaman

  4.5 Nilai Awal Iterasi Untuk 3 Dan 2 Centroid

  4.10 Model Aturan (Model Rule)

  69

  4.9 Nilai Anggota Tahun 2012, Tahun 2012, Tahun 2011 pada (C2)

  69

  4.8 Nilai Anggota Tahun 2013, Tahun 2012, Tahun 2011 Pada (C1)

  68

  4.7 Nilai Anggota Tahun 2013, Tahun 2012, Tahun 2011 Pada (C0)

  68

  4.6 Data Transaksi Pelanggan Sebelum Di Cluster

  53

  47

  2.1 Penelitian Yang Telah Dilakukan

  4.4 Cluster Nodel Berdasarkan Monetary

  46

  4.3 Katagorisasi Atribut

  46

  4.2 Attribut Yang Digunakan Untuk Segmentasi Pelanggan

  45

  4.1 Attribut Yang Belum DiKatagorisasikan

  3.2 Domain Nilai Untuk Masing-masing Himpunan Fuzzy RFM 39

  37

  3.1 Data Parsial Dari Database Kantor Pos Medan

  33

  71