BAB 4 HASIL DAN PEMBAHASAN
4.1 Pendahuluan Untuk menunjang proses analisis yang dilakukan, dibuatlah suatu aplikasi
untuk menampilkan data penjualan yang dilakukan tiap konsumen berdasarkan recency, frequency, dan monetary. Aplikasi ini dibuat dengan
menggunakan Clipper 5.3, dan dilengkapi dengan desain hasil akhir dari metode K-Means Clustering serta perhitungan nilai Sum Of Squared Error
SSE, selain itu aplikasi ini juga menampilkan prosentase dari cluster terbaik dan potensial serta prosentase dari jenis layanan yang paling banyak
digunakan dikalangan konsumen..
4.2 Hasil Transformasi Data
Data yang berasal dari format excel khususnya data tahun 2012 dan tahun 2013 akan ditransformasikan menjadi DBF. Hal ini dilakukan untuk
mendapatkan data pengujian yang akan digunakan sebagai data input pada proses clustering menggunakan algoritma Kernel K-Means. Adapun tampilan
transformasi Aplikasi K-Means Clustering sebagaimana pada gambar 4.1 .
Universita Sumatera Utara
Gambar 4.1 Hasil transformasi data pada tampilan aplikasi
Tabel 4.1 Atribut yang belum dikatagorisasikan
No Field Name
Type Width
Dec 1
Institusi Character
20 2
Biasa Numeric
15 3
Kilat Numeric
15 4
SKH Numeric
15 5
Tercatat Numeric
15 6
Posexpress Numeric
15 7
Ems Numeric
15 8
Citykurir Numeric
15 9
Paketpos Numeric
15 10
Bilangan Numeric
5 11
Bsu Numeric
15
Universita Sumatera Utara
Tabel 4.2 Atribut yang digunakan untuk segmentasi pelanggan
No Field Name
Type Width
Dec 1
Cluster Character
12 2
Kode Character
5 3
Monetary Numeric
15 4
Frequency Numeric
15 5
Recency Numeric
15
Tabel 4.3 katagorisasi atribut
ATRIBUT VARIABEL LINQUISTIK
DOMAIN NILAI
Recency SURAT BIASA
SB SURAT KILAT
SK SURAT KILAT KHUSUS
SKH SURAT TERCATAT
ST POS EXPRESS
PE EMS
EMS CITY CURIR
CC PAKETPOS
PK
Frequency SEDIKIT
= 1.000,- Transaksi AGAK BANYAK
1.000,- transaksi BANYAK
7.000,- transaksi
Monetary Rendah
Rp. Rp. 5.000.000,- Sedang
Rp. Rp. 300.000.000,- Tinggi
Rp. Rp. 500.000.000,-
Universita Sumatera Utara
4.3 Cluster Model
Cluster model yang diperoleh dari hasil pengujian terhadap data menggunakan metode Kernel K-Means seperti yang terlihat pada tabel 4.4
cluster model berdasarkan monetary dan pada aplikasi data mining dapat dilihat pada gambar 4.2 hasil segmentasi pelanggan.
Tabel 4.4 Cluster Model Berdasarkan Monetary
CLUSTER MODEL MONETARY DENGAN DATA DARI TAHUN 2011 SD BULAN MARET 2013 NO
KATAGORI CLUSTER
TAHUN Prosen
2013 Rp. 2012 Rp.
2011 Rp. 1 TERBAIK
CL_1 CL_ 2 453,019,022 1,997,017,450 1,561,402,620
69 2 POTENSIAL
CL_3 CL_4 214,224,750
370,979,834 642,276,629
21 3 TIAP HARI
CL_5 CL_6 91,551,460
180,325,000 109,310,117
7 4 KADANG
CL_7 43,153,028
47,122,000 48,013,725
2 5 KRG AKTIF
CL_8 CL_9 5,217,553
6,500,000 7,965,325
TOTAL 807,165,813 2,601,944,284 2,368,968,416
Dari tabel 4.4 dapat dilihat cluster model yang dihasilkan terdiri dari pelanggan katagori terbaik, potensial, tiap hari, kadang-kadang, kurang aktif.
Berdasarkan jumlah besar uang transaksi Monetary untuk pertahun dari bulan januari 2011 sampai dengan bulan maret 2013.
Performa sebuah cluster dapat dilihat dari tampilan aplikasi K-Means Clustering dalam format tabel sebagai berikut :
Universita Sumatera Utara
Gambar 4.2 Hasil Segmentasi Pelanggan
Dari gambar 4.2 dapat dilihat cluster model yang dihasilkan terdiri dari cluster_1 dan cluster_2 katagori terbaik dengan kinerja transaksi
mencapai prosentase 69, kelas pelanggan ini merupakan pelanggan yang tertinggi frekuensi kirimannya dengan jumlah monetary yang besar per tahun.
Cluster_3 dan cluster_4 katagori pelanggan yang potensial dengan prosentase 21 dengan memiliki tingkat frequency dan monetary yang tinggi. Cluster_5
dan cluster_6 termasuk pelanggan yang melakukan transaksi harian namun hanya memberikan kontribusi sebesar 7 dengan tingkat frequency dan
monetary per tahunnya yang sedang. Cluster_7 merupakan cluster tunggal yang termasuk bertransaksi tidak rutin dengan katagori kadang-kadang
dengan prosentase sebesar 2. Sedangkan cluster_8 dan cluster_9 pelanggan yang kurang aktif dengan tingkat transaksi sebesar 0.
Universita Sumatera Utara
Proses clustering dengan algoritma K-Means dilakukan juga untuk menentukan jenis layanan Recency yang paling banyak digunakan
dikalangan para pelanggan, seperti layanan city kurir menempati posisi tertinggi dengan prosentase sebesar 41, diikuti layanan pos express dengan
prosentase 23, layanan surat biasa dengan prosentase 21, surat kilat khusus sebesar 10, dan paketpos sebesar 4.
Gambar 4.3 Persentase layanan
Universita Sumatera Utara
Cluster juga dapat dilihat dalam gambar 4.4 dibawah ini yang merupakan hasil clustering dalam data view.
Gambar 4.4 Hasil Clustering Dalam Data View
Pada gambar 4.4 dapat dilihat hasil clustering yang dihasilkan dari pengolahan data berupa cluster jenis-jenis layanan yang berupa attribut
rec_ket. Pada attribut rec_ket cluster jenis layanan dibedakan seperti CC = City kurir, PE = Post Express, SB= surat biasa , ST = surat tercatat, SK=Surat
kilat, SKH = surat kilat khusus , PK= Paketpos, EMS = Electronic mail service
Universita Sumatera Utara
4.4 Cluster Data berdasarkan Katagori Terbaik