Pendahuluan Untuk menunjang proses analisis yang dilakukan, dibuatlah suatu aplikasi Hasil Transformasi Data Cluster Model

BAB 4 HASIL DAN PEMBAHASAN

4.1 Pendahuluan Untuk menunjang proses analisis yang dilakukan, dibuatlah suatu aplikasi

untuk menampilkan data penjualan yang dilakukan tiap konsumen berdasarkan recency, frequency, dan monetary. Aplikasi ini dibuat dengan menggunakan Clipper 5.3, dan dilengkapi dengan desain hasil akhir dari metode K-Means Clustering serta perhitungan nilai Sum Of Squared Error SSE, selain itu aplikasi ini juga menampilkan prosentase dari cluster terbaik dan potensial serta prosentase dari jenis layanan yang paling banyak digunakan dikalangan konsumen..

4.2 Hasil Transformasi Data

Data yang berasal dari format excel khususnya data tahun 2012 dan tahun 2013 akan ditransformasikan menjadi DBF. Hal ini dilakukan untuk mendapatkan data pengujian yang akan digunakan sebagai data input pada proses clustering menggunakan algoritma Kernel K-Means. Adapun tampilan transformasi Aplikasi K-Means Clustering sebagaimana pada gambar 4.1 . Universita Sumatera Utara Gambar 4.1 Hasil transformasi data pada tampilan aplikasi Tabel 4.1 Atribut yang belum dikatagorisasikan No Field Name Type Width Dec 1 Institusi Character 20 2 Biasa Numeric 15 3 Kilat Numeric 15 4 SKH Numeric 15 5 Tercatat Numeric 15 6 Posexpress Numeric 15 7 Ems Numeric 15 8 Citykurir Numeric 15 9 Paketpos Numeric 15 10 Bilangan Numeric 5 11 Bsu Numeric 15 Universita Sumatera Utara Tabel 4.2 Atribut yang digunakan untuk segmentasi pelanggan No Field Name Type Width Dec 1 Cluster Character 12 2 Kode Character 5 3 Monetary Numeric 15 4 Frequency Numeric 15 5 Recency Numeric 15 Tabel 4.3 katagorisasi atribut ATRIBUT VARIABEL LINQUISTIK DOMAIN NILAI Recency SURAT BIASA SB SURAT KILAT SK SURAT KILAT KHUSUS SKH SURAT TERCATAT ST POS EXPRESS PE EMS EMS CITY CURIR CC PAKETPOS PK Frequency SEDIKIT = 1.000,- Transaksi AGAK BANYAK 1.000,- transaksi BANYAK 7.000,- transaksi Monetary Rendah Rp. Rp. 5.000.000,- Sedang Rp. Rp. 300.000.000,- Tinggi Rp. Rp. 500.000.000,- Universita Sumatera Utara

4.3 Cluster Model

Cluster model yang diperoleh dari hasil pengujian terhadap data menggunakan metode Kernel K-Means seperti yang terlihat pada tabel 4.4 cluster model berdasarkan monetary dan pada aplikasi data mining dapat dilihat pada gambar 4.2 hasil segmentasi pelanggan. Tabel 4.4 Cluster Model Berdasarkan Monetary CLUSTER MODEL MONETARY DENGAN DATA DARI TAHUN 2011 SD BULAN MARET 2013 NO KATAGORI CLUSTER TAHUN Prosen 2013 Rp. 2012 Rp. 2011 Rp. 1 TERBAIK CL_1 CL_ 2 453,019,022 1,997,017,450 1,561,402,620 69 2 POTENSIAL CL_3 CL_4 214,224,750 370,979,834 642,276,629 21 3 TIAP HARI CL_5 CL_6 91,551,460 180,325,000 109,310,117 7 4 KADANG CL_7 43,153,028 47,122,000 48,013,725 2 5 KRG AKTIF CL_8 CL_9 5,217,553 6,500,000 7,965,325 TOTAL 807,165,813 2,601,944,284 2,368,968,416 Dari tabel 4.4 dapat dilihat cluster model yang dihasilkan terdiri dari pelanggan katagori terbaik, potensial, tiap hari, kadang-kadang, kurang aktif. Berdasarkan jumlah besar uang transaksi Monetary untuk pertahun dari bulan januari 2011 sampai dengan bulan maret 2013. Performa sebuah cluster dapat dilihat dari tampilan aplikasi K-Means Clustering dalam format tabel sebagai berikut : Universita Sumatera Utara Gambar 4.2 Hasil Segmentasi Pelanggan Dari gambar 4.2 dapat dilihat cluster model yang dihasilkan terdiri dari cluster_1 dan cluster_2 katagori terbaik dengan kinerja transaksi mencapai prosentase 69, kelas pelanggan ini merupakan pelanggan yang tertinggi frekuensi kirimannya dengan jumlah monetary yang besar per tahun. Cluster_3 dan cluster_4 katagori pelanggan yang potensial dengan prosentase 21 dengan memiliki tingkat frequency dan monetary yang tinggi. Cluster_5 dan cluster_6 termasuk pelanggan yang melakukan transaksi harian namun hanya memberikan kontribusi sebesar 7 dengan tingkat frequency dan monetary per tahunnya yang sedang. Cluster_7 merupakan cluster tunggal yang termasuk bertransaksi tidak rutin dengan katagori kadang-kadang dengan prosentase sebesar 2. Sedangkan cluster_8 dan cluster_9 pelanggan yang kurang aktif dengan tingkat transaksi sebesar 0. Universita Sumatera Utara Proses clustering dengan algoritma K-Means dilakukan juga untuk menentukan jenis layanan Recency yang paling banyak digunakan dikalangan para pelanggan, seperti layanan city kurir menempati posisi tertinggi dengan prosentase sebesar 41, diikuti layanan pos express dengan prosentase 23, layanan surat biasa dengan prosentase 21, surat kilat khusus sebesar 10, dan paketpos sebesar 4. Gambar 4.3 Persentase layanan Universita Sumatera Utara Cluster juga dapat dilihat dalam gambar 4.4 dibawah ini yang merupakan hasil clustering dalam data view. Gambar 4.4 Hasil Clustering Dalam Data View Pada gambar 4.4 dapat dilihat hasil clustering yang dihasilkan dari pengolahan data berupa cluster jenis-jenis layanan yang berupa attribut rec_ket. Pada attribut rec_ket cluster jenis layanan dibedakan seperti CC = City kurir, PE = Post Express, SB= surat biasa , ST = surat tercatat, SK=Surat kilat, SKH = surat kilat khusus , PK= Paketpos, EMS = Electronic mail service Universita Sumatera Utara

4.4 Cluster Data berdasarkan Katagori Terbaik