1
1. Pendahuluan
Pengetahuan tentang pelanggan merupakan aset yang kritikal. Usaha untuk mengumpulkan, mengelola dan membagi pengetahuan tentang pelanggan dapat
menjadi kegiatan yang penting bagi suatu usaha kecil menengah [1]. Semakin ketatnya persaingan dalam dunia bisnis saat ini menuntut pengusaha untuk cepat
dan tanggap dalam mengambil keputusan agar perusahaan yang didirikan dapat tetap bertahan ditengah situasi dan keadaan yang demikian. Salah satu langkah
yang dapat dilakukan adalah dengan memberikan kepuasan kepada pelanggan secara maksimal, karena pada dasarnya tujuan dari suatu bisnis adalah
menciptakan rasa puas pada pelanggan. Salah satu tindakan untuk memuaskan konsumen adalah bagaimana dan seberapa tinggi kualitas pelayanan yang
diberikan terhadap konsumen [2].
Salah satu solusi yang dapat dilakukan oleh perusahaan untuk menjaga agar kinerja penjualannya selalu berada dalam posisi baik adalah dengan menganalisis
dan mengetahui faktor-faktor yang dapat menjaga kinerja penjualan itu sendiri berada dalam posisi baik. Analisis dapat dilakukan dengan mengumpulkan data
keluhan dan penanganan keluhan yang bersifat historis atau lampau dan kemudian melihat grafik kinerja penjualan perusahaan. Di dalam data tersebut dapat terlihat
banyak komponen yang terkait dengan pelayanan terhadap pelanggan diantaranya hubungan antara jenis masalah yang disebutkan dalam keluhan, team karyawan
yang menangani keluhan, dan durasi waktu penyelesaian masalah.
Hubungan antara komponen-komponen tersebut dapat dianalisis dengan menggunakan teknik data mining, untuk melihat seberapa efisien kinerja dari
perusahaan. Efisiensi tercapai ketika karyawan dapat menyelesaikan tugas secepat mungkin. Data mining dapat memberikan informasi yaitu karyawan tertentu
cocok untuk menyelesaikan jenis masalah tertentu. Melalui informasi ini, maka ketika terdapat keluhan baru yang masuk, maka sistem dapat memberikan
rekomendasi karyawan yang paling cocok untuk menyelesaikan jenis pekerjaan itu.
Berdasarkan permasalahan dalam hal pencapaian efisiensi penanganan terhadap keluhan pelanggan, dan kegunaan data mining dalam hal penggalian
informasi, maka diajukan penelitian data mining untuk analisis efisiensi kinerja pelayanan keluhan pada CV Tripola Jaya.
2. Tinjauan Pustaka
Wei pada penelitiannya [3] menggunakan teknik data mining untuk mengidentifikasi tipe pelanggan pada penyedia layanan tata rambut. Teknik yang
digunakan merupakan kombinasi antara self-orginizing map SOM dan K-means untuk diterapkan pada model RFM recency, frequency, dan monetary. Teknik
tersebut membantu mengidentifikasi empat tipe pelanggan, yaitu pelanggan setia, pelanggan potensial, pelanggan baru dan pelanggan hilang, dan kemudian
membangun strategi pemasaran.
Liao menegaskan bahwa jenis pemasaran yang spesifik ini, atau lebih dikenal dengan istilah pemasaran langsung adalah metode pemasaran yang efektif.
2 Metode tersebut dapat menyediakan produk dan layanan yang spesifik bagi
pelanggan tertentu. Selain itu metode tersebut juga dapat mengurangi biaya transaksi dan promosi. Pada penelitiannya, Liao menggunakan pendekatan
association rules dan cluster analysis, untuk menganalisis gaya hidup dan perilaku belanja konsumen, dengan tujuan untuk mencapai pemasaran langsung. Studi
tersebut menemukan beberapa model, diantaranya adalah cluster preferensi pembelian oleh konsumen [4].
Ridwan, Suyono dan Sarosa [5] menerapkan data mining dengan algoritma Naïve Bayes untuk mengevaluasi kinerja akademik mahasiswa. Penelitian tersebut
difokuskan untuk mengevaluasi kinerja akademik mahasiswa pada tahun ke-2 dan diklasifikasikan dalam kategori mahasiswa yang dapat lulus tepat waktu atau
tidak. Kemudian dari klasifikasi tersebut, sistem akan memberikan rekomendasi solusi untuk memandu mahasiswa lulus dalam waktu yang paling tepat dengan
nilai optimal berdasarkan histori nilai yang telah ditempuh mahasiswa. Input dari sistem ini adalah data induk mahasiswa dan data akademik mahasiswa. Sampel
mahasiswa angkatan 2005-2009 yang sudah dinyatakan lulus akan digunakan sebagai data training dan testing. Sedangkan data mahasiswa angkatan 2010-2011
dan belum lulus akan digunakan sebagai data target. Data input akan diproses menggunakan teknik data mining algoritma Naive Bayes Classifier NBC untuk
membentuk tabel probabilitas sebagai dasar proses klasifikasi kelulusan mahasiswa. Output dari sistem ini berupa klasifikasi kinerja akademik mahasiswa
yang diprediksi kelulusannya dan memberikan rekomendasi untuk proses kelulusan tepat waktu atau lulus dalam waktu yang paling tepat dengan nilai
optimal. Hasil pengujian menunjukkan bahwa faktor yang paling berpengaruh dalam penentuan klasifikasi kinerja akademik mahasiswa yaitu Indeks Prestasi
Komulatif IPK, Indeks Prestasi IP semester 1, IP semester 4, dan jenis kelamin.
Berdasarkan penelitian-penelitian yang telah dilakukan tentang data mining untuk membantu strategi bisnis, maka dilakukan penelitian ini. Penelitian
ini menggunaan algortima Naïve Bayes untuk menganalisis efisiensi penanganan keluhan pelanggan pada PT Tripola Jaya. Tujuan dari penelitian yang dilakukan
adalah untuk merancang data mining untuk proses analisis efisiensi dalam penanganan keluhan pelanggan. Manfaat dari penelitian ini adalah untuk
menghasilkan sebuah sistem rekomendasi penanganan keluhan bagi PT. Tripola Jaya.
Batasan masalah dalam penelitian ini adalah sebagai berikut: 1 Data yang dianalisis adalah data keluhan pelanggan, penanganan keluhan, dan data karyawan
yang menangani keluhan tersebut; 2 Algoritma data mining yang digunakan adalah Naïve Bayes.
Ngai [6] menyebutkan fungsi dari data mining, yaitu: Association, Classification, Clustering, Forecasting, Regression, Sequence Discovery, dan
Visualization. Association bertujuan untuk membangun hubungan antara item yang ada bersama-sama dalam suatu record. Contoh aturan assosiatif dari analisa
pembelian di suatu pasar swalayan adalah dapat diketahuinya berapa besar kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan
pengetahuan tersebut pemilik pasar swalayan dapat mengatur penempatan
3 barangnya atau merancang kampanye pemasaran dengan memakai kupon diskon
untuk kombinasi barang tertentu [6]. Klasifikasi Classification data adalah suatu proses yang menemukan properti-properti yang sama pada sebuah himpunan
obyek di dalam sebuah basis data, dan mengklasifikasikannya ke dalam kelas- kelas yang berbeda menurut model klasifikasi yang ditetapkan. Tujuan dari
klasifikasi ini adalah pertama-tama untuk menganalisa training data dan membentuk sebuah deskripsi yang akurat atau sebuah model untuk setiap kelas
berdasarkan feature-feature yang tersedia di dalam data itu [7]. Sebagai contoh, sebuah dealer mobil ingin mengklasifikasikan pelanggannya menurut
kecenderungan mereka untuk menyukai mobil jenis tertentu, sehingga para sales yang bekerja di tempat tersebut dapat mengetahui siapa yang harus didekati,
kemana katalog mobil jenis baru harus dikirim, sehingga hal ini akan sangat membantu dalam hal promosi. Clustering adalah proses membagi dataset ke
dalam kelompok-kelompok dengan anggota tiap kelompok memiliki kedekatan sifat atau perilaku. Clustering merupakan pembelajaran tanpa pengawasan
unsupervised learning. Clustering dapat mengungkap hubungan yang sebelumnya tidak terdeteksi dalam dataset. Ada banyak aplikasi untuk clustering.
Misalnya, dalam bisnis, clustering dapat digunakan untuk menemukan dan mengenali segmen pelanggan, untuk tujuan pemasaran dan dalam biologi, dapat
digunakan untuk klasifikasi tumbuhan dan hewan yang diberikan fitur mereka [8]. Forecasting merupakan proses memperkirakan nilai masa depan berdasarkan pola
rekor itu. Hal ini berkaitan dengan pemodelan dan hubungan logis dari model di beberapa waktu di masa depan. Perkiraan permintaan adalah contoh khas dari
model peramalan. Alat umum untuk peramalan antara lain yaitu neural network dan survival analysis. Regresi adalah jenis estimasi teknik statistik yang
digunakan untuk memetakan setiap objek data ke nilai riil untuk memberikan nilai prediksi. Penggunaan regresi termasuk di dalamnya yaitu curve fitting, prediksi
termasuk peramalan, pemodelan hubungan kausal, dan pengujian hipotesis ilmiah tentang hubungan antara variabel. Alat umum untuk regresi linear adalah
regresi linier dan regresi logistik. Sequence discovery memiliki arti yaitu penemuan urutan identifikasi association atau pola dari waktu ke waktu.
Tujuannya adalah untuk memodelkan kondisi proses yang menghasilkan urutan atau untuk ekstraksi dan melaporkan penyimpangan dan tren dari waktu ke waktu.
Alat yang umum digunakan untuk sequence discovery adalah statistik dan menetapkan teori. Visualisasi: Visualisasi mengacu pada penyajian data sehingga
pengguna dapat melihat pola yang kompleks. Hal ini digunakan dalam hubungannya dengan model data mining lainnya untuk memberikan pemahaman
yang lebih jelas tentang pola atau hubungan ditemukan.
Pada penelitian ini digunakan teknik association. Association bertujuan untuk membentuk hubungan antara item-item yang muncul secara bersamaan
pada suatu batas tertentu [8]. Batas ini dapat berupa satu record atau rentang nilai tertentu.
Klasifikasi-klasifikasi Bayes adalah klasifikasi statistik. Klasifikasi- klasifikasi Bayes dapat memprediksi kelas anggota probabilitas. Klasifikasi Bayes
berdasarkan atas teorema Bayes. Studi-studi perbandingan algoritma-algoritma klasifikasi dapat menemukan sebuah klasifikasi Bayes sederhana yang dikenal
4 sebagai “Naïve Bayes”. Algoritma Naïve Bayes berasumsi bahwa efek suatu nilai
variabel di sebuah kelas yang ditentukan adalah tidak terkait pada nilai-nilai variabel lain. Asumsi ini disebut kelas kondisi bebastidak terikat. Itu dibuat untuk
menyederhanakan perhitungan dan dalam hal ini diang
gap sebagai “Naïve”. Algoritma Naïve Bayes memungkinkan secara cepat membuat model yang
mempunyai kemampuan untuk prediksi dan juga menyediakan sebuah method baru dalam mengeksplorasi dan mengerti data. Bayes menyediakan metode yang
digunakan untuk pembelajaran berdasarkan bukti evidence yang ada. Algoritmanya mempelajari bukti yang ada dengan menghitung korelasi diantara
variabel yang diinginkan dan semua variabel yang lain.
Untuk mulai menggunakan Naïve Bayes, perlu diketahui sebuah aturan dasar dalam algoritma ini. Berikut rumus aturan Bayes:
Pa | b = Pb | a Pa Pb 1
Posterior = Likehood Prior Evidence 2
Dimana, a adalah hal yang menyebabkan suatu hal terjadi cause dan b
adalah akibatnya effect, mengacu pada Rumus 1. Pa|b sering disebut juga dengan istilah likehood dari b terhadap a, dari sini didapatkan probabilitas
posterior Pa|b, mengacu pada Rumus 2, dimana Pa|b menyatakan probabilitas munculnya a jika diketahui b.
Untuk menjelaskan teorema Naive Bayes, perlu diketahui bahwa proses klasifikasi memerlukan sejumlah petunjuk untuk menentukan kelas apa yang
cocok bagi sampel yang dianalisis tersebut. Karena itu, teorema bayes di atas disesuaikan sebagai berikut [9]:
3 Variabel C merepresentasikan kelas, sementara variabel F1...Fn
merepresentasikan karakteristik petunjuk yang dibutuhkan untuk melakukan klasifikasi. Maka rumus tersebut menjelaskan bahwa peluang masuknya sampel
karakteristik tertentu dalam kelas C Posterior adalah peluang munculnya kelas C sebelum masuknya sampel tersebut, seringkali disebut prior, dikali dengan
peluang kemunculan karakteristik karakteristik sampel pada kelas C disebut juga likelihood, dibagi dengan peluang kemunculan karakteristik karakteristik sampel
secara global disebut juga evidence. Karena itu, rumus diatas dapat pula ditulis secara sederhana sebagai berikut [9]:
4 Nilai Evidence selalu tetap untuk setiap kelas pada satu sampel. Nilai dari
posterior tersebut nantinya akan dibandingkan dengan nilai nilai posterior kelas lainnya untuk menentukan ke kelas apa suatu sampel akan diklasifikasikan.
Penjabaran lebih lanjut rumus Bayes tersebut dilakukan dengan menjabarkan menggunakan aturan perkalian sebagai berikut [9]:
5 5
3.
Metode dan Perancangan Sistem
Penelitian yang dilakukan, diselesaikan melalui tahapan penelitian yang terbagi dalam lima tahapan, yaitu: 1 Identifikasi masalah dan studi literatur, 2
Perancangan sistem, 3 Implementasi sistem, 4 Pengujian sistem dan analisis hasil pengujian, 5 Penulisan laporan.
Identifikasi Masalah dan Studi Literatur Perancangan Sistem
Implementasi Sistem Pengujian Sistem dan Analisis Hasil Pengujian
Penulisan Laporan
Gambar 1 Tahapan Penelitian
Tahapan penelitian pada Gambar 1, dapat dijelaskan sebagai berikut. Tahap pertama: yaitu melakukan analisis kebutuhan-kebutuhan user dalam proses
analisis data mining; Tahap kedua: yaitu melakukan perancangan sistem yang meliputi perancangan database, perancangan antarmuka yakni sebagai media
penghubung interaksi antara user dan sistem; Tahap ketiga: yaitu mengimplementasikan rancangan yang telah dibuat di tahap dua ke dalam sebuah
aplikasiprogram sesuai kebutuhan sistem; Tahap keempat: yaitu melakukan pengujian terhadap sistem yang telah dibuat, serta menganalisis hasil pengujian
tersebut, untuk melihat apakah aplikasi yang telah dibuat sudah sesuai dengan yang diharapkan atau tidak, jika belum sesuai maka akan dilakukan perbaikan.;
dan Tahap kelima: melakukan penulisan laporan penelitian.
Metode perancangan sistem dilakukan dengan menggunakan metodologi pengembangan perangkat lunak prototype model [10]. Pada proses implementasi
dihasilkan beberapa prototype yang dapat dijelaskan sebagai berikut. Tahap pertama: mendengarkan atau wawancara customer atau user; Tahap kedua;
merancang program kemudian membuat perbaikan terhadap hasil yang diperoleh; Tahap ketiga: melakukan evaluasi ke customer atau user dimana pada tahap ini
6 proses akan kembali lagi ketahap pertama. Diagram prototype model ditunjukkan
pada Gambar 2.
Gambar 2
Prototype Model [10]
Database Log Kerja
Log Kerja Data Uji
Naïve bayes
Rekomen dasi
Mulai
Selesai
Gambar 3 Proses Rekam Data dan Analisis dengan Naïve Bayes.
Setiap pegawai Tripola, wajib untuk mencatat jam mulai dan selesai dari tiap tugas yang dikerjakan. Data pekerjaan ini disimpan dalam database, dan
dimanfaatkan untuk proses analisis data mining dengan algoritma Naïve Bayes. Hasil proses analisis adalah rekomendasi pegawai yang dapat dipilih untuk
menyelesaikan suatu tugas.
7
Tabel 1 Kriteria Data yang Digunakan
No Kolom
Keterangan
1 Wilayah
Kode wilayah pelanggan 2
PD Pasang Daya
3 R1T
Pemasangan baru untuk rumah hunian biasa 4
Ganti Meter Ada pergantian alat meteran listrik.
5 Migrasi
Pindah lokasi alat meteran listrik dalam satu rumah 6
Petugas Nama Petugas
7 Kualifikasi Kerja
Terbagi ke dalam 3 kriteria kelas yaitu TQ tidak masuk kualifikasi, B Baik, Q masuk kualifikasi
Kriteria data yang digunakan dalam perhitungan naïve bayes ditunjukkan pada Tabel 1. Setiap pelanggan masuk dalam kelompok wilayah tertentu. Jenis
pekerjaan yang dilakukan oleh terbagi ke dalam kategori PD, R1T, Ganti Meter, atau Migrasi. Satu keluhan dapat terdiri dari beberapa keluhan sekaligus. Setiap
kali petugas menyelesaikan pekerjaan, dicatat lama waktu proses pengerjaan keluhan tersebut. Waktu kerja ini berupa data angka dalam satuan menit. Tabel 2
menunjukkan contoh data yang diolah dengan Naïve Bayes.
Tabel 2 Contoh Data Training Set
No Wilayah
PD R1T
Ganti Meter
Migrasi Petugas
Waktu Target
Waktu Kerja
Kualifika si Kerja
1 SA1
TAMBAH Y
T Y
AGUS 120
60 Q
2 SA1
TAMBAH Y
T Y
FAUZAN 120
45 Q
3 SA2
TIDAK T
Y T
FAUZAN 45
45 B
4 SA2
TURUN T
Y T
FAUZAN 75
60 Q
5 SA1
TURUN T
Y T
FAUZAN 75
45 Q
6 SA3
TIDAK T
Y T
AGUS 45
60 TQ
7 SA3
TIDAK T
Y Y
YANTO 105
60 Q
8 SA3
TIDAK T
Y Y
YANTO 105
45 Q
9 SA1
TAMBAH Y
T T
YANTO 60
45 Q
10 SA2
TURUN T
Y T
YANTO 75
45 Q
Target kerja untuk PD adalah 30 menit, R1T 30 menit, Ganti Meter 45 menit, dan Migrasi 60 menit. Pekerjaan yang dilakukan kurang dari target waktu,
maka dianggap Baik B lebih dari waktu target dianggap K, dan jika tepat waktu maka dianggap Cukup C.
Langkah-langkah analisis dengan algoritma Naïve Bayes untuk contoh data pada tabel 2 dijelaskan sebagai berikut. Jika ada SATU pekerjaan di wilayah
SA1, PD tambah, R1T Y, Ganti meter T, migrasi T. Petugas siapa yang bias mengerjakan paling cepat?
Tabel 3 Contoh Kasus
WILAYAH PD
R1T GANTI METER
MIGRASI PETUGAS
Kualifikasi Kerja
SA1 TAMBAH
Y T
T AGUS
? SA1
TAMBAH Y
T T
FAUZAN ?
8
SA1 TAMBAH
Y T
T YANTO
?
Dalam data training diatas, ada 3 petugas: AGUS, FAUZAN, YANTO. Jadi akan cari satu-satu, dan dilihat kemungkinan waktu selesainya pekerjaan
untuk tiap petugas.
Langkah 1: variabel WAKTU K, C, B
PK = 1 10 PC = 1 10
PB = 8 10
Langkah 2: variabel WAKTU dipasangkan dengan variabel yang lain
Wilayah Karena pekerjaan yang dicari ada di wilayah SA1, maka dihitung khusus
yang wilayah SA1
PSA1 | K = 0 1 PSA1 | C = 0 1
PSA1 | B = 4 8
PD Cari khusus yang PD=TAMBAH
PTAMBAH| K = 0 1 PTAMBAH| C = 0 1
PTAMBAH| B = 3 8
R1T Cari khusus yang R1T=Y
PY | K = 0 1 PY | C = 0 1
PY | B = 3 8
Ganti meter Cari khusus yang GANTI METER= T
PT | K = 0 1 PT | C = 0 1
PT | B = 3 8
Migrasi Cari khusus yang MIGRASI=T
PT | K = 1 1 PT | C = 1 1
PT | B = 4 8
Petugas Untuk menghitung petugas, dilakukan kesemua petugas yang ada.
PAGUS | K = 1 1 PAGUS | C = 0 1
PAGUS | B = 1 1
9
PFAUZAN | K = 0 1 PFAUZAN | C = 1 1
PFAUZAN | B = 3 8 PYANTO | K = 0 1
PYANTO | C = 0 1 PYANTO | B = 4 8
Langkah 3: Hitung Persentase Kemungkinan Kemungkinan untuk AGUS dalam waktu K:
=PAGUS | K x PMIGRASI=T | K x PGANTI METER=T | K x PR1T=Y | K x PPenambahan Daya= TAMBAH | K x PWilayah=SA1 | K x PK
= 1 1 x 11 x 01 x 01 x 01 x 01 x 110 = 0
Kemungkinan untuk AGUS dalam waktu C:
= PAGUS | C x PMIGRASI=T | C x PGANTI METER=T | C x PR1T=Y | C x PPenambahan Daya= TAMBAH | C x PWilayah=SA1 | C x PC
=01 x 11 x 01 x 01 x 01 x 01 x 110 = 0
Kemungkinan untuk AGUS dalam waktu B:
= PAGUS | B x PMIGRASI=T | B x PGANTI METER=T | B x PR1T=Y | B x PPenambahan Daya= TAMBAH | B x PWilayah=SA1 | B x PB
=1 1 x 4 8 x 3 8 x 3 8 x 3 8 x 4 8 x 8 10 = 0.010546
Kemungkinan untuk FAUZAN dalam waktu K:
= PFAUZAN | K x PMIGRASI=T | K x PGANTI METER=T | K x PR1T=Y | K x PPenambahan Daya= TAMBAH | K x PWilayah=SA1 | K x PK
=0 1 x 11 x 01 x 01 x 01 x 01 x 110 = 0
Kemungkinan untuk FAUZAN dalam waktu C:
= PFAUZAN | C x PMIGRASI=T | C x PGANTI METER=T | C x PR1T=Y | C x PPenambahan Daya= TAMBAH | C x PWilayah=SA1 | C x PC
=1 1 x 11 x 01 x 01 x 01 x 01 x 110 = 0
Kemungkinan untuk FAUZAN dalam waktu B:
= PFAUZAN | B x PMIGRASI=T | B x PGANTI METER=T | B x PR1T=Y | B x PPenambahan Daya= TAMBAH | B x PWilayah=SA1 | B x PB
=3 8 x 4 8 x 3 8 x 3 8 x 3 8 x 4 8 x 8 10 = 0.003955
Kemungkinan untuk YANTO dalam waktu K:
= PYANTO | K x PMIGRASI=T | K x PGANTI METER=T | K x PR1T=Y | K x PPenambahan Daya= TAMBAH | K x PWilayah=SA1 | K x PK
=0 1 x 11 x 01 x 01 x 01 x 01 x 110 = 0
Kemungkinan untuk YANTO dalam waktu C:
= PYANTO | C x PMIGRASI=T | C x PGANTI METER=T | C x PR1T=Y | C x PPenambahan Daya= TAMBAH | C x PWilayah=SA1 | C x PC
= 0 1 x 11 x 01 x 01 x 01 x 01 x 110 = 0
Kemungkinan untuk YANTO dalam waktu B:
= PYANTO | B x PMIGRASI=T | B x PGANTI METER=T | B x PR1T=Y | B x PPenambahan Daya= TAMBAH | B x PWilayah=SA1 | B x PB
=4 8 x 4 8 x 3 8 x 3 8 x 3 8 x 4 8 x 8 10 = 0.052734
Tabel 4 Kesimpulan Akhir
Petugas Waktu
Nilai Kemungkinan Persentase
10
kalikan 100
AGUS K
tidak terpakai AGUS
C tidak terpakai
AGUS B
0.010546 1.05
FAUZAN K
tidak terpakai FAUZAN
C tidak terpakai
FAUZAN B
0.003955 0.3
YANTO K
tidak terpakai YANTO
C tidak terpakai
YANTO B
0.052734 5 tertinggi dari
semua
Agus, Fauzan, dan Yanto sama-sama masuk kategori Qualified Q, tapi dari 3 orang tersebut, persentasi tertinggi adalah Yanto 5. Jadi yang dipilih
untuk tugas tersebut adalah Yanto karena memiliki nilai kemungkinan terbesar untuk menyelesaikan pekerjaan dalam Qualified.
4. Hasil dan Pembahasan