Perumusan Masalah Batasan Masalah Tujuan Penelitian Manfaat Penelitian Pendahuluan

Pada penelitian ini akan digunakan teknik data mining yaitu algoritma Kernel K-Means Clustering untuk membuat model aturan dalam membuat segmentasi pelanggan . Data yang digunakan dalam penelitian ini adalah data kantor pos Medan yang beralamat jalan Bukit Barisan no. 1 Medan. Algoritma K-Means mengklusterkan ukuran jarak Eucliden, dimana jarak dihitung adalah untuk mencari kuadrat dari jarak antara masing-masing nilai, menjumlahkan kuadrat dan menemukan akar kuadrat dari jumlah tersebut . Kernel K-Means adalah pengembangan dari Algoritma K-Means yang menggunakan metode Kernel untuk memetakan data yang berdimensi tinggi pada space yang baru sehingga dapat dipisahkan secara linear. Hal ini dilakukan untuk meningkatkan akurasi hasil klaster. Didalam Kernel K- Means diharapkan data dapat dipisahkan dengan lebih baik karena data yang overlap atau data outlier bisa menjadi linear diruang dimensi baru. Berdasarkan masalah diatas maka penelitian ini akan memaparkan algoritma Kernel K-Means Clustering untuk membuat model aturan dalam melakukan segmentasi pelanggan PT. Pos Indonesia Persero.

1.2 Perumusan Masalah

Berdasarkan latar belakang di atas, dapat dirumuskan beberapa masalah yang menjadi inti dari penelitian ini, yaitu : 1. Bagaimana menggunakan metode Kernel untuk data pelanggan pada perusahaan yang bergerak dibidang jasa. 2. Bagaimana memperoleh model segmentasi pelanggan dengan Kernel K-Means Clustering berbasis Customer Relationship Management CRM. Universita Sumatera Utara

1.3 Batasan Masalah

Untuk memfokuskan pada permasalahan diatas, maka permasalahan dalam penelitian ini dibatasi sebagai berikut : 1. Indikator yang menjadi ukuran segmentasi pelanggan menggunakan 3 tiga atribut yaitu Recency, Frequency, dan Monetary. 2. Data yang diambil untuk dijadikan sampel adalah data Kantor Pos Medan . 3. Pengujian data dibangun aplikasi model segmentasi pelangan dengan metode k-means clustering.

1.4 Tujuan Penelitian

Tujuan yang ingin dicapai dari penelitian ini adalah : 1. Membangun suatu model segmentasi pelanggan dengan metode k- means clustering berbasis Customer Relationship Management CRM untuk meningkatkan pertumbuhan jangka panjang dan profitabilitas perusahaan dengan mengetahui prilaku dan kebutuhan pelanggan. 2. Mengevaluasi model segmentasi pelanggan dengan kernel k-means clustering berbasis Customer Relationship Management CRM yang telah dikembangkan untuk mendapatkan nilai parameter yang menghasilkan output yang optimal.

1.5 Manfaat Penelitian

Hasil penelitian ini diharapkan dapat bermanfaat bagi unit Pemasaran dan Manajemen sebagai early warning system dalam melakukan peningkatan kinerja perusahaan. Universita Sumatera Utara BAB 2 TINJAUAN PUSTAKA

2.1 Pendahuluan

Data Mining atau pertambangan data adalah suatu aplikasi database yang memiliki kemampuan pencarian data yang menggunakan statistikal algoritma untuk menemukan pola dan korelasi dalam data. Data mining dapat menemukan informasi yang berada di gudang data dalam perusahaan. Data mining mempunyai pola dan hubungan yang menggambarkan langkah- langkah yang harus diambil untuk memastikan hasil yang tepat. Software data mining bertujuan untuk mengetahui bisnis, memahami data dan membantu analis bisnis untuk menghasilkan hipotesis. Manajemen hubungan pelanggan atau disebut juga Customer Relationship Management CRM adalah sebuah sistem informasi yang digunakan untuk merencanakan, menjadwalkan, dan mengendalikan aktivitas-aktivitas prapenjualan dan pascapenjualan dalam sebuah organisasi. Hal ini melingkupi semua aspek perusahaan yang berhubungan dengan calon pelanggan. Manajemen hubungan pelanggan juga mencakup pengembangan yang menawarkan produk untuk dijual pada pelanggan. Dalam penjualan, perusahaan menggunakan manajemen pemasaran untuk menargetkan peningkatan efektivitas pemasaran. Tujuan dari manajemen hubungan pelanggan adalah meningkatkan pertumbuhan jangka panjang dan profitabilitas perusahaan melalui pengertian terhadap kebiasaan dan perilaku behavior pelanggan. Sumber data manajemen hubungan pelanggan ini dapat diperoleh melalui survei pelanggan dari pemberian pertanyaan, serta perilaku data yang terdapat dalam sistem transaksi. Kemajuan teknologi zaman sekarang membuat hubungan pemasaran lebih maju, sehingga hubungan perusahaan dengan pelanggan menjadi pusat Universita Sumatera Utara masalah bisnis perusahaan dalam konsep pemasaran. Manajemen hubungan pelanggan ini dapat membantu proses penjual dan pembeli perusahaan untuk berkomunikasi menawarkan produk yang ditargetkan dan meningkatkan efisiensi bagi kedua pihak. Untuk itu data mining dapat dipilih sebagai sistem yang tepat untuk kemajuan perusahaan. Data mining dapat menemukan informasi yang berada di gudang data perusahaan yang terletak pada penyimpanan data komputer dan data bisnis tersebut dapat bermanfaat sebagai informasi dalam setiap langkah pembangunan. Data mining juga dapat memprediksi keuntungan perusahaan dari pelanggan. Data mining memainkan peran penting dalam proses manajamen hubungan pelanggan dengan mencakup interaksi pelanggan dengan data dan perangkat lunak manajemen. Program manajemen hubungan pelanggan yang menggunakan data mining dapat mengakibatkan peningkatan nilai pelanggan perusahaan bila digunakan dengan sistem yang tepat. 2 .2 Data Warehouse Data warehouse merupakan kumpulan data dari berbagai sumber yang disimpan dalam suatu gudang data repository dalam kapasitas besar dan digunakan untuk proses pengambilan keputusan Prabhu, 2007. Menurut William Inmon, karakteristik dari data warehouse adalah sebagai berikut : 1. Subject oriented. Pada sistem operasional, data disimpan berdasarkan aplikasi. Set data hanya terdiri dari data yang dibutuhkan oleh fungsi yang terkait dan aplikasinya, sedangkan pada data warehouse, data disimpan bukan berdasarkan aplikasi, melainkan berdasarkan subjeknya. Misalnya untuk sebuah perusahaan manufaktur subjek bisnis yang penting, yaitu penjualan, pengangkutan, dan penyimpanan barang. Universita Sumatera Utara 2. Integrated. Data yang tersimpan dalam data warehouse terdiri dari berbagai system operasional. Oleh sebab itu terdapat kemungkinan bahwa terjadi beberapa perbedaan, yaitu dalam konvensi penamaan, representasi kode, atribut data, dan pengukuran data. Keempat perbedaan tersebut harus disamakan terlebih dahulu sesuai dengan standar tertentu agar data yang nantinya tersimpan dalam data warehouse dapat terintegrasi. 3. Time variant. Pada data warehouse, data yang tersimpan adalah data historis dalam kurun waktu tertentu, bukan data terkini. Oleh karena itu data yang tersimpan mengandung keterangan waktu, misalnya tanggal, minggu, bulan, catur wulan, dan sebagainya. Karakteristik time variant pada data warehouse memiliki karakteristik sebagai berikut : a. Melakukan analisa terhadap hal di masa lalu. b. Mencari hubungan antara informasi dengan keadaan saat ini. c. Melakukan prediksi hal yang akan datang. 4 Non-volatile. Data dalam sistem operasional dapat di-update sesuai transaksi bisnis. Setiap kali terjadi transaksi bisnis. Namun dalam data warehouse, data tidak dapat diubah karena bersifat read only. Arsitektur data warehouse gambar 2.1 mencakup proses ETL Extraction, Transformation, Loading untuk memindahkan data dari operational data source dan sumber data eksternal lainnya ke dalam data warehouse . Data warehouse dapat dibagi menjadi beberapa data mart, berdasarkan fungsi bisnisnya contoh data mart untuk penjualan, pemasaran, dan keuangan. Data dalam data warehouse dan data mart diatur oleh satu atau lebih server yang mewakili multidimensional view dari data terhadap berbagai front end tool, seperti query tools, analysis tools, report writers, dan data mining tools. Universita Sumatera Utara Gambar 2.1 Arsitektur Data Warehouse Proses ETL Extraction, Transformation, Loading merupakan proses yang harus melalui dalam pembentukan data warehouse Kimball, 2004. Berikut adalah penjelasan dari tiap proses. 1. Ekstraksi Data Extract Ekstraksi data adalah proses dimana data diambil atau diekstrak dari berbagai sistem operasional, baik menggunakan query, atau aplikasi ETL. Terdapat beberapa fungsi ekstraksi data, yaitu : a. Ekstraksi data secara otomatis dari aplikasi sumber. b. Penyaringan atau seleksi data hasil ekstraksi. c. Pengiriman data dari berbagai platform aplikasi ke sumber data. d. Perubahan format layout data dari format aslinya. e. Penyimpanan dalam file sementara untuk penggabungan dengan hasil ekstraksi dari sumber lain. 2. Transformasi Data Transformation Transformasi adalah proses dimana data mentah raw data hasil ekstraksi disaring dan diubah sesuai dengan kaidah bisnis yang berlaku. Langkah- langkah dalam transformasi data adalah sebagai berikut : Universita Sumatera Utara a. Memetakan data input dari skema data aslinya ke skema data warehouse. b. Melakukan konversi tipe data atau format data. c. Pembersihan serta pembuangan duplikasi dan kesalahan data. d. Penghitungan nilai-nilai derivat atau mula-mula. e. Penghitungan nilai-nilai agregat atau rangkuman. f. Pemerikasaan integritas referensi data. g. Pengisian nilai-nilai kosong dengan nilai default. h. Penggabungan data. 3. Pengisian Data Loading Proses terakhir yang perlu dilakukan adalah proses pemuatan data yang di dapatkan dari hasil transformasi ke dalam data warehouse. Cara untuk memuat data adalah dengan menjalankan SQL script secara periodik.

2. 3 Data Mining

Data mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basisdata. Informasi yang dihasilkan diperoleh dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang terdapat dalam basisdata. Data mining terutama digunakan untuk mencari pengetahuan yang terdapat dalam data base yang besar sehingga sering disebut Knowledge Discovery in Databases KDD. Proses pencarian pengetahuan ini menggunakan berbagai teknik-teknik pembelajaran komputer machine learning untuk menganalisis dan mengekstraksikannya. Proses pencarian bersifat iteratif dan interaktif untuk menemukan pola atau model yang sahih, baru, bermanfaat, dan dimengerti. Dalam penerapannya data mining memerlukan berbagai perangkat lunak analisis data untuk menemukan pola dan relasi data agar dapat digunakan untuk membuat prediksi dengan akurat. Universita Sumatera Utara

2.3.1 Manfaat Data Mining

Pemanfaatan data mining dapat dilihat dari dua sudut pandang, yaitu sudut pandang komersial dan sudut pandang keilmuan. Dari sudut pandang komersial, pemanfaatan data mining dapat digunakan dalam menangani meledaknya volume data. Bagaimana mana menyimpannya, mengestraknya serta memanfaaatkannya. Berbagai teknik komputasi dapat digunakan menghasilkan informasi yang dibutuhkan. Informasi yang dihasilkan menjadi asset untuk meningkatkan daya saing suatu institusi. Data mining tidak hanya digunakan untuk menangani persoalan menumpuknya data informasi dan bagaimana menggudangkannya tanpa kehilangan informasi yang penting warehousing. Data mining juga diperlukan untuk menyelesaikan permasalahan atau menjawab kebutuhan bisnis itu sendiri, misalnya: • Bagaimana mengetahui hilangnya pelanggan karena pesaing • Bagaimana mengetahui item produk atau konsumen yang memiliki kesamaan karakteristik • Bagaimana mengidentifikasi produk-produk yang terjual bersamaan dengan produk lain. • Bagaimana memprediski tingkat penjualan • Bagaimana menilai tingkat resiko dalam menentukan jumlah produksi suatu item. • Bagaimana memprediksi prilaku bisnis di masa yang akan datang Dari sudut pandang keilmuan, data mining dapat digunakan untuk mengcapture, menganlisis serta menyimpan data yang bersifat real-time dan sangat besar, misalnya: Universita Sumatera Utara • Remote sensor yang ditempatkan pada suatu satelit • Telescope yang digunakan untuk memindai langit • Simulasi saintifik yang membangkitkan data dalam ukuran terrabytes Data mining merupakan salah satu metode alternatif yang dapat digunakan untuk mengolah data mentah, ketika metode konvensional tidak fisibel untuk dilakukan karena besarnya volume data yang diolah. Hal ini dapat terjadi karena data mining memiliki kemampuan mereduksi data baik melalui teknik katalogisasi, klasifikasi maupun segementasi.

2.3.2 Tahapan Data Mining

Data mining sesungguhnya merupakan salah satu rangkaian dari proses pencarian pengetahuan pada database Knowledge Discovery in DatabaseKDD. KDD berhubungan dengan teknik integrasi dan penemuan ilmiah, interprestasi dan visualisasi dari pola-pola sejumlah kumpulan data. KDD adalah keseluruhan proses non-trivial untuk mencari dan mengidentifikasi pola pattern dalam data, dimana pola yang ditemukan bersifat sah, baru, dapat bermanfaat dan dapat dimengerti. Serangkaian proses tersebut yang memiliki tahap sebagai berikut Tan, 2006: 1. Pembersihan data dan integrasi data cleaning and integration Proses ini digunakan untuk membuang data yang tidak konsisten dan bersifat noise dari data yang terdapat di berbagai basisdata yang mungkin berbeda format maupun platform yang kemudian diintegrasikan dalam satu database data warehouse. 2. Seleksi dan transformasi data selection and transformation Data yang terdapat dalam database data warehouse kemudian direduksi dengan berbagai teknik. Proses reduksi diperlukan untuk mendapatkan hasil yang lebih akurat dan mengurangi waktu Universita Sumatera Utara komputasi terutama utuk masalah dengan skala besar large scale problem. Beberapa cara seleksi, antra lain: • Sampling, adalah seleksi subset representatif dari populasi data yang besar. • Denoising, adalah proses menghilangkan noise dari data yang akan ditransformasikan • Feature extraction, adalah proses membuka spesifikasi data yang signifikan dalam konteks tertentu. Transformasi data diperlukan sebagai tahap pre-procecing, dimana data yang diolah siap untuk ditambang. Beberapa cara transformsi, antara lain Santoso, 2007: • Centering, mengurangi setiap data dengan rata-rata dari setiap atribut yang ada. • Normalisation, membagi setiap data yang dicentering dengan standar deviasi dari atribut bersangkutan. • Scaling, mengubah data sehingga berada dalam skala tertentu. Gambar 2.2 Tahap-tahap Knowledge Discovery in Database Universita Sumatera Utara

2.3.3 Penambangan data data mining

Data yang telah diseleksi dan ditransformasi ditambang dengan berbagai teknik. Proses data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan fungsi-fungsi tertentu. Fungsi atau algoritma dalam data mining sangat bervariasi. Pemilihan fungsi atau algoritma yang tepat sangat bergantung pada tujuan dan proses pencaraian pengetahuan secara keseluruhan.

2.3.4 Evaluasi pola dan presentasi pengetahuan

Tahap ini merupakan bagian dari proses pencarian pengetahuan yang mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya. Langkah terakhir KDD adalah mempresentasikan pengetahuan dalam bentuk yang mudah dipahami oleh pengguna.

2.3.5 Fungsi-fungsi

Fungsi-fungsi yang umum diterapkan dalam data mining Haskett, 2000: • Assosiation, adalah proses untuk menemukan aturan assosiatif antara suatu kombinasi item dalam suatu waktu • Secuence, hampir sama dengan association bedanya seccuence diterapkan lebih dari satu periode. • Clastering, adalah proses pengelompokan sejumlah data obyek ke dalam kelompok-kelompok data klaster sehingga setiap klaster akan berisi data yang saling mirip. • Classification, adalah proses penemuan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. • Regretion, adalah proses pemetaam data dalam suatu nilai prediksi. Universita Sumatera Utara • Forecasting, adalah proses pengestimasian nilai prediksi berdasarkan pola-pola di dalam sekumpulan data • Solution, adalah proses penemuan akar masalah dan problem solving dari persoalan bisnis yang dihadapi atau paling tidak sebagai informasi pendukung dalam pengambilan keputusan.

2.3.6 Penerapan Data Mining

Sebagai cabang ilmu baru di bidang komputer cukup banyak penerapan yang dapat dilakukan oleh Data Mining. Apalagi ditunjang ke-kaya-an dan keanekaragaman berbagai bidang ilmu artificial intelligence, database, statistik, pemodelan matematika, pengolahan citra membuat penerapan data mining menjadi makin luas. Berikut beberapa penerapannya • Analisa Pasar dan Manajemen Untuk analisa pasar, banyak sekali sumber data yang dapat digunakan seperti transaksi kartu kredit, kartu anggota club tertentu, kupon diskon, keluhan pembeli, ditambah dengan studi tentang gaya hidup publik. • Menembak target pasar Data mining dapat melakukan pengelompokan clustering dari model model pembeli dan melakukan klasifikasi terhadap setiap pembeli sesuai dengan karakteristik yang diinginkan seperti kesukaan yang sama, tingkat penghasilan yang sama, kebiasaan membeli dan karakteristik lainnya. • Melihat pola beli pemakai dari waktu ke waktu Data mining dapat digunakan untuk melihat pola beli seseorang dari waktu ke waktu. Sebagai contoh, ketika seseorang menikah bisa saja dia kemudian memutuskan pindah dari single account ke joint account rekening bersama dan kemudian setelah itu pola beli-nya berbeda dengan ketika dia masih bujangan. Universita Sumatera Utara • Cross market analisys Kita dapat memanfaatkan data mining untuk melihat hubungan antara penjualan satu produk dengan produk lainnya. • Profil customer Data mining dapat membantu untuk melihat profil customer pembeli nasabah sehingga kita dapat mengetahui kelompok customer tertentu suka membeli produk apa saja. • Identifikasi kebutuhan user Kita dapat mengidentifikasi produk-produk apa saja yang terbaik untuk tiap kelompok customer dan menyusun faktor-faktor apa saja yang kira-kira dapat menarik customer baru untuk bergabung membeli. • Perencanaan keuangan dan evaluasi asset Data Mining dapat membantu untuk melakukan analisis dan prediksi cash flow serta melakukan contingent claim analysis untuk mengevaluasi aset. Selain itu juga dapat menggunakannya untuk analisis trend. • Perencanaan sumber daya Reseource planning Dengan melihat informasi ringkas summary serta pola pembelanjaan dan pemasukan dari masing-masing resource, kita dapat memanfaatkannya untuk melakukan resource planning. • Persaingan competision Sekarang ini banyak perusahaan yang berupaya untuk dapat melakukan competitive intelligence. Data Mining dapat membantu untuk memonitor pesaing-pesaing dan melihat market direction seperti :  Melakukan pengelompokan customer, memberikan variasi hargalayananbonus untuk masing-masing grup.  Menyusun strategi penetapan harga di pasar yang sangat kompetitif. Hal ini diterapkan oleh perusahaan minyak REPSOL di Spanyol dalam menetapkan harga jual gas di pasaran. Universita Sumatera Utara

2.3.7 CRISP-DM

CRISP-DM CRoss-Industry Standard Process for Data Mining merupakan suatu konsorsium perusahaan yang didirikan oleh Komisi Eropa pada tahun 1996 dan telah ditetapkan sebagai proses standar dalam data mining yang dapat diaplikasikan di berbagai sektor industri. Gambar 2.3 menjelaskan tentang siklus hidup pengembangan data mining yang telah ditetapkan dalam CRISP-DM. Gambar 2.3 Siklus Hidup CRISP-DM Chapman, 2000 Berikut ini adalah enam tahap siklus hidup pengembangan data mining Chapman, 2000 : 1. Business Understanding Tahap pertama adalah memahami tujuan dan kebutuhan dari sudut pandang bisnis, kemudian menterjemakan pengetahuan ini ke dalam pendefinisian Universita Sumatera Utara masalah dalam data mining. Selanjutnya akan ditentukan rencana dan strategi untuk mencapai tujuan tersebut. 2. Data Understanding Tahap ini dimulai dengan pengumpulan data yang kemudian akan dilanjutkan dengan proses untuk mendapatkan pemahaman yang mendalam tentang data, mengidentifikasi masalah kualitas data, atau untuk mendeteksi adanya bagian yang menarik dari data yang dapat digunakan untuk hipotesa untuk informasi yang tersembunyi. 3. Data Preparation Tahap ini meliputi semua kegiatan untuk membangun dataset akhir data yang akan diproses pada tahap pemodelanmodeling dari data mentah. Tahap ini dapat diulang beberapa kali. Pada tahap ini juga mencakup pemilihan tabel, record, dan atribut-atribut data, termasuh proses pembersihan dan transformasi data untuk kemudian dijadikan masukan dalam tahap pemodelan modeling. 4. Modeling Dalam tahap ini akan dilakukan pemilihan dan penerapan berbagai teknik pemodelan dan beberapa parameternya akan disesuaikan untuk mendapatkan nilai yang optimal. Secara khusus, ada beberapa teknik berbeda yang dapat diterapkan untuk masalah data mining yang sama. Di pihak lain ada teknik pemodelan yang membutuhan format data khusus. Sehingga pada tahap ini masih memungkinan kembali ke tahap sebelumnya. 5. Evaluation Pada tahap ini, model sudah terbentuk dan diharapkan memiliki kualitas baik jika dilihat dari sudut pandang analisa data. Pada tahap ini akan dilakukan evaluasi terhadap keefektifan dan kualitas model sebelum digunakan dan menentukan apakah model dapat mencapat tujuan yang ditetapkan pada fase awal Business Understanding. Kunci dari tahap ini adalah menentukan apakah ada masalah bisnis yang belum dipertimbangkan. Di akhir dari tahap ini harus ditentukan penggunaan hasil proses data mining. Universita Sumatera Utara 6. Deployment Pada tahap ini, pengetahuan atau informasi yang telah diperoleh akan diatur dan dipresentasikan dalam bentuk khusus sehingga dapat digunakan oleh pengguna. Tahap deployment dapat berupa pembuatan laporan sederhana atau mengimplementasikan proses data mining yang berulang dalam perusahaan. Dalam banyak kasus, tahap deployment melibatkan konsumen, di samping analis data, karena sangat penting bagi konsumen untuk memahami tindakan apa yang harus dilakukan untuk menggunakan model yang telah dibuat.

2.4 Customer Relationship Management CRM Manajemen Hubungan

Pelanggan Konsumen merupakan aset yang sangat penting bagi suatu perusahaan. Tidak akan ada prospek bisnis tanpa adanya hubungan antara perusahaan dengan konsumen yang bersifat loyal. Hal ini adalah alasan mengapa perusahaan harus merencanakan dan menggunakan strategi yang cukup jelas dalam memperlakukan konsumen. Customer Relationship Management CRM telah berkembang dalam beberapa dekade belakangan ini untuk merefleksikan peranan utama dari konsumen untuk pengaturan strategi perusahaan. CRM meliputi seluruh ukuran untuk memahami konsumen dan proses untuk mengeksploitasi pengetahuan ini untuk merancang dan mengimplementasikannya pada kegiatan marketing, produksi, dan rantai supply dari pemasok supplier. Berikut ini akan didefenisikan beberapa pengertian CRM yang diambil dari berbagai literatur, antara lain Tama, 2009 : 1. Dari sisi yang berkaitan dengan teknologi informasi, CRM adalah sebuah strategi untuk mengoptimalkan customer lifetime value dengan cara mengetahui lebih banyak mengenai informasi konsumen dan berinteraksi dengan konsumen secara intensif Todman, 2001. Universita Sumatera Utara 2. Dari sisi komunikasi dan manajemen, CRM di definisikan sebagai sebuah pendekatan perusahaan untuk memahami dan mempengaruhi perilaku konsumen melalui komunikasi yang intensif dalam rangka meningkatkan akuisisi konsumen, mempertahankan konsumen, dan loyalitas konsumen Swift, 2001. 3. Definisi CRM jika dilihat dari segi bisnis dapat diartikan sebagai sebuahstrategi bisnis untuk memahami, mengantisipasi dan mengelola kebutuhan konsumen yang potensial dalam suatu organisasi pada saat sekarang dan yang akan datang Brown, 2000. Dari ketiga definisi di atas dapat ditarik kesimpulan mengenai definisi CRM yaitu sebuah pendekatan yang komprehensif yang mengintegrasikan setiap bisnis proses yang berhubungan langsung dengan konsumen, yaitu penjualan, pemasaran dan layanan konsumen melalui integrasi filosofi, teknologi, dan juga proses Tama, 2009. Dengan kata lain, CRM dipandang bukanlah sebagai sebuah produk ataupun sebuah layanan, tetapi sebuah filosofi bisnis yang bertujuan memaksimalkan nilai konsumen dalam jangka panjang customer lifetime value.

2.4.1 Teknologi CRM

Sebuah definisi standar mengenai komponen teknologi CRM diberikan oleh META Group di dalam “The Customer Relationship Management Ecosystem”. Kategorisasi ini bertujuan untuk lebih memahami bagaimana suatu strategi CRM dan teknologinya mampu menyediakan seluruh arsitektur secara menyeluruh yang terfokus pada layanan konsumen. Ada tiga tipe utama dari teknologi CRM yaitu Tama, 2009 : 1. Operational CRM, yang dikenal sebagai CRM “front office”. Operational CRM merupakan area dimana terjadi hubungan dengan konsumen secara langsung. Otomasi dari proses bisnis yang terintegrasi yang melibatkan Universita Sumatera Utara front office customer touch points, seperti penjualan, pemasaran, dan layanan konsumen, termasuk ntegrasi. Dengan perkembangan teknologi informasi dan komunikasi yang pesat, operational CRM kemudian juga dapat dibedakan menjadi dua bagian yaitu e-CRM dan m-CRM. antara front office dan back office, seperti manajemen pesanan, dan otomasi pemasaran 2. Collaborative CRM, merupakan bentuk perluasan dari CRM tradisional. Collaborative CRM berkaitan dengan manajemen hubungan antara stakeholder eksternal, seperti supplier, distributor, dan reseller. Aplikasi utama dari collaborative CRM adalah enterprise portal yang berbasis pada infrastruktur ekstranet dan perangkat lunak manajemen hubungan mitra partner relationshiop management software yang memberikan akses kepada konsumen, reseller, dan mitra bisnis melalui internet. 2 Analytical CRM yang dikenal sebagai CRM “ Back office” atau strategic CRM. Analytical CRM biasanya berhubungan dengan penggunaan data secara efective, efisien dan strategis sehingga memungkinkan pengambilan keputusan yang tepat bagi pihak manajemen. Pengambilan keputusan dilaksanakan setelah melalui proses analisis, pemodelan, dan evaluasi terhadap data yang tersimpan didata base untuk menghasilkan sebuah hubungan yang saling menguntungkan antara perusahaan dan konsumennya . Contoh dari Analytical CRM adalah business intelegence seperti data warehaouse, OLAP, dan data mining. Hal yang terpenting dalam memahami perilaku konsumen tidak hanya memahami siapa mereka dalam hal ini customer profiling atau segmentation tetapi juga perilaku mereka dan pola-pola pattern yang mereka ikuti. Pemahaman perilaku pelanggan harus ditetapkan sebagai suatu proses yang dinamis dan berkelanjutan Xu dan Walton, 2005. Universita Sumatera Utara

2.4.2 Data Mining Dalam Kerangka Kerja CRM

Menurut Swift, dkk 2001, CRM memiliki empat dimensi, yaitu : 1. Identifikasi konsumen customer identification. 2. Membangun daya tarik terhadap konsumen customer attraction. 3. Mempertahankan konsumen yang ada customer retention. 4. Pengembangkan konsumen customer development. Keempat dimensi dari CRM tersebut dapat dilihat sebagai siklus tertutup dalam Customer Management System. Setiap dimensi memiliki tujuan umum yang sama yaitu untuk membangun pemahaman yang lebih mendalam dari konsumen dan meningkatkan nilai konsumen customer value dari perusahaan. Dalam kaitannya dengan pencapaian tujuan tersebut, teknik data mining dapat digunakan untuk menemukan karakteristik dan perilaku konsumen yang tersembunyi dalam database yang berukuran besar. Untuk menemukan pola karakteristik dan perilaku konsumen, dapat digunakan metode pemodelan data dalam teknik data mining. Beberapa metode pemodelan data yang dapat digunakan, yaitu : 1. Association 2. Classification 3. Clustering 4. Forecasting 5. Regression 6. Sequence discovery 7. Visualization Universita Sumatera Utara Kerangka kerja teknik data mining dalam keempat dimensi CRM dijelaskan melalui Gambar 2.4. Gambar 2.4 Kerangka Kerja Teknik Data Mining dalam CRM Ngai dkk 2008

2.5 Clustering

Clustering adalah salah satu teknik unsupervised machine learning, yang tidak terdapat fase pembelajaran dalam prosesnya. Teknik ini bertujuan untuk mengelompokkan suatu himpunan obyek menjadi kelas-kelas yang terdiri dari obyek-obyek yang sama atau pengelompokkan berdasarkan kesamaan karakteristik diantara obyek-obyek tersebut Kesamaan dan pembagian didasarkan melalui kriteria jumlah kuadrat kesalahan yang minimal. Kriteria ini sangat sensitif dengan keberadaan data outlier, oleh karena itu dikoreksi dengan membagi suatu kelompok besar ke ukuran yang lebih kecil Berkhin 2002 Universita Sumatera Utara

2.5.1 Algoritma Klasifikasi K-Means

Algoritma K-Means merupakan metode clustering berbasis jarak yang mempartisi data ke sejumlah kelompok dan bekerja pada atribut numerik. Algoritma ini dimulai dengan pemilihan jumlah kelompok K secara acak serta pengambilan sebagian populasi sejumlah K untuk dijadikan sebagai titik pusat awal. Salah satu metode perhitungan jarak yang bisa digunakan adalah Euclidean Distance. Perhitungan jarak menggunakan metode Euclidean dinyatakan sebagai berikut : 2.1 Dimana x : obyek ke-1 y : obyek ke-2 n : banyaknya atribut obyek ke-1 dan ke-2 Prosedur dasar clustering K-Means adalah sebagai berikutJohnson Wicherin 2002: 1. Menentukan k sebagai jumlah cluster yang ingin dibentuk 2. Membangkitkan k centroids titik pusat cluster awal secara random 3. Menghitung jarak setiap data ke masing-masing centroids 4. Setiap data memilih centroid yang terdekat 5. Menentukan posisi centroids baru dengan cara menghitng nilai rata-rata dari data-data yang berada pada centroids yang sama 6. Kembali ke langkah 3 jika posisi centroids baru dengan centroids lama tidak sama Universita Sumatera Utara

2.5.2 Clustering Hirarkhi Hierarchical clustering

Clustering hierarchi membangun sebuah hirarki cluster atau dengan kata lain sebuah pohon cluster yang juga dikenal sebagai dendogram. Setiap node cluster mengandung cluster anak, cluster-cluster saudara yang membagi point yang ditutupi oleh induk mereka. Metode-metode clustering hirarki dikatagorikan kedalam agglomeratif bawah atas dan divisive atas bawah Jain Murthy, 1999;, Kaufman Rouseeuw 1990. Clustering agglomeratif dimulai dengan cluster satu point singleton dan secara berulang-ulang menggabungkan dua atau lebih cluster yang paling tepat. Cluster divisive dimulai dengan satu cluster dari semua point data dan secara berulang-ulang melindungi cluster yang paling tepat. Proses erbut berlanjut hingga kriteria penghentian seringkali, jumlah k yang diperlukan dari cluster dicapai. Kelebihan cluster hirarki meliputi : I Fleksibilitas yang tertanam mengenai level granaularitas II Kemudahan menangani bentuk-bentuk kesamaan atau jarak III Pada akhirnya, daya pakai pada tpe-tipe atribut apapun. Kelemahan dari clustering hirarki berhubungan dengan : I Ketidakjelasan kriteria terminasi II Terhadap perbaikan perbaikan hasil clustering, sebagian besar algoritma hirarki tidak mengunjungi kembali cluster-clusternya yang telah dikonstruksi. Untuk clustering hirarki, menghubungkan atau memisahkan subset dari point- point dan bukan point-point individual, jarak antara point-point individu harus digenelarikan terhadap jarak antara subset. Ukuran kedekatan yang diperoleh disebut metrik berhubungan. Tipe mertik hubungan yang digunakan secara signifikan memperoleh algoritma hisrarki, karena merefleksikan konsep tertentu dari kedekatan dan konektivitas. Metrik Universita Sumatera Utara hubungan antar cluster utama Murtagh 1985, Olson 1995 termasuk hubungan tunggal, hubungan rata-rata, dan hubungan sempurna. Algoritma clustering hirarki populer untuk data katagorikal COBWEB Fisher, 1987 memiliki dua kualitas yang sangat penting, Pertama menggunakan pembelajaran incrementasl. Daripada mengikuti pendekatan diviseve atau aggglomerative, secara dinamis membangun sebuah dendrogram melalui pengolahan satu point data pada suatu waktu. Kedua COBWEB termasuk pada pembelajaran berdasarkan konseptualatau model, Ini berarrti bahwa setiap cluster dianggap sebagai sebuah model yang dapat dijelaskan secara intrinsik, dan bukan sebagai sebuah kumpulan point yang ditentukan terhadapnya. Dendogram COBWEB disebut pohon klasifikasi. Setiap node pohon C, sebuah cluster berhubungan dengan probabilitas kondisional untuk pasangan- pasangan nilai-nilai atribut, yakti : PrXi=vip \ C, I = 1; d.p=I\A1 2,2

2.5.3 Clustering Partisional Partisional Clustering

Dengan mengetahui objek-objek database n, sebuah algoritma clustering partisional membentuk k bagian dari data, dimana setiap cluster mengoptimalkan kriteria clustering, seperti minimasi jumlah jarak kuadrat dari rata-rata dalam setiap cluster. Salah satu isu dengan algortima-algoritma tersebut adalah kompleksitas tinggi, karena menyebutkan semua pengelompokan yang memungkinkan dan berusaha mencari optimum global. Bahkan untuk jumlah objek yang kecil, jumlah partisi adalah besar, itulah sebabnya mengapa solusi-solusi umum dimulai dengan sebuah partisi awal, biasanya acak, dan berlanjut dengan penyempurnaannya. Universita Sumatera Utara

2.6 Metode Klasifikasi Fuzzy RFM

Analisa RFM terdiri dari tiga dimensi, yaitu Tsiptsis dan Chorianopoulos, 2009 : 1. Recency, yaitu jenis layanan yang diigunakan para pelanggan untuk bertransaksi. Terdapat 8 jenis layanan yang ditawarkan kepada pelanggan. 2. Frequency, yaitu jumlah total transaksi atau jumlah rata-rata transaksi dalam satu periode. 3. Monetary, yaitu jumlah rata-rata nilai pembelian konsumen dalam suatu satuan waktu. Metode sharp RFM mendeskripsikan atribut recency, frequency, dan monetary dengan variabel linguistik Zumstein, 2007. Sebagai contoh, atribut recency dideskripsikan dengan 8 jenis layanan yang digunakan seperti layanan suratpos SB, surat kilat SK, surat kilat khusus SKH, surat tercatat ST, pos express PE, ems EMS, city curir CC, paketpos PK. Atribut frequency dideskripsikan dengan bahasa natural sedikit, agak banyak, dan banyak. Sedangkan atribut monetary dideskripsikan dengan rendah, sedang, tinggi. Konteks dari masing-masing atribut didefinisikan sebagai berikut : 1. Domain atribut recency didefinisikan dalam transaksi harian, dengan memilih 8 jenis layanan. Pelanggan dapat menggunakan lebih dari satu jenis layanan 2. Domain atribut frequency didefinisikan dalam range frequency sedikit 1.000 transaksi tahun, frequency agak banyak 7.000,- transaksi tahun, frequency banyak 7.000,- transaksi tahun. 3. Domain atribut monetary didefinisikan dalam range rendah 15.000.000,- per tahun, range sedang 20.000.000 per tahun, range tinggi = 20.000.000,- Universita Sumatera Utara Untuk setiap kelas ditentukan nilai score yang bergantung dari besarnya nilai frequency, dan monetary. Semakin tinggi nilai frequency, dan monetary dari konsumen, semakin tinggi juga nilai score yang diperoleh. Dengan klasifikasi menggunakan metode fuzzy RFM, nilai score dari masing-masing konsumen dapat diperhitungkan dengan lebih akurat dan lebih baik

2.7 Riset-Riset Terkait

Terdapat beberapa riset yang telah dilakukan oleh banyak peneliti berkaitan dengan model segmentasi pelanggan dengan data mining seperti yang akan dijelaskan dibawah ini : Penelitian yang dilakukan oleh Jansen 2007 untuk menerapkan konsep data mining dalam proses segmentasi konsumen customer segmentation dan mendefinisikan profil konsumen customer profiling serta hubungan antara keduanya. Jansen menggunakan algoritma K-Means, K- Medoid, Fuzzy C-Means, Gustafson Kessel dan Gath Geva Clustering untuk melakukan proses segmentasi konsumen. Studi kasus dalam penelitian ini adalah konsumen pengguna jasa telekomunikasi Vodafone. Segmentasi konsumen didasarkan pada perilaku konsumen yang diukur berdasarkan jumlah panggilan masuk dan panggilan keluar yang dilakukan oleh konsumen. Customer profiling dibangun melalui informasi yang berasal dari data warehouse, seperti umur, jenis kelamin, dan informasi daerah tempat tinggal. Dengan menggunakan teknik data mining, yaitu Support Vector Machine SVM, segmentasi konsumen dapat diperkirakan melalui profil konsumen. Dalam penelitian ini diperoleh hasil bahwa dengan menggunakan SVM, dapat dibentuk empat segmen konsumen dari data profil konsumen yang ada dengan tingkat keakuratan 80,3. Sedangkan jika jumlah segmen yang dibentuk berjumlah 6, maka tingkat keakuratan klasifikasinya adalah 78,5. Universita Sumatera Utara Cao, Zhu, dan Hou 2009 menggunakan metode FFCHC Fuzzy Fisher Criterion Based Hierarchical Clustering Algorithm untuk melakukan segmentasi konsumen. Metode FFHC memadukan algoritma FFC Fuzzy Fisher Criterion sebagai algoritma untuk melakukan clustering dan clustering validity function untuk mencari jumlah cluster yang paling optimal. Metode ini diterapkan pada dataset konsumen pada suatu perusahaan pasar modal. Penelitian tentang perbandingan algoritma Fuzzy C-Means dan Fuzzy Subtractive Clustering juga pernah dilakukan sebelumnya. Collazo-Cuevas 2010 melakukan perbandingan terhadap dua metode clustering yaitu Fuzzy C-Means dan Fuzzy Substracttive Clustering. Kedua metode ini diterapkan untuk melakukan clustering terhadap data polusi udara di Liverpool. Dalam penelitian ini dibangun algoritma identifikasi model fuzzy sebagai dasar dari motode estimasi. Hasil dari proses clustering adalah pemodelan hubungan antara suhu udara, kelembaman udara, dan kosentrasi PM 10 di Liperpool Inggris. Hammouda dan Karaay 2000 dalam penelitiannya melakukan perbandingan terhadap empat metode clustering yaitu F-Means, Fuzzy C- Means, Mountain, dan Fuzzy Substractive clustering. Keempat metode clustering ini diterapkan untuk melakukan proses clustering terhadap data medis. Selanjutnya, hasil dari proses data clustering tersebut digunakan untuk membantu proses diagnosa terhadap penyakit hati, perbandingan terhadap keempat metode clustering dilakukan menggunakan parameter keakuratan hasil clustering, waktu yang dibutuhkan untuk melakukan proses clustering. Root mean square error, dan kemiringan garis regresi regression line slope. Dari hasil perbandingan diperoleh hasil bahwa Mountain Clustering kurang baik untuk digunakan pada data dengan jumlah dimensi besar. Pendekatan algoritma yang lebih baik adalah menggunakan Fuzzy Substractive clustering karena membutuhkan waktu pemrosesan yang lebih cepat dibandingkan Mountain Clustering untuk memproses data dengan 13 dimensi. Algoritma K-Means dan Fuzzy C-Means kinerja yang lebih baik Universita Sumatera Utara dibandingkan Mountain Clustering dan Fuzzy Substractive Clustering , namun membutuhkan informasi tentang jumlah cluster yang harus dibentuk. Penelitian tentang metode fuzzy RFM dilakukan oleh Zumstein 2007 dalam thesisnya, Zumstein meneliti tentang klasifikasi fuzzy sebagai metode analisa dan manajemen data multidimensi. Meotode Klasifikasi fuzzy sesuai untuk digunakan dalam proses CRM dan membangun hubungan dengan konsumen yang menguntungkan. Metode fuzzy dipadukan dengan metode klasifikasi seperti metode analisa SWOT, analisa portofolio, analisa ABC, serta metode penilaian scoring method untuk memperoleh hasil segmentasi konsumen yang lebih baik. Dalam penelitian ini, metode fuzzy yang juga dipadukan dengan metode RFM, yaitu metode untuk menentukan segmen- segmen konsumen berdasarkan recency, frequency dan monetary. Metode fuzzy FRM juga dibandingkan terhadap metode fuzzy RFM memberikan hasil segmentasi konsumen yang lebih baik, sehingga dapat membantu perusahaan untuk memahami perilaku konsumen dengan lebih baik. Berikut ini adalah daftar penelitian mengenai data mining yang dilakukan sebelumnya dilakukan disajikan dalam table 2.1 Tabel 2.1 Penelitian Yang Telah Dilakukan No. Peneltian Metode Deskripsi 1. Jansen 2007 K-Means, K- Medoid, Fuzzy c- Means, Gustafson, Keseel dan Gath Geva Clustering Mencari segmentasi dan profil konsumen pada perusahaan Telekomunikasi Vodafone 2. Cao, Zhu dan Hou 2009 FFCHCFuzzy Fisher Criterion Based Hierarchical Clustering Algorithm Mencari segmentasi konsumen pada suatu perisahaan pasar modal Universita Sumatera Utara Tabel 2.1 Penelitian Yang Telah Dilakukan No. Peneltian Metode Deskripsi 3. Caollazo- Cuevas dkk2010 Fuzzy C-Means dan Fuzzy Substractive Clustering Melakukan perbandingan terhadap Fuzzy C-MENAS DAN Fuzzy Substractive Clustering untuk data polusi udara 4. Hammouda dan Karaay 2000 K-Means, Fuzzy C- Means, Mountain Clustering, Substractive Clustering Melakukan perbandingan keempat algoritma clustering dengan menggunakan data medis untuk mendiagnosa penyakit hati 5. Zumstein Fuzzy Classification fuzzy RFM Melakukan studi perbandinan metode klasifikasi klasik dengan metode kleasifikasi yang dipadukan dengan metode fuzzy

2.8 Persamaan dengan Riset-Riset lain

Yohana Nugraheni 2011 dalam penelitiannya menjelaskan data mining dengan metode fuzzy untuk customer relationship management CRM pada perusahaan Retail. Cen 2007 menggunakan teknik data mining untuk menemukan pola dan trend dari data konsumen dalam kaitannya dengan konsep CRM. Proses clustering dilakukan terhadap data konsumen C-Company, yaitu perusahaan yang bergerak dibidang industry elektronik. Universita Sumatera Utara

2.9 Perbedaan dengan Riset-Rise lain

Dari beberapa riset yang dilakukan peneliti sebelumnya, terdapat beberapa titik perbedaan dengan riset yang akan dilakukan ini : Analisa pemodelan segmentasi pelanggan dengan data mining berbasis customer relationship management CRM risetnya dilakukan di kantor pos Medan. Riset yang dilakukan penulis untuk membuat model berdasarkan Recency, Frequency, Monetary. Pada penelitian ini hasil akhir yang diharapkan dengan model segmentasi pelanggan dengan data mining berbasis Customer Relationship Management dapat diketahui pelanggan – pelanggan yang potensial,

2.10 Kontribusi Riset

Penelitian ini memberikan kontribusi pada pemahaman kita tentang hubungan Recency, Frequency, Monetary dalam menentukan pelanggan terbaik dan potensial berdasarkan clustering yang telah ditentukan. Pembuat keputusan bisa menggunakan model segmentasi pelanggan dengan data mining untuk meningkatkan kualitas pengambilan keputusan. Universita Sumatera Utara BAB 3 METODE PENELITIAN

3.1 Pendahuluan Tujuan dari tesis ini adalah untuk membuat model aturan dalam memprediksi

pelanggan potensial, kebutuhan pasar, dan perilaku konsumen menggunakan algoritma Kernel K-Means yang dapat digunakan sebagai alat Bantu analitis oleh manajemen dalam mengambil keputusan. Pada bagian ini kita mulai dengan menggambarkan kasus data mining pada system pemilihan pelanggan yang potensial dan prosedur bagaimana mengumpulkan data yang digunakan pada penelitian ini.

3.2 Rancangan Penelitian

Rancangan penelitian ini dimulai dengan mengumpulkan data dari kantor pos Medan. Data dikumpulkan dari database tahun 2011. Variabel yang dikumpulkan adalah kode customer, nama, alamat, telp, tglpks, lingkuppks, nomor pks, keterangan dan variable-variabel lain yang berkaitan dengan pemilihan pelanggan yang berpotensi. Data yang diperoleh untuk tahun 2011 dalam bentuk DBF, tahun 2012 dan tahun 2013 bentuk xls, untuk keseragaman bentuk xls dimodifikasi dan ditransformasikan ke bentuk DBF. Selanjutnya dilakukan pengujian terhadap data dengan menggunakan aplikasi data mining dengan metode K-Means Clustering. Dari pengujian diperoleh cluster dari data yang telah diuji selanjutnya dilakukan analisis cluster untuk menganalisis dan mendapatkan model aturan. Universita Sumatera Utara

3.3 Pra Pemrosesan Data Preprocessing Data

Pada tahap ini struktur data base Pangkalan Data akan dipersiapkan sehingga mempermudah proses mining. Proses preprocessing ini mencakup tiga hal utama yaitu: a. Data Selection: Memilih data yang akan digunakan dalam proses data mining. Dalam proses ini dilakukan juga pemilihan atribut-atribut yang disesuaikan dengan proses data mining. b. Data Preprocessing: Memastikan kualitas data yang telah dipilih pada tahap data selection, pada tahap ini masalah yang harus dihadapi adalah noisy data dan missing values. Proses pembersihan data cleansing dilakukan dengan melakukan metode-metode query sederhana untuk menemukan anomali-anomali data yang bisa saja masih terdapat pada sistem. c. Data Transformation: Mengelompokkan atribut-atribut atau field-yang telah terpilih menjadi 1 tabel dengan cara melakukan denormalisasi dari data base OLTP. Berikut ini adalah hasil pemilihan atribut-atribut yang dibutuhkan untuk proses Berikut segmentasi menggunakan metode K-Means Clustering, yaitu atribut-atribut yang terkait dengan recency, frequency, dan monetary Tabel 3.1. Universita Sumatera Utara Tabel 3.1 Data Parsial dari Database Kantor Pos Medan Field Keterangan KodeCustomer Kode customer JenisLayanan Recency, merupakan jenis layanan yang digunakan oleh Customer. FrekuensiTransaksi Menandakan frequency, merupakan jumlah transaksi selama periode yang ditentukan TotalTransaksi Menandakan monetary, merupakan jumlah uang selama periode yang ditentukan Dalam proses data preparation dibangun suatu data warehouse untuk mempermudah proses mining. Data yang akan dilibatkan dalam penelitian ini adalah data yang berkaitan dengan transaksi penjualan. Skema bintang penjualan yang dibentuk dalam penelitian ini ditunjukkan pada gambar 3.2. Model yang digunakan dalam penelitian ini adalah model K-Means clustering.Metode clustering yang digunakan adalah metode K-Means dan Metode Klasisifikasi Fuzzy RFM Recency Frequency, Monetary.. Kedua metode ini memiliki karakteristik yang berbeda karena K-Means Clustering merupakan metode clustering yang terawasi supervised sedangkan FS termasuk metode clustering yang tidak terawasi unsupervised. Pada K-Means jumlah cluster ditentukan, sedangkan klasifikasi menggunakan metode Fuzzy RFM nilai score dari masing-masing konsumen dapat diperhitungkan dengan lebih akurat dan lebih baik. Universita Sumatera Utara Hasil proses data mining menggunakan metode K-Means dan Fuzzy RFM akan dibandingkan untuk mengetahui unjuk kerja kedua metode ini. Hasil dari proses clustering menggunakan kedua metode ini akan digunakan untuk proses segmentasi konsumen. Model yang digunakan untuk proses segmentasi konsumen adalah model Fuzzy RFM . Dalam model Fuzzy RFM variabel recency, frequency, dan monetary, masing-masing dibagi menjadi 3 himpunan fuzzy : 1. Recency dibagi menjadi 8 himpunan K-Means, yaitu Surat Biasa, Surat Kilat, Surat Kilat Khusus, Surat Tercatat, Pos Express, Ems, City Kurir, Paketpos Tabel 3.2. 2. Frequency dibagi menjadi 3 himpunan K-Means, yaitu Sedikit, Agak Banyak, Banyak Tabel 3.2. 3. Monetary dibagi menjadi 3 himpunan K-Means, yaitu Rendah, Sedang, dan Tinggi Tabel 3.2. Domain himpunan Fuzzy RFM untuk variabel recency, frequency, dan monetary ditunjukkan dalam Tabel 3.2 berikut ini. Universita Sumatera Utara Tabel 3.2 Domain nilai untuk masing-masing himpunan Fuzzy RFM. Atribut Variabel linguistik Domain nilai Recency SURAT BIASA SB SURAT KILAT SK SURAT KILAT KHUSUS SKH SURAT TERCATAT ST POS EXPRESS PE EMS EMS CITY KURIR CC PAKETPOS PK Frequency SEDIKIT 1.000 transaksi AGAK BANYAK = 1.000 transaksi BANYAK = 7.000 transaksi Monetary RENDAH Rp. 5.000.000,- SEDANG = Rp. 300.000.000,- TINGGI = Rp. 500.000.000,- Universita Sumatera Utara

3.4 Deployment

Pada tahap ini dilakukan pembuatan aplikasi K-Means Clustering, untuk menghasilkan laporan data mining hingga melakukan integrasi dengan sistem informasi yang telah ada dilapangan. Pada penelitian ini proses deployment adalah melakukan proses mining pada seluruh database, dan dilakukan proses integrasi dengan sistem yang telah ada. Pada gambar 3.1 merupakan tampilan aplikasi data mining Gambar 3.1 Tampilan aplikasi K-Means Clustering Universita Sumatera Utara Gambar 3.1 merupakan tampilan aplikasi K-Means Clustering yang digunakan pada penelitian ini untuk menampilkan cluster terhadap data dan memperlihatkan matrik yang tersebar pada kelompok-kelompok. Algoritma Kernel K-Means clustering menggunakan alat-alat kelompok yang telah dirancang dan dipersiapkan pada aplikasi Data Mining. 3,5 Prosedur Penelitian Presedur penelitiaan ini dilakukan seperti pada gambar 3.2 yaitu, data diperoleh dari database Pangkalan Data Kantor Pos Medan. Data terdapat dua model, untuk jenis database dari tahun 1994 sampai dengan tahun 2011 database menggunakan DBF, sedangkan untuk database dari tahun 2012 dan tahun 2013 menggunakan excell XLS. Digunakan tools WhiteTown Wizard untuk melakukan transformasi dari excell ke DBF terhadap data tahun 2012 dan tahun 2013. Hasil proses transformasi tersebut selanjutnya dilakukan pengolahan dengan aplikasi data mining yang berupa cluster dari data yang dianalisis untuk mendapatkan pengetahuan berupa model aturan. Gambar 3.2 Prosedur Penelitian Pengumpulan data dari Database Data Modifikasi Transformasi data xls Data Analisis Knowledge Universita Sumatera Utara

3.6 Diagram Aktivitas Penelitian

Berikut ini alur kerja yang akan dilakukan pada penelitian ini yang digambarkan dalam diagram aktivitas pada gambar 3.3 berikut : Gambar 3.3 Gambar Aktivitas Kerja Penelitian Identifikasi Masalah Mengumpulkan Data dari Identifikasi Masalah Olah Data menggunakan Kernel K-Means Clustering Membuat Analisa dan Rule Membuat Kesimpulan dan Saran Universita Sumatera Utara

3.7 Tempat dan Waktu Penelitian

Tempat dan waktu penelitian dilakukan di Kantor Pos Medan dari bulan April 2013 hingga Juli 2013. Sesuai dengan rancangan tahapan penelitian, penelitian di Kantor Pos Medan diawali dengan studi kelayakan feasibility study dan pemahaman terhadap prosedur yang sudah ada existing procedure.

3.8 Jadwal Penelitian

No . Kegiatan Apr 2013 Mei 2013 Juni 2013 Juli 2013 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1. Kolokium 2. Pengumpulan Data 3. Analisa Data 4. Seminar 5. Ujian Universita Sumatera Utara