BAB 2
LANDASAN TEORI
Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan analisa datadan algoritma Fuzzy C-Means untuk mangetahui
pola perilaku konsumen.
2.1. Pola Perilaku Konsumen
Perilaku konsumen adalah proses dan aktivitas ketika seseorang berhubungan dengan pencarian, pemilihan, pembelian, penggunaan, serta pengevaluasian produk dan jasa
demi memenuhi kebutuhan dan keinginan Duncan, 2005. Perilaku konsumen merupakan hal-hal yang mendasari konsumen untuk membuat keputusan pembelian.
Untuk barang berharga jual rendah low-involvement proses pengambilan keputusan dilakukan dengan mudah, sedangkan untuk barang berharga jual tinggi high-
involvement proses pengambilan keputusan dilakukan dengan pertimbangan yang matang Kincaid, 2003.
Pemahaman akan perilaku konsumen dapat diaplikasikan dalam beberapa hal, yang pertama adalah untuk merancang sebuah strategi pemasaran yang baik, misalnya
menentukan kapan saat yang tepat perusahaan memberikan diskon untuk menarik pembeli. Kedua, perilaku konsumen dapat membantu pembuat keputusan membuat
kebijakan publik. Misalnya dengan mengetahui bahwa konsumen akan banyak menggunakan transportasi saat lebaran, pembuat keputusan dapat merencanakan harga
tiket transportasi di hari raya tersebut. Aplikasi ketiga adalah dalam hal pemasaran sosial social marketing, yaitu penyebaran ide di antara konsumen.Dengan
memahami sikap konsumen dalam menghadapi sesuatu, seseorang dapat menyebarkan ide dengan lebih cepat dan efektif.
2.2. Penambangan Data Data Mining
Data mining merupakan pemilihan atau menggali pengetahuan dari jumlah data yang
banyak Han dan Kamber, 2001.Data mining disebut penemuan pengetahuan atau menemukan pola yang tersembunyi dalam data. Data mining adalah analisis otomatis
dari data yang berjumlah besar atau kompleks dengan tujuan untuk menemukan pola atau kecenderungan yang penting yang biasanya tidak disadari keberadaanya
Pramudiono, 2006. Data mining
merupakan analisis dari peninjauan kumpulan data untuk menemukan hubungan yang tidak diduga dan meringkas data dengan cara yang
berbeda dengan sebelumnya,yang dapat dipahami dan bermanfaat bagi pemilik data Larose, 2006. Dengan kata lain, data mining adalah proses menganalisis data dalam
jumlah besar dan membentuk suatu pola sehingga menjadi informasi yang berguna. Berdasarkan definisi-definisi yang telah disampaikan, hal penting yang terkait
dengan data mining adalah : 1.Data mining merupakan suatu proses otomatis terhadap data yang sudah ada.
2. Data yang akan diproses berupa data yang sangat besar. 3. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin
memberikan indikasi yang bermanfaat.
Data mining bukanlah suatu bidang ilmu yang sama sekali baru. Salah satu
kesulitan untuk mendefinisikan data mining dikarenakan data mining mewarisi banyak aspek dan teknik dari bidang-bidang ilmu yang sudah mapan terlebih dahulu.
Gambar 2.1 menunjukkan bahwa data mining memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan artificial intelligence, machine learning, statictic,
database , dan juga information retrieval Pramudiono, 2006.
Gambar 2.1. Bidang Ilmu Data Mining
2.2.1. Tahapan Data Mining Istilah data mining dan Knowledge Discovery in Database KDD seringkali
digunakan secara bergantian untuk menjelaskan proses penggalian informasi yang tersembunyi dalam suatu basis data yang besar. Dalam implementasinya, data mining
merupakan bagian dari proses KDD. Sebagai komponen dalam KDD, data mining berkaitan dengan ekstraksi dan penghitungan pola-pola dari data yang ditelaah dalam
basis data. KDD mencakup keseluruhan proses pencarian polainformasi dalam basis data yang dimulai dari pemilihan dan persiapan data sampai representasi pola yang
ditentukan dalam bentuk yang mudah dimengerti oleh pihak berkepentingan. Proses KDD secara garis besar terdiri atas beberapa tahap Fayyad, 1996.
1. Data Selection Pemilihan seleksi data dari sekumpulan data operasional perlu dilakukan
sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah
dari basis data operasional.
2. Pre-processingCleaning Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning
pada data yang menjadi fokus KDD. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang tidak konsisten, dan memperbaiki
kesalahan pada data, seperti kesalahan cetak typo, juga dilakukan proses enrichment
, yaitu proses “memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau
informasi eksternal. 3. Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data
tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan
dicari dalam basis data. 4. Data mining
Data mining adalah proses mencari pola atau informasi menarik dalam data
terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode dan algoritma
yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan. 5. InterpretationEvalution
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini
merupakan bagian dari proses KDD yang disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan
dengan fakta atau hipotesis yang ada sebelumnya.Penjelasan diatas dapat direpresentasikan pada Gambar 2.2.
Gambar 2.2. Tahapan Data Mining
Sumber : Fayyad, 1996
2.2.2. Pengelompokan Data Mining Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang
dapatdilakukan, yaitu Larose, 2005:
1. Deskripsi Terkadang penelitian analisis secara sederhana ingin mencoba mencari cara untuk
menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menemukan keterangan
atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan presiden. Deskripsi dari pola dan kecenderungan sering memberikan
kemungkinan penjelasan untuk suatu pola atau kecenderungan.
2. Estimasi Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke
arah numerik daripada ke arah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi.
Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel prediksi. Sebagai contoh, akan dilakukan estimasi
tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis kelamin, indeks berat badan, dan level sodium darah. Hubungan antara tekanan
darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan
menghasilkan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya.
3. Prediksi Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam
prediksi nilai dari hasil akan ada di masa datang. Contoh prediksi dalam bisnis dan penelitian adalah :
1. Prediksi harga beras dalam tiga bulan yang akan datang. 2. Prediksi presentase kenaikan kecelekaan lalu lintas tahun depan jika batas bawah
kecepatan dinaikkan. 4. Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori.Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi,
pendapatan sedang, dan pendapatan rendah. 5. Pengklusteran
Pengklusteran merupakan
pengelompokan record
, pengamatan,
atau memperhatikan
dan membentuk
kelas objek-objek
yang memiliki
kemiripan.Cluster adalah kumpulan record yang memiliki kemiripan satu dengan yang lainnya dan memiliki ketidakmiripan dengan record-record dalam cluster
lain. Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target
dalam pengklusteran. Pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma
pengklusteran mencoba untuk melakukan pembagian terhadap keseluruhan data menjadi kelompok-kelompok yang memiliki kemiripan homogen, yang mana
kemiripan record dalam satu kelompok akan bernilai maksimal, sedangkan kemiripan dengan record dalam kelompok lain akan bernilai minimal.
Contoh pengklusteran dalam bisnis dan penelitian adalah: 1. Melakukan pengklusteran terhadap ekspresi dari gen, untuk mendapatkan
kemiripan perilaku dari gen dalam jumlah besar. 2. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu
produk bagi perusahaan yang tidak memiliki dana pemasaran yang besar. 3. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap
perilakufinansial dalam baik dan mencurigakan.
6. Asosiasi Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam
satu waktu.Dalam dunia bisnis lebih umum disebut analisis keranjang belanja. Contoh asosiasi dalam bisnis dan penelitian adalah :
1. Menemukan barang dalam supermarket yang dibeli secara bersamaan dan barang yang tidak pernah dibeli secara bersamaan.
2. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang diharapkan untuk memberikan respons positif terhadap penawaran upgrade
layanan yang diberikan.
2.3. Clustering