IF MATERI DATA MINING PERTEMUAN 06
A
rsitektur dan
M
odel
D
ata
M
ining
Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika
(2)
(3)
Arsitektur Data Mining
Keterangan :
1. Data cleaning (Pembersihan Data) : untuk membuang data yang tidak konsisten dan noise
2. Data integration : penggabungan data dari beberapa sumber
3. Data Mining Engine : Mentranformasikan data menjadi bentuk yang sesuai untuk di mining
4. Pattern evaluation : untuk menemukan pengetahuan yang bernilai melalui knowledge base
(4)
Model Data Mining
Model Prediksi
➢ Dengan menggunakan beberapa variabel, untuk
memprediksi nilai yang belum diketahui (unknown ) atau nilai selanjutnya (future) dari variabel lain
Classification
Regression
Deviation Detection / Deviation Analysis Contoh:
(5)
Model Data Mining
Model Deskripsi
➢ Menemukan pola pendeskripsian data yang dapat diinterpretasikan oleh manusia
Clustering
Association Rule Discovery Contoh:
(6)
Classification
Proses untuk menemukan model atau fungsi yang membedakan kelas data, dengan tujuan untuk dapat
memprediksi kelas dari suatu objek yang labelnya tidak diketahui
(7)
Examples of Classification Task
➢ Memprediksi sel tumor apakah jinak atau ganas
➢ Klasifikasi transaksi kartu kredit apakah sah atau penipuan
➢ Mengkategorikan artikel berita keuangan, cuaca, hiburan, olahraga, dll
(8)
Classification Techniques
❖ Decision Tree based Methods
❖ Neural Networks
❖ Rule-based Methods
❖ Memory based reasoning
❖ Naïve Bayes and Bayesian Belief Networks
(9)
Classification Techniques
(10)
Classification Techniques
Example
Type :
SUV Minivan
Car
Door : 2, 4
(11)
Classification Techniques
(12)
Classification Techniques
Types Doors Tires Result
SUV 2 Whitewall + MINIVAN 4 Whitewall -SUV 2 Blackwall -CAR 4 Blackwall -CAR 4 Blackwall -CAR 2 Blackwall + CAR 2 Whitewall + MINIVAN 4 Blackwall -SUV 2 Blackwall -MINIVAN 4 Whitewall -SUV 4 Blackwall -SUV 4 Whitewall + CAR 2 Blackwall + SUV 2 Blackwall
(13)
-Classification Techniques
(14)
Regression
➢ Digunakan untuk memetakan data dengan prediksi atribut bernilai real
Metode Regression mirip dengan metode Classification, bedanya adalah regression tidak bisa mencari pola yang dijabarkan sebagai class (kelas).
(15)
Examples of Regression Task
✓Memprediksi jumlah penjualan produk baru pada advertising expenditure (belanja iklan).
✓Memprediksi kecepatan memutar (wind velocities) pada fungsi temperatur, tekanan udara , dll
✓Memperkirakan metode distribusi dan kapasitas distribusi
(16)
Regression Techniques
✓ Linear Regression
✓ Logic Regression
SQL Server Data Mining mendukung teknik :
✓ Regression Trees (bagian Microsoft Decission Trees)
✓ Neural Network
Oracle Data Mining mendukung teknik :
✓ Generalized Linear Models (GLM)
(17)
Deviation Detection / Deviation Analysis
✓ Digunakan untuk mencari kasus yang bertindak sangat berbeda dari normalnya
✓ Mengidentifikasi kasus yang tidak normal diantara jutaan transaksi
(18)
Examples of Deviation Analysis Task
✓Pendeteksian penyalah gunaan Kartu kredit.
✓Pendeteksian gangguan jaringan komputer
✓Analisa kesalahan produksi, dll
Deviation Analysis Techniques
✓ Decision trees
(19)
Clustering
✓ Disebut juga sebagai Segmentation
✓ Clustering mendistribusikan obyek ke dalam kelompok, sehingga :
✓ derajat tingkat keterhubungan antar anggota cluster yang sama adalah kuat dan
✓ derajat tingkat keterhubungan antar anggota cluster yang berbeda adalah lemah
✓ Clustering adalah suatu alat untuk analisa data, yang memecahkan permasalahan
(20)
Clustering
Contoh :
(21)
Clustering
Contoh :
(22)
Clustering
Clustering bermakna menggolongkan data atau membagi satuan data yang besar ke dalam satuan data yang lebih kecil yang memiliki kesamaan
(23)
Cluster Analysis
Contoh Kasus :
Sebuah Departement Store ingin melakukan riset pasar untuk mengetahui apa saja yang mendorong, seorang konsumen berbelanja di Departement Store tersebut
(24)
Cluster Analysis
Parameter / Variabel yang diukur :
✓ Layout ruangan
✓ Kelengkapan produk yang ditawarkan
✓ Harga yang di tetapkan
✓ Penggunaan musik dalam ruangan
✓ Pelayanan Karyawan
✓ Pelayanan Kasir
✓ Promosi yang di buat
✓ Image mengenai Dept.Store tsb.
(25)
Cluster Analysis
Beberapa kesimpulan yang bisa diambil dari contoh diatas :
✓ Mengetahui pengelompokkan dan menentukan target pasar yang di tuju
✓ Mengetahui positioning produk dan menentukan pengembangan produk baru
✓ Memilih pasar yang akan di pilih untuk produk baru perusahaan
(26)
Clustering
Gambar dibawah ini menunjukkan kelompok data pelanggan yang berisi dua atribut, yaitu
(27)
Clustering
Algoritma Clustering mengelompokkan kelompok data kedalam tiga segment berdasarkan kedua atribut ini.
Cluster 1 berisi populasi berusia muda dengan pendapatan rendah
Cluster 2 berisi populasi berusia menengah dengan pendapatan yang lebih tinggi
Cluster 3 berisi populasi berusia tua dengan pendapatan yang relatif rendah.
(28)
Association Rule Discovery
Teknik Association Rule Association Rule
→ Teknik data mining untuk menemukan aturan asosiatif antara suatu kombinasi item
(29)
Example Association Rule Task
Contoh :
Analisis pembelian barang di suatu pasar swalayan yaitu :
dapat diketahuinya besar kemungkinan seorang pelanggan membeli suatu barang dengan barang lainnya
(30)
Association Rule Techniques
Tahap analisis asosiasi untuk menghasilkan algoritma adalah pola frekuensi tinggi (frequent pattern mining)
Analisis asosiasi sering juga disebut market basket analysis
(1)
Cluster Analysis
Beberapa kesimpulan yang bisa diambil dari contoh diatas :
✓ Mengetahui pengelompokkan dan menentukan target pasar yang di tuju
✓ Mengetahui positioning produk dan menentukan pengembangan produk baru
✓ Memilih pasar yang akan di pilih untuk produk baru perusahaan
(2)
Clustering
Gambar dibawah ini menunjukkan kelompok data pelanggan yang berisi dua atribut, yaitu
(3)
Clustering
Algoritma Clustering mengelompokkan kelompok data kedalam tiga segment berdasarkan kedua atribut ini.
Cluster 1 berisi populasi berusia muda dengan pendapatan rendah
Cluster 2 berisi populasi berusia menengah dengan pendapatan yang lebih tinggi
Cluster 3 berisi populasi berusia tua dengan pendapatan yang relatif rendah.
(4)
Association Rule Discovery
Teknik Association Rule Association Rule
→ Teknik data mining untuk menemukan aturan asosiatif antara suatu kombinasi item
(5)
Example Association Rule Task
Contoh :
Analisis pembelian barang di suatu pasar swalayan yaitu :
dapat diketahuinya besar kemungkinan seorang pelanggan membeli suatu barang dengan barang lainnya
(6)
Association Rule Techniques
Tahap analisis asosiasi untuk menghasilkan algoritma adalah pola frekuensi tinggi (frequent pattern mining)
Analisis asosiasi sering juga disebut market basket analysis