Aplikasi dan Kecenderungan dalam Data Mining
Aplikasi dan Kecenderungan dalam
Data Mining
■Aplikasi data mining ■
Sistem produk dan protetipe riset data mining ■
Tema tambahan pada data mining ■
Dampak tentang data mining ■
Kecenderungan yang terdapat pada data mining ■
Ringkasan
Aplikasi Data Mining
■
Data Mining adalah suatu aplikasi terbaru yang berbeda dan lebih luas
■ Masih adanya perbedaan pendapat antara prinsip umum dan pembagian wilayah secara khusus pada aplikasi data mining, khususnya pada keefektifan alat bantu data mining untuk aplikasi tertentu
■
Beberapa aplikasi domein (yang tercantum pada bab ini)
■ Biomedical dan analisa data DNA
■ Analisa data keuangan
■ Industri penjualan eceran
■ Industri telekomunikasi
Biomedical dan Analisa Data DNA
■Urutan DNA: 4 dasar yang membangun blok ( nucleotides): adenine ( A), cytosine ( C), guanine ( G), dan thymine ( T) ■
Gen: suatu urutan dari beratus-ratus individu nucleotides yang diatur secara
tertentu ■Manusia mempunyai sekitar 30,000 gen ■
Hal yang paling luar biasa yaitu jumlah jalan yang terdapat pada nucleotides
sehingga dapat dipecah dan diurutkan kembali untuk membentuk gen yang terpisah■ Pengintegrasian pembagian heterogen yang semantik, dalam genome database
Sekarang: terbagi-bagi, Generasi yang tak terkendali dan penggunaan data DNA secara luas Metoda pembersihan dan pengintegrasian data yang dikembangkan dalam Data Mining akan sangat membantu
Contoh Analisa DNA Pencarian persamaan dan perbandingan antar urutan DNA
Perbandingan sering terjadi pada pola tiap kelas ( sebagai contoh, sehat dan sakit)
Mengidentifikasi urutan pola gen yang berperan dalam berbagai penyakit Analisa asosiasi: identifikasi dari co-occurring urutan genKebanyakan penyakit tidaklah dicetuskan oleh gen tunggal tetapi oleh suatu kombinasi gen yang bertindak bersama-sama
Analisa asosiasi dapat membantu menentukan macam gen yang mungkin terjadi
bersama-sama dalam target percontohanAnalisa alur: menghubungkan gen pada masa pengembangan penyakit lain Gen yang berbeda bisa menjadi aktip pada penyakit yang berbeda Intervensi pada masa perkembang farmasi yang mentargetkan langkah-langkah yang berbeda secara terpisah
Penggambaran alat bantu dan analisa data genetik
Data Mining pada Analisa Data Keuangan
Data keuangan yang dikumpulkan oleh bank dan lembaga keuangan relatif lebih lengkap, dapat dipercaya, dan bermutu tinggi Disain dan konstruksi dari gudang data untuk multidimensional analisa data dan data mining
Gambaran dari hutang perbulan, perdaerah, persektor, dan faktor lain
Mengakses informasi statistik seperti maximum, minimum, total, rata-rata,
kecenderungannya, dan lain lainAnalisa pembayaran peminjaman kebijakan kredit secara prediksi per pelanggan
Seleksi di masa depan dan perlunya penggolongan secara atribut Pencapaian pembayaran peminjaman Nilai kredit konsumen
Keuangan Data Mining
Penggolongan dan pengelompokan pelanggan untuk target pemasaran Segmentasi multidimensional berdasarkan metode terdekat, penggolongan, alur keputusan, dan lain lain untuk mengidentifikasi penggolongan persediaan sekelompok pelanggan atau pelanggan baru
Mendeteksi pencucian uang dan kejahatan keuangan lain
pengintegrasian dari berbagai DBs ( sebagai contoh, transaksi bank, DBs sejarah kejahatan federal/negara) Alat bantu: data gambar, analisa pertalian, penggolongan, alat penggabungan, analisa orang asing, dan analisa pola alat percontohan (ditemukan urutan akses secara tidak biasa) Data Mining pada Industri Retail Industri Retail: besarnya data penjualan, sejarah belanja pelanggan, dan lain-lain
Aplikasi dari Retail data mining
Mengidentifikasi perilaku pembelian pelanggan Menentukan kecenderungan pola belanja pelanggan Meningkatkan mutu dari layanan pelanggan Mencapai kepuasan pelanggan Tingkatkan perbandingan konsumsi barang-barang Mendisain keefektifan distribusi dan transportasi barang Contoh Data Mining pada Industri Retail
Disain dan konstruksi dari gudang data yang didasarkan keuntungan penggunaan data mining Analisa multidimensional dari penjualan, pelanggan, produk, waktu, dan daerah
Analisa dari efektivitas dari kampanye penjualan Ingatan pelanggan: Analisa dari kesetiaan pelanggan
Menggunakan informasi kartu kesetiaan pelanggan untuk mendaftarkan urutan dari pembelian dari pelanggan tertentu Menggunakan pola mining untuk menyelidiki perubahan dalam konsumsi atau kesetiaan pelanggan Menyarankan penyesuaian penetapan harga dan variasi barang- barang
Referensi pembelian dan perbandingan materi
Data Mining pada Industri Telekomunikasi ( 1) Perkembangan yang sangat cepat dan industri yang sangat kompetitif dan permintaan yang besar untuk data mining
Memahami bisnis yang terlibat Mengidentifikasi pola telekomunikasi Menangkap aktivitas curang Mempergunaan sumber daya secara lebih baik Meningkatkan mutu dari layanan
Analisa multidimensional dari data telekomunikasi
Hakekat multidimensional: tempo pemanggilan, jangka waktu, lokasi dari pemanggil, jenis panggilan, dan lain lain
Data Mining pada Industri Telekomunikasi ( 2)
Analisa pola kecurangan dan identifikasi pola yang tidak lazim Mengidentifikasi pola para pengguna yang berpotensi curang dan penggunaan yang tidak lazim Mendeteksi usaha kecurangan masukan ke dalam rekening pelanggan Menemukan pola yang tidak biasa memerlukan perhatian khusus
Multidimensional asosiasi dan percontohan pola analisa Temukan pola satu set jasa komunikasi berdasarkan kelompok pelanggan, bulan, dan lain lain Mempromosikan penjualan dari jasa spesifik Meningkatkan ketersediaan dari jasa tertentu pada suatu daerah
Penggunaan alat bantu penggambaran dalam analisa data telekomunikasi
Bagaimana cara memilih suatu Sistem Data Mining?
Secara komersil sistem data mining mempunyai sedikit kesamaan Perbedaan kemampuan atau metodologi Data Mining Dapat bekerja dengan bermacam-macam data yang berbeda
Memerlukan berbagai pandangan yang dimensional dalam pemilihan Jenis data: relational, tanggapan, teks, urutan waktu, ruang?
Isu sistem
Hanya berjalan pada satu atau beberapa sistem operasi? Arsitektur client/server? Menyediakan tampilan berbasis Web dan mengijinkan data XML sebagai masukan atau keluaran?
Bagaimana cara memilih suatu Sistem Data Mining? ( 2)
Sumber data File teks ASCII, berbagai sumber data relational Mendukung koneksi ODBC ( OLE DB, JDBC)?
Fungsi dan metodologi Data mining Satu melawan berbagai fungsi data mining Satu melawan berbagai macam variasi perfungsi
Fungsi lain data mining dan metoda perfungsinya menyediakan pengguna dengan analisa dan fleksibilitas yang lebih besar
Menggabungkan dengan DB dan/atau sistem data gudang Empat format penggabungan: tidak ada penggabungan, penggabungan lepas, penggabungan semi ketat, dan penggabungan ketat
Idealnya, suatu sistem data mining harus di gabungkan dengan ketat dengan suatu sistem database Bagaimana cara memilih suatu Sistem Data Mining? ( 3)
Scalabilitas Scalabilitas perbaris ( atau ukuran database) Scalabilitas perkolom ( atau dimensi) Kutukan dari dimensionalitas: jauh lebih menantang untuk membuat suatu skala sistem kolom dari pada skala sistem baris
Alat bantu gambar "Suatu gambar dapat berharga seribu kata-kata“ Kategori penggambaran: data gambar, hasil gambaran, proses penggambaran, dan gambaran data mining
Bahasa query pada Data mining dan tampilan grafis pengguna
Mudah digunakan dan grafis yang berkualitas tinggi Pentingnya buku pedoman, data mining yang sangat interaktip
Contoh Sistem Data Mining ( 1)
Miner IBM yang cerdas
Suatu cakupan luas dari algoritma data mining Skala algoritma data mining Alat bantu: algoritma jaringan neural, metode statistik, persiapan data, dan alat bantu penggambaran data gambar Pengintegrasian yang ketat IBM dengan relational sistem database DB2
Perusahaan SAS miner
Berbagai alat bantu analisa yang statistik Alat bantu data gudang dan berbagai data algoritma mining
Microsoft SQLServer 2000
Mengintegrasikan DB dan OLAP dengan mining Mendukung OLEDB untuk DM standard
Contoh Sistem Data Mining ( 2)
Sgi Mineset Berbagai algoritma dan statistik tingkat lanjut data mining Alat bantu penggambaran tingkat lanjut
Clementine (SPSS) Pengembangan lingkungan data mining yang terintegrasi untuk pengguna akhir dan pengembang Berbagai algoritma data mining dan alat bantu penggambaran
DBMiner ( DBMiner Teknologi Inc.)
Berbagai modul data mining : analisa OLAP discovery-driven, asosiasi, penggolongan, dan pengelompokan efisien, Asosiasi dan sequential-pattern fungsi mining, dan alat penggolongan visuil Mining antara database relational dan data gudang
Visuallisasi Data Mining Visualisasi : penggunaan grafik komputer untuk menciptakan gambaran visuil yang membantu pemahaman yang ruwet, penyajian presentasi data yang kokoh
Visualisasi Data mining : proses menemukan kandungan yang tersembunyi dapat
menjadi pengetahuan yang bermanfaat khususnya dari data yang besar dengan
menggunakan teknik visualisasiVisualisasi
Tujuan visualisasi
Memperoleh masukan ruang informasi dengan mempetakan data ke dalam grafis sederhana Menyediakan ikhtisar yang kwalitatif dari data yang besar Mencari contoh pola, kecenderungan, struktur, ketidakteraturan, hubungan antar data.
Bantuan untuk menemukan daerah menarik dan parameter yang pantas untuk analisis kuantitatif lebih lanjut. Menyediakan suatu bukti yang visuil tentang memperoleh penyajian komputer
Visualisasi Data Mining & Visualisasi
Data Pengintegrasian dari visualisasi data miningVisualisasi data Hasil Visualisasi data mining Proses visualisasi data mining Visualisasi data mining yang interaktip
Visualisasi data
Data dalam database atau data gudang terlihat Pada tingkat abstrak yang berbeda Sebagai kombinasi yang berbeda tentang atribut atau dimensi
Data dapat dipersentasikan dalam berbagai format visual
Hasil Visualisasi Data Mining Presentasi dari hasil atau pengetahuan yang diperoleh dari format visual data mining
Contoh
Menyebar alur cerita dan boxplots (yang diperoleh dari data mining) Alur keputusan Aturan Asosiasi Kelompok Asing Aturan disamaratakan Boxplots dari Statsoft: Berbagai Combinasi Variabel
Visualisasi dari Data Mining pada
Perusahaan SAS Miner : Menyebaran Plots Visualisasi dari Peraturan Asosiasi SGI/MineSet 3.0