Aplikasi dan Kecenderungan dalam Data Mining

  

Aplikasi dan Kecenderungan dalam

Data Mining

  Aplikasi data mining

  Sistem produk dan protetipe riset data mining

  Tema tambahan pada data mining

  Dampak tentang data mining

  Kecenderungan yang terdapat pada data mining

  Ringkasan

Aplikasi Data Mining

  ■

Data Mining adalah suatu aplikasi terbaru yang berbeda dan lebih luas

  ■ Masih adanya perbedaan pendapat antara prinsip umum dan pembagian wilayah secara khusus pada aplikasi data mining, khususnya pada keefektifan alat bantu data mining untuk aplikasi tertentu

  ■

Beberapa aplikasi domein (yang tercantum pada bab ini)

  ■ Biomedical dan analisa data DNA

  ■ Analisa data keuangan

  ■ Industri penjualan eceran

  ■ Industri telekomunikasi

  

Biomedical dan Analisa Data DNA

  Urutan DNA: 4 dasar yang membangun blok ( nucleotides): adenine ( A), cytosine ( C), guanine ( G), dan thymine ( T) ■

  

Gen: suatu urutan dari beratus-ratus individu nucleotides yang diatur secara

tertentu ■

  Manusia mempunyai sekitar 30,000 gen ■

  

Hal yang paling luar biasa yaitu jumlah jalan yang terdapat pada nucleotides

sehingga dapat dipecah dan diurutkan kembali untuk membentuk gen yang terpisah

  ■ Pengintegrasian pembagian heterogen yang semantik, dalam genome database

  Sekarang: terbagi-bagi, Generasi yang tak terkendali dan penggunaan data DNA secara luas Metoda pembersihan dan pengintegrasian data yang dikembangkan dalam Data Mining akan sangat membantu

  Contoh Analisa DNA Pencarian persamaan dan perbandingan antar urutan DNA

  

Perbandingan sering terjadi pada pola tiap kelas ( sebagai contoh, sehat dan sakit)

Mengidentifikasi urutan pola gen yang berperan dalam berbagai penyakit Analisa asosiasi: identifikasi dari co-occurring urutan gen

  Kebanyakan penyakit tidaklah dicetuskan oleh gen tunggal tetapi oleh suatu kombinasi gen yang bertindak bersama-sama

Analisa asosiasi dapat membantu menentukan macam gen yang mungkin terjadi

bersama-sama dalam target percontohan

  Analisa alur: menghubungkan gen pada masa pengembangan penyakit lain Gen yang berbeda bisa menjadi aktip pada penyakit yang berbeda Intervensi pada masa perkembang farmasi yang mentargetkan langkah-langkah yang berbeda secara terpisah

  Penggambaran alat bantu dan analisa data genetik

  Data Mining pada Analisa Data Keuangan

  Data keuangan yang dikumpulkan oleh bank dan lembaga keuangan relatif lebih lengkap, dapat dipercaya, dan bermutu tinggi Disain dan konstruksi dari gudang data untuk multidimensional analisa data dan data mining

  Gambaran dari hutang perbulan, perdaerah, persektor, dan faktor lain

Mengakses informasi statistik seperti maximum, minimum, total, rata-rata,

kecenderungannya, dan lain lain

  Analisa pembayaran peminjaman kebijakan kredit secara prediksi per pelanggan

  Seleksi di masa depan dan perlunya penggolongan secara atribut Pencapaian pembayaran peminjaman Nilai kredit konsumen

  Keuangan Data Mining

  Penggolongan dan pengelompokan pelanggan untuk target pemasaran Segmentasi multidimensional berdasarkan metode terdekat, penggolongan, alur keputusan, dan lain lain untuk mengidentifikasi penggolongan persediaan sekelompok pelanggan atau pelanggan baru

Mendeteksi pencucian uang dan kejahatan keuangan lain

  pengintegrasian dari berbagai DBs ( sebagai contoh, transaksi bank, DBs sejarah kejahatan federal/negara) Alat bantu: data gambar, analisa pertalian, penggolongan, alat penggabungan, analisa orang asing, dan analisa pola alat percontohan (ditemukan urutan akses secara tidak biasa) Data Mining pada Industri Retail Industri Retail: besarnya data penjualan, sejarah belanja pelanggan, dan lain-lain

Aplikasi dari Retail data mining

  Mengidentifikasi perilaku pembelian pelanggan Menentukan kecenderungan pola belanja pelanggan Meningkatkan mutu dari layanan pelanggan Mencapai kepuasan pelanggan Tingkatkan perbandingan konsumsi barang-barang Mendisain keefektifan distribusi dan transportasi barang Contoh Data Mining pada Industri Retail

  Disain dan konstruksi dari gudang data yang didasarkan keuntungan penggunaan data mining Analisa multidimensional dari penjualan, pelanggan, produk, waktu, dan daerah

  Analisa dari efektivitas dari kampanye penjualan Ingatan pelanggan: Analisa dari kesetiaan pelanggan

  Menggunakan informasi kartu kesetiaan pelanggan untuk mendaftarkan urutan dari pembelian dari pelanggan tertentu Menggunakan pola mining untuk menyelidiki perubahan dalam konsumsi atau kesetiaan pelanggan Menyarankan penyesuaian penetapan harga dan variasi barang- barang

  Referensi pembelian dan perbandingan materi

  Data Mining pada Industri Telekomunikasi ( 1) Perkembangan yang sangat cepat dan industri yang sangat kompetitif dan permintaan yang besar untuk data mining

  Memahami bisnis yang terlibat Mengidentifikasi pola telekomunikasi Menangkap aktivitas curang Mempergunaan sumber daya secara lebih baik Meningkatkan mutu dari layanan

  Analisa multidimensional dari data telekomunikasi

  Hakekat multidimensional: tempo pemanggilan, jangka waktu, lokasi dari pemanggil, jenis panggilan, dan lain lain

  Data Mining pada Industri Telekomunikasi ( 2)

  Analisa pola kecurangan dan identifikasi pola yang tidak lazim Mengidentifikasi pola para pengguna yang berpotensi curang dan penggunaan yang tidak lazim Mendeteksi usaha kecurangan masukan ke dalam rekening pelanggan Menemukan pola yang tidak biasa memerlukan perhatian khusus

  Multidimensional asosiasi dan percontohan pola analisa Temukan pola satu set jasa komunikasi berdasarkan kelompok pelanggan, bulan, dan lain lain Mempromosikan penjualan dari jasa spesifik Meningkatkan ketersediaan dari jasa tertentu pada suatu daerah

  Penggunaan alat bantu penggambaran dalam analisa data telekomunikasi

  Bagaimana cara memilih suatu Sistem Data Mining?

  Secara komersil sistem data mining mempunyai sedikit kesamaan Perbedaan kemampuan atau metodologi Data Mining Dapat bekerja dengan bermacam-macam data yang berbeda

  Memerlukan berbagai pandangan yang dimensional dalam pemilihan Jenis data: relational, tanggapan, teks, urutan waktu, ruang?

Isu sistem

  Hanya berjalan pada satu atau beberapa sistem operasi? Arsitektur client/server? Menyediakan tampilan berbasis Web dan mengijinkan data XML sebagai masukan atau keluaran?

  Bagaimana cara memilih suatu Sistem Data Mining? ( 2)

  Sumber data File teks ASCII, berbagai sumber data relational Mendukung koneksi ODBC ( OLE DB, JDBC)?

  Fungsi dan metodologi Data mining Satu melawan berbagai fungsi data mining Satu melawan berbagai macam variasi perfungsi

  Fungsi lain data mining dan metoda perfungsinya menyediakan pengguna dengan analisa dan fleksibilitas yang lebih besar

  Menggabungkan dengan DB dan/atau sistem data gudang Empat format penggabungan: tidak ada penggabungan, penggabungan lepas, penggabungan semi ketat, dan penggabungan ketat

  Idealnya, suatu sistem data mining harus di gabungkan dengan ketat dengan suatu sistem database Bagaimana cara memilih suatu Sistem Data Mining? ( 3)

  Scalabilitas Scalabilitas perbaris ( atau ukuran database) Scalabilitas perkolom ( atau dimensi) Kutukan dari dimensionalitas: jauh lebih menantang untuk membuat suatu skala sistem kolom dari pada skala sistem baris

  Alat bantu gambar "Suatu gambar dapat berharga seribu kata-kata“ Kategori penggambaran: data gambar, hasil gambaran, proses penggambaran, dan gambaran data mining

Bahasa query pada Data mining dan tampilan grafis pengguna

  Mudah digunakan dan grafis yang berkualitas tinggi Pentingnya buku pedoman, data mining yang sangat interaktip

  Contoh Sistem Data Mining ( 1)

Miner IBM yang cerdas

  Suatu cakupan luas dari algoritma data mining Skala algoritma data mining Alat bantu: algoritma jaringan neural, metode statistik, persiapan data, dan alat bantu penggambaran data gambar Pengintegrasian yang ketat IBM dengan relational sistem database DB2

  Perusahaan SAS miner

  Berbagai alat bantu analisa yang statistik Alat bantu data gudang dan berbagai data algoritma mining

Microsoft SQLServer 2000

  Mengintegrasikan DB dan OLAP dengan mining Mendukung OLEDB untuk DM standard

  Contoh Sistem Data Mining ( 2)

  Sgi Mineset Berbagai algoritma dan statistik tingkat lanjut data mining Alat bantu penggambaran tingkat lanjut

  Clementine (SPSS) Pengembangan lingkungan data mining yang terintegrasi untuk pengguna akhir dan pengembang Berbagai algoritma data mining dan alat bantu penggambaran

DBMiner ( DBMiner Teknologi Inc.)

  Berbagai modul data mining : analisa OLAP discovery-driven, asosiasi, penggolongan, dan pengelompokan efisien, Asosiasi dan sequential-pattern fungsi mining, dan alat penggolongan visuil Mining antara database relational dan data gudang

  Visuallisasi Data Mining Visualisasi : penggunaan grafik komputer untuk menciptakan gambaran visuil yang membantu pemahaman yang ruwet, penyajian presentasi data yang kokoh

Visualisasi Data mining : proses menemukan kandungan yang tersembunyi dapat

menjadi pengetahuan yang bermanfaat khususnya dari data yang besar dengan

menggunakan teknik visualisasi

  Visualisasi

Tujuan visualisasi

  Memperoleh masukan ruang informasi dengan mempetakan data ke dalam grafis sederhana Menyediakan ikhtisar yang kwalitatif dari data yang besar Mencari contoh pola, kecenderungan, struktur, ketidakteraturan, hubungan antar data.

  Bantuan untuk menemukan daerah menarik dan parameter yang pantas untuk analisis kuantitatif lebih lanjut. Menyediakan suatu bukti yang visuil tentang memperoleh penyajian komputer

  

Visualisasi Data Mining & Visualisasi

Data Pengintegrasian dari visualisasi data mining

  Visualisasi data Hasil Visualisasi data mining Proses visualisasi data mining Visualisasi data mining yang interaktip

  Visualisasi data

  Data dalam database atau data gudang terlihat Pada tingkat abstrak yang berbeda Sebagai kombinasi yang berbeda tentang atribut atau dimensi

  Data dapat dipersentasikan dalam berbagai format visual

  Hasil Visualisasi Data Mining Presentasi dari hasil atau pengetahuan yang diperoleh dari format visual data mining

Contoh

  Menyebar alur cerita dan boxplots (yang diperoleh dari data mining) Alur keputusan Aturan Asosiasi Kelompok Asing Aturan disamaratakan Boxplots dari Statsoft: Berbagai Combinasi Variabel

  

Visualisasi dari Data Mining pada

Perusahaan SAS Miner : Menyebaran Plots Visualisasi dari Peraturan Asosiasi SGI/MineSet 3.0