Himpunan Data Dalam Data Mining

1. Tipe data numerik adalah suatu tipe data yang dapat dikalkulasi dapat dilakukan penjumlahan, pengurangan, perkalian, pembagian. 2. Tipe data nominal adalah suatu tipe data yang tidak dapat dikalkulasi, contoh datanya adalah data jenis kelamin yang isinya adalah laki – laki, atau perempuan. Gambar 2. 7 Himpunan Data

2.2.7 Metode Data Mining

Pekerjaan yang berkaitan dengan data mining dapat dibagi menjadi empat kelompok [6] : a. Model prediksi Prediction modelling Pekerjaan ini berkaitan dengan pembuatan sebuah model yang dapat melakukan pemetaan dari setiap himpunan variabel ke setiap targetnya, kemudian menggunakan model tersebut untuk memberikan nilai target pada himpunan baru yang didapat. Model prediksi ini digunakan ketika tipe data yang dimiliki oleh himpunan data merupakan tipe data numerik, dan ciri khas dari model prediksi ini merupakan dataset dalam bentuk time series. Contoh algoritma yang dapat digunakan dalam model prediksi ini adalah algoritma neural network ANN. Contoh pekerjaan yang menggunakan jenis klasifikasi adalah untuk melakukan prediksi harga saham dengan clas atau label berupa tanggal penutupan saham. Gambar 2. 8 Contoh data saham Dari data saham tersebut dilakukan pembelajaran misalnya dengan neural network sehingga didapakan sebuah pengetahuan, pengetahuan yang didapatkan berupa pengahuan berapa harga sahama kedepan. b. Analisis Cluster Analisis cluster kelompok melakukan pengelompokan ke dalam sejumlah kelompok berdasarkan kesamaan karakteristik masing – masing data pada kelompok – kelompok yang ada. Data – data yang masuk ke dalam batas kesamaan dengan kelompoknya akan bergabung ke dalam kelompok tersebut, dan akan terpisah dalam kelompok yang berbeda jika keluar dari batas kesamaan kelompok tersebut. Metode clustering digunakan apabila dataset yang dimiliki tidak memiliki label, metode clustering ini tidak memerlukan guru dalam melakukan pembelajaranya atau biasa disebut dengan unsupervised learning, hal ini yang membedakan model clustering dengan model yang lainya. pekerjaan yang berkaitan dengan cluster adalah bagaimana bisa mengetahui pola pembelian barang oleh konsumen pada waktu – waktu tertentu. Dengan mengetahui pola kelompok pembelian tersebut, maka perusahaan retailer dapat menentukan jadwal promosi yang dapat diberikan sehingga dapat membantu meningkatkan omzet penjualan.