1. Tipe data numerik adalah suatu tipe data yang dapat dikalkulasi dapat
dilakukan penjumlahan, pengurangan, perkalian, pembagian.
2. Tipe data nominal adalah suatu tipe data yang tidak dapat dikalkulasi, contoh datanya adalah data jenis kelamin yang isinya adalah laki
– laki,
atau perempuan.
Gambar 2. 7 Himpunan Data
2.2.7 Metode Data Mining
Pekerjaan yang berkaitan dengan data mining dapat dibagi menjadi empat kelompok [6] :
a. Model prediksi Prediction modelling Pekerjaan ini berkaitan dengan pembuatan sebuah model yang dapat
melakukan pemetaan dari setiap himpunan variabel ke setiap targetnya, kemudian menggunakan model tersebut untuk memberikan nilai target
pada himpunan baru yang didapat. Model prediksi ini digunakan ketika tipe data yang dimiliki oleh
himpunan data merupakan tipe data numerik, dan ciri khas dari model prediksi ini merupakan dataset dalam bentuk time series. Contoh
algoritma yang dapat digunakan dalam model prediksi ini adalah algoritma neural network ANN.
Contoh pekerjaan yang menggunakan jenis klasifikasi adalah untuk melakukan prediksi harga saham dengan clas atau label berupa tanggal
penutupan saham.
Gambar 2. 8 Contoh data saham
Dari data saham tersebut dilakukan pembelajaran misalnya dengan neural network sehingga didapakan sebuah pengetahuan, pengetahuan
yang didapatkan berupa pengahuan berapa harga sahama kedepan. b. Analisis Cluster
Analisis cluster kelompok melakukan pengelompokan ke dalam sejumlah kelompok berdasarkan kesamaan karakteristik masing
– masing data pada kelompok
– kelompok yang ada. Data – data yang masuk ke dalam batas kesamaan dengan kelompoknya akan bergabung
ke dalam kelompok tersebut, dan akan terpisah dalam kelompok yang berbeda jika keluar dari batas kesamaan kelompok tersebut.
Metode clustering digunakan apabila dataset yang dimiliki tidak memiliki label, metode clustering ini tidak memerlukan guru dalam
melakukan pembelajaranya atau biasa disebut dengan unsupervised learning, hal ini yang membedakan model clustering dengan model
yang lainya. pekerjaan yang berkaitan dengan cluster adalah bagaimana bisa
mengetahui pola pembelian barang oleh konsumen pada waktu – waktu
tertentu. Dengan mengetahui pola kelompok pembelian tersebut, maka perusahaan retailer dapat menentukan jadwal promosi yang dapat
diberikan sehingga dapat membantu meningkatkan omzet penjualan.