Data berkala time series adalah data yang dikumpulkan dari waktu ke waktu. Tujuannya adalah untuk menggambarkan perkembangan suatu kegiatan dari waktu ke
waktu. Misalnya, perkembangan produksi di suatu perusahaan selama lima tahun terakhir, perkembangan penjualan produk selama lima tahun terakhir, dan lain
sebagainya. Jenis data ini juga sering disebut sebagai data historis.
2.2 . Data Mining
Data Miningadalah suatu metode pengolahan data untuk menemukan pola yang tersembunyi dari data tersebut. Hasil dari pengolahan data dengan metode Data
Miningini dapat digunakan untuk mengambil keputusan di masa depan. Data Mining ini juga dikenal dengan istilah pattern recognition Ong, 2013.
Data Mining, sering juga disebut knowledge discovery in database KDD, adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan
keteraturan, pola atau hubungan dalam set data berukuran besar. Keluaran dari Data Mining ini biasa dipakai untuk memperbaiki pengambilan keputusan di masa depan.
Sehingga istilah pattern recognition sekarang jarang digunakan karena ia termasuk bagian dari Data Mining Santosa, 2007.
Data Mining suatu proses kegiatan yang berulang-ulang pada analisis database dalam jumlah besar, dengan tujuan untuk melakukan penggalian informasi dan pengetahuan
yang dapat membuktikan keakuratan dan potensi yang berguna bagi pengetahuan pekerja yang terlibat dalam pengambilan keputusan dan pemecahan masalah. Istilah
data mining itu merujuk pada keseluruhan proses yang terdiri dari pengumpulan data analisis, pengembangan model pembelajaran induktif dan adopsi keputusan praktis
seta tindakan berdasarkan pengetahuan yang diperoleh Vercilles, 2009.Kegiatan data mining dapat dibagi kedalam dua inti penyelidikan utama, sesuai dengan tujuan utama
dari analisis, yaitu: interpretasi dan prediksi Vercilles, 2009. 1.
Interpretasi Tujuan interpretasi adalah untuk mengidentifikasi pola yang teratur dalam data
dan untuk mengekspresikan data melalui peraturan dan kriteria yang dapat dengan mudah dipahami oleh para ahli dalam domain aplikasi. Contoh;
Clustering, Association Rules.
Universitas Sumatera Utara
2. Prediksi
Tujuan dari prediksi adalah untuk mengantisipasi atau memprediksi nilai suatu variable random yang akan menggambarkan kondisi dimasa mendatang atau
memperkirakan kemungkinan peristiwa masa depan. Contoh; Classification, Regression, Time Series Analysis.
Berdasarkan tugas dan tujuan analisis, proses data mining dapat dibagi menjadi dua kategori utama, Tergantung pada adanya target variabel dan metode belajar learning
yaitu antara proses belajar yang diawasi supervised dan tanpa pengawasan unsupervised Vercilles, 2009.
1. Belajar yang diawasi supervised learning
Dalam analisis supervised learning, atribut targetlabel menggambarkan kelas yang dimiliki setiap catatan. Atau dengan kata lain metode belajar dengan
adanya latihan training dan pelatihlabel. Contoh: Regresi, analisa Deskriminan, Artificial Neural Network dan Support Vektor Machine.
2. Belajar tanpa pengawasan unsupervised learning.
Tanpa pengawasan analisis belajar tidak dipandu oleh atribut targetlabel. Oleh karena itu, data mining dalam hal ini ditujukan untuk menemukan pola
berulang dan kedekatan dalam kumpulan data. Atau dengan kata lain metode belajar tanpa adanya latihan training dan pelatihlabel. Contoh clustering dan
Self Organization Map SOM. Data Miningmerupakan metode pengolahan data berskala besar oleh karena itu Data
Mining ini memiliki peranan penting dalam bidang industri, keuangan, cuaca, ilmu dan teknologi. Secara umum kajian Data Mining membahas metode-metode seperti,
clustering, klasifikasi, regresi, seleksi variable, dan market basket analisis. Santosa, 2007. Data Mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat
dilakukan, yaitu Paulanda, 2012 : 1.
Deskripsi Description Terkadang penelitian analisis secara sederhana ingin mencoba mencari cara untuk
menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menemukan keterangan
atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan presiden. Deskripsi dari pola dan kecenderungan sering memberikan
kemungkinan penjelasan untuk suatu pola atau kecenderungan.
Universitas Sumatera Utara
2. Estimasi Estimation
Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke arah numerik daripada ke arah kategori. Model dibangun menggunakan
recordlengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi. Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat
berdasarkan nilai variabel prediksi. Sebagai contoh, akan dilakukan estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis
kelamin, indeks berat badan, dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan
menghasilan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya.
3. Prediksi Prediction
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada di masa datang. Contoh prediksi dalam bisnis dan
penelitian adalah : a.
Prediksi harga beras dalam tiga bulan yang akan datang. b.
Prediksi persentase kenaikan kecelakaan lalu lintas tahun depan jika batas bawah kecepatan dinaikkan.
Beberapa metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat pula digunakan untuk keadaan yang tepat untuk prediksi.
4. Klasifikasi Classification
Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi,
pendapatan sedang dan pendapatan rendah. Berikut contoh dari Klasifikasi:
a. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang
curang atau bukan. b.
Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan suatu kredit yang baik atau buruk.
c. Mendiagnosis penyakit seorang pasien untuk mendapatkan kategori penyakit
apa.
Universitas Sumatera Utara
5. Pengklusteran Clustering
Pengklusteran merupakan
pengelompokkan record,
pengamatan atau
memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan. clusteradalah kumpulan recordyang memiliki kemiripan satu dengan yang lainnya
dan memiliki
ketidakmiripan dengan
record-recorddalam clusterlain.
Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam pengklusteran. Pengklusteran tidak mencoba untuk melakukan klasifikasi,
mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma pengklusteran mencoba untuk melakukan pembagian terhadap keseluruhan data
menjadi kelompok-kelompok yang memiliki kemiripan homogen, yang mana kemiripan recorddalam satu kelompok akan bernilai maksimal, sedangkan
kemiripan dengan recorddalam kelompok lain akan bernilai minimal. Contoh pengklusteran dalam bisnis dan penelitian adalah :
a. Melakukan pengklusteran terhadap ekspresi dari gen, untuk mendapatkan
kemiripan perilaku dari gen dalam jumlah besar. b.
Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial dalam keadaan baik atau mencurigakan.
c. Asosiasi Assosiation
d. Tugas asosiasi dalam Data Miningadalah menemukan atribut yang muncul
dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja. Contoh asosiasi dalam bisnis dan penelitian adalah :
a. Menemukan barang dalam supermarket yang dibeli secara bersamaan
dan barang yang tidak pernah dibeli secara bersamaan. b.
Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu produk bagi perusahaan yang tidak memiliki dana pemasaran
yang besar. c.
Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang diharapkan untuk memberikan respons posistif terhadap
penawaran upgrade layanan yang diberikan.
2.3. Proses Data Mining