4
1.5. Manfaat Penelitian
1. Manfaat Praktis Bagi penulis, manfaat praktis yang di harapakan adalah dengan adanya penelitian
yang penulis teliti diharapkan dapat memperluas wawasan dan memperoleh pengetahuan baru tentang mengelompokan data pertandingan DOTA 2 ,dimana
game belum terlalu banyak dalam sebuah penelitian.
2. Manfaat Akademis manfaat akademis yang diharapkan dalah agar hasil dari penelitian ini dapat
dijadikan bahan rujukan bagi semua ilmu yang berhubungan dengan penelitian dan juga dapat menjadi referensi bagi mahasiswa yang melakukan kajian
terhadap algoritma ini .
5
BAB 2 LANDASAN TEORI
Pada bab ini akan dijelaskan bagaimana cara penulis mendapatkan informasi dalam pengerjaan karya ini ,dan agar tentunya landasan teori ini dapat
mempertanggung jawabkan hasil akhir dari penelitian ini.
2.1 Knowledge Discovery in Database
Knowledge Discovery and Data MiningKDD adalah proses yang dibantu
oleh komputer untuk menggali dan menganalisis sejumlah besar himpunan data dan mengekstrak informasi dan pengetahuan yang berguna. Data mining
tools memperkirakan perilaku dan tren masa depan, memungkinkan bisnis untuk membuat keputusan yang proaktif dan berdasarkan pengetahuan. Data mining
tools mampu menjawab permasalahan bisnis yang secara tradisional terlalu lama untuk diselesaikan. Data mining tools
menjelajah database untuk mencari pola tersembunyi, menemukan infomasi yang prediktif yang mungkin dilewatkan para
pakar karena berada di luar ekspektasi mereka.Proses KDD terdiri dari 5 proses seperti terlihat pada gambar di bawah.Akan tetapi , dalam proses KDD yang
sesungguhnya ,dapat saja terjadi iterasi atau pengulangan pada tahap tertentu.Pada setiap tahap dalam proses KDD,bisa saja dapat kembali ke tahap
sebelumnya.Sebagai contoh pada saat coding atau data mining,ada proses cleaning yang belum dilakukan dengan sempurna, kemudian menemukan informasi baru
untuk memperkaya data yang sudah ada.
Gambar 2. 1 Proses pengolahan datae.g., Fayyad et al. 1996
6 1. Data Selection
Menciptakan himpunan data target , pemilihan himpunan data, atau memfokuskan pada subset variabel atau sampel data, dimana penemuan discovery akan
dilakukan.Pemilihan seleksi data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil
seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.
2. Pre-processingatau Cleaning Pemprosesan pendahuluan dan pembersihan data merupakan operasi dasar seperti
penghapusan noise dilakukan.Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD.Proses
cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak
tipografi.Dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk
KDD, seperti data atau informasi eksternal.
3. Transformation Pencarian fitur-fitur yang berguna untuk mempresentasikan data bergantung
kepada goal yang ingin dicapai.Merupakan proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses ini
merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data .Dalam penelitian ini menggunakan 2
normalisasi yaitu Z-score dan MinMax a. Normalisasi Z-score
Disebut juga zero-mean normalization, dimana value dari sebuah atribut A dinormalisasi berdasarkan nilai rata-rata dan standar deviasi dari
atribut A. Sebuah value v dari atribut A dinormalisasi menjadi v dengan rumus:
7 2.1
Keterangan : -
̅ = adalah rata-rata dari nilai -
σ
A
= adalah standar deviasi dari atribut A - v = adalah nilai yang ingin diubah
- v’ = adalah hasil Z-score
b. Normalisasi MinMax MinMax normalization memetakan sebuah value v dari atribut A
menjadi v ke dalam range [new_minA, new_maxA] berdasarkan rumus:
2.2 Keterangan :
- v = adalah nilai yang akan dinormalisasi -
v’=adalah nilai hasil normalisasi - min = adalah nilai minimal lama dari nilai v
- max = adalah nilai maksimal lama dari nilai v - new_min = adalah nilai minimal baru sesuai kebutuhan
- new_max = adalah nilai maksimal baru sesuai kebutuhan
4. Data mining Pemilihan tugas data mining; pemilihan goal dari proses KDD misalnya
klasifikasi, regresi, clustering, dll.Pemilihan algoritma data mining untuk pencarian searchingProses Data mining yaitu proses mencari pola atau informasi
menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan
8 metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD
secara keseluruhan.
5. Interpretationatau Evaluation Penerjemahan pola-pola yang dihasilkan dari data mining.Pola informasi yang
dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah mimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari
proses KDD yang mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya.
2.2 Pengertian Clustering