Predictive Descriptive . External Temporal Processing Exte te

menghasilkan suatu pola atau karakter data yang dapat berarti dan dapat digunakan untuk membentuk sebuah informasi atau pengetahuan yang berguna. Data mining ini merupakan salah satu tahapan dari proses yang ada pada Knowledege Discovery in Database KDD yang digunakan untuk mengambil intisari dari model atau pola tertentu yang muncul dari analisis data. Secara umum, data mining dapat dikelompokan menjadi 2 kategori utama, yaitu predictive dan descriptive Han, Kamber, Pei, 2012 :

a. Predictive

mining adalah proses pencarian pola-pola dari kumpulan data menggunakan variabel tertentu yang mungkin akan terjadi di waktu yang akan datang. Proses ini dilakukan dengan cara melakukan analisis kepada kumpulan data secara urut dan membentuk satu atau beberapa kumpulan model yang dapat digunakan untuk memprediksi karakteristik dari kumpulan data baru. Contoh dari penerapan predictive data mining adalah proses klasifikasi, analisis regresi dan analisis trend.

b. Descriptive

Descriptive mining adalah proses pencarian karakter atau ciri-ciri serta informasi tertentu yang penting dalam suatu kumpulan data. Tugas descriptive mining adalah melakukan penyelidikan atas informasi yang bisa didapatkan dari kumpulan data tertentu. Informasi yang didapatkan, atau cirri yang didaptkan dari proses yang ada pada Kn Kn owledege Discovery in Database KD KD D D yang digunaka an n untuk mengambil intisari d dari mode e l atau pola terten entu yang muncul dari a analisis data. . Seca c ra u u mum, data mining da d pat t dike e lo l mpokan menjad ad i i 2 ka ka t te gori utama, ya yait i u pr pred ed ic i tive ve dan de de sc scri riptiv v e Han, Kambe r, Pei, 20 12 12 :

a. .

Pr edicti ve mining adalah prose s pencarian pola la - -pola a da ri kumpulan da ta m engg un akan varia be l l te e rt rten e tu yang m un gk in a ka n terj ad i di waktu y a ang akan an datang. Pr os es ini d ilak uk an den ga an ca cara a mela ku kan anal isis kepad a kumpulan dat a a se secara ra ur ut d d a an membe nt nt uk sat at u atau b b eb eb erapa kumpul l an an model yang dapat t d d i igunakan untuk mempred d ik ik si si karakteristik dari kumpulan data baru. C Con onto to h da da i ri p p en e er er ap ap an an p p redict ct iv ive e da da ta ta m i inin n g g ad ad al al ah proses es kla la si si fika ka si si, , an an al al is sis is regresi si dan analis is i is trend.

b. Descriptive

Descriptive mining g adalah proses pencarian karakter atau ciri ri-ci iri serta informasi tertentu yang penting dalam m suatu kumpulan data. Tugas proses ini perlu dilakukan proses validasi dan pemberian penjelasan terhadap temuan baru yang ada pada data. Proses ini disebut post- processing. Data mining memiliki 3 tujuan utama dari proses yang dilakukan yaitu explanatory, confirmatory, dan exploratory Hoffer, Ramesh Topi, 2012. Tujuan data mining dalam kaitannya dengan explanatory adalah untuk memberikan penjelasan pada suatu kondisi tertentu atau pada suatu proses observasi. Sedangkan tujuan confirmatory digunakan untuk melakukan konfirmasi atau menjawab hipotesis yang dibuat. Terakir adalah exploratory yang bertugas untuk menganalisis kumpulan data yang akan diproses. Sebagai salah satu proses analisis, data mining memiliki kelebihan dalam melakukan proses analisis. Yang pertama jelas bahwa data mining dapat menangani pemrosesan terhadap data yang besar dan kompleks seperti memiliki berbagai macam tipe data dan atribut yang dimiliki. Kelebihan yang penting pada data mining adalah kemampuannya untuk mempelajari pengalaman atau proses pembelajaran terdahulu. Dengan kemampuan ini, hasil dan kualitas analisis proses yang dilakukan pada waktu selanjutnya akan meningkat. Pada data mining terdapat beberapa tahapan yang dilakukan untuk memproses kumpulan data. Proses pertama yang dilalui adalah data selection. Pada pemilihan data ini adalah proses memilih kumpulan data yang akan dianalisis. Lalu yang kedua adalah preprocessing yaitu proses pembuangan data yang ganda, data yang inkonsisten , serta penggabungan Data mining g memiliki 3 t t uj uj uan utama dari proses yang dilak k uk ukan yaitu explanatory, co c nfirmatory, dan explorat atory Hoffer er , Ramesh Topi, 2 2 012. Tujuan data a minin n g da d la m m ka kait it an an ny ny a a dengan e e xplanatory ad dalah unt uk uk memberikan penj el elasan n pada a suatu kondis is i i t terten en t tu atau pada s ua a tu tu pro ose se s s obse r rvasi. Se Se da da ng ng kan tu juan co nf irmatory d d ig i un n ak ak an an u nt n uk me me la la kuka ka n konfirmasi a tau menjawab h ip ip otes esis is yan ang di d buat at . Teraki r adal ah explor at ory ya ng ng b ber ertu tu ga s s u untu u k menganalis is kumpulan data yang akan dip p ro ro se s s. Se b ba gai sa lah sa tu p ro ses analisis , da ta

a m

min in in n g g me e mi liki kel eb ihan d al am mel akuk an proses a analisi is . Ya a ng pertama jelas bahwa data mining dapat m menang ngan i i pe pe mr os es an t t er er ha ha da d p data y y an

an g

g be b sar da n ko komple e ks ks seperti me mi liki ki b b er erbaga gai i macam tipe data da dan n atribut yang dimiliki. Kelebihan yang penting pa pa d da da data ta mining adalah kemampuannya untuk mem em pe pela laja ja ri pe p ng ng al al am am an an

a a

ta ta u u pr pros oses es p pem m be be la la ja ja ra ra n n te te rd rdah ah u ulu. De Deng ng an

an k

k e emam am p puan i i ni, hasi i l l dan n ku u al alit it as

as a

ana nalisis proses yang dilakuka kan pa a da d waktu selan j jutnya akan meningkat. Pada data minin ng terda dapat beberapa tahapan yang dilakukan untuk mem mprose es kumpulan data. Proses pertama yang dilalui

a a

da lah data selection. Pada pemilihan data ini adalah proses memilih kumpulan data dengan data lain untuk memperkaya informasi guna keperluan analisis. Proses ketiga adalah transformasi yaitu proses pengkodean sesuai dengan kriteria analisis pada data yang telah dipilih. Kemudian proses pencarian pola atau informasi yang baru dengan metode atau teknik tertentu. Proses terakhir adalah proses evaluasi yaitu proses pengkajian hasil penemuan informasi baru dengan fakta atau hipotesis yang sebelumnya telah dibuat lalu dipresentasikan dalam bentuk yang sesuai dengan keinginan.

2.2.2. Artificial Neuron Network ANN

Artificial Neuron Network ANN atau Jaringan Saraf Tiruan adalah sebuah konsep rekayasa pengetahuan yang mengadopsi sistem kerja saraf manusia. Metode ini dapat digunakan untuk pengenalan pola, klasifikasi dan peramalan. Dalam desainnya, ANN memiliki 3 bagian yaitu bagian input, bagian pemrosesan dan bagian output Prasetyo, 2012. Inputan pada ANN ini dapat berupa vector sehingga perhitungan dalam ANN dapat dilakukan untuk masalah yang kompleks dengan mudah. Dalam prosesnya, metode ANN ini digunakan untuk melakukan peramalan dan pengenalan pola dalam data mining. Untuk melakukannya, ANN memerlukan proses pelatihan agar dapat melakukan prediksi kelas dari suatu data uji coba. Dalam proses penambangan data, ANN menggunakan fungsi aktivasi yang digunakan untuk membatasi keluaran dari bagian pemrosesan atau neuron agar sesuai dengan batasan yang diinginkan. Terdapat berbagai algoritma yang dapat digunakan Kemudian proses pe pe nc ncarian po po la atau informasi yang baru dengan metode atau tekn ik ik tertentu. Proses terakhir adalah proses evaluasi yaitu proses pengka ka j jian hasil p en enem mua ua n n in in formasi ba b ru dengan fakt kta atau h h ip ip otes i is yang se sebe be lu lum mnya tel ah ah dibuat l lalu dip ip re r sentas s ik ik an an d alam b b en en tuk yang g s s esuai dengan kein in gi gi na na n.

2.2.2. 2.

Artifi ci al Neuro n Networ k ANN Artificial N euron Netw or k ANN ata u u Ja Jari ring n an n Sa r ra f Tiruan ada la h se bu ah kon se p reka ka ya y sa a pe eng etahuan ya ng m en ga do ps i si st em ker ja a sar r af af ma a nusia. Metode in i dapat di gu na ka n untuk pe ngena alan n po po la , kl as if ik asi dan peramalan. Dal am d e esai ainnya ya , ANN me mi mi li li ki ki 3 3 b b ag agia ia n ya yait it u u ba ba gi gi an

an i

i nput, bagi gi an an pemrosesan dan bagia

a n

n output Prasetyo, 20 12 12 . In In pu p tan pada ANN ini dapat berupa vector s s eh ehin ingg gg a pe pe rh rh it it un un ga ga n n da da la lam m AN ANN N da a pa pat t di di l la ku ku ka ka n n un un tu tu k k ma ma sa sal lah ya ya ng ng kom om pl plek eks de deng ng

an a

m mud ud a ah. Dalam prosesnya, a, metod ode ANN ini digunakan untuk melakukan peramalan n dan pe engenalan pola dalam data mining. Untuk mela k kukanny ya, ANN memerlukan proses pelatihan agar dapat t mel l ak ukan prediksi kelas dari suatu data uji coba. D Dal alam proses penambangan data, k f i k i i di k k untuk menggunakan metode ini. Salah satunya adalah algoritma Backpropagation. Algoritma Backpropagation adalah salah satu algoritma yang digunakan untuk melakukan pelatihan pada metode ANN. Algoritma ini bersifat nonlinear yang dapat mengatasi berbagai masalah yang rumit. Algoritma ini memiliki dasar matematis yang tinggi dan dilatih menggunakan meode belajar tebimb ing dimana hasil atau tujuannya sudah diketahui sebelumnya. Pada algoritma ini, jaringan akan diberikan sepasang pola yang merupakan masukan dan pola yang diinginkan. Ketika pola dimasukan ke dalam jaringan maka bobot-bobot akan diubah untuk memperkecil perbedaan pola keluaran dengan pola yang diinginkan. Pelatihan ini dilakukan berulang -ulang sehingga memenuhi pola yang diinginkan, Algoritma ini mendukung jenis ANN yang bersifat multi layer atau biasa disebut Multi Layer Precepton MLP. Pada algoritma ini terdiri dari 3 layer yaitu layer input, layer tersembunyi dan layer output. Gambar 2.1. Arsitektur Multi Layer Precepton Haselstainer Pfurtscheller, 2000. g y g g p pada metode AN N N. N. Algoritma i i ni n bersifat nonlinear yang dapat t mengatasi berbagai masa salah yang rumit. Algoritm tma ini mem m il i iki dasar matemati is s yang tinggi dan dilati i h h m menggu gu na naka ka n n me me od od e e belajar tebimb ing di dimana has s il il atau tujuannya a suda d h di diketahui sebelu lu mn mnya y . Pa Pa da alg or itma i i ni n , ja ja ri ri ngan akan di di be be ri ri kan n se pa sang pol a yang merup ak ak

an m

m as asuk u an dan po po la la y y a an g diinginkan. Ketika pol a dima su sukan ke ke dal l

am a

ja j rin ng an maka bobo t- bobot ak an d iu u bah h un un tu k k m memp mp er kecil perb ed aan pola k el uaran dengan pol l a a ya y ng g di i in gink an . Pelati ha n in i di lakukan beru la ang -u -u la l ng ng se e hi ngga mem en uh i po la y an g diin gi nk an, Algori tma ini mendukun g je ni s AN N yang ber rsifa a t t mult i la a ye ye r r atau bi bias a a dise se b but Mult lt i i La yer Pr P ecepto ton n MLP. Pada algoritma in n i i terdiri dari 3 layer y y ai ai tu tu layer input, layer tersembunyi dan layer output. t. Pada gambar di atas dapat dilihat arsitektur dari algoritma ini. Dicontohkan dengan gambar diatas diketahui terdapat layer output lalu satu layer tersembunyi dan satu layer input. Pada layer tersembunyi ini dapat dibuat lebih dari satu layer. Proses yang berjalan pada algoritma ini adal ah nilai dikirim melalui layer input ke layer tersembunyi sampai ke layer output. Pada bagian layer tersembunyi memiliki fungsi aktivasi sigmoid. Pelatihan pada algoritma Backpropagation memiliki proses seperti berikut. Yang pertama adalah proses Inisialisasi yang digunakan untuk memberikan nilai awal terhadap nilai yang diperlukan seperti bobot. Lalu yang kedua adalah Aktivasi yang akan melakukan perhitungan aktual output pada layer tersembunyi dan layer output. Selanjutnya adalah Pelatihan Bobot yaitu menghitung eror pada layer tersembunyi dan layer output dan mengganti bobot dengan bobot yang baru dan terakhir adalah Iterasi yang akan mengulang proses ini hingga mendapat eror yang minimal. Pada algoritma ini, proses pelatihan memiliki dua fase utama. Fase yang pertama, inputan pada algoritma ini diberikan pada layer input pada jaringan. Kemudian inputan akan diteruskan ke dalam layer – layer tersembunyi hingga menghasilkan nilai output di layer output. Fase kedua yaitu akan dihitung nilai eror dari hasil output jaringan dengan output yang sebenarnya. Kemudian hasil tersebut dikembalikan ke layer tersembunyi hingga kembali ke layer input dimana saat proses pengembalian ini, p y y p y tersembunyi da a n n satu layer r input. Pada layer tersembuny y i i ini dapat dibuat lebih h dari satu layer. Proses y yang berjalan

a p

p ada algo g ritma in i i adal ah nilai diki i r rim mela la lu lu i i la a ye ye r r in in pu pu t t ke k layer t t ersembunyi sa ampai ke l l ay er output. P P ad ada bagian n layer m m tersem embu buny n i m me mi liki fungs i akti iva vasi si sig gmoid. Pe Pe la lati tihan pada algor itma Backprop ag agat io io n n me m mi i li l ki pr pr os os es seper ti berikut . Yang pertama a a da la lah h pros s es e Inisi iali sasi yan g digu na kan un tu k memb er rikan

an n

n il i ai i a awal l terhadap ni la i ya ng dip er lukan sepe r rti bo bo bo b t. La l lu yan g kedua ad al ah Aktiv as i yang a kan m mela a ku ku ka a n n pe e rh itungan ak tu al outpu t pa da l ay er terse mb b unyi d dan n la a yer output. Se la nj utnya ad al ah Pelatih

a n

B B o obot t ya yait u me ng hi tu tu ng ng eror pada l l ay ay er e ter se mbun uny yi d d an an layer outp ut dan m m en en gg g

an n

ti ti b bobot d engan bobot ya ya ng ng baru dan terakhir adal ah ah Iterasi yang akan mengu gula la n ng pr r os os es ini hingga mendapat eror yang minim im al al. . Pa Pa da

al l

go go ri ri tm tm

a a

in in i, i, p ro ro se ses s pe pela lati ti ha ha n n me me mi mi li li ki ki d dua

a f

fase ut utam am a a. F F a ase e yang p p ertama, in puta ta n n p pad

ad a

a al al go goritma ini di diberikan pada a lay yer input pad d a jaringan. Kemudian inputan ak kan dite eruskan ke dalam layer – layer tersembunyi h hingga menghasilkan nilai output di layer output. F a ase k kedua yaitu akan dihitung nilai eror dari hasil ou utput jaringan dengan output yang sebenarnya Kemudian hasil tersebut bobot nilai akan diubah untuk agar mendapatkan hasil output yang lebih akurat Prasetyo, 2012. Backpropagation Klasifikasi memiliki metode yang digunakan untuk melakukan pembelajaran terhadap kumpulan data dan kemudian memetakan masing-masing data yang terpilih ke dalam salah satu dari kelompok kelas yang telah ditetapkan sebelumya. Tujuan dari klasifikasi yaitu memperkirakan kelas yang dimiliki dari suatu objek dimana objek tersebut belum diketahui labelnya. Proses klasifikasi ini melakukan proses pencarian model atau fungsi yang dapat menjelaskan atau membedakan kelas dari data tertentu Han, et al., 2012. Untuk mengukur kualitas dari klasifikasi dapat digunakan perhitungan berikut ini:

2.2.3. Temporal Data Mining

Temporal Data mining adalah sebuah teknik penambangan data yang dilakukan pada database temporal. Database temporal merupakan database yang memiliki data bersifat temporal yang artinya memiliki faktor waktu. Sebuah data pada temporal database bersifat time series yang artinya nilai pada data tersebut tersusun berdasarkan waktu tertentu. Dengan kata lain, temporal data mining berarti melakukan analisis penambangan data yang mempertimbangkan pengaruh waktu Mitsa, 2010. Pada penambangan data ini, unsur kompleksitas akan muncul dikarenakan penggalian data dan pemrosesan data dilakukan berdasarkan runtun waktu tertentu. Dalam penerapannya, penambangan data temporal ini dapat digunakan untuk melakukan klasifikasi serta prediksi suatu data yang akan datang. Klasifikasi pada y g g p j p kumpulan data da dan kemudian m m em em etakan masing-masing data yang te terpilih ke dalam salah sa satu dari kelompok kelas ya yang telah d ditetapkan sebelumya. a. Tujuan dari klas s i ifikasi i ya ya it i u me memp mp er er ki ki ra raka ka n n ke e las yang ng dimiliki da dari s s ua u tu o b bjek dimana ob b je e k k te te rsebut t belum diketa tahu hui i labe be ln lnya . Proses kla si sifi f kasi i i i ni ni mel

ak a

ukan pr pr os os es es p p e en ca rian model atau fung gsi y y an ang g da dapat me me nj nj ela as kan atau membedakan kela s dari d d ata te terten n tu t Han , , et al., 2012. Un tuk me ng ukur k ua alita ta s s da d ri ri k klas s if ikasi dapa t digu na kan pe rh itungan be r riku u t t in in i:

2. .

2. 3.

Tempor al D at a Mining Temporal Dat a mining a dalah sebuah te ekni k k pe e na n mban ga n n d da ta ta yang di di la la k ku ka ka n n pada d databas

as e

e temporal. Database t tem empo ora ral merupakan database y yan an g g memiliki data bersif f at temporal yang art rtin in y ya me m mi mi li li ki ki f f ak ak to to r r wa w ktu. Seb b ua ua h h da da ta ta p p ad ad

a a

te te mp mpor or al da d ta b base b ber ersi si fa t ti time me s series y yan

an g

ar i

tinya a ni nilai pa pada da d data a terseb b ut u ter r s susun be be rd rd as asar ar ka kan waktu tertentu. Dengan ka ata la ain, temporal data mining berarti melakukan analisi s penambangan data yang mempertimbangkan pen ngaruh waktu Mitsa, 2010. Pada penambangan data ini, uns sur kompleksitas akan muncul dikarenakan penggalian n data dan pemrosesan data dil k k b d k k l temporal data mining dilakukan berdasarkan analisis trend dan pola tertentu berdasarkan waktu Shahnawaz, et al., 2011. Klasifikasi dan prediksi dalam penambangan data temporal ini berdasarkan pergerakan nilai data pada suatu interval waktu yang diketahui bahwa pola-pola data yang muncul pada masa lalu dapat terulang. Perbedaan utama antara klasifikasi statis yang biasanya dilakukan dengan klasifikasi pada data temporal sangat jelas terlihat pada dimensi waktu. Pada klasifikasi statis, tidak ada hubungan antara satu data dengan data yang lain, sehingga data dapat diporses secara satu per satu atau individual. Berbeda degan klasifikasi yang dilakukan pada data temporal, proses dilakukan pada sebuah set data yang berurutan dari kumpulan data. Dalam proses klasifikasi temporal data ini, terdapat 2 jenis pendekatan untuk melakukan pemrosesan data pada temporal data, yaitu External Temporal Processing dan Internal Temporal Processing Haselstainer Pfurtscheller, 2000.

a. External Temporal Processing

External Temporal Processing memiliki arti bahwa pengolahan data temporal dimana dimensi waktu dari kumpulan data tersebut ditangani di luar proses klasifikasi. Gambar 1 di bawah ini dapat menunjukan proses dari External Temporal Processing. pergerakan nilai d d at ata pada da s s ua u tu interval waktu yang diketahui bahw hwa pola-pola data y an ang muncul pada masa lalu dapat at terulang. g Perbed d aa

aa n

n utam m a a an anta tara ra k k la la si si fikasi s sta t tis yang bi iasanya ya dil ilak akukan dengan kl l

as s

if i ikas as i pa da d data tempor or al al sanga ga t t jelas te rlih

at t

p p ada di di me mensi w waktu. Pa Pa da da k klasi si fi kasi stati s, tidak a da hub bun un ga gan n an ta t ra sa sa tu tu da at a dengan data ya ng lain, sehin gg gga da data ta dap p

at a

di d por rs es secar a satu per s at u atau i i nd d iv ivid id ua u l. . B Berb b ed a degan kl as ifik as i ya ng dilakukan p p ad d a a da d ta a te m mp oral, proses d il ak uk an pad a sebu ah set d dat a a ya y ng ng be e ru rutan da ri kumpu la n da ta . Dalam pros ses s kl l asifikasi temp oral data in i, terdapat 2 je jeni s s pe pe nd ekatan u u nt nt uk uk melakukan p p em em ro r sesa n da a ta ta pad ad

a a

temporal d d at

a, y

ai ai tu tu Ex x te te rn rn l al Temporal Processi si ng ng dan Internal Temporal Processing Haselstaine ne r r Pf Pfur ur tscheller, 2000.

a. Exte te

rn rn al T T em e pora ra l l Pr Pr oces s si s ng g E External Tempo poral Processing me e mi mi l liki arti bahwa pengolaha an data temporal dimana dimensi waktu dari kumpu pulan da ata tersebut ditangani di luar proses klas if i ika asi. Gambar 1 di bawah ini dapat menunjukan p p ro oses dari External Temporal Processing. Gambar 2.2. External Temporal Processing Haselstainer Pfurtscheller, 2000. Dari gambar 1 di atas, dapat dilihat bahwa proses ini membentuk sebuah pola yang digunakan sebagain inputan untuk klasifikasi menggunakan sebuah subset yang terdiri dari data-data individual. Singkatnya, kumpulan data individual akan dibentuk ulang menjadi sebuah pola yang lebih besar. Dari pola yang terbentuk tersebut akan merepresentasikan bentuk baru dari kumpulan data temporal yang ada sebelumnya. Pola baru dari kumpulan data individual tersebut dapat dibentuk dengan menggunakan perhitungan statistika. Keuntungan utama dari pendekatan ini yaitu proses klasifikasi dapat dilakukan dengan menggunakan model klasifikasi yang sederhana yaitu klasifikasi untuk pola yang statis. Proses yang kompleks akan terdapat pada proses pembentukan pola baru dari kumpulan data individual. Gamb bar ar 2 2 .2. External Tem m po po ral Processi sing H H a aselst t ai ai ne r Pfurts ch ch el el ler, 2 2 00 00 . Da Da ri g ambar 1 di atas, d ap at dil l ih h at at bah ahwa pr r o os es ini membentuk sebuah po la y an ang di digu gu naka an s se bagain inp ut

an u

nt uk k la si fikasi m men ngg ggun un ak a an n se buah subse t ya ng t er diri dari data ta-d -data indivi du al. Si ng katn ya , ku mpul an data in ndivi i dual al akan diben tu k ul an g me nj adi sebuah p o ola ya yang g lebih besar. Dari pola y ang terbentuk ters rsebut t akan m m er er e eprese e nt nt asikan b b e entu k k ba ba ru dari k kumpul l an an data temporal ya an ng a ada sebelumnya. Pola ba ba ru ru dari kumpulan data individual tersebut d d ap

ap a

at di di be be nt nt uk uk d d en en ga g n me me ng ng gu gu na na ka ka n n p perh h it itun un g gan statisti ti ka ka . Ke Keuntungan uta ama d dari pendekat at an

an i

ini yaitu proses klasifi ikasi d d apat dilakukan dengan menggunakan mod del kl a asifikasi yang sederhana yaitu klasifikasi i untu uk pola yang statis. Proses yang kompleks

ak a

a an terdapat pada proses pembentukan pola baru dari kumpulan data

b. Internal Temporal Processing