Penerapan Teknik Data Mining

Terdapat dua cara unt uk mel akukan diskrit isasi nil ai at ribut . Cara pert ama dengan mel akukan penel usuran scanni ng sel uruh dat aset unt uk semua nil ai kont inu yang muncul , kemudian menggunakan nil ai t ersebut sebagai domain dari at ribut nominal . Teknik ini membuat domain nil ai menj adi himpunan t ert ut up dari nil ai yang mungkin muncul , sehingga dat aset menj adi ‘ spar se’ . Terdapat t eknik l ainnya, yait u ‘ bi nni ng’ , yang mendef inisikan kumpul an kel as nominal unt uk set iap at ribut , kemudian menet apkan set iap nil ai at ribut ke dal am sal ah sat u kel as. Misal nya, j ika domain at ribut numerik mempunyai nil ai dari 0 sampai dengan 100, domain t ersebut dapat dibagi menj adi empat bin 0. . 24, 25. . 49, 50. . 74, 75. . 100. Set iap nil ai at ribut akan dikonversi menj adi at ribut nominal yang berkorespondensi dengan sal ah sat u bin. Terdapat t iga cara unt uk mendef inisikan int erval nil ai, yait u equal -wi dt h, equal -f r equency, dan cust omi sed. Equal -wi dt h akan membagi int erval nil ai at ribut menj adi n int erval yang l ebarnya sama. Equal -f r equency menghit ung int erval dari set iap kel as sehingga set iap kel as yang dial okasikan akan mempunyai f rekuensi inst ans dat aset yang hampir sama.

4. Penerapan Teknik Data Mining

Proses anal isis dat a dengan menerapkan t eknik dat a mi ni ng dapat dil akukan mel al ui anal isis st at ist ik at au dengan pendekat an machi ne l ear ni ng. Anal isis dat a pembel aj aran dengan pendekat an machi ne l ear ni ng akan menggunakan t iga t eknik, yait u associ at i on r ul es, cl ust er i ng, dan cl assi f i cat i on [ Nil akant , 2004] [ Merceron, 2005] . Al gorit ma associ at i on r ul e AR digunakan unt uk menemukan hubungan ant ar nil ai t ert ent u dari at ribut nominal dal am suat u dat aset . At uran yang dihasil kan dapat dit ul is dal am bent uk “ if -t hen” dengan mempert imbangkan besaran suppor t dan conf i dence unt uk menil ai rel iabil it as at uran. Bent uk umum at uran dal am associ at i on r ul e adal ah : X = x i → Y = y i [ sup, conf ] dengan X = { x 1 , x 2 , . . . , x n }, Y = { y 1 , y 2 , . . . , y m }, sup = probabil it as bahwa suat u inst ans dal am dat aset mengandung X Y, conf = probabil it as kondisional bahwa inst ans yang mengandung X j uga mengandung Y. Pada gambar 4 dit unj ukkan cont oh at ribut dat aset yang dapat dit urunkan dari Tabel 1 yang akan digunakan sebagai acuan unt uk pembahasan dal am al gorit ma AR, cl assif icat ion, dan cl ust ering berikut ini. Dat aset t ersebut dapat merupakan gabungan dari beberapa dat a yang diperol eh saat siswa berint eraksi dengan sist em pembel aj aran. 26 Mewat i Ayub No At ribut Ket erangan 1 IdSiswa Ident it as siswa 2 NoSoal Nomor soal yang dikerj akan 3 JenisSal ah Jenis kesal ahan 4 NoAt uran Nomor at uran konsep yang dipakai dal am soal 5 Jml Coba Banyaknya usaha siswa mencoba menj awab soal 6 Tingkat Tingkat pencapaian dal am pengerj aan soal 7 Nil ai Nil ai yang diperol eh Gambar 4. Cont oh At ribut Dat aset Dal am mi ni ng dat a pembel aj aran, al gorit ma AR dapat dimanf aat kan unt uk menemukan kesal ahan yang sering t erj adi pada saat siswa mengerj akan l at ihan soal . Sebagai cont oh, dari dat aset pada gambar 4, diperol eh kumpul an inst ans mengenai siswa yang mel akukan kesal ahan dengan f rekuensi t ert ent u. Diasumsikan kumpul an inst ans t ersebut memenuhi kondisi j ika siswa mel akukan kesal ahan A dan kesal ahan B, maka mereka j uga mel akukan kesal ahan C, misal nya dengan support 30 dan conf idence 60, akan dit ul is sebagai : A and B → C [ 30, 60] At uran t ersebut dapat dibaca sebagai berikut : dari 30 siswa yang mel akukan kesal ahan A dan kesal ahan B dari sel uruh siswa yang mengerj akan l at ihan soal , 60 diant aranya mel akukan kesal ahan C. Al gorit ma AR j uga dapat menyat akan hubungan ant ara beberapa at ribut yang berbeda, misal nya kesal ahan A pada konsep X menimbul kan kesal ahan B pada konsep Y, yang dit ul is sebagai A and X → B and Y Teknik cl assi f i cat i on bekerj a dengan mengel ompokkan dat a berdasarkan dat a t raining dan nil ai at ribut kl asif ikasi. At uran pengel ompokan t ersebut akan digunakan unt uk kl asif ikasi dat a baru ke dal am kel ompok yang ada. Cl assif icat ion dapat direpresent asikan dal am bent uk pohon keput usan deci si on t r ee. Set iap node dal am pohon keput usan menyat akan suat u t es t erhadap at ribut dat aset , sedangkan set iap cabang menyat akan hasil dari t es t ersebut . Pohon keput usan yang t erbent uk dapat dit erj emahkan menj adi sekumpul an at uran dal am bent uk IF condit ion THEN out come. Perbedaan ut ama ant ara at uran hasil al gorit ma AR dengan at uran hasil cl assi f i cat i on adal ah cl assi f i cat i on hanya membuat model unt uk sat u 27 at ribut , yait u at ribut kel as. Pada al gorit ma AR, bagian konsekuen at uran bagian kanan at uran dapat mengandung l ebih dari sat u at ribut , sedangkan pada cl assi f i cat i on hanya mengandung nil ai at ribut dari at ribut kel as. Hal ini dapat digunakan unt uk anal isis secara t op-down, yait u mul ai dengan al gorit ma AR unt uk memperol eh hubungan ant ara beberapa at ribut , kemudian anal isis dipersempit pada at ribut t ert ent u dengan menggunakan cl assi f i cat i on. Dengan menggunakan dat aset hasil bel aj ar siswa sepert i pada gambar 4, sebagai dat a t raining pada suat u t ahun, dapat dibuat pohon keput usan unt uk memperkirakan dist ribusi nil ai siswa pada t ahun berikut nya. Gambar 5 menunj ukkan cont oh pohon keput usan yang dihasil kan dari t eknik cl assi f i cat i on. Pada gambar 5 t erl ihat kl asif ikasi siswa yang didasarkan pada j uml ah kesal ahan yang dil akukan siswa dan t ingkat pencapaian dal am pengerj aan soal . Pemil ihan at ribut yang digunakan dal am pohon keput usan dit ent ukan secara heurist ik dengan i nf or mat i on gai n [ Jiawei, 2001] . Gambar 5. Cont oh Pohon Keput usan Teknik cl ust er i ng bekerj a dengan mencari kemiripan di ant ara obj ek dengan memperhat ikan karakt erist ik obj ek, sekel ompok obj ek yang mirip akan t ermasuk ke dal am sat u cl ust er . Teknik yang dapat digunakan unt uk mel akukan cl ust er i ng ant ara l ain al gorit ma k-means at au al gorit ma k- medoi ds [ Jiawei, 2001] . Cl ust er i ng dapat dit erapkan unt uk mengenal i karakt erist ik siswa yang mengal ami kesul it an bel aj ar. Misal nya kit a ingin menganal isis siswa yang sudah mencoba mengerj akan l at ihan, namun t idak dapat menyel esaikannya sampai t unt as. Dal am hal ini, dat a yang dapat digunakan adal ah j uml ah kesal ahan yang dil akukan seorang siswa dal am mengerj akan suat u soal . Dengan demikian, siswa-siswa dengan f rekuensi tingkat pencapaian? tingkat jml-salah? n ≤ n pencapaian? ≤ p p ≤ m m kelas-3 kelas-2 kelas-1 kelas-2 28 Mewat i Ayub dan j enis kesal ahan yang hampir sama mirip, dapat dikel ompokkan dal am sat u cl ust er yang sama. Sebagai cont oh, bil a n m, cl ust er 1 adal ah kel ompok siswa yang f rekuensi kesal ahannya l ebih kecil dari n, cl ust er 2 adal ah kel ompok siswa dengan f rekuensi kesal ahan di ant ara n sampai dengan m, dan cl ust er 3 adal ah kel ompok siswa dengan f rekuensi kesal ahan l ebih besar dari m. Cont oh visual isasi cl ust ering dapat dit unj ukkan sepert i pada gambar 6. Pada gambar t ersebut t erdapat t iga cl ust er dan beberapa out l i er . Gambar 6. Cont oh Clust ering frekuensi kesalahan id.siswa

5. Kesimpulan