Proses Data Mining dalam Sistem Pembelajaran Berbantuan Komputer.

(1)

Berbantuan Komputer

Mewat i Ayub

Jur usan Tekni k Inf or mat i ka, Fakul t as Teknol ogi Inf or masi Uni ver si t as Kr i st en Mar anat ha, Bandung Emai l : mewat i . ayub@eng. mar anat ha. edu

Abstract

Web-based educat i onal syst ems and i nt el l i gent t ut or i ng syst ems col l ect l ar ge amount s of st udent s dat a, f r om web l ogs t o st udent model s. Dat a mi ni ng appl i cat i ons on t hose dat a can hel p di scover i ng r el evant knowl edge f or i mpr ovi ng comput er ai ded l ear ni ng syst em. Usi ng t he knowl edge, t eacher can under st and mor e about how st udent s l ear n by st udyi ng a gr oup of st udent s i n or der t o enhance t eachi ng and l ear ni ng. In t hi s paper , dat a mi ni ng pr ocess wi l l be separ at ed i nt o dat a col l ect i on, dat a t r ansf or mat i on, and dat a anal ysi s. Associ at i on r ul es, cl assi f i cat i on, and cl ust er i ng ar e dat a mi ni ng al gor i t hms t hat expl or ed i n dat a anal ysi s f or comput er ai ded l ear ni ng syst ems.

Keywords : dat a mi ni ng, comput er ai ded l ear ni ng syst em, knowl edge 1. Pendahuluan

Ket ersediaan dat a yang berl impah yang dihasil kan dari penggunaan t eknol ogi inf ormasi di hampir semua bidang kehidupan, menimbul kan kebut uhan unt uk dapat memanf aat kan inf ormasi dan penget ahuan yang t erkandung di dal am l impahan dat a t ersebut , yang kemudian mel ahirkan dat a mi ni ng. Dat a mi ni ng merupakan proses unt uk menemukan penget ahuan (knowl edge di scover y) yang dit ambang dari sekumpul an dat a yang vol umenya sangat besar. Apl ikasi dat a mi ni ng pada pengel ol aan bisnis, pengendal ian produksi, dan anal isa pasar misal nya, memungkinkan diperol ehnya pol a dan hubungan yang dapat dimanf aat kan unt uk peningkat an penj ual an, at au pengel ol aan sumber daya dengan l ebih baik. Dunia pendidikan memil iki dat a yang berl impah dan berkesinambungan mengenai siswa yang dibina dan al umni yang dihasil kannya. Hal ini membuka pel uang dit erapkannya dat a mi ni ng unt uk pengel ol aan pendidikan yang l ebih baik [ Jing, 2004] dan dat a mi ni ng dal am pel aksanaan pembel aj aran berbant uan komput er yang l ebih ef ekt if [ Merceron, 2005] .


(2)

Sist em pembel aj aran berbant uan komput er (comput er ai ded l ear ni ng syst em) dapat diimpl ement asikan sebagai sist em t ut orial berbasis web (web-based t ut or i ng t ool ) [ Merceron, 2005] at au sist em t ut orial cerdas (i nt el l i gent t ut or i ng syst em) [ Nil akant , 2004] . Di dal am sist em t ut orial berbasis web maupun sist em t ut orial cerdas, set iap int eraksi siswa dengan sist em akan dicat at dal am suat u basis dat a dal am bent uk web l og at au model siswa (st udent model ). Set el ah sist em t ersebut digunakan dal am proses pembel aj aran sel ama j angka wakt u t ert ent u, maka akan t erkumpul sej uml ah besar dat a. Kumpul an dat a t ersebut dapat diproses l ebih l anj ut dengan dat a mi ni ng unt uk memperol eh pol a baru yang dapat digunakan unt uk meningkat kan ef ekt if it as dal am proses pembel aj aran.

Makal ah ini akan membahas bagaimana dat a mi ni ng dapat dimanf aat kan unt uk meningkat kan ef ekt if it as dal am proses pembel aj aran berbant uan komput er dari sudut pedagogi.

2. Dat a Mining

Dat a mi ni ng mengacu pada proses unt uk menambang (mi ni ng) penget ahuan dari sekumpul an dat a yang sangat besar [ Jiawei, 2001] . Sebenarnya dat a mi ni ng merupakan suat u l angkah dal am knowl egde di scover y i n dat abases (KDD). Knowl edge di scover y sebagai suat u proses t erdiri at as pembersihan dat a (dat a cl eani ng), int egrasi dat a (dat a i nt egr at i on), pemil ihan dat a (dat a sel ect i on), t ransf ormasi dat a (dat a t r ansf or mat i on), dat a mi ni ng, eval uasi pol a (pat t er n eval uat i on) dan penyaj ian penget ahuan (knowl edge pr esent at i on).

Kerangka proses dat a mi ni ng yang akan dibahas t ersusun at as t iga t ahapan, yait u pengumpul an dat a (dat a col l ect i on), t ransf ormasi dat a (dat a t r ansf or mat i on), dan anal isis dat a (dat a anal ysi s) [ Nil akant , 2004] . Proses t ersebut diawal i dengan pr epr ocessi ng yang t erdiri at as pengumpul an dat a unt uk menghasil kan dat a ment ah (r aw dat a) yang dibut uhkan ol eh dat a mi ni ng, yang kemudian dil anj ut kan dengan t ransf ormasi dat a unt uk mengubah dat a ment ah menj adi f ormat yang dapat diproses ol eh kakas dat a mi ni ng, misal nya mel al ui f il t rasi at au agregasi. Hasil t ransf ormasi dat a akan digunakan ol eh anal isis dat a unt uk membangkit kan penget ahuan dengan menggunakan t eknik sepert i anal isis st at ist ik, machi ne l ear ni ng, dan visual isasi inf ormasi.

Penget ahuan kurang Perbaikan dat aset

Pengumpulan data

Transformasi data

Data mentah Dataset Pengetahuan

Evaluasi Analisis data


(3)

(Mewat i Ayub) Gambar 1. Aliran inf ormasi dalam dat a mining

Pada gambar 1 dit unj ukkan diagram yang menggambarkan al iran inf ormasi dal am proses dat a mi ni ng yang diadapt asi dari [ Nil akant , 2004] . Proses dat a mi ni ng pada gambar t ersebut dit unj ukkan sebagai proses yang it erat if . Hasil eval uasi penget ahuan yang dihasil kan dat a mi ni ng dapat menimbul kan kebut uhan penget ahuan yang l ebih l engkap, perbaikan kumpul an dat a (dat aset ) at au perubahan pada sist em.

3. Dat a mining dalam pembelaj aran

Unt uk menent ukan variabel apa saj a yang perl u dicat at dari int eraksi siswa dengan sist em, perl u dikembangkan suat u model int eraksi siswa-sist em. Gambar 2 menunj ukkan anal isis int eraksi t ersebut pada beberapa l apisan (l ayer) yang berbeda [ Nil akant , 2004] .

Apabil a eval uasi sist em t ut orial dit erapkan pada l apisan t erl uar, maka akan dil akukan pr e-t est sebel um pel aj aran dimul ai dan post -t est set el ah pel aj aran sel esai diberikan. Perbedaan pr e-t est dan post -t est akan menunj ukkan perubahan kinerj a set iap siswa dengan granul arit as pada t ingkat pel aj aran. Jika diperl ukan anal isis yang l ebih t erinci, maka ekspl orasi hasil bel aj ar (l ear ni ng out come) harus dil akukan pada l apisan yang l ebih dal am. Sebagai cont oh, pembel aj aran dal am suat u pel aj aran t ersusun at as beberapa sesi. Set iap sesi diawal i dan diakhiri dengan t es unt uk mengeval uasi perubahan kinerj a set iap siswa per sesi. Sel ama suat u sesi, siswa akan mencoba mengerj akan sej uml ah soal . Unt uk mengerj akan suat u soal , siswa mungkin akan mencoba beberapa kal i sebel um mendapat kan sol usi yang pal ing t epat . Dari int eraksi t ersebut , beberapa inf ormasi dapat dicat at ol eh sist em, sepert i misal nya apakah siswa dapat menj awab set iap soal dengan benar, berapa kal i siswa mencoba sebel um akhirnya memberikan j awaban yang t epat . Pada t ingkat granul arit as yang pal ing baik, set iap usaha siswa menj awab soal dibedakan at as mel anggar at au memenuhi sej uml ah at uran. Inf ormasi mengenai pel anggaran at au pemenuhan t ersebut dapat dicat at , dan akan menghasil kan represent asi st at us kognit if siswa, yang dikenal sebagai model siswa.


(4)

Pelajaran

Sesi

Soal

Usaha

Aturan

Gambar 2. Model int eraksi siswa-sist em (lapisan granularit as) Inf ormasi yang dihasil kan pada berbagai l apisan t ersebut di at as dapat sal ing mel engkapi, sehingga anal isis dat a dapat menunj ukkan hubungan ant ara dat a dari berbagai l apisan. Sebagai cont oh, unt uk set iap pel anggaran at uran yang dicat at , inf ormasi mengenai siswa yang mel akukan pel anggaran, pel aj aran yang sedang diikut i, soal yang sedang dipel aj ari, sert a usaha yang menyebabkan pel anggaran harus disimpan j uga. Pada t abel 1 dit unj ukkan ringkasan dat a yang dapat disimpan unt uk set iap usaha yang dil akukan siswa dal am menj awab soal .

T abel 1. T aksonomi variabel dari usaha siswa menj awab soal

Kegiat an Variabel Ket erangan

persiapan • umpan bal ik yang

t ersedia

• banyaknya soal • banyaknya usaha • t ingkat kesul it an soal • kont eks soal

inf ormasi yang dipakai siswa

sebel um mencoba menj awab suat u soal

pel aksanaan l at ihan soal

wakt u yang diperl ukan unt uk menj awab soal

inf ormasi mengenai usaha siswa menj awab suat u soal

eval uasi • at uran (rel evan,

dipenuhi, dil anggar) • t ingkat umpan bal ik

yang dimint a

• permint aan mel ihat sol usi

inf ormasi yang berhubungan dengan hasil (out come) dari suat u usaha.


(5)

(Mewat i Ayub)

Tahap pengumpul an dat a akan menyediakan dat a dal am vol ume yang cukup besar, namun anal isis dat a t idak dapat l angsung dil akukan t erhadap kumpul an dat a t ersebut , karena harus dil akukan t ransf ormasi t erhadap dat a sehingga anal isis siap dil akukan.

Dat a ment ah yang dihasil kan dari pengumpul an dat a, biasanya t ersimpan dal am bent uk beberapa t abel basis dat a. Karena anal isis dat a umumnya dil akukan t erhadap suat u t abel t unggal , maka perl u dil akukan penggabungan (j oin) beberapa t abel yang rel evan. Hasil nya adal ah suat u st rukt ur yang disebut dengan dat aset , sepert i t ampak pada gambar 3 [ Nil akant , 2004] . Dat aset dapat dikel ompokkan secara vert ikal sebagai kumpul an at ribut dan secara horisont al sebagai kumpul an inst ans. Set iap at ribut mempunyai t ipe dat a, yang dapat berupa numerik, t eks, at au bent uk l ainnya. Jika domain nil ai suat u at ribut berhingga, maka disebut at ribut nominal . Suat u inst ans adal ah dat a yang dihasil kan dari suat u kej adian di dunia nyat a, yang dicat at dal am beberapa at ribut .

at ribut -1

at ribut -2

. . . at ribut -n inst ans-1 x1, 1 x1, 2 . . . x1, n inst ans-2 x2, 1 x2, 2 . . . x2, n . . . . inst ans-m xm, 1 xm, 2 . . . xm, n

Gambar 3. Format Dat aset

Transf ormasi dat aset dapat dil akukan dal am beberapa cara, ant ara l ain f il t rasi dat aset dan konversi at ribut [ Nil akant , 2004] [ Jiawei, 2001] . Fil t rasi dat aset dil akukan dengan mengurangi ukuran dat aset , yait u dengan membuang beberapa inf ormasi yang t idak rel evan. Sebagai cont oh, dari anal isis t erhadap dat a ment ah dit emukan bahwa beberapa soal dal am basis dat a cenderung menimbul kan pel anggaran t erhadap at uran t ert ent u. Unt uk ekspl orasi penyebabnya, anal isis harus dibat asi hanya t erhadap kumpul an soal t ersebut . Dengan menyaring inf ormasi t ersebut , proses anal isis akan memberikan hasil yang l ebih dapat diandal kan (r el i abl e). Fil t rasi dil akukan t erhadap sal inan dat a, sehingga dat a asl i t idak mengal ami perubahan dat a. Cara berikut nya unt uk t ransf ormasi dat a adal ah konversi at ribut , yait u bekerj a pada nil ai at ribut di set iap inst ans dari dat aset . Tuj uan dari konversi at ribut adal ah mengubah at ribut bernil ai kont inu (t idak berhingga) menj adi at ribut dengan nil ai nominal (berhingga), karena sebagian cara anal isis dengan machi ne l ear ni ng t idak dapat berf ungsi pada at ribut yang bernil ai kont inu.


(6)

Terdapat dua cara unt uk mel akukan diskrit isasi nil ai at ribut . Cara pert ama dengan mel akukan penel usuran (scanni ng) sel uruh dat aset unt uk semua nil ai kont inu yang muncul , kemudian menggunakan nil ai t ersebut sebagai domain dari at ribut nominal . Teknik ini membuat domain nil ai menj adi himpunan t ert ut up dari nil ai yang mungkin muncul , sehingga dat aset menj adi ‘spar se’ .

Terdapat t eknik l ainnya, yait u ‘ bi nni ng’ , yang mendef inisikan kumpul an kel as nominal unt uk set iap at ribut , kemudian menet apkan set iap nil ai at ribut ke dal am sal ah sat u kel as. Misal nya, j ika domain at ribut numerik mempunyai nil ai dari 0 sampai dengan 100, domain t ersebut dapat dibagi menj adi empat bin (0. . 24, 25. . 49, 50. . 74, 75. . 100). Set iap nil ai at ribut akan dikonversi menj adi at ribut nominal yang berkorespondensi dengan sal ah sat u bin.

Terdapat t iga cara unt uk mendef inisikan int erval nil ai, yait u equal -wi dt h, equal -f r equency, dan cust omi sed. Equal -wi dt h akan membagi int erval nil ai at ribut menj adi n int erval yang l ebarnya sama. Equal -f r equency menghit ung int erval dari set iap kel as sehingga set iap kel as yang dial okasikan akan mempunyai f rekuensi inst ans dat aset yang hampir sama. 4. Penerapan Teknik Data Mining

Proses anal isis dat a dengan menerapkan t eknik dat a mi ni ng dapat dil akukan mel al ui anal isis st at ist ik at au dengan pendekat an machi ne l ear ni ng. Anal isis dat a pembel aj aran dengan pendekat an machi ne l ear ni ng akan menggunakan t iga t eknik, yait u associ at i on r ul es, cl ust er i ng, dan cl assi f i cat i on [ Nil akant , 2004] [ Merceron, 2005] .

Al gorit ma associ at i on r ul e (AR) digunakan unt uk menemukan hubungan ant ar nil ai t ert ent u dari at ribut nominal dal am suat u dat aset . At uran yang dihasil kan dapat dit ul is dal am bent uk “ if -t hen” dengan mempert imbangkan besaran suppor t dan conf i dence unt uk menil ai rel iabil it as at uran. Bent uk umum at uran dal am associ at i on r ul e adal ah :

(X = xi) →(Y = yi) [ sup, conf ]

dengan X = { x1, x2, . . . , xn}, Y = { y1, y2, . . . , ym}, sup = probabil it as bahwa suat u inst ans dal am dat aset mengandung X Y, conf = probabil it as kondisional bahwa inst ans yang mengandung X j uga mengandung Y.

Pada gambar 4 dit unj ukkan cont oh at ribut dat aset yang dapat dit urunkan dari Tabel 1 yang akan digunakan sebagai acuan unt uk pembahasan dal am al gorit ma AR, cl assif icat ion, dan cl ust ering berikut ini. Dat aset t ersebut dapat merupakan gabungan dari beberapa dat a yang diperol eh saat siswa berint eraksi dengan sist em pembel aj aran.


(7)

(Mewat i Ayub)

No At ribut Ket erangan

1 IdSiswa Ident it as siswa

2 NoSoal Nomor soal yang dikerj akan 3 JenisSal ah Jenis kesal ahan

4 NoAt uran Nomor at uran/ konsep yang dipakai dal am soal 5 Jml Coba Banyaknya usaha siswa mencoba menj awab soal 6 Tingkat Tingkat pencapaian dal am pengerj aan soal 7 Nil ai Nil ai yang diperol eh

Gambar 4. Cont oh At ribut Dat aset

Dal am mi ni ng dat a pembel aj aran, al gorit ma AR dapat dimanf aat kan unt uk menemukan kesal ahan yang sering t erj adi pada saat siswa mengerj akan l at ihan soal . Sebagai cont oh, dari dat aset pada gambar 4, diperol eh kumpul an inst ans mengenai siswa yang mel akukan kesal ahan dengan f rekuensi t ert ent u. Diasumsikan kumpul an inst ans t ersebut memenuhi kondisi j ika siswa mel akukan kesal ahan A dan kesal ahan B, maka mereka j uga mel akukan kesal ahan C, misal nya dengan support 30% dan conf idence 60%, akan dit ul is sebagai :

A and B → C [ 30%, 60%]

At uran t ersebut dapat dibaca sebagai berikut : dari 30% siswa yang mel akukan kesal ahan A dan kesal ahan B (dari sel uruh siswa yang mengerj akan l at ihan soal ), 60% diant aranya mel akukan kesal ahan C.

Al gorit ma AR j uga dapat menyat akan hubungan ant ara beberapa at ribut yang berbeda, misal nya kesal ahan A pada konsep X menimbul kan kesal ahan B pada konsep Y, yang dit ul is sebagai

A and X → B and Y

Teknik cl assi f i cat i on bekerj a dengan mengel ompokkan dat a berdasarkan dat a t raining dan nil ai at ribut kl asif ikasi. At uran pengel ompokan t ersebut akan digunakan unt uk kl asif ikasi dat a baru ke dal am kel ompok yang ada. Cl assif icat ion dapat direpresent asikan dal am bent uk pohon keput usan (deci si on t r ee). Set iap node dal am pohon keput usan menyat akan suat u t es t erhadap at ribut dat aset , sedangkan set iap cabang menyat akan hasil dari t es t ersebut . Pohon keput usan yang t erbent uk dapat dit erj emahkan menj adi sekumpul an at uran dal am bent uk IF condit ion THEN out come. Perbedaan ut ama ant ara at uran hasil al gorit ma AR dengan at uran hasil cl assi f i cat i on adal ah cl assi f i cat i on hanya membuat model unt uk sat u


(8)

at ribut , yait u at ribut kel as. Pada al gorit ma AR, bagian konsekuen at uran (bagian kanan at uran) dapat mengandung l ebih dari sat u at ribut , sedangkan pada cl assi f i cat i on hanya mengandung nil ai at ribut dari at ribut kel as. Hal ini dapat digunakan unt uk anal isis secara t op-down, yait u mul ai dengan al gorit ma AR unt uk memperol eh hubungan ant ara beberapa at ribut , kemudian anal isis dipersempit pada at ribut t ert ent u dengan menggunakan cl assi f i cat i on.

Dengan menggunakan dat aset hasil bel aj ar siswa sepert i pada gambar 4, sebagai dat a t raining pada suat u t ahun, dapat dibuat pohon keput usan unt uk memperkirakan dist ribusi nil ai siswa pada t ahun berikut nya. Gambar 5 menunj ukkan cont oh pohon keput usan yang dihasil kan dari t eknik cl assi f i cat i on. Pada gambar 5 t erl ihat kl asif ikasi siswa yang didasarkan pada j uml ah kesal ahan yang dil akukan siswa dan t ingkat pencapaian dal am pengerj aan soal . Pemil ihan at ribut yang digunakan dal am pohon keput usan dit ent ukan secara heurist ik dengan i nf or mat i on gai n [ Jiawei, 2001] .

Gambar 5. Cont oh Pohon Keput usan

Teknik cl ust er i ng bekerj a dengan mencari kemiripan di ant ara obj ek dengan memperhat ikan karakt erist ik obj ek, sekel ompok obj ek yang mirip akan t ermasuk ke dal am sat u cl ust er . Teknik yang dapat digunakan unt uk mel akukan cl ust er i ng ant ara l ain al gorit ma means at au al gorit ma k-medoi ds [ Jiawei, 2001] . Cl ust er i ng dapat dit erapkan unt uk mengenal i karakt erist ik siswa yang mengal ami kesul it an bel aj ar. Misal nya kit a ingin menganal isis siswa yang sudah mencoba mengerj akan l at ihan, namun t idak dapat menyel esaikannya sampai t unt as. Dal am hal ini, dat a yang dapat digunakan adal ah j uml ah kesal ahan yang dil akukan seorang siswa dal am mengerj akan suat u soal . Dengan demikian, siswa-siswa dengan f rekuensi

tingkat

pencapaian?

tingkat

jml-salah?

> n

n

pencapaian?

p

> p

m

> m

kelas-3

kelas-2


(9)

(Mewat i Ayub) dan j enis kesal ahan yang hampir sama (mirip), dapat dikel ompokkan dal am sat u cl ust er yang sama. Sebagai cont oh, bil a n < m, cl ust er 1 adal ah kel ompok siswa yang f rekuensi kesal ahannya l ebih kecil dari n, cl ust er 2 adal ah kel ompok siswa dengan f rekuensi kesal ahan di ant ara n sampai dengan m, dan cl ust er 3 adal ah kel ompok siswa dengan f rekuensi kesal ahan l ebih besar dari m. Cont oh visual isasi cl ust ering dapat dit unj ukkan sepert i pada gambar 6. Pada gambar t ersebut t erdapat t iga cl ust er dan beberapa out l i er .

Gambar 6. Cont oh Clust ering

frekuensi kesalahan

id.siswa

5. Kesimpulan

Penerapan dat a mining dal am sist em pembel aj aran berbant uan komput er diawal i dengan pengumpul an dat a, yang dil anj ut kan dengan t ransf ormasi dat a, dan diakhiri dengan anal isis dat a. Pada pengumpul an dat a, harus didef inisikan suat u model int eraksi si swa-sist em unt uk menet apkan dat a yang harus dicat at dari suat u proses pembel aj aran. Model int eraksi siswa-sist em t ersebut dapat t ersusun at as beberapa l apisan unt uk memungkinkan penangkapan dat a pada t ingkat granul arit as yang berbeda. Proses t ransf ormasi dat a mengubah dat a ment ah menj adi dat aset yang siap dianal isis. Transf ormasi dapat dil akukan pada inst ans dat aset mel al ui proses f il t rasi, maupun pada at ribut dari dat aset mel al ui f il t rasi at aupun konversi. Anal isis dat a hasil pembel aj aran dapat dil akukan dengan menerapkan t eknik al gorit ma associ at i on r ul es, cl assi f i cat i on, dan cl ust er i ng unt uk menghasil kan penget ahuan yang dapat membant u guru dal am mengel ol a kel asnya dengan memahami cara bel aj ar siswa, dan memberikan umpan bal ik proakt if kepada siswanya.


(10)

Daft ar Pust aka

Jiawei, H. , Kamber, M. (2001). Dat a Mining Concept s and Techniques, Morgan Kauf mann Publ ishers.

Jing, L. (2004). Dat a Mining Appl icat ions in Higher Educat ion,

www. spss. com/ event s/ e_id_1471/ Dat a Mining in Higher Educat ion. pdf, diakses t anggal 7 Februari 2007.

Nil akant , K. (2004). Appl icat ion of Dat a Mining in Const raint Based

Int el l igent Tut oring Syst em, www. cosc. cant erbury. ac. nz/ research/ report s/ HonsReps/ 2004/ hons_04

08. pdf, diakses t anggal 28 Februari 2007.

Merceron, A. , Yacef , K. (2005). Educat ional Dat a Mining : a Case St udy, ht t p: / / www. it . usyd. edu. au/ ~kal ina/ publ is/

merceron_yacef _aied05. pdf, diakses t anggal 7 Februari 2007.

Merceron, A. , Yacef , K. (2005). TADA-Ed f or Educat ional Dat a Mining, imej . wf u. edu/ art icl es/ 2005/ 1/ 03/ print ver. asp, diakses t anggal 1


(1)

(Mewat i Ayub)

Tahap pengumpul an dat a akan menyediakan dat a dal am vol ume yang cukup besar, namun anal isis dat a t idak dapat l angsung dil akukan t erhadap kumpul an dat a t ersebut , karena harus dil akukan t ransf ormasi t erhadap dat a sehingga anal isis siap dil akukan.

Dat a ment ah yang dihasil kan dari pengumpul an dat a, biasanya t ersimpan dal am bent uk beberapa t abel basis dat a. Karena anal isis dat a umumnya dil akukan t erhadap suat u t abel t unggal , maka perl u dil akukan penggabungan (j oin) beberapa t abel yang rel evan. Hasil nya adal ah suat u st rukt ur yang disebut dengan dat aset , sepert i t ampak pada gambar 3 [ Nil akant , 2004] . Dat aset dapat dikel ompokkan secara vert ikal sebagai kumpul an at ribut dan secara horisont al sebagai kumpul an inst ans. Set iap at ribut mempunyai t ipe dat a, yang dapat berupa numerik, t eks, at au bent uk l ainnya. Jika domain nil ai suat u at ribut berhingga, maka disebut at ribut nominal . Suat u inst ans adal ah dat a yang dihasil kan dari suat u kej adian di dunia nyat a, yang dicat at dal am beberapa at ribut .

at ribut -1

at ribut -2

. . . at ribut -n inst ans-1 x1, 1 x1, 2 . . . x1, n inst ans-2 x2, 1 x2, 2 . . . x2, n . . . . inst ans-m xm, 1 xm, 2 . . . xm, n

Gambar 3. Format Dat aset

Transf ormasi dat aset dapat dil akukan dal am beberapa cara, ant ara l ain f il t rasi dat aset dan konversi at ribut [ Nil akant , 2004] [ Jiawei, 2001] . Fil t rasi dat aset dil akukan dengan mengurangi ukuran dat aset , yait u dengan membuang beberapa inf ormasi yang t idak rel evan. Sebagai cont oh, dari anal isis t erhadap dat a ment ah dit emukan bahwa beberapa soal dal am basis dat a cenderung menimbul kan pel anggaran t erhadap at uran t ert ent u. Unt uk ekspl orasi penyebabnya, anal isis harus dibat asi hanya t erhadap kumpul an soal t ersebut . Dengan menyaring inf ormasi t ersebut , proses anal isis akan memberikan hasil yang l ebih dapat diandal kan (r el i abl e). Fil t rasi dil akukan t erhadap sal inan dat a, sehingga dat a asl i t idak mengal ami perubahan dat a. Cara berikut nya unt uk t ransf ormasi dat a adal ah konversi at ribut , yait u bekerj a pada nil ai at ribut di set iap inst ans dari dat aset . Tuj uan dari konversi at ribut adal ah mengubah at ribut bernil ai kont inu (t idak berhingga) menj adi at ribut dengan nil ai nominal (berhingga), karena sebagian cara anal isis dengan machi ne l ear ni ng t idak dapat berf ungsi pada at ribut yang bernil ai kont inu.


(2)

Terdapat dua cara unt uk mel akukan diskrit isasi nil ai at ribut . Cara pert ama dengan mel akukan penel usuran (scanni ng) sel uruh dat aset unt uk semua nil ai kont inu yang muncul , kemudian menggunakan nil ai t ersebut sebagai domain dari at ribut nominal . Teknik ini membuat domain nil ai menj adi himpunan t ert ut up dari nil ai yang mungkin muncul , sehingga dat aset menj adi ‘spar se’ .

Terdapat t eknik l ainnya, yait u ‘ bi nni ng’ , yang mendef inisikan kumpul an kel as nominal unt uk set iap at ribut , kemudian menet apkan set iap nil ai at ribut ke dal am sal ah sat u kel as. Misal nya, j ika domain at ribut numerik mempunyai nil ai dari 0 sampai dengan 100, domain t ersebut dapat dibagi menj adi empat bin (0. . 24, 25. . 49, 50. . 74, 75. . 100). Set iap nil ai at ribut akan dikonversi menj adi at ribut nominal yang berkorespondensi dengan sal ah sat u bin.

Terdapat t iga cara unt uk mendef inisikan int erval nil ai, yait u equal -wi dt h, equal -f r equency, dan cust omi sed. Equal -wi dt h akan membagi int erval nil ai at ribut menj adi n int erval yang l ebarnya sama. Equal -f r equency menghit ung int erval dari set iap kel as sehingga set iap kel as yang dial okasikan akan mempunyai f rekuensi inst ans dat aset yang hampir sama. 4. Penerapan Teknik Data Mining

Proses anal isis dat a dengan menerapkan t eknik dat a mi ni ng dapat dil akukan mel al ui anal isis st at ist ik at au dengan pendekat an machi ne l ear ni ng. Anal isis dat a pembel aj aran dengan pendekat an machi ne l ear ni ng akan menggunakan t iga t eknik, yait u associ at i on r ul es, cl ust er i ng, dan cl assi f i cat i on [ Nil akant , 2004] [ Merceron, 2005] .

Al gorit ma associ at i on r ul e (AR) digunakan unt uk menemukan hubungan ant ar nil ai t ert ent u dari at ribut nominal dal am suat u dat aset . At uran yang dihasil kan dapat dit ul is dal am bent uk “ if -t hen” dengan mempert imbangkan besaran suppor t dan conf i dence unt uk menil ai rel iabil it as at uran. Bent uk umum at uran dal am associ at i on r ul e adal ah :

(X = xi) →(Y = yi) [ sup, conf ]

dengan X = { x1, x2, . . . , xn}, Y = { y1, y2, . . . , ym}, sup = probabil it as bahwa suat u inst ans dal am dat aset mengandung X Y, conf = probabil it as kondisional bahwa inst ans yang mengandung X j uga mengandung Y.

Pada gambar 4 dit unj ukkan cont oh at ribut dat aset yang dapat dit urunkan dari Tabel 1 yang akan digunakan sebagai acuan unt uk pembahasan dal am al gorit ma AR, cl assif icat ion, dan cl ust ering berikut ini. Dat aset t ersebut dapat merupakan gabungan dari beberapa dat a yang diperol eh saat siswa berint eraksi dengan sist em pembel aj aran.


(3)

(Mewat i Ayub)

No At ribut Ket erangan

1 IdSiswa Ident it as siswa

2 NoSoal Nomor soal yang dikerj akan

3 JenisSal ah Jenis kesal ahan

4 NoAt uran Nomor at uran/ konsep yang dipakai dal am soal 5 Jml Coba Banyaknya usaha siswa mencoba menj awab soal 6 Tingkat Tingkat pencapaian dal am pengerj aan soal

7 Nil ai Nil ai yang diperol eh

Gambar 4. Cont oh At ribut Dat aset

Dal am mi ni ng dat a pembel aj aran, al gorit ma AR dapat dimanf aat kan unt uk menemukan kesal ahan yang sering t erj adi pada saat siswa mengerj akan l at ihan soal . Sebagai cont oh, dari dat aset pada gambar 4, diperol eh kumpul an inst ans mengenai siswa yang mel akukan kesal ahan dengan f rekuensi t ert ent u. Diasumsikan kumpul an inst ans t ersebut memenuhi kondisi j ika siswa mel akukan kesal ahan A dan kesal ahan B, maka mereka j uga mel akukan kesal ahan C, misal nya dengan support 30% dan conf idence 60%, akan dit ul is sebagai :

A and B → C [ 30%, 60%]

At uran t ersebut dapat dibaca sebagai berikut : dari 30% siswa yang mel akukan kesal ahan A dan kesal ahan B (dari sel uruh siswa yang mengerj akan l at ihan soal ), 60% diant aranya mel akukan kesal ahan C.

Al gorit ma AR j uga dapat menyat akan hubungan ant ara beberapa at ribut yang berbeda, misal nya kesal ahan A pada konsep X menimbul kan kesal ahan B pada konsep Y, yang dit ul is sebagai

A and X → B and Y

Teknik cl assi f i cat i on bekerj a dengan mengel ompokkan dat a berdasarkan dat a t raining dan nil ai at ribut kl asif ikasi. At uran pengel ompokan t ersebut akan digunakan unt uk kl asif ikasi dat a baru ke dal am kel ompok yang ada. Cl assif icat ion dapat direpresent asikan dal am bent uk pohon keput usan (deci si on t r ee). Set iap node dal am pohon keput usan menyat akan suat u t es t erhadap at ribut dat aset , sedangkan set iap cabang menyat akan hasil dari t es t ersebut . Pohon keput usan yang t erbent uk dapat dit erj emahkan menj adi sekumpul an at uran dal am bent uk IF condit ion THEN out come. Perbedaan ut ama ant ara at uran hasil al gorit ma AR dengan at uran hasil cl assi f i cat i on adal ah cl assi f i cat i on hanya membuat model unt uk sat u


(4)

at ribut , yait u at ribut kel as. Pada al gorit ma AR, bagian konsekuen at uran (bagian kanan at uran) dapat mengandung l ebih dari sat u at ribut , sedangkan pada cl assi f i cat i on hanya mengandung nil ai at ribut dari at ribut kel as. Hal ini dapat digunakan unt uk anal isis secara t op-down, yait u mul ai dengan al gorit ma AR unt uk memperol eh hubungan ant ara beberapa at ribut , kemudian anal isis dipersempit pada at ribut t ert ent u dengan menggunakan cl assi f i cat i on.

Dengan menggunakan dat aset hasil bel aj ar siswa sepert i pada gambar 4, sebagai dat a t raining pada suat u t ahun, dapat dibuat pohon keput usan unt uk memperkirakan dist ribusi nil ai siswa pada t ahun berikut nya. Gambar 5 menunj ukkan cont oh pohon keput usan yang dihasil kan dari t eknik cl assi f i cat i on. Pada gambar 5 t erl ihat kl asif ikasi siswa yang didasarkan pada j uml ah kesal ahan yang dil akukan siswa dan t ingkat pencapaian dal am pengerj aan soal . Pemil ihan at ribut yang digunakan dal am pohon keput usan dit ent ukan secara heurist ik dengan i nf or mat i on gai n [ Jiawei, 2001] .

Gambar 5. Cont oh Pohon Keput usan

Teknik cl ust er i ng bekerj a dengan mencari kemiripan di ant ara obj ek dengan memperhat ikan karakt erist ik obj ek, sekel ompok obj ek yang mirip akan t ermasuk ke dal am sat u cl ust er . Teknik yang dapat digunakan unt uk mel akukan cl ust er i ng ant ara l ain al gorit ma means at au al gorit ma k-medoi ds [ Jiawei, 2001] . Cl ust er i ng dapat dit erapkan unt uk mengenal i karakt erist ik siswa yang mengal ami kesul it an bel aj ar. Misal nya kit a ingin menganal isis siswa yang sudah mencoba mengerj akan l at ihan, namun t idak dapat menyel esaikannya sampai t unt as. Dal am hal ini, dat a yang dapat digunakan adal ah j uml ah kesal ahan yang dil akukan seorang siswa dal am mengerj akan suat u soal . Dengan demikian, siswa-siswa dengan f rekuensi

tingkat

pencapaian?

tingkat

jml-salah?

> n

n

pencapaian?

p

> p

m

> m

kelas-3

kelas-2


(5)

(Mewat i Ayub) dan j enis kesal ahan yang hampir sama (mirip), dapat dikel ompokkan dal am sat u cl ust er yang sama. Sebagai cont oh, bil a n < m, cl ust er 1 adal ah kel ompok siswa yang f rekuensi kesal ahannya l ebih kecil dari n, cl ust er 2 adal ah kel ompok siswa dengan f rekuensi kesal ahan di ant ara n sampai dengan m, dan cl ust er 3 adal ah kel ompok siswa dengan f rekuensi kesal ahan l ebih besar dari m. Cont oh visual isasi cl ust ering dapat dit unj ukkan sepert i pada gambar 6. Pada gambar t ersebut t erdapat t iga cl ust er dan beberapa out l i er .

Gambar 6. Cont oh Clust ering

frekuensi kesalahan

id.siswa

5. Kesimpulan

Penerapan dat a mining dal am sist em pembel aj aran berbant uan komput er diawal i dengan pengumpul an dat a, yang dil anj ut kan dengan t ransf ormasi dat a, dan diakhiri dengan anal isis dat a. Pada pengumpul an dat a, harus didef inisikan suat u model int eraksi si swa-sist em unt uk menet apkan dat a yang harus dicat at dari suat u proses pembel aj aran. Model int eraksi siswa-sist em t ersebut dapat t ersusun at as beberapa l apisan unt uk memungkinkan penangkapan dat a pada t ingkat granul arit as yang berbeda. Proses t ransf ormasi dat a mengubah dat a ment ah menj adi dat aset yang siap dianal isis. Transf ormasi dapat dil akukan pada inst ans dat aset mel al ui proses f il t rasi, maupun pada at ribut dari dat aset mel al ui f il t rasi at aupun konversi. Anal isis dat a hasil pembel aj aran dapat dil akukan dengan menerapkan t eknik al gorit ma associ at i on r ul es, cl assi f i cat i on, dan cl ust er i ng unt uk menghasil kan penget ahuan yang dapat membant u guru dal am mengel ol a kel asnya dengan memahami cara bel aj ar siswa, dan memberikan umpan bal ik proakt if kepada siswanya.


(6)

Daft ar Pust aka

Jiawei, H. , Kamber, M. (2001). Dat a Mining Concept s and Techniques, Morgan Kauf mann Publ ishers.

Jing, L. (2004). Dat a Mining Appl icat ions in Higher Educat ion,

www. spss. com/ event s/ e_id_1471/ Dat a Mining in Higher Educat ion. pdf, diakses t anggal 7 Februari 2007.

Nil akant , K. (2004). Appl icat ion of Dat a Mining in Const raint Based

Int el l igent Tut oring Syst em, www. cosc. cant erbury. ac. nz/ research/ report s/ HonsReps/ 2004/ hons_04

08. pdf, diakses t anggal 28 Februari 2007.

Merceron, A. , Yacef , K. (2005). Educat ional Dat a Mining : a Case St udy, ht t p: / / www. it . usyd. edu. au/ ~kal ina/ publ is/

merceron_yacef _aied05. pdf, diakses t anggal 7 Februari 2007.

Merceron, A. , Yacef , K. (2005). TADA-Ed f or Educat ional Dat a Mining, imej . wf u. edu/ art icl es/ 2005/ 1/ 03/ print ver. asp, diakses t anggal 1