resume jurnal 3 uts. pdf

PERTAMBANGAN PENGGUNAAN WEB UNTUK MEMPREDIKSI TANDA
AKHIR DARI SISWA YANG MENGGUNAKAN MOODLE KURSUS
A. Pendahuluan
Klasifikasi adalah salah satu masalah yang paling sering diteliti Peneliti DM
dan mesin (ML). Terdiri dari pra- menentukan nilai atribut kategoris (kelas)
berdasarkan nilai atribut lainnya (atribut prediktor). Di ML dan DM Bidang,
klasifikasi

biasanya

didekati

sebagai

pembelajaran

yang

diawasi

tugas. Algoritma pencarian digunakan untuk menginduksi classifier dari satu set

contoh data diklasifikasikan dengan benar, disebut set pelatihan. Lain kumpulan
contoh data yang diklasifikasikan dengan benar, yang dikenal sebagai rangkaian
pengujian, digunakan untuk mengukur kualitas classifier yang diperoleh setelah
proses pembelajaran. Berbagai jenis model dapat digunakan untuk repremengirim penggolong, dan ada banyak variasi algoritma yang tersedia untuk
menginduksi pengklasifikasi dari data. Paragraf berikut memberikan a deskripsi
singkat tentang algoritma klasifikasi yang digunakan dalam pekerjaan kita.
Dalam klasifikasi statistik, item individual dimasukkan ke dalam kelompok
berdasarkan informasi kuantitatif karakteristik melekat pada item (disebut
sebagai variabel, karakter, dll) dan berdasarkan pada serangkaian pelatihan item
berlabel sebelumnya. Statistik- Pendekatan kal umumnya ditandai dengan
adanya a eksplisit mendasari model probabilitas, yang menyediakan probkemampuan berada di setiap kelas dan bukan sekedar klasifikasi. Beberapa
contoh algoritma statistik adalah: diskriminan linier analisis, di mana ruang
sampel dibagi dengan serangkaian dari hyperplanes ditentukan oleh kombinasi
variabel linier sedemikian rupa sehingga contoh-contoh yang dimiliki masingmasing kelas adalah paling jelas terbelah; paling tidak berarti kuadrat kuadrat
[31], gener-alization metode sebelumnya dimana permukaan kuadrat berada
bekerja; metode kernel [30] mendekati masalah dengan peta-ping data ke ruang
fitur dimensi tinggi, di mana masing-masing koordinat sesuai dengan satu fitur
dari item data, trans- membentuk data menjadi satu set titik di ruang
Euclidean. Di Ruang itu, berbagai metode bisa digunakan untuk menemukan
hubungan dalam data. K tetangga terdekat [32] adalah metode di mana a

kumpulan data digunakan sebagai referensi untuk mengklasifikasikan kasus
baru dengan bantuan jarak tempuh yang sesuai. Untuk mengklasifikasikan yang

baru contoh data, tetanya terdekat terdekat ditemukan, jumlah Contoh setiap
kelas dihitung untuk subset dari k , dan Contoh yang harus diklasifikasikan
diberikan ke kelas dengan yang tertinggi menghitung. Metode statistik memiliki
tradisi yang panjang dan telah lama diterapkan pada masalah klasifikasi praktis
di berbagai domain, seperti biologi [33], meteorologi [34], keuangan [35], dll.
Pohon keputusan adalah seperangkat kondisi yang disusun secara hirarkis
struktur [36] yang berisi nol atau lebih simpul internal dan satu atau lebih banyak
simpul daun. Semua simpul internal memiliki dua atau lebih anak node dan
mengandung split, yang menguji nilai sebuah ekspresi dari atribut. Busur dari
simpul internal ke anak-anaknya adalah diberi label dengan hasil tes yang
berbeda pada simpul internal. Setiap simpul daun memiliki label kelas yang
terkait dengannya. Keputusannya pohon adalah model prediktif dimana sebuah
instance diklasifikasikan oleh mengikuti jalan kondisi puas dari akar pohon
sampai mencapai daun, yang akan sesuai dengan label kelas. Pohon keputusan
dapat dengan mudah diubah menjadi seperangkat klasifikasi aturan. Beberapa
algoritma pohon keputusan yang paling terkenal adalah C4.5 [36] dan CART
[37]. Perbedaan utama antara ini Dua algoritma adalah kriteria pemisahan yang

digunakan pada simpul internal: C4.5 menggunakan rasio keuntungan informasi,
dan CART mempekerjakan gini indeks. Pohon keputusan telah dipekerjakan
dengan sukses di dif-domain yang sama seperti pertanian [38], obat-obatan [39],
jaringan [40], dll.
Rule Induction adalah area pembelajaran mesin dimana IF-THEN Aturan
produksi diekstraksi dari sekumpulan pengamatan [29]. Aturan adalah cara
sederhana dan mudah dipahami untuk mewakili pengetahuan. Aturan memiliki
dua bagian, anteseden dan kon- berurutan. Aturan pendahuluan (IF part) berisi
kombinasi

kondisi

sehubungan

dengan

atribut

prediktor. Khas,


Kondisi

membentuk gabungan dengan cara AND logis operator, tapi secara umum
operator logika pun bisa digunakan hubungkan kondisi unsur, juga dikenal
sebagai klausa. Peraturan konsekuen (THEN part) berisi nilai prediksi untuk
kelas. Dengan cara ini, sebuah aturan menetapkan instance data ke kelas yang
ditunjuk keluar oleh konsekuensinya jika nilai atribut predictor memenuhi kondisi
yang dinyatakan dalam anteseden, dan dengan demikian, classifier diwakili
sebagai himpunan aturan. Algoritma termasuk dalam paradigma ini bisa
dianggap sebagai heuristic state-space search. Dalam induksi aturan, sebuah

negara sesuai dengan aturan kandidat dan operator sesuai dengan generalisasi
dan spesialisasi oper- ations yang mengubah satu aturan kandidat menjadi yang
lain. Contoh dari algoritma induksi aturan adalah: CN2 [41], di mana antecedent
Kondisi dibangun dalam beberapa tahap, menghilangkan kejadian

tercakup

dalam setiap tahap; AprioriC [42] didasarkan pada frekuensi dari penampilan
masing-masing variabel dalam training set. Beberapa dari Metode induksi aturan

yang digunakan dalam penelitian ini adalah evolusi- Ary algorithmms (EAs)
berdasarkan penggunaan pencarian probabilistic Algoritma terinspirasi oleh titiktitik tertentu dari teori Darwin dari evolusi Fitur penting yang dimiliki oleh semua
EA adalah: the penggunaan populasi solusi kandidat; sebuah generasional inheriMetode tance termasuk penerapan operator genetik seperti mutasi dan
crossover; dan fungsi kebugaran yang digunakan untuk mengukur kualitas
masing-masing individu. The EAs bekerja dalam pekerjaan kita adalah XCS [43],
Algoritma Induktif yang Diawasi (SIA) [44], a Algoritma genetika menggunakan
gen bernilai nyata (Corcoran) [45] dan algoritma pemrograman genetika berbasis
Grammar (GGP) [46]. Pendekatan klasifikasi berbasis aturan yang berbeda telah
diterapkan untuk obat-obatan [47], jaringan [48], teknik [23], dll.
Indikasi aturan fuzzy menggunakan logika fuzzy untuk menafsirkan
mendasari data secara linguistik [49]. Untuk menggambarkan sistem fuzzy
sepenuhnya, aturan dasar (struktur) dan partisi fuzzy harus ditentukan
(parameter) untuk semua variabel. Beberapa aturan fuzzy belajar- Metode ing
adalah MaxLogitBoost [50], sebuah genetika berbasis penguat
(meningkatkan

algoritma

adalah


statistik

aditif

model-

metode

teknik

yang

menggabungkan pengklasifikasi kualitas rendah yang berbeda mendapatkan
penggolong majemuk yang berkinerja lebih baik dari pada yang lainnya
komponen); Pemrograman genetika berbasis Grammar (GP) [51], pemrograman
genetika berbasis grammar hibrida / genetik algo- metode rithm (GAP) [30],
sebuah simulasi disimulasikan anil / genetic algoritma pemrograman (SAP) [30]
(simulasi anil adalah a metode di mana setiap langkah dari algoritma
menggantikan arus solusi dengan solusi di dekatnya acak, dipilih dengan
probabil- Itu tergantung parameter yang disebut suhu, yaitu secara bertahap

menurun selama proses); dan adaptasi dari algoritma Wang-Mendel (Chi) [52] di
mana aturan fuzzy ditimbang oleh algoritma. Aturan klasifikasi fuzzy telah
digunakan dalam teknik [53], biologi [54], dokumentasi [55], dll.

Jaringan syaraf tiruan (JST) adalah model komputasi terinspirasi dalam
jaringan saraf biologis. Ini terdiri dari antar- terhubung kelompok neuron buatan,
dan

memproses

informasi

menggunakan

pendekatan

koneksi

untuk


perhitungan. Dalam kebanyakan kasus an JST adalah sistem adaptif yang
mengubah strukturnya berdasarkan informasi eksternal atau internal yang
mengalir melalui jaringan selama tahap pembelajaran. Contoh jaringan saraf
algo- Ritme adalah: perceptron multilayer (dengan gradien konjugasi pelatihan)
[56], ANN feedforward yang menggunakan tiga atau lebih lay-ers neuron dengan
fungsi aktivasi nonlinier; dasar radial fungsi jaringan syaraf tiruan (RBFN) [57],
yang meningkatkan multi- lapisan perceptrons, menghindari terjebak di minima
lokal oleh sarana penggunaan fungsi berbasis jarak; genetik hibrida algoritma /
jaringan syaraf tiruan (GANN) [58]; dan jaringan syaraf tiruan pemrograman
evolusioner (NNEP) [17], hibridisasi lain JST dengan EA (pemrograman
evolusioner). Berbeda jenis jaringan saraf telah diterapkan pada teknik [59], obatobatan [60], agronomi [61], dll. Kami telah menjelaskan 21 algoritma klasifikasi
ini karena Algoritma spesifik ini akan digunakan dalam percobaan kami, Meski
ada beberapa teknik klasifikasi lainnya seperti mendukung mesin vektor, jaringan
bayesian, dll. Sehubungan dengan penerapan klasifikasi dalam pendidikan,
disana adalah dua tipe utama lingkungan pendidikan: tradisional lingkungan
pendidikan (offline atau kelas) dan e- belajar atau lingkungan berbasis web (online education).
Lingkungan kelas tradisional adalah yang paling banyak digunakan sistem
pendidikan Mereka didasarkan pada kontak tatap muka antara pendidik dan
siswa dan diorganisir dalam perkuliahan. Sana banyak subtipe yang berbeda:
pendidikan swasta dan publik, ele- pendidikan dasar dan dasar, pendidikan orang

dewasa, lebih tinggi, tersier dan pendidikan akademis, pendidikan khusus, dll. Di
conven- Ruang kelas, pendidik berusaha untuk meningkatkan instruksi oleh
memantau proses belajar siswa dan menganalisis kinerja per- formances
menggunakan catatan kertas dan observasi. Mereka juga bisa gunakan
informasi tentang kehadiran siswa, informasi kursus, tujuan kurikulum, dan data
rencana individual. Secara tradisional lingkungan pendidikan, klasifikasi telah
diterapkan

Banyak

tugas,

beberapa

contohnya

adalah:

memprediksi


keberhasilan siswa menggunakan persamaan regresi berganda dalam sebuah
program pengantar- kursus ming, dengan harapan akan adanya konseling yang

lebih baik bagi siswa [62]; menjelaskan dan memprediksi nilai akhir siswa yang
diprediksi

oleh

jaringan

saraf

[63]; memprediksi

kinerja dari

nilai

tes


menggunakan jaringan saraf [24]; dalam program pendidikan yang berbakat pilihsiswa yang lebih lemah untuk kelas remedial dengan menggunakan asosiasi
aturan [64]; memprediksi hasil siswa dengan menggunakan fungsi diskriminan
analisis dan identifikasi variabel untuk memprediksi keberhasilan di kursus
khusus [15]; memprediksi kinerja akademik untuk menentukan- milikku apa
faktor registrasi menentukan keberhasilan akademik di Indonesia universitas
[65]; menggunakan beberapa teknik data mining, sebelumnya sesi pertama ujian,
untuk mengklasifikasikan siswa menjadi tiga kelompok sesuai dengan
probabilitas keberhasilan mereka, untuk mengidentifikasi- tentukan siswa yang
membutuhkan bantuan, dan dengan demikian mengusulkan yang spesifik
tindakan perbaikan pada waktunya [27]; memprediksi akademik siswa kinerja
menggunakan jaringan syaraf tiruan, keputusan pohon dan linier regresi [66].
Pendidikan berbasis web adalah bentuk pendidikan jarak jauh yang
disampaikan Melalui internet. Saat ini, ada banyak istilah yang digunakan untuk
merujuk ke pendidikan berbasis web seperti e-learning, e-training, online instruksi,
pembelajaran berbasis web, pelatihan berbasis web, dll. Semua Sistem ini
biasanya mencatat akses siswa di web log yang menyediakan pelacakan mentah
navigasi peserta didik situsnya Namun, ada dua jenis pendidikan berbasis web
sistem: sistem manajemen pembelajaran yang terkenal dan adap- sistem
pendidikan berbasis web yang cerdas dan cerdas. Belajar sistem manajemen
mengumpulkan sejumlah besar data log aktivitas siswa dalam database dan
biasanya memiliki siswa built-in fitur pemantauan Pendidikan berbasis web
adaptif dan cerdas. Sistem diferensial (AIWBES) merupakan hasil evolusi
bersama sistem bimbingan cerdas (ITS) dan adaptif hypermedia sys-tems
(AHS). AIWBES memiliki data dari siswa di domain model, model siswa dan file
log interaksi pengguna. Di web- pendidikan berbasis, klasifikasi telah diterapkan
pada banyak tugas, misalnya: menemukan kelompok siswa potensial yang
serupa karakteristik dan reaksi terhadap strategi pedagogis tertentu dengan
menerapkan teknologi decision tree dan data cube [19]; meramalkan- ing kinerja
siswa dan jumlah kesalahan seorang siswa akan buatlah melalui penggunaan
Neural Networks [67]; memprediksi stu- kinerja penyok dan nilai akhir mereka
menggunakan algoritma genetika [38]; mendeteksi penyalahgunaan siswa atau

siswa yang bermain menggunakan Latent Model Respon [20]; memprediksi
kinerja siswa juga sebagai penilaian relevansi atribut yang terlibat, dengan
menggunakan perbedaan- teknik belajar mesin ent [32]; mengintegrasikan
masalah sebelumnya memecahkan dan berbagi pengetahuan sejarah kelompok
untuk memprediksi kinerja kelompok masa depan menggunakan kombinasi
mesin belajar- alat probabilistik [68]; mengelompokkan siswa pengantar petunjuk
atau orang yang mengalami kegagalan dan menemukan kesalahpahaman umum
siswa

[21]; Memprediksi

keberhasilan

kursus

dengan

menggunakan

pembelajaran mesin yang berbeda metode [69]; mengklasifikasikan kinerja
siswa sesuai dengan kinerjanya akumulasi pengetahuan dalam platform elearning menggunakan C4.5 algoritma [70]; Menemukan fitur penggunaan mana
yang terbaik di predict- ing online student mark dan menjelaskan mark prediksi
di Bentuk aturan sederhana dan mudah ditafsirkan menggunakan Fuzzy
Inductive Penalaran [71]; prediksi keterlibatan menggunakan Bayesian Netbekerja dan mengidentifikasi peserta didik dengan motivasi rendah, dan juga
menemukan tindakan perbaikan untuk menurunkan tingkat putus sekolah [72].
B. Hasil dan Pembahasan
Kami telah melakukan dua percobaan untuk mengevaluasi per- Kegagalan
dan kegunaan dari algoritma klasifikasi yang berbeda memprediksi tanda akhir
siswa berdasarkan informasi pada siswa ' penggunaan data dalam LMS Tujuan
kami adalah untuk mengklasifikasikan siswa dengan cara yang sama tanda akhir
ke dalam kelompok yang berbeda tergantung pada kegiatan yang dilakukan
keluar dalam kursus berbasis web. Kami telah memilih data 438 Cordoba
Mahasiswa di 7 program teknik Moodle tentang: kesehatan dan keselamatan di
tempat kerja, proyek, perusahaan teknik, pemrograman untuk teknik, ilmu
komputer fundamental, komputer terapan sains, dan pemrograman ilmiah. Mulai
dari kursus ini dan menggunakan alat penambangan Moodle kami, tabel
ringkasan (lihat Tabel 1) telah diciptakan yang mengintegrasikan informasi yang
paling penting untuk tujuan kami (kegiatan Moodle dan nilai akhir yang diperoleh
pada kursus). Tabel 1 merangkum baris demi baris semua aktivitas yang
dilakukan oleh setiap siswa dalam kursus (variabel input atau atribut) dan tanda
akhir yang diperoleh dalam kursus ini (atribut kelas atau keluaran). Meski ada
banyak faktor yang dapat mempengaruhi efektifitas di e-learning [77], penelitian

ini didasarkan pada informasi yang terkumpul tentang tiga kegiatan online berikut
ini:
1) Kuis merupakan alat yang berguna bagi siswa untuk menguji tingkat
pengetahuan mereka. tepi dan tinjau masing-masing subyek yang diteliti
[78]. Mereka itu hebat untuk memberi siswa umpan balik yang cepat
mengenai kinerja dan penampilan mereka Mengukur pemahaman materi
mereka. Dalam penelitian kami, keduanya Kuis yang terlambat dan gagal
dipertimbangkan.
2) Tugas adalah alat untuk mengumpulkan karya siswa [79]. Ini adalah sebuah
cara mudah untuk memungkinkan siswa mengunggah konten digital untuk
penilaian. Mereka dapat diminta mengirimkan esai, spreadsheet, presentasi,
halaman web, foto, atau klip audio atau video kecil.
3) Forum adalah alat komunikasi yang kuat [80]. mereka memungkinkan
pendidik dan siswa untuk berkomunikasi satu sama lain setiap waktu, dari
mana saja dengan koneksi internet. Forum buat banyak kesempatan untuk
meniru percakapan yang Anda miliki di kelas, untuk merumuskan diskusi
antara kelompok siswa atau untuk membawa ide-ide terbaik dan pertanyaan
dari forum ke dalam kelas. Dalam penelitian kami, kami menggunakan kedua
pesan yang dikirim dan membaca untuk / pada forum. Tabel summarization
Seluruh telah dibagi menjadi 10 pasang pelatihan dan uji file data. Dengan
cara ini, setiap algoritma dapat dievaluasi dengan menggunakan stratified 10
kali lipat cross-validasi [81]. Itu adalah dataset secara acak dibagi menjadi 10
subset terputus-putus dengan ukuran yang sama dengan cara stratified
(menjaga distribusi kelas yang asli). Itu algoritma dieksekusi 10 kali dan di
setiap pengulangan, salah satu dari 10 subset digunakan sebagai test set dan
9 subset lainnya digabungkan untuk membentuk training set. Akhirnya,
akurasi rata dihitung. Percobaan pertama membandingkan semua klasifikasi
algo-rithms (dijelaskan dalam Bagian Background) menggunakan tiga yang
berbeda semua data yang tersedia, data yang disaring oleh baris.
4) The dataset pertama (semua data yang tersedia) terdiri dari 438 contoh /
siswa dengan 9 masukan atribut untuk setiap contoh, bahwa adalah, seluruh
data siswa yang diperoleh dari Moodle dalam ringkasan meja.

5) The dataset kedua (data disaring oleh baris) terdiri dari 135 contoh / siswa
dengan 9 masukan atribut untuk setiap contoh. Di hal ini, siswa-siswa tertentu
dipilih / disaring oleh tangan (135) karena mereka adalah satu-satunya yang
menyelesaikan

semua

kegiatan

Moodle

diusulkan

dalam

setiap

kursus. Tujuan kami adalah untuk membersihkan data yang tidak lengkap.
6) The dataset ketiga (data disaring oleh kolom) terdiri dari 438 kasus / siswa
dengan hanya 4 atribut input (tentu saja,n Assigment, n kuis, dan total waktu
kuis) untuk setiap contoh. Dalam hal ini, 4 atribut ini masukan tertentu dipilih
karena mereka sebelumnya telah dipilih oleh atribut seperti algoritma seleksi
sebagai: CfsSubsetEval, FilteredSubsetEval dan ChiSquaredAttributeEval,
semua tersedia di Weka [82] software. algoritma seleksi atribut mencoba
untuk menghapus atribut yang tidak relevan dari data Dalam banyak situasi
praktis ada terlalu banyak atribut untuk skema untuk menangani belajar, dan
beberapa dari mereka bisa tidak relevan atau berlebihan. Tujuan kami adalah
untuk mengurangi dimensi dari data.
Jadi, percobaan pertama ini adalah untuk menguji apakah klasifikasi yang
lebih baik akurasi bisa diperoleh dengan menggunakan data disaring bukan origyang Data inal. Untuk melakukannya, tiga dijelaskan sebelumnya set 10 kali lipat
file data yang digunakan; satu eksekusi dilakukan dengan semua algoritma
deterministik dan 5 eksekusi dengan nondeterministic yang. Tabel 2
menunjukkan persentase global tingkat akurasi dengan data uji (rata-rata dari 10
eksekusi). Persentase global yang diklasifikasikan dengan benar (PCC global)
menunjukkan akurasi pengklasifikasi. Tabel 2 menunjukkan bahwa sejumlah
besar algoritma (14 dari 21) memperoleh nilai akurasi tertinggi mereka
menggunakan data asli, dan semua sisa algoritma (7 dari 21) mendapatkan
mereka menggunakan Data disaring oleh kolom. Hal ini dapat disebabkan oleh
fakta bahwa beberapa algoritma sendiri mencoba untuk memilih atribut secara
tepat dan mengabaikan yang tidak relevan dan berlebihan, sementara yang
lainnya tidak [70]. Algoritma terbaik (lebih dari 65% PCC global) dengan asli data
Kereta, GAP, GGP, dan NNEP. Algoritma terbaik (lebih 50% global yang PCC)
dengan menggunakan data disaring oleh baris yang PolQuadraticLMS, KNN, dan
XCS. Algoritma terbaik (lebih 64% PCC global) dengan Data disaring oleh kolom
yang Kereta, SAP, dan GAP.

Kesimpulan dari percobaan pertama ini adalah bahwa tuduhannya terbaik
Hasil bersemangat (lebih dari 65% PCC global) diperoleh ketika semua tersedia
Data (semua siswa dan semua atribut) dipertimbangkan ver- filtering
sus. Bahkan, ketika penyaringan demi baris, 303 siswa yang memiliki tidak
dilakukan beberapa kegiatan tersingkir dari data asli. Dan, adalah logis untuk
mendapatkan akurasi yang lebih buruk bila kurang data telah bekas. Di sisi lain,
ketika penyaringan oleh seleksi atribut, hanya 4 dari 10 atribut input yang
tersedia telah digunakan. Dan dalam beberapa algoritma, efek penurunan jumlah
atribut adalah penurunan akurasi klasifikasi. Jadi, dalam kasus kami, kami
merekomendasikan menggunakan semua data yang tersedia. Percobaan kedua
lagi dibandingkan semua klasifikasi algoritma (dijelaskan dalam Bagian
Background) menggunakan semua tersedia data tetapi sekarang menerapkan
dua tugas pra-pengolahan dengan Data: diskritisasi dan rebalancing. Dengan
demikian, tiga dataset yang berbeda akan digunakan lagi: data numerik asli
penuh, Cat- Data egorical (diskretisasi data asli) dan data menyeimbangkan
kembali (Rebalancing data asli).
C. Kesimpulan
Dalam makalah ini kami telah membandingkan kinerja dan kegunaan teknik
data mining yang berbeda untuk mengklasifikasikan mahasiswa melalui
penggunaan dataset yang berbeda dari kursus Moodle. Kita punya juga
mengembangkan alat pertambangan tertentu diintegrasikan ke dalam Moodle
sistem dalam rangka memfasilitasi pelaksanaan algoritma data mining baik
untuk pengguna non-ahli, seperti instruktur, dan pengguna ahli, seperti peneliti
data mining. Percobaan kami menunjukkan, di satu sisi, bahwa secara umum ada
bukan salah satu algoritma tunggal yang memperoleh klasifikasi terbaik akurasi
dalam semua kasus (dengan semua dataset). Di sisi lain, beberapa preprocessing tugas seperti filtering, diskritisasi atau rebalanzing bisa menjadi
sangat penting untuk mendapatkan hasil yang lebih baik atau lebih buruk. Bahkan,
sebagian besar algoritma terlihat untuk meningkatkan perfor- klasifikasinya
Mance saat menggunakan semua data yang tersedia (tanpa filtering); beberapa
mereka lakukan ketika pra-pengolahan tugas-tugas seperti diskritisasi dan rebalData ancing diterapkan; yang lainnya tidak sama sekali. Namun, kami memiliki
terlihat bahwa akurasi yang diperoleh tidak terlalu tinggi (dalam kisaran 65%) dan

itu menunjukkan bahwa itu adalah tugas yang sangat sulit untuk memprediksi stu
- yang tanda akhir penyok mulai dari data penggunaan web mereka. pertama
solusi yang mungkin dapat mencoba untuk memperbaiki / set param- lebih tepat
eters dengan melakukan eksperimen lengkap yang bervariasi dan tes Semakin
nilai berkisar masing-masing parameter terhadap nilai-nilai. Tapi, kami belum
memperoleh akurasi klasifikasi yang lebih baik dengan cara ini. SEBUAH solusi
yang berbeda dan menjanjikan bisa menggunakan lebih dan berbeda atribut
siswa sebagai atribut masukan. Sebagai contoh, kita bisa menggunakan tidak
hanya informasi online tentang siswa (seperti yang telah kita lakukan dalam hal
ini kertas) tetapi juga informasi offline seperti kehadiran di kelas, ketepatan
waktu, partisipasi, perhatian, predisposisi, dll Tapi, itu adalah penting untuk
memperhatikan bahwa semua informasi secara offline ini tidak diperoleh secara
otomatis dan dengan mudah seperti yang kita telah memperoleh informal secara
online mation disediakan dengan menggunakan Moodle. Dengan demikian
instruktur harus memberikan nilai-nilai atribut-atribut baru sendiri yang bisa
menjadi tugas yang sulit. Kami juga telah menunjukkan bahwa, dalam masalah
kita, classifier yang baik Model harus akurat dan dipahami untuk instruktur.
Jadi, dari antara semua metode yang diusulkan, sebaiknya gunakan pohon
keputusan, aturan induksi dan rule fuzzy algoritma karena mereka putih-kotak
model yang memberikan hasil dipahami, memungkinkan interpretasi yang akan
dibuat dari model yang diperoleh dan dapat digunakan untuk membuat
keputusan. Dalam percobaan berikutnya, kami ingin dapat mengukur tingkat dari
comprehensibility masing-masing model klasifikasi dalam rangka untuk memilih
algoritma terbaik. Namun karena itu adalah ukuran subjektif, kita dapat
menggunakan misalnya sekelompok ahli dalam data mining untuk mengevaluasi
interpretability dan comprehensibility masing-masing algoritma tertentu. Kami
juga ingin melakukan eksperimen lainnya menggunakan data dengan lebih
informal mation tentang siswa (yaitu, profil dan kurikulum) dan menggunakan
lebih banyak jumlah data (data dari program lain dan tahun). Ini bisa mengukur
seberapa

kuantitas

dan

kualitas

data

dapat

mempengaruhi

kinerja

algoritma. Akhirnya, alat ini juga harus diuji oleh guru dalam situasi pedagogis
nyata untuk membuktikan penerimaan.