APLIKASI DATA MINING MENGGUNAKAN METODE

Ju rnal)lm iah . E2/ 6ol.
1. o.
3 2015

A PL IK A SI DATA MINING ME NGGUNA K A N
ME T ODE DE CISION TRE E UNT UK ME NA MPIL K A N L A POR A N
HA SIL NIL A I A K HIR MA HA SISW A
(ST UDI K A SUS DI F A K UL T A S T E K NIK UMSUR A BA Y A )
T riuli Novianti 1) A bdul Aziz2)
Program Studi D3 T eknik K omputer UMSurabaya, Surabaya 60113
email: triuli81@yahoo.com1), unicaziz@gmail.com2)
A bstrak
Salah satu faktor penyebab ketidaklulusan mahasiswa karena kurangnya kebijakan dan tindakan dari instansi
pendidikan untuk menjaga mahasiswanya tidak lulus pada mata kuliah yang telah ditempuh. Dengan
memanfaatkan data induk mahasiswa dan data nilai akhir mahasiswa diharapkan dapat menghasilkan informasi
tentang laporan hasil nilai akhir dengan data induk mahasiswa melalui teknik data mining. Studi kasus penelitian
ini dilaksanakan pada F akultas Teknik UMSurabaya untuk interval waktu tahun akademik 2012/2013. Metode
penelitian yang dipakai adalah metode Decision Tree dengan algoritma C4.5. Pada tahap akhir, penelitian
dievaluasi dan validasi dengan cross validation. Dari penelitian dihasilkan, aplikasi laporan hasil nilai akhir
dengan metode decision tree algoritma C4.5 sebagai acuan dalam membuat kebijakan dan tindakan untuk
mengurangi jumlah mahasiswa yang tidak lulus dengan akurasi 100E menggunakan evaluasi Cross Validation.

Kata Kunci: Decision Tree, Algoritma C4.5, Nilai Akhir, Cross Validation

A bstract
One of the causes of student failure due to the lack of policies and actions of educational institutions to keep
students do not pass on the courses you have taken. By utilizing the student master data and data value end
students are expected to generate information on the results of the final report by the student master data through
data mining techniques. The case study research was conducted at the F aculty of Engineering UMSurabaya for
the 2012/2013 academic year intervals. The research method used is a method C4.5 Decision Tree algorithm. In
the final stage, evaluation and validation studies with cross validation. F rom the resulting research, application of
the results of the final report by the method of decision tree algorithm C4.5 as a reference in making policies and
measures to reduce the number of students who did not pass with 100E accuracy using the evaluation Cross
Validation
Yey
word :Decision Tree, Algoritma C4.5, Nilai Akhir, Cross Validation

1.

PE NDA HUL UA N

Di dalam peraturan akademik Universitas Muhammadiyah Surabaya bidang pendidikan tahun

2013 pada BA B X I pasal 35 ayat 3 butir a di sebutkan bahwa “Sistem penilaian yang digunakan
Universitas Muhammadiyah Surabaya adalah sistem penilaian komprehensif yang terdiri dari aktifitas
(A ), tugas (T), ujian tengah semester (UT S) dan ujian akhir semester (UA S)” (Peraturan A kademik,
2013).
Berdasarkan buku wisuda tahun 2013 menunjukkan nilai IPK mahasiswa pada Fakultas T eknik
umumnya rendah. Hal ini menunjukkan bahwa masih ada mahasiswa Program Sarjana (S1) dan
Program Diploma (D3) reguler di Fakultas T eknik yang tidak lulus untuk beberapa mata kuliah. Oleh
karena itu, dengan memanfaatkan data induk mahasiswa dan data nilai mahasiswa, dapat diketahui
informasi hasil nilai akhir mahasiswa melalui teknik data mining.
Nilai akhir mahasiswa dapat dilihat dari komponen nilai aktifitas (A), tugas (T ), ujian tengah
semester (UT S) dan ujian akhir semester (UA S). Data mining diharapkan dapat membantu menyajikan
informasi tentang nilai akhir mahasiswa dengan menggunakan data nilai akhir mahasiswa dan data
induk mahasiswa. Permasalahan yang dibahas dalam penelitian ini adalah bagaimana membuat aplikasi
198 |b 9 wh

Ju rnal)lm iah . E2/ 6ol.
1. o.
3 2015

untuk menghasilkan informasi yang berguna tentang hubungan nilai akhir dengan skala penilaian

dengan teknik data mining metode decision tree algoritma C4.5. Informasi yang ditampilkan berupa
nilai support dan confidence hubungan antara nilai akhir mahasiswa dengan nilai aktifitas (A ), tugas (T),
ujian tengah semester (UTS) dan ujian akhir semester (UA S). Hasil klasifikasi dari algoritma C4.5
dievaluasi dan divalidasi dengan cross validation untuk mengetahui tingkat akurasi A lgoritma C4.5.

2. ME T ODE PE NE L IT IA N
Metode dan tahapan penelitian yaitu meliputi;
1. Pembersihan data (data cleaning).
Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten. Data
yang digunakan dalam penulisan penelitian ini terdiri dari dua sumber data, yaitu data induk
mahasiswa (Nama, NIM dan Program Studi) dan data nilai akhir yang didapatkan dari skala
penilaian (aktifitas (A ), tugas (T), ujian tengah semester (UT S) dan ujian akhir semester (UA S)).
2. Integrasi data (data integration).
Integrasi data merupakan penggabungan data dari berbagai database ke dalam satu database baru.
3. Seleksi Data (Data Selection)
Data yang ada pada database sering kali tidak semua dipakai, hanya data yang sesuai untuk
dianalisis yang diambil dari database. K arena tidak semua tabel digunakan maka perlu dilakukan
pembersihan data agar data yang akan diolah benar-benar relevan dengan yang dibutuhkan.
4. T ransformasi data (Data Transformation).
Data digabung ke dalam format yang sesuai untuk diproses dalam data mining. Transformasi data

merupakan proses pengubahan atau penggabungan data ke dalam format yang sesuai.
5. Proses mining
Merupakan proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dari
data. Pohon keputusan (decision tree) merupakan teknik yang digunakan pada proses mining.
6. Pengujian dan Evaluasi Sistem
Pengujian dilakukan dengan training dan testing menggunakan metode Cross validation.

Gambar 1 Diagram Alir Penelitian
199 |b 9 wh

Ju rnal)lm iah . E2/ 6ol.
1. o.
3 2015

3. HA SIL DA N PE MBA HA SA N

3.1 Pohon K eputusan (Decision Tree)
Data training yang digunakan yakni nilai aktifitas (A ), tugas (T), ujian tengah semester (UT S)
dan ujian akhir semester (UA S). Nilai akhir yang digunakan yakni A , A B, B, C, D dan E.
T abel 1 Data Nilai Akhir

NO.

UT S

T ugas

A ktifitas

UA S

Nilai A khir

1

40

80

85


80

AB

2

50

80

78

90

AB

3

75


80

53

90

AB

4

45

79

66

53

BC


5

40

77

49

90

BC

6

65

80

77


90

AB

7

50

65

59

26

DD

8

40


77

65

62

BC

9

40

80

67

90

AB


10

50

80

72

26

BC

11

40

80

65

80

BB

12

50

80

65

90

AB

13

50

80

77

90

AB

14

40

77

51

90

BC

15

60

80

66

90

AB

16

50

60

65

62

BC

17

50

80

61

62

BC

18

85

80

77

80

AA

19

50

80

65

53

BC

20

70

80

70

90

AB

21

70

80

78

90

AB

22

50

65

40

26

DD

23

50

77

77

90

AB

24

30

80

62

90

BB

25

50

80

70

71.8

BB

26

50

79

75

80.9

AB

27

70

80

96

90

AA

28

50

80

66

80.9

BB

29

95

80

88

90

AA

30

75

77

65

90

AB

31

50

80

64

80.9

BB

200|b 9 wh

Ju rnal)lm iah . E2/ 6ol.
1. o.
3 2015

T abel 2 Nilai Entropy dan Gain untuk Menentukan Simpul Akar
Data
31

T otal
UT S

A
3

AB
13

B
5

BC
8

C
0

D
2

E
0

E ntropy
2.035801

Gain

0
25

0
31

0
3

0
13

0
5

0
8

0
0

0
2

0
0

0
2.035801
0.451574

50

22
9

0
3

7
6

5
0

8
0

0
0

2
0

0
0

1.856653
0.918296

75

29
2

1
2

13
0

5
0

8
0

0
0

2
0

0
0

1.902279
0

0.25625

0

T ugas
25

0
31

0
3

0
13

0
5

0
8

0
0

0
2

0
0

0
2.035801
0

50

31

3

13

5

8

0

2

0

2.035801
0.407278

75

3
28

0
3

0
13

0
5

1
7

0
0

2
0

0
0

25

0
31

A
0
3

AB
0
13

B
0
5

BC
0
8

C
0
0

D
0
2

E
0
0

0
2.035801

0

50

2
29

0
3

0
13

1
4

0
8

0
0

1
1

0
0

1
1.931753

0.164161

A ktifitas

0.918296
1.803007

Gam
bar 2
Poho
n
Kepu
tusan
Hasil
Peng
olaha
n

Gam
bar
3.
Hasil
Kelu
aran
Prog
ram
M

75

22
9

0
3

25

31

3

50

3
28

0
3

75

22

3

UA S

memiliki nilai UT S 75,

aksud
dari
gamb
ar 3
adala
0
0
0
0
0
0
0
0
h
13
5
8
0
2
0
2.035801
data
yang
0
0
1
0
2
0
0.918296
0.318411
diuji
13
5
7
0
0
0
1.803007
misal
nya
0
1
6
0
2
0
1.224394
0.543335
maha
13
4
2
0
0
0
1.602131
siswa
Tugas 80, UA S 53 dan A ktivitas 90, maka akar pertama akan menanyakan
7
6

5
0

8
0

0
0

2
0

0
0

1.856653
0.918296

0.451574

201|b 9 wh

Ju rnal)lm iah . E2/ 6ol.
1. o.
3 2015

apakah nilai aktivitasnya kurang dari 66.9? K arena nilai aktivitas 90 lebih dari nilai tersebut, maka
masuk ke ranting kedua yang ditanya apakah nilai UA S kurang dari 52? K arena nilai UA S 80 maka
masuk ke ranting ketiga yang ditanya apakah UTS kurang dari 80? K arena UTS 75 maka masuk ke
rating selanjutnya yakni nilai akhir mahasiswa tersebut ‘A B’.
T abel 3. Hasil Training dan Testing
T raining
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
1
0
1
1
0
1
1
0
0
1
1
1
0

T esting
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
1
0
1
1
0
1
1
0
0
1
1
1
0

Dari hasil di atas diperoleh, hasil training dan testing menghasilkan hasil yang tepat sama, jadi akurasi
pada percobaan di atas 100E.
4.

K E SIMPUL A N

K esimpulan yang dapat diambil dalam penelitian ini adalah A plikasi Data Mining ini dapat
digunakan untuk menampilkan informasi yang berguna tentang nilai akhir mahasiswa dengan teknik
data mining.
Informasi yang ditampilkan berupa hubungan antara nilai akhir mahasiswa dengan nilai aktifitas
(A ), tugas (T), ujian tengah semester (UT S) dan ujian akhir semester (UA S). Hal ini terlihat pada pohon
keputusan (decision tree) dan rancangan aplikasi berbasis pohon keputusan. Hasil evaluasi dan validasi
dengan Cross Validation menunjukkan tingkat akurasi pada algoritma C4.5 sebesar 100E.
Data induk mahasiswa yang diproses mining meliputi data proses masuk, data asal sekolah, data
kota mahasiswa, dan data program studi. Hasil dari proses data mining ini dapat digunakan sebagai
pertimbangan dalam mengambil keputusan lebih lanjut tentang faktor yang mempengaruhi tingkat
kelulusan khususnya faktor dalam data induk mahasiswa.

202|b 9 wh

Ju rnal)lm iah . E2/ 6ol.
1. o.
3 2015

5. Daftar Pustaka

[1].
[2].
[3].
[4].
[5].
[6].
[7].
[8].
[9].
[10].
[11].
[12].
[13].
[14].
[15].
[16].

A ndriani A nik. 2011. Penerapan A lgoritma C4.5 Pada Program K lasifikasi Mahasiswa
Dropout . A MIK BSI J akarta
A nonim, 2013 “Peraturan Akademik Universitas Muhammadiyah Surabaya”, Surabaya.
Budi, 2007, “Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis”, Graha Ilmu,
Y ogyakarta.
Bramer, Max, 2007, “Principles of Data Mining”, Springer, L ondon.
Chintakayala, Padmini. 2005. “Beginners Guide for Software Testing : Symbiosys
Technologies”.
Guidici, P. & Figini, S. 2009. Applied Data Mining for Business and Industry (2nd ed). Italy.
J ohn Wiley & Sons, L td. ISBN: 978-0-470-05886-2
Han, J . and K amber, M, 2006, “Data Mining Concepts and Techniques Second Edition”.
Morgan K auffman, San Francisco.
Hermawati A F, 2013. Data Mining. Penerbit A ndi. Y ogjakarta
Huda MN. 2010. A plikasi Data Mining Untuk Menampilkan Informasi T ingkat K elulusan
Mahasiswa (Studi K asus Di Fakultas Mipa Universitas Diponegoro). FMIPA UNDIP
L arose, D. T . 2005. Discovering Knowledge in Data. New J ersey: J ohn Willey & Sons, Inc.
ISBN 0-471-66657-2.
K usrini, dan Emha T aufik L uthfi, 2009, “Algoritma Data Mining”, Penerbit A ndi,
Y ogyakarta.
Pramudiono, I. 2007. Pengantar Data Mining : Menambang Permata Pengetahuan di Gunung
Data.
Rainardi, V incent, 2008, “Building a Data Warehouse with Examples in SQL Server”,
Springer, New Y ork.
Pressman, Roger S, 1997, “Software Engineering:A Practitioner’s Approch.” The McGrawHill Companies, Inc., New Y ork Santosa,
Sommerville, Ian, 2003, “Software Engineering (Rekayasa Perangkat Lunak)/ Edisi 6/J ilid 1”
Erlangga, J akarta.
Widodo Pudjo P, Handayanto T P. dan Herlawati, 2013. “Penerapan Data Mining dengan
Matlab”. Rekayasa Sains. Bandung

203|b 9 wh