BAB III
baru berupan rule-rule atau aturan-aturan yang akan dijadikan pola keputusan.
Algoritma ini dirasa cukup mudah pada implementasi sehingga apabila ada
perubahan data di masa yang akan dating maka akan mudah juga untuk
melakukan pembaruan pola keputusan yang baru.
3.2 Algoritma Sistem
Pada algoritma C4.5 terdiri dari beberapa tahapan yaitu:
1.
2.
3.
4.
Pilihan atribut sebagai akar.
Buat cabang untuk tiap-tiap nilai.
Bagi kasus dalam cabang.
Ulangi peroses untuk setiap cabang sampai semua kasus pada cabang
memiliki kelas yang sama.
Sebelum melakukan proses sesuai dengan Algoritma C4.5, maka terlebih
dahulu akan dilakukan penetuan data awal. Data awal yang digunakan adalah data
nilai rata-rata rapor, nilai ujian nasional bahasa Inggrus dan nilai ujian seleksi
penerimaan yang nantinya akan digunakan untuk pengambilan keputusan.
3.2.1 Penentuan Data Awal
Data yang digunakan adalah data nilai rata-rata rapor, nilai ujian nasional
bahasa inggris dan nilai ujian seleksi pada 50 orang pertama calon siswa SMA
Negri Unggulan Sukma Nias, yaitu sebagai berikut :
Tabel 3.1 Data Calon Siswa
No
Nama Calon Siswa
Nilai Rata rata Rapor
Nilai UN
Bahasa
Inggris
Nilai Ujian
Seleksi
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
Alvajar Nofanolo Harefa
Anniversari Ritalenta
Charles Setiawan Zega
Elnatan Purnama Sangahao
Hepi Hardiyanti Waruwu
Iman Hati Gea
Indra David Karunia Mendrofa
Jonta Hendrik Pratama Zamago
Juli Kriswanto Jhonpra Volta
Kelvin Putra Jaya Zebua
Miwa Berkat Niamana Zebua
Oktalena Zai
Prischa Deyta Claudia Zalukhu
Purim Kharisman Hulu
Puspita Dewi Putri Faruwu
Rikmen Denta Anoita Gori
Risnah Harefa
Rivonius Berkat Jaya Noitolo
Wahyudinansyah Kurinci
Yakin Kasih Telaumbanua
Deana Kristiani Zebua
Dian Nova Betriana Mendrofa91
Didian Noveni Waruwu
Dikta Pretty Yitra Zebua
Dita Kasih Kristine Hulu
Edwin Syah Putra Laia
Elfa Yusriani Harefa
Eukardi Yanto Kristov Waruwu
Hadirat Zebua
Igor Adefrid Jantri Milleno
Iwan Krisman Lase
Mayang Julfriani Lase
Meiman Krisman Penyabar
Nince Junita Waruwu
Rahmat Kurniawan Hulu
Steven Jordan Zebua
Surya Kurniati Zebua
Welly Nolira Narwastuti Harefa
Yarniwati Hura
Yismael Nashara Enos Bella
87
79
84
77
78
80
85
79
82
88
89
91
90
95
75
80
85
83
83
79
89
91
90
95
75
69
65
80
76
77
70
78
87
80
85
83
82
77
89
91
Tabel 3.1 Data Calon Siswa (Lanjutan)
77
70
82
87
80
74
83
74
88
89
91
90
95
75
69
65
80
69
65
70
82
87
90
77
77
70
80
85
80
74
90
70
77
78
80
85
83
73
85
83
85
80
87
90
84
85
81
80
85
83
82
88
89
92
90
95
82
81
65
80
89
88
88
82
87
90
88
82
70
80
85
80
87
90
84
81
81
80
87
90
No
41
42
43
44
45
46
47
48
49
50
Nama Calon Siswa
Arisman Tarkus Deli
Bernad Teuku Ryan Waruwu
Carlin De Puteh Daeli
Cristoni Hasiholan Pardosi
Dermawan Gulo
Dika Theo Dice Gea
Elda Maria Krisanti
Eva Damayanti
Fakta Sastra Mendrofa
Fitri Juhana Sitompul
Nilai Rata rata Rapor
90
95
75
80
85
83
82
75
89
77
Nilai UN
Bahasa
Inggris
82
88
89
91
90
95
77
70
80
71
Nilai
Ujian
Seleksi
82
88
89
91
90
95
85
69
85
80
3.2.2 Transformasi Data
Dari data tersebut diatas, selanjutnya kita akan melakukan transformasi data.
Hal ini dilakukan dengan tujuan untuk mempermudah proses pengalian data.
Adapun transpormasi data tersebut dilakukan dengan acuan sebagai berikut:
Tabel 3.2 Transformasi Data Nilai Calon Siswa.
Ujian Seleksi
81
Cukup
Nilai
Ujian Nasional Bahasa
Inggris
=75
Kurang
Cukup
Rapor
=80
Cukup
Berdasarkan data pada tabel 3.2 di atas, maka data akan ditransfermasikan
menjadi seperti berikut:
Tabel 3.3 Data Nilai Awal Setelah Ditransformasi
N
o
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Alvajar Nofanolo Harefa
Cukup
Nilai UN
Bahasa
Inggris
Cukup
Anniversari Ritalenta
Charles Setiawan Zega
Elnatan Purnama
Sangahao
Hepi Hardiyanti Waruwu
Iman Hati Gea
Indra David Karunia
Mendrofa
Jonta Hendrik Pratama
Zamago
Juli Kriswanto Jhonpra
Volta
Kelvin Putra Jaya Zebua
Miwa Berkat Niamana
Zebua
Oktalena Zai
Prischa Deyta Claudia
Zalukhu
Purim Kharisman Hulu
Puspita Dewi Putri
Faruwu
Rikmen Denta Anoita
Gori
Risnah Harefa
Rivonius Berkat Jaya
Noitolo
Wahyudinansyah Kurinci
Cukup
Cukup
Kurang
Cukup
Kurang
Cukup
Lulus
Gaga
l
Lulus
Kurang
Kurang
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Kurang
Lulus
Lulus
Lulus
Cukup
Cukup
Kurang
Cukup
Cukup
Kurang
Lulus
Gaga
l
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Lulus
Lulus
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Lulus
Lulus
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Lulus
Lulus
Kurang
Kurang
Cukup
Lulus
Cukup
Cukup
Kurang
Cukup
Cukup
Kurang
Lulus
Lulus
Cukup
Cukup
Cukup
Cukup
Kurang
Kurang
Cukup
Cukup
Kurang
Cukup
Kurang
Kurang
Lulus
Lulus
Gaga
l
Lulus
Cukup
Cukup
Cukup
Kurang
Kurang
Kurang
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Kurang
Kurang
Cukup
Cukup
Cukup
Kurang
Lulus
Lulus
Lulus
Lulus
Lulus
Lulus
Cukup
Kurang
Cukup
Cukup
Kurang
Kurang
Lulus
Lulus
Kurang
Cukup
Kurang
Lulus
Nama Calon Siswa
Yakin Kasih Telaumbanua
Deana Kristiani Zebua
Dian Nova Betriana
Mendrofa91
Didian Noveni Waruwu
Dikta Pretty Yitra Zebua
Dita Kasih Kristine Hulu
Edwin Syah Putra Laia
Elfa Yusriani Harefa
Eukardi Yanto Kristov
Waruwu
Hadirat Zebua
Igor Adefrid Jantri
Milleno
Nilai Rata rata
Nilai Ujian
Seleksi
Cukup
Hasil
31
32
33
34
35
36
37
38
39
40
Iwan Krisman Lase
Mayang Julfriani Lase
Meiman Krisman
Penyabar
Nince Junita Waruwu
Rahmat Kurniawan Hulu
Steven Jordan Zebua
Surya Kurniati Zebua
Welly Nolira Narwastuti
Harefa
Yarniwati Hura
Yismael Nashara Enos
Bella
Kurang
Cukup
Cukup
Cukup
Cukup
Kurang
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Kurang
Kurang
Cukup
Cukup
Cukup
Cukup
Kurang
Kurang
Gaga
l
Lulus
Gaga
l
Lulus
Lulus
Lulus
Lulus
Gaga
l
Lulus
Cukup
Cukup
Cukup
Lulus
Tabel 3.3 Data Nilai Awal Setelah di Transformasi (Lanjutan)
No
Nama Calon Siswa
41
44
45
46
47
Arisman Tarkus Deli
Bernad Teuku Ryan
Waruwu
Carlin De Puteh Daeli
Cristoni Hasiholan
Pardosi
Dermawan Gulo
Dika Theo Dice Gea
Elda Maria Krisanti
48
49
Eva Damayanti
Fakta Sastra Mendrofa
50
Fitri Juhana Sitompul
42
43
Cukup
Nilai UN
Bahasa
Inggris
Cukup
Cukup
Cukup
Cukup
Kurang
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Kurang
Kurang
Kurang
Kurang
Cukup
Cukup
Kurang
Cukup
Cukup
Kurang
Nilai Rata rata
Nilai Ujian
Seleksi
Hasil
Cukup
Lulus
Lulus
Lulus
Lulus
Lulus
Lulus
Lulus
Gaga
l
Lulus
Gaga
l
Dari transfermasi data di atas, jumlah siswa yang lulus adalah 42 Orang, dan
jumlah siswa yang tidak lulus adalah 8 Orang.
3.2.3 Algoritma C4.5
Berikut adalah tahapan-tahapan penyelesaian untuk membentuk sebuah
pohon keputusan dari data nilai yang akan dijadikan acuan untuk memilih calon
siswa baru yang akan diterima bersekolah di SMA Negri Unggulan Sukma Nias.
3.2.3.1 Pilih atribut akar
Untuk memilih atribut sebagai akar, berdasarkan pada nilai gain tertinggi
dari atribut-atribut yang ada.
Dengan menggunakan 2 persamaan di atas maka didapatkan entropy dan
gain yang digunakan sebagai akar dalam membuat pohon keputusan.
1. Entropy Total
−42
42
−8
8
∗log 2
+
∗log 2
=0.63431
50
50
50
50
Enteropy total adalah menghitung nilai lulus (42) dan tidak lulus (8) dimana
Entropy Total ¿
(
( )) (
( ))
50 adalah jumlah kasus keseluruhan.
2. Entropy Atribut Nilai Rata-rata
Untuk atribut nilai rata-rata terdiri dari 2 nilai yaitu: kurang dan cukup
dimana nilai entropy masing-masing adalah sebagai berikut:
Nilai Rata-rata=Cukup
(Jumlah Kasus=39, Hasil Lulus=33, Hail Tidak Lulus=6)
−33
33
−6
6
∗log 2
+
∗log 2
=0.6194
39
39
39
39
Nilai Rata-rata = Kurang
(Jumlah Kasus=11, Hasil Lulus=9, Hail Tidak Lulus=2)
−9
9
−2
2
∗log 2
+
∗log 2
=0.6840
Entropy (Kurang)l ¿
11
11
11
11
Entropy (Cukup)l ¿
(
( )) (
(
( )) (
( ))
( ))
3. Entropy Atribut Nilai Ujian Bahasa Inggris
Untuk Atrubut Nilai Ujian Bahasa Inggris dari 2 nilai yaitu: Cukup dan
Kurang dimana, nilai Entropy masing-masing adalah sebagai berikut:
Nilai Ujian Bahasa Inggris = Cukup
(Jumlah Kasus=44, Hasil Lulus=39, Hail Tidak Lulus=5)
−39
39
−5
5
∗log 2
+
∗log 2
=0.5108
Entropy (Cukup) ¿
44
44
44
44
Nilai Ujian Bahasa Inggris = Kurang
(Jumlah Kasus=6, Hasil Lulus=3, Hail Tidak Lulus=3)
−3
3
−3
3
∗log 2
+
∗log 2
=1
Entropy (Kurang)l ¿
6
6
6
6
(
(
( )) (
( ))
( )) (
( ))
4. Entropy Atribut Nilai Ujian Seleksi
Untuk Atribut Nilai Ujian Seleksi terdiri dari 2 nilai yaitu Cukup dan
Kurang dimana nilai Entropy masing-masing adalah sebagai berikut:
Nilai Ujian Seleksi = Cukup
(Jumlah Kasus=27, Hasil Lulus=27, Hail Tidak Lulus=0)
−27
27
−0
0
∗log 2
+
∗log 2
=0
Entropy (Cukup) ¿
27
27
27
27
Nilai Ujian Seleksi = Kurang
(Jumlah Kasus=23, Hasil Lulus=15, Hail Tidak Lulus=8)
−15
15
−8
8
∗log 2
+
∗log 2
=0 .9321
Entropy (Kurang) ¿
23
23
23
23
Tahap selanjutnya adalah menghitung nilai lain tiap-tiap atribut:
(
( )) (
( ))
(
( )) (
( ))
5. Gain (Total, Nilai Rata-rata)
Gain untuk Nilai Rata-rata adalah:
Nilai Rata−ratai
¿
¿
Nilai Rata−rata i|
|
= Entropy(S)∗Entropy ¿
|Total|
n
∑¿
i=1
39
11
∗0.6194 +
∗0.6840 =0.0007
50
50
Dimana Jumlah Total = 50, Jumlah Kasus (Nilai Rata-rata Cukup = 39,
=0.63431-
((
))
)(
Nilai Rata-rata Kurang = 11)
6. Gain (Total, Nilai Ujian Bahasa Inggris)
Gain untuk Nilai Ujian Bahasa Inggris adalah:
Nilai Ujian Bahasa Inggrisi
¿
¿
Nilai Ujian Bahasa Inggrisi|
|
= Entropy(S)∗Entropy ¿
|Total|
n
∑¿
i=1
44
6
∗0.5108 +
∗1 =0.0648
50
50
Dimana Jumlah Total = 50, Jumlah Kasus (Nilai Bahasa Inggris Cukup =
=0.63431-
((
)(
))
44, Nilai Bahasa Inggris Kurang = 6)
7. Gain (Total, Nilai Ujian Seleksi)
Gain untuk Nilai Ujian Seleksi adalah:
Nilai Ujian Seleksi i
¿
¿
|Nilai Ujian Seleksi i|
= Entropy(S)∗Entropy ¿
|Total|
n
∑¿
i=1
27
23
∗0 +
∗0.9321 =0.2055
50
50
Dimana Jumlah Total = 50, Jumlah Kasus (Nilai Seleksi Cukup = 27, Nilai
=0.63431-
((
))
)(
Seleksi Kurang = 23)
Setelah seluruh nilai Entropy dan Gain diperoleh, selanjutnya hasil dari
penelitian tersebut dimasukan ke dalam Tabel 3.4.
Pada perhitungan pada Tabel 3.4, dapat diketahui bahwa atribut dengan
Gain tertinggi adalah nilai Uian Seleksi dengan nilai 0,2055, sehingga atribut
Nilai Ujian Seleksi dapat menjadi Node Akar.
Tabel 3.4 Tabel Perhitungan Node 1
Jumla
h
Kasus
50
Node
1
TOTAL
Nilai Rata - rata
Rapor
Lulus
Tidak
Lulus
Entropy
42
8
0,634310
Gain
0,000
7
Cukup
Kuran
g
39
33
6
0,6194
11
9
2
0,6840
Nilai Ujian Bahasa
Inggris
0,064
8
Cukup
Kuran
g
44
39
5
0,5108
6
3
3
10,000
0,205
5
Nilai Ujian Seleksi
Cukup
Kuran
27
23
27
15
0
8
0,0000
0,9321
g
3.2.3.2 Cabang Untuk Setiap Nilai
Pada atribut Nilai Ujian Seleksi yang dijadikan akar terdapat 2 nilai yaitu
“Cukup” dan “Kurang”. Dari nilai atribut tersebut, nilai “Cukup” mempunyai
Hasil = “Lulus” sehingga tidak perlu dilakukan perhitungan kembali. Sedangkan
nilai “Kurang” mempunyai Hasil = “Lulus” dan Hasil = “Tidak Lulus” sehingga
untuk nilai atribut “Kurang” harus dilakukan perhitungan kembali. Gambar pohon
keputusan sementara dapat dilihat pada gambar 3.1 sebagai berikut:
Kurang
???
Nilai Ujian
Seleksi
Cukup
Lulus
Gambar 3.1 Pohon Keputusan Hasil Perhitungan Node 1
Dari gambar 3.1 di atas, diperhatikan bahwa yang dijadikan Node akar
adalah Nilai Ujian Seleksi dimana Nilai Ujian Seleksi ini dibagi dalam 2 tipe
yaitu “Cukup dan “Kurang”. Untuk nilai “Cukup” tidak perlu dilakukan
perhitungan kembali dikarenakan hasil dari nilai tersebut adalah “Lulus”
sedangkan untuk nilai “Kurang” harus dilakukan perhitungan kembali
dikarenakan hasilnya berniali “Lulus” dan “Tidak Lulus”.
3.2.3.3 Pembagian Kasus Pada Setiap Cabang
Selanjutnya adalah menyelesaikan untuk menghitung Node 1.1 sebagai akar,
sama dengan cara yang diatas dengan menghitung nilai Entropy dari atribut yang
tersisa yaitu Nilai Rata-rata Rapor dan Nilai Ujian Nasional Bahasa Inggris.
Setelah dihitung Entropy, lalu kemudian dihitung Gain untuk tiap-tiap atribut.
1. Entropy Nilai Ujian Seleksi
Untuk atribut Nilai Ujian Seleksi akan dijadikan cabang, dimana
jumlah kasus sebanyak 10 dengan Hasil Lulus = 2 dan Hasil Tidak Lulus = 8,
sehingga Entropy adalah sebagai berikut:
Entropy (Nilai Ujian Seleksi) ¿
(
−15
15
−8
8
∗log 2
+
∗log 2
=0.9321
23
23
23
23
( )) (
( ))
2. Entropy Nilai Rata-rata Rapor
Untuk Atribut Nilai Rata-rata Rapor terdiri dari 2 bilai yaitu : Cukup
dan Kurang dimana nilai Entropy masing-masing adalah sebagai berikut:
Nilai Rata-rata Rapor = Cukup
(Jumlah Kasus=19, Hasil Lulus=13, Hail Tidak Lulus=6)
Entropy (1) ¿
(
−13
13
−6
6
∗log 2
+
∗log 2
=0.8997
19
19
19
19
( )) (
( ))
Nilai Rata-rata Rapor = Kurang
(Jumlah Kasus=4, Hasil Lulus=2, Hail Tidak Lulus=2)
Entropy (2) ¿
(
−2
2
−2
2
∗log 2
+
∗log 2
=1
4
4
4
4
( )) (
( ))
3. Entropy Ujian Nasional Bahasa Inggris
Untuk Atribut Nilai Rata-rata Rapor terdiri dari 2 bilai yaitu : Cukup dan
Kurang dimana nilai Entropy masing-masing adalah sebagai berikut:
Nilai Nasional Bahasa Inggris = Cukup
(Jumlah Kasus=20, Hasil Lulus=15, Hail Tidak Lulus=5)
Entropy (1) ¿
(
−15
15
−5
5
∗log 2
+
∗log 2
=0.8113
20
20
20
20
( )) (
( ))
Nilai Nasional Bahasa Inggris = Kurang
(Jumlah Kasus=3, Hasil Lulus=0, Hail Tidak Lulus=3)
Entropy (2) ¿
(
−0
0
−3
3
∗log 2
+
∗log 2
=0
3
3
3
3
( )) (
( ))
4. Gain (Total, Nilai Rata-rata Rapor)
Gaian untuk Nilai Rata-rata Rapor adalah:
Nilai Rata−rata Rapor i
¿ Total∨¿∗Entropy ¿
¿ Nilai Rata−rata Rapori ∨ ¿¿
=Entropy(S)
¿
n
−∫ ¿
i=1
¿
(
−0
0
−3
3
∗log 2
+
∗log 2
=0
3
3
3
3
( )) (
( ))
Dimana Jumlah Total = 23, Jumlah Kasus (Nilai Rata-rata Rapor “Cukup” =
19 dan Niali Rata-rata “Kurang” = 4)
5. Gain (Total, Ujian Nasional Bahasa Ingggris)
Gaian untuk Nilai Rata-rata Rapor adalah:
Nilai Bhs . Inggisi
¿ Total∨¿∗Entropy ¿
¿ Nilai Bhs . Inggrisi∨ ¿¿
=Entropy(S)
¿
n
−∫ ¿
i=1
¿ 0,9321−
((
20
3
∗0.8113 +
∗0 =0 , 2267
23
23
)(
))
Dimana Jumlah Total = 23, Jumlah Kasus (Ujian Nasional Bahasa
Inggris“Cukup” = 20 dan Ujian Nasional Bahasa Inggris “Kurang” = 3)
Setelah seluruh nilai Entropy dan Gain diperolaeh, selanjutnya hasil
dari perhitungan tersebut dimasukkan kedalam Tabel 3.5
Tabel 3.5 Perhitungan Entropy dan Gain pada Node 1.1
Jumla
h
Kasus
23
Node
1
TOTAL
Nilai Rata - rata
Lulus
Tidak
Lulus
Entropy
15
8
0,9321
Gain
0,0149
Cukup
Kurang
39
11
33
9
6
2
0,8997
1,0000
Nilai Ujian Bahasa
Inggris
0,2267
Cukup
Kurang
20
3
15
0
5
3
0,8113
0,0000
Dari hasi Tabel 3.5 dapatdiketahui bahwa atribut dengan Gain tertinggi
adalah Nilai Ujian Nasional Bahasa Inggris yaitu sebesar 0,2267 yang berarti
Nilai Ujian Nasional Bahas Inggris adalah node akar berikut. Ada 2 atribut dari
Nilai Ujian Seleksi yaitu “Cukup” dan “Kurang”. Nilai “Vukup” mempunyai hasil
“Lulus” sedangkan nilai “Kurang” mempunyai Hasil = “Lulus” dan Hasil =
“Tidak Lulus”. Apabila dilihat dari atribut selanjutnta yaitu Nilai Ujian Nasional
Bahasa Inggris diperoleh bahwa jiak Nilai Ujian Seleksi “Kuramg” dan Nilai
Ujian Nasional Bahasa Inggris “Cukup” maka Hasil = “Lulus” dan jika Nilai
Ujian Seleksi “Kurang” dan Nilai Ujian Bahasa Inggris “Kurang” maka hasil =
“Tidak Lulus”. Jika dilihat pada atribut selajutnya yaitu Nilai Rata-rata Rapor
maka jika Nilai Rata-rata Rapor “Cukup” ataupun “Kurang” maka hasilnya tetap
Lulus.
3.2.3.4 Pohon Keputusan
Berdasarkan perhitungan Entropy dan Gain seperti yang telah dilakukan
diatas, maka diperoleh Pohon Keputusan akhir seperti gambar 3.2.
Nilai Ujian Seleksi
Nilai Ujian Nasional
Bahasa INggris
Niali Rata-rata
Rapor
Lulus
Lulus
Tidak Lulus
Lulus
Gambar 3.2 Pohon Keputusan Akhir
Setelah Nilai ujian seleksi dijadikan Node akar, maka Nilai Ujian Nasional
Bahasa Inggris dijadikan Node 1.1 atau node cabag. Untuk Nilai Ujian Nasional
Bahasa Inggris dengan Nilai “Kurang”, serta Nilai Rata-rata Rapor dijadikan
sebagai node berikutnya.
3.2.3.5 General Rules
Berdasarkan dari pohon keputusan yang terbentuk seperti pada
gambar 3.2, maka dapat dihasilkan rule sebagai berikut :
1. If Nilai Ujian Seleksi=”Cukup”then Hasil=”Lulus”
2. If Nilai Ujian Seleksi=”Kurang”and Nilai Ujian Nasional Bahasa
Inggris=”Kurang”then Hasil=”Tidak Lulus”
3. If Nilai Ujian Seleksi=”Kurang”and Nilai Ujian Nasional Bahasa
Inggris=”Cukup”and Nilai Rata – rata Rapor=”Cukup”then Hasil=”Lulus”
4. If Nilai Ujian Seleksi=”Kurang”and Nilai Ujian Nasional Bahasa
Inggris=”Cukup”and Nilai Rata – rata Rapor=”Kurang”then Hasil=”Lulus”
3.3 Flowchart Algoritma C4.5
Berikut adalah flowchart program pada pengolahan data kriteria yang
akan digunakan dalam pembuatan pola keputusan Penerimaan Siswa Baru Pada
SMA Negeri Unggulan Sukma Nias.
Start
A
Data Kriteria
Cari Atribut Cabang
dengan Atribut Cabang
= Gain Tertinggi
Hitung Jumlah Kasus
Y
Hitung Entropy Total
B
AdaCabang
Lagi ?
Hitung Entropy dan
Gain Setiap Kriteria
B
Cari Cabang dari sisa
atribut kriteria selain
atribut akar
Hitung Entropy dan
Gain Atribut Lain
Pohon
Keputusan
Stop
Gambar 3.3 Flowchart Algoritma C4.5
Pada saat system dijalankan, data yang diperlukan adalah kriteria –
kriterian yang menjadi acuan dalam proses penerimaan siswa baru. Setelah data
terpenuhi, maka akan dilakukan proses perhitungan jumlah kasus yang kemudian
tdata tersebut akan digunakan untuk proses pencarian nilai entropy total dan
entropy tiap – tiap kriteria. Setelah data nilai entropy terpenuhi, maka selanjutnya
adalah menghitung nilai gain. Apabila sudah tidak terdapat cabang lagi, maka
pohon keputusan dari system penerimn siswa baru telah terbentuk.
3.4.1 Use Case Diagram
Adapun Use Case diagram untuk aplikasi penerapan Algoritma C4.5 dapat
dilihat pada gambar 3.4 berikut :
Direktori
Penyimpanan
Import Data
Admin
Import
Algoritma
Data
DDat
Atribut
Running
Hubungan/R
elasi
Sistem
Gambar 3.4 Use Case Diagram Aplikasi Penerapan Algoritma C4.5
Adapun scenario dari Use Case Diagram diatas dapat dijelaskn sebagai
berikut :
1. Skenario Use Case Direktori Penyimpanan
Adapun scenario Use Case dari Direktori Penyimpanan adalah
sebagai berikut :
Nama Use Case
: Direktori Penyimpanan
Actor
: Admin
Tujuan
: Pembuatan Default Lokasi Penyimpanan
Deskripsi
: Menentukan lokasi yang digunakan sebagai pengaturan
Dasar penyimpanan seluruh file yang dibutuhkan system.
User
1. Mengaktifkan aplikasi Rapid Miner
2. Memilih Menu File – New
Sistem
3. Tampilan Aplikasi Rapid Miner
4. Memilih Tab Repositories
5. Menyimpan Default direktori yang
akan digunakan
2. Skenario Use Case Import Data
Adapun scenario Use Case dari Import Data dari Direktori
Penyimpanan adalah sebagai berikut :
Nama Use Case
: Import Data
Actor
: Admin
Tujuan
: Memasukkan Sumber Data
Deskripsi
: Menambahkan data atribut yang akan diolah kedalam
program yang akan digunakan.
1.
2.
3.
4.
User
Memilih Tab Repositories dan Import Excel
Sheet
Memilih Sheet yang akan digunakan
Memilih data yang akan digunakan
Membuat nama file dan memilih tempat
penyimpanan
Sistem
5. Menyimpan data sumber dari bentuk file
Excel yang akan digunakan
3. Skenario Use Case Data Atribut
Adapun scenario Use Case dari Data Atribut adalah sebagai berikut :
Nama Use Case
: Data Atribut
Actor
: Sistem
Tujuan
: Membuat Data Atribut
Deskripsi
: Menyiapkan sumber data yang akan digunakan dalam
Proses yang akan dibuat dalam bentuk Excel.
User
Sistem
1. Data atribut telah dibuat dengan
menggunakan Excel
2. Penyimpanan data atribut
4. Skenario Use Case Algoritma C4.5
Adapun scenario Use Case dari Import Data adalah sebagai berikut :
Nama Use Case
: Algoritma C4.5
Actor
: Admin
Tujuan
: Memasukkan Algortima C4.5
Deskripsi
: Menambahkan Algoritma C4.5 yang telah disediakan oleh
aplikasi ke dalam lembar kerja.
User
1. Memilih Tab Operatiors – Modeling
Classification – Delcision Tree
2. Memasukkan Algoritma C4.5 ke lembar
kerja
Sistem
5. Skenario Use Case Relasi/Hubungan
Adapun scenario Use Case dari Import Data adalah sebagai berikut :
Nama Use Case
: Relasi / Hubungan
Actor
: Admin
Tujuan
: Menghubungkan Sumber Data dan Algoritma
Deskripsi
: Menghubungkan Algoritma C4.5 yang telah dipilih
dengan data atribut yang telah dimasukkan sebelumnya.
User
1. Menentukan Output dan Input dalam relasi
yang akan dibuat.
2. Membuat hubungan/relasi antara Algoritma
yang akan dipilih dengan sumber data yang
akan digunakan
Sistem
3. Memeriksa apakah relasi yang terjadi
sudah sesuai denan ketentuan
6. Skenario Use Case Running Sistem
Adapun scenario Use Case dari Running Sistem adalah sebagai
berikut :
Nama Use Case
: Running Sistem
Actor
: Admin
Tujuan
: Menghasilkan Pohon Keputusan
Deskripsi
: Menjalakan relasi antara algoritma yang telah dipilih
Dengan data sumber untuk menghasilkan pohon keputusa
User
Sistem
1. Memilih icon Run
2.
3.
4.
Memeriksa data nilai dan mengeksekusi
Algoritma C4.5
Membentuk pohon keputusan
Membentuk Rule berdasarkan pohon
keputusan
3.4.2 Activity Diagram
Activity diagram memodelkan alur kerja sebuah urutan aktivitas pada
Suatu proses. Activity diagram pada system ini, bias dilihat pada gambar 3.5
dibawah ini :
Admin
Sistem
Klik New
Tampilkan Halaman Proses
zKlik Tombol Menu Import
Data
Tampilkan Halaman Open
Dialog Dtaa
Mencari Lokasi Data
Mengelompokkan Data
Pemilihan Atribut
Klik Tombol Finish
Menampilkan Halaman Proses
Memasukkan Data
Memasukkan Algoritmas
Pemilihan Parameter
Klik Start
Menampilkan Dialog Save
Menampilkan Halaman
Decision Tree
Gambar 3.5 Activity Diagram Sistem
3.4.3 Perancangan Sistem
Tahap perancangan berikutnya yaitu desain system secara detail yang
meliputi desain input system, dan desain database. Berikut ini adalah rancangan
input sebagai antarmuka pengguna :
1. Rancangan Form Menu Utama
Rancangan form yang disajikan oleh system untuk melakukan menampilkan
seluruh menu yang ada, ditunjukkan pada gambar 3.6 :
File | Edit | Process | Tools | Views | Help
Gambar 3.6 Desain Form Menu Utama
2. Rancangan Form Menu Utama
Rancangan form yang disajikan oleh system untuk melakukan prosess
yang ditunjukkan pada gambar 3.7 :
File | Edit | Process | Tools | Views | Help
Operator
Process Window
Properties
Repositories
Gambar 3.7 Rancangan Form Pengaturan Data Kriteria
Algoritma ini dirasa cukup mudah pada implementasi sehingga apabila ada
perubahan data di masa yang akan dating maka akan mudah juga untuk
melakukan pembaruan pola keputusan yang baru.
3.2 Algoritma Sistem
Pada algoritma C4.5 terdiri dari beberapa tahapan yaitu:
1.
2.
3.
4.
Pilihan atribut sebagai akar.
Buat cabang untuk tiap-tiap nilai.
Bagi kasus dalam cabang.
Ulangi peroses untuk setiap cabang sampai semua kasus pada cabang
memiliki kelas yang sama.
Sebelum melakukan proses sesuai dengan Algoritma C4.5, maka terlebih
dahulu akan dilakukan penetuan data awal. Data awal yang digunakan adalah data
nilai rata-rata rapor, nilai ujian nasional bahasa Inggrus dan nilai ujian seleksi
penerimaan yang nantinya akan digunakan untuk pengambilan keputusan.
3.2.1 Penentuan Data Awal
Data yang digunakan adalah data nilai rata-rata rapor, nilai ujian nasional
bahasa inggris dan nilai ujian seleksi pada 50 orang pertama calon siswa SMA
Negri Unggulan Sukma Nias, yaitu sebagai berikut :
Tabel 3.1 Data Calon Siswa
No
Nama Calon Siswa
Nilai Rata rata Rapor
Nilai UN
Bahasa
Inggris
Nilai Ujian
Seleksi
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
Alvajar Nofanolo Harefa
Anniversari Ritalenta
Charles Setiawan Zega
Elnatan Purnama Sangahao
Hepi Hardiyanti Waruwu
Iman Hati Gea
Indra David Karunia Mendrofa
Jonta Hendrik Pratama Zamago
Juli Kriswanto Jhonpra Volta
Kelvin Putra Jaya Zebua
Miwa Berkat Niamana Zebua
Oktalena Zai
Prischa Deyta Claudia Zalukhu
Purim Kharisman Hulu
Puspita Dewi Putri Faruwu
Rikmen Denta Anoita Gori
Risnah Harefa
Rivonius Berkat Jaya Noitolo
Wahyudinansyah Kurinci
Yakin Kasih Telaumbanua
Deana Kristiani Zebua
Dian Nova Betriana Mendrofa91
Didian Noveni Waruwu
Dikta Pretty Yitra Zebua
Dita Kasih Kristine Hulu
Edwin Syah Putra Laia
Elfa Yusriani Harefa
Eukardi Yanto Kristov Waruwu
Hadirat Zebua
Igor Adefrid Jantri Milleno
Iwan Krisman Lase
Mayang Julfriani Lase
Meiman Krisman Penyabar
Nince Junita Waruwu
Rahmat Kurniawan Hulu
Steven Jordan Zebua
Surya Kurniati Zebua
Welly Nolira Narwastuti Harefa
Yarniwati Hura
Yismael Nashara Enos Bella
87
79
84
77
78
80
85
79
82
88
89
91
90
95
75
80
85
83
83
79
89
91
90
95
75
69
65
80
76
77
70
78
87
80
85
83
82
77
89
91
Tabel 3.1 Data Calon Siswa (Lanjutan)
77
70
82
87
80
74
83
74
88
89
91
90
95
75
69
65
80
69
65
70
82
87
90
77
77
70
80
85
80
74
90
70
77
78
80
85
83
73
85
83
85
80
87
90
84
85
81
80
85
83
82
88
89
92
90
95
82
81
65
80
89
88
88
82
87
90
88
82
70
80
85
80
87
90
84
81
81
80
87
90
No
41
42
43
44
45
46
47
48
49
50
Nama Calon Siswa
Arisman Tarkus Deli
Bernad Teuku Ryan Waruwu
Carlin De Puteh Daeli
Cristoni Hasiholan Pardosi
Dermawan Gulo
Dika Theo Dice Gea
Elda Maria Krisanti
Eva Damayanti
Fakta Sastra Mendrofa
Fitri Juhana Sitompul
Nilai Rata rata Rapor
90
95
75
80
85
83
82
75
89
77
Nilai UN
Bahasa
Inggris
82
88
89
91
90
95
77
70
80
71
Nilai
Ujian
Seleksi
82
88
89
91
90
95
85
69
85
80
3.2.2 Transformasi Data
Dari data tersebut diatas, selanjutnya kita akan melakukan transformasi data.
Hal ini dilakukan dengan tujuan untuk mempermudah proses pengalian data.
Adapun transpormasi data tersebut dilakukan dengan acuan sebagai berikut:
Tabel 3.2 Transformasi Data Nilai Calon Siswa.
Ujian Seleksi
81
Cukup
Nilai
Ujian Nasional Bahasa
Inggris
=75
Kurang
Cukup
Rapor
=80
Cukup
Berdasarkan data pada tabel 3.2 di atas, maka data akan ditransfermasikan
menjadi seperti berikut:
Tabel 3.3 Data Nilai Awal Setelah Ditransformasi
N
o
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Alvajar Nofanolo Harefa
Cukup
Nilai UN
Bahasa
Inggris
Cukup
Anniversari Ritalenta
Charles Setiawan Zega
Elnatan Purnama
Sangahao
Hepi Hardiyanti Waruwu
Iman Hati Gea
Indra David Karunia
Mendrofa
Jonta Hendrik Pratama
Zamago
Juli Kriswanto Jhonpra
Volta
Kelvin Putra Jaya Zebua
Miwa Berkat Niamana
Zebua
Oktalena Zai
Prischa Deyta Claudia
Zalukhu
Purim Kharisman Hulu
Puspita Dewi Putri
Faruwu
Rikmen Denta Anoita
Gori
Risnah Harefa
Rivonius Berkat Jaya
Noitolo
Wahyudinansyah Kurinci
Cukup
Cukup
Kurang
Cukup
Kurang
Cukup
Lulus
Gaga
l
Lulus
Kurang
Kurang
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Kurang
Lulus
Lulus
Lulus
Cukup
Cukup
Kurang
Cukup
Cukup
Kurang
Lulus
Gaga
l
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Lulus
Lulus
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Lulus
Lulus
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Lulus
Lulus
Kurang
Kurang
Cukup
Lulus
Cukup
Cukup
Kurang
Cukup
Cukup
Kurang
Lulus
Lulus
Cukup
Cukup
Cukup
Cukup
Kurang
Kurang
Cukup
Cukup
Kurang
Cukup
Kurang
Kurang
Lulus
Lulus
Gaga
l
Lulus
Cukup
Cukup
Cukup
Kurang
Kurang
Kurang
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Kurang
Kurang
Cukup
Cukup
Cukup
Kurang
Lulus
Lulus
Lulus
Lulus
Lulus
Lulus
Cukup
Kurang
Cukup
Cukup
Kurang
Kurang
Lulus
Lulus
Kurang
Cukup
Kurang
Lulus
Nama Calon Siswa
Yakin Kasih Telaumbanua
Deana Kristiani Zebua
Dian Nova Betriana
Mendrofa91
Didian Noveni Waruwu
Dikta Pretty Yitra Zebua
Dita Kasih Kristine Hulu
Edwin Syah Putra Laia
Elfa Yusriani Harefa
Eukardi Yanto Kristov
Waruwu
Hadirat Zebua
Igor Adefrid Jantri
Milleno
Nilai Rata rata
Nilai Ujian
Seleksi
Cukup
Hasil
31
32
33
34
35
36
37
38
39
40
Iwan Krisman Lase
Mayang Julfriani Lase
Meiman Krisman
Penyabar
Nince Junita Waruwu
Rahmat Kurniawan Hulu
Steven Jordan Zebua
Surya Kurniati Zebua
Welly Nolira Narwastuti
Harefa
Yarniwati Hura
Yismael Nashara Enos
Bella
Kurang
Cukup
Cukup
Cukup
Cukup
Kurang
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Kurang
Kurang
Cukup
Cukup
Cukup
Cukup
Kurang
Kurang
Gaga
l
Lulus
Gaga
l
Lulus
Lulus
Lulus
Lulus
Gaga
l
Lulus
Cukup
Cukup
Cukup
Lulus
Tabel 3.3 Data Nilai Awal Setelah di Transformasi (Lanjutan)
No
Nama Calon Siswa
41
44
45
46
47
Arisman Tarkus Deli
Bernad Teuku Ryan
Waruwu
Carlin De Puteh Daeli
Cristoni Hasiholan
Pardosi
Dermawan Gulo
Dika Theo Dice Gea
Elda Maria Krisanti
48
49
Eva Damayanti
Fakta Sastra Mendrofa
50
Fitri Juhana Sitompul
42
43
Cukup
Nilai UN
Bahasa
Inggris
Cukup
Cukup
Cukup
Cukup
Kurang
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Cukup
Kurang
Kurang
Kurang
Kurang
Cukup
Cukup
Kurang
Cukup
Cukup
Kurang
Nilai Rata rata
Nilai Ujian
Seleksi
Hasil
Cukup
Lulus
Lulus
Lulus
Lulus
Lulus
Lulus
Lulus
Gaga
l
Lulus
Gaga
l
Dari transfermasi data di atas, jumlah siswa yang lulus adalah 42 Orang, dan
jumlah siswa yang tidak lulus adalah 8 Orang.
3.2.3 Algoritma C4.5
Berikut adalah tahapan-tahapan penyelesaian untuk membentuk sebuah
pohon keputusan dari data nilai yang akan dijadikan acuan untuk memilih calon
siswa baru yang akan diterima bersekolah di SMA Negri Unggulan Sukma Nias.
3.2.3.1 Pilih atribut akar
Untuk memilih atribut sebagai akar, berdasarkan pada nilai gain tertinggi
dari atribut-atribut yang ada.
Dengan menggunakan 2 persamaan di atas maka didapatkan entropy dan
gain yang digunakan sebagai akar dalam membuat pohon keputusan.
1. Entropy Total
−42
42
−8
8
∗log 2
+
∗log 2
=0.63431
50
50
50
50
Enteropy total adalah menghitung nilai lulus (42) dan tidak lulus (8) dimana
Entropy Total ¿
(
( )) (
( ))
50 adalah jumlah kasus keseluruhan.
2. Entropy Atribut Nilai Rata-rata
Untuk atribut nilai rata-rata terdiri dari 2 nilai yaitu: kurang dan cukup
dimana nilai entropy masing-masing adalah sebagai berikut:
Nilai Rata-rata=Cukup
(Jumlah Kasus=39, Hasil Lulus=33, Hail Tidak Lulus=6)
−33
33
−6
6
∗log 2
+
∗log 2
=0.6194
39
39
39
39
Nilai Rata-rata = Kurang
(Jumlah Kasus=11, Hasil Lulus=9, Hail Tidak Lulus=2)
−9
9
−2
2
∗log 2
+
∗log 2
=0.6840
Entropy (Kurang)l ¿
11
11
11
11
Entropy (Cukup)l ¿
(
( )) (
(
( )) (
( ))
( ))
3. Entropy Atribut Nilai Ujian Bahasa Inggris
Untuk Atrubut Nilai Ujian Bahasa Inggris dari 2 nilai yaitu: Cukup dan
Kurang dimana, nilai Entropy masing-masing adalah sebagai berikut:
Nilai Ujian Bahasa Inggris = Cukup
(Jumlah Kasus=44, Hasil Lulus=39, Hail Tidak Lulus=5)
−39
39
−5
5
∗log 2
+
∗log 2
=0.5108
Entropy (Cukup) ¿
44
44
44
44
Nilai Ujian Bahasa Inggris = Kurang
(Jumlah Kasus=6, Hasil Lulus=3, Hail Tidak Lulus=3)
−3
3
−3
3
∗log 2
+
∗log 2
=1
Entropy (Kurang)l ¿
6
6
6
6
(
(
( )) (
( ))
( )) (
( ))
4. Entropy Atribut Nilai Ujian Seleksi
Untuk Atribut Nilai Ujian Seleksi terdiri dari 2 nilai yaitu Cukup dan
Kurang dimana nilai Entropy masing-masing adalah sebagai berikut:
Nilai Ujian Seleksi = Cukup
(Jumlah Kasus=27, Hasil Lulus=27, Hail Tidak Lulus=0)
−27
27
−0
0
∗log 2
+
∗log 2
=0
Entropy (Cukup) ¿
27
27
27
27
Nilai Ujian Seleksi = Kurang
(Jumlah Kasus=23, Hasil Lulus=15, Hail Tidak Lulus=8)
−15
15
−8
8
∗log 2
+
∗log 2
=0 .9321
Entropy (Kurang) ¿
23
23
23
23
Tahap selanjutnya adalah menghitung nilai lain tiap-tiap atribut:
(
( )) (
( ))
(
( )) (
( ))
5. Gain (Total, Nilai Rata-rata)
Gain untuk Nilai Rata-rata adalah:
Nilai Rata−ratai
¿
¿
Nilai Rata−rata i|
|
= Entropy(S)∗Entropy ¿
|Total|
n
∑¿
i=1
39
11
∗0.6194 +
∗0.6840 =0.0007
50
50
Dimana Jumlah Total = 50, Jumlah Kasus (Nilai Rata-rata Cukup = 39,
=0.63431-
((
))
)(
Nilai Rata-rata Kurang = 11)
6. Gain (Total, Nilai Ujian Bahasa Inggris)
Gain untuk Nilai Ujian Bahasa Inggris adalah:
Nilai Ujian Bahasa Inggrisi
¿
¿
Nilai Ujian Bahasa Inggrisi|
|
= Entropy(S)∗Entropy ¿
|Total|
n
∑¿
i=1
44
6
∗0.5108 +
∗1 =0.0648
50
50
Dimana Jumlah Total = 50, Jumlah Kasus (Nilai Bahasa Inggris Cukup =
=0.63431-
((
)(
))
44, Nilai Bahasa Inggris Kurang = 6)
7. Gain (Total, Nilai Ujian Seleksi)
Gain untuk Nilai Ujian Seleksi adalah:
Nilai Ujian Seleksi i
¿
¿
|Nilai Ujian Seleksi i|
= Entropy(S)∗Entropy ¿
|Total|
n
∑¿
i=1
27
23
∗0 +
∗0.9321 =0.2055
50
50
Dimana Jumlah Total = 50, Jumlah Kasus (Nilai Seleksi Cukup = 27, Nilai
=0.63431-
((
))
)(
Seleksi Kurang = 23)
Setelah seluruh nilai Entropy dan Gain diperoleh, selanjutnya hasil dari
penelitian tersebut dimasukan ke dalam Tabel 3.4.
Pada perhitungan pada Tabel 3.4, dapat diketahui bahwa atribut dengan
Gain tertinggi adalah nilai Uian Seleksi dengan nilai 0,2055, sehingga atribut
Nilai Ujian Seleksi dapat menjadi Node Akar.
Tabel 3.4 Tabel Perhitungan Node 1
Jumla
h
Kasus
50
Node
1
TOTAL
Nilai Rata - rata
Rapor
Lulus
Tidak
Lulus
Entropy
42
8
0,634310
Gain
0,000
7
Cukup
Kuran
g
39
33
6
0,6194
11
9
2
0,6840
Nilai Ujian Bahasa
Inggris
0,064
8
Cukup
Kuran
g
44
39
5
0,5108
6
3
3
10,000
0,205
5
Nilai Ujian Seleksi
Cukup
Kuran
27
23
27
15
0
8
0,0000
0,9321
g
3.2.3.2 Cabang Untuk Setiap Nilai
Pada atribut Nilai Ujian Seleksi yang dijadikan akar terdapat 2 nilai yaitu
“Cukup” dan “Kurang”. Dari nilai atribut tersebut, nilai “Cukup” mempunyai
Hasil = “Lulus” sehingga tidak perlu dilakukan perhitungan kembali. Sedangkan
nilai “Kurang” mempunyai Hasil = “Lulus” dan Hasil = “Tidak Lulus” sehingga
untuk nilai atribut “Kurang” harus dilakukan perhitungan kembali. Gambar pohon
keputusan sementara dapat dilihat pada gambar 3.1 sebagai berikut:
Kurang
???
Nilai Ujian
Seleksi
Cukup
Lulus
Gambar 3.1 Pohon Keputusan Hasil Perhitungan Node 1
Dari gambar 3.1 di atas, diperhatikan bahwa yang dijadikan Node akar
adalah Nilai Ujian Seleksi dimana Nilai Ujian Seleksi ini dibagi dalam 2 tipe
yaitu “Cukup dan “Kurang”. Untuk nilai “Cukup” tidak perlu dilakukan
perhitungan kembali dikarenakan hasil dari nilai tersebut adalah “Lulus”
sedangkan untuk nilai “Kurang” harus dilakukan perhitungan kembali
dikarenakan hasilnya berniali “Lulus” dan “Tidak Lulus”.
3.2.3.3 Pembagian Kasus Pada Setiap Cabang
Selanjutnya adalah menyelesaikan untuk menghitung Node 1.1 sebagai akar,
sama dengan cara yang diatas dengan menghitung nilai Entropy dari atribut yang
tersisa yaitu Nilai Rata-rata Rapor dan Nilai Ujian Nasional Bahasa Inggris.
Setelah dihitung Entropy, lalu kemudian dihitung Gain untuk tiap-tiap atribut.
1. Entropy Nilai Ujian Seleksi
Untuk atribut Nilai Ujian Seleksi akan dijadikan cabang, dimana
jumlah kasus sebanyak 10 dengan Hasil Lulus = 2 dan Hasil Tidak Lulus = 8,
sehingga Entropy adalah sebagai berikut:
Entropy (Nilai Ujian Seleksi) ¿
(
−15
15
−8
8
∗log 2
+
∗log 2
=0.9321
23
23
23
23
( )) (
( ))
2. Entropy Nilai Rata-rata Rapor
Untuk Atribut Nilai Rata-rata Rapor terdiri dari 2 bilai yaitu : Cukup
dan Kurang dimana nilai Entropy masing-masing adalah sebagai berikut:
Nilai Rata-rata Rapor = Cukup
(Jumlah Kasus=19, Hasil Lulus=13, Hail Tidak Lulus=6)
Entropy (1) ¿
(
−13
13
−6
6
∗log 2
+
∗log 2
=0.8997
19
19
19
19
( )) (
( ))
Nilai Rata-rata Rapor = Kurang
(Jumlah Kasus=4, Hasil Lulus=2, Hail Tidak Lulus=2)
Entropy (2) ¿
(
−2
2
−2
2
∗log 2
+
∗log 2
=1
4
4
4
4
( )) (
( ))
3. Entropy Ujian Nasional Bahasa Inggris
Untuk Atribut Nilai Rata-rata Rapor terdiri dari 2 bilai yaitu : Cukup dan
Kurang dimana nilai Entropy masing-masing adalah sebagai berikut:
Nilai Nasional Bahasa Inggris = Cukup
(Jumlah Kasus=20, Hasil Lulus=15, Hail Tidak Lulus=5)
Entropy (1) ¿
(
−15
15
−5
5
∗log 2
+
∗log 2
=0.8113
20
20
20
20
( )) (
( ))
Nilai Nasional Bahasa Inggris = Kurang
(Jumlah Kasus=3, Hasil Lulus=0, Hail Tidak Lulus=3)
Entropy (2) ¿
(
−0
0
−3
3
∗log 2
+
∗log 2
=0
3
3
3
3
( )) (
( ))
4. Gain (Total, Nilai Rata-rata Rapor)
Gaian untuk Nilai Rata-rata Rapor adalah:
Nilai Rata−rata Rapor i
¿ Total∨¿∗Entropy ¿
¿ Nilai Rata−rata Rapori ∨ ¿¿
=Entropy(S)
¿
n
−∫ ¿
i=1
¿
(
−0
0
−3
3
∗log 2
+
∗log 2
=0
3
3
3
3
( )) (
( ))
Dimana Jumlah Total = 23, Jumlah Kasus (Nilai Rata-rata Rapor “Cukup” =
19 dan Niali Rata-rata “Kurang” = 4)
5. Gain (Total, Ujian Nasional Bahasa Ingggris)
Gaian untuk Nilai Rata-rata Rapor adalah:
Nilai Bhs . Inggisi
¿ Total∨¿∗Entropy ¿
¿ Nilai Bhs . Inggrisi∨ ¿¿
=Entropy(S)
¿
n
−∫ ¿
i=1
¿ 0,9321−
((
20
3
∗0.8113 +
∗0 =0 , 2267
23
23
)(
))
Dimana Jumlah Total = 23, Jumlah Kasus (Ujian Nasional Bahasa
Inggris“Cukup” = 20 dan Ujian Nasional Bahasa Inggris “Kurang” = 3)
Setelah seluruh nilai Entropy dan Gain diperolaeh, selanjutnya hasil
dari perhitungan tersebut dimasukkan kedalam Tabel 3.5
Tabel 3.5 Perhitungan Entropy dan Gain pada Node 1.1
Jumla
h
Kasus
23
Node
1
TOTAL
Nilai Rata - rata
Lulus
Tidak
Lulus
Entropy
15
8
0,9321
Gain
0,0149
Cukup
Kurang
39
11
33
9
6
2
0,8997
1,0000
Nilai Ujian Bahasa
Inggris
0,2267
Cukup
Kurang
20
3
15
0
5
3
0,8113
0,0000
Dari hasi Tabel 3.5 dapatdiketahui bahwa atribut dengan Gain tertinggi
adalah Nilai Ujian Nasional Bahasa Inggris yaitu sebesar 0,2267 yang berarti
Nilai Ujian Nasional Bahas Inggris adalah node akar berikut. Ada 2 atribut dari
Nilai Ujian Seleksi yaitu “Cukup” dan “Kurang”. Nilai “Vukup” mempunyai hasil
“Lulus” sedangkan nilai “Kurang” mempunyai Hasil = “Lulus” dan Hasil =
“Tidak Lulus”. Apabila dilihat dari atribut selanjutnta yaitu Nilai Ujian Nasional
Bahasa Inggris diperoleh bahwa jiak Nilai Ujian Seleksi “Kuramg” dan Nilai
Ujian Nasional Bahasa Inggris “Cukup” maka Hasil = “Lulus” dan jika Nilai
Ujian Seleksi “Kurang” dan Nilai Ujian Bahasa Inggris “Kurang” maka hasil =
“Tidak Lulus”. Jika dilihat pada atribut selajutnya yaitu Nilai Rata-rata Rapor
maka jika Nilai Rata-rata Rapor “Cukup” ataupun “Kurang” maka hasilnya tetap
Lulus.
3.2.3.4 Pohon Keputusan
Berdasarkan perhitungan Entropy dan Gain seperti yang telah dilakukan
diatas, maka diperoleh Pohon Keputusan akhir seperti gambar 3.2.
Nilai Ujian Seleksi
Nilai Ujian Nasional
Bahasa INggris
Niali Rata-rata
Rapor
Lulus
Lulus
Tidak Lulus
Lulus
Gambar 3.2 Pohon Keputusan Akhir
Setelah Nilai ujian seleksi dijadikan Node akar, maka Nilai Ujian Nasional
Bahasa Inggris dijadikan Node 1.1 atau node cabag. Untuk Nilai Ujian Nasional
Bahasa Inggris dengan Nilai “Kurang”, serta Nilai Rata-rata Rapor dijadikan
sebagai node berikutnya.
3.2.3.5 General Rules
Berdasarkan dari pohon keputusan yang terbentuk seperti pada
gambar 3.2, maka dapat dihasilkan rule sebagai berikut :
1. If Nilai Ujian Seleksi=”Cukup”then Hasil=”Lulus”
2. If Nilai Ujian Seleksi=”Kurang”and Nilai Ujian Nasional Bahasa
Inggris=”Kurang”then Hasil=”Tidak Lulus”
3. If Nilai Ujian Seleksi=”Kurang”and Nilai Ujian Nasional Bahasa
Inggris=”Cukup”and Nilai Rata – rata Rapor=”Cukup”then Hasil=”Lulus”
4. If Nilai Ujian Seleksi=”Kurang”and Nilai Ujian Nasional Bahasa
Inggris=”Cukup”and Nilai Rata – rata Rapor=”Kurang”then Hasil=”Lulus”
3.3 Flowchart Algoritma C4.5
Berikut adalah flowchart program pada pengolahan data kriteria yang
akan digunakan dalam pembuatan pola keputusan Penerimaan Siswa Baru Pada
SMA Negeri Unggulan Sukma Nias.
Start
A
Data Kriteria
Cari Atribut Cabang
dengan Atribut Cabang
= Gain Tertinggi
Hitung Jumlah Kasus
Y
Hitung Entropy Total
B
AdaCabang
Lagi ?
Hitung Entropy dan
Gain Setiap Kriteria
B
Cari Cabang dari sisa
atribut kriteria selain
atribut akar
Hitung Entropy dan
Gain Atribut Lain
Pohon
Keputusan
Stop
Gambar 3.3 Flowchart Algoritma C4.5
Pada saat system dijalankan, data yang diperlukan adalah kriteria –
kriterian yang menjadi acuan dalam proses penerimaan siswa baru. Setelah data
terpenuhi, maka akan dilakukan proses perhitungan jumlah kasus yang kemudian
tdata tersebut akan digunakan untuk proses pencarian nilai entropy total dan
entropy tiap – tiap kriteria. Setelah data nilai entropy terpenuhi, maka selanjutnya
adalah menghitung nilai gain. Apabila sudah tidak terdapat cabang lagi, maka
pohon keputusan dari system penerimn siswa baru telah terbentuk.
3.4.1 Use Case Diagram
Adapun Use Case diagram untuk aplikasi penerapan Algoritma C4.5 dapat
dilihat pada gambar 3.4 berikut :
Direktori
Penyimpanan
Import Data
Admin
Import
Algoritma
Data
DDat
Atribut
Running
Hubungan/R
elasi
Sistem
Gambar 3.4 Use Case Diagram Aplikasi Penerapan Algoritma C4.5
Adapun scenario dari Use Case Diagram diatas dapat dijelaskn sebagai
berikut :
1. Skenario Use Case Direktori Penyimpanan
Adapun scenario Use Case dari Direktori Penyimpanan adalah
sebagai berikut :
Nama Use Case
: Direktori Penyimpanan
Actor
: Admin
Tujuan
: Pembuatan Default Lokasi Penyimpanan
Deskripsi
: Menentukan lokasi yang digunakan sebagai pengaturan
Dasar penyimpanan seluruh file yang dibutuhkan system.
User
1. Mengaktifkan aplikasi Rapid Miner
2. Memilih Menu File – New
Sistem
3. Tampilan Aplikasi Rapid Miner
4. Memilih Tab Repositories
5. Menyimpan Default direktori yang
akan digunakan
2. Skenario Use Case Import Data
Adapun scenario Use Case dari Import Data dari Direktori
Penyimpanan adalah sebagai berikut :
Nama Use Case
: Import Data
Actor
: Admin
Tujuan
: Memasukkan Sumber Data
Deskripsi
: Menambahkan data atribut yang akan diolah kedalam
program yang akan digunakan.
1.
2.
3.
4.
User
Memilih Tab Repositories dan Import Excel
Sheet
Memilih Sheet yang akan digunakan
Memilih data yang akan digunakan
Membuat nama file dan memilih tempat
penyimpanan
Sistem
5. Menyimpan data sumber dari bentuk file
Excel yang akan digunakan
3. Skenario Use Case Data Atribut
Adapun scenario Use Case dari Data Atribut adalah sebagai berikut :
Nama Use Case
: Data Atribut
Actor
: Sistem
Tujuan
: Membuat Data Atribut
Deskripsi
: Menyiapkan sumber data yang akan digunakan dalam
Proses yang akan dibuat dalam bentuk Excel.
User
Sistem
1. Data atribut telah dibuat dengan
menggunakan Excel
2. Penyimpanan data atribut
4. Skenario Use Case Algoritma C4.5
Adapun scenario Use Case dari Import Data adalah sebagai berikut :
Nama Use Case
: Algoritma C4.5
Actor
: Admin
Tujuan
: Memasukkan Algortima C4.5
Deskripsi
: Menambahkan Algoritma C4.5 yang telah disediakan oleh
aplikasi ke dalam lembar kerja.
User
1. Memilih Tab Operatiors – Modeling
Classification – Delcision Tree
2. Memasukkan Algoritma C4.5 ke lembar
kerja
Sistem
5. Skenario Use Case Relasi/Hubungan
Adapun scenario Use Case dari Import Data adalah sebagai berikut :
Nama Use Case
: Relasi / Hubungan
Actor
: Admin
Tujuan
: Menghubungkan Sumber Data dan Algoritma
Deskripsi
: Menghubungkan Algoritma C4.5 yang telah dipilih
dengan data atribut yang telah dimasukkan sebelumnya.
User
1. Menentukan Output dan Input dalam relasi
yang akan dibuat.
2. Membuat hubungan/relasi antara Algoritma
yang akan dipilih dengan sumber data yang
akan digunakan
Sistem
3. Memeriksa apakah relasi yang terjadi
sudah sesuai denan ketentuan
6. Skenario Use Case Running Sistem
Adapun scenario Use Case dari Running Sistem adalah sebagai
berikut :
Nama Use Case
: Running Sistem
Actor
: Admin
Tujuan
: Menghasilkan Pohon Keputusan
Deskripsi
: Menjalakan relasi antara algoritma yang telah dipilih
Dengan data sumber untuk menghasilkan pohon keputusa
User
Sistem
1. Memilih icon Run
2.
3.
4.
Memeriksa data nilai dan mengeksekusi
Algoritma C4.5
Membentuk pohon keputusan
Membentuk Rule berdasarkan pohon
keputusan
3.4.2 Activity Diagram
Activity diagram memodelkan alur kerja sebuah urutan aktivitas pada
Suatu proses. Activity diagram pada system ini, bias dilihat pada gambar 3.5
dibawah ini :
Admin
Sistem
Klik New
Tampilkan Halaman Proses
zKlik Tombol Menu Import
Data
Tampilkan Halaman Open
Dialog Dtaa
Mencari Lokasi Data
Mengelompokkan Data
Pemilihan Atribut
Klik Tombol Finish
Menampilkan Halaman Proses
Memasukkan Data
Memasukkan Algoritmas
Pemilihan Parameter
Klik Start
Menampilkan Dialog Save
Menampilkan Halaman
Decision Tree
Gambar 3.5 Activity Diagram Sistem
3.4.3 Perancangan Sistem
Tahap perancangan berikutnya yaitu desain system secara detail yang
meliputi desain input system, dan desain database. Berikut ini adalah rancangan
input sebagai antarmuka pengguna :
1. Rancangan Form Menu Utama
Rancangan form yang disajikan oleh system untuk melakukan menampilkan
seluruh menu yang ada, ditunjukkan pada gambar 3.6 :
File | Edit | Process | Tools | Views | Help
Gambar 3.6 Desain Form Menu Utama
2. Rancangan Form Menu Utama
Rancangan form yang disajikan oleh system untuk melakukan prosess
yang ditunjukkan pada gambar 3.7 :
File | Edit | Process | Tools | Views | Help
Operator
Process Window
Properties
Repositories
Gambar 3.7 Rancangan Form Pengaturan Data Kriteria