misalnya flowchart, pseudocode dan bahasa algoritma. Pada penelitian ini, penulisan membuat model analisis terhadap preprocessing data yang
menggunakan aturan pohon keputusan. Terhadap data tersebut dilakukan 2 preproceesing data, yakni dengan
Handle missing value as category dan Missing value replenishment. Hasil preprocessing data diolah kembali dengan pohon keputusan decision tree, random
tree dan random forest.
3.5 Kontribusi Penelitian
Penelitian ini memberikan kontribusi pada pemahaman kita manfaat preprocessing data, dan mengetahui model mana yang paling efisien untuk
diterapakan pada algoritma pohon keputusan. Beberapa kemungkinan lain dianggap penting adalah pimpinan organisasi
dapat menggunakan informasi yang diberikan dalam mengambil beberapa tindakan untuk meningkatkan kualitas relasi tenaga kerja.
Pembuat keputusan bisa menggunakan model prediksi seberapa besar pemberian liburan ataupun jumlah upah dapat mempengaruhi kualitas relasi
tenaga kerja Penelitian ini memperkenalkan model preproceesing data Handle missing value as category dan Missing value replenishment, yang diaplikasikan
pada keputusan decision tree, random tree dan random forest.
Universitas Sumatera Utara
BAB IV HASIL DAN PEMBAHASAN
4.1. Pendahuluan
Bab ini menyajikan hasil penelitian sesuai dengan pertanyaan-pertanyaan yang diajukan pada permulaan. Penelitian dilaksanakan pada satu data set, yaitu Labor
Relations Data Set yang diambil dari dari UCI Machine Learning Repository http:archive.ics.uci.edu. Secara terperinci, data ini terdiri dari 40 record
berisikan persetujuan tenaga kerja pada bisnis dan layanan sektor personal, seperti guru, perawat, staf universitas, polisi, dan sebagainya. Dengan data ini dapat
digunakan untuk proses data mining. Dataset digunakan sebagai inputan preprocessing, dan selanjutnya
digunakan pada aplikasi model aturan algoritma decision tree, random tree dan random forest, menggunakan software rapidminer. Pohon Keputusan digunakan
untuk membuat model aturan yang akan dipilih dalam mengambil keputusan.
4.2 Hasil Percobaan
Adapun hasil percobaan training dan testing data dapat dilihat pada bagian berikut ini.
Universitas Sumatera Utara
4.2.1. Deskripsi Sampel Data
Dalam pengujian data set pada tesis ini yang terdiri dari 40 data dengan rincian sebagai berikut: Tabel 4.1 Deskripsi data
Tipe Nama
Tipe data Deskripsi
Uraian Missing value
label Class
nominal mode = good 26, least = bad 14
bad 14, good 26 regular
Duration integer
avg = 2.103 +- 0.754 [1.000 ; 3.000]
1 regular
wage-inc-1 real
st
avg = 3.621 +- 1.331 [2.000 ; 6.900]
1 regular
wage-inc-2 real
nd
avg = 3.913 +- 1.281 [2.000 ; 7.000]
10 regular
wage-inc-3 real
rd
avg = 3.767 +- 1.415 [2.000 ; 5.100]
28 regular
col-adj nominal
mode = none 14, least = tcf 4 tcf 4, none 14, tc 6
16 regular
working-hours integer
avg = 37.811 +- 2.717 [27.000 ; 40.000]
3 regular
Pension nominal
mode = none 8, least = ret_allw 3 none 8, empl_contr 7, ret_allw 3
22 regular
standby-pay integer
avg = 6.143 +- 4.845 [2.000 ; 13.000]
33 regular
shift-differential integer
avg = 4.583 +- 4.754 [0.000 ; 25.000]
16 regular
education-allowance nominal
mode = no 11, least = yes 7 no 11, yes 7
22 regular
statutory-holidays integer
avg = 11.105 +- 1.371 [9.000 ; 15.000]
2 regular
Vacation nominal
mode = below-average 14, least = average 11 generous 12, below-average 14, average 11
3 regular
longterm-disability-assistance nominal
mode = yes 11, least = no 5 no 5, yes 11
24 regular
contrib-to-dental-plan nominal
mode = half 11, least = none 6 none 6, half 11, full 8
15 regular
bereavement-assistance nominal
mode = yes 18, least = no 2 no 2, yes 18
20 regular
contrib-to-health-plan nominal
mode = full 12, least = none 6 none 6, half 6, full 12
16
21
Universitas Sumatera Utara
4.2.2 Hasil Preprocessing dengan Handle missing value as category
4.2.2.1 DecisionTree
Model preprocessing dengan grafik dari software rapidminer yang akan digunakan dapat dilihat pada gambar 4.1
Gambar 4.1 Model Preprocessingnya Handle missing value as category dengan implementasi decision tree
Dari Gambar 4.1 dapat dihasilkan pohon seperti pada Gambar 4.2, dimana bahwa wage_inc_1st memiliki pengaruh paling besar dalam data penelitian tesis
ini, setelah dilakukan percobaan dengan menggunakan rapidminer bahwa variabel wage_inc_1st berada pada node paling atas, kemudian dibandingkan dengan rata-
rata nilai dari wage_in_1st untuk mendapatkan statutory_holiday dan working_hours.
Gambar 4.2 Hasil decision tree
Universitas Sumatera Utara
Jika rule grafik diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.2.
Tabel 4.2. Keterangan Rule Grafik Decision Tree
Rule Keterangan Rule
Predikat Bad
Good
1 Wage-inc-1st 2.650
Statutory-holidays 10.500 : good statutory-holidays
≤ 10.500 22
2 wage-inc-1st 4.250: good
wage-inc-1st ≤ 4.250: bad
4 3
3 wage-inc-1st
≤ 2.650 working-hours 36: bad
working-hours ≤ 36: good
9 1
1
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.3.
wage-inc-1st 2.650 | statutory-holidays 10.500: good {bad=0, good=22}
| statutory-holidays ≤ 10.500
| | wage-inc-1st 4.250: good {bad=0, good=3} | | wage-inc-1st
≤ 4.250: bad {bad=4, good=0} wage-inc-1st
≤ 2.650 | working-hours 36: bad {bad=9, good=0}
| working-hours ≤ 36: good {bad=1, good=1}
Gambar 4.3 Rule decision tree dengan implementasi handle missing value as category
4.2.2.2 Random Tree
Model preprocessing dengan grafik dari software rapidminer yang akan digunakan dapat dilihat pada gambar 4.4.
Universitas Sumatera Utara
Gambar 4.4 Model Preprocessingnya Handle missing value as category dengan implementasi random tree
Gambar 4.5 memperlihatkan bahwa dengan random tree pension memiliki pengaruh paling besar dalam data penelitian tesis ini, setelah dilakukan percobaan
dengan menggunakan rapidminer bahwa variabel pension berada pada node paling atas, untuk mendapatkan wage_ind_2nd dan statutory_holiday.
Gambar 4.5 Hasil random tree implementasi handle missing value as category
Universitas Sumatera Utara
Jika rule grafik Gambar 4.5 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.3.
Tabel 4.3. Keterangan Rule Grafik Random Tree
Rule Keterangan Rule
Predikat Bad
Good
1 pension = empl_contr
wage-inc-2nd 3.207: good wage-inc-2nd
≤ 3.207: bad 1
2 4
2 pension = missing
statutory-holidays 10.500: good statutory-holidays
≤ 10.500 vacation = below-average: bad
vacation = generous: good 1
18
1 2
3 pension = none: bad
pension = ret_allw: bad 8
2 1
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.6.
pension = empl_contr | wage-inc-2nd 3.207: good {bad=1, good=4}
| wage-inc-2nd ≤ 3.207: bad {bad=2, good=0}
pension = missing | statutory-holidays 10.500: good {bad=0, good=18}
| statutory-holidays ≤ 10.500
| | vacation = below-average: bad {bad=1, good=1} | | vacation = generous: good {bad=0, good=2}
pension = none: bad {bad=8, good=0} pension = ret_allw: bad {bad=2, good=1}
Gambar 4.6 Rule random tree dengan implementasi handle missing value as category
Universitas Sumatera Utara
4.2.2.3 Random Forest
Model preprocessing dengan grafik dari software rapidminer yang akan digunakan dapat dilihat pada gambar 4.7.
Gambar 4.7 Model Preprocessingnya Handle missing value as category dengan implementasi random forest
Model preprocessing ini memperlihatkan bahwa dengan random forest ada 10 sepuluh model yang dihasilkan dalam data penelitian tesis ini.
Gambar 4.8 Model 1 handle missing value as category dengan implementasi random forest
Jika rule grafik Gambar 4.8 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.4.
Tabel 4.4. Keterangan Rule Grafik Random Forest Model 1 Rule
Keterangan Rule Predikat
Bad Good
1 wage-inc-3rd 2.200: good
wage-inc-3rd ≤ 2.200: bad
9 3
28
Universitas Sumatera Utara
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.9.
wage-inc-3rd 2.200: good {bad=9, good=28} wage-inc-3rd
≤ 2.200: bad {bad=3, good=0}
Gambar 4.9 Teks Model 1 Rule random forest dengan implementasi handle missing value as category
Model 2 :
Gambar 4.10 Model 2 handle missing value as category dengan implementasi random forest
Jika rule grafik Gambar 4.10 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.5.
Tabel 4.5. Keterangan Rule Grafik Random Forest Model 2 Rule
Keterangan Rule Predikat
Bad Good
1 standby-pay 5: good
standby-pay ≤ 5: bad
7 5
28
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.11.
Universitas Sumatera Utara
standby-pay 5: good {bad=7, good=28} standby-pay
≤ 5: bad {bad=5, good=0}
Gambar 4.11 Teks Model 2 Rule random forest dengan implementasi handle missing value as category
Model 3 :
Gambar 4.12 Model 3 handle missing value as category dengan implementasi random forest
Jika rule grafik Gambar 4.12 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.6.
Universitas Sumatera Utara
Tabel 4.6. Keterangan Rule Grafik Random Forest Model 3 Rule
Keterangan Rule Predikat
Bad Good
1 wage-inc-1st 2.750
working-hours 39 wage-inc-1st 4.250: good
wage-inc-1st ≤ 4.250: bad
3 10
2 working-hours
≤ 39: good 19
3 wage-inc-1st
≤ 2.750: bad 8
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.13.
wage-inc-1st 2.750 | working-hours 39
| | wage-inc-1st 4.250: good {bad=0, good=10} | | wage-inc-1st
≤ 4.250: bad {bad=3, good=0} | working-hours
≤ 39: good {bad=0, good=19} wage-inc-1st
≤ 2.750: bad {bad=8, good=0}
Gambar 4.13 Teks Model 3 Rule random forest dengan implementasi handle missing value as category
Model 4 :
Gambar 4.14 Model 4 handle missing value as category dengan implementasi random forest
Universitas Sumatera Utara
Jika rule grafik Gambar 4.14 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.7.
Tabel 4.7. Keterangan Rule Grafik Random Forest Model 4 Rule
Keterangan Rule Predikat
Bad Good
1 wage-inc-1st 2.900: good
wage-inc-1st ≤ 2.900: bad
3 10
26 1
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.15.
wage-inc-1st 2.900: good {bad=3, good=26} wage-inc-1st
≤ 2.900: bad {bad=10, good=1}
Gambar 4.15 Teks Model 4 Rule random forest dengan implementasi handle missing value as category
Model 5 :
Gambar 4.16 Model 5 handle missing value as category dengan implementasi random forest
Universitas Sumatera Utara
Jika rule grafik Gambar 4.16 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.8.
Tabel 4.8. Keterangan Rule Grafik Random Forest Model 5
Rule Keterangan Rule
Predikat Bad
Good 1
statutory-holidays 10.500: good statutory-holidays
≤ 10.500 2
27
2 shift-differential 4
longterm-disability-assistance = missing: bad
longterm-disability-assistance = yes: good 3
1 1
3 shift-differential
≤ 4: bad 6
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.17.
statutory-holidays 10.500: good {bad=2, good=27} statutory-holidays
≤ 10.500 | shift-differential 4
| | longterm-disability-assistance = missing: bad {bad=3, good=0} | | longterm-disability-assistance = yes: good {bad=1, good=1}
| shift-differential ≤ 4: bad {bad=6, good=0}
Gambar 4.17 Teks Model 5 Rule random forest dengan implementasi handle missing value as category
Universitas Sumatera Utara
Model 6 :
Gambar 4.18 Model 6 handle missing value as category dengan implementasi random forest
Jika rule grafik Gambar 4.18 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.9.
Tabel 4.9. Keterangan Rule Grafik Random Forest Model 6
Rule Keterangan Rule
Predikat Bad
Good 1
statutory-holidays 11.500: good statutory-holidays
≤ 11.500 15
2 wage-inc-2nd 3.957: good
wage-inc-2nd ≤ 3.957: bad
2 14
8 1
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.19.
Universitas Sumatera Utara
statutory-holidays 11.500: good {bad=0, good=15} statutory-holidays
≤ 11.500 | wage-inc-2nd 3.957: good {bad=2, good=8}
| wage-inc-2nd ≤ 3.957: bad {bad=14, good=1}
Gambar 4.19 Teks Model 6 Rule random forest dengan implementasi handle missing value as category
Model 7 :
Gambar 4.20 Model 7 handle missing value as category dengan implementasi random forest
Jika rule grafik Gambar 4.20 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.10.
Universitas Sumatera Utara
Tabel 4.10. Keterangan Rule Grafik Random Forest Model 7
Rule Keterangan Rule
Predikat Bad
Good
1 wage-inc-1st 2.900
statutory-holidays 10.500: good statutory-holidays
≤ 10.500 22
2 working-hours 39: bad
working-hours ≤ 39: good
4 2
3 wage-inc-1st
≤ 2.900 statutory-holidays 11.500: good
statutory-holidays ≤ 11.500:
10 2
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.21.
wage-inc-1st 2.900 | statutory-holidays 10.500: good {bad=0, good=22}
| statutory-holidays ≤ 10.500
| | working-hours 39: bad {bad=4, good=0} | | working-hours
≤ 39: good {bad=0, good=2} wage-inc-1st
≤ 2.900 | statutory-holidays 11.500: good {bad=0, good=2}
| statutory-holidays ≤ 11.500: bad {bad=10, good=0}
Gambar 4.21 Teks Model 7 Rule random forest dengan implementasi handle missing value as category
Universitas Sumatera Utara
Model 8 :
Gambar 4.22 Model 8 handle missing value as category dengan implementasi random forest
Jika rule grafik Gambar 4.22 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.11.
Tabel 4.11. Keterangan Rule Grafik Random Forest Model 8
Rule Keterangan Rule
Predikat Bad
Good 1
statutory-holidays 10.500: good statutory-holidays
≤ 10.500: bad 2
10 27
1 Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks
seperti pada Gambar 4.23.
statutory-holidays 10.500: good {bad=2, good=27} statutory-holidays
≤ 10.500: bad {bad=10, good=1}
Gambar 4.23 Teks Model 8 Rule random forest dengan implementasi handle missing value as category
Universitas Sumatera Utara
Model 9 :
Gambar 4.24 Model 9 handle missing value as category dengan implementasi random forest
Jika rule grafik Gambar 4.24 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.12.
Tabel 4.12. Keterangan Rule Grafik Random Forest Model 9
Rule Keterangan Rule
Predikat Bad
Good
1 wage-inc-1st 2.900
statutory-holidays 10.500: good statutory-holidays
≤ 10.500 16
2 wage-inc-1st 4.250: good
wage-inc-1st ≤ 4.250: bad
2 5
3 wage-inc-1st
≤ 2.900: bad 17
Universitas Sumatera Utara
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.25.
wage-inc-1st 2.900 | statutory-holidays 10.500: good {bad=0, good=16}
| statutory-holidays
≤ 10.500 | | wage-inc-1st 4.250: good {bad=0, good=5}
| | wage-inc-1st ≤ 4.250: bad {bad=2, good=0}
wage-inc-1st ≤ 2.900: bad {bad=17, good=0}
Gambar 4.25 Teks Model 9 Rule random forest dengan implementasi handle missing value as category
Model 10 :
Gambar 4.26 Model 10 handle missing value as category dengan implementasi random forest
Universitas Sumatera Utara
Jika rule grafik Gambar 4.26 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.13.
Tabel 4.13. Keterangan Rule Grafik Random Forest Model 10
Rule Keterangan Rule
Predikat Bad
Good
1 wage-inc-2nd 2.750
contrib-to-health-plan = full: good contrib-to-health-plan = half
10
2 bereavement-assistance = missing: bad
bereavement-assistance = yes: good 1
1 2
3 contrib-to-health-plan = missing: good
contrib-to-health-plan = none: bad 1
3 17
4 wage-inc-2nd
≤ 2.750: bad 5
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.27.
wage-inc-2nd 2.750 | contrib-to-health-plan = full: good {bad=0, good=10}
| contrib-to-health-plan = half | | bereavement-assistance = missing: bad {bad=1, good=1}
| | bereavement-assistance = yes: good {bad=0, good=2} | contrib-to-health-plan = missing: good {bad=1, good=17}
| contrib-to-health-plan = none: bad {bad=3, good=0} wage-inc-2nd
≤ 2.750: bad {bad=5, good=0}
Gambar 4.27 Teks Model 10 Rule random forest dengan implementasi handle missing value as category
Universitas Sumatera Utara
4.2.3 Preprocessing dengan Missing value replenishment
4.2.3.1 DecisionTree
Model preprocessing dengan grafik dari software rapidminer yang akan digunakan dapat dilihat pada gambar 4.28
Gambar 4.28 Model Preprocessingnya Missing value replenishment dengan implementasi decision tree
Dari Gambar 4.28 dapat dihasilkan pohon seperti pada Gambar 4.30, dimana bahwa longterm_dissability_assistance memiliki pengaruh paling besar
dalam wage_inc_2nd berada pada node paling atas.
Gambar 4.29 Hasil decision tree implementasi Missing value replenishment
Universitas Sumatera Utara
Jika rule grafik Gambar 4.29 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.14.
Tabel 4.14. Keterangan Rule Grafik Decision Tree
Rule Keterangan Rule
Predikat Bad
Good 1
longterm-disability-assistance = no: bad longterm-disability-assistance = yes
5
2 wage-inc-2nd 2.250
wage-inc-1st 2.900: good wage-inc-1st
≤ 2.900 23
3 statutory-holidays 11.500: good
statutory-holidays ≤ 11.500
2
4 statutory-holidays 10.500: good
statutory-holidays ≤ 10.500: bad
1 5
1
5 wage-inc-2nd
≤ 2.250: bad 3
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.30.
longterm-disability-assistance = no: bad {bad=5, good=0} longterm-disability-assistance = yes
| wage-inc-2nd 2.250 | | wage-inc-1st 2.900: good {bad=0, good=23}
| | wage-inc-1st
≤ 2.900 | | | statutory-holidays 11.500: good {bad=0, good=2}
| | | statutory-holidays ≤ 11.500
| | | | statutory-holidays 10.500: good {bad=1, good=1} | | | | statutory-holidays
≤ 10.500: bad {bad=5, good=0} | wage-inc-2nd
≤ 2.250: bad {bad=3, good=0}
Gambar 4.30 Rule decision tree dengan implementasi Missing value replenishment
Universitas Sumatera Utara
4.2.3.2 Random Tree
Model preprocessing dengan grafik dari software rapidminer yang akan digunakan dapat dilihat pada gambar 4.31.
Gambar 4.31. Model Preprocessingnya Missing value replenishment dengan implementasi random tree
Gambar 4.32 memperlihatkan bahwa dengan random tree
longterm_dissability_assistance juga memiliki pengaruh paling besar dalam menentukan hasil wage_ind_3nd.
Gambar 4.32 Hasil random tree implementasi Missing value replenishment
Universitas Sumatera Utara
Jika rule grafik Gambar 4.32 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.15.
Tabel 4.15. Keterangan Rule Grafik Random Tree
Rule Keterangan Rule
Predikat Bad
Good 1
longterm-disability-assistance = no: bad longterm-disability-assistance = yes
5
2
wage-inc-3rd 2.150 contrib-to-health-plan = full: good
contrib-to-health-plan = half: good contrib-to-health-plan = none: bad
5
2 21
5
3
wage-inc-3rd ≤ 2.150: bad
2
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.33.
longterm-disability-assistance = no: bad {bad=5, good=0} longterm-disability-assistance = yes
| wage-inc-3rd 2.150 | | contrib-to-health-plan = full: good {bad=5, good=21}
| | contrib-to-health-plan = half: good {bad=0, good=5} | | contrib-to-health-plan = none: bad {bad=2, good=0}
| wage-inc-3rd
≤ 2.150: bad {bad=2, good=0}
Gambar 4.33 Rule random tree dengan implementasi Missing value replenishment
Universitas Sumatera Utara
4.2.3.3 Random Forest
Model preprocessing dengan grafik dari software rapidminer yang akan digunakan dapat dilihat pada gambar 4.34.
Gambar 4.34. Model Preprocessingnya Missing value replenishment dengan implementasi random tree
Model preprocessing ini memperlihatkan bahwa dengan random forest ada 10 sepuluh model yang dihasilkan dengan implementasi Missing value
replenishment. Model 1 :
Gambar 4.35 Model 1 Missing value replenishment dengan implementasi random forest
Universitas Sumatera Utara
Jika rule grafik Gambar 4.35 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.16.
Tabel 4.16. Keterangan Rule Grafik Random Forest Model 1 Rule
Keterangan Rule Predikat
Bad Good
1
bereavement-assistance = no: bad bereavement-assistance = yes: good
2 10
28
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.36.
bereavement-assistance = no: bad {bad=2, good=0} bereavement-assistance = yes: good {bad=10, good=28}
Gambar 4.36 Teks Model 1 Rule random forest dengan implementasi Missing value replenishment
Model 2 :
Gambar 4.37 Model 2 Missing value replenishment dengan implementasi random forest
Universitas Sumatera Utara
Jika rule grafik Gambar 4.37 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.17.
Tabel 4.17. Keterangan Rule Grafik Random Forest Model 2
Rule Keterangan Rule
Predikat Bad
Good 1
bereavement-assistance = no: bad bereavement-assistance = yes
2
2 contrib-to-health-plan = full: good
contrib-to-health-plan = half: good contrib-to-health-plan = none: bad
5 1
4 25
3
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.38.
bereavement-assistance = no: bad {bad=2, good=0} bereavement-assistance = yes
| contrib-to-health-plan = full: good {bad=5, good=25} | contrib-to-health-plan = half: good {bad=1, good=3}
| contrib-to-health-plan = none: bad {bad=4, good=0}
Gambar 4.38 Teks Model 2 Rule random forest dengan implementasi Missing value replenishment
Universitas Sumatera Utara
Model 3 :
Gambar 4.39 Model 3 Missing value replenishment dengan implementasi random forest
Jika rule grafik Gambar 4.39 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.18.
Tabel 4.18. Keterangan Rule Grafik Random Forest Model 3
Rule Keterangan Rule
Predikat Bad
Good
1 wage-inc-2nd 3.207
duration 1.500: good duration
≤ 1.500 2
23
2 col-adj = none: good
col-adj = tc: bad 1
3 3
3 wage-inc-2nd
≤ 3.207: bad 8
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.40.
Universitas Sumatera Utara
wage-inc-2nd 3.207 | duration 1.500: good {bad=2, good=23}
| duration ≤ 1.500
| | col-adj = none: good {bad=1, good=3} | | col-adj = tc: bad {bad=3, good=0}
wage-inc-2nd ≤ 3.207: bad {bad=8, good=0}
Gambar 4.40 Teks Model 3 Rule random forest dengan implementasi Missing value replenishment
Model 4 :
Gambar 4.41 Model 4 Missing value replenishment dengan implementasi random forest
Jika rule grafik Gambar 4.41 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.19.
Tabel 4.19. Keterangan Rule Grafik Random Forest Model 4 Rule
Keterangan Rule Predikat
Bad Good
1 longterm-disability-assistance = no: bad
longterm-disability-assistance = yes 5
2 wage-inc-1st 2.900: good
wage-inc-1st ≤ 2.900: bad
1 7
25 2
Universitas Sumatera Utara
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.42.
longterm-disability-assistance = no: bad {bad=5, good=0} longterm-disability-assistance = yes
| wage-inc-1st 2.900: good {bad=1, good=25} | wage-inc-1st
≤ 2.900: bad {bad=7, good=2}
Gambar 4.42 Teks Model 4 Rule random forest dengan implementasi Missing value replenishment
Model 5 :
Gambar 4.43 Model 5 Missing value replenishment dengan implementasi random forest
Jika rule grafik Gambar 4.43 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.20.
Universitas Sumatera Utara
Tabel 4.20. Keterangan Rule Grafik Random Forest Model 5 Rule
Keterangan Rule Predikat
Bad Good
1
wage-inc-3rd 2.200 contrib-to-health-plan = full: good
contrib-to-health-plan = half: good contrib-to-health-plan = none: bad
3
6 20
8
2
wage-inc-3rd ≤ 2.200: bad
3
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.44.
wage-inc-3rd 2.200 | contrib-to-health-plan = full: good {bad=3, good=20}
| contrib-to-health-plan = half: good {bad=0, good=8} | contrib-to-health-plan = none: bad {bad=6, good=0}
wage-inc-3rd
≤ 2.200: bad {bad=3, good=0}
Gambar 4.44 Teks Model 5 Rule random forest dengan implementasi Missing value replenishment
Model 6 :
Gambar 4.45 Model 6 Missing value replenishment dengan implementasi random forest
Universitas Sumatera Utara
Jika rule grafik Gambar 4.45 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.21.
Tabel 4.21. Keterangan Rule Grafik Random Forest Model 6
Rule Keterangan Rule
Predikat Bad
Good
1 wage-inc-1st 2.650
wage-inc-1st 3.250: good wage-inc-1st
≤ 3.250 22
2 statutory-holidays 11: good
statutory-holidays ≤ 11: bad
2 2
3 wage-inc-1st
≤ 2.650: bad 14
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.46.
wage-inc-1st 2.650 | wage-inc-1st 3.250: good {bad=0, good=22}
| wage-inc-1st ≤ 3.250
| | statutory-holidays 11: good {bad=0, good=2} | | statutory-holidays
≤ 11: bad {bad=2, good=0} wage-inc-1st
≤ 2.650: bad {bad=14, good=0}
Gambar 4.46 Teks Model 6 Rule random forest dengan implementasi Missing value replenishment
Universitas Sumatera Utara
Model 7:
Gambar 4.47 Model 7 Missing value replenishment dengan implementasi random forest
Jika rule grafik Gambar 4.47 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.22.
Tabel 4.22. Keterangan Rule Grafik Random Forest Model 7 Rule
Keterangan Rule Predikat
Bad Good
1 standby-pay 5
wage-inc-2nd 2.250: good wage-inc-2nd
≤ 2.250: bad 3
3 30
2 standby-pay
≤ 5: bad {bad=4, good=0} 4
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.48.
standby-pay 5 | wage-inc-2nd 2.250: good {bad=3, good=30}
| wage-inc-2nd ≤ 2.250: bad {bad=3, good=0}
standby-pay ≤ 5: bad {bad=4, good=0}
Gambar 4.48 Teks Model 7 Rule random forest dengan implementasi Missing value replenishment
Universitas Sumatera Utara
Model 8 :
Gambar 4.49 Model 8 Missing value replenishment dengan implementasi random forest
Jika rule grafik Gambar 4.49 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.23.
Tabel 4.23. Keterangan Rule Grafik Random Forest Model 8
Rule Keterangan Rule
Predikat Bad
Good
1
wage-inc-2nd 2.750 bereavement-assistance = no: bad
bereavement-assistance = yes: good
2 4
24 2
wage-inc-2nd ≤ 2.750: bad {bad=9, good=1}
9 1
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.50.
Universitas Sumatera Utara
wage-inc-2nd 2.750 | bereavement-assistance = no: bad {bad=2, good=0}
| bereavement-assistance = yes: good {bad=4, good=24} wage-inc-2nd
≤ 2.750: bad {bad=9, good=1}
Gambar 4.50 Teks Model 8 Rule random forest dengan implementasi Missing value replenishment
Model 9 :
Gambar 4.51 Model 9 Missing value replenishment dengan implementasi random forest
Jika rule grafik Gambar 4.51 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.24.
Tabel 4.24. Keterangan Rule Grafik Random Forest Model 9
Rule Keterangan Rule
Predikat Bad
Good 1
wage-inc-1st 2.900: good wage-inc-1st
≤ 2.900: bad 2
14 24
Universitas Sumatera Utara
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.52.
wage-inc-1st 2.900: good {bad=2, good=24} wage-inc-1st
≤ 2.900: bad {bad=14, good=0}
Gambar 4.52 Teks Model 9 Rule random forest dengan implementasi Missing value replenishment
Model 10 :
Gambar 4.53 Model 10 Missing value replenishment dengan implementasi random forest
Jika rule grafik Gambar 4.53 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.25.
Universitas Sumatera Utara
Tabel 4.25. Keterangan Rule Grafik Random Forest Model 10
Rule Keterangan Rule
Predikat Bad
Good 1
wage-inc-1st 2.650: good wage-inc-1st
≤ 2.650 2
31
2 statutory-holidays 11.500: good
statutory-holidays ≤ 11.500: bad
5 2
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.54.
wage-inc-1st 2.650: good {bad=2, good=31} wage-inc-1st
≤ 2.650 | statutory-holidays 11.500: good {bad=0, good=2}
| statutory-holidays ≤ 11.500: bad {bad=5, good=0}
Gambar 4.54 Teks Model 10 Rule random forest dengan implementasi Missing value replenishment
Universitas Sumatera Utara
BAB V KESIMPULAN DAN SARAN
5.1. Kesimpulan
Tesis ini menghasilkan beberapa kesimpulan sebagai berikut : 1.
Dengan menerapkan model preprocessing data Handle missing value as category dan Missing value replenisment data hasil pre-processing
dapat diaplikasikan pada pohon keputusan Decision tree, random tree dan Random Forest.
2. Diperoleh suatu model aturan yang dapat memperlihatkan aturan
keterhubungan antara wage_inc_1st dengan staturoty holidays dan working hours
3. Dalam studi kasus labour realtion ditemukan bahwa jika statutrory
holidays akan diberikan jika wage_inc_1st lebih besar dari 2.0. 4.
Preprocessing ternyata memberi efek pada efisiensi implementasi pohon keputusan.
.
5.2 Saran