Random Forest Hasil Preprocessing dengan Handle missing value as category

4.2.2.3 Random Forest

Model preprocessing dengan grafik dari software rapidminer yang akan digunakan dapat dilihat pada gambar 4.7. Gambar 4.7 Model Preprocessingnya Handle missing value as category dengan implementasi random forest Model preprocessing ini memperlihatkan bahwa dengan random forest ada 10 sepuluh model yang dihasilkan dalam data penelitian tesis ini. Gambar 4.8 Model 1 handle missing value as category dengan implementasi random forest Jika rule grafik Gambar 4.8 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.4. Tabel 4.4. Keterangan Rule Grafik Random Forest Model 1 Rule Keterangan Rule Predikat Bad Good 1 wage-inc-3rd 2.200: good wage-inc-3rd ≤ 2.200: bad 9 3 28 Universitas Sumatera Utara Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.9. wage-inc-3rd 2.200: good {bad=9, good=28} wage-inc-3rd ≤ 2.200: bad {bad=3, good=0} Gambar 4.9 Teks Model 1 Rule random forest dengan implementasi handle missing value as category Model 2 : Gambar 4.10 Model 2 handle missing value as category dengan implementasi random forest Jika rule grafik Gambar 4.10 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.5. Tabel 4.5. Keterangan Rule Grafik Random Forest Model 2 Rule Keterangan Rule Predikat Bad Good 1 standby-pay 5: good standby-pay ≤ 5: bad 7 5 28 Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.11. Universitas Sumatera Utara standby-pay 5: good {bad=7, good=28} standby-pay ≤ 5: bad {bad=5, good=0} Gambar 4.11 Teks Model 2 Rule random forest dengan implementasi handle missing value as category Model 3 : Gambar 4.12 Model 3 handle missing value as category dengan implementasi random forest Jika rule grafik Gambar 4.12 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.6. Universitas Sumatera Utara Tabel 4.6. Keterangan Rule Grafik Random Forest Model 3 Rule Keterangan Rule Predikat Bad Good 1 wage-inc-1st 2.750 working-hours 39 wage-inc-1st 4.250: good wage-inc-1st ≤ 4.250: bad 3 10 2 working-hours ≤ 39: good 19 3 wage-inc-1st ≤ 2.750: bad 8 Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.13. wage-inc-1st 2.750 | working-hours 39 | | wage-inc-1st 4.250: good {bad=0, good=10} | | wage-inc-1st ≤ 4.250: bad {bad=3, good=0} | working-hours ≤ 39: good {bad=0, good=19} wage-inc-1st ≤ 2.750: bad {bad=8, good=0} Gambar 4.13 Teks Model 3 Rule random forest dengan implementasi handle missing value as category Model 4 : Gambar 4.14 Model 4 handle missing value as category dengan implementasi random forest Universitas Sumatera Utara Jika rule grafik Gambar 4.14 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.7. Tabel 4.7. Keterangan Rule Grafik Random Forest Model 4 Rule Keterangan Rule Predikat Bad Good 1 wage-inc-1st 2.900: good wage-inc-1st ≤ 2.900: bad 3 10 26 1 Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.15. wage-inc-1st 2.900: good {bad=3, good=26} wage-inc-1st ≤ 2.900: bad {bad=10, good=1} Gambar 4.15 Teks Model 4 Rule random forest dengan implementasi handle missing value as category Model 5 : Gambar 4.16 Model 5 handle missing value as category dengan implementasi random forest Universitas Sumatera Utara Jika rule grafik Gambar 4.16 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.8. Tabel 4.8. Keterangan Rule Grafik Random Forest Model 5 Rule Keterangan Rule Predikat Bad Good 1 statutory-holidays 10.500: good statutory-holidays ≤ 10.500 2 27 2 shift-differential 4 longterm-disability-assistance = missing: bad longterm-disability-assistance = yes: good 3 1 1 3 shift-differential ≤ 4: bad 6 Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.17. statutory-holidays 10.500: good {bad=2, good=27} statutory-holidays ≤ 10.500 | shift-differential 4 | | longterm-disability-assistance = missing: bad {bad=3, good=0} | | longterm-disability-assistance = yes: good {bad=1, good=1} | shift-differential ≤ 4: bad {bad=6, good=0} Gambar 4.17 Teks Model 5 Rule random forest dengan implementasi handle missing value as category Universitas Sumatera Utara Model 6 : Gambar 4.18 Model 6 handle missing value as category dengan implementasi random forest Jika rule grafik Gambar 4.18 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.9. Tabel 4.9. Keterangan Rule Grafik Random Forest Model 6 Rule Keterangan Rule Predikat Bad Good 1 statutory-holidays 11.500: good statutory-holidays ≤ 11.500 15 2 wage-inc-2nd 3.957: good wage-inc-2nd ≤ 3.957: bad 2 14 8 1 Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.19. Universitas Sumatera Utara statutory-holidays 11.500: good {bad=0, good=15} statutory-holidays ≤ 11.500 | wage-inc-2nd 3.957: good {bad=2, good=8} | wage-inc-2nd ≤ 3.957: bad {bad=14, good=1} Gambar 4.19 Teks Model 6 Rule random forest dengan implementasi handle missing value as category Model 7 : Gambar 4.20 Model 7 handle missing value as category dengan implementasi random forest Jika rule grafik Gambar 4.20 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.10. Universitas Sumatera Utara Tabel 4.10. Keterangan Rule Grafik Random Forest Model 7 Rule Keterangan Rule Predikat Bad Good 1 wage-inc-1st 2.900 statutory-holidays 10.500: good statutory-holidays ≤ 10.500 22 2 working-hours 39: bad working-hours ≤ 39: good 4 2 3 wage-inc-1st ≤ 2.900 statutory-holidays 11.500: good statutory-holidays ≤ 11.500: 10 2 Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.21. wage-inc-1st 2.900 | statutory-holidays 10.500: good {bad=0, good=22} | statutory-holidays ≤ 10.500 | | working-hours 39: bad {bad=4, good=0} | | working-hours ≤ 39: good {bad=0, good=2} wage-inc-1st ≤ 2.900 | statutory-holidays 11.500: good {bad=0, good=2} | statutory-holidays ≤ 11.500: bad {bad=10, good=0} Gambar 4.21 Teks Model 7 Rule random forest dengan implementasi handle missing value as category Universitas Sumatera Utara Model 8 : Gambar 4.22 Model 8 handle missing value as category dengan implementasi random forest Jika rule grafik Gambar 4.22 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.11. Tabel 4.11. Keterangan Rule Grafik Random Forest Model 8 Rule Keterangan Rule Predikat Bad Good 1 statutory-holidays 10.500: good statutory-holidays ≤ 10.500: bad 2 10 27 1 Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.23. statutory-holidays 10.500: good {bad=2, good=27} statutory-holidays ≤ 10.500: bad {bad=10, good=1} Gambar 4.23 Teks Model 8 Rule random forest dengan implementasi handle missing value as category Universitas Sumatera Utara Model 9 : Gambar 4.24 Model 9 handle missing value as category dengan implementasi random forest Jika rule grafik Gambar 4.24 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.12. Tabel 4.12. Keterangan Rule Grafik Random Forest Model 9 Rule Keterangan Rule Predikat Bad Good 1 wage-inc-1st 2.900 statutory-holidays 10.500: good statutory-holidays ≤ 10.500 16 2 wage-inc-1st 4.250: good wage-inc-1st ≤ 4.250: bad 2 5 3 wage-inc-1st ≤ 2.900: bad 17 Universitas Sumatera Utara Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.25. wage-inc-1st 2.900 | statutory-holidays 10.500: good {bad=0, good=16} | statutory-holidays ≤ 10.500 | | wage-inc-1st 4.250: good {bad=0, good=5} | | wage-inc-1st ≤ 4.250: bad {bad=2, good=0} wage-inc-1st ≤ 2.900: bad {bad=17, good=0} Gambar 4.25 Teks Model 9 Rule random forest dengan implementasi handle missing value as category Model 10 : Gambar 4.26 Model 10 handle missing value as category dengan implementasi random forest Universitas Sumatera Utara Jika rule grafik Gambar 4.26 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.13. Tabel 4.13. Keterangan Rule Grafik Random Forest Model 10 Rule Keterangan Rule Predikat Bad Good 1 wage-inc-2nd 2.750 contrib-to-health-plan = full: good contrib-to-health-plan = half 10 2 bereavement-assistance = missing: bad bereavement-assistance = yes: good 1 1 2 3 contrib-to-health-plan = missing: good contrib-to-health-plan = none: bad 1 3 17 4 wage-inc-2nd ≤ 2.750: bad 5 Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.27. wage-inc-2nd 2.750 | contrib-to-health-plan = full: good {bad=0, good=10} | contrib-to-health-plan = half | | bereavement-assistance = missing: bad {bad=1, good=1} | | bereavement-assistance = yes: good {bad=0, good=2} | contrib-to-health-plan = missing: good {bad=1, good=17} | contrib-to-health-plan = none: bad {bad=3, good=0} wage-inc-2nd ≤ 2.750: bad {bad=5, good=0} Gambar 4.27 Teks Model 10 Rule random forest dengan implementasi handle missing value as category Universitas Sumatera Utara

4.2.3 Preprocessing dengan Missing value replenishment