4.2.2 Hasil Preprocessing dengan Handle missing value as category
4.2.2.1 DecisionTree
Model preprocessing dengan grafik dari software rapidminer yang akan digunakan dapat dilihat pada gambar 4.1
Gambar 4.1 Model Preprocessingnya Handle missing value as category dengan implementasi decision tree
Dari Gambar 4.1 dapat dihasilkan pohon seperti pada Gambar 4.2, dimana bahwa wage_inc_1st memiliki pengaruh paling besar dalam data penelitian tesis
ini, setelah dilakukan percobaan dengan menggunakan rapidminer bahwa variabel wage_inc_1st berada pada node paling atas, kemudian dibandingkan dengan rata-
rata nilai dari wage_in_1st untuk mendapatkan statutory_holiday dan working_hours.
Gambar 4.2 Hasil decision tree
Universitas Sumatera Utara
Jika rule grafik diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.2.
Tabel 4.2. Keterangan Rule Grafik Decision Tree
Rule Keterangan Rule
Predikat Bad
Good
1 Wage-inc-1st 2.650
Statutory-holidays 10.500 : good statutory-holidays
≤ 10.500 22
2 wage-inc-1st 4.250: good
wage-inc-1st ≤ 4.250: bad
4 3
3 wage-inc-1st
≤ 2.650 working-hours 36: bad
working-hours ≤ 36: good
9 1
1
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.3.
wage-inc-1st 2.650 | statutory-holidays 10.500: good {bad=0, good=22}
| statutory-holidays ≤ 10.500
| | wage-inc-1st 4.250: good {bad=0, good=3} | | wage-inc-1st
≤ 4.250: bad {bad=4, good=0} wage-inc-1st
≤ 2.650 | working-hours 36: bad {bad=9, good=0}
| working-hours ≤ 36: good {bad=1, good=1}
Gambar 4.3 Rule decision tree dengan implementasi handle missing value as category
4.2.2.2 Random Tree
Model preprocessing dengan grafik dari software rapidminer yang akan digunakan dapat dilihat pada gambar 4.4.
Universitas Sumatera Utara
Gambar 4.4 Model Preprocessingnya Handle missing value as category dengan implementasi random tree
Gambar 4.5 memperlihatkan bahwa dengan random tree pension memiliki pengaruh paling besar dalam data penelitian tesis ini, setelah dilakukan percobaan
dengan menggunakan rapidminer bahwa variabel pension berada pada node paling atas, untuk mendapatkan wage_ind_2nd dan statutory_holiday.
Gambar 4.5 Hasil random tree implementasi handle missing value as category
Universitas Sumatera Utara
Jika rule grafik Gambar 4.5 diterjemahkan kedalam rule bahasa sederhana dapat dilihat pada Tabel 4.3.
Tabel 4.3. Keterangan Rule Grafik Random Tree
Rule Keterangan Rule
Predikat Bad
Good
1 pension = empl_contr
wage-inc-2nd 3.207: good wage-inc-2nd
≤ 3.207: bad 1
2 4
2 pension = missing
statutory-holidays 10.500: good statutory-holidays
≤ 10.500 vacation = below-average: bad
vacation = generous: good 1
18
1 2
3 pension = none: bad
pension = ret_allw: bad 8
2 1
Untuk lebih jelasnya dapat dilihat pada model aturan berbentuk teks seperti pada Gambar 4.6.
pension = empl_contr | wage-inc-2nd 3.207: good {bad=1, good=4}
| wage-inc-2nd ≤ 3.207: bad {bad=2, good=0}
pension = missing | statutory-holidays 10.500: good {bad=0, good=18}
| statutory-holidays ≤ 10.500
| | vacation = below-average: bad {bad=1, good=1} | | vacation = generous: good {bad=0, good=2}
pension = none: bad {bad=8, good=0} pension = ret_allw: bad {bad=2, good=1}
Gambar 4.6 Rule random tree dengan implementasi handle missing value as category
Universitas Sumatera Utara
4.2.2.3 Random Forest