���� , � = −
�
� �=1
�
2
�
bahwa S1 sampai Sc adalah c subset yang dihasilkan dari pemecahan S dengan menggunakan atribut A yang mempunyai sebanyak c nilai. Selanjutnya
rasio perolehan gain ratio dihitung dengan cara :
��� ��� , � =
��� ,� ����
,�
II.5. Algoritma Reduct Based Decision Tree RDT
II.5.1 Pendahuluan
Dalam Algoritma penambangan data Reduct Based Decision Tree RDT terdapat dua langkah penting yaitu Reduct Computation dan pembentukan pohon
keputusan. Reduct Based Decision TreeRDT mengkombinasikan teori himpunan kasar Rough Set dan induksi algoritma pohon keputusan, yang meningkatkan
efisiensi dan sederhana. Datasets dapat diskret ataupun kontinyu.
II.5.2 Reduct Computation dan Pembentukan Pohon Keputusan
Di dalam proses Reduct Computation Algorithm RCA, tabel keputusan diberikan sebagai input dan atribut utama predominant attributes yang disebut
reduct diperoleh sebagai output. Jika data yang digunakan besar, digunakan fragmentasi vertikal. Atribut keputusan ditambahkan ke tiap fragmen dan RCA
dipergunakan. Predominant attributes untuk semua fragmen diperoleh dan dikelompokkan bersama dengan informasi fragmen dan atribut keputusan.
Selanjutnya RCA digunakan lagi. Himpunan baru dari atribut disebut composite reduct. Menurut Ramadevi 2008 langkah-langkah dalam Reduct Computation
Algorithm RCA adalah sebagai berikut. ...............…2.8
...............…2.9
Algoritma RCA input : Tabel Keputusan; output : Reduct: 1.
Baca tabel keputusan T1. Berikut ini
Tabel 2.8 Data Input Tabel Keputusan T1 ID
a b
c d
E X
1
1 2
1 1
X
2
1 2
1
X
3
1 2
2
X
4
1 2
2 1
X
5
2 1
2
X
6
2 1
1 2
X
7
2 1
2 1
1
2. Urutkan baris secara ascending berdasarkan atribut keputusan.
Tabel 2.9 Tabel Keputusan T1 Diurutkan Secara Ascending ID
a b
c d
E X
4
1 2
2 1
X
1
1 2
1 1
X
2
1 2
1
X
7
2 1
2 1
1
X
3
1 2
2
X
5
2 1
2
X
6
2 1
1 2
3. Inisialisasi Himpunan Atribut Predominan HAP sebagai Null.
4. Buatlah Matriks Boolean MB, seperti dijelaskan pada langkah 5,
dengan membuat generate baris untuk setiap pasangan dari baris yang nilai atribut keputusannya berbeda.
5. Buat
baris berisi 1 dan 0. Beri nilai elemennya „1‟ jika dari setiap pasangan baris responden nilai atributnya berbeda, sebaliknya