Dari Gambar 2.3 didapat production rule sebagai berikut Rule 1 If Bulges are none then plane is C5A
Rule 2 If Bulges are aft of wings then plane is C141 Rule 3 If bulges are aft of cockpit then plane is B747
Rule 4 If bulges are under wing then plane is C130 Dari production rule yang didapat diatas didapat bahwa atribut yang paling
penting adalah bulges, karena dengan satu atribut saja sudah bisa untuk mengidentifikasi pesawat terbang yang ada. Apabila situasi yang terjadi adalah
deterministik ini tidak akan menjadi maslah, tetapi apabila pengamat tidak bisa menentukan dengan pasti bulges dari pesawat karena cuaca yang buruk atau
karena sesuatu hal maka atribut yang lain akan sangat diperlukan.
2.20 Algoritma ID3 untuk Membuat Rule
Untuk menjelaskan algoritma ini akan dibuat sebuah skenario tentang investasi. Jenis investasi yang dijadikan contoh dibatasi pada :
Investasi pada blue chip stock Investasi pada North American gold mining
Investasi pada mortgage-related securities
Tujuan kita adalah untuk memastikan dengan waktu dan kondisi yang diberikan investasi mana yang akan memberikan keuntungan yang terbesar. Untuk itu akan
dibuat klasifikasi nilai mutual fund yang diharapkan kedalam tiga klas yaitu high, medium atau low.
Sedangkan dari ketiga tipe mutual fund adalah sebagai berikut : Suku bunga
Jumlah uang yang beredar di Jepang, Eropa Barat dan Amerika Serikat Derajat gangguan internasional seperti prospek operasi militer, terorisme dan
lainnya Dari atribut yang ada kemudian kita membaca data historis yang ada dalam
Tabel 2.2 dibawah ini. Tabel 2.2 Faktor-faktor yang mempengaruhi nilai
Mutual Fund Type Interest
Rate Cash
Available Tension
Fund Value Class
Blue Chip High
High Medium
Medium Blue Chip
Low High
Medium High
Blue Chip Medium
Low High
Low Gold Stock
High High
Medium High
Lanjutan Tabel 2.2
Mutual Fund Type Interest
Rate Cash
Available Tension
Fund Value Class
Gold Stock Low
High Medium
Medium Gold Stock
Medium Low
High Medium
Mortgage High
High Medium
Low Mortgage
Low High
Medium High
Mortgage Medium
Low High
Low
Langkah selanjutnya adalah membuat decision tree untuk data-data diatas, langkah yang akan kita pakai menggunakan pendekatan yang lebih sistematik
berdasarkan hitungan dari entropi untuk setiap atribut, dimana atribut yang akan dijadikan root node adalah atribut yang mempunyai entropi terendah.
Persamaan 3.1 yang digunakan untuk menghitung entropi sari atribut A
k
adalah sebagai berikut :
3.1
Dimana, HC|A
k
= Entropi dari atribut A
k
Pa
k,j
= Probabilitas atribut a mempunyai nilai j Pc
i
|a
k,j
= Probabilitas nilai klas adalah c
i
ketika atribut k bernilai j M
k
= Total jumlah nilai yang digunakan untuk atribut A
k
N = Total jumlah klas yang berbeda i =1,2,3…….N
K = Total jumlah atribut yang ada k=1,2,3……..N
Dari data dalam Tabel 2.2 didapat nilai-nilai berikut: Terdapat 4 atribut yaitu fund type, interest rate, cash, dan tension maka K=4
Terdapat 3 klas yaitu nilai untuk fund value high, medium atau low maka N=3 Terdapat 3 nilai untuk atribut mutual fund type high, medium atau low maka
M
1
=3 Terdapat 3 nilai untuk atribut interest rate high, medium atau low maka M
2
=3 Terdapat 2 nilai untuk atribut cash high atau low maka M
3
=2 Terdapat 2 nilai untuk atribut tention high atau medium maka M
4
=2 Setelah diperoleh nilai-nilai tersebut diatas maka kita akan menghitung entropi untu
setipa atribut. Sebagai contoh akan dihitung entropi untuk atribut cash Pa
3,1
= Probabilitas cash mempunyai nilai high = 69 Pa
3,2
= Probabilitas cash mempunyai nilai low = 39
Pc
1
|a
3,1
= Probabilitas fund value bernilai high ketika cash bernilai high = 36 Pc
2
|a
3,1
= Probabilitas fund value bernilai medium ketika cash bernilai high = 26 Pc
3
|a
3,1
= Probabilitas fund value bernilai low ketika cash bernilai high = 16 Pc
1
|a
3,2
= Probabilitas fund value bernilai high ketika cash bernilai low = 03 Pc
2
|a
3,2
= Probabilitas fund value bernilai medium ketika cash bernilai low = 13 Pc
3
|a
3,2
= Probabilitas fund value bernilai low ketika cash bernilai low = 23 Nilai-nilai diatas kita subtitusikan kedalam persamaan entropi, maka didapat nilai-
nilai sebagai berikut :
dengan cara yang sama akan didapat entropi untuk atribut yang lainnya
int
|
erest C
H
1,140333
|
tension C
H
1,2787
|
type fund
mutual C
H
1,140333 Dari hitungan terdapat dua atribut yang mempunyai nilai terendah yang sama,
maka kita dapat memilihnya salah satu. Sebagai contoh kita memilih interest untuk dijadikan root node. Setelah kita mendapatkan atribut interest untuk dijadikan root
node maka langkah selanjutnya adalah membagi Tabel 2.2 berdasarkan pada nilai atribut interest. Ini akan menghasilkan tiga subtabel satu untuk nilai interest=high,
satu untuk nilai interest=medium dan satu untuk nilai interest=low. Subtabel untuk nilai interest=high dapat dilihat pada Tabel 2.3.
Tabel 2.3 Subtabel untuk nilai interest=high
Mutual Fund Cash
Tension Fund Value
Blue Chip High
Medium Medium
Gold Stock High
Medium High
Mortgage-related High
Medium Low
Setelah itu kita menghitung lagi untuk setiap atribut yang ada, dari perhitungan yang sudah dilakukan didapat bahwa atribut mutual fund type mempunyai nilai yang
terendah. Setelah itu kita akan membuat percabangan berdasarkan pada mutual fund-type. Hasil yang didapat dapat dilihat pada Gambar 2.4.
Gambar 2.4 Percabangan berdasarkan pada mutual fund-type Dari Gambar 2.4 Didapat rule-rule sebagai berikut
Rule 1 If interest rate are high and the fund type is blue chip then the value will be
minimum Rule 2 If interest rate are high and the fund type is gold stock then the value will be
high Rule 3 If interest rate are high and the fund type is mortgage-related then te value
will be low Rule 4 If interest rate are medium and the fund type is blue chip then the value will
be low Rule 5 If interest rate are medium and fund type is gold stock then the value will be
medium Rule 6 If interest rate are medium and the fund type is mortgage-related then tte
value will low Rule 7 If interest rate are low and the fund type is blue chip then the value will be
high Rule 8 If interest rate are low and the fund type is gold stock then the value will be
medium Rule 9 If interest rate are low and the fund type is mortgage-related then te value will
be high Kita juga bisa menggabung dari rule-rule yang ada. Sebagai contoh rule 5 dan rule 8
bisa digabung menjadi, Rule 58 If fund type are gold stocks and interest rate are medium or interest rate are
low then the value will be medium.
Ada beberapa catatan bahwa decision tree yang ada dalam Gambar 2.4 mungkin akan menuntun kita pada suatu kesimpulan bahwa setiap level pada tree
akan mempunyai atribut yang sama. Sebagai contoh pada level 2 Gambar 2.4 kita mendapatkan atribut mutual fund type. Ini hanyalah sebuah kebetulan belaka.
2.21 Perangkat Lunak untuk Rule Induction