Algoritma ID3 untuk Membuat Rule

Dari Gambar 2.3 didapat production rule sebagai berikut Rule 1 If Bulges are none then plane is C5A Rule 2 If Bulges are aft of wings then plane is C141 Rule 3 If bulges are aft of cockpit then plane is B747 Rule 4 If bulges are under wing then plane is C130 Dari production rule yang didapat diatas didapat bahwa atribut yang paling penting adalah bulges, karena dengan satu atribut saja sudah bisa untuk mengidentifikasi pesawat terbang yang ada. Apabila situasi yang terjadi adalah deterministik ini tidak akan menjadi maslah, tetapi apabila pengamat tidak bisa menentukan dengan pasti bulges dari pesawat karena cuaca yang buruk atau karena sesuatu hal maka atribut yang lain akan sangat diperlukan.

2.20 Algoritma ID3 untuk Membuat Rule

Untuk menjelaskan algoritma ini akan dibuat sebuah skenario tentang investasi. Jenis investasi yang dijadikan contoh dibatasi pada :  Investasi pada blue chip stock  Investasi pada North American gold mining  Investasi pada mortgage-related securities Tujuan kita adalah untuk memastikan dengan waktu dan kondisi yang diberikan investasi mana yang akan memberikan keuntungan yang terbesar. Untuk itu akan dibuat klasifikasi nilai mutual fund yang diharapkan kedalam tiga klas yaitu high, medium atau low. Sedangkan dari ketiga tipe mutual fund adalah sebagai berikut :  Suku bunga  Jumlah uang yang beredar di Jepang, Eropa Barat dan Amerika Serikat  Derajat gangguan internasional seperti prospek operasi militer, terorisme dan lainnya Dari atribut yang ada kemudian kita membaca data historis yang ada dalam Tabel 2.2 dibawah ini. Tabel 2.2 Faktor-faktor yang mempengaruhi nilai Mutual Fund Type Interest Rate Cash Available Tension Fund Value Class Blue Chip High High Medium Medium Blue Chip Low High Medium High Blue Chip Medium Low High Low Gold Stock High High Medium High Lanjutan Tabel 2.2 Mutual Fund Type Interest Rate Cash Available Tension Fund Value Class Gold Stock Low High Medium Medium Gold Stock Medium Low High Medium Mortgage High High Medium Low Mortgage Low High Medium High Mortgage Medium Low High Low Langkah selanjutnya adalah membuat decision tree untuk data-data diatas, langkah yang akan kita pakai menggunakan pendekatan yang lebih sistematik berdasarkan hitungan dari entropi untuk setiap atribut, dimana atribut yang akan dijadikan root node adalah atribut yang mempunyai entropi terendah. Persamaan 3.1 yang digunakan untuk menghitung entropi sari atribut A k adalah sebagai berikut : 3.1 Dimana, HC|A k = Entropi dari atribut A k Pa k,j = Probabilitas atribut a mempunyai nilai j Pc i |a k,j = Probabilitas nilai klas adalah c i ketika atribut k bernilai j M k = Total jumlah nilai yang digunakan untuk atribut A k N = Total jumlah klas yang berbeda i =1,2,3…….N K = Total jumlah atribut yang ada k=1,2,3……..N Dari data dalam Tabel 2.2 didapat nilai-nilai berikut:  Terdapat 4 atribut yaitu fund type, interest rate, cash, dan tension maka K=4  Terdapat 3 klas yaitu nilai untuk fund value high, medium atau low maka N=3  Terdapat 3 nilai untuk atribut mutual fund type high, medium atau low maka M 1 =3  Terdapat 3 nilai untuk atribut interest rate high, medium atau low maka M 2 =3  Terdapat 2 nilai untuk atribut cash high atau low maka M 3 =2  Terdapat 2 nilai untuk atribut tention high atau medium maka M 4 =2 Setelah diperoleh nilai-nilai tersebut diatas maka kita akan menghitung entropi untu setipa atribut. Sebagai contoh akan dihitung entropi untuk atribut cash  Pa 3,1 = Probabilitas cash mempunyai nilai high = 69  Pa 3,2 = Probabilitas cash mempunyai nilai low = 39  Pc 1 |a 3,1 = Probabilitas fund value bernilai high ketika cash bernilai high = 36  Pc 2 |a 3,1 = Probabilitas fund value bernilai medium ketika cash bernilai high = 26  Pc 3 |a 3,1 = Probabilitas fund value bernilai low ketika cash bernilai high = 16  Pc 1 |a 3,2 = Probabilitas fund value bernilai high ketika cash bernilai low = 03  Pc 2 |a 3,2 = Probabilitas fund value bernilai medium ketika cash bernilai low = 13  Pc 3 |a 3,2 = Probabilitas fund value bernilai low ketika cash bernilai low = 23 Nilai-nilai diatas kita subtitusikan kedalam persamaan entropi, maka didapat nilai- nilai sebagai berikut : dengan cara yang sama akan didapat entropi untuk atribut yang lainnya  int | erest C H 1,140333  | tension C H 1,2787    | type fund mutual C H 1,140333 Dari hitungan terdapat dua atribut yang mempunyai nilai terendah yang sama, maka kita dapat memilihnya salah satu. Sebagai contoh kita memilih interest untuk dijadikan root node. Setelah kita mendapatkan atribut interest untuk dijadikan root node maka langkah selanjutnya adalah membagi Tabel 2.2 berdasarkan pada nilai atribut interest. Ini akan menghasilkan tiga subtabel satu untuk nilai interest=high, satu untuk nilai interest=medium dan satu untuk nilai interest=low. Subtabel untuk nilai interest=high dapat dilihat pada Tabel 2.3. Tabel 2.3 Subtabel untuk nilai interest=high Mutual Fund Cash Tension Fund Value Blue Chip High Medium Medium Gold Stock High Medium High Mortgage-related High Medium Low Setelah itu kita menghitung lagi untuk setiap atribut yang ada, dari perhitungan yang sudah dilakukan didapat bahwa atribut mutual fund type mempunyai nilai yang terendah. Setelah itu kita akan membuat percabangan berdasarkan pada mutual fund-type. Hasil yang didapat dapat dilihat pada Gambar 2.4. Gambar 2.4 Percabangan berdasarkan pada mutual fund-type Dari Gambar 2.4 Didapat rule-rule sebagai berikut Rule 1 If interest rate are high and the fund type is blue chip then the value will be minimum Rule 2 If interest rate are high and the fund type is gold stock then the value will be high Rule 3 If interest rate are high and the fund type is mortgage-related then te value will be low Rule 4 If interest rate are medium and the fund type is blue chip then the value will be low Rule 5 If interest rate are medium and fund type is gold stock then the value will be medium Rule 6 If interest rate are medium and the fund type is mortgage-related then tte value will low Rule 7 If interest rate are low and the fund type is blue chip then the value will be high Rule 8 If interest rate are low and the fund type is gold stock then the value will be medium Rule 9 If interest rate are low and the fund type is mortgage-related then te value will be high Kita juga bisa menggabung dari rule-rule yang ada. Sebagai contoh rule 5 dan rule 8 bisa digabung menjadi, Rule 58 If fund type are gold stocks and interest rate are medium or interest rate are low then the value will be medium. Ada beberapa catatan bahwa decision tree yang ada dalam Gambar 2.4 mungkin akan menuntun kita pada suatu kesimpulan bahwa setiap level pada tree akan mempunyai atribut yang sama. Sebagai contoh pada level 2 Gambar 2.4 kita mendapatkan atribut mutual fund type. Ini hanyalah sebuah kebetulan belaka.

2.21 Perangkat Lunak untuk Rule Induction