X
6
X
7
1 1
2.6 Reduct Based Decision Tree
Algoritma RDT adalah algoritma yang lahir dengan memanfaatkan kelebihan-kelebihan dari teori himpunan kasar dan algoritma pohon keputusan
yang seudah ada sebelumnya, maka akan meningkatkan efisiensi, kesederhanaan dan kemampuan generalisasi dari kedua algoritma tersebut Yellasiri, 2008.
Algoritma Reduct Based Decision Tree RDT sebagian besar memiliki dua langkah penting, yaitu Reduct Computation dan pembentukan pohon DT
Construction atau pembentukan pohon keputusan.
RDT juga memiliki banyak jenis-jenis nya, yang merupakan pengembangan lebih lanjut dari RDT itu sendiri, dan letak pengembangan adalah
dengan memodifikasi salah satu langkah dalam proses reduct nya Adhiguru, Minz and Jain, 2006 . Perbedaan dan deskripsi dari masing-masing algoritma
tersebut bisa dilihat dalam tabel 2.5 berikut, data diambil dari hasil pengujian pada sebuah dataset nutrisi Jain,2006 :
Tabel 2.5 Algoritma dan varian RDT
Dari tabel diatas bisa dilihat bahwa, algoritma Rough Set RS sendiri menggunakan Full Discernibility dan keputusannya dibuat dengan relative reduct.
Relative Reduct adalah algoritma yang digunakan pada data set untuk melakukan
reduct dan memperoleh rule dan kemudian bisa melakukan klasifikasi dan
prediksi. Sedangkan RDT sendiri hanya menggunakan global reduct, yakni
reduct pada data set tetapi tidak sampai kepada proses klasifikasi dan prediksi
Jain, 2011, sehingga digunakan pohon keputusan untuk melakukan pencarian pola dan keputusannya. Bisa dilihat bahwa RDT ini benar-benar menggabungkan
antara kelebihan Rough Set dengan reduct-nya dan pohon keputusan untuk pencarian polanya. Sehingga atribut-atribut yang sangat berperan penting dalam
pencarian pola data bisa diperoleh dari proses reduct atribut dalam konsep rough set
ini. Kemudian dibentuk pola dengan algoritma pohon keputusan berdasarkan atribut hasil reduct tersebut.
Namun, yang menjadi masalah utama atau problem mendasar untuk banyak praktek aplikasi yang menggunakan Rough Set ini, adalah mendefinisikan
metode method mana yang efisien, untuk pemilihan atribut yang penting dalam klasifikasi objek suatu universe Yellasiri, 2008. Dalam software Rosetta Rough
Set Toolkit , algoritma yang digunakan untuk me-reduct data adalah Johnson
Algorithm dan Genetic Algorithm. Oleh karena itu, Ramadevi Yellasiri
mengusulkan algoritma RDT yang berbeda untuk reduct atribut data yang lebih sederhana dibandingkan dengan Johnson Algorithm dan Genetic Algorithm.
Algoritma yang digunakan oleh Yellasiri adalah Reduct Computation Algorithm RCA.
Walaupun sederhana, dari pengujian dengan Kappa Statistic, untuk membandingkan dengan teknik klasifikasi yang satu dengan yang lain, algoritma
RDT Yellsiri ini cukup menunjukkan tingkat akurasi yang lebih baik dibandingkan yang lain.
Dari definisi dan uraian diatas, maka penulis dalam penelitian ini akan menggunakan algoritma RDT dengan algoritma RCA yang diusulkan oleh
Ramadevi Yellasiri untuk proses reduct-nya. Untuk pembentukan pohon keputusannya, akan digunakan algoritma C4.5, karena Yellasiri tidak menentukan
secara eksplisit algorittma apa yang digunakan untuk pembentukan pohon keputusannya.
2.6.1 Reduct Computation Algorithm RCA
Dalam algoritma ini, tabel keputusan digunakan sebagai input dan atribut- atribut utama yang diperoleh disebut reduct adalah outputnya Yellasiri,
C.R.RAO, Ramakhrisna, Prathima,2008. Atribut-atribut yang menjadi output tersebut disebut SPA Set of Predominant Attribute atau Himpunan Atribut
Dominan HAP. Adapun algoritma RCA tersebut adalah sebagai berikut :
a. Baca tabel keputusan T1 b. Urutkan baris secara ascending order pada atribut keputusannya
c. Inisialisasikan himpunan atribut-atribut utama SPA ke null d. Buat sebuah matrik boolean seperti yang dijelaskan pada langkah 5,
dengan membuat sebuah baris untuk setiap pasangan baris responden yang memiliki perbedaan pada atribut keputusannya.
e. Buat sebuat baris dengan nilai „1‟ dan „0‟. Tandai a „1‟ ke elemen jika
dari pasangan baris responden memiliki nilai atribut berbeda, selain itu tandai denga
n „0‟ f. Ulangi langkah
„7‟ dan „8‟ sampai jumlah baris dalam Matriks Boolean
bernilai „0‟ atau matriknya menjadi null.
g. Ambil atribut „a‟ yang memiliki hasil penjumlahan maksimum dari
baris-baris, dan tambahkan ke SPA h. Hapus semua baris dari matrik boolean yang mempunyani nilai elemen
„1‟ dari atribut „a‟ tersebut i. Jika matrik boolean tidak null, tampilkan
“SPA secara kasar menjelaskan tentang atribut keputusan
”. j. Tetapkan SPA sebagai hasil reduct
2.6.2 Pohon Keputusan Decision Tree
Dalam teknik klasifikasi pada data mining, ada banyak pemodelan yang bisa dibangun, salah satunya adalah menggunakan teknik klasifikasi dengan
pohon keputusan. Pohon keputusan adalah suatu diagram alir seperti struktur pohon, dimana setiap titik internal node merupakan sebuah atribut, setiap
cabang branch menggambarkan keluaran dari suatu logical test dan bagian daun