Discernibility Matrix dan Boolean Matrix.

X 6 X 7 1 1

2.6 Reduct Based Decision Tree

Algoritma RDT adalah algoritma yang lahir dengan memanfaatkan kelebihan-kelebihan dari teori himpunan kasar dan algoritma pohon keputusan yang seudah ada sebelumnya, maka akan meningkatkan efisiensi, kesederhanaan dan kemampuan generalisasi dari kedua algoritma tersebut Yellasiri, 2008. Algoritma Reduct Based Decision Tree RDT sebagian besar memiliki dua langkah penting, yaitu Reduct Computation dan pembentukan pohon DT Construction atau pembentukan pohon keputusan. RDT juga memiliki banyak jenis-jenis nya, yang merupakan pengembangan lebih lanjut dari RDT itu sendiri, dan letak pengembangan adalah dengan memodifikasi salah satu langkah dalam proses reduct nya Adhiguru, Minz and Jain, 2006 . Perbedaan dan deskripsi dari masing-masing algoritma tersebut bisa dilihat dalam tabel 2.5 berikut, data diambil dari hasil pengujian pada sebuah dataset nutrisi Jain,2006 : Tabel 2.5 Algoritma dan varian RDT Dari tabel diatas bisa dilihat bahwa, algoritma Rough Set RS sendiri menggunakan Full Discernibility dan keputusannya dibuat dengan relative reduct. Relative Reduct adalah algoritma yang digunakan pada data set untuk melakukan reduct dan memperoleh rule dan kemudian bisa melakukan klasifikasi dan prediksi. Sedangkan RDT sendiri hanya menggunakan global reduct, yakni reduct pada data set tetapi tidak sampai kepada proses klasifikasi dan prediksi Jain, 2011, sehingga digunakan pohon keputusan untuk melakukan pencarian pola dan keputusannya. Bisa dilihat bahwa RDT ini benar-benar menggabungkan antara kelebihan Rough Set dengan reduct-nya dan pohon keputusan untuk pencarian polanya. Sehingga atribut-atribut yang sangat berperan penting dalam pencarian pola data bisa diperoleh dari proses reduct atribut dalam konsep rough set ini. Kemudian dibentuk pola dengan algoritma pohon keputusan berdasarkan atribut hasil reduct tersebut. Namun, yang menjadi masalah utama atau problem mendasar untuk banyak praktek aplikasi yang menggunakan Rough Set ini, adalah mendefinisikan metode method mana yang efisien, untuk pemilihan atribut yang penting dalam klasifikasi objek suatu universe Yellasiri, 2008. Dalam software Rosetta Rough Set Toolkit , algoritma yang digunakan untuk me-reduct data adalah Johnson Algorithm dan Genetic Algorithm. Oleh karena itu, Ramadevi Yellasiri mengusulkan algoritma RDT yang berbeda untuk reduct atribut data yang lebih sederhana dibandingkan dengan Johnson Algorithm dan Genetic Algorithm. Algoritma yang digunakan oleh Yellasiri adalah Reduct Computation Algorithm RCA. Walaupun sederhana, dari pengujian dengan Kappa Statistic, untuk membandingkan dengan teknik klasifikasi yang satu dengan yang lain, algoritma RDT Yellsiri ini cukup menunjukkan tingkat akurasi yang lebih baik dibandingkan yang lain. Dari definisi dan uraian diatas, maka penulis dalam penelitian ini akan menggunakan algoritma RDT dengan algoritma RCA yang diusulkan oleh Ramadevi Yellasiri untuk proses reduct-nya. Untuk pembentukan pohon keputusannya, akan digunakan algoritma C4.5, karena Yellasiri tidak menentukan secara eksplisit algorittma apa yang digunakan untuk pembentukan pohon keputusannya.

2.6.1 Reduct Computation Algorithm RCA

Dalam algoritma ini, tabel keputusan digunakan sebagai input dan atribut- atribut utama yang diperoleh disebut reduct adalah outputnya Yellasiri, C.R.RAO, Ramakhrisna, Prathima,2008. Atribut-atribut yang menjadi output tersebut disebut SPA Set of Predominant Attribute atau Himpunan Atribut Dominan HAP. Adapun algoritma RCA tersebut adalah sebagai berikut : a. Baca tabel keputusan T1 b. Urutkan baris secara ascending order pada atribut keputusannya c. Inisialisasikan himpunan atribut-atribut utama SPA ke null d. Buat sebuah matrik boolean seperti yang dijelaskan pada langkah 5, dengan membuat sebuah baris untuk setiap pasangan baris responden yang memiliki perbedaan pada atribut keputusannya. e. Buat sebuat baris dengan nilai „1‟ dan „0‟. Tandai a „1‟ ke elemen jika dari pasangan baris responden memiliki nilai atribut berbeda, selain itu tandai denga n „0‟ f. Ulangi langkah „7‟ dan „8‟ sampai jumlah baris dalam Matriks Boolean bernilai „0‟ atau matriknya menjadi null. g. Ambil atribut „a‟ yang memiliki hasil penjumlahan maksimum dari baris-baris, dan tambahkan ke SPA h. Hapus semua baris dari matrik boolean yang mempunyani nilai elemen „1‟ dari atribut „a‟ tersebut i. Jika matrik boolean tidak null, tampilkan “SPA secara kasar menjelaskan tentang atribut keputusan ”. j. Tetapkan SPA sebagai hasil reduct

2.6.2 Pohon Keputusan Decision Tree

Dalam teknik klasifikasi pada data mining, ada banyak pemodelan yang bisa dibangun, salah satunya adalah menggunakan teknik klasifikasi dengan pohon keputusan. Pohon keputusan adalah suatu diagram alir seperti struktur pohon, dimana setiap titik internal node merupakan sebuah atribut, setiap cabang branch menggambarkan keluaran dari suatu logical test dan bagian daun

Dokumen yang terkait

Implementasi algoritma reduct based decision tree untuk mengenali pola klasifikasi mahasiswa yang terkena sisip program.

0 1 229

Pencarian karakteristik calon mahasiswa baru Universitas Sanata Dharma yang tidak mendaftar ulang dengan menggunakan algoritma pohon.

0 0 125

MANAJEMEN WAKTU MAHASISWA TERHADAP KURIK

0 1 17

Pencarian karakteristik calon mahasiswa baru Universitas Sanata Dharma yang tidak mendaftar ulang dengan menggunakan algoritma pohon - USD Repository

0 0 123

Klasifikasi Data Penerimaan Mahasiswa Baru dan Prestasi akademik mahasiswa Jurusan Teknik Informatika Universitas Sanata Dharma dengan menggunakan algoritma naive bayesian - USD Repository

0 1 145

Pencarian pola klasifikasi mahasiswa yang tidak memenuhi sisip program berdasarkan nilai tes masuk penerimaan mahasiswa baru dan latar belakang mahasiswa Universitas Sanata Dharma dengan menggunakan algoritma C4.5 - USD Repository

0 0 175

Prediksi calon mahasiswa baru Universitas Sanata Dharma yang tidak mendaftar ulang menggunakan algoritma Naive Bayessian - USD Repository

0 0 119

Pengenalan pola klasifikasi status registrasi calon mahasiswa baru Universitas Sanata Dharma dengan algoritma Reduct Based Decision Tree (RDT) - USD Repository

0 1 151

Pencarian pola klasifikasi karya pengembangan profesi guru berdasarkan data sertifikasi guru dengan algoritma Reduct Based Decision Tree (RDT) - USD Repository

0 0 231

Implementasi algoritma reduct based decision tree untuk mengenali pola klasifikasi mahasiswa yang terkena sisip program - USD Repository

0 0 227