diubah bentuk sesuai dengan jenis dan data yang akan dicari dalam database
. Tranformasi data juga akan berpengaruh untuk menentukan kualitas data mining.
c. Penambangan Data Data Mining Penambangan data merupakan suatu proses utama saat metode
diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data.
d. Evaluasi dan Presentasi Pola Evaluation and Presentation Untuk mengidentifikasi pola-pola menarik kedalam knowledge based
yang ditemukan. Dan presentasi merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh
pengetahuan yang diperoleh pengguna.
2.3 Himpunan dan Himpunan Kasar 2.3.1 Relasi
Relasi atau hubungan antara himpunan A dan B adalah pemasangan anggota-anggota himpunan A dengan anggota-anggota himpunan B dengan aturan
tertentu Liu,1995.
2.3.2 Relasi Ekivalensi
Dikatakan juga oleh Liu 1995, suatu relasi R pada himpunan S dikatakan ekuivalen jika memenuhi ketiga hal berikut ini :
1. Refleksif , xRx 2. Simetri, jika xRy maka yRx
3. Transitif, Jika xRy dan yRz maka xRz
Misalkan Diberikan himpunan S={1,2,3....,20}dan relasi R pada S didefinisikan 4| x
– y . Akan ditunjukan R merupakan relasi ekivalensi a | b artinya a membagi b .
1. Refleksif. Untuk sebarang x
S diperoleh x
– x = 0, Jelas s | 0 , terbukti R bersifat Refleksif
2. Simetri. Diketahui xRy maka 4 | x – y , yang artinya x – y = 4n.
Diperoleh y – x = - 4n maka 4 | y – x = - 4n . Dapat disimpulkan yRx
3. Transitif. Diketaui xRy dan yRz yang artinya x – y = 4n dan y– z = 4m
Diperoleh x – z + 4m = 4n kemudian x – z = 4n + 4m = 4 n + m .
Itu artinya xRz. Maka terbukti bahwa R Transitive.
2.3.3 Kelas Ekivalensi
Dalam relasi ekuivalensi pasti terdapat kelas ekivalensi. Misalkan diberikan R relasi ekuivalen pada S maka untuk semua
a S
terdapat suatu himpunan yang berisikan semua anggota S yang berelasi ke a , dinotasikan [ a ] = {
a S |
a R x }. Tabel 2.1 berikut ini merupakan contoh sebuah tabel dengan objeknya
adalah kelas ekivalensi. Tabel dibawah ini adalah contoh data dari 18 pasien penderita kanker berdasarkan lokasi asal tumor, lung L, colon L. Empat atribut
yang dicatat dari pasien-pasien tersebut adalah level ekspresi atau perubahan bentuk dari ketiga gen dalam metastatic tumor dan dibandingkan dengan
kesehatan penderita. 0: unchanged, ↓down-regulated, ↑ up-regulated serta
dilihat penderita smoking yes or no.
Tabel 2.1 Contoh tabel kelas ekivalensi
Equivalence classes Gene
1 Gene2
Gene 3
sm Site of Origin
Decision E1={P1,P6}
↓ ↓
yes { L}
E2={P2,P4} Ye
s {L}
E3={P3,P13,P18} ↓
↑ no
{C,L} E4={P5,P11,P12,P17
} ↓
yes {L}
E5={P7,P8,P15} ↓
↑ No
{C} E6={P9}
↑ yes
{C} E7={P10,P16}
↓ ↓
↑ No
{C,L} E8={P14}
↑ ↑
No {C}
2.3.4 Pengetahuan Dasar Himpunan Kasar
Himpunan kasar rough sets pertama kali diperkenalkan oleh Zdzislaw Pawlak dari Warsaw University of Technology di Polandia pada tahun 1982
sebagai suatu metode matematis untuk mendeskripsikan himpunan tidak tegas, dalam arti bahwa elemen-elemen tertentu dalam semestanya tidak dapat
ditentukan secara tegas apakah merupakan anggota himpunan itu atau tidak, karena elemen-elemen itu tidak dapat dibedakan satu sama lain akibat
keterbatasan atau ketidaklengkapan pengetahuan atau informasi yang tersedia mengenai elemen-elemen itu Susilo, 2006 . Pada awalnya himpunan kasar
dikembangkan untuk menangani ketidakpastian dan ketidaktegasan Pawlak, 2003 dalam bidang analisis data. Dasar pengembangan teori himpunan kasar
adalah asumsi bahwa setiap elemen dalam semesta wacananya terkait dengan informasi mengenai elemen itu, dan bahwa elemen-elemen dengan informasi yang
sama adalah elemen-elemen yang takterbedakan Indiscernibility. Pada dasarnya pendekatan terhadap himpunan kasar adalah suatu hampiran terhadap himpunan
taktegas itu dengan menggunakan sepasang himpunan tegas yang dikonstruksikan berdasarkan suatu partisi pada semesta himpunan itu. Sebagai partisi bisaanya
diambil partisi yang terimbas oleh relasi ekivalensi “takterbedakan” antara
elemen-elemen dalam semesta itu. Dengan demikian kelas-kelas ekivalensi dalam partisi itu memuat elemen-elemen semesta yang takterbedakan satu sama lain.
Relasi ekivalensi adalah model matematik paling sederhana yang dapat dipergunakan untuk merepresentasikan keadaan di mana elemen-elemen tertentu
dalam suatu semesta tidak dapat dibedakan satu sama lain, dengan mengingat bahwa relasi
“takterbedakan” itu pada dasarnya adalah suatu relasi ekivalensi, yaitu bersifat refleksif, simetrik, dan transitif. Konsep himpunan kasar adalah
perampatan konsep himpunan tegas, dalam arti bahwa himpunan tegas adalah kejadian khusus dari himpunan kasar.
Dalam konsep rough set ini, data atau tabel keputusan dinotasikan dengan T = U,A,C,D Yellasiri, 2008, dimana U adalah semesta, A adalah himpunan
atribut-atribut primitif, dan C, D ⊂ A himpunan bagian dari A adalah dua subset
dari atribut A yang disebut atribut kondisi dan atribut keputusan. Dengan istilah