Spatial Data Mining Pengembangan Prototipe Spatial Data Mining Untuk Karakterisasi Desa Miskin di Jawa Barat

Skema yang menggambarkan proses spatial data mining menurut Chawla et al. 2001 yang diilustrasikan pada Gambar 3. Gambar 3. Proses Spatial Data Mining sumber : Chawla et al. 2001.

2.6. Teknik Spatial Data Mining

Data mining merupakan area multidisiplin, dan terdapat banyak cara-cara baru untuk melakukan ekstraksi pola data. Ada tiga teknik data mining yang telah diterima secara umum, yaitu classification, clustering dan association rules Shekhar Chawla 2003. Classification Tujuan teknik klasifikasi adalah untuk menduga nilai sebuah atribut dari relasi berdasarkan nilai atribut-atribut lainnya dari relasi tersebut. Definisi lainnya menyatakan teknik klasifikasi memilih himpunan atribut dan nilai nilai atribut yang relevan, yang digunakan untuk secara efektif memetakan obyek spasial ke dalam kelas target yang telah didefinisikan sebelumnya. Clustering Teknik clustering merupakan contoh pembelajaran tak-terarahkan unsupervised learning. Teknik ini berusaha mengelompokkan data tanpa memiliki pengetahuan awal tentang kluster atau jumlah kluster. Obyek spasial dikelompokkan sehingga obyek dalam satu kluster adalah mirip, dan obyek dalam kluster yang berbeda adalah tidak mirip. Clustering dapat dilakukan berdasarkan kombinasi atribut non-spasial, atribut spasial, dan kedekatan obyek dalam ruang, waktu dan ruang-waktu. Association Rules Teknik ini bertujuan menemukan hubungan diantara atribut-atribut dalam sebuah relasi. Dalam konteks spasial, association rule melibatkan predikat spasial topologi, jarak atau arah dalam preseden atau anteseden-nya. Sebagai contoh rules dinyatakan dalam bentuk is_close house, beach Æ is_expensivehouse yang bermakna rumah yang dekat dengan pantai mungkin harganya mahal. Disamping teknik classification, clustering dan association rules di atas, Miller dan Han 2001 menyebutkan beberapa teknik lain yaitu : • Outlier Detection, obyek spasial yang tidak masuk ke dalam kluster manapun disebut pencilan outlier. Jadi outlier detection adalah masalah kebalikan dari clustering. • Spatial Trend Detection, teknik ini melibatkan pencarian pola perubahan dengan memperhatikan tetangga dari beberapa obyek spasial. • Geographic Characterization and Generalization , teknik ini menghasilkan deskripsi ringkas data berupa summary rules atau characteristics rule. Dalam data mining klasik non-spasial, metode yang handal untuk menghasilkan summary rules adalah metode induksi berorientasi atribut attribute-oriented induction.

2.7. Karakterisasi Spasial

Spatial association rule dinyatakan dalam bentuk: P 1 ………. P m Æ Q 1 ……….Q n c Dimana paling tidak satu dari predikat P1, …. , P m , Q 1, …., Q n adalah predikat spasial dan c adalah confidence yang mengindikasikan bahwa c obyek yang memenuhi anteseden juga memenuhi konsekuen dari rule. Untuk mengatasi keterbatasan tersebut, Ester et al. 2001 mendefinisikan karakterisasi spasial spatial characterization dari sekumpulan obyek target terhadap basisdata tempat obyek tersebut tersimpan sebagai “deskripsi dari sifat spasial dan non-spasial yang serupa bagi obyek target, tetapi bukan untuk