Karakterisasi Spasial Pengembangan Prototipe Spatial Data Mining Untuk Karakterisasi Desa Miskin di Jawa Barat

keseluruhan basisdata a description of the spatial and non-spatial properties which are typical for the target objects, but not for the whole database ”. Sifat yang menjadi perhatian adalah frekuensi relatif nilai atribut non-spasial dan frekuensi relatif tipe obyek yang berbeda. Perbedaan frekuensi relatif dalam basisdata dengan frekuensi relatif dalam daerah target diperlihatkan pada Gambar 4. Gambar 4. Frekuensi sampel dan perbedaannya Atribut spasial dan non-spasial digambarkan dalam Gambar 5. Gambar 5. Atribut spasial dan non-spasial Berikut ini adalah beberapa batasan yang digunakan dalam teknik karakterisasi spasial : Definisi 1 : Hubungan Spasial Untuk melakukan karakterisasi spasial, tidak hanya sifat dari obyek target yang diperhatikan melainkan juga sifat obyek tetangga.Hubungan satu obyek dengan obyek tetangganya dapat dinyatakan dalam tiga bentuk Ester et al, 2001: 1. Hubungan Topologi : berdasarkan batas, interior atau komplemen dari dua obyek. Contoh hubungan yang mungkin terjadi adalah Gambar 6: Gambar 6. Contoh hubungan topologi sumber : Egenhofer et al. 1989 dalam Shekhar dan Chawla, 2003. 2. Hubungan Jarak : membandingkan jarak dua obyek dengan sebuah konstanta menggunakan operator pembanding aritmatik. Hubungan jarak dinyatakan sebagai DistanceO 1 ,O 2 σ c dengan O 1 : obyek pertama, O 2 : obyek kedua, σ : , atau =, c : konstanta. Ilustrasi hubungan jarak diperlihatkan pada Gambar 7. Gambar 7. Contoh hubungan jarak sumber :Ester et al, 2001 3. Hubungan Arah atau Orientasi : obyek pertama sebagai sistem koordinat virtual, quadrant dan half-plane menentukan arahnya Gambar 8. Gambar 8. Contoh hubungan arah sumber :Ester et al, 2001 Definisi 2 : neighborhood graph and paths Ditetapkan neighborhood sebagai hubungan tetangga dan DB sebagai basisdata obyek spasial. Sebuah neighborhood graph E N G DB neighbor , = adalah sebuah graph dengan node N=DB dan edge NxN E ⊆ dimana sebuah edge e =n 1 ,n 2 ada jika dan hanya jika terdapat neighborn 1 ,n 2 . Hubungan neighborn 1 ,n 2 dapat berupa hubungan topologi, jarak atau arah. Gambar 9 memperlihatkan sebuah basisdata obyek spasial DB serta dua buah neighborhood graph dengan hubungan topologi meet dan hubungan arah north. Gambar 9. Contoh Neighborhood Graph Sebuah neighborhood path dengan panjang k didefinisikan sebagai untaian node [n 1 ,n 2 ,….n k ] dimana neighbor n i , n i+1 terjadi untuk semua k i N n i ≤ ∈ 1 , . Definisi 3 : Operasi pada neighborhood graph Terdapat beberapa operasi yang dilakukan pada sebuah neighborhood graph graf tetangga yaitu Ester et al, 2001: 1. Neighbours: Graphs x Objects x Predicates Æ Sets_of_objects Operasi Neighbours menghasilkan himpunan semua obyek set of objects yang terhubung dengan object pada graph yang memenuhi kondisi yang dinyatakan dalam predicates. 2. Path: Sets_of_objects Æ set_of_path Operasi path menghasilkan semua path dengan panjang l yang dibentuk oleh sebuah elemen tunggal dari obyek. 3. Extensions: Graphs x Sets_of_path x integer x predicates Æ sets_of_path Operasi Extensions menghasilkan himpunan semua path set_of_all_path dengan panjang tertentu integer pada graph yang merupakan perpanjangan sebuah elemen dari path. Definisi 4 : Filter Predikat Predicates Filter Ketika bergerak dari sebuah obyek menuju obyek lainnya dalam graf, dapat digunakan beberapa filter yaitu Ester et al, 2001: 1. Starlike Filter Ketika memperpanjang sebuah path p = [n 1 ,n 2 ,….n k ] dengan sebuah node n k+1 , maka arah terakhir yang pasti exact “final” direction dari p tidak dapat digeneralisasi. Sebagai contoh, sebuah path dengan arah terakhir tenggara maka hanya dapat diperpanjang dengan sebuah node dari sebuah edge yang memiliki arah tenggara. 2. Variable Starlike Filter Variable starlike filter memungkinkan path yang lebih halus, dengan hanya mensyaratkan ketika memperpanjang path p maka edge n k , n k+1 paling tidak memenuhi arah awal yang pasti exact “initial” direction dari path p. Sebagai contoh, sebuah path dengan arah awal utara dapat diperpanjang sehingga arah path tersebut tetap utara atau menjadi tenggara. 3. Vertical Starlike Filter Filter ini merupakan bentuk khusus dari starlike filter dimana filter kurang ketat ke arah vertikal dibandingkan ke arah horizontal. Filter ini digunakan jika memerlukan analisis lebih rinci ke arah vertikal. Ilustrasi dari masing-masing filter dapat dilihat pada Gambar 10. Gambar 10. Filter Predicates sumber :Ester et al, 2001 Definisi 5 : Neighbourhood Index Neighbourhood Index adalah sebuah tabel yang mencatat hubungan antarobyek dalam basisdata spasial. Neighbourhood index untuk DB dengan jarak maksimum max, dinyatakan sebagai berikut { } 2 1 1 2 2 1 2 1 2 1 max max , , | , , , , TO O DO O dist O jarak O DB O O T D dist O O I dist DB ≤ ∈ = = dengan DB sebagai sebuah himpunan obyek spasial, max dan dist adalah bilangan real, D adalah hubungan arah direction relation dan T adalah hubungan topologi topological relation. Ilustrasi Neighbourhood Index pada Gambar 11. Gambar 11. Contoh Neighbourhood Index Definisi 6: Karakterisasi Spasial Karakterisasi spasial adalah aturan yang menjelaskan sifat atribut untuk sebuah wilayah dibandingkan dengan sifat atribut tersebut pada keseluruhan basisdata. Ditetapkan DB neighbour G adalah s neighbourhood graph dan target adalah subset dari basisdata spasial DB. Ditetapkan freq s prop yang menyatakan jumlah kemunculan sifat prop dalam himpunan s dan cards menyatakan kardinalitas dari s. Frequency factor dari prop terhadap targets dan DB dinyatakan dalam arg arg arg DB card prop freq ets t card prop freq prop f DB ets t DB ets t = Ditetapkan significance dan proportion sebagai bilangan real dan max- neighbours sebagai bilangan natural. Neighbours s S i G menyatakan himpunan dari seluruh obyek yang dapat dicapai dari satu elemen s dengan berjalan paling banyak i edge dari graph tetangga G. Kemudian, pekerjaan karakterisasi spasial adalah untuk menemukan setiap sifat prop dan setiap bilangan natural n = max-neighbours sehingga 1. himpunan objects = arg ets t neighbours n G dan 2. himpunan objects = } {t neighbours n G untuk proportion paling kecil terdapat ∈ t target yang memenuhi kondisi, Proses karakterisasi spasial menghasilkan aturan rule dalam bentuk Aturan ini bermakna bahwa untuk himpunan dari seluruh target yang diperluas oleh neighbours n i , sifat p i muncul dalam basisdata lebih banyak atau lebih sedikit dari freq-fac i. . Contoh rule yang dihasilkan adalah sebagai berikut Obyek dengan tingkat penduduk pensiun tinggi Î Apartemen per gedung = sangat rendah 0.91 tingkat orang asing = sangat rendah 0.89 tingkat akademisi = sedang 0.63 rata-rata ukuran perusahaan = sangat rendah 0.58 tipe obyek = pegunungan 3.41 Obyek target dan wilayah yang diperluas dengan tetangganya dapat dilihat pada Gambar 12. Gambar 12. Obyek target dan wilayah yang diperluas sumber: Ester et al. 2001. Sehingga secara umum algoritma spatial characterization adalah sebagai berikut karakterisasi graph DB r G ; himpunan obyek target; real significance, proportion; integer max- neighbors inisialisasi himpunan karakterisasi sebagai himpunan kosong; inisialisasi himpunan region menjadi target; inisialisasi n dengan 0; hitung prop frekuensi DB untuk semua sifat prop = atribut, nilai; while n ≤ max-neighbors do for each atribut pada DB dan untuk atribut khusus tipe obyek do for each nilai dari atribut do hitung prop frekuensi region untuk semua sifat prop = atribut, nilai; if ce significan prop f DB region ≥ or ce significan prop f DB region 1 ≤ then tambahkan prop, n, prop f DB region ke dalam himpunan karakterisasi; if n max-neighbors then for each obyek dalam region do tambahkan neighbors DB r G , obyek, TRUE ke dalam region; tambahkan nilai n dengan 1; ekstrak semua tuple prop, n, prop f DB region dari karakterisasi yang signifikan di dalam paling sedikit proportion region dengan n perluasan; return aturan yang dihasilkan dari karakterisasi; METODOLOGI PENELITIAN Penelitian ini mengembangkan sistem spatial data mining untuk melakukan karakterisasi desa miskin di Propinsi Jawa Barat. Dengan sistem tersebut diharapkan dapat mengungkap hubungan antara data spasial dan non-spasial. Metode pengembangan sistem mengikuti model prototyping. Model prototyping mensyaratkan adanya interaksi antara pengembang dengan pengguna dalam beberapa iterasi, dan ini sejalan dengan proses pengembangan spatial data mining menurut Chawla et al. 2001. Hasil prototyping adalah working prototype yang mengimplementasikan beberapa subset dari fungsionalitas yang diinginkan sistem. Karena penelitian ini merupakan iterasi pertama dari pengembangan sistem, maka kegiatan yang akan dilakukan adalah: 1 penentuan kebutuhan sistem, 2 perancangan cepat, 3 pembangunan prototipe, 4 pengujian prototipe oleh pengguna dan 5 perbaikan prototipe. Kegiatan ke-enam dalam prototyping yaitu pengembangan produk belum dilakukan dalam penelitian ini.

3.1. Penentuan Kebutuhan Sistem

Prototyping dimulai dengan penentuan kebutuhan sistem. Sasaran yang ingin dicapai oleh sistem dalam penelitian ini adalah: 1. Sistem mendukung teknik karakterisasi spasial. 2. Sistem mampu menampung, mengolah dan menampilkan data spasial dan non-spasial. 3. Sistem bersifat modular, terbuka dan mudah dikembangkan.

3.2. Perancangan Cepat

Perancangan cepat quick design memfokuskan representasi aspek-aspek dari sistem yang terlihat oleh pengguna, misalkan pendekatan yang akan digunakan untuk memberikan masukan ke sistem dan format keluaran yang dihasilkan oleh sistem. Gambaran umum prototipe sistem disajikan dalam diagram konteks yang diilustrasikan pada Gambar 13. Gambar 13. Diagram Konteks Prototipe Sistem Karakterisasi Spasial. Sistem akan mengolah masukan yang diberikan dan memberikan keluaran berupa wilayah yang diperluas dan aturan karakterisasi characteristic rule. Wilayah yang diperluas disajikan berupa peta sedangkan aturan karakterisasi disajikan dalam bentuk teks. Prototipe sistem karakterisasi spasial terdiri dari beberapa komponen yaitu modul pengolahan awal praproses, modul basisdata, modul spasial data mining serta modul visualisasi. Keterkaitan antar keempat komponen tersebut dapat dilihat pada Gambar 14. Gambar 14. Arsitektur aplikasi. Sistem Karakterisasi Spasial Pengguna Obyek target Wilayah yang diperluas dan aturan karakteristik Pengguna Data Podes Jabar 1996 Peta Desa Jabar 2000 Modul Pengolahan Awal Modul Basisdata Modul Spatial Data Mining • neighbourhood graph • spatial filter • neighbourhood index • algoritme karakterisasi spasial Modul Visualisasi Data Sumber