Karakterisasi Spasial Pengembangan Prototipe Spatial Data Mining Untuk Karakterisasi Desa Miskin di Jawa Barat
keseluruhan basisdata a description of the spatial and non-spatial properties which are typical for the target objects, but not for the whole database
”. Sifat yang menjadi perhatian adalah frekuensi relatif nilai atribut non-spasial dan
frekuensi relatif tipe obyek yang berbeda. Perbedaan frekuensi relatif dalam basisdata dengan frekuensi relatif dalam daerah target diperlihatkan pada
Gambar 4.
Gambar 4. Frekuensi sampel dan perbedaannya Atribut spasial dan non-spasial digambarkan dalam Gambar 5.
Gambar 5. Atribut spasial dan non-spasial
Berikut ini adalah beberapa batasan yang digunakan dalam teknik karakterisasi spasial :
Definisi 1 : Hubungan Spasial
Untuk melakukan karakterisasi spasial, tidak hanya sifat dari obyek target yang diperhatikan melainkan juga sifat obyek tetangga.Hubungan satu obyek
dengan obyek tetangganya dapat dinyatakan dalam tiga bentuk Ester et al, 2001: 1.
Hubungan Topologi : berdasarkan batas, interior atau komplemen dari dua obyek. Contoh hubungan yang mungkin terjadi adalah Gambar 6:
Gambar 6. Contoh hubungan topologi sumber : Egenhofer et al. 1989 dalam Shekhar dan Chawla, 2003.
2. Hubungan Jarak : membandingkan jarak dua obyek dengan sebuah
konstanta menggunakan operator pembanding aritmatik. Hubungan jarak dinyatakan sebagai DistanceO
1
,O
2 σ
c dengan O
1 :
obyek pertama, O
2
: obyek kedua, σ
: , atau =, c :
konstanta.
Ilustrasi hubungan jarak diperlihatkan pada Gambar 7.
Gambar 7. Contoh hubungan jarak sumber :Ester et al, 2001 3.
Hubungan Arah atau Orientasi : obyek pertama sebagai sistem koordinat virtual, quadrant dan half-plane menentukan arahnya Gambar 8.
Gambar 8. Contoh hubungan arah sumber :Ester et al, 2001
Definisi 2 : neighborhood graph and paths
Ditetapkan neighborhood sebagai hubungan tetangga dan DB sebagai basisdata obyek spasial. Sebuah neighborhood graph
E N
G
DB neighbor
, =
adalah
sebuah graph dengan node N=DB dan edge NxN
E ⊆
dimana sebuah edge e =n
1
,n
2
ada jika dan hanya jika terdapat neighborn
1
,n
2
. Hubungan neighborn
1
,n
2
dapat berupa hubungan topologi, jarak atau arah. Gambar 9
memperlihatkan sebuah basisdata obyek spasial DB serta dua buah neighborhood
graph dengan hubungan topologi meet dan hubungan arah north.
Gambar 9. Contoh Neighborhood Graph
Sebuah neighborhood path dengan panjang k didefinisikan sebagai untaian
node [n
1
,n
2
,….n
k
] dimana neighbor n
i
, n
i+1
terjadi untuk semua k
i N
n
i
≤ ∈ 1
, .
Definisi 3 : Operasi pada neighborhood graph
Terdapat beberapa operasi yang dilakukan pada sebuah neighborhood graph graf tetangga yaitu Ester et al, 2001:
1. Neighbours:
Graphs x Objects x Predicates Æ Sets_of_objects
Operasi Neighbours
menghasilkan himpunan semua obyek set of objects yang terhubung dengan object pada graph yang memenuhi kondisi yang
dinyatakan dalam predicates. 2.
Path:
Sets_of_objects Æ set_of_path
Operasi path menghasilkan semua path dengan panjang l yang dibentuk oleh sebuah elemen tunggal dari obyek.
3. Extensions:
Graphs x Sets_of_path x integer x predicates Æ sets_of_path
Operasi Extensions menghasilkan himpunan semua path set_of_all_path dengan panjang tertentu integer pada graph yang merupakan perpanjangan
sebuah elemen dari path.
Definisi 4 : Filter Predikat Predicates Filter
Ketika bergerak dari sebuah obyek menuju obyek lainnya dalam graf, dapat digunakan beberapa filter yaitu Ester et al, 2001:
1. Starlike Filter
Ketika memperpanjang sebuah path p = [n
1
,n
2
,….n
k
] dengan sebuah node n
k+1
, maka arah terakhir yang pasti exact “final” direction dari p tidak dapat digeneralisasi. Sebagai contoh, sebuah path dengan arah terakhir
tenggara maka hanya dapat diperpanjang dengan sebuah node dari sebuah edge yang memiliki arah tenggara.
2. Variable Starlike Filter
Variable starlike
filter memungkinkan path yang lebih halus, dengan hanya
mensyaratkan ketika memperpanjang path p maka edge n
k
, n
k+1
paling tidak
memenuhi arah awal yang pasti exact “initial” direction dari path p. Sebagai contoh, sebuah path dengan arah awal utara dapat diperpanjang
sehingga arah path tersebut tetap utara atau menjadi tenggara.
3. Vertical Starlike Filter
Filter ini merupakan bentuk khusus dari starlike filter dimana filter kurang ketat ke arah vertikal dibandingkan ke arah horizontal. Filter ini digunakan
jika memerlukan analisis lebih rinci ke arah vertikal. Ilustrasi dari masing-masing filter dapat dilihat pada Gambar 10.
Gambar 10. Filter Predicates sumber :Ester et al, 2001
Definisi 5 : Neighbourhood Index
Neighbourhood Index adalah sebuah tabel yang mencatat hubungan
antarobyek dalam basisdata spasial. Neighbourhood index untuk DB dengan jarak maksimum max, dinyatakan sebagai berikut
{ }
2 1
1 2
2 1
2 1
2 1
max
max ,
, |
, ,
, ,
TO O
DO O
dist O
jarak O
DB O
O T
D dist
O O
I
dist DB
≤ ∈
=
=
dengan DB sebagai sebuah himpunan obyek spasial, max dan dist adalah bilangan real, D adalah hubungan arah direction relation dan T adalah hubungan topologi
topological relation. Ilustrasi Neighbourhood Index pada Gambar 11.
Gambar 11. Contoh Neighbourhood Index
Definisi 6: Karakterisasi Spasial
Karakterisasi spasial adalah aturan yang menjelaskan sifat atribut untuk sebuah wilayah dibandingkan dengan sifat atribut tersebut pada keseluruhan
basisdata. Ditetapkan
DB neighbour
G adalah s neighbourhood graph dan target adalah
subset dari basisdata spasial DB. Ditetapkan freq
s
prop yang menyatakan jumlah
kemunculan sifat prop dalam himpunan s dan cards menyatakan kardinalitas dari s. Frequency factor dari prop terhadap targets dan DB dinyatakan dalam
arg
arg arg
DB card
prop freq
ets t
card prop
freq prop
f
DB ets
t DB
ets t
=
Ditetapkan significance dan proportion sebagai bilangan real dan max- neighbours
sebagai bilangan natural. Neighbours s
S
i G
menyatakan himpunan dari seluruh obyek yang dapat dicapai dari satu elemen s dengan berjalan paling
banyak i edge dari graph tetangga G. Kemudian, pekerjaan karakterisasi spasial adalah untuk menemukan setiap
sifat prop dan setiap bilangan natural n = max-neighbours sehingga 1.
himpunan objects = arg
ets t
neighbours
n G
dan 2.
himpunan objects = }
{t neighbours
n G
untuk proportion paling kecil terdapat
∈ t
target yang memenuhi kondisi,
Proses karakterisasi spasial menghasilkan aturan rule dalam bentuk Aturan ini bermakna bahwa untuk himpunan dari seluruh target yang
diperluas oleh neighbours n
i
, sifat p
i
muncul dalam basisdata lebih banyak atau lebih sedikit dari freq-fac
i.
. Contoh rule yang dihasilkan adalah sebagai berikut
Obyek dengan tingkat penduduk pensiun tinggi Î Apartemen per gedung = sangat rendah 0.91
tingkat orang asing = sangat rendah 0.89 tingkat akademisi = sedang 0.63
rata-rata ukuran perusahaan = sangat rendah 0.58 tipe obyek = pegunungan 3.41
Obyek target dan wilayah yang diperluas dengan tetangganya dapat dilihat pada Gambar 12.
Gambar 12. Obyek target dan wilayah yang diperluas sumber: Ester et al. 2001. Sehingga secara umum algoritma spatial characterization adalah sebagai
berikut
karakterisasi graph
DB r
G
; himpunan obyek target; real significance, proportion; integer max- neighbors
inisialisasi himpunan karakterisasi sebagai himpunan kosong;
inisialisasi himpunan region menjadi target; inisialisasi n dengan 0;
hitung
prop frekuensi
DB
untuk semua sifat prop = atribut, nilai;
while n ≤ max-neighbors do
for each
atribut pada
DB dan untuk atribut khusus tipe obyek do for
each nilai dari atribut do
hitung
prop frekuensi
region
untuk semua sifat prop = atribut, nilai;
if
ce significan
prop f
DB region
≥
or
ce significan
prop f
DB region
1 ≤
then
tambahkan prop, n,
prop f
DB region
ke dalam himpunan karakterisasi;
if n max-neighbors then for
each obyek dalam region do
tambahkan neighbors
DB r
G
, obyek, TRUE ke dalam region;
tambahkan nilai n dengan 1; ekstrak semua tuple prop, n,
prop f
DB region
dari karakterisasi yang signifikan di dalam paling sedikit
proportion region dengan n perluasan;
return aturan yang dihasilkan dari karakterisasi;
METODOLOGI PENELITIAN
Penelitian ini mengembangkan sistem spatial data mining untuk melakukan karakterisasi desa miskin di Propinsi Jawa Barat. Dengan sistem tersebut
diharapkan dapat mengungkap hubungan antara data spasial dan non-spasial. Metode pengembangan sistem mengikuti model prototyping. Model prototyping
mensyaratkan adanya interaksi antara pengembang dengan pengguna dalam beberapa iterasi, dan ini sejalan dengan proses pengembangan spatial data mining
menurut Chawla et al. 2001. Hasil prototyping adalah working prototype yang mengimplementasikan beberapa subset dari fungsionalitas yang diinginkan
sistem. Karena penelitian ini merupakan iterasi pertama dari pengembangan sistem, maka kegiatan yang akan dilakukan adalah: 1 penentuan kebutuhan
sistem, 2 perancangan cepat, 3 pembangunan prototipe, 4 pengujian prototipe oleh pengguna dan 5 perbaikan prototipe. Kegiatan ke-enam dalam prototyping
yaitu pengembangan produk belum dilakukan dalam penelitian ini.