Penentuan Kebutuhan Sistem Perancangan Cepat
Gambar 13. Diagram Konteks Prototipe Sistem Karakterisasi Spasial. Sistem akan mengolah masukan yang diberikan dan memberikan keluaran
berupa wilayah yang diperluas dan aturan karakterisasi characteristic rule. Wilayah yang diperluas disajikan berupa peta sedangkan aturan karakterisasi
disajikan dalam bentuk teks. Prototipe sistem karakterisasi spasial terdiri dari beberapa komponen yaitu
modul pengolahan awal praproses, modul basisdata, modul spasial data mining serta modul visualisasi. Keterkaitan antar keempat komponen tersebut dapat
dilihat pada Gambar 14.
Gambar 14. Arsitektur aplikasi.
Sistem Karakterisasi
Spasial Pengguna
Obyek target Wilayah yang diperluas dan
aturan karakteristik Pengguna
Data Podes Jabar 1996
Peta Desa Jabar 2000
Modul Pengolahan
Awal
Modul Basisdata
Modul Spatial Data Mining
•
neighbourhood graph
•
spatial filter
•
neighbourhood index
•
algoritme karakterisasi spasial
Modul Visualisasi
Data Sumber
Data Sumber
Spatial data mining melibatkan data spasial dan data non-spatial atribut. Data spasial yang digunakan dalam penelitian ini adalah peta batas administrasi
desa Propinsi Jawa Barat tahun 2000, termasuk Banten yang sekarang menjadi propinsi tersendiri. Jumlah desa yang terlibat adalah 7327 desa Gambar 15. Peta
batas administrasi desa didapat dalam format ESRI shapefile shp.
Gambar 15. Peta batas administrasi desa Propinsi Jawa Barat tahun 2000 Pada peta batas administrasi desa melekat beberapa atribut yaitu:
• ID2000
: nomor identitas desa yang ditetapkan BPS tahun 2000 •
Propinsi : nama propinsi
• Kab_Kota : nama kabupaten atau kota
• Kecamatan : nama kecamatan
• Desa
: nama desa Data atribut yang digunakan adalah data Podes 2003 yang didapat dalam
format SAS SSD. Secara umum data Podes 2003 berisi: •
Karakteristik desa •
Populasi, perumahan dan lingkungan •
Fasilitas Pendidikan
• Fasilitas Sosial-budaya
• Fasilitas Rekreasi dan hiburan
• Fasilitas Kesehatan
• Fasilitas Transportasi
• Penggunaan Lahan
• Kondisi Ekonomi
• Unit Finansial Desa
• Karakteristik Kepala Desa
Modul Pengolahan Awal
Dalam pengolahan awal pra-proses terdapat kegiatan data cleaning, integrasi, seleksi dan transformasi.
a. Data cleaning dilakukan untuk menangani data yang hilang atau data yang
tidak benar. Jumlah poligon pada peta Jabar 2000 adalah 7327 sedangkan jumlah
kode desa yang berbeda pada Podes 2003 adalah 7234 , untuk itu perlu dilakukan data cleaning.
b. Integrasi dilakukan untuk menggabungkan data dari berbagai sumber yang
berbeda. Penelitian menggunakan data atribut desa dan data spasial desa. Agar
dapat menggabungkan data atribut desa dengan data spasial desa maka diperlukan atribut kunci yaitu kode desa. Untuk itu dilakukan pemeriksaan
kode desa pada kedua data agar sesuai. c.
Seleksi digunakan untuk memilih data yang relevan untuk analisis. Santoso A pada tahun 2000. melakukan penelitian tentang kriteria
desa miskin berdasarkan konsumsi kalori keluarga dan hubungannya dengan potensi desa. Data yang digunakan pada penelitian tersebut adalah Podes
196. Penelitian tersebut menghasilkan model regresi prediksi persentase keluarga miskin Y untuk desa di propinsi Jawa Barat sebagai berikut :
Y= 40.00 + 4.99 X2 – 0.115 X4 + 0.00850 X8 + 0.466 X9 + 3.45 X13 – 6.18 X14 + 4.26 X15 + 0.835 X17 - 0.078 X19 – 1.65 X21+ 0.707 X22 +
2.84 X23
Daftar kelompoknama dan jenis peubah yang terlibat dalam penelitian Santoso 2000 terdapat pada Tabel 1.
Tabel 1. Daftar kelompoknama dan jenis peubah Podes Santoso A, 2000
Kelompok Peubah
Nama PeubahJenis Kode
1. Potensi fasilitas sosial
ekonomi desa 1. Tipe LKMD 1 = aktif, 0 = tidak aktif
X1 2. jalan utama desa 1 = aspal, 0 = non aspal
X2 3. Sumber penghasilan sebagian besar
penduduk 1 = pertanian, 0 = non-pertanian X3
4. Jarak ke rumah sakit terdekat km X4
5. Fasilitas pendidikan 1 = lebih dari SD, 0 = SD
X5 6.Fasilitas kesehatan 1 = ada, 0 = tidak ada X6
7. Pasar 1= ada, 0 = tidak ada X7
8. Kepadatan penduduk km persegi X8
9. Rasio banyaknya tempat ibadah per 1000 penduduk
X9 2. Fasilitas
perumahan dan lingkungan
10. Sumber air minum buatan 1 = ada, 0 = tidak ada
X10 11. Wabah penyakit 1 = ada, 0 = tidak ada
X11 12. Bahan bakar 1 = bahan bakar minyak dan
gas, 0 = non BBMG X12
13. Pembuangan sampah 1= ada, 0 = tidak ada
X13 14. Jamban 1 = jamban sendiri, 0 = jamban
bersama X14
15. Keberadaan pelanggan koranmajalah 1= ada, 0 = tidak ada
X15 3.
Kependudukan 16. Persentase rumah tangga tani
X16 17. Persentase rumah tangga yang
menyekolahkan anakfamili ke perguruan tinggi
X17 18. Persentase rumah tangga yang
menggunakan listrik X18
19. Persentase rumah tangga yg memiliki TV X19 20.Persentase rumah tangga yang memiliki
telepon X20
21. Persentase rumah tangga yang memiliki kendaraan roda 4
X21 22. Persentase rumah tangga yang memiliki
kendaraan roda 2 atau 3 X22
23. Rata-rata anggota rumah tangga X23
24. Persentase rumah sederhana X24
Dari 17 atribut Podes yang digunakan dalam penelitian Santoso 2000, untuk pengembangan prototipe ini dicobakan lima atribut yaitu.
1. Tipe jalan utama desa 2. Jarak desa ke rumah sakit terdekat
3. Cara pembuangan sampah 4. Tempat buang air besar
5. Keberadaan pelanggan koranmajalah Atribut lainnya dapat dilibatkan jika prototipe ini telah terbukti dapat
bekerja dengan baik. d. Transformasi dimana data dari beberapa sumber yang berbeda dikonversi ke
dalam bentuk yang dapat diproses. Algoritma karakterisasi spasial bekerja dengan atribut kategorik,
sehingga atribut yang memiliki tipe numerik harus ditransformasi menjadi kategorik diskretisasi. Dari lima atribut yang dipilih, hanya satu yang
bertipe numerik yaitu jarak desa ke rumah sakit terdekat. Gambar 16 memperlihatkan histogram dari peubah ini. Dari histogram tersebut, jarak
desa ke rumah sakit dibagi ke dalam tiga kelas yaitu dekat 0-30 km, sedang 30 – 60 km dan jauh 60 km
100 80
60 40
20
X4
500 400
300 200
100
Fr equency
Mean = 23.4 Std. Dev. = 22.755
N = 6,248
Gambar 16. Histogram jarak desa ke rumah sakit
Modul Spatial Data Mining
Proses-proses dalam modul spasial diperlihatkan pada Gambar 17.
Gambar 17. Proses dalam modul spasial
Menghitung frequency
factor
Loading Data
Peta Peta Jabar
Jabar
Membangun neighbourhood
graph
Adjacency
Membangun neighbourhood
index
Index
Membentuk path
Obyek Target
path
Data Atribut Desa
Membentuk aturan
karakterisasi spasial
Aturan karakterisasi
spasial
a. Loading Data Peta
Peta desa dimuat ke dalam lingkungan Matlab menggunakan fungsi
shaperead
yang terdapat dalam Mapping Toolbox. Fungsi
shaperead
akan membaca file shapefile shp dan menyimpannya sebagai struc array dengan
field sebagai berikut: •
Geometry : tipe obyek spasial misal point, line atau polygon •
BoundingBox : berisi koordinat dua titik MBR Minimum Bounding Rectangle yaitu x-min, y-min dan x-max,y-max
• X : merupakan array dari koordinat X titik-titik yang menyusun obyek
• Y : merupakan array dari koordinat Y titik-titik yang menyusun obyek
• X1 : merupakan koordinat X titik tengah obyek
• Y1 : merupakan koordinat Y titik tengah obyek
• Serta atribut yang melekat pada shapefile misal kode_desa,
nama_desa dan sebagainya b.
Membangun neighbourhood graph Neighbourhood graph disimpan dalam sebuah matriks NxN. Elemen pada
baris i dan kolom j bernilai 1 jika obyek ke-i dan obyek ke-j merupakan tetangga dan bernilai 0 jika selainnya. Untuk membentuk neighbourhood
graph dilakukan pekerjaan berikut ini •
Untuk semua obyek ke-i periksa apakah MBR obyek ke-i berpotongan dengan MBR obyek ke-k. Gambar 18a memperlihatkan sebuah
obyek dengan MBR-nya, sedangkan Gambar 18b memperlihatkan tiga kemungkinan dimana MBR dua buah obyek berpotongan.
a b
Gambar 18. Minimum Bounding Rectangle MBR
• Untuk semua obyek ke-i dan obyek ke-k yang memenuhi syarat di
atas, periksa apakah kedua obyek merupakan tetangga. Dalam penelitian ini didefinisikan dua buah desa merupakan tetangga jika
dan hanya jika poligon batas kedua desa berpotongan di lebih satu titik. Gambar 19 merupakan visualisasi dari neighbourhood graph.
Gambar 19. Visualisasi neighbourhood graph. c.
Membangun neighbourhood index Karena Neighbourhood graph berukuran N x N maka diperlukan
sebuah indeks agar proses pembacaan hubungan antara dua obyek lebih cepat, tidak dihitung berkali-kali setiap diminta. Hubungan spasial yang
disimpan dalam neighbourhood index dalam penelitian ini adalah hubungan jarak dan hubungan arah. Hubungan topologi tidak disimpan dalam indeks
karena berdasarkan batasan yang diterapkan pada pembentukan neighbourhood graph maka hanya memiliki satu hubungan topologi yaitu
berdampingan adjacent. d.
Membentuk path Proses pembentukan path dilakukan melalui tahapan berikut
• Tentukan obyek target.
Dalam penelitian ini, obyek target merupakan subset dari desa yang termasuk kelas miskin berdasarkan Santoso A 2000. Sumber data
penelitian Santoso A 2000 meliputi 7 kabupaten di Jawa Barat yaitu
: Pandeglang, Serang, Bogor, Bandung, Cirebon, Indramayu dan Garut. Pemilihan kabupaten tersebut didasarkan atas pertimbangan
bahwa kabupaten yang dipilih merupkan kabupaten dengan persentase desa miskin menurut kriteria BPS tahun 1995 dari desa yang terkena
Susenas cukup besar yaitu sekitar 50 persen. Sehingga diperoleh jumlah desa miskin yang cukup mewakili untuk desa-desa di pulau
Jawa. Disamping pertimbangan di atas ada pertimbangan lain, misalnya topografi dan kondisi geografis. Data desa miskin menurut
Santoso A 2000 terdapat di Lampiran 1. •
Bentuk path dengan panjang 2 node Gambar 20 merupakan visualisasi path dengan panjang 2 node untuk
dua buah titik target.
Gambar 20. Visualisasi path dengan panjang 2 node •
Bentuk path perluasan dengan menerapkan filter spasial Gambar 21 merupakan visualisasi path dengan panjang 3 node untuk
dua buah titik target.
Gambar 21. Visualisasi path dengan panjang 3 node e.
Menghitung frequency factor Dalam menghitung frequency factor dari atribut akan diperhatikan pengaruh
dari panjang path max-neighbours s dan nilai ambang significance f.
Membentuk aturan karakterisasi spasial Selanjutkan dilakukan pembentukan aturan klasifikasi spasial dengan pola
sebagai berikut
Modul Basisdata
Sistem manajemen basis data SQL Server 2000 akan digunakan untuk menyimpan neighbourhood indeks agar proses pencarian hubungan antar dua
obyek lebih cepat.
Modul Visualisasi
Visualisasi diperlukan untuk mempermudah pemahaman dan pengecekan proses. Visualisasi akan menggunakan Mapping Toolbox pada Matlab.