Penentuan Kebutuhan Sistem Perancangan Cepat

Gambar 13. Diagram Konteks Prototipe Sistem Karakterisasi Spasial. Sistem akan mengolah masukan yang diberikan dan memberikan keluaran berupa wilayah yang diperluas dan aturan karakterisasi characteristic rule. Wilayah yang diperluas disajikan berupa peta sedangkan aturan karakterisasi disajikan dalam bentuk teks. Prototipe sistem karakterisasi spasial terdiri dari beberapa komponen yaitu modul pengolahan awal praproses, modul basisdata, modul spasial data mining serta modul visualisasi. Keterkaitan antar keempat komponen tersebut dapat dilihat pada Gambar 14. Gambar 14. Arsitektur aplikasi. Sistem Karakterisasi Spasial Pengguna Obyek target Wilayah yang diperluas dan aturan karakteristik Pengguna Data Podes Jabar 1996 Peta Desa Jabar 2000 Modul Pengolahan Awal Modul Basisdata Modul Spatial Data Mining • neighbourhood graph • spatial filter • neighbourhood index • algoritme karakterisasi spasial Modul Visualisasi Data Sumber Data Sumber Spatial data mining melibatkan data spasial dan data non-spatial atribut. Data spasial yang digunakan dalam penelitian ini adalah peta batas administrasi desa Propinsi Jawa Barat tahun 2000, termasuk Banten yang sekarang menjadi propinsi tersendiri. Jumlah desa yang terlibat adalah 7327 desa Gambar 15. Peta batas administrasi desa didapat dalam format ESRI shapefile shp. Gambar 15. Peta batas administrasi desa Propinsi Jawa Barat tahun 2000 Pada peta batas administrasi desa melekat beberapa atribut yaitu: • ID2000 : nomor identitas desa yang ditetapkan BPS tahun 2000 • Propinsi : nama propinsi • Kab_Kota : nama kabupaten atau kota • Kecamatan : nama kecamatan • Desa : nama desa Data atribut yang digunakan adalah data Podes 2003 yang didapat dalam format SAS SSD. Secara umum data Podes 2003 berisi: • Karakteristik desa • Populasi, perumahan dan lingkungan • Fasilitas Pendidikan • Fasilitas Sosial-budaya • Fasilitas Rekreasi dan hiburan • Fasilitas Kesehatan • Fasilitas Transportasi • Penggunaan Lahan • Kondisi Ekonomi • Unit Finansial Desa • Karakteristik Kepala Desa Modul Pengolahan Awal Dalam pengolahan awal pra-proses terdapat kegiatan data cleaning, integrasi, seleksi dan transformasi. a. Data cleaning dilakukan untuk menangani data yang hilang atau data yang tidak benar. Jumlah poligon pada peta Jabar 2000 adalah 7327 sedangkan jumlah kode desa yang berbeda pada Podes 2003 adalah 7234 , untuk itu perlu dilakukan data cleaning. b. Integrasi dilakukan untuk menggabungkan data dari berbagai sumber yang berbeda. Penelitian menggunakan data atribut desa dan data spasial desa. Agar dapat menggabungkan data atribut desa dengan data spasial desa maka diperlukan atribut kunci yaitu kode desa. Untuk itu dilakukan pemeriksaan kode desa pada kedua data agar sesuai. c. Seleksi digunakan untuk memilih data yang relevan untuk analisis. Santoso A pada tahun 2000. melakukan penelitian tentang kriteria desa miskin berdasarkan konsumsi kalori keluarga dan hubungannya dengan potensi desa. Data yang digunakan pada penelitian tersebut adalah Podes 196. Penelitian tersebut menghasilkan model regresi prediksi persentase keluarga miskin Y untuk desa di propinsi Jawa Barat sebagai berikut : Y= 40.00 + 4.99 X2 – 0.115 X4 + 0.00850 X8 + 0.466 X9 + 3.45 X13 – 6.18 X14 + 4.26 X15 + 0.835 X17 - 0.078 X19 – 1.65 X21+ 0.707 X22 + 2.84 X23 Daftar kelompoknama dan jenis peubah yang terlibat dalam penelitian Santoso 2000 terdapat pada Tabel 1. Tabel 1. Daftar kelompoknama dan jenis peubah Podes Santoso A, 2000 Kelompok Peubah Nama PeubahJenis Kode 1. Potensi fasilitas sosial ekonomi desa 1. Tipe LKMD 1 = aktif, 0 = tidak aktif X1 2. jalan utama desa 1 = aspal, 0 = non aspal X2 3. Sumber penghasilan sebagian besar penduduk 1 = pertanian, 0 = non-pertanian X3 4. Jarak ke rumah sakit terdekat km X4 5. Fasilitas pendidikan 1 = lebih dari SD, 0 = SD X5 6.Fasilitas kesehatan 1 = ada, 0 = tidak ada X6 7. Pasar 1= ada, 0 = tidak ada X7 8. Kepadatan penduduk km persegi X8 9. Rasio banyaknya tempat ibadah per 1000 penduduk X9 2. Fasilitas perumahan dan lingkungan 10. Sumber air minum buatan 1 = ada, 0 = tidak ada X10 11. Wabah penyakit 1 = ada, 0 = tidak ada X11 12. Bahan bakar 1 = bahan bakar minyak dan gas, 0 = non BBMG X12 13. Pembuangan sampah 1= ada, 0 = tidak ada X13 14. Jamban 1 = jamban sendiri, 0 = jamban bersama X14 15. Keberadaan pelanggan koranmajalah 1= ada, 0 = tidak ada X15 3. Kependudukan 16. Persentase rumah tangga tani X16 17. Persentase rumah tangga yang menyekolahkan anakfamili ke perguruan tinggi X17 18. Persentase rumah tangga yang menggunakan listrik X18 19. Persentase rumah tangga yg memiliki TV X19 20.Persentase rumah tangga yang memiliki telepon X20 21. Persentase rumah tangga yang memiliki kendaraan roda 4 X21 22. Persentase rumah tangga yang memiliki kendaraan roda 2 atau 3 X22 23. Rata-rata anggota rumah tangga X23 24. Persentase rumah sederhana X24 Dari 17 atribut Podes yang digunakan dalam penelitian Santoso 2000, untuk pengembangan prototipe ini dicobakan lima atribut yaitu. 1. Tipe jalan utama desa 2. Jarak desa ke rumah sakit terdekat 3. Cara pembuangan sampah 4. Tempat buang air besar 5. Keberadaan pelanggan koranmajalah Atribut lainnya dapat dilibatkan jika prototipe ini telah terbukti dapat bekerja dengan baik. d. Transformasi dimana data dari beberapa sumber yang berbeda dikonversi ke dalam bentuk yang dapat diproses. Algoritma karakterisasi spasial bekerja dengan atribut kategorik, sehingga atribut yang memiliki tipe numerik harus ditransformasi menjadi kategorik diskretisasi. Dari lima atribut yang dipilih, hanya satu yang bertipe numerik yaitu jarak desa ke rumah sakit terdekat. Gambar 16 memperlihatkan histogram dari peubah ini. Dari histogram tersebut, jarak desa ke rumah sakit dibagi ke dalam tiga kelas yaitu dekat 0-30 km, sedang 30 – 60 km dan jauh 60 km 100 80 60 40 20 X4 500 400 300 200 100 Fr equency Mean = 23.4 Std. Dev. = 22.755 N = 6,248 Gambar 16. Histogram jarak desa ke rumah sakit Modul Spatial Data Mining Proses-proses dalam modul spasial diperlihatkan pada Gambar 17. Gambar 17. Proses dalam modul spasial Menghitung frequency factor Loading Data Peta Peta Jabar Jabar Membangun neighbourhood graph Adjacency Membangun neighbourhood index Index Membentuk path Obyek Target path Data Atribut Desa Membentuk aturan karakterisasi spasial Aturan karakterisasi spasial a. Loading Data Peta Peta desa dimuat ke dalam lingkungan Matlab menggunakan fungsi shaperead yang terdapat dalam Mapping Toolbox. Fungsi shaperead akan membaca file shapefile shp dan menyimpannya sebagai struc array dengan field sebagai berikut: • Geometry : tipe obyek spasial misal point, line atau polygon • BoundingBox : berisi koordinat dua titik MBR Minimum Bounding Rectangle yaitu x-min, y-min dan x-max,y-max • X : merupakan array dari koordinat X titik-titik yang menyusun obyek • Y : merupakan array dari koordinat Y titik-titik yang menyusun obyek • X1 : merupakan koordinat X titik tengah obyek • Y1 : merupakan koordinat Y titik tengah obyek • Serta atribut yang melekat pada shapefile misal kode_desa, nama_desa dan sebagainya b. Membangun neighbourhood graph Neighbourhood graph disimpan dalam sebuah matriks NxN. Elemen pada baris i dan kolom j bernilai 1 jika obyek ke-i dan obyek ke-j merupakan tetangga dan bernilai 0 jika selainnya. Untuk membentuk neighbourhood graph dilakukan pekerjaan berikut ini • Untuk semua obyek ke-i periksa apakah MBR obyek ke-i berpotongan dengan MBR obyek ke-k. Gambar 18a memperlihatkan sebuah obyek dengan MBR-nya, sedangkan Gambar 18b memperlihatkan tiga kemungkinan dimana MBR dua buah obyek berpotongan. a b Gambar 18. Minimum Bounding Rectangle MBR • Untuk semua obyek ke-i dan obyek ke-k yang memenuhi syarat di atas, periksa apakah kedua obyek merupakan tetangga. Dalam penelitian ini didefinisikan dua buah desa merupakan tetangga jika dan hanya jika poligon batas kedua desa berpotongan di lebih satu titik. Gambar 19 merupakan visualisasi dari neighbourhood graph. Gambar 19. Visualisasi neighbourhood graph. c. Membangun neighbourhood index Karena Neighbourhood graph berukuran N x N maka diperlukan sebuah indeks agar proses pembacaan hubungan antara dua obyek lebih cepat, tidak dihitung berkali-kali setiap diminta. Hubungan spasial yang disimpan dalam neighbourhood index dalam penelitian ini adalah hubungan jarak dan hubungan arah. Hubungan topologi tidak disimpan dalam indeks karena berdasarkan batasan yang diterapkan pada pembentukan neighbourhood graph maka hanya memiliki satu hubungan topologi yaitu berdampingan adjacent. d. Membentuk path Proses pembentukan path dilakukan melalui tahapan berikut • Tentukan obyek target. Dalam penelitian ini, obyek target merupakan subset dari desa yang termasuk kelas miskin berdasarkan Santoso A 2000. Sumber data penelitian Santoso A 2000 meliputi 7 kabupaten di Jawa Barat yaitu : Pandeglang, Serang, Bogor, Bandung, Cirebon, Indramayu dan Garut. Pemilihan kabupaten tersebut didasarkan atas pertimbangan bahwa kabupaten yang dipilih merupkan kabupaten dengan persentase desa miskin menurut kriteria BPS tahun 1995 dari desa yang terkena Susenas cukup besar yaitu sekitar 50 persen. Sehingga diperoleh jumlah desa miskin yang cukup mewakili untuk desa-desa di pulau Jawa. Disamping pertimbangan di atas ada pertimbangan lain, misalnya topografi dan kondisi geografis. Data desa miskin menurut Santoso A 2000 terdapat di Lampiran 1. • Bentuk path dengan panjang 2 node Gambar 20 merupakan visualisasi path dengan panjang 2 node untuk dua buah titik target. Gambar 20. Visualisasi path dengan panjang 2 node • Bentuk path perluasan dengan menerapkan filter spasial Gambar 21 merupakan visualisasi path dengan panjang 3 node untuk dua buah titik target. Gambar 21. Visualisasi path dengan panjang 3 node e. Menghitung frequency factor Dalam menghitung frequency factor dari atribut akan diperhatikan pengaruh dari panjang path max-neighbours s dan nilai ambang significance f. Membentuk aturan karakterisasi spasial Selanjutkan dilakukan pembentukan aturan klasifikasi spasial dengan pola sebagai berikut Modul Basisdata Sistem manajemen basis data SQL Server 2000 akan digunakan untuk menyimpan neighbourhood indeks agar proses pencarian hubungan antar dua obyek lebih cepat. Modul Visualisasi Visualisasi diperlukan untuk mempermudah pemahaman dan pengecekan proses. Visualisasi akan menggunakan Mapping Toolbox pada Matlab.

3.3. Pembangunan Prototipe

Hasil dari perancangan cepat digunakan untuk pembangunan prototipe. Prototipe ini akan dievaluasi oleh pengguna dan digunakan untuk memperbaiki kebutuhan sistem dari perangkat lunak yang akan dikembangkan. Pengembang dapat menggunakan potongan program yang sudah ada atau perangkat lunak pembantu tools agar working prototype dihasilkan lebih cepat. Perangkat lunak yang digunakan dalam pembangunan prototipe spatial data mining ini antara lain: • Microsoft Windows 2000 sebagai sistem operasi • Matlab dengan Mapping Toolbox sebagai lingkungan pemrograman • SQL Server 2000 sebagai sistem manajemen basisdata • SAS 6.1.2 dan SPSS 10 sebagai perangkat pengolahan data • Weka sebagai perangkat data mining • ArcGIS 9.2 sebagai perangkat pengolah data spasial misal merge, dissolve peta Perangkat keras yang digunakan dalam pembangunan prototipe spatial data mining ini adalah personal komputer dengan spesifikasi Prosesor Intel Pentium IV 1.6 Ghz, RAM 2 Gb dan Harddisk 80 Gb.

3.4. Pengujian Prototipe oleh Pengguna

Tahap ini akan menguji kinerja prototipe. Faktor yang diamati dalam penelitian ini adalah hal yang mempengaruhi aturan karakterisasi yang dihasilkan prototipe, misalnya nilai konstanta significance dan jenis predicate filter

3.5 Perbaikan Prototipe

Aturan yang didapat dari proses ekstraksi pola tidak selalu menarik atau dapat digunakan secara langsung. Aturan yang diperoleh akan dikonfirmasi kepada pakar ekonomi geografi , apakah sesuai dengan aturan penentuan desa miskin yang selama ini digunakan atau sesuai dengan kenyataan di lapangan. Selain itu perbaikan juga dapat dilakukan secara teknis untuk meningkatkan kinerja prototipe. HASIL DAN PEMBAHASAN

3.1 Loading data peta

Peta digital desa di Jawa Barat dan Banten tahun 2000 didapat dalam format Mapinfo per masing-masing provinsi. Peta kedua peta kemudian dikonversi ke dalam format Shapefile dan digabung menjadi satu. Selanjutnya peta shapefile dimuat loading ke dalam lingkungan Matlab menggunakan fungsi shaperead yang tersedia di Matlab Mapping Toolbox. Dalam Matlab, peta desa disimpan sebagai variabel S JabarS.mat dengan tipe struct. Nomor indeks pada variabel S merepresentasikan urutan obyek bersangkutan dalam shapefile. Alur loading data peta disajikan pada Gambar 22, sedangkan ilustrasi struktur variabel S digambarkan sebagai berikut Gambar 23. Gambar 22. Alur loading data peta Gambar 23. Struktur Variabel S Shaperead JabarS.mat Add Index Jabar.shp 1 7327 2 S 7327x1 struct array Geometry BoundingBox X Y Jabar_ID Area Perimeter Prop_No KabKota_No Kec_No Desa_No ID2000 Propinsi Kab_Kota Kecamatan Desa Jabar96_ID X1 Y1 S 1,1 X min X max Y min Y max S 1,1.BoundingBox S 1,1.X S 1,1.Y