Pengembangan Prototipe Spatial Data Mining Untuk Karakterisasi Desa Miskin di Jawa Barat

(1)

PENGEMBANGAN PROTOTIPE SPATIAL DATA MINING

UNTUK KARAKTERISASI DESA MISKIN DI JAWA BARAT

HARI AGUNG ADRIANTO

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

BOGOR

2007


(2)

Dengan ini saya menyatakan bahwa tesis Pengembangan Prototipe Spatial Data Mining Untuk Karakterisasi Desa Miskin di Jawa Barat adalah karya saya sendiri dengan arahan Komisi Pembimbing dan belum diajukan dalam bentuk apapun kepada penguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.

Bogor, Mei 2007

Hari Agung Adrianto NRP. G651020034


(3)

ABSTRAK

HARI AGUNG ADRIANTO. Pengembangan Prototipe Spatial Data Mining Untuk Karakterisasi Desa Miskin di Jawa Barat. Dibimbing oleh AGUS BUONO dan BABA BARUS.

Data mining, atau secara populer dirujuk sebagai Knowlegde discovery in databases (KDD) adalah teknik yang secara otomatis. melakukan ekstraksi pola yang merepresentasikan pengetahuan yang secara implisit tersimpan dalam basisdata besar, data warehouse, dan tempat penyimpanan yang masif lainnya. Spatial data mining berurusan dengan pencarian pengetahuan dalam basisdata spasial.Salah satu teknik dalam spatial data mining adalah karakterisasi spasial (spatial characterization). Karakterisasi spasial digunakan untuk mengungkap karakteristik atau deskripsi ringkas spasial dari sifat-sifat yang menarik pada sebuah komunitas (obyek target) tetapi tidak untuk keseluruhan basisdata. Dalam penelitian ini dilakukan pengembangan prototipe sistem yang dapat menerapkan teknik spatial data mining untuk mengungkap karakteristik spasial dari kondisi kemiskinan di Jawa Barat. Prototipe yang dihasilkan terdiri dari empat komponen yaitu modul pengolahan awal, modul spatial data mining, modul basisdata dan modul visualisasi. Modul spatial data mining tersusun atas neighbourhood graph, predicate filter, neighbourhood index dan algoritma karakterisasi spasial.


(4)

poor village characterization at West Java. Under the direction of AGUS BUONO and BABA BARUS

Data mining, also popularly referred to as Knowlegde discovery in databases (KDD), is the automated or convenient extraction of pattern representing knowledge implicitly stored in large databases, data warehouses, and other massive information repositories. Spatial data mining deal with knowledge discovery in spatial databases. One of spatial data mining task is characterization – to find a description of the spatial and non-spatial properties which are typical for the target objects but not for the whole database. In this research we developed a system prototype which can be implement spatial data mining technique to discover poor village characteristics at West Java. The prototype consist of four components : preprocessing module, spatial data mining module, database module and visualization module. Spatial data mining module consist of neighbourhood graph, predicate filter, neighbourhood index and spatial characterization algorithm.


(5)

PENGEMBANGAN PROTOTIPE SPATIAL DATA MINING

UNTUK KARAKTERISASI DESA MISKIN DI JAWA BARAT

HARI AGUNG ADRIANTO

Tesis

Sebagai salah satu syarat untuk memperoleh gelar

Magister Sains pada

Departemen Ilmu Komputer

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

BOGOR

2007


(6)

Penguji Luar Komisi Ujian Tesis : Prof. Dr.Ir. Khairil Anwar Notodiputro, M.Sc.


(7)

Judul tesis : Pengembangan Prototipe Spatial Data Mining Untuk Karakterisasi Desa Miskin di Jawa Barat Nama : Hari Agung Adrianto

NRP : G651020034

Disetujui

Komisi Pembimbing

Ir. Agus Buono, M.Si, M.Kom. Dr. Baba Barus. Ketua Anggota

Mengetahui

Ketua Program Studi Ilmu Komputer Dekan sekolah pascasarjana

Dr. Sugi Guritman Prof. Dr.Ir. Khairil Anwar Notodiputro, M.Sc.


(8)

Puji dan syukur penulis panjatkan kepada Allah SWT atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian ini adalah pengembangan prototipe spatial data mining untuk karakterisasi desa miskin di Jawa Barat.

Terima kasih penulis sampaikan kepada Bapak Ir. Agus Buono, M.Si, M.Kom. dan Bapak Dr. Baba Barus selaku pembimbing. Di samping itu, penghargaan penulis sampaikan kepada Bapak Ir. Janawir, M.Si (BPS – Jakarta), Bapak Usman, S.Si, M.Si (LPEM UI) dan Bapak Ir. Diar Shiddiq yang telah membantu pengadaan data. Terima kasih pula penulis ucapkan kepada Ibu Dr. Sri Nurdiati, Ibu Imas S. Sitanggang, S.Si, M.Kom, Bapak Ir. Irmansyah, M.Si , Bapak Firman Ardiansyah, S.Si, M.Si dan Bapak Jatmiko yang telah meminjamkan / memberikan ijin penggunaan hardware yang diperlukan dalam penelitian ini. Ungkapan terima kasih juga disampaikan kepada istri tercinta Ade Irma Rufaidah serta anak tersayang Marwa Aliifah Muthmainnah dan Qonita Hafizha atas segala pengertiannya. Tak lupa terima kasih kepada ayah, ibu, mertua, serta seluruh keluarga dan sahabat atas segala doa dan dukungannya.

Semoga karya ilmiah ini bermanfaat.

Bogor, Mei 2007


(9)

RIWAYAT HIDUP

Penulis dilahirkan di Jakarta pada tanggal 17 September 1976 dari ayah Amir Hidayat, S.H. dan ibu Muryati. Penulis merupakan anak kedua dari empat bersaudara.

Pendidikan sarjana ditempuh di Program Studi Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam IPB dan lulus pada tahun 2000. Sejak tahun 2001 penulis bekerja sebagai staf pengajar honorer di Departemen Ilmu Komputer IPB dan pada tahun 2006 diangkat sebagai PNS di lingkungan Institut Pertanian Bogor.


(10)

DAFTAR ISI

Halaman

DAFTAR TABEL ... xi

DAFTAR GAMBAR ... xii

PENDAHULUAN Latar Belakang ... 1

Formulasi Permasalahan ... 3

Ruang Lingkup ... 3

Keaslian Penelitian ... 3

Manfaat Penelitian ... 4

Tujuan Penelitian ... 4

TINJAUAN PUSTAKA Konsep dan Definisi Kemiskinan ... 5

Susenas dan Podes ... 5

Prototyping ... 6

Basis data spasial ... 8

Spatial Data Mining ... 9

Teknik Spatial Data Mining ... 10

Karakterisasi Spasial ... 11

METODOLOGI PENELITIAN Penentuan Kebutuhan Sistem ... 19

Perancangan Cepat ... 19

Data Sumber ... 21

Modul Pengolahan Awal ... 22

Modul Spatial Data Mining ... 25


(11)

PENGEMBANGAN PROTOTIPE SPATIAL DATA MINING

UNTUK KARAKTERISASI DESA MISKIN DI JAWA BARAT

HARI AGUNG ADRIANTO

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

BOGOR

2007


(12)

Dengan ini saya menyatakan bahwa tesis Pengembangan Prototipe Spatial Data Mining Untuk Karakterisasi Desa Miskin di Jawa Barat adalah karya saya sendiri dengan arahan Komisi Pembimbing dan belum diajukan dalam bentuk apapun kepada penguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.

Bogor, Mei 2007

Hari Agung Adrianto NRP. G651020034


(13)

ABSTRAK

HARI AGUNG ADRIANTO. Pengembangan Prototipe Spatial Data Mining Untuk Karakterisasi Desa Miskin di Jawa Barat. Dibimbing oleh AGUS BUONO dan BABA BARUS.

Data mining, atau secara populer dirujuk sebagai Knowlegde discovery in databases (KDD) adalah teknik yang secara otomatis. melakukan ekstraksi pola yang merepresentasikan pengetahuan yang secara implisit tersimpan dalam basisdata besar, data warehouse, dan tempat penyimpanan yang masif lainnya. Spatial data mining berurusan dengan pencarian pengetahuan dalam basisdata spasial.Salah satu teknik dalam spatial data mining adalah karakterisasi spasial (spatial characterization). Karakterisasi spasial digunakan untuk mengungkap karakteristik atau deskripsi ringkas spasial dari sifat-sifat yang menarik pada sebuah komunitas (obyek target) tetapi tidak untuk keseluruhan basisdata. Dalam penelitian ini dilakukan pengembangan prototipe sistem yang dapat menerapkan teknik spatial data mining untuk mengungkap karakteristik spasial dari kondisi kemiskinan di Jawa Barat. Prototipe yang dihasilkan terdiri dari empat komponen yaitu modul pengolahan awal, modul spatial data mining, modul basisdata dan modul visualisasi. Modul spatial data mining tersusun atas neighbourhood graph, predicate filter, neighbourhood index dan algoritma karakterisasi spasial.


(14)

poor village characterization at West Java. Under the direction of AGUS BUONO and BABA BARUS

Data mining, also popularly referred to as Knowlegde discovery in databases (KDD), is the automated or convenient extraction of pattern representing knowledge implicitly stored in large databases, data warehouses, and other massive information repositories. Spatial data mining deal with knowledge discovery in spatial databases. One of spatial data mining task is characterization – to find a description of the spatial and non-spatial properties which are typical for the target objects but not for the whole database. In this research we developed a system prototype which can be implement spatial data mining technique to discover poor village characteristics at West Java. The prototype consist of four components : preprocessing module, spatial data mining module, database module and visualization module. Spatial data mining module consist of neighbourhood graph, predicate filter, neighbourhood index and spatial characterization algorithm.


(15)

PENGEMBANGAN PROTOTIPE SPATIAL DATA MINING

UNTUK KARAKTERISASI DESA MISKIN DI JAWA BARAT

HARI AGUNG ADRIANTO

Tesis

Sebagai salah satu syarat untuk memperoleh gelar

Magister Sains pada

Departemen Ilmu Komputer

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

BOGOR

2007


(16)

Penguji Luar Komisi Ujian Tesis : Prof. Dr.Ir. Khairil Anwar Notodiputro, M.Sc.


(17)

Judul tesis : Pengembangan Prototipe Spatial Data Mining Untuk Karakterisasi Desa Miskin di Jawa Barat Nama : Hari Agung Adrianto

NRP : G651020034

Disetujui

Komisi Pembimbing

Ir. Agus Buono, M.Si, M.Kom. Dr. Baba Barus. Ketua Anggota

Mengetahui

Ketua Program Studi Ilmu Komputer Dekan sekolah pascasarjana

Dr. Sugi Guritman Prof. Dr.Ir. Khairil Anwar Notodiputro, M.Sc.


(18)

Puji dan syukur penulis panjatkan kepada Allah SWT atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian ini adalah pengembangan prototipe spatial data mining untuk karakterisasi desa miskin di Jawa Barat.

Terima kasih penulis sampaikan kepada Bapak Ir. Agus Buono, M.Si, M.Kom. dan Bapak Dr. Baba Barus selaku pembimbing. Di samping itu, penghargaan penulis sampaikan kepada Bapak Ir. Janawir, M.Si (BPS – Jakarta), Bapak Usman, S.Si, M.Si (LPEM UI) dan Bapak Ir. Diar Shiddiq yang telah membantu pengadaan data. Terima kasih pula penulis ucapkan kepada Ibu Dr. Sri Nurdiati, Ibu Imas S. Sitanggang, S.Si, M.Kom, Bapak Ir. Irmansyah, M.Si , Bapak Firman Ardiansyah, S.Si, M.Si dan Bapak Jatmiko yang telah meminjamkan / memberikan ijin penggunaan hardware yang diperlukan dalam penelitian ini. Ungkapan terima kasih juga disampaikan kepada istri tercinta Ade Irma Rufaidah serta anak tersayang Marwa Aliifah Muthmainnah dan Qonita Hafizha atas segala pengertiannya. Tak lupa terima kasih kepada ayah, ibu, mertua, serta seluruh keluarga dan sahabat atas segala doa dan dukungannya.

Semoga karya ilmiah ini bermanfaat.

Bogor, Mei 2007


(19)

RIWAYAT HIDUP

Penulis dilahirkan di Jakarta pada tanggal 17 September 1976 dari ayah Amir Hidayat, S.H. dan ibu Muryati. Penulis merupakan anak kedua dari empat bersaudara.

Pendidikan sarjana ditempuh di Program Studi Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam IPB dan lulus pada tahun 2000. Sejak tahun 2001 penulis bekerja sebagai staf pengajar honorer di Departemen Ilmu Komputer IPB dan pada tahun 2006 diangkat sebagai PNS di lingkungan Institut Pertanian Bogor.


(20)

DAFTAR ISI

Halaman

DAFTAR TABEL ... xi

DAFTAR GAMBAR ... xii

PENDAHULUAN Latar Belakang ... 1

Formulasi Permasalahan ... 3

Ruang Lingkup ... 3

Keaslian Penelitian ... 3

Manfaat Penelitian ... 4

Tujuan Penelitian ... 4

TINJAUAN PUSTAKA Konsep dan Definisi Kemiskinan ... 5

Susenas dan Podes ... 5

Prototyping ... 6

Basis data spasial ... 8

Spatial Data Mining ... 9

Teknik Spatial Data Mining ... 10

Karakterisasi Spasial ... 11

METODOLOGI PENELITIAN Penentuan Kebutuhan Sistem ... 19

Perancangan Cepat ... 19

Data Sumber ... 21

Modul Pengolahan Awal ... 22

Modul Spatial Data Mining ... 25


(21)

Modul Visualisasi ... 29

Pembangunan Prototipe ... 30

Pengujian Prototipe oleh Pengguna ... 30

Perbaikan Prototipe ... 30

HASIL DAN PEMBAHASAN Loading data peta ... 31

Membangun neighborhood graph ... 32

Cek MBR ... 33

Membangun List ... 34

Periksa Adjacency ... 35

Membangun neigborhood index ... 36

Hitung Jarak ... 37

Cari Arah ... 37

Pembentukan File Topologi ... 39

Loading ke SQL Server ... 39

Membentuk path ... 40

Penentuan Obyek Target ... 40

Membangun Path dengan k=2 ... 43

Membangun Filter Predikat ... 44

Membangun Path dengan k=n ... 46

Menghitung frequency factor ... 47

Membentuk aturan karakterisasi spasial ... 48

SIMPULAN DAN SARAN ... 50

DAFTAR PUSTAKA ... 52


(22)

DAFTAR TABEL

Halaman

1 Daftar kelompok/nama dan jenis peubah Podes (Santoso A, 2000) ... 23 2 Hubungan antara peubah dalam Santoso A. (2000) dengan peubah

dalam Podes 1996 ... 25 3 Transformasi peubah Podes 1996 ... 26 4 Nilai untuk masing-masing peubah ... 26 5 Desa Target ... 41 6 Frequency-Factor ... 48

DAFTAR GAMBAR

Halaman

1 Proses Prototyping ... 7 2 Arsitektur SDBMS tiga-layer ... 8 3 Proses Spatial Data Mining (Chawla et al. 2001) ... 10 4 Frekuensi sampel dan perbedaannya ... 12 5 Atribut Spasial dan Non-spasial ... 12 6 Contoh Hubungan Topologi ... 13 7 Contoh Hubungan Jarak ... 14 8 Contoh Hubungan Arah ... 14 9 Contoh Neighbourhood Graph ... 14 10 Filter Predicates ... 16 11 Contoh Neighbourhood Index ... 16 12 Objek Target dan Wilayah yang Diperluas ... 18 13 Diagram Konteks Prototipe Sistem Karakterisasi Spasial ... 20 14 Arsitektur Aplikasi ... 20


(23)

15 Peta batas administrasi desa Propinsi Jawa Barat tahun 1996 ... 21 16 Histogram jarak desa ke rumah sakit ... 24 17 Proses dalam modul spasial ... 25 18 Minimum Bounding Rectangle (MBR) ... 26 19 Visualisasi neighbourhood graph ... 27 20 Visualisasi path dengan panjang 2 node ... 28 21 Visualisasi path dengan panjang 3 node ... 29 22 Alur loading data peta ... 31 23 Struktur Variabel S ... 31 24 Desa Miskin/Tidak Miskin di Pandeglang, Serang, Bogor, Bandung,

Cirebon, Indramayu dan Garut ... 32 25 Sebagian desa di Jawa Barat ... 33 26 MBR desa ... 33 27 Matriks not_separate ... 34 28 Not_Separate_List ... 34 29 Matriks Adjacence ... 35 30 Desa yang memenuhi hubungan Meet. ... 35 31 Alur pembentukan Neighbourhood Graph ... 36 32 . Alur pembangunan Neighbourhood Index ... 36 33 Visualisasi jarak antardesa ... 37 34 Get_direction (S,1,4) ... 37 35 Get_direction (S,1,6) ... 38 36 Struktur file topologi ... 39 37 Struktur tabel NeighbourhoodIndex ... 40 38 Alur proses pembentukan path ... 41 39 Desa Target ... 42 40 Path k=2 ... 43 41 Perluasan Path ... 44 42 Path k =3 dengan filter starlike ... 46 43 Path k=3 dengan filter variable starlike ... 46 44 Jumlah Path dan Jumlah Desa ... 47


(24)

(25)

PENDAHULUAN

1.1. Latar Belakang

Banyak sekali data yang telah disimpan dalam basisdata, data warehouse, sistem informasi geografis, serta fasilitas penyimpanan informasi lainnya, dan data tersebut terus bertambah banyak dengan cepat. Dengan perkembangan teknologi penyimpnan data, kemampuan manusia untuk menyimpan data sangat jauh melampaui kemampuan untuk melakukan analisis dan ekstraksi informasi yang bermakna dari data yang tersimpan tersebut secara otomatis.

Knowledge Discovery in Databases (KDD) muncul sebagai bidang riset dan teknologi baru untuk melakukan pencarian pengetahuan yang menarik, implisit, dan belum diketahui sebelumnya dari basisdata yang besar. Menurut Frawley et al. (1991) yang diacu dalam Fayyad et al. (1996) KDD adalah non-trivial process of identifying valid, novel, potentially useful, and ultimately understandable patterns in data. Bagian dari KDD adalah data mining, yaitu kegiatan penyulingan data menjadi informasi atau fakta tentang kenyataan yang dijelaskan oleh basisdata. Dalam prosesnya data mining melibatkan beberapa bidang riset seperti sistem basisdata, machine learning, visualisasi data, statistika, dan information theory (Fayyad et al. 1996).

Di Indonesia, Badan Pusat Statistik secara teratur melakukan pengumpulan data memantau kondisi penduduk dan sosial ekonomi Indonesia, misalnya melalui Survei Sosial Ekonomi Nasional (Susenas) dan Potensi Desa (Podes). Sejak tahun 1993 jumlah contoh data Susenas sebanyak 202.000 rumah tangga (Surbakti 1995) sedang data Podes mencakup seluruh desa di Indonesia. Salah satu data yang dapat diperoleh setiap tiga tahun dari Susenas adalah konsumsi dan pengeluaran rumah tangga. Data konsumsi dan pengeluaran rumah tangga digunakan untuk menentukan penduduk miskin, sedangkan data Podes digunakan untuk menentukan desa miskin.


(26)

Data Susenas dan Podes memiliki referensi geografis dan waktu. Referensi geografis bisa dinyatakan dalam kode propinsi, kode kabupaten, kode kecamatan, kode desa, kode pos, atau kode wilayah tertentu. Saat ini telah tersedia peta batas wilayah administratif dalam bentuk digital yang memungkinkan analisis fenomena sosial-ekonomi dan kaitannya dengan lokasi geografis wilayah pencacahan. Hal ini menyebabkan meningkatnya kebutuhan akan teknik analisis data yang handal yang dapat mengkaitkan data sensus dengan distribusi geografisnya.

Perkembangan dalam struktur data spasial (Güting 1994), spatial reasoning (Egenhofer 1991) dan Computational Geometry telah merintis jalan bagi spatial data mining. Spatial data mining merupakan the extraction of implicit knowledge, spatial relations, or other patterns not explicitly stored in spatial databases (Koperski dan Han 1995 diacu dalam Koperski et al. 1996).

Spatial data mining telah digunakan oleh Ester et al. (1998) untuk menganalisis karakteristik spasial serta deteksi kecenderungan spasial pada data sensus penduduk daerah Bavaria, Jerman tahun 1987. Sedangkan Appice et al. (2003) menggunakan teknik spatial association rule untuk mendapatkan pengetahuan baru dari data sensus ekonomi UK.

Salah satu teknik dalam spatial data mining adalah karakterisasi spasial (spatial characterization). Karakterisasi spasial digunakan untuk mengungkap karakteristik atau deskripsi ringkas spasial dari properties yang menarik pada sebuah komunitas, misalnya bagaimana karakteristik daerah yang memiliki tingkat pertumbuhan ekonomi tinggi, atau bagaimana karakteristik daerah yang memiliki jumlah penduduk usia lanjut tinggi dan sebagainya.

Penelitian ini akan menggunakan teknik spatial data mining untuk mengungkap karakteristik spasial dari kondisi kemiskinan di Jawa Barat. Diharapkan dari proses karekterisasi spasial tersebut dapat terbentuk sebuah basis pengetahuan (knowledge-bases) spasial baru yang bermanfaat bagi penentuan kebijakan pengentasan kemiskinan di Jawa Barat.


(27)

3

1.2. Formulasi Permasalahan

Badan Pusat Spasial telah melakukan penghimpunan sejumlah besar data sosial ekonomi di Indonesia secara teratur, diantaranya melalui Susenas dan Podes. Dengan jumlah data yang besar tersebut dirasa perlu adanya sebuah sistem yang dapat melakukan analisis dan ekstraksi informasi yang bermakna dari data yang tersimpan tersebut secara otomatis. Karena data Susenas maupun Podes memiliki referensi geografis maka analisis yang dilakukan sebaiknya memperhatikan Hukum I Geografi yaitu “everything is related to everything else, but near things are more related than distant thing” (Tobler 1979). Agar proses analisis dapat dilakukan dengan lebih cepat dan akurat, maka sebaiknya menggunakan sistem manajemen basisdata yang mendukung data spasial dan non-spasial.

1.3. Ruang Lingkup

Teknik spatial data mining yang akan diterapkan pada prototipe adalah spatial characterization. Data spasial yang digunakan adalah batas administrasi desa Jawa Barat dan Banten tahun 2003. Data atribut desa diperoleh dari data Potensi Desa (Podes) tahun 2003. Karena atribut dalam data Podes sangat banyak, maka hanya beberapa atribut saja yang dilibatkan dalam pengembangan prototipe ini. Dalam memberikan sebuah label kepada sebuah objek berdasarkan nilai tertentu digunakan pendekatan crips (tidak fuzzy).

1.4. Keaslian Penelitian

Analisis data sensus dengan menggunakan spatial data mining telah ditunjukkan oleh Ester et al. (1998) dan Appice et al. (2003). Sedangkan Sugiyono (2003) telah melakukan penelitian tentang karakteristik kemiskinan dan pemetaan penduduk miskin Propinsi Jawa Barat. Penelitian Sugiyono (2003) menggunakan analisis statistik spasial. Sejauh ini penulis belum menemukan sistem spatial data mining untuk analisis karakteristik spasial desa miskin di Propinsi Jawa Barat.


(28)

1.5. Manfaat Penelitian

Dari penelitian ini diharapkan terbentuk prototipe sistem spatial data mining Prototipe tersebut diharapkan dengan mudah dan cepat mendapatkan pengetahuan implisit, hubungan spasial, atau pola-pola lainnya yang tidak secara eksplisit tersimpan dalam basisdata. Prototipe tersebut akan digunakan untuk mengungkap karakteristik spasial dari desa miskin di Jawa Barat.

1.6. Tujuan Penelitian

Penelitian ini memiliki tujuan yaitu:

1. Memahami konsep salah satu teknik dalam spatial data mining yaitu spatial characterization.

2. Membangun prototipe sistem spatial data mining yang mampu menjalankan teknik spatial characterization.

3. Memanfaatkan prototipe spatial characterization untuk mendapatkan karakter desa miskin di Propinsi Jawa Barat berdasarkan data Potensi Desa


(29)

TINJAUAN PUSTAKA

2.1. Konsep dan Definisi Kemiskinan

Konsep kemiskinan yang digunakan dalam penelitian ini merujuk kepada metode BPS, yaitu menggunakan pendekatan kemampuan dalam memenuhi kebutuhan dasar (basic need) yang meliputi kebutuhan makanan dan kebutuhan bukan makanan. Selanjutnya dengan penetapan batas garis kemiskinan (proverty line), suatu rumah tangga dapat dikelompokkan ke dalam rumah tangga miskin atau tidak miskin.

Garis kemiskinan didefinisikan sebagai besarnya nilai rupiah yang harus dikeluarkan oleh seseorang untuk memenuhi kebutuhan hidup minimumnya. Kebutuhan hidup minimum terdiri dari kelompok makanan maupun kelompok bukan makanan. Batas miskin untuk kebutuhan makanan dikonsepkan setara 2.100 kalori per hari. Batasan ini mengacu pada hasil Widyakarya Pangan dan Gizi 1978. Pemenuhan energi setara 2.100 kalori diperoleh dari konsumsi berbagai jenis kelompok makanan, yaitu : beras, umbi-umbian, ikan, daging dan sebagainya.

Sedangkan batas miskin untuk kebutuhan bukan makanan tercermin dari besarnya nilai rupiah yang harus dikeluarkan untuk memenuhi kebutuhan minimum bukan makanan. Kebutuhan bukan makanan terdiri dari perumahan, pendidikan, kesehatan, pakaian, serta aneka barang dan jasa lainnya (Sugiyono 2003).

2.2. Susenas dan Podes

Pengumpulan data Potensi Desa (Podes) adalah kegiatan rutin yang dilaksanakan setiap sensus, baik sensus penduduk, sensus pertanian , maupun sensus ekonomi. Sejak tahun 1994 Podes tidak hanya dilaksanakan pada tahun-tahun kegiatan sensus saja tetapi dilaksanakan setiap tahun-tahun. Tujuan pengumpulan data Podes antara lain untuk mendapatkan data tentang karakteristik desa secara lebih rinci, yang meliputi data mengenai sarana dan prasarana desa, potensi pertanian, pendidikan, kesehatan, dan potensi sosial-ekonomi lainnya.


(30)

Survei Sosial Ekonomi Nasional (Susenas) merupakan survei rumah tangga yang diselenggarakan setiap tahun. Susenas berfungsi sebagai wahana dalam menghimpun data sosial ekonomi penduduk. Keterangan yang dihimpun antara lain menyangkut aspek demografi, pendidikan, kesehatan/gizi, perumahan/lingkungan, kriminalitas, kegiatan sosial budaya, konsumsi/pengeluaran rumah tangga, perjalanan wisata dan kesejahteraan rumah tangga.

Peubah Susenas yang dikumpulkan dibagi menjadi dua kategori, yaitu peubah pokok (kor) dan peubah sasaran (modul). Peubah kor dikumpulkan setiap tahun, sedangkan peubah modul dikumpulkan setiap tiga tahun. Setiap tahun salah satu dari kelompok peubah modul ditetapkan, yaitu (1) konsumsi/pengeluaran rumah tangga, (2) pendidikan, kesehatan, dan perumahan serta lingkungan, (3) sosial budaya, kriminalitas, dan wisata nusantara dikumpulkan dari rumah tangga.

Pemilihan contoh Susenas umumnya dilakukan dalam 3 atau 4 tahap, yaitu (1) pemilihan sejumlah kecamatan, (2) pemilihan sejumlah desa pada setiap kecamatan terpilih, (3) pemilihan sejumlah wilayah pencacahan (wilcah) pada setiap desa terpilih, dan (4) pemilihan sejumlah rumah tangga pada setiap wilcah terpilih. Sejak tahun 1993 jumlah contoh Susenas sebanyak 202.000 rumah tangga. Sebanyak 65.000 rumah tangga diberikan daftar pertanyaan modul, sedangkan 137.000 rumah tangga diberikan pertanyaan modul saja. Santoso (2000) menggunakan data Susenas 1996 untuk menghasilkan daftar desa miskin di Jawa Barat.

2.3. Prototyping

Dalam pengembangan sebuah perangkat lunak, sering pengguna telah mendefinisikan tujuan umum dari perangkat lunak yang diinginkan, tetapi tidak melakukan identifikasi rinci dari kebutuhan masukan, pengolahan dan keluaran. Dalam kasus lain, pengembang mungkin tidak yakin tentang efisiensi algoritma yang digunakan, kemampuan adaptasi dari sistem operasi, atau bentuk interaksi antara manusia dengan komputer yang digunakan. Dalam kasus-kasus seperti di atas maka pendekatan pengembangan perangkat lunak yang paling sesuai adalah prototyping (Pressman 1992).


(31)

7

Prototyping adalah proses yang memungkinkan pengembang perangkat lunak untuk membuat model dari perangkat lunak yang akan dibangun. Model tersebut dapat dinyatakan dalam tiga bentuk: (1) prototipe berbentuk kertas atau model berbasis PC yang menggambarkan bagaimana interaksi antara manusia dan mesin terjadi, (2) workingprototype yang mengimplementasikan beberapa subset dari fungsionalitas yang diinginkan dari perangkat lunak, atau (3) program yang telah ada saat ini yang mengerjakan sebagian atau seluruh fungsionalitas yang diinginkan tetapi memiliki beberapa feature yang akan ditingkatkan dalam usaha pengembangan selanjutnya. Rangkaian kegiatan dalam prototyping digambarkan pada Gambar 1.

Gambar 1. Proses Prototyping (sumber: Laudon dan Laudon, 2005). Identifikasi

Kebutuhan Dasar

Langkah 1

Mengembangkan

Working

Prototype Langkah 2

Menggunakan Prototipe

Langkah 3

Pengguna Puas?

Prototipe Operasional

Revisi dan Perbaikan

Prototipe Langkah 4 TIDAK


(32)

2.4. Basisdata Spasial

Shekhar dan Chawla (2003) mendefinisikan sistem manajemen basisdata spasial (Spatial Database Management System - SDBMS) sebagai berikut:

1. SDBMS adalah modul perangkat lunak yang dapat bekerja dengan sistem manajemen basisdata dasar, seperti Object-Relational Database Management System (OR-DBMS) atau Object-Oriented Database Management System (OO-DBMS)

2. SDBMS mendukung beberapa model data spasial, tipe data abstrak (Abstract Data Type –ADT) dan bahasa query yang dapat memanggil ADT tersebut

3. SDBMS mendukung indeks spasial, algoritma yang efisien untuk melaksanakan operasi spasial, serta aturan-aturan yang spesifik bagi domain tertentu untuk optimasi query.

Gambar 2 menggambarkan arsitektur untuk membangun SDBMS berdasarkan OR-DBMS


(33)

9

2.5. Spatial Data Mining

Seperti berbagai bidang riset dan aplikasi lainnya, geografi telah berpindah dari lingkungan miskin-data dan miskin-komputasi ke lingkungan kaya-data dan kaya-komputasi. Bidang, cakupan, dan volume dataset geografik digital terus berkembang dengan cepat. Agen di sektor publik dan swasta mengadakan, memproses dan menyebarkan data digital tentang penggunaan lahan, peubah sosial-ekonomi dan infrastruktur dengan resolusi geografis yang rinci. Berbagai teknologi seperti penginderaan jarak jauh, global positioning sustem (GPS), perangkat yang peka lokasi – position aware devices (telepon selular, sistem navigasi kendaraan, wireless internet client) menyebabkan jumlah data geografik akan meningkat secara eksponensial dalam pertengahan abad ke-21 mendatang.

Metode analisis spasial tradisional dikembangkan pada saat biaya pengumpulan data sangat mahal serta tenaga komputasi yang tersedia masih lemah. Peningkatan jumlah data serta beragamnya sifat data geografik digital menyebabkan teknik analisis spasial tradisional kewalahan. Teknik analisis spasial tradisional berorientasi pada informasi sederhana yang berasal dari dataset yang kecil dan seragam. Metode statistik tradisional, khususnya statistik spasial, memiliki beban komputasi yang tinggi. Teknik-teknik tersebut memerlukan penegasan dari pakar (corfirmatory) dan mensyaratkan peneliti untuk mempunyai dugaan sebelumnya (a priori hypotheses). Dengan demikian, teknik analisis spasial tradisional tidak dapat dengan mudah menemukan pola (pattern), kecenderungan (pattern) dan hubungan (relationship) yang baru dan tidak terduga, yang mungkin tersembunyi jauh di dalam dataset geografik yang sangat besar dan beragam (Miller dan Han 2001). Penjelasan mendalam tentang analisis spasial dapat ditemukan dalam Anselin (2004) dan ESRI (2005), sedangkan penjelasan tentang statistik spasial dapat ditemukan dalam Cressie (1993).

Penggunaan sistem basisdata spasial yang makin meluas (Güting 1994, Worboy 1995, Shekhar dan Chawla 2003) telah merintis peningkatan perhatian bagi spatial data mining. Spatial data mining merupakan the extraction of implicit knowledge, spatial relations, or other patterns not explicitly stored in spatial databases (Koperski & Han 1995, diacu dalam Koperski et al. 1996).


(34)

Skema yang menggambarkan proses spatial data mining menurut Chawla et al. (2001) yang diilustrasikan pada Gambar 3.

Gambar 3. Proses Spatial Data Mining (sumber : Chawla et al. 2001).

2.6. Teknik Spatial Data Mining

Data mining merupakan area multidisiplin, dan terdapat banyak cara-cara baru untuk melakukan ekstraksi pola data. Ada tiga teknik data mining yang telah diterima secara umum, yaitu classification, clustering dan association rules (Shekhar & Chawla 2003).

Classification

Tujuan teknik klasifikasi adalah untuk menduga nilai sebuah atribut dari relasi berdasarkan nilai atribut-atribut lainnya dari relasi tersebut. Definisi lainnya menyatakan teknik klasifikasi memilih himpunan atribut dan nilai nilai atribut yang relevan, yang digunakan untuk secara efektif memetakan obyek spasial ke dalam kelas target yang telah didefinisikan sebelumnya.

Clustering

Teknik clustering merupakan contoh pembelajaran tak-terarahkan (unsupervised learning). Teknik ini berusaha mengelompokkan data tanpa memiliki pengetahuan awal tentang kluster atau jumlah kluster. Obyek spasial dikelompokkan sehingga obyek dalam satu kluster adalah mirip, dan obyek dalam kluster yang berbeda adalah tidak mirip. Clustering dapat dilakukan berdasarkan


(35)

11

kombinasi atribut non-spasial, atribut spasial, dan kedekatan obyek dalam ruang, waktu dan ruang-waktu.

Association Rules

Teknik ini bertujuan menemukan hubungan diantara atribut-atribut dalam sebuah relasi. Dalam konteks spasial, association rule melibatkan predikat spasial (topologi, jarak atau arah) dalam preseden atau anteseden-nya. Sebagai contoh rules dinyatakan dalam bentuk is_close (house, beach) Æ is_expensive(house) yang bermakna rumah yang dekat dengan pantai mungkin harganya mahal.

Disamping teknik classification, clustering dan association rules di atas, Miller dan Han (2001) menyebutkan beberapa teknik lain yaitu :

Outlier Detection, obyek spasial yang tidak masuk ke dalam kluster manapun disebut pencilan (outlier). Jadi outlier detection adalah masalah kebalikan dari clustering.

Spatial Trend Detection, teknik ini melibatkan pencarian pola perubahan dengan memperhatikan tetangga dari beberapa obyek spasial.

Geographic Characterization and Generalization, teknik ini menghasilkan deskripsi ringkas data berupa summary rules atau characteristics rule. Dalam data mining klasik (non-spasial), metode yang handal untuk menghasilkan summary rules adalah metode induksi berorientasi atribut (attribute-oriented induction).

2.7. Karakterisasi Spasial

Spatial association rule dinyatakan dalam bentuk:

P1 ^ ……….^ PmÆ Q1^……….^Qn (c%)

Dimana paling tidak satu dari predikat P1, …. , Pm, Q1, …., Qn adalah

predikat spasial dan c% adalah confidence yang mengindikasikan bahwa c% obyek yang memenuhi anteseden juga memenuhi konsekuen dari rule.

Untuk mengatasi keterbatasan tersebut, Ester et al. (2001) mendefinisikan karakterisasi spasial (spatial characterization) dari sekumpulan obyek target terhadap basisdata tempat obyek tersebut tersimpan sebagai “deskripsi dari sifat spasial dan non-spasial yang serupa bagi obyek target, tetapi bukan untuk


(36)

keseluruhan basisdata (a description of the spatial and non-spatial properties which are typical for the target objects, but not for the whole database)”. Sifat yang menjadi perhatian adalah frekuensi relatif nilai atribut non-spasial dan frekuensi relatif tipe obyek yang berbeda. Perbedaan frekuensi relatif dalam basisdata dengan frekuensi relatif dalam daerah target diperlihatkan pada Gambar 4.

Gambar 4. Frekuensi sampel dan perbedaannya

Atribut spasial dan non-spasial digambarkan dalam Gambar 5.


(37)

13

Berikut ini adalah beberapa batasan yang digunakan dalam teknik karakterisasi spasial :

Definisi 1 : Hubungan Spasial

Untuk melakukan karakterisasi spasial, tidak hanya sifat dari obyek target yang diperhatikan melainkan juga sifat obyek tetangga.Hubungan satu obyek dengan obyek tetangganya dapat dinyatakan dalam tiga bentuk (Ester et al, 2001): 1. Hubungan Topologi : berdasarkan batas, interior atau komplemen dari dua

obyek. Contoh hubungan yang mungkin terjadi adalah (Gambar 6):

Gambar 6. Contoh hubungan topologi

(sumber : Egenhofer et al. 1989 dalam Shekhar dan Chawla, 2003).

2. Hubungan Jarak : membandingkan jarak dua obyek dengan sebuah konstanta menggunakan operator pembanding aritmatik. Hubungan jarak dinyatakan sebagai Distance(O1,O2)σc dengan

O1 : obyek pertama, O2 : obyek kedua,


(38)

Ilustrasi hubungan jarak diperlihatkan pada Gambar 7.

Gambar 7. Contoh hubungan jarak (sumber :Ester et al, 2001)

3. Hubungan Arah atau Orientasi : obyek pertama sebagai sistem koordinat virtual, quadrant dan half-plane menentukan arahnya (Gambar 8).

Gambar 8. Contoh hubungan arah (sumber :Ester et al, 2001)

Definisi 2 : (neighborhood graph and paths)

Ditetapkan neighborhood sebagai hubungan tetangga dan DB sebagai basisdata obyek spasial. Sebuah neighborhood graph GneighborDB =

(

N,E

)

adalah sebuah graph dengan node N=DB dan edge ENxN dimana sebuah edge e =(n1,n2) ada jika dan hanya jika terdapat neighbor(n1,n2). Hubungan

neighbor(n1,n2) dapat berupa hubungan topologi, jarak atau arah. Gambar 9 memperlihatkan sebuah basisdata obyek spasial DB serta dua buah neighborhood graph dengan hubungan topologi meet dan hubungan arah north.

Gambar 9. Contoh Neighborhood Graph

Sebuah neighborhood path dengan panjang k didefinisikan sebagai untaian node [n1,n2,….nk] dimana neighbor (ni, ni+1) terjadi untuk semua niN,1≤i<k.


(39)

15

Definisi 3 : Operasi pada neighborhood graph

Terdapat beberapa operasi yang dilakukan pada sebuah neighborhood graph (graf tetangga) yaitu (Ester et al, 2001):

1. Neighbours:

Graphs x Objects x Predicates Æ Sets_of_objects

Operasi Neighbours menghasilkan himpunan semua obyek (set of objects) yang terhubung dengan object pada graph yang memenuhi kondisi yang dinyatakan dalam predicates.

2. Path:

Sets_of_objects Æ set_of_path

Operasi path menghasilkan semua path dengan panjang l yang dibentuk oleh sebuah elemen tunggal dari obyek.

3. Extensions:

Graphs x Sets_of_path x integer x predicates Æ sets_of_path

Operasi Extensions menghasilkan himpunan semua path (set_of_all_path) dengan panjang tertentu integer pada graph yang merupakan perpanjangan sebuah elemen dari path.

Definisi 4 : Filter Predikat (Predicates Filter)

Ketika bergerak dari sebuah obyek menuju obyek lainnya dalam graf, dapat digunakan beberapa filter yaitu (Ester et al, 2001):

1. Starlike Filter

Ketika memperpanjang sebuah path p = [n1,n2,….nk] dengan sebuah node

nk+1, maka arah terakhir yang pasti (exact “final” direction) dari p tidak

dapat digeneralisasi. Sebagai contoh, sebuah path dengan arah terakhir tenggara maka hanya dapat diperpanjang dengan sebuah node dari sebuah edge yang memiliki arah tenggara.

2. Variable Starlike Filter

Variable starlike filter memungkinkan path yang lebih halus, dengan hanya mensyaratkan ketika memperpanjang path p maka edge (nk, nk+1) paling

tidak memenuhi arah awal yang pasti (exact “initial” direction) dari path p. Sebagai contoh, sebuah path dengan arah awal utara dapat diperpanjang sehingga arah path tersebut tetap utara atau menjadi tenggara.


(40)

3. Vertical Starlike Filter

Filter ini merupakan bentuk khusus dari starlike filter dimana filter kurang ketat ke arah vertikal dibandingkan ke arah horizontal. Filter ini digunakan jika memerlukan analisis lebih rinci ke arah vertikal.

Ilustrasi dari masing-masing filter dapat dilihat pada Gambar 10.

Gambar 10. Filter Predicates (sumber :Ester et al, 2001) Definisi 5 : Neighbourhood Index

Neighbourhood Index adalah sebuah tabel yang mencatat hubungan antarobyek dalam basisdata spasial. Neighbourhood index untuk DB dengan jarak maksimum max, dinyatakan sebagai berikut

(

)

{

1 2 1 2 1 2 2 1 1 2

}

max O ,O ,dist,D,T |O ,O DB,O jarak O ^dist max^O DO^OTO

IDB = ∈ =dist

dengan DB sebagai sebuah himpunan obyek spasial, max dan dist adalah bilangan real, D adalah hubungan arah (direction relation) dan T adalah hubungan topologi (topological relation). Ilustrasi Neighbourhood Index pada Gambar 11.

Gambar 11. Contoh Neighbourhood Index Definisi 6: Karakterisasi Spasial

Karakterisasi spasial adalah aturan yang menjelaskan sifat atribut untuk sebuah wilayah dibandingkan dengan sifat atribut tersebut pada keseluruhan basisdata. Ditetapkan DB

neighbour

G adalah s neighbourhood graph dan target adalah subset dari basisdata spasial DB. Ditetapkan freqs(prop) yang menyatakan jumlah kemunculan sifat prop dalam himpunan s dan card(s) menyatakan kardinalitas dari s. Frequency factor dari prop terhadap targets dan DB dinyatakan dalam

) ( ) ( / ) arg ( ) ( ) ( arg arg DB card prop freq ets t card prop freq prop f DB ets t DB ets t =


(41)

17

Ditetapkan significance dan proportion sebagai bilangan real dan max-neighbours sebagai bilangan natural. Neighbours SGi (s)menyatakan himpunan dari seluruh obyek yang dapat dicapai dari satu elemen s dengan berjalan paling banyak i edge dari graph tetangga G.

Kemudian, pekerjaan karakterisasi spasial adalah untuk menemukan setiap sifat prop dan setiap bilangan natural n <= max-neighbours sehingga

1. himpunan objects = neighboursn(targets)

G dan

2. himpunan objects = neighboursGn({t}) untuk proportion paling kecil terdapat ttarget yang memenuhi kondisi,

Proses karakterisasi spasial menghasilkan aturan (rule) dalam bentuk

Aturan ini bermakna bahwa untuk himpunan dari seluruh target yang diperluas oleh neighbours ni, sifat pi muncul dalam basisdata lebih banyak (atau

lebih sedikit) dari freq-faci.. Contoh rule yang dihasilkan adalah sebagai berikut

Obyek dengan tingkat penduduk pensiun tinggi Î Apartemen per gedung = sangat rendah (0.91) ^ tingkat orang asing = sangat rendah (0.89) ^ tingkat akademisi = sedang (0.63) ^

rata-rata ukuran perusahaan = sangat rendah (0.58) ^ tipe obyek = pegunungan (3.41)


(42)

Obyek target dan wilayah yang diperluas dengan tetangganya dapat dilihat pada Gambar 12.

Gambar 12. Obyek target dan wilayah yang diperluas (sumber: Ester et al. 2001).

Sehingga secara umum algoritma spatial characterization adalah sebagai berikut

karakterisasi (graph GrDB; himpunan obyek target; real significance, proportion; integer max-neighbors )

inisialisasi himpunan karakterisasi sebagai himpunan kosong; inisialisasi himpunan region menjadi target; inisialisasi n dengan 0; hitung frekuensiDB(prop)untuk semua sifat prop = (atribut, nilai); while n ≤ max-neighbors do

for each atribut pada DB dan untuk atribut khusus tipe obyek do for each nilai dari atribut do

hitung frekuensiregion(prop)untuk semua sifat prop = (atribut, nilai); if fregionDB (prop)≥significanceor fregionDB (prop)≤1/significancethen

tambahkan (prop, n, fDB (prop)

region ) ke dalam himpunan karakterisasi; if n < max-neighbors then

for each obyek dalam region do

tambahkan neighbors (GrDB, obyek, TRUE) ke dalam region; tambahkan nilai n dengan 1;

ekstrak semua tuple (prop, n, fregionDB (prop)) dari karakterisasi yang signifikan di dalam paling sedikit proportion region dengan n perluasan;


(43)

METODOLOGI PENELITIAN

Penelitian ini mengembangkan sistem spatial data mining untuk melakukan karakterisasi desa miskin di Propinsi Jawa Barat. Dengan sistem tersebut diharapkan dapat mengungkap hubungan antara data spasial dan non-spasial. Metode pengembangan sistem mengikuti model prototyping. Model prototyping mensyaratkan adanya interaksi antara pengembang dengan pengguna dalam beberapa iterasi, dan ini sejalan dengan proses pengembangan spatial data mining menurut Chawla et al. (2001). Hasil prototyping adalah working prototype yang mengimplementasikan beberapa subset dari fungsionalitas yang diinginkan sistem. Karena penelitian ini merupakan iterasi pertama dari pengembangan sistem, maka kegiatan yang akan dilakukan adalah: (1) penentuan kebutuhan sistem, (2) perancangan cepat, (3) pembangunan prototipe, (4) pengujian prototipe oleh pengguna dan (5) perbaikan prototipe. Kegiatan ke-enam dalam prototyping yaitu pengembangan produk belum dilakukan dalam penelitian ini.

3.1. Penentuan Kebutuhan Sistem

Prototyping dimulai dengan penentuan kebutuhan sistem. Sasaran yang ingin dicapai oleh sistem dalam penelitian ini adalah:

1. Sistem mendukung teknik karakterisasi spasial.

2. Sistem mampu menampung, mengolah dan menampilkan data spasial dan non-spasial.

3. Sistem bersifat modular, terbuka dan mudah dikembangkan.

3.2. Perancangan Cepat

Perancangan cepat (quick design) memfokuskan representasi aspek-aspek dari sistem yang terlihat oleh pengguna, misalkan pendekatan yang akan digunakan untuk memberikan masukan ke sistem dan format keluaran yang dihasilkan oleh sistem. Gambaran umum prototipe sistem disajikan dalam diagram konteks yang diilustrasikan pada Gambar 13.


(44)

Gambar 13. Diagram Konteks Prototipe Sistem Karakterisasi Spasial.

Sistem akan mengolah masukan yang diberikan dan memberikan keluaran berupa wilayah yang diperluas dan aturan karakterisasi (characteristic rule). Wilayah yang diperluas disajikan berupa peta sedangkan aturan karakterisasi disajikan dalam bentuk teks.

Prototipe sistem karakterisasi spasial terdiri dari beberapa komponen yaitu modul pengolahan awal (praproses), modul basisdata, modul spasial data mining serta modul visualisasi. Keterkaitan antar keempat komponen tersebut dapat dilihat pada Gambar 14.

Gambar 14. Arsitektur aplikasi. Sistem

Karakterisasi Spasial

Pengguna Obyek target Wilayah yang diperluas dan

aturan karakteristik Pengguna Data Podes Jabar 1996 Peta Desa Jabar 2000 Modul Pengolahan Awal Modul Basisdata Modul

Spatial Data Mining • neighbourhood graphspatial filterneighbourhood indexalgoritme karakterisasi

spasial

Modul Visualisasi Data Sumber


(45)

21

Data Sumber

Spatial data mining melibatkan data spasial dan data non-spatial (atribut). Data spasial yang digunakan dalam penelitian ini adalah peta batas administrasi desa Propinsi Jawa Barat tahun 2000, termasuk Banten yang sekarang menjadi propinsi tersendiri. Jumlah desa yang terlibat adalah 7327 desa (Gambar 15). Peta batas administrasi desa didapat dalam format ESRI shapefile (shp).

Gambar 15. Peta batas administrasi desa Propinsi Jawa Barat tahun 2000

Pada peta batas administrasi desa melekat beberapa atribut yaitu:

• ID2000 : nomor identitas desa yang ditetapkan BPS tahun 2000 • Propinsi : nama propinsi

• Kab_Kota : nama kabupaten atau kota • Kecamatan : nama kecamatan

• Desa : nama desa

Data atribut yang digunakan adalah data Podes 2003 yang didapat dalam format SAS (SSD). Secara umum data Podes 2003 berisi:

• Karakteristik desa

• Populasi, perumahan dan lingkungan • Fasilitas Pendidikan


(46)

• Fasilitas Sosial-budaya • Fasilitas Rekreasi dan hiburan • Fasilitas Kesehatan

• Fasilitas Transportasi • Penggunaan Lahan • Kondisi Ekonomi • Unit Finansial Desa • Karakteristik Kepala Desa

Modul Pengolahan Awal

Dalam pengolahan awal (pra-proses) terdapat kegiatan data cleaning, integrasi, seleksi dan transformasi.

a. Data cleaning dilakukan untuk menangani data yang hilang atau data yang tidak benar.

Jumlah poligon pada peta Jabar 2000 adalah 7327 sedangkan jumlah kode desa yang berbeda pada Podes 2003 adalah 7234 , untuk itu perlu dilakukan data cleaning.

b. Integrasi dilakukan untuk menggabungkan data dari berbagai sumber yang berbeda.

Penelitian menggunakan data atribut desa dan data spasial desa. Agar dapat menggabungkan data atribut desa dengan data spasial desa maka diperlukan atribut kunci yaitu kode desa. Untuk itu dilakukan pemeriksaan kode desa pada kedua data agar sesuai.

c. Seleksi digunakan untuk memilih data yang relevan untuk analisis. Santoso A pada tahun 2000. melakukan penelitian tentang kriteria desa miskin berdasarkan konsumsi kalori keluarga dan hubungannya dengan potensi desa. Data yang digunakan pada penelitian tersebut adalah Podes 196. Penelitian tersebut menghasilkan model regresi prediksi persentase keluarga miskin (Y) untuk desa di propinsi Jawa Barat sebagai berikut :

Y= 40.00 + 4.99 X2 – 0.115 X4 + 0.00850 X8 + 0.466 X9 + 3.45 X13 – 6.18 X14 + 4.26 X15 + 0.835 X17 - 0.078 X19 – 1.65 X21+ 0.707 X22 + 2.84 X23


(47)

23

Daftar kelompok/nama dan jenis peubah yang terlibat dalam penelitian Santoso (2000) terdapat pada Tabel 1.

Tabel 1. Daftar kelompok/nama dan jenis peubah Podes (Santoso A, 2000) Kelompok

Peubah

Nama Peubah/Jenis Kode

1. Potensi / fasilitas sosial ekonomi desa

1. Tipe LKMD (1 = aktif, 0 = tidak aktif) X1 2. jalan utama desa (1 = aspal, 0 = non aspal) X2 3. Sumber penghasilan sebagian besar

penduduk (1 = pertanian, 0 = non-pertanian) X3 4. Jarak ke rumah sakit terdekat (km) X4 5. Fasilitas pendidikan (1 = lebih dari SD, 0 = SD)

X5 6.Fasilitas kesehatan (1 = ada, 0 = tidak ada) X6 7. Pasar (1= ada, 0 = tidak ada) X7 8. Kepadatan penduduk (km persegi) X8 9. Rasio banyaknya tempat ibadah per 1000 penduduk

X9 2. Fasilitas

perumahan dan lingkungan

10. Sumber air minum buatan (1 = ada, 0 = tidak ada)

X10 11. Wabah penyakit (1 = ada, 0 = tidak ada) X11 12. Bahan bakar (1 = bahan bakar minyak dan gas, 0 = non BBMG)

X12 13. Pembuangan sampah (1= ada, 0 = tidak

ada)

X13 14. Jamban (1 = jamban sendiri, 0 = jamban

bersama)

X14 15. Keberadaan pelanggan koran/majalah (1= ada, 0 = tidak ada)

X15 3.

Kependudukan

16. Persentase rumah tangga tani X16 17. Persentase rumah tangga yang

menyekolahkan anak/famili ke perguruan tinggi

X17

18. Persentase rumah tangga yang menggunakan listrik

X18 19. Persentase rumah tangga yg memiliki TV X19

20.Persentase rumah tangga yang memiliki telepon

X20 21. Persentase rumah tangga yang memiliki

kendaraan roda 4

X21 22. Persentase rumah tangga yang memiliki

kendaraan roda 2 atau 3

X22 23. Rata-rata anggota rumah tangga X23 24. Persentase rumah sederhana X24


(48)

Dari 17 atribut Podes yang digunakan dalam penelitian Santoso (2000), untuk pengembangan prototipe ini dicobakan lima atribut yaitu.

1. Tipe jalan utama desa

2. Jarak desa ke rumah sakit terdekat 3. Cara pembuangan sampah

4. Tempat buang air besar

5. Keberadaan pelanggan koran/majalah

Atribut lainnya dapat dilibatkan jika prototipe ini telah terbukti dapat bekerja dengan baik.

d. Transformasi dimana data dari beberapa sumber yang berbeda dikonversi ke dalam bentuk yang dapat diproses.

Algoritma karakterisasi spasial bekerja dengan atribut kategorik, sehingga atribut yang memiliki tipe numerik harus ditransformasi menjadi kategorik (diskretisasi). Dari lima atribut yang dipilih, hanya satu yang bertipe numerik yaitu jarak desa ke rumah sakit terdekat. Gambar 16 memperlihatkan histogram dari peubah ini. Dari histogram tersebut, jarak desa ke rumah sakit dibagi ke dalam tiga kelas yaitu dekat ( 0-30 km), sedang (30 – 60 km) dan jauh ( > 60 km)

100 80 60 40 20 0 X4 500 400 300 200 100 0 Fr equency

Mean = 23.4 Std. Dev. = 22.755 N = 6,248


(49)

25

Modul Spatial Data Mining

Proses-proses dalam modul spasial diperlihatkan pada Gambar 17.

Gambar 17. Proses dalam modul spasial Menghitung

frequency factor

Loading

Data Peta Peta Jabar

Jabar

Membangun neighbourhood

graph

Adjacency

Membangun neighbourhood

index

Index

Membentuk path Obyek Target

path

Data Atribut Desa

Membentuk aturan karakterisasi

spasial

Aturan karakterisasi spasial


(50)

a. Loading Data Peta

Peta desa dimuat ke dalam lingkungan Matlab menggunakan fungsi shaperead yang terdapat dalam Mapping Toolbox. Fungsi shaperead akan membaca file shapefile (shp) dan menyimpannya sebagai struc array dengan field sebagai berikut:

• Geometry : tipe obyek spasial (misal point, line atau polygon) • BoundingBox : berisi koordinat dua titik MBR (Minimum Bounding

Rectangle) yaitu (x-min, y-min) dan (x-max,y-max)

• X : merupakan array dari koordinat X titik-titik yang menyusun obyek • Y : merupakan array dari koordinat Y titik-titik yang menyusun obyek • X1 : merupakan koordinat X titik tengah obyek

• Y1 : merupakan koordinat Y titik tengah obyek

• Serta atribut yang melekat pada shapefile (misal kode_desa, nama_desa dan sebagainya)

b. Membangun neighbourhood graph

Neighbourhood graph disimpan dalam sebuah matriks NxN. Elemen pada baris i dan kolom j bernilai 1 jika obyek ke-i dan obyek ke-j merupakan tetangga dan bernilai 0 jika selainnya. Untuk membentuk neighbourhood graph dilakukan pekerjaan berikut ini

• Untuk semua obyek ke-i periksa apakah MBR obyek ke-i berpotongan dengan MBR obyek ke-k. Gambar 18(a) memperlihatkan sebuah obyek dengan MBR-nya, sedangkan Gambar 18(b) memperlihatkan tiga kemungkinan dimana MBR dua buah obyek berpotongan.

(a) (b)


(51)

27

• Untuk semua obyek ke-i dan obyek ke-k yang memenuhi syarat di atas, periksa apakah kedua obyek merupakan tetangga. Dalam penelitian ini didefinisikan dua buah desa merupakan tetangga jika dan hanya jika poligon batas kedua desa berpotongan di lebih satu titik. Gambar 19 merupakan visualisasi dari neighbourhood graph.

Gambar 19. Visualisasi neighbourhood graph.

c. Membangun neighbourhood index

Karena Neighbourhood graph berukuran N x N maka diperlukan sebuah indeks agar proses pembacaan hubungan antara dua obyek lebih cepat, tidak dihitung berkali-kali setiap diminta. Hubungan spasial yang disimpan dalam neighbourhood index dalam penelitian ini adalah hubungan jarak dan hubungan arah. Hubungan topologi tidak disimpan dalam indeks karena berdasarkan batasan yang diterapkan pada pembentukan neighbourhood graph maka hanya memiliki satu hubungan topologi yaitu berdampingan (adjacent).

d. Membentuk path

Proses pembentukan path dilakukan melalui tahapan berikut • Tentukan obyek target.

Dalam penelitian ini, obyek target merupakan subset dari desa yang termasuk kelas miskin berdasarkan Santoso A (2000). Sumber data penelitian Santoso A (2000) meliputi 7 kabupaten di Jawa Barat yaitu


(52)

: Pandeglang, Serang, Bogor, Bandung, Cirebon, Indramayu dan Garut. Pemilihan kabupaten tersebut didasarkan atas pertimbangan bahwa kabupaten yang dipilih merupkan kabupaten dengan persentase desa miskin (menurut kriteria BPS tahun 1995) dari desa yang terkena Susenas cukup besar yaitu sekitar 50 persen. Sehingga diperoleh jumlah desa miskin yang cukup mewakili untuk desa-desa di pulau Jawa. Disamping pertimbangan di atas ada pertimbangan lain, misalnya topografi dan kondisi geografis. Data desa miskin menurut Santoso A (2000) terdapat di Lampiran 1.

• Bentuk path dengan panjang 2 node

Gambar 20 merupakan visualisasi path dengan panjang 2 node untuk dua buah titik target.

Gambar 20. Visualisasi path dengan panjang 2 node

• Bentuk path perluasan dengan menerapkan filter spasial

Gambar 21 merupakan visualisasi path dengan panjang 3 node untuk dua buah titik target.


(53)

29

Gambar 21. Visualisasi path dengan panjang 3 node

e. Menghitung frequency factor

Dalam menghitung frequency factor dari atribut akan diperhatikan pengaruh dari panjang path max-neighbours s dan nilai ambang significance

f. Membentuk aturan karakterisasi spasial

Selanjutkan dilakukan pembentukan aturan klasifikasi spasial dengan pola sebagai berikut

Modul Basisdata

Sistem manajemen basis data SQL Server 2000 akan digunakan untuk menyimpan neighbourhood indeks agar proses pencarian hubungan antar dua obyek lebih cepat.

Modul Visualisasi

Visualisasi diperlukan untuk mempermudah pemahaman dan pengecekan proses. Visualisasi akan menggunakan Mapping Toolbox pada Matlab.


(54)

3.3. Pembangunan Prototipe

Hasil dari perancangan cepat digunakan untuk pembangunan prototipe. Prototipe ini akan dievaluasi oleh pengguna dan digunakan untuk memperbaiki kebutuhan sistem dari perangkat lunak yang akan dikembangkan. Pengembang dapat menggunakan potongan program yang sudah ada atau perangkat lunak pembantu (tools) agar working prototype dihasilkan lebih cepat.

Perangkat lunak yang digunakan dalam pembangunan prototipe spatial data mining ini antara lain:

• Microsoft Windows 2000 sebagai sistem operasi

• Matlab dengan Mapping Toolbox sebagai lingkungan pemrograman • SQL Server 2000 sebagai sistem manajemen basisdata

• SAS 6.1.2 dan SPSS 10 sebagai perangkat pengolahan data • Weka sebagai perangkat data mining

• ArcGIS 9.2 sebagai perangkat pengolah data spasial (misal merge, dissolve peta)

Perangkat keras yang digunakan dalam pembangunan prototipe spatial data mining ini adalah personal komputer dengan spesifikasi Prosesor Intel Pentium IV 1.6 Ghz, RAM 2 Gb dan Harddisk 80 Gb.

3.4. Pengujian Prototipe oleh Pengguna

Tahap ini akan menguji kinerja prototipe. Faktor yang diamati dalam penelitian ini adalah hal yang mempengaruhi aturan karakterisasi yang dihasilkan prototipe, misalnya nilai konstanta significance dan jenis predicate filter

3.5 Perbaikan Prototipe

Aturan yang didapat dari proses ekstraksi pola tidak selalu menarik atau dapat digunakan secara langsung. Aturan yang diperoleh akan dikonfirmasi kepada pakar ekonomi geografi , apakah sesuai dengan aturan penentuan desa miskin yang selama ini digunakan atau sesuai dengan kenyataan di lapangan. Selain itu perbaikan juga dapat dilakukan secara teknis untuk meningkatkan kinerja prototipe.


(55)

HASIL DAN PEMBAHASAN

3.1Loading data peta

Peta digital desa di Jawa Barat dan Banten tahun 2000 didapat dalam format Mapinfo per masing-masing provinsi. Peta kedua peta kemudian dikonversi ke dalam format Shapefile dan digabung menjadi satu. Selanjutnya peta shapefile dimuat (loading) ke dalam lingkungan Matlab menggunakan fungsi shaperead yang tersedia di Matlab Mapping Toolbox. Dalam Matlab, peta desa disimpan sebagai variabel S (JabarS.mat) dengan tipe struct. Nomor indeks pada variabel S merepresentasikan urutan obyek bersangkutan dalam shapefile. Alur loading data peta disajikan pada Gambar 22, sedangkan ilustrasi struktur variabel S digambarkan sebagai berikut (Gambar 23).

Gambar 22. Alur loading data peta

Gambar 23. Struktur Variabel S

Shaperead Add Index JabarS.mat Jabar.shp

1

7327 2

S (7327x1 struct array)

Geometry BoundingBox X Y Jabar_ID Area Perimeter Prop_No KabKota_No Kec_No Desa_No ID2000 Propinsi Kab_Kota Kecamatan Desa Jabar96_ID X1 Y1 S (1,1) X min X max Y min Y max S (1,1).BoundingBox S (1,1).X S (1,1).Y


(56)

Gambar 24 memperlihatkan batas desa di Jawa Barat beserta lokasi ke-167 desa miskin/tidak miskin berdasarkan Santoso A(2000). Sumber data Santoso 2000 Jawa Barat meliputi 7 kabupaten yaitu : Pandeglang, Serang, Bogor, Bandung, Cirebon, Indramayu dan Garut. Pemilihan kabupaten tersebut didasarkan atas pertimbangan bahwa kabupaten yang dipilih merupakan kabupaten dengan persentase desa miskin (menurut kriteria BPS tahun 1995) dari desa yang terkena Susenas cukup besar yaitu sekitar 50 persen. Sehingga diperoleh jumlah desa miskin yang cukup mewakili untuk desa-desa di Jawa Barat.

Gambar 24. Desa Miskin/Tidak Miskin di Pandeglang, Serang, Bogor, Bandung, Cirebon, Indramayu dan Garut.

3.2Membangun neighborhood graph

Setelah data peta desa termuat dalam lingkungan Matlab dilakukan pembangunan neighbourhood graph yang merepresentasikan hubungan diantara desa-desa tersebut. Gambar 25 memperlihatkan sebagian desa dengan label nomor yang merepresentasikan urutan desa bersangkutan dalam matriks S (dan juga dalam shapefile).


(57)

33

Gambar 25. Sebagian desa di Jawa Barat 3.2.1 Cek MBR

Neighbourhood graph disimpan dalam sebuah matriks N x N, sehingga membutuhkan waktu yang lama jika dilakukan pemeriksaan hubungan ketetanggaan untuk sebuah desa dengan seluruh desa selainnya. Untuk mempercepat maka dilakukan refinement melalui pemeriksaaan MBR desa yang berpotongan. Gambar 26 memperlihatkan sepuluh (10) desa pertama dalam S beserta MBR-nya masing-masing. Pada Gambar 26 terlihat adanya kesalahan dalam penentuan titik acuan MBR yang menyebabkan MBR desa 1 dianggap tidak berpotongan dengan MBR desa 2. Kesalahan ini diduga karena keterbatasan Matlab Mapping Toolbox. Pemeriksaan ulang terhadap kesalahan pengecekan MBR masih dilakukan secara manual (pengamatan visual) dan baru ditemukan satu kesalahan.


(58)

Berikut adalah pernyataan untuk pemeriksaaan MBR beserta hasilnya untuk sepuluh desa pertama di atas. Matriks not_separate sebagai hasil pemeriksaan MBR disajikan dalam Gambar 27.

Gambar 27. Matriks not_separate 3.2.2 Membangun List

Berdasarkan matriks not_separate kemudian dibentuk list desa yang MBR-nya tidak terpisah (not_separate_list). Variabel not_separate_list menggunakan struktur cell seperti digambarkan pada Gambar 28.

Gambar 28. Not_Separate_List if ( (maxX1 < minX2) ||... (minX1 > maxX2) ||... (maxY1 < minY2) ||... (minY1 > maxY2))

not_separate(poligon1,poligon2) = false; not_separate(poligon2,poligon1) = false;

Nomor Poligon N o m o r P o li g o n

1 : MBR Tidak terpisah 0 : MBR Terpisah

N o m o r L is t


(59)

35

3.2.3 Periksa Adjacency

Selanjutnya untuk semua desa yang MBR-nya berpotongan dilakukan pemeriksaan hubungan ketetanggaan. Dalam penelitian ini hubungan ketetanggaan didasarkan pada hubungan topologi Meet. Berikut statemen yang digunakan untuk memeriksa apakah dua buah poligon (batas desa) memenuhi hubungan spasial Meet:

Berikut adalah matriks Adjacence (JabarA.mat) untuk sepuluh (10) desa pertama di Jawa Barat (Gambar 29).

Gambar 29. Matriks Adjacence

Gambar 30 memperlihatkan desa contoh yang memenuhi hubungan Meet.

Gambar 30. Desa yang memenuhi hubungan Meet. poligon2= M{poligon1}(j);

poli1x = S(poligon1,1).X; poli1y = S(poligon1,1).Y; poli2x = S(poligon2,1).X; poli2y = S(poligon2,1).Y;

[xi,yi]=polyxpoly(poli1x,poli1y,poli2x,poli2y,'unique' );

adjacence = (size(xi,1)>1);

N

o

m

o

r

P

o

lig

o

n


(60)

Secara singkat alur pembentukan Neighbourhood Graph digambarkan pada Gambar 31.

Gambar 31. Alur pembentukan Neighbourhood Graph 3.3Membangun neigborhood index

Algoritme karakterisasi spasial selain melibatkan nilai atribut setiap obyek juga memperhitungkan hubungan antarobyek. Dalam penelitian ini hubungan antarobyek yang digunakan adalah jarak dan arah. Untuk menghindari perhitungan jarak dan arah yang berulang-ulang, maka jarak dan arah sebuah desa terhadap desa lainnya disimpan dalam Neighbourhood Index. Neighbourhood Index direalisasikan sebagai sebuah tabel di dalam sistem manajemen basis data SQL Server. Gambar 32 menggambarkan alur pembangunan Neighbourhood Index.

Gambar 32. Alur pembangunan Neighbourhood Index JabarS.mat Hitung Jarak Cari Arah berdasarkan MBR Cari Arah berdasarkan titik pusat Cari Exact Direction File Topologi T_1 s/d T_7327 Load ke SQL Server Neighbourhood Index

JabarS.mat Cek MBR not_separate Membangun List

JabarM.mat Periksa

Adjacency JabarA.mat


(61)

37

3.3.1. Hitung Jarak

Jarak antar dua desa didefinisikan sebagai jarak garis lurus antara titik pusat kedua desa (Gambar 33). Jarak antar dua desa dihitung berdasarkan jarak eucledian sebagai berikut:

distance = sqrt(((center(1,1)- center(2,1)).^2) +

((center(1,2)- center(2,2)).^2));

Gambar 33. Visualisasi jarak antardesa 3.3.2.Cari Arah

Arah antara dua desa didefinisikan sebagai posisi desa kedua secara relatif terhadap desa pertama yang dinyatakan dalam delapan arah mata angin. Gambar 34 merupakan visualisasi arah desa 4 relatif terhadap desa 1 dalam peta S menggunakan fungsi get_direction (S,1,4).

Gambar 34. Get_direction (S,1,4)

get_direction(S,1,4) ans =


(62)

Fungsi get_direction mengevaluasi arah berdasarkan posisi relatif MBR obyek kedua terhadap titik pusat obyek pertama yang menjadi acuan. Berikut adalah potongan programnya :

Pada kondisi dimana MBR kedua desa berpotongan (Gambar 35) maka penentuan arah berdasarkan posisi relatif MBR tidak menghasilkan nilai valid. Untuk mengatasi hal tersebut maka fungsi get_direction dilanjutkan dengan pemeriksaan posisi relatif titik pusat obyek kedua terhadap titik pusat obyek pertama yang menjadi acuan. Berikut adalah potongan programnya :

Gambar 35. Get_direction (S,1,6)

Setelah arah dalam empat mata angin utama (utara, selatan, barat, timur) ditentukan selanjutkan menentukan arah sekunder (tenggara, baratdaya, baratlaut, timurlaut). Berikut potongan programnya :

if y >= originy, direction.utara =1;, tf= true;, end if y<= originy, direction.selatan=1;,tf= true;, end if x >= originx, direction.timur=1;, tf= true;, end if x<= originx, direction.barat=1;, tf= true;, end

get_direction(S,1,6)

ans = undefined Æ based on MBR ans = selatan Æ based on center if ymin >= originy, direction.utara =1;, tf= true;, end if ymax <= originy, direction.selatan=1;, tf= true;, end if xmin >= originx, direction.timur=1;, tf= true;, end if xmax <= originx, direction.barat=1;, tf= true;, end


(63)

39

3.3.3.Pembentukan File Topologi

Hasil perhitungan jarak dan penentuan arah sebuah desa terhadap seluruh desa lainnya dalam peta S disimpan dalam variabel T_X (file topologi T_X.mat), dimana X menunjukkan nomor desa. Pada tahap ini terbentuk 7327 file dan masing-masing berukuran sekitar 300 KB sehingga total berukuran 975 MB. Gambar 36 memperlihatkan struktur dari file topologi :

Gambar 36. Struktur file topologi 3.3.4.Loading ke SQL Server

Karena setiap file topologi jika dimuat ke lingkungan Matlab akan membutuhkan ruang memori sekitar 11 MB maka tidak mungkin memuat seluruh file topologi ke memori sekaligus (membutuhkan sekitar 80 GB memori). Agar data jarak dan arah dalam file topologi dapat disimpan dan diambil dengan cepat tanpa membutuhkan memori yang sangat besar maka file topologi tersebut di-loading ke dalam basis data. Dalam SQL Server 2000, file topologi dimuat ke dalam tabel NeighbourhoodIndex pada basis data sdm dengan struktur sebagai berikut (Gambar 37):

< 1x1 struct> < 1x1 struct> < 1x1 struct>

Node1 1 Node2 2 Distance 24775 Direction < 1x1 struct>

Timur 1 Tenggara 0 Selatan 0 Baratdaya 0 Barat 0 Baratlaut 0 Utara 0 Timurlaut 0 Undefined 0

if (direction.timur==1 & direction.selatan==1),direction.tenggara=1;, end

if (direction.barat==1 & direction.selatan==1),direction.baratdaya=1;, end

if (direction.barat==1 & direction.utara==1),direction.baratlaut=1;, end

if (direction.timur==1 & direction.utara==1),direction.timurlaut=1;, end


(64)

Gambar 37. Struktur tabel NeighbourhoodIndex

Berikut potongan program yang digunakan untuk loading file topologi ke SQL Server :

Pada tahap ini terbentuk tabel NeighbourhoodIndex yang berisi 53.684.928 baris dan berukuran 1870 MB.

3.4Membentuk path

Alur proses pembentukan path digambarkan pada Gambar 38 dan terdiri dari beberapa tahap yaitu :

3.4.1.Penentuan Obyek Target

Obyek target merupakan subset dari desa yang termasuk kelas miskin. Dari 177 desa di 8 kabupaten yang dijadikan sampel oleh Santoso A(2000), 122 termasuk kelas miskin. Dari desa yang termasuk kelas miskin tersebut, dipilih 3 desa dari setiap kabupaten sebagai obyek target (Tabel 5). Gambar 39 memperlihatkan sebaran ke-24 desa obyek target (kuning) diantara desa miskin (merah) dan desa tidak miskin (hijau).

conn = database(dbTarget,'',''); dbTarget harus telah

terdaftar dalam ODBC connection

clear T

load(Tfile,'T') % load Tfile ke dalam variabel T

colnames = {'node1','node2','distance','exactdirection'}; for i=1:size(T,1);

% exdata = {T(i).node1, T(i).node2, T(i).distance,

T(i).direction.exactdirection};

exdata{i,1} = T(i).node1; exdata{i,2} = T(i).node2; exdata{i,3} = T(i).distance;

exdata{i,4} = T(i).direction.exactdirection;

end % end for i

insert(conn,tblTarget,colnames,exdata); commit(conn);


(65)

41

Gambar 38. Alur proses pembentukan path

Tabel 5. Desa Target

Membentuk path k=2 Obyek Target

Path k=2 JabarA.mat

Membentuk path k=n Neighbourhood

Index

Filter Predikat


(66)

(67)

43

3.4.2.Membangun Path dengan k=2

Path dengan panjang dua node (path k=2) menggambarkan tetangga langsung dari desa target. Karena desa tetangga adalah desa yang berdampingan dengan desa target maka pada tahap ini filter predikat yang memeriksa arah path belum diterapkan. Berikut potongan program dari fungsi sdm_pathk2 :

function pathk2 = sdm_pathk2(A,node) counter=0;

pathk2={};

for i=1:length(node)

tetangga=find(A(node(i),:)); for j=1:length(tetangga) counter=counter+1;

pathk2{counter,1}=[node(i) tetangga(j)]; end

end

Dari 24 desa target, terbentuk 142 path k=2. Visualisasi path k=2 terdapat pada Gambar 40.


(68)

3.4.3.Membangun Filter Predikat

Filter predikat digunakan untuk menyaring arah perluasan path. Pada penelitian ini perluasan path dibatasi hingga memenuhi syarat umum sebuah node hanya muncul sekali dalam satu path. Sebuah path terdiri dari serangkaian node. Jika path terdiri dari dua node maka path tersebut hanya memiliki first_node dan last_node. Jika jumlah node dalam path lebih dari dua node maka dalam path tersebut terdapat sebuah node sebelum last node (before_last_node). Ketika sebuah path diperluas, maka filter predikat akan menyaring node baru mana yang akan ditambahkan ke dalam path. Ilustrasi proses perluasan path disajikan pada Gambar 41.

Gambar 41. Perluasan Path

Filter predikat yang dibangun pada penelitian ini adalah filter predikat arah (direction predicate filter) mencakup starlike dan variable_starlike filter. Filter vertical/horizontal variable starlike tidak dikembangkan karena diasumsikan bobot perluasan path memiliki kecenderungan yang sama ke seluruh arah. Dalam setiap filter predikat arah, arah path sebelum diperluas (exact_direction_previous) akan dibandingkan dengan arah path baru jika diperluas (exact_direction_new). Yang menjadi pembeda dari kedua filter predikat arah di atas adalah bagaimana menetapkan node acuan dalam mencari exact_direction_previous serta exact_direction_new. Filter predikat arah starlike menggunakan node terakhir (last_node dan before_last_node) sedangkan variable starlike menggunakan node pertama.

First Node Before Last Node Last Node

New Node ?

?

fi

lte

r

Path Extended Path


(1)

No

Kode Prop

Kode Kab

Kode

Desa ID2000 Nama Desa KTM KM1 KM2 KM3 Skor

1 32 1 010 3601020010 CIJALARANG 81,30 6,30 6,30 6,10 37,20 2 32 1 002 3601050002 KARANGBOLONG 18,80 25,00 56,30 0,00 137,60 3 32 1 006 3601060007 MEKARJAYA 56,30 18,80 12,50 12,40 81,00 4 32 1 001 3601080008 KADUBERA 46,70 40,00 6,70 6,60 73,20 5 32 1 002 3601110002 KUBANG KAMPIL 50,00 31,30 6,30 12,40 81,10 6 32 1 029 3601110029 MONTOR 33,30 33,30 20,00 13,40 113,50 7 32 1 004 3601120004 KALANGANYAR 28,60 14,30 35,70 21,40 149,90 8 32 1 006 3601120006 TELUK 31,30 25,00 18,80 24,90 137,30 9 32 1 001 3601100002 KUBANG KONDANG 25,00 43,80 31,30 0,00 106,40 10 32 1 011 3601160011 SEKONG 26,70 26,70 26,70 19,90 139,80 11 32 1 004 3601170004 CIBEUREUM 18,80 31,30 43,80 6,10 137,20 12 32 1 014 3601190014 GERENDONG 75,00 25,00 0,00 0,00 25,00 13 32 03 006 3201010006 PANGKAL JAYA 7,10 28,60 7,10 57,20 214,40 14 32 03 013 3201020013 WANGUN JAYA 25,00 31,30 31,30 12,40 131,10 15 32 03 017 3201020017 SADENG 56,30 25,00 12,50 6,20 68,60 16 32 03 021 3201040006 SUKAMAJU 81,30 18,80 0,00 0,00 18,80 17 32 03 030 3201040015 CIJUJUNG 81,30 18,80 0,00 0,00 18,80 18 32 03 001 3201050001 TAPOS 1 0,00 12,50 31,30 56,20 243,70 19 32 03 009 3201070009 KOTA BATU 92,90 7,10 0,00 0,00 7,10 20 32 03 001 3201060001 PURWASARI 37 50 0 00 18 80 43 70 168 70 20 32 03 001 3201060001 PURWASARI 37,50 0,00 18,80 43,70 168,70 21 32 03 017 3201080017 PALASARI 100,00 0,00 0,00 0,00 0,00 22 32 03 008 3201110005 BATU LAYANG 75,00 6,30 12,50 6,20 49,90 23 32 03 010 3201110008 LEUWIMALANG 18,80 12,50 18,80 49,90 199,80 24 32 03 007 3201120007 SUKAMAHI 68,80 31,30 0,00 0,00 31,30 25 32 03 009 3201160009 SUKARASA 6,70 33,3, 26,70 33,30 186,60 26 32 03 003 3201150005 SUKAMULYA 12,50 43,80 31,30 12,40 143,60 27 32 03 014 3201170006 SUKASIRNA 46,70 20,00 6,70 26,60 113,20 28 32 03 011 3201200003 TAJUR 57,10 21,40 21,40 0,00 64,20 29 32 03 021 3201200012 CITEUREUP 25,00 25,00 25,00 25,00 150,00 30 32 03 017 3201180012 CILEUNGSI 21,40 21,40 35,70 21,50 157,30 31 32 03 019 3201180010 PASIR ANGIN 50,00 8,30 16,70 25,00 116,70 32 32 03 003 3201290002 TAPOS 12,50 18,80 25,00 43,70 199,90 33 32 03 007 3201280008 CURUG 10,00 0,00 40,00 50,00 230,00 34 32 03 009 3276040009 HARJAMUKTI 6,30 56,30 18,80 18,60 149,70 35 32 03 012 3201210012 CIRIUNG 35,70 14,30 35,70 14,30 128,60 36 32 03 019 3201130009 CIUJUNG 10,00 30,00 40,00 20,00 170,00 37 32 03 020 3201130010 CIMANDALA 91,70 8,30 0,00 0,00 8,30 38 32 03 010 3201080016 TAJUR HALANG 25,00 18,80 37,50 18,70 149,90 39 32 03 005 3276010005 PASIR PUTIH 86,70 6,70 6,70 0,00 20,10 40 32 03 014 3201050008 CINANGKA 81,30 12,50 6,30 0,00 25,10 41 32 03 006 3276060006 GANDUL 92,30 0,00 7,70 0,00 15,40 42 32 03 005 3201250005 PADURENAN 81,30 0,00 6,30 12,40 49,80 43 32 03 005 3201170001 SUKAJAYA 13,30 20,00 20,00 46,70 200,10 44 32 03 017 3201280017 PANGAUR 93,30 6,70 0,00 0,00 6,70 45 32 03 003 3276020008 MAMPANG 26,70 13,30 33,30 26,70 160,00 46 32 03 004 3276020009 PANCORAN MAS 28,60 21,40 35,70 14,30 135,70 47 32 03 005 3276050005 KUKUSAN 21,40 28,60 28,60 21,40 150,00


(2)

No

Kode Prop

Kode Kab

Kode

Desa ID2000 Nama Desa KTM KM1 KM2 KM3 Skor

48 32 03 003 3276030005 SUKAMAJU 35,70 32,10 28,60 3,60 100,10 49 32 03 006 3276030009 ABADI JAYA 53,30 26,70 13,30 6,70 73,40 50 32 06 006 3204010006 PANUNDAAN 40,00 26,70 26,70 6,60 99,90 51 32 06 009 3204010009 LEBAKMUNCANG 40,00 13,30 33,30 13,40 120,10 52 32 06 003 3204040002 BANJARSARI 53,30 23,30 20,00 3,40 73,50 53 32 06 004 3204050005 CIBEUREUM 80,60 12,90 3,20 3,30 29,20 54 32 06 007 3204070007 CIBEET 40,00 13,30 26,70 20,00 126,70 55 32 06 004 3204100004 CIARO 20,00 26,70 26,70 26,60 159,90 56 32 06 017 3204100015 CICALENGKA KULON 25,00 31,30 25,00 18,70 137,40 57 32 06 003 3204110003 RANCAEKEK KULON 37,50 12,50 43,80 6,20 118,70 58 32 06 009 3204120009 MAJALAYA 18,80 18,80 37,50 24,90 168,50 59 32 06 005 3204150005 LEBAK WANGI 20,00 20,00 40,00 20,00 160,00 60 32 06 001 3204140001 JALEKONG 25,00 43,80 6,30 24,90 131,10 61 32 06 005 3204140005 MALAKASARI 31,30 25,00 25,00 18,70 131,10 62 32 06 006 3204140006 BOJONGMALAKA 50,00 18,80 18,80 12,40 93,60 63 32 06 002 3204180002 SEKARWANGI 56,30 18,80 18,80 6,10 74,70 64 32 06 006 3204190007 SOREANG 40,00 13,30 33,30 13,40 120,10 65 32 06 008 3204190009 PADASUKA 64,30 21,40 14,30 0,00 50,00 66 32 06 002 3204200002 NANGGERANG 75,00 18,80 0,00 6,20 37,40 67 32 06 001 3204220001 CILANGARI 50,00 25,00 25,00 0,00 75,00 68 32 06 002 3204220002 SINDANGJAYA 37,50 18,80 25,00 18,70 124,90 69 32 06 003 3204230003 NEGLASARI 0 00 8 30 16 70 75 00 266 70 69 32 06 003 3204230003 NEGLASARI 0,00 8,30 16,70 75,00 266,70 70 32 06 005 3204230005 CIJENUK 0,00 7,70 15,40 76,90 269,20 71 32 06 012 3204240011 CIPANGERAN 6,70 20,00 40,00 33,30 199,90 72 32 06 001 3204250001 NANJUNG 28,60 28,60 21,40 21,40 135,60 73 32 06 004 3204260004 MARGAHAYU SELATAN 25,00 25,00 43,80 6,20 131,20 74 32 06 002 3204270002 CANGKUANG WETAN 31,30 18,80 43,80 6,10 124,70 75 32 06 002 3204310002 PADASUKA 60,00 20,00 13,30 6,70 66,70 76 32 06 011 3204320011 CIBOGO 56,30 25,00 18,80 0,00 62,60 77 32 06 004 3204340005 TUGUMUKTI 46,70 13,30 40,00 0,00 93,30 78 32 06 001 3204330001 CIWARUGA 56,30 12,50 6,30 24,90 99,80 79 32 06 002 3204350002 GADOBANGKONG 43,80 25,00 25,00 6,20 93,60 80 32 06 010 3204360009 TAGOGAPU 50,00 50,00 0,00 0,00 50,00 81 32 06 004 3204710001 MELONG 23,10 7,70 30,80 38,40 184,50 82 32 06 002 3204720002 CIGUGUR TENGAH 35,70 14,30 28,60 21,40 135,70 83 32 06 005 3204720005 PADASUKA 46,70 13,30 6,70 33,30 126,60 84 32 06 001 3204730001 PASIR KALILI 73,30 13,30 13,30 0,10 40,20 85 32 07 002 3205010002 INDRALAYANG 75,00 25,00 0,00 0,00 25,00 86 32 07 005 3205030010 GUNAMEKAR 26,70 26,70 26,70 19,90 139,80 87 32 07 003 3205040003 PANAWA 66,70 26,70 6,70 0,00 40,10 88 32 07 003 3205060003 CIKELET 66,70 26,70 6,70 0,00 40,10 89 32 07 004 3205090004 CIKONDANG 100,00 0,00 0,00 0,00 0,00 90 32 07 007 3205130007 KADONGDONG 21,40 21,40 21,40 35,80 171,60 91 32 07 001 3205140001 SUKAMURNI 31,30 18,80 31,30 18,60 137,20 92 32 07 011 3205150011 CIELA 53,30 26,70 20,00 0,00 66,70 93 32 07 014 3205150014 SUKARAME 50,00 31,30 18,80 0,00 68,90 94 32 07 002 3205170002 SARIMUKTI 31,30 12,50 31,30 24,90 149,80 95 32 07 012 3205170012 BARUSARI 20,00 0,00 13,30 66,70 226,70 96 32 07 017 3205170017 CINTAKARYA 14,30 14,30 35,70 35,70 192,80


(3)

No Prop Kab Desa ID2000 Nama Desa KTM KM1 KM2 KM3 Skor 97 32 07 008 3205180008 JAYARAGA 12,90 19,40 32,30 35,40 190,20 98 32 07 003 3205200003 LEBAKJAYA 38,70 32,30 22,60 6,40 96,70 99 32 07 005 3205200005 GODOG 13,30 13,30 33,30 40,10 200,20 100 32 07 004 3205210004 TENJONAGARA 56,30 12,50 31,30 0,00 75,10 101 32 07 003 3205230003 SUKARAJA 35,70 14,30 42,90 7,10 121,40 102 32 07 014 3205230014 KARYASARI 31,30 18,80 37,50 12,40 131,00 103 32 07 006 3205250006 KARANGANYAR 30,80 23,10 28,50 17,60 132,90 104 32 07 006 3205280006 KARANGTENGAH 13,30 4,00 33,30 49,40 218,80 105 32 07 019 3205310019 CILAMPUYANG 18,80 25,00 37,50 18,70 156,10 106 32 11 007 3209060002 SUSUKAN LEBAK 6,70 20,00 40,00 33,30 199,90 107 32 11 011 3209050013 CURUG WETAN 53,30 0,00 33,30 13,40 106,80 108 32 11 016 3209010016 CIKULAK KIDUL 37,50 25,00 31,30 6,20 106,20 109 32 11 002 3209020004 PABUARAN LOR 37,50 25,00 18,80 18,70 118,70 110 32 11 018 3209020018 BABAKAN LOSARI 28,60 50,00 7,10 14,30 107,10 111 32 11 017 3209030015 KALI RAHAYU 56,30 25,00 18,80 0,00 62,60 112 32 11 008 3209040010 KARANGWANGUN 43,80 12,50 25,00 18,70 118,60 113 32 11 001 3209080004 MUNJUL 46,20 30,80 23,10 0,00 77,00 114 32 11 008 3209090008 MUNDU PESISIR 40,00 13,30 26,70 20,00 126,70 115 32 11 007 3209110007 WANASABA LOR 16,70 16,70 16,70 49,90 199,80 116 32 11 007 3209130008 PANONGAN 13,30 40,00 33,30 13,40 146,80 117 32 11 008 3209140008 KEJUDEN 12,50 43,80 25,00 18,70 149,90 118 32 11 004 3209150004 PASALAKAN 13 30 20 00 40 00 26 70 180 10 118 32 11 004 3209150004 PASALAKAN 13,30 20,00 40,00 26,70 180,10 119 32 11 008 3209150008 MEGUGEDE 13,30 13,30 53,30 20,10 180,20 120 32 11 002 3209160002 ASTAPADA 6,70 6,70 40,00 46,60 226,50 121 32 11 015 3209160012 KEMLAKA GEDE 0,00 20,00 60,00 20,00 200,00 122 32 11 011 3209170011 BUYUT 12,50 25,00 31,30 31,20 181,20

123 32 11 012 LEGAL GUBUG 75,00 18,80 6,30 0,00 31,40

124 32 11 013 3209210010 BRINGIN 0,00 14,30 35,70 50,00 235,70 125 32 11 006 3209220006 KEJIWAN 50,00 31,30 18,80 0,00 68,90 126 32 11 019 3209230021 JAGAPURA KULON 11,10 0,00 11,10 77,80 255,60 127 32 11 021 3209230020 JAGAPURA WETAN 0,00 12,50 12,50 75,00 262,50 128 32 11 021 3209180021 BUNGO LOR 15,40 15,40 30,80 38,40 192,20 129 32 14 001 3212010001 BANTAR WARU 46,70 26,70 26,70 0,00 80,10 130 32 14 012 3212030005 KEDOKANGABUS 56,30 18,80 25,00 0,00 68,80 131 32 14 002 3212020002 TUNJUNGKERTA 25,00 37,50 18,80 18,70 131,20 132 32 14 003 3212050003 NUNUK 56,30 18,80 12,50 12,40 81,00 133 32 14 010 3212060012 SUKADANA 46,70 26,70 6,70 19,90 99,80 134 32 14 005 3212070005 TEGAL GIRANG 66,70 13,30 20,00 0,00 53,30 135 32 14 003 3212080003 GUNUNGSARI 37,50 25,00 31,30 6,20 106,20 136 32 14 007 3212080007 TULUNGAGUNG 15,40 23,10 30,80 30,70 176,80 137 32 14 001 3212100001 CANGKINGAN 50,00 42,90 7,10 0,00 57,10 138 32 14 005 3212110005 DADAP 83,30 16,70 0,00 0,00 16,70 139 32 14 008 3212110008 PONDOH 25,00 50,00 6,30 18,70 118,70 140 32 14 009 3212120009 GADINGAN 18,80 31,30 31,30 18,60 149,70 141 32 14 003 3212170003 LANJAN 68,80 18,80 12,50 0,00 43,80 142 32 14 002 3212150002 PLUMBON 25,00 12,50 37,50 25,00 162,50 143 32 14 020 3212150013 LEBAHABANG 23,10 23,10 15,40 38,40 169,10 144 32 14 011 3212160011 TERUSAN 35,70 21,40 14,30 28,60 135,80 145 32 14 003 3212180003 PUNTANG 50,00 12,50 37,50 0,00 87,50


(4)

No

Kode Prop

Kode Kab

Kode

Desa ID2000 Nama Desa KTM KM1 KM2 KM3 Skor

146 32 14 008 3212180008 PANGKALAN 43,80 18,80 31,30 6,10 99,70 147 32 14 004 3212200004 KERTAJAYA 35,70 21,40 35,70 7,20 114,40 148 32 14 003 3212210003 BUGIS 68,80 12,50 18,80 0,00 50,10 149 32 14 011 3212220012 BUGEL 42,90 14,30 21,40 21,40 121,30 150 32 20 009 3604010009 RANCASANGGAL 0,00 14,30 78,61 7,10 192,80 151 32 20 003 3604050003 TEJAMARI 93,80 0,00 6,30 0,00 12,60 152 32 20 004 3604060004 KAMUNING 91,70 0,00 8,30 0,00 16,60 153 32 20 003 3604070003 TINGGAR 13,30 33,30 20,00 33,40 173,50 154 32 20 005 3604070005 CURUGMANIS 37,50 37,50 25,00 0,00 87,50 155 32 20 008 3604070008 CURUG 13,30 33,30 33,30 20,10 160,20 156 32 20 001 3604130001 SILEBU 46,70 46,70 6,70 0,00 60,10 157 32 20 008 3604130008 CISAIT 56,30 18,80 6,30 18,60 87,20 158 32 20 014 3604160005 KOTABARU 0,00 6,70 33,30 60,00 253,30 159 32 20 008 3604150008 PANANCANGAN 38,50 23,10 30,80 7,60 107,50 160 32 20 001 3604180001 SASAHAN 73,30 6,70 6,70 13,30 60,00 161 32 20 005 3604190005 BALEKAMBANG 46,70 26,70 13,30 13,30 93,20 162 32 20 002 3604230002 WARUNG JAUD 25,00 12,50 43,80 18,70 156,20 163 32 20 003 3604230003 MESJID PRIYAYI 26,70 26,70 33,30 13,30 133,20, 164 32 20 011 3604260011 PANENJOAN 6,30 12,50 43,80 37,40 212,30 165 32 20 015 3604260015 RAGASMESIGIT 50,00 6,30 12,50 31,20 124,90

166 32 20 007 SUKMAJAYA 61,50 23,10 7,70 7,70 61,60

167 32 20 001 RAMANUJU 61 50 15 40 15 40 7 70 69 30

167 32 20 001 RAMANUJU 61,50 15,40 15,40 7,70 69,30

< 70 Desa Tidak Miskin Skor Kemiskinan = 70 - 190 Desa Miskin


(5)

SIMPULAN DAN SARAN

Kesimpulan yang didapat dari penelitian ini adalah:

1

Penelitian ini telah berhasil mengembangkan prototipe spatial data mining

yang menerapkan teknik karakterisasi spasial.

2

Prototipe yang dihasilkan terdiri dari empat komponen yaitu modul

pengolahan awal, modul spatial data mining, modul basisdata dan modul

visualisasi. Modul spatial data mining tersusun atas neighbourhood graph,

filter predikat, neighbourhood index dan algoritma karakterisasi spasial.

Untuk pengembangan lanjutan prototipe ini disarankan hal-hal berikut :

1

Algoritma karakterisasi spasial menggunakan asumsi bahwa desa yang

berdekatan dengan desa miskin juga memiliki karakter yang mirip dengan

desa miskin tersebut, padahal asumsi tersebut tidak sepenuhnya tepat untuk

kondisi non-fisik. Untuk memperbaiki hal ini perlu dilakukan modifikasi

dalam prosedur perluasan path, dimana untuk memperluas path selain

mempertimbangkan hubungan spasial (topologi, jarak dan arah) juga harus

mempertimbangkan kedekatan atribut. Pemeriksaan kedekatan atribut

diperlukan untuk menjamin seluruh desa yang masuk dalam path adalah desa

miskin juga.

2

Dalam prototipe ini Neighbourhood Index disimpan sebagai tabel di SQL

Server sedangkan proses komputasi spasial dilakukan dalam Matlab. Dengan

demikian terdapat overhead yang tinggi dalam transfer data antara SQL Server

dan Matlab. Agar proses lebih cepat disarankan untuk menggunakan sistem

manajemen basisdata yang mampu menangani data spasial sepenuhnya.

3

Penelitian ini menekankan pada pembentukan sistem yang mampu mengelola

dua bentuk atribut dalam Podes yaitu numerik dan kategorik. Kedua bentuk

atribut tersebut terdapat dalam lima peubah yang digunakan dalam prototipe

ini. Sedangkan agar hasil penelitian dapat diterapkan langsung maka perlu

belibatkan atribut lainnya dalam Podes 2003.


(6)

51

4

Nilai

frequency-factor

menunjukkan perbandingan kemunculan atribut pada

wilayah target dibandingkan dengan kemunculan atribut tersebut di seluruh

basisdata. Penelitian ini menggunakan batasan significance bagi

frequency-factor lebih besari dari 1.0. Untuk selanjutnya perlu dilakukan kajian tentang

penetapan parameter significance lebih kecil dari 1.0

5

Penelitian ini hanya menggunakan satu set desa target (8 kabupaten dan 3 desa

untuk masing-masing kabupaten, total 24 desa) . Untuk penelitian selanjutnya

dapat digunakan beberapa set desa target untuk melihat pengaruhnya terhadap

sebaran nilai frequency-factor.