Application of Spatial Decision Tree in Identifiying Mangrove Area Using C4.5 Algorithm.

ABSTRACT
NAPTHALENA. Application of Spatial Decision Tree in Identifiying Mangrove Area Using C4.5
Algorithm. Under the direction of IMAS SUKAESIH SITANGGANG and SONY HARTONO
WIJAYA.
Mangrove forests have a lot of benefits for life, such as beach abration protector, building material
and fuel, as well as meal supplier for plankton. Therefore, mangrove forest should be protected and
developed. Mangrove forests are located along tropical and subtropical beach that are influenced by
tide water. East Kalimantan is one of provinces in Kalimantan that has potential coast teritory for
mangrove’s growth. In one region there are some districts which have larger mangrove potency than
neighbor districts. For that, it is required a spatial analysis for mangrove area identification in order to
be able to know description of potential region for mangrove’s growth. One of techniques in
extracting knowledge in spatial database is spatial data mining.This research uses a spatial data
mining method, especially spatial decision tree using C4.5 algorithm to develop a classifier to predict
new data of mangrove area. This research applies the Spatial Join Index (SJI) and the complete
operator to apply conventional classification technique in spatial database. The SJI is created using
topological relation to find relation between two spatial objects, then the result is simplified using
complete operator. The result of this research shows that classes of mangrove area are described by
some attributes : slope, topography, substrat, and landuse. The classifier contains 23 rules with
60,66% accuracy.
Keywords: spatial decision tree, C4.5 algorithm, spatial join index, complete operator


PENERAPAN SPATIAL DECISION TREE UNTUK
IDENTIFIKASI LAHAN MANGROVE MENGGUNAKAN
ALGORITME C4.5

NAPTHALENA

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2009

PENERAPAN SPATIAL DECISION TREE UNTUK
IDENTIFIKASI LAHAN MANGROVE MENGGUNAKAN
ALGORITME C4.5

NAPTHALENA

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR
BOGOR
2009

PENERAPAN SPATIAL DECISION TREE UNTUK
IDENTIFIKASI LAHAN MANGROVE MENGGUNAKAN
ALGORITME C4.5

NAPTHALENA

Skripsi
Sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada
Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2009


ABSTRACT
NAPTHALENA. Application of Spatial Decision Tree in Identifiying Mangrove Area Using C4.5
Algorithm. Under the direction of IMAS SUKAESIH SITANGGANG and SONY HARTONO
WIJAYA.
Mangrove forests have a lot of benefits for life, such as beach abration protector, building material
and fuel, as well as meal supplier for plankton. Therefore, mangrove forest should be protected and
developed. Mangrove forests are located along tropical and subtropical beach that are influenced by
tide water. East Kalimantan is one of provinces in Kalimantan that has potential coast teritory for
mangrove’s growth. In one region there are some districts which have larger mangrove potency than
neighbor districts. For that, it is required a spatial analysis for mangrove area identification in order to
be able to know description of potential region for mangrove’s growth. One of techniques in
extracting knowledge in spatial database is spatial data mining.This research uses a spatial data
mining method, especially spatial decision tree using C4.5 algorithm to develop a classifier to predict
new data of mangrove area. This research applies the Spatial Join Index (SJI) and the complete
operator to apply conventional classification technique in spatial database. The SJI is created using
topological relation to find relation between two spatial objects, then the result is simplified using
complete operator. The result of this research shows that classes of mangrove area are described by
some attributes : slope, topography, substrat, and landuse. The classifier contains 23 rules with
60,66% accuracy.

Keywords: spatial decision tree, C4.5 algorithm, spatial join index, complete operator

Judul
Nama
NRP

: Penerapan Spatial Decision Tree untuk Identifikasi Lahan Mangrove Menggunakan
Algoritme C4.5
: Napthalena
: G64052303

Menyetujui:

Pembimbing I,

Pembimbing II,

Imas Sukaesih Sitanggang, S.Si, M.Kom
NIP 197501301998022001


Sony Hartono Wijaya, S.Kom, M.Kom

Mengetahui:
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Dr. drh. Hasim, DEA
NIP 196103281986011002

Tanggal Lulus :

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah SWT atas segala rahmat dan hidayah-Nya
sehingga tugas akhir dengan judul penerapan Spatial Decision Tree untuk Identifikasi Lahan
Mangrove Menggunakan Algoritme C4.5 dapat terselesaikan. Penelitian ini dilaksanakan mulai
Februari 2009 sampai dengan Juni 2009, bertempat di Departemen Ilmu Komputer.
Terima kasih penulis ucapkan kepada Ibu Imas S. Sitanggang, S.Si, M.Kom selaku pembimbing
pertama dan Bapak Sony H. Wijaya, S.Kom, M.Kom selaku pembimbing kedua yang telah banyak
memberi arahan selama penulis menjalankan penelitian. Penghargaan juga penulis sampaikan kepada
Bapak Tomi, Bapak Syukur, dan Ibu Mulya atas segala diskusi, saran, serta data yang digunakan

dalam penelitian ini. Tak lupa, ungkapan terima kasih kepada rekan-rekan Ilkom 42, FAMLAR (Adet,
Mirna, Medria, Prita, Indra, Ijun, Huda, Nila, dan Ovie), rekan-rekan Basket FMIPA (Gae, Eyyi,
Riken, Ami, dan Wiwid) atas diskusi, kebersamaan, canda, dan tawa selama penulis menempuh studi
dan menjalankan penelitian. Terakhir, ungkapan terima kasih disampaikan kepada ayah, ibu, kakak,
adik, serta seluruh keluarga atas doa dan kasih sayangnya. Semoga karya ilmiah ini bermanfaat.

Bogor, Juni 2009

Napthalena

RIWAYAT HIDUP
Penulis dilahirkan di Bogor pada tanggal 9 September 1986 dari ayah Achmad Kosasih dan Ibu
Yenni Karmila. Penulis merupakan anak kedua dari tiga bersaudara.
Tahun 2005, penulis lulus dari SMUN 5 Bogor dan pada tahun yang sama penulis diterima di
Institut Pertanian Bogor (IPB) melalui jalur USMI. Tahun 2007, penulis diterima sebagai mahasiswa
di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, IPB. Tahun 2008,
penulis menjalankan kegiatan praktik lapangan di Ditjen Kelautan, Pesisir, dan Pulau-pulau Kecil
Departemen Kelautan dan Perikanan (KP3K DKP) dengan judul Pembuatan Modul untuk
Menampilkan Peta pada Sistem Informasi Geografis Potensi Kelautan dan Pulau-pulau Kecil.
Selama menjalani perkuliahan, penulis pernah menjadi anggota Badan Eksekutif Mahasiwa

Fakultas Matematika dan Pengetahuan Alam (BEM FMIPA) Divisi Pengembangan Sumber daya
Mahasiswa (PSDM) tahun 2006. Pada tahun 2008, penulis pernah menjadi finalis lomba Data Mining
tingkat nasional (Gemastik 2008). Selain itu, penulis juga pernah menjadi asisten mata kuliah Data
Mining pada tahun akademik 2008/2009.

DAFTAR ISI
Halaman
DAFTAR TABEL ............................................................................................................. v
DAFTAR GAMBAR ......................................................................................................... v
DAFTAR LAMPIRAN ...................................................................................................... v
PENDAHULUAN
Latar Belakang ..................................................................................................................... 1
Tujuan ................................................................................................................................. 1
Ruang Lingkup .................................................................................................................... 1
Manfaat Penelitian ............................................................................................................... 1
TINJAUAN PUSTAKA
Data Spasial ......................................................................................................................... 2
Spatial Data Mining ............................................................................................................. 2
Spatial Decision Tree ........................................................................................................... 2
Spatial Join Index................................................................................................................. 2

Operator Complete ............................................................................................................... 2
Algoritme K-Means ............................................................................................................. 3
Algoritme C4.5 .................................................................................................................... 3
Confusion matrix.................................................................................................................. 2
METODE PENELITIAN
Pengadaan Data.................................................................................................................... 5
Seleksi Data ......................................................................................................................... 5
Praproses Data ..................................................................................................................... 5
Penentuan Data Uji dan Data Latih ....................................................................................... 6
Klasifikasi Menggunakan Spatial Decision Tree ................................................................... 6
Akurasi Classifier ................................................................................................................ 6
Penggunaan Classifier pada Data Baru ................................................................................. 6
Pengembangan Sistem .......................................................................................................... 6
HASIL DAN PEMBAHASAN
Pengadaan Data.................................................................................................................... 7
Seleksi Data ......................................................................................................................... 7
Praproses Data ..................................................................................................................... 7
Penentuan Data Uji dan Data Latih ....................................................................................... 9
Klasifikasi Menggunakan Spatial Decision Tree ................................................................... 9
Akurasi Classifier .............................................................................................................. 10

Penggunaan Classifier pada Data Baru ............................................................................... 11
KESIMPULAN DAN SARAN
Kesimpulan ........................................................................................................................ 11
Saran ................................................................................................................................. 12
DAFTAR PUSTAKA ...................................................................................................... 12
LAMPIRAN ................................................................................................................... 13

iv

DAFTAR GAMBAR
Halaman
1 Topological Biner (Sekhar & Chawla 2003)....................................................................... 2
2 Spatial Join Index (Zeitouni & Chelghoum 2004) .............................................................. 2
3 Ilustrasi Penggunaan Operator Complete (Zeitouni & Chelghoum 2004) ............................ 3
4 Tahapan Penelitian ............................................................................................................ 4
5 Tahapan Praproses............................................................................................................. 5
6 Penentuan Kelas Target ..................................................................................................... 6
7 Model Pohon Keputusan.................................................................................................... 7

DAFTAR TABEL

Halaman
1 Confusion matrix ............................................................................................................... 4
2 Jumlah record tabel SJI .................................................................................................... 8
3 Hsil clustering luas area..................................................................................................... 8
4 Jumlah jenis kategori ......................................................................................................... 8
5 Label kelas ........................................................................................................................ 8
6 Atribut data latih ............................................................................................................... 9
7 Tipe data dalam file Arff ................................................................................................... 9
8 Confusion matrix ............................................................................................................. 10
9 Data contoh ..................................................................................................................... 11

DAFTAR LAMPIRAN
Halaman
1 Praproses secara rinci ...................................................................................................... 14
2 Nama kelurahan .............................................................................................................. 15
3 Luas area kelurahan di Kabupaten Kutai Timur dan Kota Tarakan .................................... 16
4 Tabel spatial join index antara objek spasial kelurahan dengan objek spasial landuse ....... 18
5 Tabel SJI sederhana antara objek spasial kelurahan dengan objek spasial landuse ............. 19
6 Inisialisasi kategori .......................................................................................................... 21
7 Hasil perhitungan rasio luas area mangrove terhadap kelurahan........................................ 24

8 Tabel gabungan SJI ......................................................................................................... 26
9 Transformasi data ............................................................................................................ 28
10 Aturan model pohon keputusan ...................................................................................... 30

v

PENDAHULUAN
1.1 Latar Belakang
Hutan mangrove tumbuh dan tersebar di
wilayah Indonesia terutama di wilayah pesisir.
Wilayah pesisir merupakan suatu wilayah
peralihan antara darat dan lautan. Ditinjau dari
garis pantai, suatu wilayah pesisir memiliki dua
macam batas, yaitu batas yang sejajar dengan
garis pantai dan batas yang tegak lurus terhadap
garis pantai. Daerah penyebaran hutan
mangrove di Indonesia terluas terdapat di Irian
Jaya, yaitu lebih kurang 1.350.600 ha,
kemudian Kalimantan 978.200 ha (Dahuri
2003).
Hutan mangrove memiliki banyak manfaat
bagi kehidupan, diantaranya sebagai peredam
badai angin, pelindung abrasi pantai, bahan
bangunan dan bahan bakar, pemasok hara dan
makanan bagi plankton, dan lain-lain. Oleh
karena itu, hutan mangrove perlu dijaga dan
dikembangkan
pertumbuhannya.
Hutan
mangrove hidup di sepanjang pantai tropis dan
subtropis yang dipengaruhi oleh pasang surut
air. Kalimantan Timur merupakan salah satu
provinsi di Pulau Kalimantan yang memiliki
wilayah pesisir yang potensial untuk
pertumbuhan mangrove, yaitu di wilayah
kabupaten Kutai Timur dan Kota Tarakan.
Provinsi Kalimantan Timur memiliki 618.200
ha luas lahan hutan mangrove (Dahuri 2003).
Hutan mangrove tumbuh di daerah tersebut dan
tersebar tidak secara merata. Pada satu wilayah
terdapat beberapa daerah yang memiliki potensi
mangrove yang lebih luas dibandingkan daerah
sekitarnya, meskipun daerah tersebut sudah
memenuhi kriteria untuk pertumbuhan hutan
mangrove. Oleh karena itu diperlukan suatu
analisis spasial untuk identifikasi lahan
mangrove sehingga dapat diketahui deskripsi
wilayah yang potensial untuk mengembangkan
mangrove.
Ditjen Kelautan, Pesisir dan Pulau-pulau
Kecil (KP3K) telah melakukan pemetaan baik
secara langsung dari citra satelit untuk
memetakan daerah persebaran pertumbuhan
mangrove pada suatu wilayah maupun survey
lapangan hingga level kelurahan. Salah satu
metode untuk pengolahan dan menganalisis
data adalah spatial data mining untuk
mengekstraksi informasi atau pola yang penting
dari data di dalamnya.
Salah satu teknik dalam spatial data mining
adalah klasifikasi spasial. Klasifikasi spasial
bertujuan memberikan sebuah
label atau
menentukan kelas dari sebuah objek berdasar

nilai atribut yang ada dalam spasial dataset
dengan memperhatikan objek tetangganya.
Salah satu metode klasifikasi spasial adalah
spatial decision tree. Penelitian ini akan
menggunakan metode spatial decision tree
untuk membuat classifier dari data spasial
terkait dengan hutan mangrove.
1.2 Tujuan
Tujuan dari penelitian ini adalah :
1

Menerapkan teknik klasifikasi pada data
spasial mangrove menggunakan Algoritme
C4.5

2

Membuat
spatial
classifier
untuk
mendeskripsikan wilayah yang memiliki
lahan mangrove.

1.3 Ruang Lingkup
Classifier dibangun menggunakan data
spasial terkait dengan hutan mangrove di
wilayah provinsi Kalimantan Timur, yaitu
Kabupaten Kutai Timur dan Kota Tarakan
dengan level wilayah terendah adalah
kelurahan.
Pembuatan
decision
tree
menggunakan Algoritme C4.5 dan data spasial
yang digunakan diantaranya data mengenai
mangrove, administrasi kelurahan, sungai,
topografi, landuse, geologi, geomorfologi,
lereng, dan tanah.
1.4 Manfaat Penelitian
Penelitian ini diharapkan dapat memberikan
manfaat sebagai bahan pertimbangan bagi
pemerintah dan pihak-pihak yang terkait dalam
mengembangkan potensi mangrove di suatu
wilayah.
TINJAUAN PUSTAKA
2.1 Data Spasial
Data
spasial
adalah
data
yang
merepresentasikan aspek-aspek keruangan dari
fenomena yang terdapat di dunia nyata. Data
spasial direpresentasikan di dalam basisdata
sebagai raster atau vektor. Model data raster
menampilkan, menempatkan, dan menyimpan
data spasial dengan menggunakan struktur
matriks atau piksel-piksel yang membentuk grid
sedangkan model data vektor menggunakan
titik, garis atau kurva, atau poligon beserta
atributnya (Prahasta 2001).
Model informasi spasial terbagi menjadi dua
kategori yaitu field dan object. Model object di
dalam peta dapat direpresentasikan sebagai line
atau polygon. Pada model object, terdapat
hubungan antara dua object yang dapat
dideskripsikan
menggunakan
hubungan
1

topological. Contoh hubungan topological
antara dua objek spasial adalah contains, inside,
dan overlap yang diilustrasikan pada Gambar 1
(Sekhar & Chawla 2003).

yang merupakan perluasan dari join indeks
dalam kerangka relational database yang
diperkenalkan
oleh
Valduriez
yang
diilustrasikan pada Gambar 2. SJI menghitung
secara tepat hubungan spasial antara dua objek
dari dua lapisan tematik (Zeitouni 2000).
Hubungan antara dua objek dalam SJI dapat
berupa toplogical atau metrik. Setiap tuple
(ID1, Spatial_relationship, ID2) yang terdapat
pada SJI merepresentasikan hubungan yang
terdapat pada pasangan objek spasial yang
teridentifiaksi sebagai ID1 dam ID2 (Zeitouni &
Chelghoum 2004).
.

Gambar 1 Topological Biner (Sekhar &
Chawla 2003).
2.2 Spatial Data Mining
Basisdata
spasial
menyimpan
data
keruangan atau spasial dalam jumlah yang
besar, seperti peta, preprocessing remote
sensing atau medical imaging data, dan VLSI
chip layout data. Basisdata spasial berbeda
dengan basisdata relasional. Pada basisdata
spasial terkandung hubungan topologi atau
informasi jarak.
Spatial data mining merupakan proses
ekstraksi pengetahuan, hubungan spasial atau
pola-pola lainnya yang tidak secara eksplisit
disimpan pada basisdata spasial. Penggabungan
data mining dengan teknologi basisdata spasial
berguna untuk menemukan hubungan spasial
dan hubungan antara spasial dan non-spatial,
membangun basis pengetahuan spasial, dan
mengoptimalkan kueri spasial (Han & Kamber
2006).
2.3 Spatial Decision Tree
Spatial decision tree adalah metode
decision tree untuk klasifikasi data spasial.
Metode ini berbeda dari decision tree
konvensional dengan mengambil perhitungan
yang tersembunyi dalam hubungan spasial
antara objek (Zeitouni & Chelgoum 2001).
2.4 Spatial Join Index
Pertimbangan utama dalam spatial data
mining adalah hubungan spasial antara objek.
Tidak seperti model data relasional, hubungan
spasial
bersifat
implicit
(tersembunyi).
Komputasi spatial relationship memerlukan
banyak operasi spatial join, yang dapat
memberatkan secara komputasi. Metode untuk
menyederhanakan proses ini menggunakan
struktur yang disebut Spatial Join Index (SJI)

Gambar 2 Spatial Join Index (Zeitouni &
Chelghoum 2004).
2.5 Operator Complete
Operator complete mengatur kembali data
di dalam tabel unik atau khusus dari gabungan
tiga tabel ternasuk di dalamnya terdapat tabel
hasil dari spatial join index, sehingga
didapatkan satu tabel. Prinsip dari operator
complete adalah membangkitkan untuk setiap
nilai atribut dalam tabel terhubung dengan
atribut dari tabel hasil. Keuntungan dari
penggunaan
operator
complete
adalah
menghindari adanya duplikasi analisis objek
dan membolehkan penggunaan metode data
mining lain.
Definisi dari operator complete adalah :
Misalkan terdapat tiga tabel, yaitu R (ID1,
A1,…,An), V(ID2, B1,…,Bm) dan I(ID1, ID2,
W). Primary keys setiap tabel ditandai dengan
garis bawah. B(i=1,…,m) merupakan atribut
kualitatif dan bij(j=1,…,Ki) merupakan nilai
yang berbeda (distinct values). Misal F =
{F1,F2,…,Fm} adalah suatu kumpulan fungsi
agregasi.
COMPLETE (R, V, I, F) adalah sebuah tabel T
yang memiliki rancangan skema seperti :
T(ID1,A1,…,An,W_b11,…,W_b1K1,…,W_bm1,…,
W_bmKm) dengan :


ID1 adalah key
2

 t = (id1, a1, a2,…an, W_b11, …, W_b1K1,
…, W_bm1, W_bm2, …, W_bmKm) Є T,
- (id1,a1,a2,…,an ) = σ (ID1 = Id1) (R),
- Jika σ (ID1=Id1) (I) maka W_bij=Fi(σ
(ID1=Id1) (I) ∞ (Bi=bij) (V); W), Selainnya
NULL.
Contoh penggunaan operator Complete
diilustrasikan pada Gambar 3 (Zeitouni &
Chelghoum 2004).

2.7 Algoritme C4.5
Algoritme C4.5 adalah pengembangan dari
algoritme ID3 untuk membangkitkan pohon
keputusan (decision tree). Algoritme C4.5
secara rekursif mengunjungi setiap decision
node, memilih pemisahan (split) atribut yang
optimal, sampai tidak ada pemisahan (split)
atribut yang memungkinkan. Algoritma C4.5
menggunakan konsep dari information gain atau
entropy reduction untuk memilih pemisahan
(split) yang optimal dengan memilih split yang
memiliki information gain terbesar (Larose
2005).
Information gain didapatkan dengan cara:
dengan

Gambar 3 Ilustrasi penggunaan Operator
Complete Zeitouni & Chelghoum 2004).
2.6 Algoritme K-Means
Analisis cluster mengelompokkan obyekobyek data hanya berdasar pada informasi yang
terdapat pada data, yang menjelaskan obyek dan
relasinya. Tujuan analisis cluster adalah agar
objek-objek di dalam grup menjadi mirip (atau
berhubungan) satu dengan lainnya, dan berbeda
(atau tidak berhubungan) dengan objek dalam
grup lainnya. Salah satu teknik dalam clustering
adalah algoritme K-means.
K-means merupakan teknik clustering
sederhana. Langkah pertama yang dilakukan
adalah menentukan K initial centroid, dengan K
adalah parameter spesifik yang berupa jumlah
dari cluster yang diinginkan. Kemudian Setiap
objek dimasukkan ke dalam cluster yang
memiliki centroid terdekat dengan objek
tersebut. Centroid dalam cluster akan berubah
sesuai dengan objek yang terdapat di dalam
cluster. Kemudian langkah penempatan objek
ke dalam cluster dengan centroid terdekat
diulang hingga tidak ada objek cluster yang
berpindah cluster.
Algoritme dasar dari K-means adalah (Tan et al.
2006)
Tentukan K buah objek sebagai centroid awal.
Ulangi
Tandai masing-masing objek untuk K
cluster dimana objek tersebut memiliki
centroid terdekat.
Hitung kembali centroid untuk masingmasing cluster.
Sampai tidak ada centroid yang berubah.

adalah nilai entropy
didapatkan dengan cara :

dan

m

I ( S1, S2,…,Sm ) = -

p
i 1

i

* log 2 ( pi )

dengan S berisi s data sample. Anggap atribut
untuk kelas memiliki m nilai yang berbeda, Ci
(untuk i = 1, …,m). Anggap si adalah jumlah
adalah
samples S pada kelas C i dan
probabilitas dari sample yang mempunyai kelas
Ci. Sedangkan nilai entropy didapatkan dengan
formula :

dengan atribut A memiliki nilai yang berbeda
{a1,a2,..av}. Atribut A digunakan untuk
mempartisi S menjadi v subset, { S1, S2,...,Sv },
dimana Sj berisi sample pada S yang
mempunyai nilai aj dari A.
merupakan jumlah sample pada subset yang
mempunyai nilai aj dari A dibagi dengan jumlah
total samples pada S.
Algoritme C4.5 dibuat untuk memperbaiki
Algoritme ID3 dalam mengatasi missing data,
data kontinyu, dan pruning (Santoso 2007).
Secara umum algoritme ID3 dan C4.5
adalah sebagai berikut :
Algoritme ID3 (Han & Kamber 2006)
Input : sampel latih, sampel
Output : Decision tree
Method :
1 Buat node N;
2 Jika semua sampel memiliki kelas yang
sama yaitu C, Maka jadikan node N
sebagai leaf node dan beri label C;

3

3

Jika daftar atribut kosong, Maka jadikan
node N sebagai leaf node dengan label =
nilai kelas yang terbanyak pada sampel;
4 Pilih atribut uji, atribut dalam daftar yang
memiliki information gain tertinggi;
5 Beri label node N dengan atribut uji;
6 Untuk setiap nilai ai dalam atribut uji yang
diketahui,
7
Tambahkan cabang di bawah node N
untuk atribut uji = ai;
8
Tentukan si sebagai subset dari sampel
dimana atribut uji = ai;
9
Jika sampel si kosong,
10
Tambahkan leaf node dengan label =
nilai kelas yang terbanyak pada
sampel;
11
Selainnya, tambah cabang baru di
bawah cabang yang sekarang dengan
memanggil fungsi ID3 (si,daftar
atribut-atribut uji);

Akurasi = banyaknya total prediksi yang benar
total banyaknya prediksi

METODE PENELITIAN
Penelitian ini dilaksanakan dalam beberapa
tahap seperti yang diilustrasikan pada Gambar
4.
ka

Algoritme C4.5 (Quinlan 1993)
1
2

3

4

Bangun pohon keputusan dari data latih.
(ID3 konvensional).
Ubah pohon ke dalam bentuk aturan-aturan.
Jumlah aturan sama dengan jumlah
kemungkinan path dari akar ke daun.
Pangkas
setiap
aturan
dengan
menghilangkan precondition sehingga
meningkatkan nilai akurasi.
Urutkan aturan yang dipangkas berdasar
nilai akurasinya, dan gunakan aturan-aturan
tersebut pada data uji.
n

2.8 Confusion Matrix
Evaluasi dari kinerja model didasarkan pada
banyaknya (count) dari test record secara benar
dan secara tidak benar oleh model klasifikasi.
Count ini ditabulasikan ke dalam matrik yang
diilustrasikan pada Tabel 1 (Tan et al. 2006).
Tabel 1 Confusion matrix

Kelas
aktual

Kelas =1
Kelas = 0

Kelas hasil prediksi
Kelas = 1 Kelas = 0
f11
f10
f01
f00

Setiap entri fijdi dalam tabel menyatakan
banyaknya record dari kelas i yang diprediksi
menjadi kelas j. Berdasar entri-entri yang
terdapat pada confusion matrix, total banyaknya
prediksi yang benar oleh model adalah (f11 + f00)
dan total banyaknya prediksi yang salah oleh
model adalah (f10 + f01), sehingga akurasi
didapatkan dengan cara (Tan et al. 2006) :

Gambar 4 Tahapan penelitian.
Pengadaan Data
Data yang akan digunakan pada penelitian
ini adalah data spasial wilayah pesisir di
provinsi Kalimantan Timur, yaitu Kabupaten
Kutai Timur dan Kota Tarakan. Data yang akan
digunakan diperoleh dari Ditjen Kelautan
Pesisir dan Pulau-pulau Kecil Departemen
4

Perikanan dan Kelautan (KP3K DKP) dan dari
mahasiswa jenjang S3 yang sedang melakukan
penelitian di provinsi Kalimantan Timur. Data
yang diperoleh dari KP3K DKP adalah tahun
2006 dan data yang diperoleh dari mahasiswa
penelitian adalah data tahun 2008.
Seleksi Data
Pada tahap ini, memilih data pada sumber
data yang akan dijadikan atribut pada dataset.
Praproses Data
Beberapa tahapan yang dilakukan pada
tahap praproses secara rinci terdapat pada
Lampiran 1 dan diilustrasikan pada Gambar 5.
Proses ini dilakukan oleh semua objek spasial
yang terkait. Pada Gambar 5, objek spasial yang
dijadikan contoh adalah landuse.
1 Perhitungan luas area
Pada tahap ini dilakukan perhitungan luas
area objek kelurahan untuk hubungan spasial
dengan objek lain dan untuk membentuk
kelas target.
2 Penentuan hubungan spasial
Pada tahap ini, ditentukan hubungan spasial
antara dua objek spasial, yaitu menggunakan
hubungan topological. Operasi yang
digunakan adalah operasi intersection
menggunakan perangkat lunak Arcview,
sehingga didapatkan luas area yang
berpotongan diantara dua objek tersebut.
Hasil dari tahap ini adalah tabel spatial
join index dalam format xls yang berisi
ID_kel, ID_objeklain, hubungan_spasial,
dan luas area.
3 Penyerdehanaan tabel SJI (Spatial Join
Index)
Pada tahap ini, hasil dari tabel spatial join
index diurutkan berdasar wilayah, hubungan
topological, dan jenis atributnya. Kemudian
dihitung total luas area masing-masing
wilayah berdasar hubungan topological dan
jenis atribut. Luas area selanjutnya
dinyatakan dalam persentase terhadap luas
wilayah kelurahan. Setelah itu, dilakukan
penggunaan operator complete dengan
fungsi
agregasi
MAX
untuk
menyederhanakan tabel spasial join index,
yaitu dengan mengambil nilai terbesar
persentase luas area pada setiap jenis atribut.
Hasil dari tahap ini adalah tabel SJI yang
telah sederhana dalam format xls, berisi
ID_kel, jenis, dan luas area.

Gambar 5 Tahapan praproses.
4 Penentuan kategori
Pada tahap ini, dilakukan pengkategorian
jenis atribut pada tabel SJI yang telah
sederhana berdasar luas area. Proses ini
dilakukan menggunakan teknik clustering,
yaitu K-means dengan mengelompokkan
data ke dalam 3 cluster.
5 Pemberian label kategori
Pada tahap ini, dilakukan pemberian
label kategori pada tabel SJI yang telah
sederhana sebagai identitas dari atribut
jenis dan atribut luas area yang
digabungkan berdasar hasil clustering luas
area.
6 Penentuan kelas target
Pada tahap ini, dilakukan beberapa proses
yang diilustrasikan pada Gambar 6. Objek
spasial yang diproses adalah kelurahan dan
mangrove.

5

Akurasi Classifier

Gambar 6 Penentuan kelas target.
 Clustering luas area
Pada tahap ini, dilakukan proses clustering
luas area mangrove (dalam %) terhadap
kelurahan menggunakan teknik clustering,
yaitu K-means. Nilai ini dikelompokkan ke
dalam 3 cluster (sedikit, sedang, banyak).
Luas area yang bernilai 0 tidak dimasukkan
ke dalam proses clustering dan dianggap
masuk ke dalam label kelas tidak, sehingga
diperoleh empat label kelas yaitu ‘tidak’,
‘sedikit’, ‘sedang’, dan ‘banyak’.
 Pemberian label kelas
Pada tahap ini, dilakukan penambahan
atribut kelas pada objek kelurahan. Atribut
kelas ini berisi kategori tidak, sedikit,
sedang, dan banyak berdasar hasil clustering
rasio.

Akurasi dari model pohon yang dihasilkan
dihitung menggunakan confusion matrix, yaitu
menghitung banyaknya label kelas yang
diprediksi benar dibagi total banyaknya
prediksi. Jika hasilnya melebihi threshold, yaitu
sebesar 60% maka akan diproses ke tahap
berikutnya, apabila kurang dari threshold maka
akan kembali diproses pada tahap praproses
atau tahap penentuan dataset.
Penggunaan Classifier pada Data Baru
Classifier yang terbentuk dapat diterapkan
pada data baru, dimana data tersebut belum
memiliki label kelas. Label kelas didapatkan
dengan menelusuri model pohon yang terbentuk
atau aturan yang telah diturunkan dari model
pohon yang dihasilkan pada data latih.
Pengembangan Sistem
Perangkat lunak dan perangkat keras yang
digunakan dalam mengembangkan sistem
adalah sebagai berikut :


1 Arcview 3.3 untuk pemrosesan data
spasial.
2 Matlab 7.0 untuk proses clustering.
3 Microsoft Excel 2007 untuk melakukan
proses operator complete

7 Penggabungan tabel SJI
Pada tahap ini, dilakukan penggabungan
tabel SJI objek lain dengan tabel kelurahan
yang telah memiliki atribut kelas.
8 Transformasi data
Pada tahap ini, dilakukan perubahan tabel
format xls menjadi format arff agar dapat
diproses ke tahap selanjutnya yaitu proses
klasifikasi menggunakan perangkat lunak
Weka 3.6.0.

Perangkat Lunak :

4 Weka 3.6.0 untuk proses klasifikasi.


Perangkat keras
1 Processor Intel(R) Pentium(R) 4 CPU
3.06GHz
2 Memory 1280 MB RAM
3 Mouse
4 Keyboard

Penentuan Data Latih dan Data Uji
Pada tahap ini, dilakukan pemisahan data uji
dan data latih menggunakan 10-fold cross
validation untuk mengevaluasi classifier.
Klasifikasi Menggunakan Spatial Decision
Tree
Data hasil praproses diolah menggunakan
perangkat
lunak Weka 3.6.0 dengan
menggunakan Algoritme C4.5. Implementasi
dari algoritme C4.5 dalam Weka 3.6.0 adalah
J48.

HASIL DAN PEMBAHASAN
Pengadaan Data
Data provinsi Kalimantan Timur yang telah
diperoleh sampai level kelurahan. Kabupaten
Kutai Timur memiliki 42 wilayah kelurahan
sedangkan kota Tarakan memiliki 19 wilayah
kelurahan. Secara rinci dijabarkan nama-nama
kelurahan dimasing-masing wilayah yang
terdapat pada Lampiran 2.
Wilayah Kabupaten Kutai Timur memiliki
39 objek spasial dan wilayah Kota Tarakan
memiliki 60 objek spasial.
6

Seleksi data
Data yang digunakan pada penelitian ini
diperoleh dari wawancara dengan salah satu
pakar dari Ditjen KP3K DKP dan internet
(www.acehpedia.org). Data tersebut meliputi :
1

Batas wilayah Kabupaten Kutai Timur
Atribut yang terdapat pada objek ini adalah
shape,
area,
perimeter,
kelurahan,
kecamatan, Id, provinsi, dan kabupaten.

2

Batas wilayah Kota Tarakan
Atribut yang terdapat pada objek ini adalah
shape,
area,
perimeter,
kelurahan,
kecamatan, Id, provinsi, dan kabupaten.

3

Data Landuse
Data landuse merupakan data yang berisi
mengenai tataguna lahan. Atribut yang
terdapat pada objek ini adalah shape, ID,
dan jenis landuse.

4

Data Topografi
Data topografi merupakan data mengenai
ketinggian wilayah dihitung dari atas
permukaan laut. Atribut yang terdapat pada
objek ini adalah shape, longitude, latitude,
Id, tinggi, ellipsoid, dan datumvert.

5

Data Substrat
Data substrat merupakan data yang berisi
mengenai substrat pantai yang terkandung
di pantai pesisir. Atribut yang terdapat pada
objek ini adalah shape, area, perimeter, Id,
dan jenis.

6

Data Lereng
Data lereng merupakan data yang berisi
mengenai bentuk atau contour. Atribut
yang terdapat pada objek ini adalah shape,
Id, area, perimeter, dan jenis.

7

Data Tanah
Data tanah merupkan data yang berisi
mengenai jenis tanah. Atribut yang terdapat
pada objek ini adalah shape, Id, area,
perimeter, dan jenis.

8

Data Geologi
Data geologi merupakan data yang berisi
mengenai lapisan kulit bumi atau tanah
kedalaman tertentu. Atribut yang terdapat
pada objek ini adalah shape, Id, area,
perimeter, dan jenis.

9

Data Geomorfologi
Data geomorfologi merupakan data yang
berisi mengenai bentuk relief atau tinggi
rendahnya permukaan bumi atau disebut
juga bentang alam yang terbentuk dan
terpengaruh oleh tenaga endogen (dari
dalam bumi) dan eksogen dari luar bumi
(iklim dan cuaca). Atribut yang terdapat
pada objek ini adalah shape, Id, area,
perimeter, dan jenis.

10 Data Sungai
Data sungai merupakan data yang berisi
mengenai wilayah yang dilalui oleh aliran
sungai. Atribut yang terdapat pada objek ini
adalah shape, Id, area, dan nama.
Praproses data
Aktivitas – aktivitas yang dilakukan dalam
praproses data adalah sebagai berikut :
1 Perhitungan luas area
Perhitungan
luas
area
kelurahan
menggunakan perangkat lunak Arcview 3.3,
yaitu dengan menghitung setiap poligon atau
area kelurahan. Hasil dari perhitungan luas
area wilayah kelurahan dapat dilihat pada
Lampiran 3.
2 Penentuan hubungan spasial
Objek spasial direpresentasikan dalam
bentuk poligon atau titik. Setiap objek
poligon atau titik dianalisis hubungan
spasialnya terhadap objek kelurahan.
Hubungan spasial antara objek kelurahan
dan objek topografi adalah contains. Objek
topografi
direprentasikan dalam bentuk
titik (point), sehingga pada objek ini tidak
dihitung luas area, tetapi ditentukan nilai
rata-rata titik ketinggian yang ada di wilayah
tertentu. Terdapat beberapa wilayah yang
tidak memiliki data ketinggian, yaitu 10
wilayah di kabupaten Kutai Timur dan 6
wilayah di kota Tarakan. Oleh karena itu,
nilai ketinggiannya diisikan menjadi 0 (nol)
yang berarti tidak ada data. Selain itu,
terdapat juga 12 wilayah yang nilai
ketinggiannya diisikan dengan nilai
ketinggian wilayah tetangganya yang
diperoleh menggunakan operasi buffer.
Pada objek geomorfologi, geologi,
lereng, dan tanah terdapat tiga hubungan
spasial yaitu contains, overlap, dan inside.
Pada objek mangrove, landuse dan sungai
terdapat dua hubungan spasial yaitu overlap
dan contains. Sedangkan pada objek substrat
7

memiliki
overlap.

satu

hubungan

spasial

yaitu

Hubungan topological yang terjadi di
setiap data menghasilkan banyak record
atau yang saling berhubungan. Jumlah
record yang dihasilkan di setiap objek dapat
dilihat pada Tabel 2 dan secara rinci dapat
dilihat pada Lampiran 4.
Tabel 2 Jumlah record tabel SJI
Objek spasial
Mangrove
Topografi
Landuse
Substrat
Geomorfologi
Geologi
Lereng
Tanah

Jumlah record
122
227
431
92
477
290
296
352

3 Penyederhanaan Tabel Spatial Join Index
Pada data tabel SJI mangrove,
perhitungan luas area tidak dipisahkan
berdasar hubungan topological, melainkan
dijumlahkan semua luas area hasil tabel SJI,
karena data mangrove hanya memiliki satu
jenis.
Pada data yang memiliki tiga hubungan
spasial, yaitu data geomorfologi, geologi,
lereng dan tanah, hanya dua hubungan saja
yang diproses menggunakan operator
complete. Hubungan spasial yang diproses
adalah contains dan overlap. Hal ini
dilakukan untuk menghindari banyaknya
null pada data tersebut dikarenakan jumlah
record yang sedikit memiliki hubungan
spasial inside. Sehingga, record yang
memiliki operasi tersebut dianggap 0 (tidak
ada).
Proses penyederhanaan tabel spatial join
index ini, menghasilkan record dengan
jumlah 61, sesuai dengan banyaknya
wilayah kelurahan yang diamati. Tabel SJI
hasil penyederhanaan operator complete
dapat dilihat pada Lampiran 5.
4 Penentuan kategori
Terdapat 406 data luas area (persentase)
yang dikelompokkan ke dalam 3 cluster dari
6
atribut
yaitu
landuse,
geologi,
geomorfologi, tanah, lereng dan substrat.
Interval luas area (%) dalam setiap cluster
diberikan pada Tabel 3.

Tabel 3 Hasil clustering luas area
Cluster 1
(%)
0.01 -30.16

Cluster 2
(%)
30.87- 70.75

Cluster 3
(%)
71.2 - 100

5 Pemberian label kategori
Setiap data memiliki kode/simbol dalam
merepresentasikan hasil clustering luas area
yang digabung dengan atribut jenis.
Sehingga dari dua atribut yaitu luas area dan
atribut jenis didapatkan satu atribut yang
merepresentasikan keduanya dalam bentuk
simbol/kode. Banyaknya jenis setiap objek
dapat dilihat pada Tabel 4. Kode/simbol
setiap objek terdapat pada Lampiran 6.
Tabel 4 Jumlah jenis kategori
Objek spasial

Jumlah kategori

Landuse
Substrat
Geomorfologi
Geologi
Lereng
Tanah

10
6
14
13
4
5

6 Penentuan kelas target
 Clustering luas area
Hasil perhitungan
rasio
luas
area
mangrove terhadap area kelurahan dapat
dilihat pada Lampiran 7. Interval luas area
(%) dalam setiap cluster diberikan pada
Tabel 5.
Tabel 5 Label kelas
Cluster 1

Cluster 2

Cluster 3

Interval
(%)

0.0346
s/d
8.17

9.6871
s/d
26.968

48.641
s/d
66.775

kelas

Sedikit

Sedang

Banyak

 Pemberian label kelas
Jumlah record pada data kelurahan untuk
setiap label kelas hasil clustering adalah 24
record untuk label kelas tidak, 22 record
untuk label kelas sedikit, 13 record untuk
kelas sedang, dan 2 record untuk kelas
banyak.
7 Penggabungan Tabel SJI
Hasil penggabungan tabel SJI yang telah
ditambahkan kategori dan kelas adalah 14
8

atribut yang akan dijadikan sebagai dataset.
Secara garis besar 14 atribut tersebut dapat
dilihat pada Tabel 6 dan secara rinci terdapat
pada Lampiran 8.

10

Tabel 6 Atribut data latih

12

Atribut
1
2
3
4
5
6
7
8
9
10
11
12
13
14

Nama

13

Topografi
Sungai
Jenis landuse yang terkandung
Jenis landuse yang beroverlap
Jenis substrat yang beroverlap
Jenis geologi yang terkandung
Jenis geologi yang beroverlap
Jenis geomorfologi yang
terkandung
Jenis geomorfologi yang
beroverlap
Jenis lereng yang terkandung
Jenis lereng yang beroverlap
Jenis tanah yang terkandung
Jenis tanah yang beroverlap
Label kelas

8 Transformasi data
Mengubah format data latih menjadi
format arff sehingga dapat diolah ke dalam
perangkat lunak Weka 3.6.0. Tipe data
dalam file Arff dari masing – masing atribut
dapat dilihat pada Tabel 7 dan secara rinci
pada Lampiran 9.
Tabel 7 Tipe data dalam file Arff
Atribut
1
2
3
4
5
6
7
8
9

11

Nama

Tipe

Topografi
Sungai
Jenis landuse yang
terkandung
Jenis landuse yang
beroverlap
Jenis substrat yang
beroverlap
Jenis geologi yang
terkandung
Jenis geologi yang
beroverlap
Jenis geomorfologi
yang terkandung
Jenis geomorfologi
yang beroverlap

Numerik
Numerik
Kategorik
Kategorik
Kategorik
Kategorik
Kategorik
Kategorik
Kategorik

14

Jenis lereng yang
terkandung
Jenis lereng yang
beroverlap
Jenis tanah yang
terkandung
Jenis tanah yang
beroverlap
Label kelas

Kategorik
Kategorik
Kategorik
Kategorik
Kategorik

Penentuan Data Latih dan Data Uji
Pemisahan data ke dalam data uji dan data
latih menggunakan 10-folds cross validation.
Data akan dibagi ke dalam 10 bagian (folds),
setiap bagian akan digunakan sebagai data uji,
dan n-1 bagian (folds) akan dijadikan sebagai
data latih. Proses ini dilakukan sebanyak 10
kali.
Klasifikasi Menggunakan Spatial Decision
Tree
Dataset yang telah terbentuk diolah dan
menghasilkan sebuah model pohon keputusan.
Atribut yang dipilih sebagai atribut uji adalah
atribut yang memiliki information gain tertinggi
sesuai dengan algoritme C4.5. Di dalam Weka
algoritma C4.5 diimplementasikan dengan
menggunakan Algoritme J.48. Algoritme J.48
mampu mengolah tipe data numerik dan
kategori, hal ini terlihat dari atribut uji yang
dihasilkan terdapat atribut uji dengan tipe
numerik, yaitu topografi. Selain itu, Algoritme
J.48 juga mengolah kelas target bertipe
kategorik.
Model pohon yang terbentuk dapat dilihat
pada Gambar 7. Atribut yang menjadi atribut
uji pada model pohon ini adalah atribut
co_lereng (jenis lereng yang terkandung),
ov_substrat (jenis substrat yang beroverlap),
topografi, dan co_landuse (jenis landuse yang
terkandung). Dari pohon tersebut dapat
diturunkan 23 aturan yang selengkapnya dapat
dilihat di Lampiran 10.
Contoh aturan yang diturunkan dari hasil
model pohon keputusan yaitu :
Rules 1 : JIKA 0.01% - 30.16% area memiliki
lereng agak curam MAKA area tersebut TIDAK
memiliki mangrove.
Rules 2 : JIKA 0.01% - 30.16% area memiliki
lereng datar MAKA area tersebut memiliki
mangrove dalam kelas SEDANG.

9

Gambar 7 Model pohon keputusan.
Rules 3: JIKA area tidak memiliki lereng DAN
0.01% - 30.16% area bertumpang tindih dengan
substrat pasir DAN area memiliki ketinggian >
23 MAKA area tersebut memiliki mangrove
dalam kelas SEDIKIT.
Rules 4 : JIKA area tidak memiliki lereng DAN
tidak memiliki area yang bertumpang tindih
dengan substrat DAN 30.87% - 70.75% area
memiliki landuse belukar MAKA area tersebut
TIDAK memiliki mangrove.
Rules 5 : JIKA area tidak memiliki lereng DAN
tidak memiliki area yang bertumpang tindih
dengan substrat DAN 0.01% - 30.16% area
memiliki landuse pemukiman MAKA area
tersebut memiliki mangrove dalam kelas
SEDIKIT.
Akurasi Classifier
Hasil evaluasi metode pohon keputusan
dengan algoritme J48 menggunakan perangkat
lunak Weka 3.6.0 dapat dilihat pada Tabel 8.
Tabel 8 Confusion matrix

Kelas
aktual

0
20
6
3
1

0
1
2
3
Keterangan :
kelas 0 : Tidak
kelas 1 : Sedikit
kelas 2 : Sedang
kelas 3 : Banyak

Kelas hasil prediksi
1
2
3
0
13
3
6
4
1
0

3
1
0
0
0

secara benar sebagai label kelas tidak, 3 data
diprediksi salah sebagai label kelas sedikit dan 1
data diprediksi salah sebagai label kelas banyak.
Dari 22 data di label kelas sedikit, sebanyak 13
data diprediksi secara benar sebagai label kelas
sedikit, 6 data diprediksi salah sebagai label
kelas tidak, dan 3 data diprediksi salah sebagai
label kelas sedang. Dari 13 data di label kelas
sedang, sebanyak 4 data diprediksi secara benar
sebagai label kelas sedang, 3 data diprediksi
salah sebagai label kelas tidak, dan 6 data
diprediksi salah sebagai label kelas sedikit. Dari
2 data di label kelas banyak, tidak ada data yang
diprediksi secara benar, sebanyak 1 data
diprediksi salah sebagai label kelas tidak, dan 1
data diprediksi salah sebagai kelas sedikit. Hal
ini diakibatkan oleh sedikitnya jumlah data
untuk pelatihan di label kelas banyak yaitu
hanya 2 data, sehingga tidak ditemukan pola
dalam mengklasifikasikan data ke dalam label
kelas banyak. Selain itu, hal yang menyebabkan
salah dalam mengklasifikasi pada masingmasing kelas adalah terdapat kemiripan wilayah
berdasar pada hasil digitasi citra.
Akurasi model keputusan pohon yang
didapatkan adalah :
Akurasi = banyaknya total prediksi yang benar
total banyaknya prediksi
37
= = 0.6066
61

Hasil dari akurasi classifier menunjukkan
keakuratan model pohon yang terbentuk dalam
memprediksi data. Akurasi yang didapat yaitu
60.66 %, sehingga telah memenuhi threshold.

Dari confusion matrix diketahui dari 24 data
di label kelas tidak, sebanyak 20 data diprediksi
10

Tabel 9 Data contoh
Record
Id

Topografi





Substsrat
beroverlap

1
2
3
4
5

30
200
127
20
100


..





..




ps1
Ncs
Ncs
Ncs
Ncs

Keterangan :
ps1 = pasir dengan area (0.01% -30.16%)
ncs = area tidak memiliki substrat
h1 = hutan dengan area (0.01% -30.16%)
b2 = belukar dengan area (30.87%- 70.75%)
pm1= pemukiman dengan area
(0.01% - 30.16%)
ncl = area tidak memiliki landuse
nclr= area tidak memiliki lereng
lb1= lereng datar dengan area
(0.01% - 30.16%)
la1= lereng agak curam dengan area
(0.01%- 30.16%)
Penggunaan Classifier pada Data Baru
Pada tahap ini, terdapat beberapa record
data contoh untuk menunjukkan bagaimana
penggunaan classifier pada data baru yang
belum memiliki label kelas. Pada data contoh
terdapat 5 record yang atribut kelasnya belum
terisi. Untuk pengisian masing-masing record
dilakukan dengan cara menelusuri model pohon
yang dibuat atau dengan melihat dari aturan
pohonnya. Ilustrasi data contoh dapat dilihat
pada Tabel 9.
Pengisian label kelas pada record 1
dilakukan dengan mencari aturan yang sesuai
pada himpunan aturan. Aturan yang sesuai
adalah Rules 3 dengan nilai test atribut tidak
memiliki lereng (nclr), bertumpang tindih
dengan substrat pasir (ps1), dan ketinggian
wilayah > 23 (30). Dengan demikian label kelas
pada record 1 adalah sedikit.
Pengisian label kelas pada record 2
dilakukan dengan mencari aturan yang sesuai
pada himpunan aturan. Aturan yang sesuai
adalah Rules 4 dengan nilai test atribut tidak
memiliki lereng (nclr), tidak bertumpang tindih
dengan substrat (ncs), dan memiliki landuse
belukar (b2). Dengan demikian label kelas pada
record 2 adalah tidak.

Landuse
yang
terkandung
h1
b2
pm1
Ncl
Ncl









Lereng
yang
terkandung
nclr
nclr
nclr
lb1
la1



Kelas







?
?
?
?
?

Pengisian label kelas pada record 3
dilakukan dengan mencari aturan yang sesuai
pada himpunan aturan. Aturan yang sesuai
adalah Rules 5 dengan nilai test atribut tidak
memiliki lereng (nclr), tidak bertumpang tindih
dengan substrat (ncs), dan memiliki landuse
pemukiman (pm1). Dengan demikian label
kelas pada record 3 adalah sedikit.
Pengisian label kelas pada record 4
dilakukan dengan mencari aturan yang sesuai
pada himpunan aturan. Aturan yang sesuai
adalah Rules 2 dengan nilai test atribut
memiliki lereng datar (lb1). Dengan demikian
label kelas pada record 4 adalah sedang.
Pengisian label kelas pada record 5
dilakukan dengan mencari aturan yang sesuai
pada himpunan aturan. Aturan yang sesuai
adalah Rules 1 dengan nilai test atribut
memiliki lereng agak curam (la1). Dengan
demikian label kelas pada record 5 adalah tidak.

KESIMPULAN DAN SARAN
Kesimpulan
Berdasar penelitian yang dilakukan dalam
membuat classifier untuk identifikasi lahan
mangrove, dapat diambil kesimpulan sebagai
berikut :
1
2

3

Terbentuknya spasial classifier yang terdiri
dari 23 aturan dengan akurasi 60.66%.
Dari penelitian ini area mangrove
dideskripsikan oleh area yang mengandung
lereng, area yang beroverlap dengan
substrat, topografi, dan area yang
mengandung landuse.
Penggunaan spatial join index dan operator
complete dalam menentukan hubungan
spasial antara objek spasial menghasilkan
dataset yang dapat diolah menggunakan
teknik klasifikasi konvensional.

11

Saran
Saran-saran yang dapat diberikan untuk
pengembangan lebih lanjut agar lebih baik
dari yang telah dilakukan adalah sebagai
berikut :
1

2

International Workshop on Temporal,
Spatial and Spatio-Temporal Data Mining,
Lecture Notes in Artificial Intelligence.
102-114.

Untuk memodelkan area mangrove
diperlukan keseimbangan dalam jumlah
kelas target.
Perlu dibuat aplikasi komputer untuk
mengimplementasikan proses spatial join
index dan operator complete, terutama
untuk data spasial berukuran besar.

DAFTAR PUSTAKA
Chelghoum N, Karine Z. 2004. Spatial Data
Mining Implementation : Alternatives and
performance. Versailles. Prism Laboratory
University of Versailles.
Dahuri, R. 2003. Keanekaragaman Hayati
Laut : Aset Pembangunan Berkelanjutan
Indonesia. Jakarta: PT Gramedia Indonesia
Pustaka.
Han J, Kamber M. 2006. Data Mining
Concepts and Techniques. San Diego,
USA: Morgan-Kaufmann.
Larose, T Daniel. 2005. Discovering
Knowledge In Data : An Introduction To
Data Mining. New Jersey. WileyInterscience.
Prahasta E. 2001. Konsep-konsep Dasar
Sistem Informasi Geografis. Bandung:
Informatika.
Quinlan, J.R. 1993. C4.5: Programs For
Machine Learning. San Mateo. CA:
Morgan Kaufmann.
Santoso B. 2007. Data Mining : Teknik
Pemanfaatan Data Untuk Keperluan
Bisnis. Yogyakarta. Graha Ilmu.
Sekhar S, Chawla S.2003. Spatial Databases a
Tour. New Jersey: Prentice Hall.
Tan P, Michael S. dan Vipin K. 2006.
Introduction to Data Mining. Addison