Klasifikasi Data Titik Api di Bengkalis Riau Menggunakan Algoritme Pohon Keputusan Berbasis Spatial Entropy

KLASIFIKASI DATA TITIK API DI BENGKALIS RIAU
MENGGUNAKAN ALGORITME POHON KEPUTUSAN
BERBASIS SPATIAL ENTROPY

INDRY DESSY NURPRATAMI

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Klasifikasi Data Titik
Api di Bengkalis Riau Menggunakan Algoritme Pohon Keputusan Berbasis
Spatial Entropy adalah benar karya saya dengan arahan dari komisi pembimbing
dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun.
Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun
tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan
dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Juli 2014

Indry Dessy Nurpratami
NIM G64100032

ABSTRAK
INDRY DESSY NURPRATAMI. Klasifikasi Data Titik Api di Bengkalis Riau
Menggunakan Algoritme Pohon Keputusan Berbasis Spatial Entropy. Dibimbing
oleh IMAS SUKAESIH SITANGGANG.
Kebakaran hutan dapat dipantau dengan menggunakan satelit yang
mendeteksi titik api sebagai indikator kebakaran pada waktu dan lokasi tertentu.
Tujuan penelitian ini adalah mengembangkan sebuah pohon keputusan untuk
memprediksi munculnya titik api di kabupaten Bengkalis provinsi Riau, Indonesia
menggunakan algoritme pohon keputusan berbasis spatial entropy. Data yang
digunakan pada penelitian adalah data kebakaran hutan di daerah Bengkalis, Riau.
Data tersebut meliputi pusat kota, sungai, jalan, sumber pendapatan, tutupan
lahan, populasi, curah hujan, sekolah, temperatur, dan kecepatan angin. Hasil
penelitian dengan menggunakan metode uji 5-fold cross validation adalah 5

pohon keputusan dengan akurasi rata-rata 52.05% dan 89.04% masing-masing
pada data uji dan data latih. Pohon keputusan terbaik memiliki akurasi data uji
sebesar 56% pada data uji yang mempunyai 560 node dengan node akar adalah
layer tutupan lahan. Dari pohon keputusan tersebut diperoleh 255 aturan untuk
mengklasifikasikan titik api. Terdapat juga sebanyak 20 objek pada data uji
dengan pohon keputusan terbaik yang tidak dapat diklasifikasikan oleh pohon.
Kata kunci: bengkalis, kebakaran hutan, spatial decision tree, spatial entropy, titik
api

ABSTRACT
INDRY DESSY NURPRATAMI. Classification of Hotspot Dataset in Bengkalis
Using Spatial Entropy-Based Decision Tree Algorithm. Supervised by IMAS
SUKAESIH SITANGGANG.
Forest fire can be monitored using satellite by detecting hotspots as fire
indicators at certain times and locations. The purpose of this research is to develop
a decision tree for predicting hotspot occurences in Bengkalis district, Riau
province Indonesia using the spatial entropy-based decision tree algorithm. The
data used in this research are forest fire data of Bengkalis area. The data include
city centre, river, road, income source, land cover, population, precipitation,
school, temperature, and wind speed. This research, using the 5-fold cross

validation, yields five decision trees with the average accuracy of 52.05% and
89.04% on the testing set and the training set respectively.The best accuracy of
decision tree is 56% on the testing set that has 560 nodes with the land cover layer
as the root node. From the decision tree, as 255 rules for classifying hotspot
occurences are obtained. There are 20 objects in the testing set that cannot be
classified by the decision tree with the highest accuracy on the testing set.
Keywords: bengkalis, forest fire, hotspot, spatial decision tree, spatial entropy

KLASIFIKASI DATA TITIK API DI BENGKALIS RIAU
MENGGUNAKAN ALGORITME POHON KEPUTUSAN
BERBASIS SPATIAL ENTROPY

INDRY DESSY NURPRATAMI

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer


DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

Penguji:
1 Hari Agung Adrianto, SKom, Msi
2 Endang Purnama Giri, SKom, MKom

Judul Skripsi : Klasifikasi Data Titik Api di Bengkalis Riau Menggunakan
Algoritme Pohon Keputusan Berbasis Spatial Entropy
Nama
: Indry Dessy Nurpratami
NIM
: G64100032

Disetujui oleh

Dr Imas S. Sitanggang, SSi, MKom

Pembimbing I

Diketahui oleh

Dr Ir Agus Buono, MSi, MKom
Ketua Departemen Ilmu Komputer

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wata’ala atas
segala karunia-Nya sehingga tugas akhir dengan judul Klasifikasi Data Titik Api
di Bengkalis Riau Menggunakan Algoritme Pohon Keputusan Berbasis Spatial
Entropy dapat diselesaikan. Penyelesaian tugas akhir ini tidak terlepas dari
bantuan beberapa pihak. Oleh karena itu, penulis ingin menyampaikan terima
kasih kepada semua pihak yang telah membantu dalam penyelesaian tugas akhir
ini, antara lain:
1 Mama, Papa, dan Adik-adik serta seluruh keluarga atas segala doa, kasih
sayangnya dan semangat yang telah diberikan kepada penulis.
2 Ibu Dr Imas Sukaesih Sitanggang, SSi, MKom selaku dosen

pembimbing yang selalu memberikan saran dan arahan selama
penelitian dan penulisan tugas akhir ini.
3 Bapak Hari Agung Adrianto, SKom, MSi dan Bapak Endang Purnama
Giri, SKom, MKom yang telah bersedia menjadi dosen penguji
4 Rekan-rekan mahasiswa bimbingan Ibu Dr Imas Sukaesih Sitanggang,
SSi, MKom terutama Umil dan Ana atas informasi dan kerjasamanya
selama penyelesaian tugas akhir ini.
5 Rekan-rekan Sunda Karya yang memberi motivasi dalam penyelesaian
tugas akhir ini, yaitu Poet, Eka, Pupu, kak Ade, Ria, Beti, Jesi, dan putri.
6 Teman-teman S1 Ilmu Komputer angkatan 47 (Pixels 47) yang telah
memberikan motivasi dan bantuan dalam penyelesaian tugas akhir ini
khususnya Bayu Sasrabau yang telah membantu dan mengajari dalam
pembuatan fungsi jarak dengan bahasa Python dan Ayu Riza Bestary
serta rekan-rekan lainnya yang tentu tidak bisa disebutkan satu persatu
atas bantuan dan motivasinya.
Penulis juga mengucapkan terima kasih kepada semua pihak yang telah
membantu selama pengerjaan penyelesaian tugas akhir ini yang tidak dapat
disebutkan satu-persatu. Penulis menyadari bahwa masih terdapat kekurangan
dalam penulisan skripsi ini. Semoga skripsi ini dapat memberikan manfaat.


Bogor,

Juli 2014

Indry Dessy Nurpratami

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

PENDAHULUAN


1

Latar Belakang

1

Perumusan Masalah

2

Tujuan Penelitian

2

Manfaat Penelitian

2

Ruang Lingkup Penelitian


2

METODE

3

Data dan Area Studi

3

Tahapan Penelitian

4

Peralatan Penelitian

7

HASIL DAN PEMBAHASAN

Praproses Data

7
7

Pembuatan Model Klasifikasi Spasial Menggunakan Algoritme Pohon
Keputusan Berbasis Spatial Entropy

11

Evaluasi Model

15

SIMPULAN DAN SARAN

16

Simpulan


16

Saran

16

DAFTAR PUSTAKA

16

LAMPIRAN

18

RIWAYAT HIDUP

23

DAFTAR TABEL
1
2
3
4
5
6
7
8

Layer target
Hasil perhitungan jarak hotspot ke jalan terdekat
Hasil perhitungan jarak hotspot ke sungai terdekat
Hasil perhitungan jarak hotspot ke pusat kota terdekat
Hasil penggabungan objek target dan objek-objek penjelas
Hasil normalisasi atribut ordinal
Hasil perhitungan intra distance dan extra distance
Akurasi data uji dan data latih

9
9
10
10
11
12
12
15

DAFTAR GAMBAR
1
2
3
4
5
6
7
8
9

Layer titik api
Layer temperatur
Tahapan Penelitian
Titik hotspot dan nonhotspot
Query pembuatan layer target
Query jarak minimum dari target ke jalan terdekat
Kode program perhitungan spatial entropy
Kode program perhitungan information gain
Kode program Python untuk membuat pohon keputusan

3
3
4
8
8
9
13
14
14

DAFTAR LAMPIRAN
1
2
3
4
5

Aturan dari model pohon keputusan data latih 1
Aturan dari model pohon keputusan data latih 2
Aturan dari model pohon keputusan data latih 3
Aturan dari model pohon keputusan data latih 4
Aturan dari model pohon keputusan data latih 5

18
19
20
21
22

PENDAHULUAN
Latar Belakang
Menurut UU RI No. 41 tahun 1999 tentang kehutanan, hutan merupakan
suatu kesatuan ekosistem berupa hamparan lahan yang berisi sumber daya alam
hayati yang didominasi oleh pepohonan dalam lingkungan alam yang tidak dapat
dipisahkan antara yang satu dengan yang lainnya. Food and Agricultural
Organization (FAO) dalam buku State of the World’s Forests menempatkan
Indonesia di urutan ke-8 dari sepuluh negara dengan luas hutan alam terbesar di
dunia (FWI 2011). Akan tetapi, luas hutan di Indonesia berkurang setiap tahun
dengan laju kerusakan hutan mencapai 1.87 juta hektar pertahun dalam kurun
waktu 2000 sampai 2005 (FWI 2011). Salah satu penyebab utama kerusakan
hutan di Indonesia adalah kebakaran hutan.
Kebakaran hutan merupakan keadaan saat hutan dilanda api yang
mengakibatkan terjadinya kerusakan hutan dan dapat menimbulkan kerugian bagi
kehidupan manusia. Kerugian yang dialami berupa tercemarnya lingkungan,
terganggunya kesehatan manusia, dan melemahnya roda perekonomian bangsa
(Deliknews 2013). Secara umum, penyebab kebakaran hutan adalah kondisi suhu
udara yang tinggi dan curah hujan yang rendah sehingga sisa-sisa bahan olahan
kayu, daun, dan rumput kering yang bergesekan mudah terbakar. Apabila di
permukaan tanah terdapat mineral berwarna terang, mineral tersebut dapat
berfungsi sebagai lensa yang menghasilkan titik api sehingga kobaran api mulai
terbentuk dan akan menyebar luas dengan adanya tiupan angin (Badungkab 2013).
Kebakaran hutan dapat dipantau dengan menggunakan satelit yang mendeteksi
titik api (hotspot) pada waktu dan lokasi tertentu. Berdasarkan data satelit NOAA18 (National Oceanic and Atmospheric Administration), jumlah titik api yang
terpantau di Indonesia dari Januari hingga September 2012 sudah mencapai 24663
titik. Provinsi dengan konsentrasi titik api terbanyak adalah Kalimantan Barat
5027 titik api, Riau 4318 titik, Sumatera Selatan 4297 titik, Jambi 1895 titik,
Kalimantan Tengah 1736 titik, dan Kalimantan Timur 1058 titik api (Sigit 2012).
Banyaknya jumlah kemunculan titik api tersebut menyebabkan besarnya ukuran
data titik api.
Data titik api tersebut dapat diklasifikasikan dengan menerapkan metode
pohon keputusan berbasis spatial entropy. Klasifikasi dilakukan untuk
mengeksplorasi hubungan antara atribut target dan atribut pendukung lainnya.
Kriteria yang digunakan dalam proses perhitungan pohon keputusan adalah
entropi. Mengintegrasikan entropi spasial dalam proses klasifikasi secara efektif
dapat mengurangi jumlah kelas yang dihasilkan oleh pohon keputusan (Li dan
Claramunt 2006). Li dan Claramunt (2006) telah membangun pohon keputusan
berbasis spatial entropy pada data hasil pertanian di Cina, yang dapat
menampilkan data multidimensi dalam bentuk grafik, dan peta yang saling
bersinkronisasi. Penelitian tersebut menghasilkan algoritme pohon keputusan
berbasis spatial entropy yang digunakan untuk penelitian ini. Penelitian ini
mencoba menerapkan model pohon keputusan berbasis spatial entropy yang
merupakan hasil penelitian Li dan Claramunt (2006) untuk data kebakaran hutan
di Indonesia khususnya daerah Bengkalis, Riau untuk mengklasifikasikan

2
kemunculan titik api. Data tersebut meliputi pusat kota, sungai, jalan, sumber
pendapatan, tutupan lahan, populasi, curah hujan, sekolah, temperatur, dan
kecepatan angin.

Perumusan Masalah
Dengan mengklasifikasikan kemunculan titik api dapat diketahui pada
keadaan seperti apa kebakaran itu terjadi sehingga mengklasifikasikan titik api
penting dilakukan karena dapat mencegah terjadinya kebakaran hutan. Perumusan
masalah dalam penelitian ini adalah bagaimana cara menerapkan algoritme pohon
keputusan berbasis spatial entropy (Li dan Claramunt 2006) pada data kebakaran
hutan di Kabupaten Bengkalis, Riau untuk mengklasifikasikan kemunculan titik
api.

Tujuan Penelitian
Tujuan dari penelitian ini ialah:
1 Menerapkan algoritme pohon keputusan berbasis spatial entropy (Li dan
Claramunt 2006) pada data titik api di kabupaten Bengkalis, Riau.
2 Mengevaluasi pohon keputusan berbasis spatial entropy untuk prediksi
kemunculan titik api di kabupaten Bengkalis, Riau.

Manfaat Penelitian
Penelitian ini diharapkan dapat memberikan karakterisitik wilayah yang
berpotensi munculnya titik api. Hal ini berguna dalam pencegahan terjadinya
kebakaran hutan.

Ruang Lingkup Penelitian
Ruang lingkup penelitian yang dilakukan meliputi:
1 Data yang digunakan terdiri dari data titik api tahun 2008 di wilayah
Kabupaten Bengkalis, Riau.
2 Karakteristik wilayah mencakup sungai, jalan, pusat kota, tutupan lahan dan
batas administratif.
3 Metode yang digunakan adalah metode pohon keputusan berbasis spatial
entropy (Li dan Claramunt 2006).

3

METODE
Data dan Area Studi
Data spasial adalah data yang merepresentasikan aspek-aspek keruangan
dari fenomena yang terdapat di dunia nyata. Data spasial memiliki 2 tipe, yaitu
vektor dan raster. Model data raster menampilkan, menempatkan, dan menyimpan
data spasial dengan menggunakan struktur matriks atau piksel-piksel yang
membentuk grid, sedangkan model data vektor menggunakan titik, garis atau
kurva, atau poligon beserta atributnya. Contoh umum dari data vektor adalah peta,
desain grafik, dan representasi 3D dari susunan rantai molekul protein (Han dan
Kamber 2006).
Penelitian ini menggunakan data titik api di Kabupaten Bengkalis Provinsi
Riau pada tahun 2008. Kabupaten Bengkalis memiliki luas wilayah 7793.93 km2
yang terbagi dalam 8 kecamatan dan 102 desa/kelurahan. Wilayah Kabupaten
Bengkalis merupakan dataran rendah dengan rata-rata ketinggian antara 2 sampai
6.1 meter di atas permukaan laut dan sebagian besar merupakan tanah organosol,
yaitu jenis tanah yang banyak mengandung bahan organik (Riau 2014).
Karakteristik wilayah yang digunakan mencakup sungai, jalan, dan pusat kota,
tutupan lahan dan batas administratif. Data persebaran dan koordinat titik api pada
tahun 2008 diperoleh dari NOAA AVHR dan FIRMS MODIS Fire/Hotspot,
NASA/University of Maryland (Gambar 1). Data cuaca terdiri atas temperatur
harian (Gambar 2), maksimum hujan harian, dan kecepatan angin diperoleh dari
BMKG. Data lahan gambut yang terdiri atas tipe dan kedalaman diperoleh dari
Wetland International. Data sosial-ekonomi yang mencakup sumber pendapatan
diperoleh dari Badan Pusat Statistika (BPS) pada tahun 2008. Peta digital terdiri
atas peta jalan, sungai, pusat kota, tutupan lahan, dan batas administratif diperoleh
dari Bakosurtanal (saat ini menjadi Badan Informasi Geospasial (BIG)). Data
cuaca didapatkan dari penerapan metode Cokriging untuk melakukan interpolasi
spasial. Hasil interpolasi spasial untuk data cuaca dikonversi ke dalam format
SHP sehingga data tersebut dapat diintegrasikan dengan data spasial lainnya untuk
pemodelan yang akan dilakukan (Sitanggang 2013).

Gambar 1 Layer titik api.

Gambar 2 Layer temperatur.

4
Tahapan Penelitian
Penelitian ini dilaksanakan dalam beberapa tahap seperti yang disajikan
pada Gambar 3.

Gambar 3 Tahapan penelitian.
Praproses Data
Pada tahap ini, seleksi data dilakukan untuk mendapatkan data yang relevan.
Eksplorasi data juga dilakukan untuk mengetahui karakteristik data serta
permasalahan keberadaan missing value dan duplikasi data.
Pembagian Dataset
Pada tahap ini, pemisahan data uji dan data latih dilakukan dengan
menggunakan 5-fold cross validation. Pada 5-fold cross validation, suatu dataset
akan dibagi sebanyak 5 buah subset. Empat subset digunakan sebagai data latih
dan 1 subset digunakan sebagai data uji seperti ditunjukkan dalam Tabel 1.
Tabel 1 Pembagian dataset
Percobaan
1
2
3
4
5

Data latih
Data latih 1: subset 1,2,3,4
Data latih 2: subset 1,2,3,5
Data latih 3: subset 1,2,4,5
Data latih 4: subset 1,3,4,5
Data latih 5: subset 2,3,4,5

Data uji
Data uji 1: subset 5
Data uji 2: subset 4
Data uji 3: subset 3
Data uji 4: subset 2
Data uji 5: subset 1

5
Pembuatan Model Klasifikasi Spasial Menggunakan Spatial Entropy
Klasifikasi adalah proses menemukan model (fungsi) yang menjelaskan dan
membedakan kelas-kelas atau konsep dengan tujuan agar model yang diperoleh
dapat digunakan untuk mengetahui kelas atau objek yang memiliki label kelas
yang tidak diketahui. Klasifikasi termasuk ke dalam kategori predictive data
mining. Model yang diperoleh berdasarkan pada analisis dari data training. Proses
klasifikasi data dibagi menjadi dua yaitu tahap pembelajaran dan klasifikasi. Pada
tahap pembelajaran, sebagian data yang telah diketahui kelas datanya digunakan
untuk membentuk model. Selanjutnya pada klasifikasi, model yang sudah
terbentuk diuji dengan sebagian data lainnya untuk mengetahui akurasi dari model
tersebut. Jika akurasinya mencukupi, model tersebut dapat dipakai untuk prediksi
kelas data yang belum diketahui (Han dan Kamber 2006).
Klasifikasi spasial merupakan metode yang menganalisis objek pada data
spasial. Dalam membangun model klasifikasi spasial dapat digunakan algoritme
pohon keputusan berbasis spatial entropy. Langkah-langkah pada metode spatial
entropy adalah:
1 Menghitung jarak nominal dan jarak ordinal.
2 Menghitung jarak intra dan jarak extra pada masing-masing kategori.
3 Menghitung entropi spasial.
4 Menghitung information gain.
5 Jika layer D memiliki nilai information gain tertinggi, maka perhitungan
akan dilanjutkan dengan mencari node.
6 Kembali ke perhitungan entropi spasial dengan mengurangi atribut yang
telah menjadi akar.
1

Menghitung jarak antarobjek
Perhitungan jarak antarobjek dapat dilakukan berdasarkan tipe atribut
pada data. Pada penelitian ini terdapat dua tipe atribut, yaitu atribut nominal
dan atribut ordinal. Untuk atribut ordinal, nilai pada setiap kategori disusun
berdasarkan peringkatnya kemudian diubah menjadi bilangan sebanyak
kategori yang ada. Lalu pada tahap selanjutnya dilakukan normalisasi yang
dirumuskan sebagai berikut (Han dan Kamber 2006):
f

f-

f

f-

(1)

Dimana f adalah nilai pada setiap kategori ke-i yang telah dirubah
menjadi bilangan. Mf adalah banyaknya kategori yang ada pada data.
Kemudian dist(j,k) pada atribut ordinal dapat dihitung dengan menggunakan
jarak euclidean yang dirumuskan sebagai berikut (Han dan Kamber 2006):

Nilai xjp adalah nilai hasil normalisasi pada baris ke-j dan atribut ke-p.
xkp adalah nilai hasil normalisasi pada baris ke-k dan atribut ke-p. Untuk
menghitung dist(j,k) pada atribut nominal dapat dirumuskan sebagai berikut
(Han dan Kamber 2006):
-

(3)

6
Nilai p adalah jumlah atribut keseluruhan yang memiliki tipe nominal.
m adalah jumlah atribut yang bernilai sama. Setelah nilai dist(j,k) pada atribut
ordinal dan atribut nominal didapatkan, nilai dist(j,k) untuk keseluruhan
atribut pendukung dapat diolah dengan menggunakan rumus jarak pada
atribut tipe campuran seperti yang dirumuskan sebagai berikut (Han dan
Kamber 2006):
(4)
Jika hasil dist(j,k) pada atribut ordinal atau atribut nominal bernilai nol
akan bernilai nol.Selainnya, jika hasil dist(j,k) tersebut tidak sama dengan
nol,
akan bernilai satu (Han dan Kamber 2006).
2

Menghitung intra-distance (diint) dan extra-distance (diext) seperti yang
dirumuskan sebagai berikut:
(5)
d nt
de

t

-

(6)

-

Nilai C adalah himpunan entitas spasial dari dataset yang diberikan, Ci
menunjukkan subset dari entitas C yang termasuk dalam kategori ke-i dari
klasifikasi, diint adalah jarak rata-rata antara Ci, diext adalah jarak rata-rata
antara entitas Ci dan entitas dari kategori lain, dist(j,k) memberikan jarak
l h o
y g
mb l l
cl
adalah konstanta yang diambil relatif tinggi, konstanta ini menghindari efek
‘noise’
l null dalam perhitungan jarak rata-rata (Li dan Claramunt
2006).
3

Menghitung spatial entropy yang dirumuskan sebagai berikut:
o y

-

log

(7)

Dengan adalah proporsi jumlah kategori elemen i dari record, n
adalah jumlah kategori dalam domain yang disebutkan dari atribut target GA.
Berdasarkan hasil pehitungan Li dan Claramunt (2006) pada data sampel
landslide didapatkan bahwa ketika jumlah kategori dan proporsi identik,
entropi spasial akan bervariasi dengan perubahan distribusi spasial dari entitas
spasial (Li dan Claramunt 2006).
4

Menghitung nilai information gain dengan menggunakan rumus berikut:
(8)
o y
o y
l
merupakan nilai information gain antar atribut target
GA dengan atribut pendukung SA. Values(SA) memberikan domain yang
disebutkan dari atribut atribut pendukung SA, GAv menunjukkan subset dari
GA dimana nilai yang sesuai dengan SAv untuk setiap record, |GAv| dan |GA|
berturut-turut melambangkan kardinalitas GAv dan GA. Perhitungan pada
pohon keputusan merupakan proses yang berulang-ulang (Li dan Claramunt
2006).
Integrasi entropi spasial dalam proses klasifikasi secara efektif dapat
mengurangi jumlah kelas yang dihasilkan oleh pohon keputusan. Hirarki

7
pohon keputusan spasial berhenti ketika kategori yang berbeda di kelas dapat
dibedakan secara jelas dalam ruang. Entitas spasial cenderung memiliki
autokorelasi spasial positif yaitu diint< diext. Ambang entropi spasial dapat juga
digunakan untuk mengontrol dan menghentikan pertumbuhan pohon
keputusan spasial. Jika entropi spasial data pada cabang tertentu lebih rendah
dari ambang batas maka cabang telah mencapai daun pohon. Ambang batas
dapat mengurangi kedalaman pohon dan nomor daun tanpa mengorbankan
kinerja klasifikasi. Hal ini memberikan sejumlah kecil kelas dan
memfasilitasi penemuan aturan klasifikasi yang paling dominan (Li dan
Claramunt 2006).
Evaluasi Model
Pada tahap ini, hasil klasifikasi dievaluasi dengan menghitung tingkat
akurasi dari model yang dicari. Akurasi dapat dihitung dengan menggunakan
confusion matrix, yaitu menghitung banyaknya label kelas yang diprediksi benar
dibagi total banyaknya prediksi.
Presentasi Model
Data hasil klasifikasi dengan metode spatial entropy direpresentasikan ke
dalam kumpulan aturan yang dibangkitkan dari pohon keputusan.
Peralatan Penelitian
Perangkat lunak dan perangkat keras yang digunakan dalam
mengembangkan penelitian ini adalah sebagai berikut:
 Perangkat Lunak:
1 Python 2.7.5 sebagai bahasa pemrosesan.
2 PostgreSQL 9.2.1 sebagai sistem manajemen basis data.
3 PostGIS sebagai ekstensi PostgreSQL untuk pengelolaan data spasial.
4 Quantum GIS 2.0.1 untuk pemrosesan dan visualisasi data spasial.
5 Microsoft Office Excel 2007 dan Notepad++
6 Sistem operasi Microsoft Windows 7 Home Premium 64-bit
 Perangkat Keras:
1 Processor: Intel(R) Core(TM) i3-2310M CPU @ 2.10GHz
2 Memory: 4.00 GB RAM

HASIL DAN PEMBAHASAN
Praproses Data
Tahapan yang dilakukan dalam praproses data adalah sebagai berikut:
1

Membuat tabel target.
Pada tahap ini layer false alarm dibentuk menggunakan Quantum GIS.
Layer false alarm adalah titik non-hostpot yang dibangkitkan secara acak
disekitar titik hotspot. Untuk membuat layer false alarm dilakukan buffer dari

8
layer hotspot dengan jarak buffer sebesar 0.907374 km (Sitanggang 2013).
Hasil pemrosesan dari buffer tersebut dicari difference dalam geoprocessing
tools untuk menentukan area yang berada di luar buffer. Setelah itu dilakukan
pembangkitan 685 titik secara acak sebagai titik non-hotspot. Hasil dari
proses buffer dapat dilihat pada Gambar 4.

Gambar 4 Titik hotspot dan non-hotspot.
Kemudian tahapan selanjutnya dilakukan dengan menggunakan
pernyataan query pada DBMS PostgreSQL yaitu membuat layer target yang
merupakan gabungan dari layer true alarm dengan layer false alarm seperti
ditunjukkan pada Gambar 5.

Gambar 5 Query pembuatan layer target.
Langkah ini menghasilkan layer baru yang terdiri dari 1370 fitur titik
yang menunjukkan titik non-hotspot dan hotspot dapat dilihat pada Tabel 2.
Gid merupakan identitas data, the_geom merupakan lokasi dari objek spasial.

9
Tabel 2 Layer target.
Target

1

The_geom
01010000006...

2

0101000000D...

T

1369

01010000008...

F

1370

0101000000A...

F

gid

T

...

2

Membuat tabel distance city, distance river dan distance road.
Tahap ini dilakukan dengan menggunakan query pada DBMS
PostgreSQL untuk mencari jarak antara objek-objek di layer target dengan
objek-objek di layer-layer penjelas seperti ditunjukkan pada Gambar 6.

Gambar 6 Query jarak minimum dari target ke jalan terdekat.
Untuk layer road dilakukan perhitungan jarak minimum dari objek
target ke objek jalan terdekat (min_distance) seperti ditunjukkan pada
Gambar 7. Kemudian jarak dalam numerik diubah dalam data kategorik
(dist_road) sesuai ketentuan berikut (Sitanggang 2013):
 Low
: min_distance ≤ 2500 m
 Medium: 2500 m < min_distance ≤ 5000 m
 High : min_distance > 5000 m
Hasil perhitungan jarak ke titik api untuk beberapa objek di layer road
dapat dilihat pada Tabel 3.
Tabel 3 Hasil perhitungan jarak hotspot ke jalan terdekat.
Target
T

Min_distance
17158.54171

Dist_road

1

The_geom
01010000006...

9

0101000000A...

T

4854.698642

Medium

10

0101000000F...

T

456.8011663

Low

1368

01010000002...

F

23.25410674

Low

1369

01010000008...

F

4427.468245

Medium

1370

0101000000A...

F

8240.615218

High

gid

High

...

10
Untuk layer river dilakukan juga perhitungan jarak minimum dari objek
target ke objek sungai terdekat (min_distance). Kemudian jarak dalam
numerik diubah ke dalam data kategorik (dist_river) sesuai ketentuan berikut
(Sitanggang 2013):
 Low
: min_distance ≤ 1500 m
 Medium: 1500 m < min_distance ≤ 3000 m
 High : min_distance > 3000 m
Hasil perhitungan jarak ke titik api untuk beberapa objek di layer river
dapat dilihat pada Tabel 4.
Tabel 4 Hasil perhitungan jarak hotspot ke sungai terdekat.
Target
T

Min_distance
918.3817908

Dist_river

8

The_geom
01010000006...

9

0101000000A...

T

1968.958422

Medium

10

0101000000F...

T

4006.426486

High

1368

01010000002...

F

2343.056961

Medium

1369

01010000008...

F

4418.838336

High

1370

0101000000A...

F

44.61247693

Low

gid

Low

...

Demikian halnya untuk layer city, dilakukan juga perhitungan jarak
minimum dari objek target ke objek pusat kota terdekat (min_distance).
Kemudian jarak dalam numerik diubah ke dalam data kategorik (dist_city)
sesuai ketentuan berikut (Sitanggang 2013):
 Low
: min_distance ≤ 7000 m
 Medium: 7000 m < min_distance ≤ 14000 m
 High : min_distance > 14000 m
Hasil perhitungan jarak ke titik api untuk beberapa objek di layer city
dapat dilihat pada Tabel 5.
Tabel 5 Hasil perhitungan jarak hotspot ke pusat kota terdekat.
gid
51

The_geom
0101000000F...

Target
T

Min_distance
15923.492385

Dist_city

52

0101000000A...

T

9714.0851992

Medium

53

01010000007...

T

2945.3710693

Low

1368

01010000002...

F

15801.59506

High

1369

01010000008...

F

11968.15244

Medium

1370

0101000000A...

F

20725.56393

High

High

...

11
3

Menghapus kolom-kolom yang tidak digunakan.
Tahap ini dilakukan penghapusan kolom-kolom yang tidak diperlukan
pada layer land cover, layer income source, layer school, dan layer
population sehingga setiap layer akan memiliki 3 field data, yaitu gid,
the_geom, dan exp_attr. exp_attr merupakan nilai dari masing-masing objek
penjelas.

4

Menggabungkan data menjadi satu layer data.
Pada tahap ini, setiap layer data penjelas dan layer target digabung
menjadi satu layer. Sehingga didapatkan data sebesar 1512 record. Objekobjek dalam layer gabungan inilah yang digunakan untuk membuat model
klasifikasi spasial menggunakan algoritme pohon keputusan berbasis entropi
spasial. Akan tetapi pada proses pembuatan model klasifikasi spasial, field
the_geom dan gid tidak dipergunakan sehingga field tersebut dihapus. Setelah
field the_geom dan gid dihapus, dilakukan penghapusan duplikasi data
sehingga didapatkan data sebesar 600 record. Tabel 6 menunjukkan hasil
penggabungan objek target dan objek-objek penjelas setelah field the_geom
dan gid dihapus. Data dalam Tabel 6 merupakan data akhir dan digunakan
pada proses pembuatan model klasifikasi spasial menggunakan algoritme
pohon keputusan berbasis spatial entropy.
Tabel 6 Hasil penggabungan objek target dan objek-objek penjelas.

city

river

road

High

High

High

Medi
um
Medi
um
Medi
um
Medi
um

High
High
High
High

High
High
High
High

Income
source
Plantati
on
Plantati
on
Plantati
on
Plantati
on
Plantati
on

Land
cover
Plantati
on
Plantati
on
Plantati
on
Plantati
on
Plantati
on

popul
ation
Medi
um
Medi
um
Medi
um

precipit
ation

Low

1

Low

1

3
3
3

sch
ool
Lo
w
Lo
w
Lo
w
Lo
w
Lo
w

targ
et

tempe
rature

Wind
speed

297

1

T

297

1

T

297

1

T

298

2

T

298

2

T

Pembuatan Model Klasifikasi Spasial Menggunakan Algoritme Pohon
Keputusan Berbasis Spatial Entropy
Pada tahap ini dilakukan pembuatan pohon keputusan spasial menggunakan
algoritme pohon keputusan berbasis spatial entropy (Li dan Claramunt 2006).
Algoritme pohon keputusan berbasis spatial entropy di implementasikan
menggunakan bahasa pemrograman Python dengan memodifikasi kode program
untuk algoritme ID3 (Roach 2006). Langkah-langkah utama dalam membentuk
pohon keputusan menggunakan algoritme pohon keputusan berbasis spatial
entropy adalah:
1
2
3
4

Menghitung jarak antar objek
Menghitung intra-distance (diint) dan extra-distance (diext)
Menghitung spatial entropy
Menghitung information gain

12
Menghitung jarak antar objek
Berdasarkan Tabel 6, dapat dilihat bahwa atribut city, river, road,
population, precipitation, school, temperature dan wind speed merupakan atribut
ordinal. Sedangkan atribut income source dan land cover merupakan atribut
nominal. Setelah dilakukan pengolahan data, didapatkan hasil normalisasi untuk
atribut ordinal seperti pada Tabel 7.
Tabel 7 Hasil normalisasi atribut ordinal.
Atribut
city, river, road,
population dan school
Temperature

Wind speed dan
precipitation

Nilai
Low
Medium
High
297
298
299
0
1
2
3
4

rif
1
2
3
1
2
3
1
2
3
4
5

Normalisasi
0
0.5
1
0
0.5
1
0
0.25
0.5
0.75
1

Dari Tabel 7 dapat dilihat bahwa atribut city, river, road, population, school,
dan temperature memiliki nilai Mf = 3 sedangkan wind speed dan precipitation
memiliki nilai Mf = 5 sehingga hasil normalisasi untuk atribut Mf = 3 akan
memiliki nilai yang sama, demikian halnya dengan atribut Mf = 5. Nilai hasil
normalisasi inilah yang digunakan pada perhitungan jarak.
Menghitung intra-distance (diint) dan extra-distance (diext)
Intra distance untuk dataset dengan kelas true dihitung untuk mengetahui
jarak rata-rata antar entitas pada kategori true. Sedangkan extra distance untuk
dataset dengan kelas true dihitung untuk mengetahui jarak rata-rata antara entitas
pada kategori true dengan kategori lainnya. Demikian halnya dengan intra
distance untuk dataset dengan kelas false dan extra distance untuk dataset dengan
kelas false. Tabel 8 menunjukkan hasil perhitungan intra distance dan extra
distance.
Tabel 8 Hasil perhitungan intra distance dan extra distance.
Jarak
Intra distance untuk dataset
dengan kelas true
Intra distance untuk dataset
dengan kelas false
Extra distance untuk dataset
dengan kelas true
Extra distance untuk dataset
dengan kelas false

Data
latih 1

Data
latih 2

Data
latih 3

Data
latih 4

Data
latih 5

0.5041

0.5008

0.4998

0.4968

0.5107

0.5363

0.5343

0.5303

0.5416

0.5370

1.0496

1.0467

1.0513

1.0568

1.0583

1.0496

1.0467

1.0513

1.0568

1.0583

Pada Tabel 8 dapat dilihat bahwa extra distance untuk dataset dengan kelas
true dan extra distance untuk dataset dengan kelas false memiliki nilai yang sama,
hal ini dikarenakan jarak antar objek j dan k memiliki nilai yang sama dengan

13
jarak antar objek k dan j, sehingga hasilnya akan bernilai sama. Hasil jarak inilah
yang akan digunakan pada perhitungan entropi spasial.
Menghitung spatial entropy
Spatial entropy dihitung menggunakan persamaan 7. Contoh perhitungan
entropi spasial untuk data latih 1:
o y

log

log

Pada perhitungan diatas terdapat nilai 131 dan 349 yang berturut-turut
merupakan banyaknya frekuensi target yang bernilai true dan false. Sedangkan
nilai 480 merupakan total keseluruhan data latih 1. Sehingga hasil yang
didapatkan dari perhitungan entropi dapat dipergunakan pada perhitungan
information gain.
Kode program perhitungan spatial entropy dengan menggunakan bahasa
pemrograman Python dapat dilihat pada Gambar 7 (Roach 2006).

Gambar 7 Kode program perhitungan spatial entropy (Roach 2006).
Menghitung information gain
Perhitungan information gain dihitung menggunakan persamaan 8.
Perhitungan information gain ini digunakan untuk melihat atribut terbaik dari
masing-masing atribut yang akan dipilih menjadi label node. Setelah akar
diperoleh dari atribut dengan nilai information gain tertinggi, perhitungan akan
dilanjutkan dengan mencari node selanjutnya menggunakan data yang sama
namun telah dikurangi oleh atribut yang telah menjadi akar. Perhitungan
dilakukan berulang-ulang hingga seluruh atribut telah menjadi node. Kode
program Python untuk menghitung information gain dapat dilihat pada Gambar 8
(Roach 2006).

14

Gambar 8 Kode program perhitungan information gain (Roach 2006).
Ukuran information gain digunakan untuk membentuk pohon keputusan.
Kode program Python untuk membuat pohon keputusan dapat dilihat pada
Gambar 9 (Roach 2006).

Gambar 9 Kode program Python untuk membuat pohon keputusan (Roach 2006).

15
Evaluasi Model
Hasil evaluasi model pohon keputusan berbasis spatial entropy dapat dilihat
pada Tabel 9.
Tabel 9 Akurasi data uji dan data latih
Pohon
keputusan
1
Tree 1
2
Tree 2
3
Tree 3
4
Tree 4
5
Tree 5
Rata-rata

Percobaan

Akurasi
data uji
54.17%
56.00%
50.98%
50.50%
48.62%
52.05%

Akurasi
data latih
87.92%
88.75%
88.33%
90.00%
90.21%
89.04%

Dari Tabel 9, dapat dilihat bahwa data uji yang memiliki tingkat akurasi
terbesar berada pada percobaan ke 2 dengan tingkat akurasi 56% dan akurasi yang
terbesar pada data latih berada pada percobaan ke 5 dengan tingkat akurasi
90.21%. Didapatkan juga tingkat akurasi rata-rata dari 5 percobaan sebesar
52.05% untuk data uji dan 89.04% untuk data latih.
Hasil dari akurasi ini menunjukkan bahwa tingkat akurasi pada data latih
lebih besar daripada data uji. Hal ini dikarenakan pengujian data latih dilakukan
pada pohon keputusan yang berasal dari data latih tersebut. Pada hasil prediksi
terdapat juga data yang tidak terklasifikasi atau tidak termasuk ke dalam kelas
true maupun kelas false. Hal ini dikarenakan pada data uji tersebut tidak ada data
yang termasuk ke dalam aturan manapun, sehingga data tersebut tidak
terklasifikasi.
Dari pohon keputusan tersebut didapatkan aturan sebanyak 241 aturan untuk
percobaan 1 (Lampiran 1), 255 aturan untuk percobaan 2 (Lampiran 2), 256
aturan untuk percobaan 3 (Lampiran 3), 235 aturan untuk percobaan 4 (Lampiran
4), dan 255 aturan untuk percobaan 5 (Lampiran 5). Pohon keputusan dengan
akurasi terbaik terdapat pada percobaan 2. Contoh aturan yang didapatkan dari
hasil model pohon keputusan untuk percobaan2 yaitu:
1 JIKA tutupan lahan = unirrigated agricultural field DAN sumber
pendapatan = plantation DAN kepadatan populasi > 100 MAKA
keberadaan titik api adalah false.
2 JIKA tutupan lahan = unirrigated agricultural field DAN sumber
pendapatan = plantation D N
o l ≤
DAN 1.5 km < jarak
m m m
g

mD N
m m m
o
m D N m/ ≤ c
g < m/ D N 7 K ≤
m
<
KD N
ol h ≤
D N mm/h ≤ c h
hujan < 4 mm/hari DAN jarak minimum ke jalan terdekat > 5 km MAKA
keberadaan titik api adalah true.
3 JIKA tutupan lahan = paddy field DAN sumber pendapatan = plantation
DAN jarak minimum ke pusat kota terdekat > 14 km MAKA keberadaan
titik api adalah true.
4 JIKA tutupan lahan = mix garden DAN jarak minimum ke jalan terdekat > 5
m D N m/ ≤ c
g < m/ D N
m m m
g

m
K
b
l h false.

16
5 JIKA tutupan lahan = plantation DAN sumber pendapatan = forestry DAN
jarak minimum ke pusat o
m D N m/ ≤ c
g < m/ D N
m<
m m m
g

m
MAKA keberadaan titik api adalah true.

SIMPULAN DAN SARAN
Simpulan
Penelitian ini menghasilkan pohon keputusan berbasis spatial entropy dari
data kebakaran hutan yang terdiri dari 11 atribut, yaitu 10 atribut penjelas dan 1
atribut target. Hasil penelitian dengan dengan menggunakan metode uji 5-fold
cross validation adalah 5 pohon keputusan akurasi rata-rata 52.05% dan 89.04%
masing-masing pada data uji dan data latih. Pohon keputusan terbaik memiliki
akurasi data uji sebesar 56% yang mempunyai 560 node dengan node akar adalah
layer tutupan lahan. Dari pohon keputusan tersebut diperoleh 255 aturan untuk
mengklasifikasikan titik api. Hasil percobaan menunjukkan bahwa pohon
keputusan terbaik juga tidak dapat mengklasifikasikan sebanyak 20 objek pada
data uji Bengkalis.

Saran
Penelitian ini masih memiliki kekurangan, antara lain masih kecilnya
tingkat akurasi yang didapatkan pada data uji untuk wilayah Bengkalis. Saran
yang dapat disampaikan untuk penelitian selanjutnya adalah menguji pohon
keputusan yang dihasilkan pada data uji real untuk wilayah lain dan menerapkan
algoritme pohon keputusan spasial lainnya untuk mendapat akurasi yang lebih
baik serta membuat pohon keputusan yang dapat melihat aturan yang penting
dengan menggunakan bahasa pemrograman Python.

DAFTAR PUSTAKA
Badungkab. 2013. Kebakaran Hutan [internet]. [diacu 2013 Nov 1]. Tersedia dari:
http://www.badungkab.go.id/index2.php?option=com_content&do_pdf=1&id=
2894.
Deliknews. 2013. Kebakaran Hutan di Riau, Sebabkan Kerugian Besar [internet].
[diacu
2013
Des
3].
Tersedia
dari:
http://www.deliknews.com/2013/06/21/kebakaran-hutan-di-riau-sebabkankerugian-besar/#.Up26NsQW15Y.
[FWI] Forest Watch Indonesia. 2011. Potret Keadaan Hutan Indonesia Periode
Tahun 2000-2009 [internet]. [diunduh 2013 Nov 1]. Tersedia pada:
http://fwi.or.id/wp-content/uploads/2013/02/PHKI_2000-2009_FWI_lowres.pdf.

17
Han J, Kamber M. 2006. Data Mining Concepts and Techniques. San Francisco
(US): Morgan-Kaufmann.
Li X, Claramunt C. 2006. A Spatial Entropy-Based Decision Tree for
Classification of Geographical Information.Transaction in GIS. 10(3): 451-467.
Riau. 2013. Kabupaten Bengkalis [internet]. [diacu 2014 Mar 15]. Tersedia dari:
http://www.riau.go.id/index.php?/detail/6.
Roach C. 2006. Building Decision Trees in Python [internet].[diacu 2014 Mei 13].
Tersedia
dari:
http://www.onlamp.com/pub/a/python/2006/02/09/ai_decision_trees.html?CM
P=OTC-UD6648202101&ATT=Building+Decision+Trees+in+Python
Sigit R. 2012. Kaleidoskop Tata kelola Hutan di Indonesia: Hutan Masih Terbakar
(Bagian-2)
[internet].
[diacu
2013
Nov
1].
Tersedia
dari:
http://www.mongabay.co.id/2012/12/31/kaleidoskop-tata-kelola-hutan-diindonesia-hutan-masih-ter-dibakar-bagian-2/.
Sitanggang IS, Yaakob R, Mustapha N, Ainudin AN. 2013. Predictive Models for
Hotspots Occurence using Decision Tree Algorithms and Logistic Regression.
Journal of Applied Science.13(2):252-261. DOI:10.3923/jas.2013.252.261.

18
Lampiran 1 Aturan dari model pohon keputusan data latih 1
population
high
dist_river
high
dist_road
high
wind_speed
1
land_cover
Plantation
income_source
Other_agriculture
screen_temp
297
school
low
precipitation
3
dist_city
high
->T
Mining
->
Shrubs
->
T

T

2
->
F
medium
income_source
Forestry
land_cover
Dryland forest
wind_speed
3
screen_temp
298
school
medium
precipitation
0
dist_city
medium
->T
Services
->
F
Plantation
->
F
Other_agriculture

19
Lampiran 2 Aturan dari model pohon keputusan data latih 2
land_cover
Unirrigated agricultural field
income_source
Plantation
population
high
->
F
medium
->
F
low
dist_river
high
->
T
medium
dist_city
high
wind_speed
1
screen_temp
297
school
low
precipitation
3
dist_road
high
->T
medium
->
low
->
Trading&restaurant
->
T
Forestry
->
F
Other_agriculture
->
F
Services
wind_speed
1
dist_road
high
->
medium
->
0
->
F

T

T
F

F

20
Lampiran 3 Aturan dari model pohon keputusan data latih 3
dist_road
high
land_cover
Unirrigated agricultural field
wind_speed
1
population
high
->
F
medium
dist_city
high
->
T
medium
->
F
low
dist_river
medium
income_source
Plantation
screen_temp
297
school
low
precipitation
3
dist_city
high
->T
low
->
T
0
->
F
3
->
T
2
income_source
Forestry
->
F
Plantation
->
T
Swamp
income_source
Plantation
->
T
Forestry
population

21
Lampiran 4 Aturan dari model pohon keputusan data latih 4
dist_road
high
income_source
Plantation
land_cover
Unirrigated agricultural field
wind_speed
1
population
high
->
F
low
dist_river
medium
screen_temp
297
school
low
precipitation
3
dist_city
high
->T
low
->

T

0
->

F

2
->
T
Mix garden
wind_speed
1
dist_river
medium
screen_temp
297
school
low
precipitation
3
population
low
dist_city
high
->T
low
->
0
->

T

F

22
Lampiran 5 Aturan dari model pohon keputusan data latih 5
land_cover
Unirrigated agricultural field
dist_river
high
school
high
->
F
medium
->
T
low
->
T
medium
population
high
->
F
medium
school
medium
->
F
low
dist_city
high
income_source
Agriculture
wind_speed
3
screen_temp
298
precipitation
0
dist_road
low
->T
medium
->

F

low
->
low
wind_speed
1
population
high

F

->
medium
dist_city
high

F

->
medium

T

23

RIWAYAT HIDUP
Penulis dilahirkan di Sitiung, Kabupaten Dharmasraya, Sumatera Barat pada
tanggal 4 Desember 1992 dari pasangan Ayah Drs Syafrial dan Ibu Dra Yerni.
Penulis merupakan anak sulung dari 4 bersaudara. Penulis melanjutkan
pendidikan di Sekolah Menengah Atas Negeri 1 Sitiung dan lulus pada tahun
2010. Setelah lulus dari SMA, penulis diterima sebagai mahasiswa Institut
Pertanian Bogor pada tahun 2010 melalui jalur Undangan Seleksi Masuk IPB
(USMI) pada Program Studi Ilmu Komputer, Fakultas Matematika dan Ilmu
Pengetahuan Alam. Selama aktif sebagai mahasiswa, penulis juga aktif di
organisasi yaitu sebagai anggota divisi marketing pada Himpunan Mahasiswa
Ilmu Komputer (HIMALKOM) pada periode 2012-2013.