Sistem Informasi Berbasis Web untuk Klasifikasi Kemunculan Titik Api di Provinsi Riau Menggunakan Pohon Keputusan C4.5

SISTEM INFORMASI GEOGRAFIS BERBASIS WEB UNTUK
KLASIFIKASI KEMUNCULAN TITIK API DI PROVINSI
RIAU MENGGUNAKAN POHON KEPUTUSAN C4.5

KHAIRIL AMRI

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Sistem Informasi
Geografis Berbasis Web untuk Klasifikasi Kemunculan Titik Api di Provinsi Riau
Menggunakan Pohon Keputusan C4.5 adalah benar karya saya dengan arahan dari
komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan
tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang
diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks
dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Juni 2014
Khairil Amri
NRP G64100006

ABSTRAK
KHAIRIL AMRI. Sistem Informasi Geografis Berbasis Web untuk Klasifikasi
Kemunculan Titik Api di Provinsi Riau Menggunakan Pohon Keputusan C4.5.
Dibimbing oleh IMAS SUKAESIH SITANGGANG.
Kebakaran hutan merupakan masalah serius karena dapat menyebabkan
rusaknya ekosistem hutan dan lingkungan sekitar di banyak wilayah di Sumatera
dan Kalimantan, termasuk Provinsi Riau. Salah satu upaya pencegahan terjadinya
kebakaran hutan adalah dengan menyediakan informasi terkait titik api dan
karakteristik wilayah yang berpotensi munculnya titik api. Informasi tersebut dapat
disajikan dalam bentuk sistem informasi geografis (SIG) untuk klasifikasi
kemunculan titik api. Penelitian ini bertujuan untuk membangun modul klasifikasi
kemunculan titik api dalam SIG menggunakan OpenGeo Suite 3.0. Modul
klasifikasi dibuat menggunakan metode pohon keputusan yaitu algoritme C4.5.
Penerapan algoritme C4.5 pada data kebakaran hutan menghasilkan 109 aturan

klasifikasi dengan akurasi 69.56%. SIG memiliki fitur-fitur utama yaitu
menampilkan peta, pan map, zoom in, zoom out, scale, mouse position dan fungsi
klasifikasi kemunculan titik api berdasarkan karakteristik wilayah. Dengan adanya
SIG ini, dapat ditentukan apakah suatu wilayah berpotensi munculnya titik api
berdasarkan karakteristik wilayah yang dapat digunakan dalam pengambilan
keputusan terkait pencegahan kebakaran hutan.
Kata kunci: algoritme C4.5, klasifikasi, pohon keputusan, sistem informasi
geografis, titik api

ABSTRACT
KHAIRIL AMRI. Web-Based Geographic Information System for Hotspot
Occurrences Classification in Riau Province using C4.5 Decision Tree. Supervised
by IMAS SUKAESIH SITANGGANG.
Forest fire is a serious problem because it causes damages to forest ecosystem
and surrounding environment in many areas in Sumatera and Kalimantan including
Riau Province. One of activities in forest fire prevention is to provide relevant
information about hotspot and characteristics of areas where hotspots probably
occur. Such information can be presented in a geographic information system (GIS)
for classification of hotspot occurrences. This study aims to develop a classification
of hotspot occurrences module in a GIS using OpenGeo Suite 3.0. The classification

module was made using the decision tree method namely the C4.5 algorithm.
Applying the C4.5 algorithm on the forest fire data generated 109 classification
rules with accuracy of 69.56%. The SIG has major features such as displaying map,
pan map, zoom, in, zoom out, scale, mouse position and a classification module for
hotspot occurrences based on characteristics of areas. The GIS enables users to
determine whether an area is potential for hotspot occurrences or not based on its
characteristics. Potential hotspot occurrences can be used in decision making
related to forest fire prevention.
Keywords: classification, C4.5 algorithm, decision tree, geographic information
system, hotspot

SISTEM INFORMASI GEOGRAFIS BERBASIS WEB UNTUK
KLASIFIKASI KEMUNCULAN TITIK API DI PROVINSI
RIAU MENGGUNAKAN POHON KEPUTUSAN C4.5

KHAIRIL AMRI

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer

pada
Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

Penguji:
1 Hari Agung Adrianto, SKom MSi
2 Rina Trisminingsih, SKom MT

Judul Skripsi : Sistem Informasi Berbasis Web untuk Klasifikasi Kemunculan
Titik Api di Provinsi Riau Menggunakan Pohon Keputusan C4.5
Nama
: Khairil Amri
NIM
: G64100006


Disetujui oleh

Dr Imas Sukaesih Sitanggang, SSi MKom
Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi MKom
Ketua Departemen

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang
dipilih dalam penelitian yang dilaksanakan sejak bulan September 2013 ini ialah
kebakaran hutan, dengan judul Sistem Informasi Geografis Berbasis Web untuk
Klasifikasi Kemunculan Titik Api di Provinsi Riau Menggunakan Pohon
Keputusan C4.5. Skripsi ini merupakan salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada Departemen Ilmu Komputer, Fakultas Matematika dan

Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Penulis mengucapkan terima kasih kepada semua pihak yang telah berperan
dalam penelitian ini, di antaranya:
1 Mama, kakak, adik, keponakan dan keluarga lainnya yang telah memberikan
dukungan, doa, motivasi, semangat, dan kasih sayang yang sangat besar
2 Ibu Dr Imas Sukaesih Sitanggang, SSi MKom selaku dosen pembimbing yang
telah memberikan bimbingan, saran, arahan, dan bantuan selama penyelesaian
skripsi
3 Bapak Hari Agung Adrianto, SKom MSi dan Ibu Rina Trisminingsih SKom MT
selaku dosen penguji atas kesediaannya menguji pada waktu sidang
4 Sahabat-sahabat terbaik penulis, Hafizd Adityo Utomo, Resti Hidayah,
Roudhotul Jannah, Risa Ika Wijayanti, Colin Sabatini Lumban Tobing, terima
kasih atas doa, semangat, dan bantuannya, semoga sukses untuk kita semua
5 Kak Anna Qahhariana dan kak Sonita Veronica Br Barus atas bantuannya
6 Teman-teman PIXELS 47 yang terus memberikan semangat dan keceriaan serta
kenangan bagi penulis.
7 Seluruh dosen dan civitas akademika Departemen Ilmu Komputer IPB
8 Semua pihak yang telah membantu dalam penyelesaian skripsi ini yang tidak
bisa penulis sebutkan satu persatu.
Penulis berharap semoga skripsi ini bermanfaat bagi pihak yang

membutuhkan.

Bogor, Juni 2014

Khairil Amri

DAFTAR ISI
DAFTAR TABEL

viii

DAFTAR GAMBAR

viii

DAFTAR LAMPIRAN

viii

PENDAHULUAN


1

Latar Belakang

1

Perumusan Masalah

1

Tujuan Penelitian

1

Manfaat Penelitian

2

Ruang Lingkup Penelitian


2

METODE

2

Data dan Area Studi

2

Tahapan Penelitian

3

Perangkat Penelitian

6

HASIL DAN PEMBAHASAN


7

Praproses Data

7

Pembagian Dataset

8

Pembuatan Modul Klasifikasi Menggunakan Pohon Keputusan C4.5

8

Menghitung Akurasi Pohon Keputusan

9

Pembuatan Modul Klasifikasi Titik Api dalam Sistem Informasi Geografis


9

SIMPULAN DAN SARAN

13

Simpulan

13

Saran

13

DAFTAR PUSTAKA

14

LAMPIRAN

15

RIWAYAT HIDUP

20

DAFTAR TABEL
1
2
3
4

Kategori untuk jarak terdekat dengan pusat kota
Kategori untuk jarak terdekat dengan jalan
Kategori untuk jarak terdekat dengan sungai
Confusion matrix

7
8
8
9

DAFTAR GAMBAR
1
2
3
4
5
6
7
8

Diagram alir penelitian
Komponen dasar dalam SIG berbasis web (Peng dan Tsou 2003)
Potongan kode program klasifikasi
Kode program untuk menampilkan penanda
Tampilan halaman utama klasifikasi titik api di Provinsi Riau
Tampilan data dan hasil klasifikasi sesuai masukan pengguna
Tampilan peta menggunakan Google Map
Tampilan menu “Tentang Sistem”

3
6
10
11
11
12
12
13

DAFTAR LAMPIRAN
1 Contoh record data yang belum dikonversi dari derajat menjadi
kilometer
15
2 Contoh record data yang sudah dikonversi dari derajat menjadi kilometer
dan dikategorikan
16
3 Contoh hasil klasifikasi dengan C4.5 menggunakan Weka 3.6.9
17

PENDAHULUAN
Latar Belakang
Indonesia merupakan negara yang sebagian besar daratannya ditutupi hutan.
Luas hutan Indonesia adalah 98.56 juta hektar atau 52.4% luas wilayah Indonesia
(Kemenhut 2012). Luasnya hutan Indonesia menjadikan Indonesia sebagai salah
satu paru-paru dunia. Namun, dari tahun ke tahun luas hutan di Indonesia semakin
menyusut. Laju deforestasi hutan Indonesia mencapai 610 375.92 hektar per tahun
(Kemenhut 2012). Banyak hal yang menyebabkan menyusutnya luas hutan di
Indonesia, salah satu di antaranya adalah kebakaran hutan. Kebakaran hutan
termasuk masalah serius yang membutuhkan perhatian penuh dalam
penanggulangannya. Kebakaran hutan dapat menyebabkan rusaknya keseimbangan
ekosistem hutan. Selain itu, kebakaran hutan juga akan menurunkan produksi
oksigen (O2) yang diperlukan manusia. Oleh karena itu, kebakaran hutan harus
dikendalikan dengan sebaik-baiknya.
Pengendalian kebakaran hutan dapat dilakukan dengan berbagai cara, salah
satu di antaranya adalah membangun sistem informasi geografis (SIG) untuk
persebaran titik api. Titik panas adalah indikator kebakaran hutan yang mendeteksi
suatu lokasi yang memiliki suhu relatif lebih tinggi dibandingkan dengan suhu di
sekitarnya (Kemenhut 2009). Pada penelitian ini dibentuk modul klasifikasi
kemunculan titik api di Provinsi Riau dalam sistem informasi geografis (SIG). Pada
penelitian ini, klasifikasi kemunculan titik api dilakukan menggunakan algoritme
C4.5. Modul ini diintegrasikan dengan SIG data histori titik api di Indonesia yang
dibangun oleh Barus (2014).

Perumusan Masalah
Informasi persebaran titik api dapat divisualisasikan dalam bentuk peta
menggunakan SIG. Pengembangan aplikasi SIG sudah banyak dilakukan. Namun,
pada aplikasi tersebut hanya menampilkan lokasi kebakaran hutan dan belum
terdapat modul klasifikasi titik api. Modul klasifikasi titik api sangat penting untuk
menentukan lokasi rawan kebakaran berdasarkan karakeristik lokasi terjadinya titik
api. Informasi tersebut bermanfaat dalam pengambilan keputusan terkait
pengendalian kebakaran hutan di Provinsi Riau. Rumusan masalah dari penelitian
ini yaitu membangun dan mengintegrasikan modul klasifikasi kemunculan titik api
pada SIG berbasis web yang telah dibangun oleh peneliti sebelumnya.

Tujuan Penelitian
Penelitian ini bertujuan:
1 Menerapkan algoritme C4.5 dalam pembentukan klasifikasi kemunculan titik
api di Provinsi Riau.
2 Membuat modul pohon keputusan dalam sistem informasi geografis berbasis
web untuk prediksi kemunculan titik api di Provinsi Riau.

2
3 Visualisasi hasil klasifikasi kemunculan titik api dalam bentuk peta.

Manfaat Penelitian
Penelitian ini diharapkan bermanfaat dalam menentukan daerah yang rawan
terjadi kebakaran berdasarkan karakteristik lokasi tersebut sehingga dapat dijadikan
informasi tambahan dalam pengambilan keputusan terkait pengendalian kebakaran
hutan di Provinsi Riau.

Ruang Lingkup Penelitian
Ruang lingkup penelitian ini meliputi:
1 Data yang digunakan adalah data hotspot Provinsi Riau tahun 2005 yang sudah
dilakukan pembersihan data, perhitungan jarak terdekat suatu lokasi terhadap
pusat kota, jalan, dan sungai pada penelitian Fernando (2014).
2 Data pendukung berupa data karakteristik wilayah yaitu jalan, sungai, dan pusat
kota.
3 Modul klasifikasi diintegrasikan pada sistem informasi geografis berbasis web
yang dikembangkan oleh Barus (2014).
4 Pengembangan sistem menggunakan OpenGeo Suite 3.0 sebagai DBMS
(PostGIS) serta web map server (GeoServer) dan XAMPP 1.7.3 sebagai web
server.

METODE
Data dan Area Studi
Data yang digunakan dalam penelitian ini merupakan data spasial. Data
spasial berhubungan dengan geometri fitur spasial. SIG menggunakan dua model
dasar untuk merepresentasikan fitur spasial yaitu vektor dan raster. Model data
vektor menggunakan titik dan koordinat x, y untuk membangun fitur spasial titik,
terdiri atas titik dan edge (garis) yang menghubungkan titik-titik ini ke bentuk
polygon. Model data raster menggunakan sebuah grid untuk merepresentasikan
variasi spasial dari sebuah fitur. Setiap sel dalam grid memiliki nilai yang
berhubungan dengan karakteristik fitur spasial pada lokasi itu. Data raster sangat
cocok digunakan untuk merepresentasikan fitur spasial yang kontinu seperti curah
hujan dan ketinggian (Chang 2002).
Data yang digunakan berupa hasil perhitungan jarak terdekat suatu lokasi
terhadap pusat kota, jalan, dan sungai dalam satuan derajat serta kelas kemunculan
titik api (7169 record kelas true dan 7200 record kelas false). Kelas true
mengindikasikan titik api sedangkan kelas false bukan titik api. Data ini merupakan
hasil praproses yang telah dilakukan oleh Fernando (2014). Jarak terdekat suatu
lokasi ke pusat kota, jalan, dan sungai menunjukkan jarak terdekat titik dengan
kelas true dan false ke pusat kota, jalan, dan sungai terdekat. Data lain yang
digunakan adalah peta Provinsi Riau, data jalan, sungai, dan pusat kota dalam

3
format shapefile. Peta Provinsi Riau yang digunakan terdiri atas 9 kabupaten
(Rokan Hulu, Rokan Hilir, Kuantan Singingi, Indragiri Hulu, Kampar, Bengkalis,
Pelalawan, Siak, dan Indragiri Hilir) dan 2 kota (Pekan Baru dan Dumai). Data
pusat kota terdiri atas Tembilahan, Selat Panjang, Dumai, Balai Pungut, Duri, dan
Bengkalis.

Tahapan Penelitian
Penelitian ini dilakukan dalam beberapa tahap seperti yang diilustrasikan
pada Gambar 1.
Mulai

Praproses
data
Pembagian
dataset

Pembuatan modul
klasifikasi
menggunakan
algoritme pohon
keputusan C4.5

Pohon
keputusan

Menghitung
akurasi pohon
keputusan

Data training

Data uji

Pembuatan modul
klasifikasi titik api
dalam sistem
informasi geografis
Peta
klasifikasi
titik api

Ya

Selesai

Akurasi ≥
threshold

Tidak

Gambar 1 Diagram alir penelitian
Praproses Data
Pada praproses data dilakukan 3 tahap, yaitu menghapus data duplikat,
mengkonversi nilai data dari derajat menjadi kilometer (km), serta diskretisasi dan
mengkategorikan data jarak terdekat dengan pusat kota, jalan, serta sungai. Data
hasil perhitungan jarak terdekat dengan pusat kota, jalan, dan sungai, beberapa di
antaranya merupakan data duplikat. Untuk itu, perlu dilakukan penghapusan data
duplikat untuk mendapatkan hasil yang lebih akurat. Setelah menghapus data
duplikat, kemudian dilakukan konversi nilai terhadap jarak terdekat dengan pusat
kota, jalan, dan sungai yang semula dalam satuan derajat menjadi km agar lebih
mudah dipahami oleh pengguna.

4
Data yang telah dihapus duplikatnya dan dikonversi menjadi km kemudian
dilakukan diskretisasi berdasarkan frekuensi guna mendapatkan hasil yang merata
untuk setiap interval. Jarak terdekat dengan pusat kota dibagi menjadi 10 interval
yang diberi label M1 sampai M10. Jarak terdekat dengan jalan dibagi menjadi 5
interval yang diberi label RO1 sampai RO5. Jarak terdekat dengan sungai dibagi
menjadi 5 interval yang diberi label RI1 sampai RI5.
Pembagian Dataset
Data hasil perhitungan jarak terdekat dengan pusat kota, jalan, dan sungai
dibagi menjadi data training dan data uji dengan k-fold cross validation. Data
training digunakan untuk membangun pohon keputusan, sedangkan data uji
digunakan untuk menghitung akurasi pohon keputusan.
Pembuatan Modul Klasifikasi Menggunakan Algoritme Pohon Keputusan
C4.5
Klasifikasi adalah sebuah bentuk analisis data yang model ekstraksi datanya
menggambarkan kelas data penting. Model tersebut disebut classifier yang
memprediksi kategori (discrete, unordered) label kelas. Klasifikasi data merupakan
proses yang terdiri atas dua tahap, yaitu pembelajaran dan klasifikasi. Pada tahap
pembelajaran, data training dianalisis dengan sebuah algoritme klasifikasi. Learned
model atau classifier direpresentasikan dalam bentuk aturan klasifikasi. Pada tahap
klasifikasi, data uji digunakan untuk menghitung akurasi dari aturan klasifikasi.
Jika akurasi dianggap dapat diterima, aturan-aturan yang telah terbentuk dapat
digunakan untuk klasifikasi data tuple baru (Han et al. 2012). Model klasifikasi
berguna untuk keperluan deskriptif dan prediktif.
Pada tahapan ini dibuat pohon keputusan untuk klasifikasi kemunculan titik
api. Atribut targetnya adalah kelas dengan label T (true) dan F (false). Kelas T (true)
menunjukkan kemunculan titik api, sedangkan kelas F (false) menunjukkan
ketidakmunculan titik api. Pohon keputusan adalah sebuah flowchart dengan
struktur seperti pohon di mana setiap internal node (nonleaf node) menunjukkan
tes pada atribut, setiap cabang merupakan hasil dari tes, dan masing-masing node
(terminal node) memegang label kelas (Han et al. 2012).
Pada penelitian ini digunakan algoritme pohon keputusan C4.5. Algoritme
C4.5 dikembangkan dari algoritme ID3 untuk membangkitkan pohon keputusan.
Algoritme C4.5 mengadopsi konsep “greedy” (nonbacktracking), yaitu membentuk
pohon keputusan dengan metode divide dan conquer data secara rekursif dari atas
ke bawah (Han et al. 2012). Algoritme C4.5 secara rekursif mengunjungi setiap
decision node, memilih pemisahan (split) yang optimal, sampai tidak ada
pemisahan yang mungkin. Algoritme C4.5 menggunakan konsep information gain
atau entropy reduction untuk memilih pemisahan yang optimal (Larose 2005).
Entropy himpunan kasus S yang memiliki k atribut berbeda untuk setiap kelas
C dan information gain untuk atribut X didefinisikan sebagai berikut (Quinlan
1993):

5
k

Entropy S = - ∑
j=1

freq(Cj ,S)
freq(Cj ,S)
× log2
|S|
|S|
|S |

Gain X = entropy (S) - ∑ni=1 |S|i × entropy (Si)

dengan:
Freq (Cj, S)
|�|





X
|�� |
|�|

: jumlah atribut j pada kelas C dalam himpunan kasus S
: banyaknya himpunan kasus S
: himpunan kasus
: subset C yang memiliki label kelas j
: banyaknya kelas
: subset ke-i
: banyaknya subset
: atribut
: proporsi record dalam subset i.

Pada setiap pohon keputusan, algoritme C4.5 memilih pemisahan (split)
optimal menjadi pemisahan (split) yang memiliki information gain tertinggi. Hasil
klasifikasi berupa aturan-aturan pohon keputusan. Dalam penelitian ini dibangun
modul klasifikasi pohon keputusan dalam SIG yang berisi aturan-aturan klasifikasi.
Modul klasifikasi dibangun menggunakan bahasa pemrograman PHP.
Menghitung Akurasi Pohon Keputusan
Akurasi pohon keputusan yang dihasilkan dapat dilihat dari confusion matrix,
yaitu matriks yang memperlihatkan perhitungan banyaknya label kelas yang
diprediksi benar dibagi label kelas keseluruhan. Jika hasilnya melebihi threshold
65% diproses ke tahap berikutnya, apabila kurang dari threshold 65%, masuk ke
proses pembuatan modul klasifikasi pohon keputusan untuk pengolahan data
kembali.
Pembuatan Modul Klasifikasi Titik Api dalam Sistem Informasi Geografis
SIG berbasis web adalah produk-produk SIG yang dipublikasi di Internet
yang dapat diakses oleh siapapun sebagai penyedia informasi atau data sharing.
SIG berbasis web umumnya memiliki empat komponen utama yaitu klien, server
web dengan server aplikasi, server peta, dan server data (Peng dan Tsou 2003).
Server klien sebagai antarmuka pengguna untuk berinteraksi dengan program SIG
berbasis web. Server web menerima permintaan klien, melayani halaman web statik,
dan melibatkan server aplikasi. Server aplikasi mengatur transaksi server,
keamanan, dan keseimbangan beban. Server peta memroses permintaan klien dan
membangkitkan hasil. Server data melayani data geospasial dan data non spasial
serta menyediakan akses data dan menajemen sebuah Structured Query Language

6
(SQL) (Peng dan Tsou 2003). Komponen dasar SIG berbasis web diilustrasikan
pada Gambar 2.
Client
Client

Web Server with
Application
Server

Map Server

Data Server

Client
Gambar 2 Komponen dasar dalam SIG berbasis web (Peng dan Tsou 2003)
Pada tahapan ini, data yang telah diolah melalui proses klasifikasi dengan
algoritme C4.5 diolah kembali dengan menggunakan perangkat lunak OpenGeo
Suite 3.0. Proses ini dilakukan untuk membentuk peta rawan kebakaran yang baru
berdasarkan aturan yang dihasilkan. Hasilnya diintegrasikan dengan sistem
informasi geografis yang sudah ada untuk visualisasi kemunculan titik api di
Provinsi Riau.
Perangkat Penelitian
Pembuatan modul klasifikasi untuk data persebaran titik api di Provinsi Riau
ini menggunakan perangkat lunak dan perangkat keras sebagai berikut:
1 Perangkat keras berupa komputer personal dengan spesifikasi sebagai berikut:
a. Intel® Core ™ i5-2430M CPU @ 2.40GHz
b. Memori RAM 4.00 GB
c. 750GB HDD
d. Mouse
2 Perangkat lunak
a. Sistem operasi Windows 8
b. OpenGeo Suite 3.0 untuk mengelola data peta
c. Microsoft Excel 2013 untuk mengolah data titik api dalam format .csv
d. XAMPP 1.7.3 sebagai web server
e. Adobe Dreamweaver CS 6 untuk mengkodekan aturan-aturan pohon
keputusan
f. Bahasa pemrograman PHP
g. Quantum GIS 2.0.1 Dufour untuk visualisasi data spasial
h. RapidMiner 5 untuk diskretisasi data jarak berdasarkan frekuensinya
i. Weka 3.6.9 untuk klasifikasi data

7

HASIL DAN PEMBAHASAN
Praproses Data
Tahapan-tahapan yang dilakukan dalam praproses data adalah sebagai
berikut:
1 Menghapus data duplikat
Data yang digunakan diolah menggunakan Microsoft Excel dan dilakukan
penghapusan data duplikat untuk menghasilkan klasifikasi yang lebih akurat.
Data yang semula berjumlah 14 369 record, setelah dihapus data duplikat
menjadi 11 810 record.
2 Mengkonversi nilai data
Data jarak terdekat dengan pusat kota, jalan, dan sungai semula dalam
satuan derajat, kemudian dikonversi ke km dengan mengalikan setiap nilai jarak
dengan pengali 111.3199. Angka tersebut merupakan hasil bagi keliling bumi
dengan 360 karena keliling bumi berbentuk lingkaran. Contoh data yang belum
dikonversi dari derajat ke km dapat dilihat pada Lampiran 1. Konversi nilai dari
derajat menjadi km bertujuan memudahkan pengguna memahami data yang
ditampilkan pada web sistem informasi geografis.
3 Diskretisasi data
Atribut jarak terdekat dengan pusat kota, jarak terdekat dengan jalan, dan
jarak terdekat dengan sungai didiskretisasi berdasarkan frekuensi menggunakan
perangkat lunak RapidMiner 5. Untuk memudahkan implementasi jumlah digit
desimal ditetapkan satu sehingga jumlah objek untuk setiap interval berubah dari
output yang dihasilkan RapidMiner 5. Contoh data yang sudah dikonversi dari
derajat ke km dan dikategorikan dapat dilihat pada Lampiran 2. Kategori data
untuk atribut jarak terdekat dengan pusat kota, jarak terdekat dengan jalan, dan
jarak terdekat dengan sungai berturut-turut dapat dilihat pada Tabel 1, Tabel 2,
dan Tabel 3.
Tabel 1 Kategori untuk jarak terdekat dengan pusat kota
Kategori
M1
M2
M3
M4
M5
M6
M7
M8
M9
M10

Interval jarak ke
Jumlah objek
pusat kota (km)
(0, 22.8]
1256
(22.8, 32.8]
1170
(32.8, 42.8]
1207
(42.8, 54.0]
1099
(54.0, 67.3]
1259
(67.3, 77.4]
1104
(77.4, 90.7]
1182
(90.7, 108.5]
1223
(108.5, 126.3]
1135
>126.3
1175

8
Tabel 2 Kategori untuk jarak terdekat dengan jalan
Kategori
RO1
RO2
RO3
RO4
RO5

Interval jarak ke
Jumlah objek
jalan (km)
(0, 0.2]
2163
(0.2, 0.7]
2548
(0.7, 1.6]
2387
(1.6, 3.8]
2337
>3.8
2375

Tabel 3 Kategori untuk jarak terdekat dengan sungai
Kategori
RI1
RI2
RI3
RI4
RI5

Interval jarak ke
Jumlah objek
sungai (km)
(0, 1.7]
2384
(1.7, 3.9]
2427
(3.9, 7.2]
2508
(7.2, 12.8]
2171
>12.8
2320
Pembagian Dataset

Data akan dibagi menjadi data latih dan data uji menggunakan metode 10folds cross validation. Setiap bagian (fold) dijadikan sebagai data uji dan n-1 fold
dijadikan data latih. Proses ini dilakukan oleh Weka 3.6.9 pada saat klasifikasi data
untuk membangkitkan aturan-aturan pohon keputusan.

Pembuatan Modul Klasifikasi Menggunakan Pohon Keputusan C4.5
Dataset yang terbentuk diklasifikasikan menggunakan algoritme C4.5.
Algoritme C4.5 memilih atribut yang memiliki information gain yang paling tinggi
sebagai atribut uji. Pada Weka 3.6.9, algoritme C4.5 diimplementasikan dengan
modul J48. Algoritme C4.5 menghasilkan 109 aturan yang dapat dilihat pada
Lampiran 3. Beberapa contoh aturan yang terbentuk antara lain:
Aturan 1: Jika jarak terdekat dengan sungai kurang dari atau sama dengan 1.7 km
maka lokasi tersebut tidak berpotensi terjadi kebakaran (false).
Aturan 2: Jika jarak terdekat dengan sungai di antara 1.7 km dan 3.9 km dan jarak
terdekat dengan pusat kota kurang dari atau sama dengan 22.8 km maka
lokasi tersebut tidak berpotensi terjadi kebakaran (false).
Aturan 3: Jika jarak terdekat dengan sungai di antara 3.9 km dan 7.2 km dan jarak
terdekat dengan pusat kota di antara 108.5 km dan 126.3 km dan jarak
terdekat dengan jalan kurang dari 0.2 km maka lokasi tersebut berpotensi
terjadi kebakaran (true).
Aturan 4: Jika jarak terdekat dengan sungai di antara 7.2 km dan 12.8 km dan jarak
terdekat dengan pusat kota di antara 32.8 km dan 42.8 km dan jarak

9
terdekat dengan jalan di antara dari 0.7 km dan 1.6 km maka lokasi
tersebut berpotensi terjadi kebakaran (true).
Aturan 5: Jika jarak terdekat dengan sungai lebih besar dari 12.8 km dan jarak
terdekat dengan pusat kota kurang dari 22.8 km maka lokasi tersebut
berpotensi terjadi kebakaran (true).

Menghitung Akurasi Pohon Keputusan
Dengan menggunakan metode pengujian cross validation 10 folds, diperoleh
confusion matrix untuk pohon keputusan C4.5 yang dapat dilihat pada Tabel 4.
Tabel 4 Confusion matrix
Kelas hasil prediksi
Total
True
False
True
2168
2442
4610
Kelas aktual
False
1152
6048
7200
Total
3320
8490
11 810
Dari confusion matrix dalam Tabel 4, dapat diketahui bahwa sekitar 34% dari
data yang diklasifikasi kelas true merupakan salah klasifikasi dan sekitar 29% dari
data yang diklasifikasi kelas false merupakan salah klasifikasi. Akurasi model
pohon keputusan yang diperoleh dapat dihitung sebagai berikut:
akurasi =

banyak total prediksi yang benar
total banyaknya prediksi

2168+6048
2168+2442+1152+6048
8216
akurasi =
= 0.6956
11 810
Akurasi pohon keputusan yang menunjukkan keakuratan pohon keputusan
dalam mengklasifikasikan kemunculan titik api adalah 69.56%.
akurasi =

Pembuatan Modul Klasifikasi Titik Api dalam Sistem Informasi Geografis
Data spasial yang meliputi jarak terdekat dengan pusat kota, jarak terdekat
dengan jalan, jarak terdekat dengan sungai, kelas, peta Provinsi Riau, pusat kota,
jalan, dan sungai disimpan dalam basis data spasial dalam SIG. Data ini diolah lebih
lanjut untuk menampilkan hasil klasifikasi titik api berdasarkan pohon keputusan
yang telah diperoleh pada tahap sebelumnya. SIG dibangun menggunakan
perangkat lunak OpenGeo Suite 3.0.
Seperti yang diilustrasikan pada Gambar 2, komponen SIG berbasis web ada
4, yaitu klien, server web dengan server aplikasi, server peta, serta server data. Pada
penelitian ini, web browser bertindak sebagai klien. Apache yang telah tergabung
dalam package XAMPP 1.7.3 bertindak sebagai server web. Server web disebut
juga sebagai server HTTP, berfungsi untuk memberikan respon atas permintaan

10
dari web browser via HTTP. Modul klasifikasi kemunculan titik api terletak pada
bagian server web. Server aplikasi berperan sebagai translator atau penghubung
antara server web dan server peta. Server aplikasi meliputi model common gateway
interface (CGI) atau CGI extension seperti Microsoft’s Internet Server Application
Program Interface (ISAPI) dan Active Server Pages (ASP), dan lain-lain.
Selanjutnya Geoserver bertindak sebagai server peta yang memroses permintaan
klien dan membangkitkan peta. PostGIS bertindak sebagai server data yang
melayani data spasial dan non spasial. Geoserver dan PostGIS sudah terdapat dalam
package OpenGeo Suite 3.0. Gambar 3 merupakan potongan kode program untuk
klasifikasi.

Gambar 3 Potongan kode program klasifikasi
Data hasil klasifikasi diintegrasikan dengan peta Provinsi Riau dan
ditampilkan penanda untuk visualisasi lokasi-lokasi yang tidak atau berpotensi
terjadi kebakaran berdasarkan jarak terdekat terhadap pusat kota, jalan, dan sungai
yang dimasukkan pengguna. Gambar 4 merupakan potongan kode program untuk
menampilkan penanda.
Gambar 5 menunjukkan halaman muka SIG untuk klasifikasi titik api.
Halaman muka ini memiliki beberapa fitur utama yang terdiri atas pan map, zoom
in, zoom out, scale, dan peta Provinsi Riau menggunakan Openlayer. Pada peta
Provinsi Riau terlihat sungai (garis biru), jalan (garis coklat), pusat kota (titik merah
muda) serta marker. Marker muncul setelah tombol “Prediksi” yang terlihat pada
Gambar 6 ditekan. Marker berwarna merah untuk hasil klasifikasi true dan
berwarna biru untuk hasil klasifikasi false.

11

Gambar 4 Kode program untuk menampilkan penanda

Gambar 5 Tampilan halaman utama klasifikasi titik api di Provinsi Riau
Tampilan hasil klasifikasi kemunculan titik api berdasarkan data jarak lokasi
ke pusat kota, jalan, dan sungai terdekat yang di-input-kan pengguna diberikan pada
Gambar 6. Terdapat 2 tombol pada Gambar 6, tombol “Prediksi” berfungsi untuk
menampilkan hasil klasifikasi serta marker dan tombol “Reset Map” untuk
menghapus tabel hasil klasifikasi serta marker pada peta. Data yang ditampilkan
pada tabel merupakan data yang sesuai dengan masukan pengguna dan hasil
klasifikasi kemunculan titik api.
Gambar 7 menunjukkan halaman SIG yang menampikan peta menggunakan
google map. Tampilan ini muncul ketika masuk ke menu “Google Map”. Pada
halaman ini ditampilkan pan map, zoom in, zoom out, scale, map type control,
marker, dan info window. Info window muncul ketika pengguna melakukan aksi
pada marker. Info window dapat ditutup dengan menekan close button pada pojok
kanan atas info window. Pada info window ditampilkan keterangan dari marker
meliputi info kabupaten / kota, jarak titik tersebut dengan pusat kota, jalan, dan
sungai. Selain itu, pengguna dapat mengganti jenis tampilan peta google map.
Tampilan default yaitu jenis roadmap. Pengguna dapat menggantinya dengan tipe
satellite atau terrain menggunakan fitur map type control.

12

Gambar 6 Tampilan data dan hasil klasifikasi sesuai masukan pengguna

Gambar 7 Tampilan peta menggunakan Google Map
Gambar 8 merupakan tampilan menu “Tentang Sistem”. Pada halaman ini
terdapat keterangan tentang sistem dan sumber data yang digunakan. SIG yang
telah dibangun memiliki beberapa fungsi. Fungsi-fungsi yang terdapat pada SIG
telah diuji menggunakan metode black box dengan hasil setiap fungsi berjalan
dengan baik. Pengujian dilakukan untuk 6 kelas uji, yaitu menu utama, menu google
map, menu tentang sistem, hasil klasifikasi, dan tabel. Hasil pengujian
selengkapnya dapat dilihat pada Lampiran 4.

13

Gambar 8 Tampilan menu “Tentang Sistem”

SIMPULAN DAN SARAN
Simpulan
Simpulan dari penelitian ini yaitu:
1 Penerapan algoritme C4.5 untuk data kebakaran hutan di Provinsi Riau yang
terdiri atas jarak terdekat dengan pusat kota, jalan, dan sungai menghasilkan 109
aturan klasifikasi untuk titik api dengan akurasi 69.56%.
2 Sistem informasi geografis untuk klasifikasi titik api berdasarkan pohon
keputusan C4.5 berhasil dibangun menggunakan perangkat lunak OpenGeo
Suite 3.0. SIG memiliki enam modul utama yaitu menampilkan peta, pan map,
zoom in, zoom out, scale, mouse position dan fungsi klasifikasi kemunculan titik
api berdasarkan karakteristik lokasi yang di-input-kan pengguna.
3 Visualisasi hasil klasifikasi titik api dalam bentuk peta memudahkan pengguna
dalam melihat lokasi yang rawan terjadinya titik api berdasarkan karakteristik
lokasi tersebut yaitu jarak terdekat ke pusat kota, jalan, dan sungai.

Saran
Penelitian ini masih memiliki kekurangan, saran yang dapat disampaikan
untuk penelitian selanjutnya adalah sebagai berikut:
1 Dilakukan praproses dengan pendekatan yang berbeda untuk diskretisasi dan
tranformasi data.
2 Dilakukan penambahan atribut lain meliputi jenis tanah dan ketinggian lahan
guna membangkitkan pohon keputusan untuk klasifikasi titik api yang lebih baik.

14

DAFTAR PUSTAKA
Barus SV. 2014. Sistem informasi geografis berbasis web untuk data histori hotspot
di Indonesia menggunakan OpenGeo Suite 3.0 [skripsi]. Bogor (ID): Institut
Pertanian Bogor.
Chang KT. 2002. Introduction to Geographic Information Systems. New York
(US): McGraw-Hill.
Fernando V. 2014. Klasifikasi data spasial untuk kemunculan hotspot di Provinsi
Riau menggunakan algoritme ID3 [skripsi]. Bogor (ID): Institut Pertanian Bogor.
Han J, Kamber M, Pei J. 2012. Data Mining: Concepts and Techniques. 3rd ed.
Massachusetts (US): Morgan Kaufmann.
[Kemenhut] Kementerian Kehutanan. 2009. Peraturan Menteri Kehutanan Nomor:
P.12/Menhut-II/2009 tentang pengendalian kebakaran hutan [Internet]. [diunduh
2013
Nov
3].
Tersedia
pada:
http://storage.jakstik.ac.id/ProdukHukum/kehutanan/P12_09.pdf.
[Kemenhut] Kementerian Kehutanan. 2012. Statistik kehutanan Indonesia 2011
[Internet].
[diunduh
2013
Okt
30].
Tersedia
pada:
http://agungwi.files.wordpress.com/2012/11/buku-statistik-juli2012_terbaru.pdf.
Larose DT. 2005. Discovering Knowledge in Data: an Introduction to Data Mining.
New Jersey (US): J Wiley.
Peng ZR, Tsou MH. 2003. Internet GIS: Distributed Geographic Information
Services for the Internet and Wireless Networks. New Jersey (US): J Wiley.
Quinlan JR. 1993. C4.5: Programs for Machine Learning. Vol ke-1. California
(US): Morgan Kaufmann.

15
Lampiran 1 Contoh record data yang belum dikonversi dari derajat menjadi
kilometer
Jarak terdekat
dengan pusat
kota (derajat)
0.39
0.35
1.23
1.22
0.52
0.27
0.22
1.17
0.14
0.41

Jarak terdekat
dengan jalan
(derajat)
0.000744
0.010375
0.005791
0.003971
0.004044
0.003050
0.000793
0.042827
0.026304
0.001737

Jarak terdekat
dengan sungai
(derajat)
0.09
0.15
0.03
0.00
0.03
0.19
0.02
0.08
0.18
0.10

Kelas
T
T
T
T
T
F
F
F
F
F

16
Lampiran 2 Contoh record data yang sudah dikonversi dari derajat menjadi
kilometer dan dikategorikan
Jarak
terdekat
dengan
pusat kota
(km)
50.09396
84.60312
43.41476
38.96197
136.9235
57.88635
30.05637
24.49038
130.2443
15.58479

Jarak
terdekat
dengan
jalan (km)
4.442823
1.032791
0.082819
1.154933
0.644653
0.450129
0.339516
0.088272
4.767545
2.928167

Jarak
terdekat
dengan
sungai (km)
5.565995
18.92438
10.01879
16.69799
3.339597
3.339597
21.15078
2.226398
8.905592
20.03758

Kategori
jarak ke
pusat kota
M4
M7
M4
M3
M10
M5
M2
M2
M10
M1

Kategori Kategori
jarak ke jarak ke Kelas
jalan
sungai
RO5
RO3
RO1
RO3
RO2
RO2
RO2
RO1
RO5
RO4

RI3
RI5
RI4
RI5
RI2
RI2
RI5
RI2
RI4
RI5

T
T
T
T
T
T
F
F
F
F

17
Lampiran 3 Contoh hasil klasifikasi dengan C4.5 menggunakan Weka 3.6.9
MinDist_River = RI5
| MinDist_Maincities = M3: T (458.0/133.0)
| MinDist_Maincities = M1: T (525.0/133.0)
| MinDist_Maincities = M2: T (464.0/123.0)
| MinDist_Maincities = M4: F (135.0/50.0)
| MinDist_Maincities = M6: T (149.0/42.0)
| MinDist_Maincities = M8: F (125.0/44.0)
MinDist_River = RI2
| MinDist_Maincities = M3: F (178.0/46.0)
| MinDist_Maincities = M1: F (162.0/39.0)
| MinDist_Maincities = M5: F (309.0/108.0)
| MinDist_Maincities = M7: F (278.0/98.0)
| MinDist_Maincities = M2: F (151.0/48.0)
| MinDist_Maincities = M8: F (290.0/89.0)
| MinDist_Maincities = M10: F (351.0/46.0)
MinDist_River = RI3
| MinDist_Maincities = M3: F (155.0/42.0)
| MinDist_Maincities = M7
| | MinDist_Road = RO3: F (46.0/13.0)
| | MinDist_Road = RO1: F (100.0/25.0)
| | MinDist_Road = RO4: T (44.0/19.0)
| | MinDist_Road = RO2: F (62.0/14.0)
| | MinDist_Road = RO5: F (40.0/7.0)
| MinDist_Maincities = M4: F (287.0/98.0)
| MinDist_Maincities = M6: F (250.0/97.0)
| MinDist_Maincities = M8: F (302.0/85.0)
| MinDist_Maincities = M10: F (240.0/26.0)
MinDist_River = RI4
| MinDist_Maincities = M5: F (232.0/87.0)
| MinDist_Maincities = M7: F (210.0/70.0)
| MinDist_Maincities = M4: F (198.0/56.0)
| MinDist_Maincities = M8: F (237.0/38.0)
| MinDist_Maincities = M10: F (90.0/16.0)
MinDist_River = RI1: F (2384.0/605.0)

18
Lampiran 4 Hasil pengujian fungsi-fungsi SIG
No

Kondisi
awal
Halaman
utama

Hasil
yang
diperoleh
Tampilan
halaman
utama
Tampilan
halaman
google map
Tampilan
halaman
tentang sistem
Tampilan
hasil
klasifikasi
dan marker
pada
peta
Openlayer
dan
google
map
Tampilan peta
yang
diperbesar

Hasil
uji
OK

Pilih navigasi
zoom out

Tampilan peta
yang
diperkecil

OK

Pilih
pan

navigasi

Tampilan peta
yang digeser
ke kiri, kanan,
atas,
dan
bawah

OK

Pilih
satellite
pada map type
control
Pilih
terrain
pada map type
control
Tampilan peta

Tampilan peta
dengan tipe
satellite
Tampilan peta
dengan tipe
terrain
Tampilan
scale

OK

Mengarahkan
mouse
pada
tampilan peta

Tampilan
koordinat
longitude dan
latitude
berdasarkan
posisi mouse
pada peta

OK

Kelas uji

Deskripsi uji

1

Menu
utama

Menampilkan
halaman utama

2

Menu
google map

Halaman
utama

Pilih
menu
google map

3

Menu
tentang
sistem
Hasil
klasifikasi
dan marker

Menampilkan
halaman google
map
Menampilkan
menu
tentang
sistem
Menampilkan
hasil klasifikasi
dan marker pada
peta

Halaman
utama

Pilih
menu
tentang sistem

Halaman
utama dan
google map

Memperbesar
peta

Halaman
tampilan
peta
Openlayer
dan google
map
Halaman
tampilan
peta
Openlayer
dan google
map
Halaman
tampilan
peta
Openlayer
dan google
map
Halaman
tampilan
peta google

Pilih kategori
“Jarak dengan
pusat
kota”,
“Jarak dengan
sungai”, “jarak
dengan jalan”,
dan
tekan
tombol Prediksi
Pilih navigasi
zoom in

4

5

Menu
tampilan
peta

Memperkecil
peta

Menggeser peta

Mengganti jenis
peta

Menampilkan
scale

Menampilkan
mouse position

Halaman
tampilan
peta
Openlayer
dan google
map
Halaman
tampilan
peta
Openlayer

Skenario uji
Pilih
home

menu

OK

OK

OK

OK

OK

OK

19

6

Tabel

Menampilkan
info window

Halaman
tampilan
peta google

Click
marker

Reset
peta

Halaman
tampilan
peta
Openlayer
dan google
map
Halaman
utama dan
google map

Tekan tombol
Reset Map

tampilan

Menampilkan
tabel

pada

Pilih kategori
“Jarak dengan
pusat
kota”,
“Jarak dengan
sungai”, “jarak
dengan jalan”,
dan
tekan
tombol Prediksi

Tampilan info
kabupaten,
jarak dengan
pusat
kota,
jarak dengan
sungai, dan
jarak dengan
jalan
dari
marker
tersebut
Tampilan peta
tanpa marker

OK

Tampilan
tabel
kabupaten,
jarak dengan
pusat
kota,
jarak dengan
jalan,
dan
jarak dengan
sungai

OK

OK

20

RIWAYAT HIDUP
Penulis dilahirkan Tanjung Jati pada tanggal 18 Oktober 1992 dari pasangan
Bapak Zairul Zaidar dan Ibu Indrawati. Penulis merupakan anak kedua dari tiga
bersaudara. Pada tahun 2010, penulis lulus dari SMA Negeri 1 Kecamatan Guguak,
Kabupaten Lima Puluh Kota, Sumatera Barat dan penulis diterima sebagai
mahasiswa di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu
Pengetahuan Alam, Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk
IPB (USMI). Pada tahun yang sama, penulis mendapatkan beasiswa Bidik Misi.
Selama menjalani perkuliahan, penulis pernah menjadi asisten praktikum
mata kuliah Penerapan Komputer semester genap tahun akademik 2012/2013 dan
semester gasal tahun akademik 2013/2014. Penulis pernah melaksanakan praktik
kerja lapangan (PKL) di Direktorat Jenderal Perdagangan Dalam Negeri,
Kementerian Perdagangan pada tahun 2013. Selain itu, penulis juga pernah menjadi
finalis pada Gemastik 6 kategori Data Mining pada tahun 2013.