Identifikasi Fire Spot Berdasarkan Pola Sekuens Titik Panas Dan Klasifikasi Area Terbakar Di Lahan Gambut

IDENTIFIKASI FIRE SPOT BERDASARKAN POLA
SEKUENS TITIK PANAS DAN KLASIFIKASI AREA
TERBAKAR DI LAHAN GAMBUT

NALAR ISTIQOMAH

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa tesis berjudul Identifikasi Fire Spot
berdasarkan Pola Sekuens Titik Panas dan Klasifikasi Area Terbakar di Lahan
Gambut adalah benar karya saya dengan arahan dari komisi pembimbing dan belum
diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber
informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam
Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.

Bogor, Agustus 2016
Nalar Istiqomah
NIM G651150451

RINGKASAN
NALAR ISTIQOMAH. Identifikasi Fire Spot berdasarkan Pola Sekuens Titik
Panas dan Klasifikasi Area Terbakar di Lahan Gambut. Dibimbing oleh IMAS
SUKAESIH SITANGGANG dan LAILAN SYAUFINA.
Indonesia mempunyai lahan gambut terluas diantara negara tropika. Lahan
gambut ini memiliki peranan penting yang menunjang kehidupan makhluk hidup.
Sayangnya, dewasa ini banyak terjadi kebakaran di lahan gambut yang dapat
mengakibatkan dampak buruk bagi lingkungan.
Hingga saat ini, kebakaran hutan ditandai dengan kemunculan titik panas.
Menurut pakar dan praktisi kebakaran hutan, titik panas yang muncul berurutan dua
hingga tiga hari di lokasi yang sama memiliki potensi yang tinggi menjadi
kebakaran hutan. Oleh karena itu sequential pattern mining dapat diterapkan untuk
mendapatkan pola sekuens titik panas. Namun, kemunculan titik panas tidak selalu
menunjukkan terjadinya kebakaran hutan. Sehingga harus dilakukan pengecekan

titik panas ke lapangan untuk mengetahui apakah titik panas tersebut merupakan
kebakaran hutan atau bukan. Hal ini memerlukan waktu dan biaya yang tidak
sedikit terutama untuk daerah yang sulit dijangkau. Oleh karena itu, diperlukan
metode validasi pola sekuens kemunculan titik panas yang lebih mudah dan efisien.
Metode yang dapat digunakan antara lain dengan mengklasifikasikan data citra
satelit. Tujuan dari penelitian ini adalah mendapatkan pola sekuens kemunculan
titik panas menggunakan algortime PrefixSpan, menerapkan aturan pohon
keputusan C5.0 dan Spatial Decision Tree (SDT) dari penelitian Thariqa et.al
(2016), menerapkan metode maximum likelihood pada data citra satelit untuk
mengklasifikasikan area terbakar serta mengidentifikasi fire spot berdasarkan pola
sekuens titik panas dan hasil klasifikasi area terbakar.
Hasil penelitian ini menunjukkan bahwa data titik panas dari Kementrian
Lingkungan Hidup (KLH) tidak menghasilkan pola yang menarik, karena
panjangnya hanya 1 item, sedangkan data titik panas dari NASA menghasilkan pola
yang menarik karena panjangnya hingga 3 item. Sehingga pola sekuens yang
dianalisis lebih lanjut adalah yang berasal dari NASA. Pola sekuens tahun 2014
yang dihasilkan, banyak terdapat di Kalimantan Timur dengan panjang item 2
sebanyak 21 sekuens dan panjang item 3 sebanyak 2 sekuens. Adapun pola sekuens
pada tahun 2015, banyak terdapat di Kalimantan Barat dan Kalimantan Tengah. Di
Kalimantan Barat, terdapat 14 sekuens yang panjangnya 2 item sedangkan di

Kalimantan Tengah terdapat 10 sekuens yang panjangnya 2 item dan 1 sekuens
yang panjangnya 3 item. Adapun hasil klasifikasi citra yang paling baik dihasilkan
oleh metode maximum likelihood. Berdasarkan klasifikasi area terbakar, diketahui
bahwa untuk Pulang Pisau, terdapat 42.78% pola sekuens yang terdapat di area
terbakar dan 72.68% pola sekuens yang berada di area buffer dengan radius 1 km.
Adapun untuk Palangkaraya, terdapat 78.57% pola sekuens yang terdapat di area
terbakar 100% pola sekuens yang berada di area buffer dengan radius 1 km. Serta
di Pontianak, 100% pola sekuens terdapat di daerah terbakar serta buffernya. Dari
pemaparan tersebut, dapat dikatakan bahwa di Pulang Pisau, Palangkaraya dan
Pontianak terdapat 72.68%, 100% dan 100% pola sekuens yang menjadi fire spot.
Kata kunci: identifikasi firespot, maximum likelihood, PrefixSpan, titik panas

SUMMARY
NALAR ISTIQOMAH. Fire Spot Identification based on Sequential Pattern of
Hotspot and Burned Area Classification in Peatland. Supervised by IMAS
SUKAESIH SITANGGANG and LAILAN SYAUFINA.
Indonesia has the world's largest tropical peatlands which play important
roles that support life. Unfortunately, peatlands are threated by fires. This could
effect the environment. Peat fires are also more difficult to extinguish forest fires
than usual, because it is classified as ground fire.

Peatland fires are indicated by hotspot occurences. According to experts and
forest fire practitioners, hotspots that appear in a sequence of two to three days at
the same location has a high potential becoming a forest fire. Therefore, sequential
pattern mining was applied to identify sequence of hotspot occurences. Sequential
pattern mining was performed PrefixSpan algorithm. However, the emergence of
hot spots do not necessary to indicate the occurrence of forest fires. So it must be
verified into the field to find out if the hot spot is a fire spot or not. This requires
many time and cost, especially for areas difficult to reach. Therefore, it is required
hotspot sequence patterns validation method that more easy and efficient. Satellite
image classification can be used to validate hotspot sequence patterns. The purpose
of this study is to obtain a hotspot sequence pattern using PrefixSpan algorithm,
applying the C5.0, SDT and maximum likelihood method on satellite image data to
classify the burned area and identify the hotspot sequence pattern that become fire
spot.
The results of this study indicate that the hotspot data from the Ministry of
Environment does not produce an interesting pattern, since the length is only one
item. On the other hand, hotspot data from NASA produces interesting pattern and
its length up to 3 items. So that the pattern sequences derived from NASA was
further analyzed. Pattern sequences generated in 2014 were found in East
Kalimantan with total 21 of 2 item sequences and 2 of 3 item sequences. Meanwhile,

sequence patterns in 2015, were found in West Kalimantan and Central Kalimantan.
In West Kalimantan, there are 14 of 2 item sequence while in Central Kalimantan,
there are 10 of 2 item sequences and 1 of 3 item sequences. Sattelite image
classification have been conducted using C5.0, SDT dan maximum likelihood
algorithm. The best result was found by maximum likelihood algorithm. Based on
the classification of burned area result, it is known that in Pulang Pisau, there are
42.78% sequence patterns found in burned areas and 72.68% sequence patterns that
are located the buffer of burned area with the radius of 1 km. As for Palangkaraya,
there are 78.57% sequence patterns found in burned areas and 100% sequence
patterns that are in the buffer of burned area with the radius of 1 km. In addition,
for Pontianak, there are 100% sequence patterns found in burned areas and its buffer.
Then it can be concluded that in Pulang Pisau, Palangkaraya and Pontianak there
are respectively 72.68%, 100% and 100% fire spots as strong indicators for
peatland fires.
Keywords: firespot identification, hotspot, maximum likelihood, PrefixSpan

© Hak Cipta Milik IPB, Tahun 2016
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa
mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk

kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan,
penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak
merugikan kepentingan IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya
tulis ini dalam bentuk apa pun tanpa izin IPB

IDENTIFIKASI FIRE SPOT BERDASARKAN POLA
SEKUENS TITIK PANAS DAN KLASIFIKASI AREA
TERBAKAR DI LAHAN GAMBUT

NALAR ISTIQOMAH

Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Komputer
pada
Program Studi Ilmu Komputer

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR

BOGOR
2016

Penguji Luar Komisi pada Ujian Tesis: Dr Nining Puspaningsih, MS

Judul Tesis : Identifikasi Fire Spot berdasarkan Pola Sekuens Titik Panas dan
Klasifikasi Area Terbakar di Lahan Gambut
Nama
: Nalar Istiqomah
NIM
: G651150451

Disetujui oleh
Komisi Pembimbing

Dr Imas Sukaesih Sitanggang, SSi MKom
Ketua

Dr Ir Lailan Syaufina, MSc
Anggota


Diketahui oleh

Ketua Program Studi Ilmu Komputer

Dekan Sekolah Pascasarjana

Dr Ir Sri Wahjuni, MT

Dr Ir Dahrul Syah, MScAgr

Tanggal Ujian:
4 Agustus 2016

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah Subhana wa ta'ala. Shalawat
serta salam semoga senantiasa dilimpahkan kepada Nabi Muhammad, keluarganya,
sahabatnya, dan kepada kita yang selalu berusaha menggapai ridha Allah.

Alhamdulillah atas bimbingan dan petunjuk dari Allah Subhana wa ta'ala
serta bimbingan dari semua pihak, penyusunan tugas akhir yang berjudul
“Identifikasi Fire Spot berdasarkan Pola Sekuens Titik Panas dan Klasifikasi Area
Terbakar di Lahan Gambut” dapat diselesaikan. Tugas akhir ini tidak mungkin
dapat diselesaikan tanpa adanya bantuan dari berbagai pihak. Oleh karena itu,
penulis ingin mengucapkan terimakasih dan penghargaan yang setinggi-tingginya
kepada:
 Ayah (almarhum), Ibu dan keluarga yang selalu mendoakan, memberi nasihat,
kasih sayang, semangat, dan dukungan sehingga penelitian ini bisa diselelsaikan.
 Ibu Dr Imas Sukaesih Sitanggang, SSi MKom dan Ibu Dr Ir Lailan Syaufina,
MSc selaku dosen pembimbing I dan II yang telah memberi saran, masukan dan
ide-ide dalam penelitian ini.
 Ibu Dr Nining Puspaningsih, MS sebagai penguji.
 Teman-teman mahasiswa Magister Ilmu Komputer angkatan 2014 dan 2015,
terutama ka Putri Thariqa yang telah bersedia berbagi ilmunya selama
pelaksanaan penelitian.
 Departemen Ilmu Komputer IPB, staf dan dosen yang telah banyak membantu
selama masa perkuliahan hingga penelitian.
Semoga tesis ini dapat bermanfaat.


Bogor, Agustus 2016
Nalar Istiqomah

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

1 PENDAHULUAN
Latar Belakang
Perumusan Masalah
Tujuan Penelitian

Manfaat Penelitian
Ruang Lingkup Penelitian

1
1
3
3
3
4

2 TINJAUAN PUSTAKA
Sequential Pattern Mining
Citra Satelit
Pohon Keputusan
Pohon Keputusan Spasial
Pohon Keputusan C5.0
Maximum Likelihood Classifier
Majority Filter

4
4
7
8
11
12
12
13

3 METODE
Area Studi
Data Penelitian
Tahapan Penelitian

14
14
14
15

4 HASIL DAN PEMBAHASAN
Penentuan Pola Sekuensial dengan Algoritme PrefixSpan
Klasifikasi Citra Satelit
Identifikasi Firespot

18
18
21
28

5 SIMPULAN DAN SARAN
Simpulan
Saran

31
31
32

DAFTAR PUSTAKA
LAMPIRAN
RIWAYAT HIDUP

32
35
48

DAFTAR TABEL
1
2
3
4
5
6
7
8
9
10
11
12
13
14

Jumlah pola sekuensial kemunculan titik panas tahun 2000-2014
(Nurulhaq dan Sitanggang 2015)
Perbandingan hasil algortime klasifikasi (Thariqa et.al 2016)
Hasil transformasi data titik panas Kalimantan 2014
Contoh data sekuens titik panas Kalimantan 2015
Contoh data sekuens titik panas dengan format masukan SPMF
Jumlah pola sekuens titik panas yang dihasilkan
Pola sekuens titik panas yang menarik tahun 2014 di Kalimantan
Timur
Pola sekuens titik panas yang menarik tahun 2015 di Kalimantan
Barat dan Kalimantan Tengah
Daftar tanggal pola sekuens di Kalimantan Barat dan Kalimantan
Tengah
Contoh tabel nilai piksel beserta lokasinya
Contoh lokasi sekuens titik panas dengan longitude dan latitude
dinyatakan dalam 3 angka di belakang koma
Hasil identifikasi pola sekuens di Pontianak 2015
Hasil identifikasi pola sekuens di Palangkaraya 2015
Presentase pola sekuens di area terbakar dan buffer

6
9
19
19
20
20
21
21
22
25
29
29
30
30

DAFTAR GAMBAR
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

Algoritme PrefixSpan (Pei et al. 2014)
Langkah penggalian pola dengan PrefixSpan (Zhao dan Bhowmick
2003)
Citra kebakaran hutan di Riau tahun 2014 (Terra Image 2014 [terraimage.com])
Ilustrasi kerusakan SLC (USGS 2013)
Contoh pohon keputusan (Han et al. 2012)
Ilustrasi 8-connected neighbourhood
Ilustrasi perhitungan majority filter
Tahapan penelitian
Tahapan penentuan pola sekuens titik panas tahun 2014 dan 2015
dengan algoritme PrefixSpan
Tahapan klasifikasi citra satelit
Plot data titik panas sebelum diseleksi
Hasil seleksi data titik panas
Contoh gap pada citra Landsat 7
Contoh hasil isi gap Band 7, 4, dan 2
Citra hasil composite
Proses (a) overlay Proses overlay peta lahan gambut dengan citra
satelit Pulang Pisau dan (b) citra satelit hasil pemotongan
Hasil klasifikasi dengan metode C5.0 untuk citra (a) Pontianak, (b)
Pulang Pisau dan (c) Palangkaraya

5
5
7
7
8
14
14
15
16
17
18
18
23
23
24
24
25

18
19
20
21
22
23
24
25

Hasil klasifikasi dengan metode SDT untuk citra (a) Pontianak, (b)
Pulang Pisau dan (c) Palangkaraya
Hasil klasifikasi dengan metode maximum likelihood untuk citra (a)
Pulang Pisau, (b) Pontianak, (c) Palangkaraya
Perbandingan citra hasil filtering Pulang Pisau dengan citra asli
Perbandingan citra hasil filtering Pontianak dengan citra asli
Perbandingan citra hasil filtering Palangkaraya dengan citra asli
Hasil overlay pola sekuens dengan citra hasil klasifikasi (a) Pontianak,
(b) Pulang Pisau dan (c) Palangkaraya
Titik panas yang ditumpang-susun dengan citra hasil klasifikasi pada
(a) area terbakar dan (b) area buffer sejauh 1 km dari area terbakar
Pola sekuens Pulang Pisau yang tidak berada di area terbakar dan
buffer ditumpang-susun dengan citra composite

26
26
27
27
28
28
29
31

1

PENDAHULUAN
Latar Belakang
Indonesia mempunyai lahan gambut terluas diantara negara tropis di dunia
yaitu seluas 17-27 juta hektar yang tersebar di Pulau Sumatera, Kalimantan dan
Papua (Syaufina 2008). Lahan gambut memiliki peranan yang penting,
diantaranya sebagai media penyimpanan air di musim hujan. Simpanan air tersebut
kemudian akan dilepaskan sebagai penyedia pasokan air di musim kemarau. Air
yang diserap lahan gambut di musim hujan juga dapat mencegah terjadinya banjir.
Selain itu, lahan gambut juga merupakan habitat bagi hewan dan ikan.
Sayangnya, dewasa ini banyak terjadi kebakaran pada lahan gambut. Di
wilayah Kalimantan pada tahun 2014, kebakaran hutan mencapai total 2327.24 ha
(KLH 2015). Jumlah titik panas di lahan gambut juga meningkat dan mencapai
puncaknya tahun 2005 (WWF Indonesia 2015). Hal ini dapat memberikan dampak
buruk bagi lingkungan, diantaranya hilangnya biomassa dan keanekaragaman
hayati, terjadinya proses subsiden, hilangnya fungsi penyerapan karbon serta
timbulnya kabut asap yang menyebabkan gangguan kesehatan dan transportasi
(Syaufina 2008). Kebakaran gambut merupakan ground fire yaitu api menjalar di
bawah permukaan dengan pembakaran yang tidak menyala (smoldering)
(Syaufina 2008). Ground fire menyebabkan pemadaman kebakaran sulit dilakukan,
adanya pohon tumbang dan pohon mati yang masih berdiri tegak di atas lahan
gambut juga akan mempersulit pemadaman. Selain itu, pada pembakaran
smoldering, api dapat bertahan lama dan menghasilkan asap tebal. Berdasarkan
pemaparan tersebut, dapat disimpulkan bahwa kebakaran gambut lebih berbahaya
dibandingkan dengan kebakaran non-gambut.
Hingga saat ini, kebakaran hutan ditandai dengan kemunculan titik panas.
Data titik panas telah banyak dikumpulkan oleh berbagai institusi. Sementara itu,
pakar dan praktisi kebakaran hutan menyatakan bahwa titik panas yang muncul
secara berurutan dua hingga tiga hari di lokasi yang sama memiliki potensi yang
tinggi menjadi kebakaran hutan. Oleh karena itu sequential pattern mining dapat
diterapkan untuk mendapatkan pola sekuens dari titik panas untuk identifikasi fire
spot (titik kebakaran).
Penelitian mengenai sequential pattern mining telah dilakukan oleh
Nurulhaq dan Sitanggang (2015). Pada penelitian tersebut, dilakukan penggalian
pola sekuens data titik panas di Provinsi Riau tahun 2000 hingga 2014
menggunakan PrefixSpan. Kemudian, diketahui bahwa pola sekuensial
kemunculan titik panas yang dihasilkan setiap tahun memiliki perbedaan jumlah
pola sekuens dan nilai minimum support yang masih menghasilkan pola sekuens.
Kemunculan titik panas tahun 2013 dan 2014 dapat dianalisis hasil pola
sekuensialnya karena jumlah kemunculan titik panasnya lebih besar dari tahun
lainnya dan menghasilkan pola menarik, yaitu memiliki panjang sekuens hingga 4
item (tahun 2013) dan 3 item (tahun 2014).
Namun, kemunculan titik panas tidak selalu menunjukkan terjadinya
kebakaran hutan. Sehingga petugas kebakaran hutan harus melakukan pengecekan
titik panas ke lapangan untuk mengetahui apakah titik panas tersebut merupakan
kebakaran hutan atau bukan. Hal ini memerlukan waktu dan biaya yang tidak

2
sedikit terutama untuk daerah yang sulit dijangkau. Oleh karena itu, diperlukan
metode validasi pola sekuens kemunculan titik panas yang lebih mudah dan efisien.
Untuk mengamati lokasi, luasan dan dampak dari kebakaran gambut, dapat
dilakukan dengan dukungan teknologi yang dapat memberikan informasi
melingkupi areal yang luas. Salah satunya adalah teknologi remote sensing. Dari
satelit, data lokasi kebakaran, intensitas kebakaran dan luas area terbakar dapat
diketahui dengan mudah dan efektif (Justice et al. 1993). Metode yang dapat
digunakan antara lain dengan mengklasifikasikan data citra satelit. Beberapa
penelitian telah dilakukan antara lain oleh Mitri dan Gitas (2002) menggunakan
model klasifikasi berorientasi objek. Pada penelitian tersebut, dilakukan
klasifikasi citra pesisir Mediterania Spanyol untuk mengetahui area terbakar. Dari
penelitian tersebut, diketahui bahwa total area terbakar dari citra hasil klasifikasi
adalah 6900 ha. Sedangkan data dari Catalan Environmental Department
menyatakan bahwa luas kebakaran adalah 6000 ha. Sehingga akurasi dari
penelitian tersebut mencapai 90%. Sementara itu, Li et al. (2010) melakukan
klasifikasi dengan teori evidence dan pohon keputusan untuk mengklasifikasikan
penggunaan lahan di Yantai Economic and Technological Development Zone.
Klasifikasi dilakukan untuk tiga kelas, yaitu lahan perumahan, lahan hijau, dan
perairan. Akurasi yang didapat dari penelitian tersebut sebesar 90.23%.
Penelitian tentang klasifikasi citra satelit Indonesia juga telah dilakukan
oleh Khaira et al. (2016) yang melakukan deteksi dan prediksi perubahan tutupan
lahan gambut di Provinsi Riau. Penelitian tersebut menggunakan support vector
machine (SVM) untuk mengklasifikasi citra dan Markov Model untuk prediksi.
Dari hasil penelitian diketahui bahwa akurasi klasifikasi SVM adalah 98.2%, serta
diprediksikan pada tahun 2016 lahan non-vegetasi akan berkurang hingga 53%.
Selain itu, Thariqa et.al (2016) melakukan penelitian tentang perbandingan
algoritme pohon keputusan untuk klasifikasi citra satelit Rokan Hilir, Riau.
Algoritme yang dibandingkan adalah C4.5, CART, Spatial Decision Tree (SDT)
dan C5.0. Kemudian diketahui algoritme terbaik untuk klasifikasi citra kebakaran
hutan adalah C5.0 dengan akurasi 99.79% dan SDT dengan akurasi 96.39%.
Adapun jumlah aturan yang dihasilkan dari C5.0 adalah sebanyak 595 sedangkan
aturan yang dihasilkan SDT adalah 11.
Selain algoritme klasifikasi citra yang telah dijabarkan sebelumnya, masih
terdapat banyak algoritme klasifikasi citra lainnya (Lu 2007). Salah satunya yaitu
pendekatan klasifikasi per-piksel yang dapat dilakukan dengan metode maximum
likelihood, minimum distance, artificial neural network, dan decision tree
classifier. Metode-metode tersebut, menggunakan asumsi bahwa data menyebar
normal sedangkan asumsi tersebut tidak selalu dapat dipenuhi. Terutama untuk
citra yang kompleks. Namun, dari keempat metode tersebut, metode maximum
likelihood merupakan metode yang paling banyak digunakan. Metode ini
memiliki kelebihan antara lain robust dan banyak tersedia di hampir seluruh
perangkat lunak pemrosesan citra (Lu 2007). Selain itu, metode maximum
likelihood mengestimasi parameter dalam jumlah yang sedikit, sehingga metode
ini dapat mengklasifikasikan citra dengan sangat cepat (Canty 2010).
Hasil klasifikasi citra satelit dapat digunakan untuk memvalidasi pola
sekuens kemunculan titik panas. Dengan menyamakan hasil klasifikasi citra
dengan pola sekuens titik panas, dapat diidentifikasi pola sekuens titik panas mana

3
yang menjadi kebakaran hutan dan yang tidak. Pola sekuens titik panas yang
menjadi kebakaran hutan disebut dengan fire spot.
Berdasarkan pemaparan tersebut pada penelitian ini, dilakukan penggalian
pola kemunculan titik panas di lahan gambut Kalimantan tahun 2014 dan 2015
menggunakan algoritme PrefixSpan. Hasil pola sekuens kemunculan titik panas
akan dievaluasi menggunakan data citra satelit. Citra satelit diklasifikasikan
menggunakan algoritme pohon keputusan C5.0 dan SDT serta metode maximum
likelihood. Ketiga metode tersebut akan dibandingkan hasil klasifikasinya.
Perumusan Masalah
Hingga saat ini titik panas dijadikan sebagai indikator terjadinya kebakaran
hutan. Data kemunculan titik panas telah banyak dikumpulkan oleh berbagai
institusi. Menurut pakar, kemunculan titik panas yang muncul dua hingga tiga hari
berturut-turut pada tempat yang sama merupakan indikator kuat terjadinya
kebakaran hutan. Untuk mengetahui urutan kemunculan titik panas, dapat
dilakukan penggalian pola sekuens titik panas. Namun, kemunculan titik panas
bukan berarti pasti terjadi kebakaran. Oleh karena itu, pola sekuens kemunculan
titik panas perlu dievaluasi untuk mengidentifikasi fire spot. Evaluasi pola sekuens
kemunculan titik panas biasanya dilakukan dengan melakukan validasi langsung
ke lapangan. Namun, cara tersebut membutuhkan biaya dan waktu yang tidak
sedikit. Sehingga dibutuhkan metode identifikasi fire spot yang mudah dan efisien,
yaitu melalui citra satelit. Citra satelit diklasifikasi sehingga diketahui piksel
terbakar dan tidak. Kemudian hasil klasifikasi citra satelit, digunakan untuk
mengevaluasi pola sekuens titik panas. Dari rumusan masalah tersebut, muncul
pertanyaan penelitian bagaimana cara mengidentifikasi fire spot berdasarkan pola
sekuens titik panas dan klasifikasi citra satelit untuk area yang terbakar?
Tujuan Penelitian
Tujuan dari penelitian ini adalah:
1 Mendapatkan pola sekuens kemunculan titik panas menggunakan algortime
PrefixSpan.
2 Menerapkan model klasifikasi pohon keputusan C5.0 dan SDT pada data citra
satelit dari penelitian Thariqa et.al (2016) untuk mengklasifikasikan area
terbakar.
3 Menerapkan metode maximum likelihood pada data citra satelit untuk
mengklasifikasikan area terbakar.
4 Identifikasi fire spot berdasarkan pola sekuens titik panas dan hasil klasifikasi
area terbakar.
Manfaat Penelitian
Pada masa yang akan datang, penelitian ini dapat mengidentifikasi pola
sekuens yang berpotensi menjadi kebakaran hutan sehingga dapat mencegah
terjadinya kebakaran hutan.

4
Ruang Lingkup Penelitian
Ruang lingkup penelitian yang dilakukan meliputi:
1 Data kemunculan titik panas tahun 2014 dan 2015 yang diperoleh dari satelit
Moderate Resolution Imaging Spectrometer National Aeronautics and Space
Administration (MODIS NASA) dan Kementrian Lingkungan Hidup dan
Kehutanan (KLH) untuk menentukan pola sekuens titik panas.
2 Data citra yang digunakan merupakan data citra Landsat 7 Kalimantan dari
United States Geological Survey (USGS). Data citra yang diambil disesuaikan
waktu dan tempatnya dengan pola sekuens yang dihasilkan. Kemudian, data
citra diambil bagian lahan gambut saja.
3 Data batas wilayah yang digunakan merupakan data yang diperoleh dari Badan
Pusat Statistik.

TINJAUAN PUSTAKA
Sequential Pattern Mining
Sequential pattern mining adalah penggalian pola sekuensial atau
subsekuens yang sering muncul atau frekuen (Han et al. 2012). Pola sekuens yang
memiliki nilai support melebihi nilai minimum support disebut pola yang frekuen.
Nilai minimum support tersebut biasanya ditetapkan oleh user. Melalui nilai
minimum support ini, pola-pola yang kurang menarik dapat diabaikan sehingga
proses mining menjadi lebih efisien (Zhao dan Bhowmick 2003). Sequential
pattern mining bertujuan menemukan korelasi yang menarik, pola yang sering
muncul, serta asosiasi diantara set item dalam basis data (Zhao dan Bhowmick
2003). Hasil dari proses sequential pattern mining dapat mendeskripsikan suatu
data atau memprediksi data berikutnya. Algoritme yang dapat digunakan untuk
sequential pattern mining diantaranya algoritme apriori, AprioriAll, AprioriSome,
DynamicSome, GSP, SPADE, FreeSpan, PrefixSpan, MEMISP dan SPIRIT (Zhao
dan Bhowmick 2003).
Algoritme PrefixSpan adalah algoritme yang lebih efisien dibandingkan
GSP dan Apriori (Zhao dan Bhowmick 2003). Pada algoritme PrefixSpan,
dilakukan pembacaan basis data sekuensial untuk mendapatkan sekuens dengan
panjang-1. Kemudian basis data sekuensial dibagi menjadi beberapa partisi
berdasarkan banyaknya sekuens dengan panjang-1 masing-masing partisi adalah
proyeksi dari basis data sekuensial yang sesuai dengan sekuens panjang-1 sebagai
prefix. Basis data proyeksi hanya berisi postfix dari sekuens, dengan membaca
basis data proyeksi, didapat sekuens panjang-2 yang memiliki parent sekuens
panjang-1 sebagai prefix. Langkah tersebut dilakukan secara rekursif, sampai basis
data proyeksi kosong atau tidak ada sekuens dengan panjang-k yang frekuen (Zhao
dan Bhowmick 2003). Gambar 1 merupakan pseudo code dari algoritme
PrefixSpan. Gambar 2 merupakan ilustrasi langkah penggalian pola sekuens
dengan menggunakan PrefixSpan (Zhao dan Bhowmick 2003).

5
Algoritme 1 (PrefixSpan)
Masukan : Database sekuensial S, min_support
Luaran : Himpunan lengkap pola sekuensial
Metode : PrefixSpan( ,0,S)
Parameter : (1) α adalah pola sekuensial; (2) l adalah panjang dari α;(3)
S|α adalah proyeksi database α
Prosedur PrefixSpan (α, l, S|α ):
1) Pindai S|α satu kali, dapatkan semua item berulang b, sedemikian
sehingga:
a) b dapat diletakkan pada elemen terakhir dari α untuk membentuk
pola sekuensial.
b) dapat diletakkan di belakang α untuk membentuk pola
sekuensial.
2) Untuk setiap item berulang b, letakkan b di belakang α untuk
membentuk pola sekuensial α' dan menghasilkan α'.
3) Untuk setiap α' , bangunlah proyeksi database α' S|α'.
4) PrefixSpan (α' , l+1, S|α').

Gambar 1 Algoritme PrefixSpan (Pei et al. 2014)

Gambar 2 Langkah penggalian pola dengan PrefixSpan (Zhao dan Bhowmick
2003)
PrefixSpan telah digunakan menganalisa data titik panas kebakaran hutan
pada penelitian Nurulhaq dan Sitanggang (2015). Pada penelitian tersebut
dilakukan penentuan pola sekuensial pada data set tahun 2000 sampai 2014 dan
data semua tahun (2000 – 2014). Kemudian dihasilkan pola sekuens kemunculan
titik panas dengan jumlah untuk setiap data set dan minimum support
menggunakan algoritme PrefixSpan yang dapat dilihat pada Tabel 1 (Nurulhaq
dan Sitanggang 2015).
Dari Tabel 1 dapat disimpulkan bahwa data set yang masih menghasilkan
pola sekuensial kemunculan titik panas dengan nilai minimum support terbesar
adalah tahun 2013 saat minimum support bernilai 26%. Diikuti dengan data tahun
2000 dan 2014. Data tahun 2014 menghasilkan pola sekuensial hingga minimum
support 21%. Selain itu berdasarkan penelitian Nurulhaq dan Sitanggang (2015),
data tahun 2014 masih menghasilkan pola sekuensial dengan panjang 2 item saat

6
minimum support 5%. Adapun presentase titik panas yang menjadi indikator
kebakaran hutan pada tahun 2013 adalah sebesar 8.88% sedangkan pada tahun
2014 sebesar 16.95%. Dari penjelasan tersebut, didapat kesimpulan bahwa
kemunculan titik panas tahun 2013 dan 2014 dapat dianalisis hasil pola
sekuensialnya karena jumlah kemunculan titik panasnya lebih besar dari tahun
lainnya dan menghasilkan pola menarik. Selain itu, nilai minimum support yang
masih menghasilkan pola sekuensial pun cukup tinggi dibandingkan dengan tahun
lainnya.
Tabel 1 Jumlah pola sekuensial kemunculan titik panas tahun 2000-2014
(Nurulhaq dan Sitanggang 2015)

2000

2001

2002

2003

2004

2005

2006

2007

2008

2009

2010

2011

2012

2013

2014

2000-2014

Data set (tahun)

17
13
10
10
6
6
4
3
3
3
2
2
2
2
2
2
2
2
2
2
1
1
1
1
0
0
0

45
20
13
9
6
5
3
3
3
2
2
2
2
2
1
1
1
0
0
0
0
0
0
0
0
0
0

52
29
16
13
8
7
4
2
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

53
26
12
8
6
6
3
3
2
2
2
2
2
2
1
0
0
0
0
0
0
0
0
0
0
0
0

59
23
12
8
6
5
4
2
2
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0

114
43
24
18
11
7
3
2
2
2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

53
22
14
9
7
4
2
2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

40
18
13
7
3
3
2
2
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

39
17
12
9
6
4
3
3
2
2
2
2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

61
28
18
9
5
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

39
18
8
3
2
2
2
2
2
2
2
2
2
2
1
1
1
1
1
0
0
0
0
0
0
0
0

43
19
10
6
4
3
2
2
2
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0

42
19
12
11
10
4
2
2
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0

71
35
20
18
12
8
7
5
5
4
4
3
2
2
1
1
1
1
1
1
1
1
1
1
1
1
0

137
56
30
21
15
11
10
7
4
4
3
2
2
1
1
1
1
1
1
1
1
0
0
0
0
0
0

79
13
3
2
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

minsup
(%)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

Penelitian ini bertujuan memverifikasi pola sekuens titik panas di lahan
gambut Kalimantan. Sedangkan penelitian Nurulhaq dan Sitanggang (2015)
menggunakan data hutan gambut dan non-gambut di Provinsi Riau. Oleh karena
itu, pola sekuens titik panas tahun 2014 dan 2015 di lahan gambut Kalimantan
akan dibangkitkan. Pembangkitan pola sekuens pada penelitian ini akan
menggunakan algoritme yang sama dengan penelitian Nurulhaq dan Sitanggang
(2015) yaitu algoritme PrefixSpan.

7
Citra Satelit
Citra satelit merupakan citra yang dihasilkan dari pemotretan menggunakan
satelit. Gambar 3 merupakan contoh dari citra satelit, yaitu citra kebakaran hutan
di Riau pada 17 Februari 2014.
Salah satu satelit yang digunakan untuk penginderaan jarak jauh adalah Land
Satellite (Landsat). Landsat merupakan program tertua dalam perangkat observasi
bumi (Rastermaps 2014). Satelit Landsat terdiri atas beberapa seri yaitu Landsat1, Landsat-2 diteruskan 3, 4 hingga 8. Satelit Landsat yang paling baru adalah
Landsat 7 dan 8.

Gambar 3 Citra kebakaran hutan di Riau tahun 2014 (Terra Image 2014 [terraimage.com])
Citra Landsat 7 sejak 31 Mei 2003 memiliki gap (USGS 2013). Hal ini
disebabkan Scan Line Corrector (SLC) yang membuat Landsat 7 menscan
berurutan ke depan, mengalami kerusakan (USGS 2013). Usaha perbaikan SLC
yang dilakukan tidak berhasil sehingga kerusakan SLC bersifat permanen. Tanpa
SLC, Landsat 7 melakukan scanning secara zig-zag. Akibatnya, area yang
tergambar diduplikasi dengan lebar yang meningkat ke tepi scene citra. Gambar 4
merupakan ilustrasi kerusakan SLC (USGS 2013).

Gambar 4 Ilustrasi kerusakan SLC (USGS 2013)
Walaupun citra satelit Landsat 7 hanya tinggal 78% dari keseluruhan
pikselnya, data citra satelit ini masih menjadi citra yang paling akurat sedunia, baik

8
secara radiometrik maupun geometrik (USGS 2013). Oleh karena itu, citra Landsat
7 masih banyak digunakan dalam penelitian. Untuk mendapatkan 22% piksel yang
hilang akibat kerusakan SLC, dapat dilakukan dengan mengisi gap (gap filling).
Pengisian gap dilakukan dengan menggunakan file SLC-off gap mask yang
disertakan pada setiap data citra Landsat 7. File gap mask ini membantu pengguna
mengidentifikasi lokasi piksel yang dipengaruhi oleh data asli dalam scene SLCoff (USGS 2013). Kemudian perhitungan aproksimasi nilai piksel untuk mengisi
gap dilakukan dengan menggunakan perangkat lunak, salah satunya QGIS.
Pohon Keputusan
Pohon keputusan adalah sebuah struktur pohon, dimana setiap node pada
pohon merepresentasikan atribut, setiap cabang merepresentasikan nilai atribut,
dan node daun (leaf) merepresentasikan kelas tertentu (Han et al. 2012). Level
node teratas dari sebuah pohon keputusan adalah node akar (root) yang biasanya
berupa atribut yang paling memiliki pengaruh terbesar pada suatu kelas tertentu.
Pada umumnya, pohon keputusan melakukan strategi pencarian secara top-down
untuk solusinya. Pada proses mengklasifikasi data uji, nilai atribut akan diuji
dengan cara membaca pohon dari node akar (root) sampai node akhir (daun) dan
kemudian akan diprediksi kelas yang dimiliki oleh suatu data tersebut. Gambar 5
merupakan contoh dari pohon keputusan (Han et al. 2012).

Gambar 5 Contoh pohon keputusan (Han et al. 2012)
Klasifikasi citra satelit adalah metode pemberian label atau kelas pada setiap
piksel citra berdasarkan karakteristik spektral pada berbagai bands (Sharma et al.
2013). Beberapa penelitian tentang klasifikasi citra satelit telah dilakukan
diantaranya adalah penelitian Otukei dan Blaschke (2010) yang membandingkan
algoritme pohon keputusan, maximum likelihood dan support vector machine
(SVM) untuk mengklasifikasikan citra Landsat TM dan ETM+. Dari penelitian
tersebut diketahui algoritme klasifikasi yang paling baik adalah pohon keputusan.
Punia et al. (2011) juga menggunakan C5.0 untuk mengklasifikasikan data IRSP6 AWiFS dan mendapatkan akurasi yang tinggi. Berdasarkan penelitian tersebut,
pohon keputusan merupakan metode yang baik untuk klasifikasi citra satelit.
Pada pembangunan pohon keputusan, dibutuhkan supervised training, oleh
karena itu dibutuhkan data yang mengandung variabel respon dan penjelas. Pada
kasus klasifikasi citra satelit, variabel respon adalah kelasnya sedangkan variabel

9
penjelas adalah spectral bands atau informasi yang diturunkan dari spectral bands
(Sharma et al. 2013). Pohon keputusan diestimasi menggunakan data training
yang diolah dengan prosedur statistik. Informasi (entropi) yang didapat dari sistem
dapat dihitung dengan Persamaan 1 (Han et al. 2012).
Info D = − ∑m
i=1 pi log2 (pi )

(1)

dengan pi adalah peluang data latih � termasuk ke kelas Ci dan diduga
dengan |Ci,D|/|D|. Log basis dua digunakan karena informasi dikodekan dalam bit,
yaitu nol dan satu. Misalkan, data latih D dipecah berdasarkan atribut A yang
mempunyai v nilai berbeda {a1, a2,....,av}. Informasi yang didapat setelah
pemecahan tersebut dapat dihitung dengan Persamaan 2 (Han et al. 2012).
|D |

j
InfoA D = ∑vj=1 |D| × info(Di )

(2)

Informasi yang didapat dengan memecah data latih berdasarkan atribut A
dapat dihitung dengan Persamaan 3 (Han et al. 2012).
Gain(A)=info(D) − infoA (D)

(3)

Nilai Gain(A) menginformasikan seberapa besar informasi yang didapat
setelah memecah data latih berdasarkan atribut A. Maka, atribut A dengan nilai
gain tertinggi dipilih sebagai atribut “pemecah” pada node N.
Terdapat beberapa algoritme dalam pohon keputusan antara lain pohon
keputusan spasial (SDT), Classification and Regression Trees (CART), algoritme
C5.0, dan algoritme C4.5. Pada penelitian Thariqa et.al (2016), dilakukan
perbandingan keempat algoritme tersebut. Tabel 2 merupakan hasil perbandingan
keempat algortime pohon keputusan (Thariqa et.al 2016)
Tabel 2 Perbandingan hasil algortime klasifikasi (Thariqa et.al 2016)
Akurasi
Jumlah
Ukuran
Algoritme
(%)
aturan
Pohon
C4.5
98.89
1681
3362
CART
95.67
8
15
C5.0
99.79
595
1603
SDT
96.39
11
20
Dari Tabel 2 diketahui bahwa algortime C5.0 memiliki akurasi terbaik yaitu
99.79%. Namun ukuran pohon yang dihasilkan algoritme C5.0 berukuran sangat
besar, aturan yang dihasilkan pun cukup banyak yaitu sebanyak 595 aturan
sehingga kurang efisien. Berikut adalah contoh aturan yang dihasilkan algoritme
C5.0:
1 IF Band7 ≤ 13 DAN Band4 > 48 DAN Band2 ≤ 0 MAKA Sebelum Terbakar
2 IF Band7 > 16 DAN Band7 ≤ 18 DAN Band2 ≤ 0 MAKA Sebelum Terbakar

10
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

IF Band7 > 19 DAN Band7 ≤ 21 DAN Band4 > 37 DAN Band2 ≤ 42 MAKA
Sebelum Terbakar
IF Band7 > 24 DAN Band7 ≤ 27 DAN Band4 > 37 DAN Band2 ≤ 42
MAKA Sebelum Terbakar
IF Band7 > 22 DAN Band7 ≤ 28 DAN Band4 > 48 DAN Band2 ≤ 42 MAKA
Sebelum Terbakar
IF Band7 > 49 DAN Band7 ≤ 51 DAN Band4 > 35 DAN Band4 ≤ 54 DAN
Band2 ≤ 49 MAKA Setelah Terbakar
IF Band7 > 49 DAN Band7 ≤ 54 DAN Band4 > 37 DAN Band4 ≤ 54 DAN
Band2 ≤ 49 MAKA Setelah Terbakar
IF Band7 > 49 DAN Band7 ≤ 56 DAN Band4 > 40 DAN Band4 ≤ 54 DAN
Band2 ≤ 49 MAKA Setelah Terbakar
IF Band7 > 49 DAN Band7 ≤ 57 DAN Band4 > 41 DAN Band4 ≤ 54 DAN
Band2 ≤ 49 MAKA Setelah Terbakar
IF Band7 > 49 DAN Band7 ≤ 59 DAN Band4 > 43 DAN Band4 ≤ 54 DAN
Band2 ≤ 49 MAKA Setelah Terbakar
IF Band7 > 60 DAN Band4 > 32 DAN Band4 ≤ 33 MAKA Terbakar
IF Band7 > 60 DAN Band4 > 41 DAN Band4 ≤ 42 DAN Band2 ≤ 49 MAKA
Terbakar
IF Band7 > 60 DAN Band4 ≤ 45 DAN Band2 > 14 DAN Band2 ≤ 16
MAKA Terbakar
IF Band7 > 62 DAN Band4 ≤ 47 DAN Band2 > 14 DAN Band2 ≤ 16 MAKA
Terbakar
IF Band7 > 63 DAN Band4 ≤ 49 DAN Band2 > 14 DAN Band2 ≤ 16 MAKA
Terbakar
IF Band7 ≤ 84 DAN Band4 > 42 DAN Band2 > 82 MAKA Non Gambut
IF Band7 ≤ 79 DAN Band4 > 42 DAN Band2 > 75 MAKA Non Gambut
IF Band7 ≤ 85 DAN Band2 > 84 MAKA Non Gambut
IF Band7 ≤ 88 DAN Band2 > 85 MAKA Non Gambut
IF Band7 ≤ 95 DAN Band2 > 88 MAKA Non Gambut

Sementara itu SDT memiliki akurasi yang cukup baik yaitu 96.39% dan
menghasilkan aturan sebanyak 11. Berikut 11 aturan yang dihasilkan dari
algoritme SDT:
1 JIKA Band4 > 54 DAN 13 < Band7 ≤ 51 MAKA Sebelum Terbakar
2 JIKA Band4 > 70 DAN Band7 > 51 MAKA Sebelum Terbakar
3 JIKA Band4 > 54 DAN Band7 ≤ 13 MAKA Sebelum Terbakar
4 JIKA Band4 ≤ 54 DAN Band7 ≤ 41 DAN Band2 ≤ 49 MAKA Sebelum
Terbakar
5 JIKA 50 < Band4 ≤ 70 DAN 51 < Band7 ≤ 79 MAKA Setelah Terbakar
6 JIKA Band4 ≤ 43 DAN 41 < Band7 ≤ 66 MAKA Setelah Terbakar
7 JIKA 43 < Band4 ≤ 54 DAN 41 < Band7 ≤ 66 DAN MAKA Setelah Terbakar

11
8
9
10
11

JIKA 54 < Band4 ≤ 70 DAN Band7 > 79 MAKA Terbakar
JIKA Band4 ≤ 54 DAN Band7 > 66 MAKA Terbakar
JIKA Band4 ≤ 43 DAN 54 < Band7 ≤ 66 MAKA Terbakar
JIKA Band4 ≤ 54 DAN Band7 ≤ 41 DAN Band2 > 49 MAKA Non Gambut

Aturan yang dihasilkan algoritme C5.0 dan SDT dapat mengklasifikasikan
citra ke dalam kelas sebelum terbakar, terbakar, setelah terbakar dan non-gambut
berdasarkan band citra. Aturan yang dihasilkan berupa kalimat jika-maka. Berikut
adalah contoh cara membaca aturan pohon keputusan “jika Band4 bernilai lebih
dari 54 dan Band7 bernilai antara 13 hingga 51 maka area tersebut termasuk
kedalam kelas sebelum terbakar”.
Aturan dari algoritme C5.0 dan SDT yang dihasilkan penelitian Thariqa et.al
(2016) inilah yang akan digunakan dalam mengklasifikasikan citra satelit lahan
gambut di Kalimantan pada penelitian ini.
Pohon Keputusan Spasial
Pada SDT, klasifikasi dipandang sebagai penyusunan objek menggunakan
atributnya (nilai non-spasial) dan atribut tetangganya (Zeitouni et al. 2001). Pada
dataset spasial terdapat autokorelasi, berbeda dengan pohon keputusan tradisional
yang menganggap data terdistribusi secara identik. Karena itu, untuk menentukan
pembagian pohon keputusan, algoritme ini menghitung spatial information gain
(SIG) yang terdiri atas information gain dan neighborhood split autocorrelation
ratio (NSAR). Persamaan 4 digunakan untuk menghitung nilai NSAR dari data
ke-i (Jiang et al. 2012):
NSARi =

Г' i
Гi

(4)

dimana Гi dan Г’i adalah nilai gamma lokal dari data ke-i sebelum dan
sesudah split. Nilai gamma lokal dapat dihitung dengan menggunakan Persamaan
5 (Jiang et al 2012):
Гi = ∑j ai,j bi,j = ∑j ωi,j δi,j = ci

(5)

dimana i, j adalah indeks data; ai,j, bi,j adalah kemiripan spasial dan kelas
yang kemudian direpresentasikan dengan W-matriks �i,j dan �i,j fungsi indikator.
Nilai NSAR yang digunakan pada SIG adalah nilai NSAR dari semua sampel.
Persamaan 6 adalah rata-rata dari nilai NSAR (Jiang et al 2012):
̅̅̅̅̅̅̅̅
NSAR=

1
m

∑m
i=1 NSARi

(6)

dimana i adalah indeks dari sampel yang bernilai 1 sampai m (m adalah
banyaknya data). Nilai SIG, dapat dihitung dengan Persamaan 7 (Jiang et al 2012):
SIG= 1 − α IG+ α ̅̅̅̅̅̅̅̅
NSAR

dimana α adalah parameter penyeimbang.

(7)

12

Pohon Keputusan C5.0
Algoritme C5.0 merupakan perbaikan dari C4.5. C5.0 lebih baik dari C4.5
dalam hal kecepatan, efisiensi penggunaan memori, ukuran pohon keputusan dan
kesalahan klasifikasi (Pandya 2015). Pada algoritme C5.0, data latih awal
dianggap sebagai node root dari pohon keputusan, kemudian dihitung setiap gain
ratio setiap atribut. Untuk menghitung entropi informasi, digunakan Persamaan 8
(Zhai et al. 2012).
E S = − ∑m
i=1 pi log2 (pi )

(8)

dimana S set data yang terdiri atas n data sampel. C adalah kategori atribut
n
yang memiliki m nilai berbeda. pi adalah proporsi yang bisa dihitung dengan pi = |s|i ,
ni adalah jumlah data yang termasuk kelas ke-i ke-i dan |s| adalah banyaknya data
pada data set S (maka |s|=n).
Untuk menghitung entropi bersyarat atribut A digunakan persamaan 9 (Zhai
et al. 2012).
E S|A = − ∑vj=1 pj ' ∑m
i=1 pij log2 (pij )

(9)

dimana pj’ adalah proporsi yang dapat dihitung dengan

m
' |sj | ∑i nij
; pij
pj = =
n
s

nij

adalah peluang bersyarat yang dapat dihitung dengan pij = ; dan |Sj| adalah
|sj |
jumlah data dengan atribut A. Maka, nilai gain dari atribut A dapat dihitung dengan
Persamaan 10 (Zhai et al. 2012).
Gain A =E A − E(S|A)

(10)

Nilai gain ratio dari atribut A dihitung dengan Persamaan 11 (Zhai et al.
2012).
Gain Ratio A =

Gain(A)
Splitl(A)

(11)

dimana Spiltl A = − ∑vj=1 pj ' log2 p'j . Algoritme C5.0 memecah data latih
berdasarkan atribut yang memiliki nilai informasi gain terbesar. Prosedur split
terus dilakukan hingga tidak ada lagi subset data yang dapat di-split.

Maximum Likelihood Classifier
Klasifikasi citra satelit dengan pendekatan klasifikasi per-piksel yang dapat
dilakukan dengan metode maximum likelihood, minimum distance, artificial
neural network, dan decision tree classifier (Lu 2007). Metode-metode tersebut,
menggunakan asumsi bahwa data menyebar normal sedangkan asumsi tersebut
tidak selalu dapat dipenuhi. Terutama untuk citra yang kompleks. Namun, dari

13
keempat metode tersebut, metode maximum likelihood merupakan metode yang
paling banyak digunakan. Metode ini memiliki kelebihan antara lain robust dan
banyak tersedia di hampir seluruh perangkat lunak pemrosesan citra (Lu 2007).
Selain itu, metode maximum likelihood mengestimasi parameter dalam jumlah
yang sedikit, sehingga metode ini dapat mengklasifikasikan citra dengan sangat
cepat (Canty 2010).
Metode maximum likelihood didasarkan pada teori peluang Bayes.
Persamaan teori Bayes disajikan pada Persamaan 12 (Canty 2010).

Pr k|g =

p g|k Pr(k)

(12)

p(g)

dimana Pr(k), k=1,2,...,K adalah peluang prior, p(g|k) adalah fungsi densitas
peluang per-kelas, dan p(g) dihitung dengan Persamaan 13 (Canty 2010).
Pr k|g = ∑Kj=1 p g|j Pr(j)

(13)

Karena p(g) adalah independen dari k, maka rule decision-nya adalah:
klasifikasikan g ke kelas k jika p g|k Pr(k) ≥ p g|j Pr(j) untuk j=1,2,...,K (Canty
2010). Dengan asumsi data terdistribusi normal, didapat fungsi diskriminan pada
Persamaan 14 (Canty 2010).
dk g = log Pr k

1

1

T

− log|Σk | − (g − μk ) Σ-1
k (g − μk )
2
2

(14)

Sehingga, maximum likelihood classifier-nya adalah sebagai berikut
klasifikasikan g ke kelas k jika dk g ≥ dj g untuk j=1,…,k

(15)

Tahapan klasifikasi dengan maximum likelihood adalah, parameter
diestimasi dari data latih terlebih dahulu. Kemudian tahapan berikutnya secara
umum hanya mengaplikasikan Persamaan 15 ke setiap piksel citra. Dalam
penelitian ini, setiap piksel citra akan dikelaskan ke dalam dua kelas, yaitu kelas
terbakar dan tidak terbakar.
Majority Filter
Filtering adalah proses dimana setiap nilai piksel dalam peta raster diganti
dengan nilai baru yang memenuhi kondisi atau sekumpulan kondisi (ITC-ILWIS
2001). Nilai baru ini diperoleh dengan menerapkan beberapa fungsi pada setiap
piksel dan tetangganya. Terdapat beberapa tipe filter salah satunya adalah majority
filter. Majotiry filter menghitung nilai atau nama kelas dari piksel yang sering
muncul. Ketika menggunakan filter berukuran 3×3, majority filter menggunakan
perhitungan 8-connected (ITC-ILWIS 2001). Ilustrasi 8-connected dapat dilihat
pada Gambar 6. Jendela perhitungan (calculation window) mulai di piksel
pertama pada baris pertama. Hasil jendela perhitungan tersebut kemudian
disimpan pada piksel tengah. Setelah itu, jendela perhitungan pindah ke piksel

14
kedua di baris pertama, perhitungan diulangi hingga jendela perhitungan
berpindah ke keseluruhan piksel.

Gambar 6 Ilustrasi 8-connected neighbourhood
Gambar 7 merupakan ilustrasi hasil dari perhitungan majority filter. Dari
Gambar 7 dapat dilihat bahwa terdapat beberapa piksel yang berubah nilainya
sesuai dengan piksel tetangganya yang sering muncul. Majority filter ini dapat
digunakan untuk mengurangi sebagian besar variasi dalam kelas atau nilai piksel
tetangga.

Gambar 7 Ilustrasi perhitungan majority filter

METODE
Area Studi
Kalimantan merupakan salah satu pulau di Indonesia yang memiliki luas 544
150 m2. Kalimantan terdiri dari lima provinsi, yaitu Kalimantan Barat, Kalimantan
Tengah, Kalimantan Selatan, Kalimantan Timur dan Kalimantan Utara.
Kalimantan memiliki lahan gambut seluas 4 778 004 ha yang merupakan lahan
gambut terluas kedua di Indonesia setelah Sumatera. Persebaran lahan gambut di
Kalimantan, paling banyak berada di Kalimantan Tengah dengan luas 2 664 438
ha, kemudian Kalimantan Barat 1 046 438 ha, Kalimantan Timur 332 365 ha, dan
Kalimantan Selatan 106 271 ha.
Data Penelitian
Penelitian ini menggunakan data citra satelit Landsat 7, data peta lahan
gambut, data peta batas wilayah dan data titik panas. Untuk menentukan pola

15
sekuens kemunculan titik panas, digunakan data titik panas tahun 2014 dan 2015
dari MODIS NASA dan KLH. Data titik panas tersebut dipilih yang memiliki nilai
confidence lebih dari sama dengan 70%. Data yang digunakan untuk proses
klasifikasi adalah citra Landsat 7 dengan resolusi spasial 30 × 30 m. Lokasi citra
yang dipilih merupakan kabupaten yang banyak terdapat pola sekuens titik panas
yang muncul. Kabupaten tersebut antara lain Kabupaten Pulang Pisau dan
Palangkaraya, Provinsi Kalimantan Tengah serta Pontianak, Kalimantan Barat.
Tanggal akusisi citra disesuaikan dengan tanggal kemunculan sekuens dan
ketersediaan citra di USGS, yaitu tanggal 14 Oktober 2015 dan 8 September 2015.
Peta lahan gambut Kalimantan tahun 2002 dengan resolusi dengan skala 1:250 000
digunakan untuk mengetahui letak tutupan lahan gambut yang terdapat pada citra
satelit Landsat. Peta lahan gambut berupa poligon diperoleh dari Wetlands
International. Adapun peta batas wilayah Kalimantan dari BPS tahun 2013
digunakan untuk mengetahui desa, kecamatan, kabupaten dan provinsi dari
sekuens yang dihasilkan.
Perangkat lunak yang digunakan pada penelitian ini meliputi:
 R digunakan untuk proses klasifikasi,
 Ilwis 3.8.3 digunakan untuk praproses citra satelit,
 QGIS digunakan untuk pemroses citra satelit,
 PostgreSQL 9.1 digunakan untuk mengelola data spasial
Perangkat keras dengan spesifikasi:
 Processor Intel Core i5-4200U,
 RAM 4 GB, dan
 HDD 500 GB
Tahapan Penelitian
Pada penelitian ini, terdapat tiga bagian besar yang dilakukan yaitu
menentukan pola sekuens kemunculan titik panas tahun 2014 dan 2015 dengan
PrefixSpan, klasifikasi citra satelit, kemudian mengidentifikasi fire spot. Langkah
penelitian digambarkan dalam Gambar 8.
Mulai

Penentuan pola sekuens tahun
2014-2015 dengan PrefixSpan

Data tanggal
dan lokasi

Klasifikasi citra satelit
Kalimantan 2015

Citra hasil
klasifikasi

Pola sekuens
titik panas

Identifikasi fire spot

Fire spot

Gambar 8 Tahapan penelitian

16
Penentuan Pola Sekuensial dengan Algoritme PrefixSpan
Tahap penentuan pola sekuens kemunculan titik panas tahun 2014 dan 2015
dengan PrefixSpan digambarkan pada Gambar 9.

Mulai

Praproses
data

Data titik panas

Selesai

Penentuan pola
sekuensial dengan
algoritme PrefixSpan

Pola sekuensial
data titik panas

Gambar 9 Tahapan penentuan pola sekuens titik panas tahun 2014 dan 2015
dengan algoritme PrefixSpan
1 Praproses Data
Pada tahap praproses data, dilakukan seleksi data, pembersihan data,
transformasi data, dan pembuatan data sekuensial. Seleksi data bertujuan
memilih atribut yang akan digunakan dalam penelitian, yaitu longitude, latitude
dan tanggal kemunculan. Selain itu, pada seleksi data, data titik panas dipilih
yang berada pada lahan gambut Kalimantan dan memiliki nilai confidence lebih
dari sama dengan 70%. Transformasi data bertujuan mengubah tipe atribut dan
penyimpanan data dalam format Excel (.xls) atau comma separated values
(.csv). Pembuatan data sekuensial dilakukan dengan mengurutkan data
berdasarkan atribut longitude, latitude, dan tanggal.
2 Penentuan Pola Sekuensial dengan Algoritme PrefixSpan
Data sekuens hasil praproses kemudian dicari pola sekuensnya dengan
algoritme PrefixSpan menggunakan perangkat lunak SPMF. PrefixSpan
menerapkan pendekatan divide dan conquer. Pendekatan ini secara rekursif
akan memproyeksi basis data menjadi sekumpulan basis data yang lebih kecil
berdasarkan pola berulang saat itu, lalu proyeksi tersebut digali untuk
memperoleh polanya. PrefixSpan akan memproyeksi prefiksnya saja sehingga
ukuran proyeksi database akan semakin menyusut dan redundansi pemeriksaan
pada setiap posisi yang mungkin dari sebuah kandidat potensial pun akan
tereduksi (Pei et al. 2004).
Klasifikasi Citra Satelit
Pada tahap ini akan dilakukan klasifikasi citra satelit menggunakan
algoritme C5.0, SDT dan maximum likelihood. Tahapan klasifikasi citra
digambarkan pada Gambar 10.
1 Praproses citra
Pada tahap ini dilakukan pengisian gap, proses kombinasi band, dan
proses subset citra. Pengisian gap dilakukan dengan tujuan mengisi bagian citra
yang nilai pikselnya tidak mempunyai nilai. Pengisian gap menggunakan gap
mask untuk mengetahui lokasi piksel yang harus diisi. Sedangkan perhitungan
nilai untuk mengisi pikselnya dilakukan dengan menggunakan perangkat lunak
QGIS. Proses kombinasi band bertujuan mendapatkan warna RGB dari citra.

17
Warna R direpresentasikan dengan band 7, G direpresentasikan dengan band 4
dan B direpresentasikan dengan band 2. Citra satelit dipilih atau dipotong
bagian yang merupakan lahan gambut serta bersih dari awan untuk mel