Multidimensional association rules mining untuk data kebakaran hutan menggunakan algoritme fp-growth dan eclat

MULTIDIMENSIONAL ASSOCIATION RULES MINING
UNTUK DATA KEBAKARAN HUTAN MENGGUNAKAN
ALGORITME FP-GROWTH DAN ECLAT

NUKE ARINCY

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Multidimensional
Association Rules Mining untuk Data Kebakaran Hutan Menggunakan Algoritme
FP-Growth dan ECLAT benar karya saya dengan arahan dari komisi pembimbing
dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun.
Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun
tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan
dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, November 2014
Nuke Arincy
NIM G64124054

ABSTRAK
NUKE ARINCY. Multidimensional Association Rules Mining untuk Data
Kebakaran Hutan Menggunakan Algoritme FP-Growth dan ECLAT. Dibimbing
oleh IMAS SUKAESIH SITANGGANG.
Bencana kebakaran hutan dan lahan merupakan permasalahan serius yang
harus dihadapi bangsa Indonesia khususnya Provinsi Riau. Salah satu upaya
pencegahan kebakaran hutan yaitu dengan mempelajari pola keterkaitan antar
kejadian titik panas (hotspot) dengan karakteristik objek geografis terdekat titik
panas. Tujuan penelitian ini adalah menerapkan metode aturan asosiasi
multidimensi dengan algoritme Frequent Pattern Growth (FP-Growth) dan
algoritme Equivalence Class Transformation (ECLAT) untuk menentukan pola
keterkaitan antara kemunculan titik panas dan faktor-faktor pendukungnya.
Sebagai bahan penentuan faktor kemunculan titik panas penelitian ini
menggunakan minimum support 30% dan minimum confidence 80% dengan

variabel target yaitu terjadinya titik panas. Hasil penelitian menunjukkan bahwa
hubungan yang kuat antara terjadinya titik panas dan pengaruh faktor yang
ditemukan dengan support terbesar 44.49%, confidence 100%, dan lift 1.02. Titik
panas terjadi umumnya pada daerah yang memiliki curah hujan lebih besar atau
sama dengan 3 mm/hari.
Kata Kunci: ECLAT , FP-Growth, hotspot, multidimensional association rules

ABSTRACT
NUKE ARINCY. Multidimensional Association Rules Mining for Forest Fires
Data Using FP-Growth and ECLAT Algorithm. Supervised by IMAS SUKAESIH
SITANGGANG.
Forest fires and land are a serious problem that must be solved by the
Indonesian government including Riau Province. One of forest fires prevention
effort is learning relationship patterns of hotspot occurences as fire indicators with
characteristics of geographic objects where the hotspots occur. The objective of
this research is to apply the multidimensional association rule mining method with
Frequent Pattern Growth algorithm (FP-Growth) and Equivalence Class
Transformation algorithm (ECLAT) to determine association patterns between
hotspot occurrences and its supporting factors. The factors that influence hotspot
occurrences were discovered on minimum support of 30% and minimum

confidence of 80% with hotspot occurrence as the target attribute. The result of
this research shows that strong relationships between hotspot occurrences and its
influence factor were found with the the highest support of 44.49%, confidence of
100%, and lift of 1.02, where hotspot are mostly occurred in areas which has
precipitation greater than or equal to 3 mm/day.
Keywords: ECLAT , FP-Growth, hotspot, multidimensional association rules

MULTIDIMENSIONAL ASSOCIATION RULES MINING
UNTUK DATA KEBAKARAN HUTAN MENGGUNAKAN
ALGORITME FP-GROWTH DAN ECLAT

NUKE ARINCY

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Ilmu Komputer
pada
Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

Penguji: 1
2

Toto Haryanto, SKom MSi
Hari Agung Adrianto, SKom
MSi

Judul Skripsi : Multidimensional Association Rules Mining untuk Data Kebakaran
Hutan Menggunakan Algoritme FP-Growth dan ECLAT
Nama
: Nuke Arincy
NIM
: G64124054

Disetujui oleh


Dr Imas Sukaesih Sitanggang, SSi MKom
Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi MKom
Ketua Departemen

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah Subhanahu wa Ta'ala atas
rahmat dan segala karunia-Nya sehingga skripsi ini berhasil diselesaikan. Tema
yang dipilih dalam penelitian yang dilaksanakan sejak bulan Juli 2014 ini adalah
data mining, dengan judul Multidimensional Association Rules Mining untuk Data
Kebakaran Hutan Menggunakan Algoritme FP-Growth dan ECLAT.
Penyelesaian penelitian ini tidak lepas dari dukungan dan bantuan berbagai
pihak. Penulis ingin menyampaikan ucapan terima kasih yang sebesar-besarnya
kepada kedua orang tua tercinta Warsono dan Ibunda Diyan Sudiana, kaka

Nesya Wardhiani, adik Adha Indrayoga dan segenap keluarga besar penulis atas
do’a serta dukungan yang diberikan. Kepada Ibu Dr Imas Sukaesih Sitanggang,
SSi MKom selaku pembimbing, Bapak Hari Agung Adrianto, SKom MSi dan
Bapak Toto Haryanto, SKom MSi selaku penguji. Kepada seluruh teman-teman
penulis di Program S1 Ilmu Komputer Alih Jenis Angkatan 7.
Semoga karya ilmiah ini bermanfaat.
Bogor, November 2014
Nuke Arincy

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

PENDAHULUAN


1

Latar Belakang

1

Perumusan Masalah

2

Tujuan Penelitian

2

Manfaat Penelitian

2

Ruang Lingkup Penelitian


2

METODE

3

Data Penelitian

3

Association Rule Mining

3

Aturan Asosiasi Multidimensi

4

Algoritme FP-Growth


4

Algoritme ECLAT

6

Tahapan Penelitian

6

Lingkungan Pengembangan

7

HASIL DAN PEMBAHASAN

8

Data Penelitian
Pembentukan Aturan Asosiasi


8
10

Perbandingan Aturan Asosiasi Algoritme Apriori, FP-Growth, dan ECLAT 16
Visualisasi Aturan Asosiasi Algoritme FP-Growth

16

Penentuan Faktor Pendukung Kemunculan Titik Panas

17

SIMPULAN DAN SARAN

18

Simpulan

18


Saran

19

DAFTAR PUSTAKA

19

RIWAYAT HIDUP

20

DAFTAR TABEL
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Interval jarak pusat kota ke titik panas (dist_city)
Interval jarak sungai ke titik panas (dist_river)
Interval jarak jalan besar ke titik panas (dist_road)
Interval jumlah penduduk km² (population)
Interval curah hujan (precipitation)
Interval jumlah sekolah per km² (school)
Interval suhu (screen_temp)
Nilai interval kecepatan angin 10 m (wind_speed)
Data terjadinya titik panas (hotspot_occurrence)
Data sumber pendapatan (income_source)
Data penutupan lahan (land_cover)
Data tipe lahan gambut (peatland_type)
Data kedalaman lahan gambut (peatland_depth)
Jumlah frequent itemset dari algoritme FP-Growth dan ECLAT
Jumlah aturan asosiasi algoritme Apriori, FP-Growth, dan ECLAT
Aturan asosiasi dari algoritme Apriori minimum support 30% dan
minimum confidence 80%
17 Aturan asosiasi dari algoritme FP-Growth minimum support 30% dan
minimum confidence 80%
18 Aturan asosiasi dari algoritme ECLAT minimum support 30% dan
minimum confidence 80%

8
8
8
8
9
9
9
9
9
9
10
10
10
11
12
13
14
15

DAFTAR GAMBAR
1 Algoritme FP-Growth
2 Tahapan penelitian
3 Scatter plot 17 aturan asosiasi yang mengandung
hotspot_occurrence=Yes

5
6
17

PENDAHULUAN
Latar Belakang
Bencana kebakaran hutan dan lahan merupakan permasalahan serius yang
harus dihadapi bangsa Indonesia khususnya Provinsi Riau karena kerugian
ekonomi yang ditimbulkan sangat tinggi. Selain kerusakan ekosistem, dampak
dari kebakaran hutan tidak hanya secara nasional tetapi juga berpengaruh secara
global. Hal ini disebabkan asap yang ditimbulkan dari kebakaran hutan sudah
menjalar ke negara-negara tetangga. Untuk menyelesaikan masalah ini maka
manajemen penanggulangan bahaya kebakaran harus berdasarkan hasil penelitian
dan tidak lagi hanya mengandalkan dari terjemahan textbook atau pengalaman dari
negara lain tanpa menyesuaikan dengan keadaan lahan di Indonesia (Saharjo
2000).
Salah satu upaya pencegahan kebakaran hutan yaitu dengan mempelajari
pola keterkaitan antar kejadian titik panas (hotspot) dengan karakteristik objek
geografis terdekat titik panas, sehingga faktor-faktor yang mungkin
mempengaruhi kebakaran dapat ditentukan untuk memprediksi terjadinya titik
panas. Konsep data mining sangat sesuai diterapkan untuk pencarian pola tersebut.
Data mining adalah proses menemukan hubungan yang menarik atau pola yang
penting dalam dataset berukuran besar (Han et al. 2011). Teknik data mining
yang digunakan pada penelitian ini adalah multidimensional association rule
mining.
Penelitian mengenai pencarian pola keterkaitan antarlokasi kejadian titik
panas sebagai indikator terjadinya kebakaran hutan dan karakteristik wilayah
tempat titik panas terjadi sebelumnya telah dilakukan oleh Sitanggang (2013).
Penelitian sebelumnya menggunakan teknik multidimensional association rules
mining dengan algoritme Apriori. Algoritme Apriori pertama kali diperkenalkan
oleh Agrawal dan Srikant (1994). Kelebihan algoritme Apriori yaitu setiap pola
dengan panjang pola k yang tidak frequent atau tidak sering muncul dalam sebuah
kumpulan data, maka pola dengan panjang (k+1) yang mengandung sub pola k
tersebut tidak frequent pula. Namun di sisi lain, algoritme Apriori harus
melakukan scan dataset setiap kali iterasi, sehingga meningkatkan waktu eksekusi
algoritme. Penelitian sebelumnya oleh Sitanggang (2013) menghasilkan 324
aturan asosiasi multidimensi yang menunjukkan hubungan antara kejadian titik
panas dengan faktor-faktor lainnya. Hubungan tersebut didapat pada nilai
minimum support 10% dan minimum confidence 80%.
Pada penelitian ini algoritme yang digunakan adalah Frequent Pattern
Growth (FP-Growth) dan algoritme Equivalence Class Transformation (ECLAT)
untuk menentukan pola keterkaitan antara kemunculan titik panas dan faktorfaktor pendukungnya. Pada algoritme FP-Growth pencarian frequent item dengan
cara membangkitkan struktur Frequent Pattern Tree (FP-Tree) (Han et al. 2011).
FP-Growth menerapkan teknik divide and conquer yaitu membagi suatu
permasalahan besar menjadi permasalahan-permasalahan yang lebih kecil.
Algoritme ECLAT itemset direpresentasikan secara vertikal dari dataset dan
berbasis transaction id-list (tid-list) dari itemset yaitu list dari ID yang diurutkan
dari semua transaksi yang mengandung itemset (Borgelt 2003). Dengan kelebihan

2
yang dimiliki algoritme FP-Growth dan ECLAT, diharapkan pola keterkaitan titik
panas dengan karakteristik wilayah yang dihasilkan akan lebih menarik
berdasarkan nilai support, confidence, dan lift yang lebih tinggi. Selain itu jumlah
aturan asosiasi yang dihasilkan lebih sedikit dibandingkan hasil dari penelitian
sebelumnya karena algoritme FP-Growth (Han et al. 2011) dan algoritme ECLAT
(Zaki 2000) pada saat pencarian frequent itemset lebih cepat dibandingkan
algoritme Apriori.

Perumusan Masalah
Berdasarkan latar belakang di atas, perumusan masalah dalam penelitian ini
adalah bagaimana menerapkan algoritme FP-Growth dan ECLAT untuk mencari
pola keterkaitan antar lokasi kejadian titik panas dengan karakteristik wilayah
tempat titik panas terjadi.

Tujuan Penelitian
1

2

Tujuan dari penelitian ini adalah:
Menerapkan metode multidimensional association rules mining dengan
algoritme FP-Growth dan ECLAT pada dataset kebakaran hutan di
Kabupaten Rokan Hilir Provinsi Riau Indonesia untuk menemukan pola
keterkaitan antar lokasi kejadian titik panas dengan karakteristik wilayah
tempat titik panas terjadi.
Menentukan faktor-faktor yang mempengaruhi terjadinya titik panas
berdasarkan aturan asosiasi yang dihasilkan.

Manfaat Penelitian
Faktor-faktor yang mempengaruhi terjadinya titik panas yang dihasilkan
dapat digunakan untuk memprediksi terjadinya titik panas di masa depan.

Ruang Lingkup Penelitian
1

2

Ruang lingkup penelitian ini adalah:
Data yang akan digunakan pada penelitian ini diperoleh dari peneliti
sebelumnya yang dilakukan oleh Sitanggang (2013) dan data telah melalui
tahap praproses.
Data kebakaran hutan yang digunakan adalah data untuk Kabupaten Rokan
Hilir Provinsi Riau Indonesia. Data yang digunakan yaitu kemunculan titik
panas tahun 2008, penutupan lahan, jarak pusat kota ke titik panas, jarak
sungai ke titik panas, jarak jalan besar ke titik panas, sumber pendapatan,
jumlah penduduk per km², jumlah sekolah per km², curah hujan, kecepatan
angin, suhu, jenis lahan gambut, dan kedalaman lahan gambut.

3

METODE
Data Penelitian
Data dan sumber data yang digunakan dalam penelitian ini sebagai berikut:
Data penyebaran dan koordinat titik panas tahun 2008. Data diperoleh
dari Fire Information for Resource Management System (FIRMS),
University of Maryland, NASA, Conservation International.
2
Peta digital untuk penutupan lahan, jalan besar, sungai, dan pusat kota. Data
diperoleh dari Badan Koordinasi Survei dan Pemetaan Nasional
(BAKOSURTANAL) Indonesia.
3
Data sosial ekonomi meliputi sumber pendapatan penduduk, jumlah
penduduk per km², dan jumlah sekolah per km². Data diperoleh dari Badan
Pusat Statistik (BPS) Indonesia.
4
Data Cuaca (dalam format netCDF) tahun 2008 meliputi curah hujan,
kecepatan angin, dan suhu. Data diperoleh dari Badan Meteorologi
Klimatologi dan Geofisika Badan (BMKG) Indonesia.
5
Peta digital untuk kedalaman lahan gambut dan jenis lahan gambut. Data
disediakan oleh Wetland International.
Seluruh data telah melalui tahap praproses dalam penelitian sebelumnya
oleh Sitanggang (2013).

1

Association Rule Mining
Association rule mining digunakan untuk mencari hubungan yang menarik
antar item-item yang tersembunyi dalam sebuah dataset yang berukuran besar.
Ukuran kemenarikan dalam menentukan suatu association rule mining yaitu (Han
et al. 2011):
a
Support, perbandingan terjadinya sebuah itemset terhadap jumlah seluruh
transaksi dalam dataset. Persamaannya sebagai berikut:

b

Confidence, menunjukkan kekuatan hubungan antar-itemset pada sebuah
aturan asosiasi. Persamaannya sebagai berikut:

c

Correlation, alternatif lain dalam menemukan hubungan kemenarikan antar
itemset. Hubungan kemenarikan dapat ditentukan dengan cara menghitung
nilai lift. Persamaannya sebagai berikut:

4
Jika nilai lift (A, B) lebih besar dari 1 maka A dan B berkorelasi
positif artinya bahwa kejadian A menunjukan adanya saling keterkaitan
dengan kejadian B. Jika nilai lift (A, B) kurang dari 1 maka A dan B
berkorelasi negatif artinya bahwa kejadian A tidak menunjukkan adanya
saling keterkaitan dengan kejadian B.

Aturan Asosiasi Multidimensi
Aturan asosiasi multidimensi merupakan aturan yang ditemukan dari dataset
yang berisi lebih dari satu variabel. Ada dua macam model untuk aturan asosiasi
multidimensi, yaitu (Han et al. 2011):
a
Interdimensional association rule, contoh:

b

Aturan tersebut mengandung tiga variabel (age, occupation dan buys).
Interdimensional association rule adalah aturan dalam aturan asosiasi
multidimensi dengan tanpa perulangan predikat.
Hybrid-dimensional association rule, contoh:

Aturan tersebut mengandung dua variabel (age dan buys). Model hybriddimensional association rule memperbolehkan terjadinya pengulangan
predikat pada sebuah aturan.
Kedua model tersebut yang membedakan adalah model interdimensional
association rule tidak diperbolehkan adanya pengulangan predikat yang sama
pada sebuah
aturan, sementara
hybrid-dimensional
association rule
memperbolehkan terjadinya pengulangan predikat pada sebuah aturan.

Algoritme FP-Growth
Algoritme FP-Growth merupakan perluasan dari algoritme Apriori yang
telah ada sebelumnya. Struktur data yang digunakan untuk mencari frequent
itemset dengan algoritme FP-Growth yaitu menggunakan sebuah pohon prefix
(disebut juga FP-tree). Dengan menggunakan FP-Tree, algoritme FP-Growth
dapat langsung mengekstrak frequent itemset dari FP-Tree yang telah terbentuk
(Han et al. 2011).
1
Pembentukan FP-Tree
FP-tree adalah sebuah tree yang terdiri dari satu header table, satu
root, dan satu himpunan item prefix subtree sebagai node dari anak root.
Algoritme pembentukan FP-Tree secara garis besar sebagai berikut (Han et
al. 2000):
a
Telusuri transaksi dataset (D) untuk menemukan semua item yang
terdapat dalam dataset. Setiap item sesuai diurutkan dengan frekuensi
dan jumlah support setiap item terbesar sampai terkecil.
b
Proses membuat tree diawali dengan pembuatan root (T) dan diberi
label null. Setelah itu, frequent item diambil dan diurutkan pada setiap
transaksi. Frequent item yang telah terurut ditransformasi menjadi
[p|P], dengan p adalah elemen pertama dan P adalah item sisa yang

5
ada dalam daftar transaksi. Kemudian fungsi insert_tree ([p|P],T)
dijalankan.
Jika root (T) memiliki anak atau child (N) dengan N.nama-child =
p.nama-node yang baru maka tambah N dengan nilai 1. Selainnya buat
node baru dengan nilai 1, jika ada node yang sama dengan N.namachild hubungkan dengan sebuah node link. Jika P tidak kosong panggil
insert_tree (P,N) secara rekursif.
2

Pembentukan frequent itemset dengan algoritme FP-Growth
Setelah tahap pembentukan FP-tree dari sekumpulan data transaksi,
akan diterapkan algoritme FP-Growth untuk mencari frequent itemset yang
signifikan. Algoritme FP-growth dibagi menjadi tiga langkah utama, yaitu:
a
Tahap pembangkitan conditional pattern base
Pembangkitan conditional pattern base didapatkan melalui FP-Tree
yang telah dibangun sebelumnya.
b
Pembangkitan conditional FP-Tree
Pada tahap ini support count dari setiap item pada setiap conditional
pattern base dijumlahkan, lalu setiap item yang memiliki jumlah
support count lebih besar sama dengan minimum support count akan
dibangkitkan dengan conditional FP-Tree.
c
Pencarian frequent itemset
Berikut algoritme FP-Growth yang digunakan untuk mendapatkan
frequent itemset dapat dilihat pada Gambar 1 (Han et al. 2000).
Input: FP-tree Tree, minimum support
Output:Sekumpulan lengkap frequent pattern
Method: FP-growth(Tree,null)
Procedure: FP-growth(Tree,α)
{
01 : if Tree mengandung single path P;
02 : then untuk tiap kombinasi (dinotasikan β)

dari node-node dalam path P do

03 :
04 :
05 :
06 :
07 :
08 :

bangkitkan pola β
α dengan support=
minimum support dari node-node dalam β;
else untuk tiap ai dalam header dari Tree
do{
bangkitkan pola β = ai
α dengan
support = ai.support;
bangun β conditional pattern base
kemudian conditional FP-Tree dari Tree β;
if Tree β=Ø
then panggil FP-growth(Tree,β) }}

Gambar 1 Algoritme FP-Growth
Pada algoritme FP-Growth apabila conditional FP-Tree merupakan
single path (P), maka akan didapatkan frequent itemsets dengan
melakukan kombinasi item untuk setiap conditional FP-Tree. Selain
itu dilakukan pembangkitan FP-Growth secara rekursif.

6
Algoritme ECLAT
Algoritme ECLAT membangkitkan kandidatnya dengan pencarian depthfirst dan menggunakan interseksi (titik potong) tid-list antar item-nya (Borgelt
2003). Dalam prosesnya algoritme ECLAT didefinisikan secara rekursif, artinya
proses pencarian itemset yang diinginkan akan terjadi secara berkesinambungan
sepanjang masih ada itemset yang tersisa. Metode pembentukan itemset pada
algoritme ECLAT (Zaki 1997) yaitu:
1
Nyatakan setiap item dalam tabel tid-list secara vertikal
2
Menentukan nilai minimum support dari setiap k-itemset dengan interseksi
tid-list dari kedua (k-1) subset. Pendekatan interseksinya adalah bottom-up.
Keuntungan dari algoritme ECLAT ialah proses perhitungan frequent
itemset lebih cepat dibandingkan dengan algoritme Apriori (Zaki et al. 2000). Hal
ini disebabkan proses pencarian itemset-nya secara mendalam dan ketika telah
ditemukan itemset yang sering dikunjungi maka proses berakhir. Berbeda pada
algoritme Apriori yang proses pencariannya secara melebar sehingga hal ini
membutuhkan waktu yang cukup lama untuk menentukan frequent itemset.

Tahapan Penelitian
Pelaksanaan penelitian ini meliputi beberapa tahapan yang digambarkan
pada Gambar 2.
Data Kebakaran
Hutan

Mulai

Penentuan Aturan Asosiasi
Menggunakan Algoritme
FP-Growth

Penentuan Aturan Asosiasi
Menggunakan Algoritme
ECLAT

Aturan Asosiasi dari
Algoritme FP-Growth

Aturan Asosiasi dari
Algoritme ECLAT

Perbandingan Aturan
Asosiasi
Visualisasi Aturan
Asosiasi
Penentuan Faktor
Pendukung Kemunculan
Titik Panas

Gambar 2 Tahapan penelitian

Selesai

7
Penentuan Aturan Asosiasi Menggunakan Algoritme FP-Growth
Pada tahapan ini dilakukan proses pencarian frequent itemset dengan
menggunakan algoritme FP-Growth. Pada algoritme FP-Growth penentuan
frequent itemset dilakukan melalui 2 tahap proses yaitu: pembuatan FP-Tree dan
penerapan algoritme FP-Growth untuk menemukan frequent itemset. Ketika
frequent itemset telah didapatkan maka akan dibentuk aturan asosiasi yang
memenuhi minimum support dan minimum confidence.
Penentuan Aturan Asosiasi Menggunakan Algoritme ECLAT
Pada tahapan ini proses yang dilakukan sama seperti tahapan sebelumnya
yaitu pencarian frequent itemsets, tetapi menggunakan algoritme yang berbeda
yaitu algoritme ECLAT. Algoritme ECLAT direpresentasikan secara vertikal
dalam dataset (Borgelt 2003). Ketika frequent itemset telah didapatkan maka akan
dibentuk aturan asosiasi yang memenuhi minimum support dan minimum
confidence.
Perbandingan Aturan Asosiasi
Pada tahapan ini dilakukan perbandingan aturan asosiasi yang telah
dihasilkan oleh algoritme FP-Growth dan ECLAT. Dari aturan asosiasi kedua
algoritme tersebut dipilih pola keterkaitan titik panas dengan karakteristik wilayah
yang paling menarik berdasarkan nilai support dan confidence.
Visualisasi Aturan Asosiasi
Pada tahapan ini proses yang dilakukan adalah visualisasi aturan asosiasi.
Teknik visualisasi digunakan untuk penggambaran aturan asosiasi yang telah
dihasilkan. Ada beberapa macam visualisasi untuk aturan asosiasi seperti scatter
plot, balloon plot, graph, dan parallel coordinates plot. Penelitian ini hasil aturan
asosiasi digambarkan dengan menggunakan scatter plot.
Penentuan Faktor Pendukung Kemunculan Titik Panas
Pada tahapan ini aturan asosiasi yang telah dipilih dari salah satu algoritme
dianalisis untuk mencari faktor-faktor yang mempengaruhi terjadinya titik panas.

Lingkungan Pengembangan
Spesifikasi perangkat keras dan perangkat lunak yang digunakan dalam
penelitian ini adalah sebagai berikut:
1
Perangkat keras berupa komputer personal dengan spesifikasi

Intel Core 2 Duo CPU 2.13 GHz.

RAM 2 GB.

Harddisk 360 GB.
2
Perangkat lunak

Sistem operasi Windows 7 Ultimate.

Tool komputasi statistik R versi 3.0.3.

Microsoft Excel 2007 untuk mengolah data.

Bahasa pemrograman PHP untuk membuat aplikasi pembentukan
aturan asosiasi.

8

HASIL DAN PEMBAHASAN
Data Penelitian
Data yang digunakan pada penelitian ini diperoleh dari peneliti sebelumnya
yaitu oleh Sitanggang (2013). Data telah melalui tahap praproses dan sudah dalam
format (.csv). Dataset berisi 490 transaksi dan 12 variabel dengan 1 variabel
menyatakan kelas target. Beberapa data telah melalui tahap transformasi yaitu
data numerik dikonversi menjadi sebuah interval. Data yang dikonversi adalah
data lingkungan fisik pada variabel jarak pusat kota ke titik panas (dist_city), jarak
sungai ke titik panas (dist_river), dan jarak jalan besar ke titik panas (dist_road).
Untuk data sosial ekonomi pada variabel jumlah penduduk per km² (population),
dan jumlah sekolah per km² (school). Kemudian untuk data cuaca pada variabel
curah hujan (precipitation), suhu (screen_temp), dan kecepatan angin 10 m
(wind_speed). Interval dan jumlah data yang dibentuk dapat dilihat pada Tabel 1
sampai Tabel 8.
Tabel 1 Interval jarak pusat kota ke titik panas (dist_city)
Dist_city
Jumlah data
14 km
126
Tabel 2 Interval jarak sungai ke titik panas (dist_river)
Dist_river
Jumlah data
3 km
151
Tabel 3 Interval jarak jalan besar ke titik panas (dist_road)
Dist_road
Jumlah data
5 km
115
Tabel 4 Interval jumlah penduduk km² (population)
Population
Jumlah data
100
43

9

Tabel 5 Interval curah hujan (precipitation)
Precipitation
Jumlah data
[2 mm/day, 3 mm/day)
12
>=3 mm/day
478
Tabel 6 Interval jumlah sekolah per km² (school)
School
Jumlah data
0.2
25
Tabel 7 Interval suhu (screen_temp)
Screen_temp
Jumlah data
[297 K, 298 K)
372
[298 K, 299 K)
118
Tabel 8 Nilai interval kecepatan angin 10 m (wind_speed)
Wind_speed
Jumlah data
[0 m/s, 1 m/s)
149
[1 m/s, 2 m/s)
341
Selain data pada Tabel 1 sampai Tabel 8 data lain yang digunakan pada
penelitian ini, seperti data sosial ekonomi yaitu sumber pendapatan
(income_source), data lingkungan fisik yaitu penutupan lahan (land_cover), tipe
lahan gambut (peatland_type), kedalaman lahan gambut (peatland_depth), dan
terjadinya titik panas (hotspot_occurrence). Variabel terjadinya titik panas
(hotspot_occurrence) digunakan sebagai kelas target. Tabel 9 sampai Tabel 13
beberapa data yang digunakan pada penelitian.
Tabel 9 Data terjadinya titik panas (hotspot_occurrence)
Hotspot_occurrence Jumlah data
No
272
Yes
218
Tabel 10 Data sumber pendapatan (income_source)
Income_source
Jumlah data
Agriculture
108
Forestry
106
No_data
8
Other_agriculture
21
Others
6
Plantation
238
Trading_restaurant
3

10
Tabel 11 Data penutupan lahan (land_cover)
Land_cover
Jumlah data
Plantation
174
Mix_garden
80
Dryland_forest
73
Shrubs
50
Unirrigated_agri_field
43
Bare_land
29
Water_body
3
Swamp
3
Mangrove
6
Settlement
8
Paddy_field
21
Tabel 12 Data tipe lahan gambut (peatland_type)
Peatland_type
Jumlah data
Non_peatland
217
Hemists/Saprists(60/40),Very_deep
116
Hemists/Saprists(60/40),Moderate
54
Saprists/min(90/10),Moderate
35
Hemists/Saprists(60/40),Deep
25
Saprists(100),Moderate
17
Hemists/min(30/70),Moderate
3
Saprists/min(50/50),Shallow
9
Saprists/min(50/50),Moderate
10
Saprists/Hemists(60/40),Moderate
4
Tabel 13 Data kedalaman lahan gambut (peatland_depth)
Peatland_depth
Jumlah data
(Shallow/Thin: 50 – 100 cm)
33
(Moderate: 100 – 200 cm)
101
(Deep/Thick: 200-400 cm)
50
(Very Deep/very thick: > 400 cm)
89
non_peatland
217

Pembentukan Aturan Asosiasi
Frequent itemset menggunakan algoritme FP-Growth dan ECLAT
Pembentukan frequent itemset digunakan untuk melihat seberapa sering
kemunculan itemset dalam dataset. Algoritme FP-Growth frequent itemset
dihasilkan menggunakan aplikasi pemrograman C dalam format .exe yang
dijalankan pada command prompt (CMD). Program FP-Growth tersebut diperoleh
dari (http://www.borgelt.net/fpgrowth.html). Untuk algoritme ECLAT frequent
itemset yang dihasilkan menggunakan aplikasi statistika R dengan menggunakan
package arules tetapi tidak langsung menghasilkan aturan asosiasinya. Minimum
support yang dicoba dalam pembentukan frequent itemset yaitu 10%, 20%, 30%,

1

11
40%, dan 50%. Tabel 14 merupakan jumlah frequent itemset yang terbentuk untuk
setiap minimum support yang diperoleh algoritme FP-Growth dan ECLAT.
Tabel 14 Jumlah frequent itemset dari algoritme FP-Growth dan ECLAT
No

Minimum
Support
(%)

Total Large
Itemset

1

10

2568

2

20

476

3

30

156

4

40

55

5

50

23

k-itemset
1
2
3
1
2
3
1
2
3
1
2
3
1
2
3

FP-Growth

ECLAT

Jumlah
Itemset
34
251
670
27
103
176
16
55
61
13
24
15
7
10
5

Jumlah
Itemset
34
251
670
27
103
176
16
55
61
13
24
15
7
10
5

Berdasarkan Tabel 14 pengujian frequent itemset dilakukan sampai dengan
minimum support 50% karena dalam pengujian minimum support 60% pada 3itemset jumlah yang dihasilkan hanya 2, sehingga tidak dilakukan penentuan
frequent itemset pada minimum support di atas 60%. Hasil tersebut menunjukan
jumlah frequent itemset kedua algoritme sama dan semakin kecil nilai minimum
support-nya maka semakin banyak frequent itemset yang dihasilkan.
2

Aturan asosiasi algoritme Apriori, FP-Growth, dan ECLAT
Pada penelitian sebelumnya oleh Sitanggang (2013), aturan asosiasi
dihasilkan dengan menggunakan algoritme Apriori. Aplikasi statistika R telah
menyediakan algoritme Apriori dengan menggunakan package arules langsung
membentuk aturan asosiasinya dan penelitian sebelumnya menghasilkan 2981
aturan. Tujuan dari penelitian adalah menemukan faktor-faktor yang sangat
mungkin mempengaruhi terjadinya titik panas. Oleh karena itu, analisis aturan
asosiasi hanya mencakup terjadinya titik panas (hotspot_occurrence=Yes). Ada
324 aturan atau sekitar 10.87% mengandung terjadinya titik panas yang dihasilkan
dari dataset dengan nilai default minimum support 10% dan minimum confidence
80%.
Dari dataset kebakaran hutan, pembentukan frequent itemset dilakukan
menggunakan algoritme FP-Growth dan ECLAT. Setelah itu, dibentuk aturan
asosiasinya untuk dijadikan bahan perbandingan dengan aturan asosiasi yang
dihasilkan algoritme Apriori. Pada aplikasi R, algoritme FP-Growth belum

12
tersedia package-nya, maka frequent itemset dihasilkan menggunakan aplikasi
pemrograman C dalam format .exe yang dijalankan pada command prompt
(CMD). Untuk algoritme ECLAT aplikasi R hanya dapat menghasilkan frequent
itemset meggunakan package arules. Oleh karena itu, pada saat pembentukan
aturan asosiasi berdasarkan frequent itemset yang diperoleh dari algoritme FPGrowth dan ECLAT menggunakan aplikasi sederhana yang dibuat dengan bahasa
pemrograman PHP. Tabel 15 merupakan jumlah aturan asosiasi yang dihasilkan
algoritme Apriori, FP-Growth, dan ECLAT dengan minimum support 10%, 20%,
30%, 40%, dan minimum confidence 80%. Pada Tabel 15 Left Hand Side (LHS)
sebagai antecedent dan Right Hand Side (RHS) sebagai consequent.
Tabel 15 Jumlah aturan asosiasi algoritme Apriori, FP-Growth, dan ECLAT
Min
Min
Jumlah Hotspot_occurrence=Yes
Support
Confidence
Algoritme
Aturan
LHS
RHS
(%)
(%)
10
80
3737
324
0
20
80
597
47
0
Apriori
30
80
183
17
0
40
80
61
1
0
10
80
3737
324
0
20
80
597
47
0
FP-Growth
30
80
183
17
0
40
80
61
1
0
10
80
3737
324
0
20
80
597
47
0
ECLAT
30
80
183
17
0
40
80
61
1
0
Berdasarkan Tabel 15 pengujian dilakukan sampai dengan minimum support
40% karena dalam pengujian minimum support 50% tidak dihasilkan aturan
yang mengandung terjadinya titik panas lagi. Aturan asosiasi yang diambil
sebagai bahan penentuan terjadinya titik panas dengan menggunakan minimum
support 30% dan confidence 80%. Dengan menggunakan algoritme Apriori, FPGrowth, dan ECLAT jumlah aturan yang mengandung terjadinya titik panas
menghasilkan 17 aturan. Pada penelitian sebelumnya aturan yang dianalisis
dengan minimum support 10% dan minimum confidence 80%. Jumlah aturan
asosiasi yang dihasilkan masih terlalu banyak dan minimum support masih cukup
rendah. Berikut aturan asosiasi dengan minimum support 30% dan minimum
confidence 80% yang mengandung terjadinya titik panas yang dihasilkan
algoritme Apriori, FP-Growth, dan ECLAT dapat dilihat pada Tabel 16 sampai
Tabel 18.

13
Tabel 16 Aturan asosiasi dari algoritme Apriori minimum support 30% dan
minimum confidence 80%
Support Confidence
No
LHS
RHS
Lift
(%)
(%)
1 {hotspot_occurrence=Yes} {precipitation=
44.49
100
1.0251
>=3mm/day}
2 {hotspot_occurrence=Yes} {school==3mm/day,
83.03
1.0045
hotspot_occurrence=Yes} {school==3mm/day}
6 {population=