Hierarchical Clustering Pada Data Time Series Hotspot Provinsi Riau

HIERARCHICAL CLUSTERING PADA DATA TIME SERIES
HOTSPOT PROVINSI RIAU

ILHAM ALPHA DINOV

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Hierarchical
Clustering Pada Data Time Series Hotspot Provinsi Riau adalah benar karya saya
dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun
kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip
dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah
disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir
skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.
Bogor, Maret 2014

Ilham Alpha Dinov
NIM G64114008

ABSTRAK
ILHAM ALPHA DINOV. Hierarchical Clustering Pada Data Time Series
Hotspot Provinsi Riau. Dibimbing oleh IMAS SUKAESIH SITANGGANG.
Kebakaran hutan menjadi permasalahan tahunan di Indonesia khususnya di
provinsi Riau. Penelitian ini menerapkan metode hierarchical clustering untuk
data time series hotspot menggunakan rumus jarak rataan untuk menganalisis
distribusi hotspot di provinsi Riau. Penelitian ini fokus pada persebaran hotspot di
bulan Juni, Juli dan Agustus periode tahun 2001 hingga tahun 2012. Dekomposisi
data time series diolah untuk mendapatkan pola kemunculan hotspot selama
periode tersebut. Hierarchical clustering menghasilkan 4 buah cluster pada
ketinggian sekitar 300 dendrogram. Sebagian besar hotspot pada cluster-cluster
tersebut berada di daerah perkebunan.
Kata kunci: Data Time Series, kebakaran hutan, hotspot, hierarchical clustering.


ABSTRACT
ILHAM ALPHA DINOV. Hierarchical Clustering on Hotspot Time Series Data
in Riau Province. Supervised by IMAS SUKAESIH SITANGGANG.
Land and forest fires become yearly issues in Indonesia, particularly in Riau
province. This work applied the hierarchical clustering method for hotspot time
series data using average distance formula to analyze hotspots distribution in Riau
province. This work focuses on the hotspots distribution in June, July and August
for the period 2001-2012. Time series data decomposition was generated to obtain
the hotspot occurrence patterns over the period. Hierarchical clustering on the
data results 4 clusters at the height of dendrogram about 300. Most of hotspots in
these clusters are located in plantation.
Keywords: data time series, forest fires, hotspot, hierarchical clustering

HIERARCHICAL CLUSTERING PADA DATA TIME SERIES
HOTSPOT PROVINSI RIAU

ILHAM ALPHA DINOV

Skripsi
sebagai salah satu syarat untuk memperoleh gelar

Sarjana Komputer
pada
Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA ILMU PENGETAHUAN ALAMM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

Judul Skripsi : Hierarchical Clustering Pada Data Time Series Hotspot Provinsi
Riau
Nama
: Ilham Alpha Dinov
NIM
: G64114008

Disetujui oleh

Dr Imas Sukaesih Sitanggang, SSi MKom

Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi MKom
Ketua Departemen

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang
dipilih dalam penelitian yang dilaksanakan sejak bulan Juli 2013 ini ialah Data
Mining, dengan judul Hierarchical Clustering Pada Data Time Series Hotspot
Provinsi Riau.
Penulis menyadari bahwa dalam proses penulisan skripsi ini banyak
mengalami kendala, namun berkat bantuan, bimbingan, kerjasama dari berbagai
pihak dan berkah dari Allah subhanahu wa ta'ala sehingga kendala-kendala yang
dihadapi tersebut dapat diatasi. Untuk itu penulis menyampaikan ucapan terima
kasih dan penghargaan kepada Ibu Dr Imas Sukaesih Sitanggang SSi, MKom

selaku pembimbing yang telah dengan sabar, tekun, tulus dan ikhlas meluangkan
waktu, tenaga dan pikiran memberikan bimbingan, motivasi, arahan, dan saransaran yang sangat berharga kepada penulis selama menyusun skripsi. Ucapan
terimakasih juga saya saya tujukan kepada Bapak Toto Haryanto SKom MSi dan
Bapak Asyhar Agmalaro SSi MKom selaku penguji atas segala masukan dan
saran yang telah diberikan. Ungkapan terima kasih juga disampaikan kepada ayah,
ibu, serta seluruh keluarga atas segala doa dan kasih sayangnya.
Semoga karya ilmiah ini bermanfaat.

Bogor, Februari 2014

Ilham Alpha Dinov

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi


PENDAHULUAN

1

Latar Belakang

1

Tujuan Penelitian

2

Manfaat Penelitian

2

Ruang Lingkup Penelitian

2


METODE

2

Data Penelitian

2

Lingkungan Pengembangan

3

Prosedur Analisis Data

3

Praproses Data

3


HASIL DAN PEMBAHASAN

4

Pengumpulan Data

4

Praproses Data Time Series Hotspot

6

Analisis Data

7

Clustering Data Time Series

7


SIMPULAN DAN SARAN

12

Simpulan

12

Saran

12

DAFTAR PUSTAKA

13

RIWAYAT HIDUP

14


DAFTAR TABEL
1
2
3
4

Kelas penutupan lahan provinsi Riau
Rataan dan Persentase tiap kelas penutupan lahan selama satu tahun
kurun waktu 2001 hingga tahun 2012.
List anggota pembagian cluster berdasarkan pembagian ketinggian
dendrogram
Jumlah hotspot tiap cluster dengan pemotongan dendrogram pada
ketinggian 300 per tipe penutupan lahan

3
8
10
11


DAFTAR GAMBAR
1
2
3
4
5
6
7
8

Diagram tahapan penelitian
Diagram alur praproses data
Jumlah hotspot provinsi Riau dari tahun 2001 hingga tahun 2012
Frekuensi hotspot berdasarkan tipe penutupan lahan di wilayah Riau
tahun 2001 hingga tahun 2012
Dekomposisi data time series hotspot Riau tahun 2001 hingga tahun 2012
Dendrogram data hotspot selama setahun dari tahun 2001 hingga tahun
2012
Grafik jumlah hotspot tiap bulan selama 12 tahun (2001-2012)
Dendrogram hotspot bulan Juni, Juli dan Agustus dari tahun 2001 hingga
tahun 2012

2
4
5
5
7
8
9
9

PENDAHULUAN
Latar Belakang
Kebakaran hutan dan lahan menjadi permasalahan yang kian mencolok di
Indonesia. Peluang terjadinya kebakaran hutan di Indonesia meningkat dari tahun
ke tahun. Hal tersebut menandakan perubahan hotspot yang terjadi di suatu
wilayah bersifat dinamis seiring waktu yang berjalan. Kebakaran hutan ini
merupakan salah satu masalah yang berulang sehingga menghasilkan informasi
waktu dan lokasi persebaran hotspot. Informasi tersebut dapat diolah untuk
menghasilkan kebijakan dalam penanganan kebakaran hutan di Indonesia.
Salah satu upaya pencegahan kebakaran hutan tersebut yakni dengan
mengetahui persebaran pengelompokan hotspot yang berpotensi tinggi terhadap
terjadinya kebakaran hutan. Konsep data mining sesuai untuk diterapkan pada
data hotspot tersebut. Clustering digunakan untuk untuk mengelompokkan data
berdasarkan pada kedekatan dari suatu karakteristik sampel.
Secara umum, clustering merupakan proses pengelompokan sekumpulan
objek ke dalam kelas yang objeknya mirip (Han dan Kamber 2006). Ukuran
kemiripan dan ketidakmiripan dinilai berdasarkan nilai atribut yang
mendeskripsikan objek. Tujuan dari clustering adalah untuk mengidentifikasi
struktur data yang belum berlabel yang ditentukan secara objektif oleh data yang
terorganisir ke dalam grup yang homogen dengan meminimalisir kesamaan antar
grup dan memaksimalkan ketidakmiripan antar grup (Liao 2005).
Data hotspot merupakan salah satu indikator kemungkinan terjadinya
kebakaran hutan pada wilayah tertentu. Pemantauan hotspot dilakukan dengan
penginderaan jauh (remote sensing) menggunakan satelit. Data hotspot merupakan
data time series karena diamati secara periodik setiap harinya oleh satelit seperti
NOAA dan MODIS.
Time series adalah serangkaian waktu koleksi pengamatan yang dilakukan
secara kronologis (Tak-Chung 2011). Contoh data time series yang sering ditemui
adalah data suhu harian (daily temperature), total penjualan mingguan (weekly
sales totals) dan harga reksa dana (prices of mutual funds).
Penelitian ini dilakukan untuk melihat pola persebaran hotspot di Riau
dalam kurun waktu dari tahun 2001 sampai tahun 2012. Time series clustering
dipilih sebagai metode yang digunakan karena merupakan salah satu metode yang
sesuai untuk melihat pola pengelompokan per satuan waktu. Terdapat dua
kategori utama dalam time series clustering yaitu ―whole clustering‖ dan
―subsequence clustering‖. ―Whole clustering‖ adalah clustering yang dilakukan
pada banyak objek time series untuk serangkaian kelompok yang sama.
―Subsequence clustering‖ berdasarkan pada ekstraksi sliding window atau window
yang berjalan dari time series tunggal yang bertujuan untuk menemukan
kesamaan dan perbedaan time windows atau antar objek waktu (Keogh et al
2003). Contoh dari “whole clustering” adalah penggunaan dua buah objek waktu
seperti bulan dan tanggal. “Subsequence clustering” hanya menggunakan satu
objek waktu saja, misal objek tanggal seperti yang digunakan dalam penelitian ini.
Penelitian ini termasuk pada subsequence clustering karena hanya menggunakan
satu objek time series yaitu tanggal.

2
Tujuan Penelitian
1 Analisis data time series hotspot, dengan melihat pola kecenderungan
kemunculan hotspot selama 12 tahun dari tahun 2001 hingga tahun 2012.
2 Menentukan pengelompokan hotspot menggunakan metode hierarchical
clustering.
Manfaat Penelitian
Penelitian ini diharapkan membantu pihak–pihak yang membutuhkan
informasi terkait pengelompokan hotspot provinsi Riau periode 2001 – 2012.
Ruang Lingkup Penelitian
1 Analisis dan pengelompokkan data time series hotspot dilakukan menggunakan
modul-modul terkait dalam perangkat lunak komputasi statistika R (www.rproject.org).
2 Formula jarak yang digunakan dalam hierarchical clustering adalah average /
rataan

METODE
Pemodelan dan analisis clustering data hotspot dilakukan dengan
menggunakan perangkat lunak R. Penelitian ini dilakukan dalam beberapa tahap
seperti yang ditunjukkan pada Gambar 1.

Gambar 1 Diagram tahapan penelitian
Data Penelitian
Data yang digunakan dalam penelitian ini adalah data hotspot provinsi Riau
tahun 2001 hingga tahun 2012 yang diunduh dari situs NASA dan tipe data

3
penutupan lahan provinsi Riau pada tahun 2008 sebagai kelas target. Luas daerah
tiap tipe penutupan lahan dapat dilihat pada Tabel 1.
Tabel 1 Kelas penutupan lahan provinsi Riau
Tipe Penutupan Lahan
Plantation
Dryland Forest
Agricultural Field
Shrubs
Natural Forest
Bare Land
Swamp & Mangrove

Luas Area (km2)
28,417.13
17,497.66
20,294.21
8,176.02
8,110.41
3,029.42
3,746.12

Lingkungan Pengembangan
Perangkat keras dan perangkat lunak yang digunakan untuk penelitian ini
adalah sebagai berikut
Perangkat keras berupa komputer personal dengan spesifikasi sebagai
berikut:
o Processor Intel® CoreTM i5
o Memory 4 GB
o Hardisk 320 GB
Perangkat lunak:
o Sistem operasi Microsoft Windows 8
o Tool untuk komputasi statistika R 3.0.1 64 Bit
o Tool R Studio untuk memudahkan modifikasi sintaks R
o DBMS PostgreSQL 9.1
o Quantum GIS 1.8.0 untuk analisis, visualisasi data spasial dan pemisah data
hotspot per tipe kelas penutupan lahan.
o PostGIS 2.0 sebagai ekstensi spasial dalam PostgreSQL 9.1 untuk
menghubungkan dengan Quantum GIS 1.8.0.
o Microsoft Excel untuk memanipulasi data time series hasil kueri DBMS
menjadi masukan R
Prosedur Analisis Data
Praproses Data
Praproses dilakukan untuk mempersiapkan dataset time series untuk
keperluan analisis awal dan clustering. Tahapan praproses data dapat dilihat pada
Gambar 2. Pada langkah awal, data dimasukkan ke dalam aplikasi Quantum GIS
1.8.0 untuk dilakukan proses clipping. Proses ini memisahkan tiap tipe penutupan
lahan dan untuk mendapatkan data hotspot yang berada di wilayah provinsi Riau
dari tahun 2001 hingga tahun 2012. Selanjutnya hasil proses clipping di-export
menjadi shape file agar file tersebut dapat diolah di dalam DBMS PostgreSQL.
Kemudian data yang diperoleh di-import ke dalam DBMS PostgreSQL 9.1 yang
telah terintegrasi dengan PostGIS 2.0. Selanjutnya dilakukan kueri–kueri hingga
didapatkan data yang dibutuhkan untuk clustering. Sebelum data digunakan

4
menjadi data masukan R, struktur data diubah menjadi struktur data yang sesuai
dengan struktur data masukan R dengan bantuan Microsoft Excel 2010.
Selanjutnya data dapat diolah menggunakan R dengan bantuan tool R Studio.

Gambar 2 Diagram alur praproses data

HASIL DAN PEMBAHASAN
Pengumpulan Data
Pada penelitian ini, data yang digunakan adalah:
1 Data persebaran hotspot
Data persebaran hotspot yang digunakan adalah data hotspot dari tahun
2001 hingga tahun 2012 yang diunduh dari situs resmi NASA. Data ini
memiliki atribut latitude, longitude dan acq_date. Atribut latitude dan
longitude menggambarkan letak hotspot dalam peta geografis provinsi Riau
sedangkan atribut acq_date adalah keterangan tanggal suatu hotspot muncul
pada titik tertentu. Gambar 3 menyajikan jumlah hotspot di wilayah provinsi
Riau dari tahun 2001 hingga tahun 2012.

5
14000
11746

Jumlah Hotspot

12000

11079

10937

10000
7726

8000

6891

6840

5911

6000

5628
4229

4128

4067

4000
2000

1645

0
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
Tahun

Gambar 3 Jumlah hotspot provinsi Riau dari tahun 2001 hingga tahun 2012

Jum;ah Hotspot

Dari Gambar 3 terlihat bahwa tahun 2005, 2006 dan 2009 merupakan
tahun–tahun yang memiliki catatan jumlah hotspot tinggi.
2 Data penutupan lahan
Data penutupan lahan di wilayah Riau terbagi atas tujuh tipe yaitu lahan
perkebunan (plantation), hutan kering (dryland forest), lahan pertanian
(agricultural field), semak (shrubs), hutan alami (natural forest), lahan kosong
(bare land), serta rawa dan bakau (swamp & mangrove). Gambar 4
menunjukkan grafik kemunculan hotspot per kelas penutupan lahan dari tahun
2001 hingga tahun 2012.
40000
35000
30000
25000
20000
15000
10000
5000
0

35744

12995

10817

7978

6001

5887
1405

Tipe penutupan lahan

Gambar 4 Frekuensi hotspot berdasarkan tipe penutupan lahan di wilayah Riau
tahun 2001 hingga tahun 2012

6
Praproses Data Time Series Hotspot
1 Import shape file ke dalam Quantum GIS
Data awal hotspot yang didapatkan berupa shape file yang berisi data hotspot
yang berada di dalam dan di luar wilayah provinsi Riau. Untuk memudahkan
memanipulasi data awal tersebut maka dilakukan importing file ke dalam
aplikasi Quantum GIS.
2 Kueri dan clipping data hotspot dengan data penutupan lahan
Proses kueri dan clipping ini dilakukan guna mendapatkan hotspot yang berada
di dalam wilayah provinsi Riau tiap tahun dari tahun 2001 hingga tahun 2012.
Kueri dilakukan untuk pengelompokan data hotspot berdasarkan tahun. Setelah
data hotspot sudah terbagi berdasarkan tahun, selanjutnya dilakukan proses
clipping data. Clipping data dilakukan untuk memisahkan data hotspot tiap tipe
penutupan lahan.
Langkah terakhir proses clipping adalah mengelompokkan data berdasarkan
tujuh kelas landcover di wilayah provinsi Riau yaitu lahan perkebunan
(plantation), hutan kering (dryland forest), lahan pertanian (agricultural field),
semak (shrubs), hutan alami (natural forest), lahan kosong (bare land), serta
rawa dan bakau (swamp & mangrove).
3 Export layer hasil clipping menjadi shape file
Hasil kueri dan clipping di-export menjadi shape file. Sehingga dapat diolah
selanjutnya menggunakan DBMS PostgreSQL.
4 Import shape file ke dalam PostgreSQL
Agar PostgreSQL dapat membaca shape file yang berisi data spasial, terlebih
dahulu dipasang tool pendukung PostGIS. Satu buah shape file menghasilkan
satu buah tabel dalam PostgreSQL. Pada tahap ini akan dihasilkan tabel–tabel
hotspot provinsi Riau dari tahun 2001 hingga 2012 dan tabel penutupan lahan
provinsi Riau.
5 Kueri untuk mendapatkan frekuensi hotspot per hari
Data yang dibutuhkan untuk kelas target dalam metode clustering adalah kelas
pada data penutupan lahan Provinsi Riau. Untuk itu perlu penyaringan data
hotspot yang terdapat pada masing–masing kelas penutupan lahan tiap tahun
dalam periode 12 (dua belas) tahun.
6 Modifikasi struktur data menggunakan Microsoft Excel
Hotspot di setiap tipe penutupan lahan tidak muncul setiap hari, sehingga data
hasil kueri pada proses sebelumnya tidak bisa langsung dijadikan data masukan
dalam sintak R. Untuk membuat struktur data time series hotspot perlu dihitung
jumlah hotspot per hari selama setahun. Dengan menggunakan Microsoft Excel
struktur data dapat dimodifikasi sesuai dengan format yang dibutuhkan aplikasi
R.

7
Analisis Data
Gambar 5 menyajikan dekomposisi data time series hotspot di wilayah Riau
pada kurun waktu 2001 hingga 2012. Label observed merupakan gambaran
banyaknya hotspot per hari selama setahun pada data time series tahun 2001
hingga tahun 2012. Proses dekomposisi menghasilkan trend yang tidak linear
maupun kuadratik, terlihat pada Gambar 5 baris kedua label Trend. Apabila dilihat
trend masing-masing tahun, jumlah hotspot akan terlihat signifikan naik dan
signifikan turun disekitar pergantian tahun. Hal ini dapat dilihat pada awal
pergantian tahun 2002, 2003, 2006, 2008, 2009, dan 2011 yang naik secara
signifikan. Sedangkan pada awal pergantian tahun 2004, 2005, 2007 dan 2010
yang turun secara signifikan. Season atau musiman dari data time series
didefinisikan sebagai pola yang berulang selama interval waktu yang tetap.

Gambar 5 Dekomposisi data time series hotspot Riau tahun 2001 hingga tahun
2012
Clustering Data Time Series
Pada algoritme clustering, data akan dikelompokkan menjadi cluster-cluster
berdasarkan kemiripan satu data dengan yang lain. Prinsip dari clustering adalah
memaksimalkan kesamaan antar anggota satu cluster dan meminimumkan
kesamaan antaranggota cluster yang berbeda.
Dengan menggunakan algoritme Hierarchical Clustering kita bisa membagi
cluster berdasarkan ketinggian ketidakmiripan atau dissimilarity antar cluster

8
dendrogram. Hasil keseluruhan dari algoritme hierarchical clustering secara
grafik dapat digambarkan sebagai tree, yang disebut dengan dendrogram. Tree ini
secara grafik menggambarkan proses penggabungan dari cluster–cluster yang ada,
sehingga menghasilkan cluster dengan level yang lebih tinggi (Steinbach et al
2000). Tampilan dendrogram hasil hierarchical clustering data hotspot dalam
setahun kurun waktu 2001 hingga tahun 2012 dapat dilihat pada Gambar 6

Gambar 6 Dendrogram data hotspot selama setahun dari tahun 2001 hingga tahun
2012
Sebanyak 80,852 hotspot yang diamati dalam 365 hari yang berada dalam
rentang waktu tahun 2001 hingga tahun 2012. Data tersebut dibagi per kelas
penutupan lahan tiap tahunnya. Tabel 2 menyajikan rataan dan persentase jumlah
hotspot tiap kelas penutupan lahan dalam 12 (dua belas) bulan setiap tahun selama
kurun waktu dari tahun 2001 hingga tahun 2012.
Tabel 2 Rataan dan Persentase tiap kelas penutupan lahan selama satu tahun
kurun waktu 2001 hingga tahun 2012.
No
1
2
3
4
5
6
7

Kelas
Plantation
Dryland_forest
Agricultural_field
Shrubs
Natural_forest
Bare_land
Swamp_Mangrove

Rataan Hotspot Persentase (%)
8.16
44.22
1.82
9.87
2.77
16.22
1.47
7.28
1.35
7.28
2.47
13.38
0.32
1.74

Gambar 7 menyajikan grafik jumlah hotspot tiap bulan selama kurun waktu
12 (dua belas) tahun dari tahun 2001 hingga 2012. Dapat dilihat bahwa bulan
Agustus memiliki frekuensi hotspot paling banyak dibandingkan dengan frekuensi
hotspot di bulan yang lainnya yaitu sebanyak 14.450 hotspot.

Jumlah Hotspot

9
16000
14000
12000
10000
8000
6000
4000
2000
0

14450
1216112873

12593
7882
5577

4773

4229 3516

1487

772 514

Bulan

Gambar 7 Grafik jumlah hotspot tiap bulan selama 12 tahun (2001-2012)
Data bulan Agustus dan dua bulan sebelumnya menjadi titik fokus
pengamatan karena bulan-bulan tersebut merupakan urutan bulan yang memiliki
jumlah frekuensi hotspot paling banyak dibandingkan dengan total frekuensi pada
urutan bulan–bulan lainnya. Sebanyak 39,484 hotspot ditemukan pada bulanbulan tersebut. Gambar 8 menyajikan tampilan plot pada bulan Juni, Juli dan
Agustus selama kurun waktu 12 (dua belas) tahun dari tahun 2001 hingga tahun
2012.

Gambar 8 Dendrogram hotspot bulan Juni, Juli dan Agustus dari tahun 2001
hingga tahun 2012
Dari Gambar 8 dapat dilihat bahwa proses clustering menghasilkan
dendrogram yang memiliki ketinggian yang menyatakan ketidaksamaan atau
dissimilarity antar dua cluster. Pada Tabel 3 dapat terlihat pembagian cluster
berdasarkan ketinggian dendrogram dan susunan objek anggota tiap-tiap cluster
tersebut.

10
Tabel 3 Cluster berdasarkan ketinggian dendrogram
Ketinggian
Dendrogram
300

Banyak
Cluster
4

200

4

Anggota
Cluster 1
Cluster 2
Cluster 3
Cluster 4

Cluster 1
Cluster 2
Cluster 3
Cluster 4

159, 161
197, 217
193, 213
175, 212, 221, 166, 225, 227, 184,
198, 185, 194, 214, 216, 168, 205,
218, 220, 206, 199, 229, 157, 160,
169, 171, 231, 233, 195, 232, 228,
176, 222, 170, 164, 177, 209, 183,
186, 202, 190, 187, 189, 165, 182,
191, 178, 180, 163, 188, 192, 200,
201, 196, 154, 158, 153, 155, 244,
235, 243, 241, 203, 239, 240, 242,
238, 208, 237, 181, 204, 230, 173,
210, 162, 207, 215, 156, 211, 234,
179, 236, 174, 167, 172, 224, 226
159, 161
212, 221, 166, 225, 227
198, 185, 194, 214, 216, 168, 205
218, 220, 206, 199, 229, 157, 160,
169, 171, 231, 233, 195, 232, 228,
176, 222, 170, 164, 177, 209, 183,
186, 202, 190, 187, 189, 165, 182,
191, 178, 180, 163, 188, 192, 200,
201, 196, 154, 158, 153, 155, 244,
235, 243, 241, 203, 239, 240, 242,
238, 208, 237, 181, 204, 230, 173,
210, 162, 207, 215, 156, 211, 234,
179, 236, 174, 167, 172, 224, 226

Pada Tabel 3 dapat dilihat pemotongan dendrogram pada titik ketinggian
300 menghasilkan sebanyak 4 cluster dan pemotongan dendrogram pada titik
ketinggian 200 juga menghasilkan 4 cluster.
Tabel 4 menyajikan persebaran jumlah hotspot per cluster pada pemotongan
titik 300 dendrogram pada data bulan Juni, Juli dan Agustus periode tahun 2001
hingga 2012 tiap tipe penutupan lahan. Tipe penutupan lahan plantation
(perkebunan) memiliki frekuensi tertinggi pada tiap cluster yang telah dihasilkan.

11

Tabel 4 Jumlah hotspot tiap cluster dengan pemotongan dendrogram pada
ketinggian 300 per tipe penutupan lahan
Tipe penutupan lahan
Plantation
Dryland forest
Agricultural Field
Shrubs
Natural Forest
Bareland
Swamp mangrove

Cluster 1
279
80
95
61
34
42
11

Jumlah Hotspot
Cluster 2
Cluster 3
604
557
146
160
254
212
157
82
130
179
134
55
33
17

Cluster 4
16,476
3,757
6,011
3,233
3,368
2,748
569

Tabel 5 menyajikan persebaran jumlah hotspot pada masing-masing cluster
per tipe penutupan lahan pada pemotongan titik ketinggian 300 pada dendrogram
data bulan Juni, Juli, dan Agustus periode tahun 2001 hingga 2012. Tipe
penutupan lahan plantation (perkebunan) memiliki frekuensi tertinggi pada tiap
cluster yang telah dihasilkan.
Tabel 5 Jumlah hotspot tiap cluster dengan pemotongan dendrogram pada
ketinggian 200 per tipe penutupan lahan
Tipe penutupan
lahan
Plantation
Dryland forest
Agricultural Field
Shrubs
Natural Forest
Bareland
Swamp mangrove

Cluster 1
279
80
95
61
34
42
11

Jumlah Hotspot
Cluster 2 Cluster 3
1,266
1,629
383
269
527
715
214
408
224
318
172
295
55
51

Cluster 4
14,742
3,411
5,235
2,850
3,135
2,470
513

12

SIMPULAN DAN SARAN
Simpulan
Berdasarkan penelitian yang telah dilakukan terhadap data time series
hotspot, diambil kesimpulan sebagai berikut:
1 Dekomposisi data time series hotspot menghasilkan trend yang tidak linear
maupun kuadratik. Jumlah hotspot signifikan naik dan signifikan turun di
sekitar pergantian tahun.
2 Pada pemotongan titik ketinggian dendrogram 300 dari data bulan Juni, Juli
dan Agustus hasilkan 4 buah Cluster dan 4 buah Cluster pada pemotongan di
titik ketinggian dendrogram 200.
3 Pada pemotongan ketinggian dendrogram 300 dari data bulan Juni, Juli dan
Agustus tipe penutupan lahan perkebunan (plantation) memiliki jumlah hotspot
paling banyak di setiap cluster.
4 Pada pemotongan ketinggian dendrogram 200 untuk data bulan Juni, Juli dan
Agustus tipe penutupan lahan perkebunan (plantation) memiliki jumlah hotspot
paling banyak di setiap cluster.
5 Dalam kurun waktu 12 tahun persentase kemunculan hotspot terbanyak pada
penutupan lahan perkebunan (plantation).
Saran
Beberapa hal yang perlu dikembangkan lebih lanjut dari penelitian ini antara
lain:
1 Penggunaan metode clustering lain guna mendapatkan hasil cluster yang lebih
baik.
2 Dilakukan validasi cluster untuk mendapatkan cluster terbaik dari data time
series hotspot.

13

DAFTAR PUSTAKA
Han J, Kamber M. 2006. Data Mining Concepts and Techniques Second Edition.
San Fransisco (US): Morgan Kaufmann Publisher.
Keogh E, Lin J, Truppel W. 2003. Clustering of time series subsequences is
meaningless: Implications for past and future research. Di dalam: Proc. of the
3rd IEEE International Conference on Data Mining; 2003 Nov 19-22;
Melbourne, FL, USA. hlm 115–122.
Liao TW. 2005. Clustering of time series data—a survey. Pattern Recognition.
38(11): 1857-1874.
Makridakis S, Wheelwright SC, Hyndman RJ. 1998. Forecasting Methods and
Applications. New York (US): John Wiley & Sons, Inc.
Steinbach M, Karypis G, Kumar V. 2000. A comparisont of document clustering
techniques. Minnesota (US) [Internet]. [diunduh 2014 Jan 01]. Tersedia pada:
http://glaros.dtc.umn.edu/gkhome/fetch/papers/doccluster.pdf
Tak-Chung Fu. 2011. A review on time series data mining. Engineering
Applications of Artificial Intelligence. 24 (1): 164–181.

14

RIWAYAT HIDUP
Penulis dilahirkan di Nagari Taeh Baruah kecamatan Payakumbuh
kabupaten Lima Puluh Kota provinsi Sumatera Barat pada tanggal 6 November
1990. Penulis adalah anak pertama dari tiga bersaudara, anak dari pasangan Putra
Erial dan Ramona.
Penulis menempuh awal pendidikan di TK (Taman Kanak-kanak) Pertiwi
Desa Surya Indah kecamatan Pangkalan Kuras kabupaten Pelalawan propinsi Riau
pada tahun 1995. Penulis melanjutkan pendidikan sekolah dasar pada tahun 1996
hingga 2002 di SDN 028 Kecamatan Pangkalan Kuras. Kemudian penulis
melanjutkan pendidikan Sekolah Menengah Pertama di SMPN 3 Kecamatan
Payakumbuh Kabupaten Lima Puluh Kota Sumatera barat dari tahun 2002 hingga
tahun 2005. Penulis menempuh pendidikan tingkat Sekolah Menengah Atas di
SMAN 1 Kecamatan Guguk Kabupaten Lima Puluh Kota Sumatera Barat pada
tahun 2005 hingga tahun 2008. Kemudian penulis melanjutkan pendidikan
perguruan tinggi di Program Diploma Institut Pertanian Bogor, Program Keahlian
Manajemen Informatika pada tahun 2008 hingga 2011.