Clustering dataset titik panas dengan algoritme dbscan menggunakan web framework shiny pada bahasa pemrograman r

CLUSTERING DATASET TITIK PANAS DENGAN ALGORITME
DBSCAN MENGGUNAKAN WEB FRAMEWORK SHINY PADA
BAHASA PEMROGRAMAN R

RAHMAH MARDHIYYAH

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Clustering Dataset Titik
Panas dengan Algoritme DBSCAN Menggunakan Web Framework Shiny pada
Bahasa Pemrograman R adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana
pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun
tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam
Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Agustus 2014

Rahmah Mardhiyyah
NIM G64080037 

ABSTRAK
RAHMAH MARDHIYYAH. Clustering Dataset Titik Panas dengan Algoritme
DBSCAN Menggunakan Web Framework Shiny pada Bahasa Pemrograman R.
Dibimbing oleh KARLINA KHIYARIN NISA.
Kebakaran hutan merupakan permasalahan serius yang terjadi berulang kali di
Indonesia. Salah satu bentuk penanggulangan bencana kebakaran hutan adalah
dengan melakukan pemantauan terhadap titik panas melalui satelit penginderaan
jauh. Setiap titik panas yang berpotensi sebagai lokasi kebakaran akan dicatat
pada suatu dataset. Penelitian ini bertujuan membangun sebuah aplikasi web yang
melakukan clustering pada data titik panas. Aplikasi ini dibangun menggunakan
framework Shiny dan algoritme DBSCAN pada bahasa pemrograman R.
Clustering dilakukan pada dataset titik panas di pulau Kalimantan dan provinsi
Sumatera Selatan pada tahun 2002-2003. Clustering menggunakan DBSCAN

menghasilkan pola-pola penyebaran hotspot kebakaran hutan. Wilayah yang
memiliki cluster hotspot terluas adalah provinsi Kalimantan Barat yang memiliki
3528 hotspot.

Kata kunci: clustering, DBSCAN, kebakaran hutan, R, Shiny, titik panas

ABSTRACT
RAHMAH MARDHIYYAH. Clustering on Hotspot Dataset with DBSCAN
Algorithm using Shiny Web Framework on R Programming Language.
Supervised by KARLINA KHIYARIN NISA
Forest fire is a very serious and critical problem which occurs repeatedly in
Indonesia. One prevention and solution for the forest fire disaster is by monitoring
the hotspots through remote sensing satellite. Every hotspot which is likely to be
fire location is recorded in a dataset. The purpose of this research is to build a
web application that performs clustering on the hotspot dataset. This application
implements the DBSCAN algorithm using Shiny web framework on R
programming language. Clustering is performed on a dataset of hotspots in
Borneo island and South Sumatra province in 2002-2003. Clustering using
DBSCAN produces patterns of distributing hotspot forest fire. The widest cluster
hotspot is located at West Kalimantan province which has 3528 hotspots.

Keywords: clustering, DBSCAN, forest fire, hotspot, R, Shiny

CLUSTERING DATASET TITIK PANAS DENGAN ALGORITME
DBSCAN MENGGUNAKAN WEB FRAMEWORK SHINY PADA
BAHASA PEMROGRAMAN R

RAHMAH MARDHIYYAH

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014


Penguji: 1 Hari Agung Adrianto, SKom, MSi
2 Dr Imas Sukaesih Sitanggang, SSi, MKom

Judul Skripsi : Clustering Dataset Titik Panas dengan Algoritme DBSCAN
Menggunakan Web Framework Shiny pada Bahasa Pemrograman
R
Nama
: Rahmah Mardhiyyah
NIM
: G64080037

Disetujui oleh

Karlina Khiyarin Nisa, SKom, MT
Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi, MKom
Ketua Departemen


Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga penulis dapat menyelesaikan tugas akhir dengan
judul Clustering Dataset Titik Panas Dengan Algoritme DBSCAN Menggunakan
Web Framework Shiny pada Bahasa Pemrograman R. Penelitian ini dilaksanakan
di Departemen Ilmu Komputer Institut Pertanian Bogor.
Terima kasih penulis ucapkan kepada Ibu Karlina Khiyarin Nisa, SKom,
MT selaku pembimbing, serta Bapak Hari Agung SKom, MKom dan Ibu Dr. Imas
Sukaesih Sitanggang, SSi MKom selaku penguji yang telah banyak memberi
bantuan dalam penyelesaian skripsi ini. Penulis juga menyampaikan terima kasih
untuk suami tercinta, Roy Septian Sugiharto dan ananda tersayang, Muhammad
Aufa Ghaisan atas semua doa dan kasih sayang yang diberikan. Ungkapan terima
kasih juga disampaikan kepada ayah, ibu, seluruh keluarga, dan teman-teman atas
segala doa dan dukungannya.
Semoga karya ilmiah ini bermanfaat.

Bogor, Agustus 2014

Rahmah Mardhiyyah

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

PENDAHULUAN
Latar Belakang

1
1


Perumusan Masalah

1

Tujuan Penelitian

2

Manfaat Penelitian

2

Ruang Lingkup Penelitian

2

TINJAUAN PUSTAKA
Titik Panas (Hotspot)


2
2

Algoritme DBSCAN

3

Package Shiny

3

METODE
Data Penelitian

3
3

Tahapan Penelitian

4


Lingkupan Pengembangan

5

HASIL DAN PEMBAHASAN
Praproses Data

5
5

Implementasi Aplikasi Web Clustering pada Bahasa R

5

Penentuan Epsilon dan MinPts

8

Hasil Clustering dengan Algoritme DBSCAN

SIMPULAN DAN SARAN
Simpulan
Saran
DAFTAR PUSTAKA
LAMPIRAN
RIWAYAT HIDUP

10
12
12
12
12
14
16

DAFTAR TABEL
1
2
3
4


Atribut pada dataset hotspot
Spesifikasi perangkat pembuatan aplikasi web clustering
Perhitungan untuk menentukan ambang batas
Jumlah titik pada hasil clustering dataset hotspot pulau
Kalimantan

4
5
9
11

DAFTAR GAMBAR
1
2
3
4
5
6
7
8
9
10

Tahapan penelitian
Fail server.r
Fail ui.r
Aplikasi clustering berbasis internet
Grafik penentuan nilai Eps
Grafik K-dist pada dataset hotspot pulau Kalimantan
Pengaruh Epsilon terhadap jumlah cluster
Jumlah cluster pada beberapa nilai Epsilon dan MinPts
Jumlah noise pada beberapa nilai Epsilon dan MinPts
Hasil clustering pada dataset hotspot pulau Kalimantan

4
6
7
7
8
8
9
10
10
11

LAMPIRAN
1

Contoh dataset titik panas pulau Kalimantan

14

PENDAHULUAN
Latar Belakang
Kebakaran hutan merupakan salah satu bencana alam yang sering terjadi di
Indonesia. Dampak yang ditimbulkan kebakaran hutan sangat kompleks, tidak
hanya pada kerusakan ekosistem lingkungan namun juga mencakup bidang lain
seperti perekonomian, budaya, hubungan antar negara dan lainnya. Pada bidang
lingkungan, kebakaran hutan menyebabkan pencemaran kabut asap, peningkatan
emisi karbon, juga hilangnya tempat tinggal bagi sejumlah satwa liar yang
mengakibatkan ketidakseimbangan ekosistem.
Salah satu bentuk penanggulangan dan pencegahan bencana kebakaran
hutan adalah dengan melakukan pemantauan terhadap hotspot melalui satelit
penginderaan jauh. Hotspot merupakan titik-titik panas di permukaan bumi yang
dapat digunakan sebagai indikasi terjadinya kebakaran hutan. Setiap titik panas
akan dicatat pada suatu dataset yang meliputi data spasial (latitude, longitude),
data temporal (waktu dan tanggal pemantauan) dan data nonspasial (suhu udara,
curah hujan, dsb). Persebaran titik panas biasanya menggerombol secara alami,
sehingga apabila penggerombolan lokasi hotspot diketahui maka dapat digunakan
dalam analisis terjadinya kebakaran hutan. Penggerombolan ini dilakukan dengan
algoritme DBSCAN yang mampu menemukan cluster dari data spasial yang besar
(Gaonkar dan Sawant 2013).
DBSCAN adalah sebuah algoritme yang mengelompokkan objek
berdasarkan kepadatan. Algoritme ini memastikan wilayah yang cukup padat
menjadi sebuah cluster apabila memenuhi jumlah titik ketetanggaan (MinPts)
dalam jarak tertentu (epsilon). Kepadatan suatu objek didapatkan dari jumlah titik
yang memenuhi nilai epsilon tersebut sehingga DBSCAN menghasilkan cluster
yang memiliki beragam kepadatan dengan bentuk cluster yang tidak beraturan.
R merupakan salah satu bahasa pemrograman yang melakukan pengolahan
data. R sangat efektif dalam pengelolaan data, fasilitas penyimpanan dan
memvisualisasikan cluster. Selain itu R dapat dikembangkan sesuai kebutuhan
dengan menambah fitur-fitur tambahan dalam bentuk paket ke dalam software R
yang sifatnya gratis (Venables dan Smith 2009).
Purwanto (2012) telah melakukan clustering data titik panas dengan
algoritme DBSCAN dan ST-DBSCAN menggunakan MATLAB. Penelitian
tersebut berbasis desktop dengan running time selama 6 jam. Aplikasi berbasis
desktop ini memiliki beberapa kekurangan diantaranya perlu instalasi pada
komputer untuk menjalankan aplikasi tersebut sehingga tidak bisa diakses oleh
banyak orang.
Pada penelitian ini, clustering dilakukan menggunakan algoritme DBSCAN
dengan bahasa pemrograman R dan aplikasi clustering dibuat berbasis web agar
hasil clustering dapat diakses dengan mudah oleh siapapun.
Perumusan Masalah
Rumusan permasalahan pada penelitian ini adalah bagaimana membangun
aplikasi berbasis web yang melakukan clustering dengan algoritme DBSCAN
pada dataset titik panas menggunakan bahasa R.

2

Tujuan Penelitian
Penelitian ini bertujuan untuk membuat aplikasi clustering berbasis web
pada data spasial titik panas menggunakan bahasa pemrograman R.
Manfaat Penelitian
Penelitian ini membangun aplikasi web clustering yang dapat menghasilkan
pola penyebaran titik panas yang mudah diakses oleh peneliti bidang kehutanan,
pemerintah, maupun masyarakat. Dengan demikian tindakan pencegahan dan
evakuasi dapat dilakukan lebih awal.
Ruang Lingkup Penelitian
1
2
3

Lingkup dari penelitian ini antara lain yaitu:
Penelitian ini dibatasi pada data titik panas Pulau Kalimantan dan Provinsi
Sumatera Selatan.
Algoritme clustering yang digunakan untuk pengolahan dataset titik panas
adalah algoritme DBSCAN.
Aplikasi ini dijalankan pada server lokal.

TINJAUAN PUSTAKA
Titik Panas (Hotspot)
Titik panas (hotspot) menurut Peraturan Menteri Kehutanan Nomor:
P.12/Menhut/II/2009 adalah indikator kebakaran hutan yang mendeteksi suatu
lokasi yang memiliki suhu relatif lebih tinggi dibandingkan dengan suhu di
sekitarnya. Pemantauan hotspot dapat dilakukan dengan menggunakan satelit
penginderaan jauh (remote sensing).
Salah satu sensor satelit yang digunakan untuk memantau permukaan bumi
adalah Moderate Resolution Imaging Spectroradiometer (MODIS). MODIS
merupakan sensor yang terdapat pada satelit Terra (EOS AM-1), yang diluncurkan
pada 18 Desember 1999 dan Aqua (EOS PM-1) yang diluncurkan pada 4 Mei 2002.
Pendeteksian titik api yang aktif menggunakan MODIS mewakili titik tengah dari
piksel berukuran 1 kilometer yang bisa terdiri dari satu titik api atau lebih. Titik
api dapat diketahui menggunakan data dari instrumen MODIS yang terdapat pada
badan satelit Aqua atau Terra milik NASA (National Aeronautics and Space
Administration.)
Titik api yang terdeteksi dapat diartikan bahwa kebakaran terjadi di dalam
lingkup piksel berukuran 1 km2. Piksel merupakan unit terkecil dari citra
satelit/foto. Satu piksel pada citra satelit TERRA dan AQUA setara dengan + 1
km2. Namun 1 piksel tidak selalu setara dengan 1 km2 ketika berada di pinggiran
lintasan. Ketika terjadi kebakaran pada koordinat tertentu maka koordinat tersebut
akan ditampilkan di tengah piksel meskipun kebakaran berada di pinggir piksel,
sehingga untuk mengetahui lokasi terjadinya kebakaran harus menelusuri kurang
lebih 1 km2 dari lokasi koordinat hotspot tersebut (NASA 2014).

3

Algoritme DBSCAN
DBSCAN (Density-Based Clustering of Application with Noise) merupakan
algoritme clustering yang mengelompokkan titik berdasarkan kepadatan data di
suatu wilayah. Algoritme DBSCAN memerlukan masukan parameter jarak
epsilon (Eps) dan jumlah titik minimum (MinPts). Epsilon merupakan jarak antar
titik yang menandakan kepadatan objek. Ketetanggaan antar titik yang memenuhi
jarak epsilon disebut e-neighborhood dan titik yang memiliki e-nighborhood
minimal sebanyak jumlah MinPts disebut sebagai titik pusat (core point).
Langkah-langkah membangun cluster menggunakan DBSCAN adalah sebagai
berikut (Han et al. 2001):
1
Pilih titik p secara acak
2
Dapatkan titik yang e-neighborhood dari titik p.
3
Jika jumlah titik dari langkah 2 memenuhi nilai MinPts, maka p merupakan
titik pusat dan sebuah cluster telah terbentuk
4
Jika jumlah titik dari langkah 2 tidak memenuhi nilai MinPts maka titik p
merupakan titik batas (border point) dan pilih titik berikutnya.
5
Lanjutkan hingga semua titik telah diproses dan tidak ada titik yang dapat
ditambahkan pada cluster.

Package Shiny
Shiny merupakan sebuah package yang mempermudah pembangunan
aplikasi web dari bahasa pemrograman R. Shiny mampu menampilkan query dan
ringkasan data secara interaktif kepada end user melalui web browser dengan
mudah. Shiny menyediakan berbagai macam widget untuk membangun antarmuka
pengguna yang interaktif. Selain itu, aplikasi Shiny juga dapat diperluas dan
diintegrasikan dengan aplikasi web lain menggunakan HTML dan CSS. Bahkan
JavaScript dan jQuery juga dapat digunakan untuk memperluas bidang aplikasi
Shiny (Beeley 2013).
Shiny termasuk dalam pemrograman reaktif yang mampu menampilkan
output data sesuai dengan inputnya. Perubahan pada nilai input akan
menghasilkan nilai output baru tanpa perlu memuat ulang halaman. Aplikasi
Shiny tersusun dari dua komponen yaitu bagian antarmuka dan bagian server yang
tergabung dalam satu folder. Bagian antarmuka mengatur tampilan dan layout dari
aplikasi yang dikembangkan sedangkan bagian server akan berisi instruksi bagi
komputer untuk membangun aplikasi tersebut.

METODE
Data Penelitian
Data yang digunakan pada penelitian ini adalah data titik panas di Pulau
Kalimantan dan provinsi Sumatera Selatan pada tahun 2002-2003. Data ini
diperoleh dari Fire Information for Resource Management System (FIRMS) yang
disediakan oleh National Aeronautics and Space Administration (NASA). Pada

4
dataset pulau Kalimantan terdapat 4999 titik panas, sedangkan pada dataset
provinsi Sumatera Selatan terdapat 4821 titik panas. Atribut pada dataset hotspot
yang diperoleh dari FIRMS dapat dilihat pada Tabel 1.
Tabel 1 Atribut pada dataset hotspot
No.
1
2
3
4
5
6
7
8
9
10
11
12

Nama Atribut
Latitude
Longitude
Brightness temperature
Scan
Track
Acq_date
Acq_time
Satellite
Confidence
Bright_t31
Frp
Versi

Keterangan
Koordinat lintang lokasi hotspot (o)
Koordinat bujur lokasi hotspot (o)
temperatur (K)
Ukuran lebar piksel citra satelit
Ukuran panjang piksel citra satelit
tanggal kejadian titik panas
waktu kejadian titik panas
satelit yang digunakan (Aqua, Terra)
kualitas titik panas (0-100%)
temperatur channel-31 (K)
fire radiative power (MegaWatts)
5.0 = MODIS NASA-LANCE,
5.1 = MODIS MODAPS-FIRMS

Tahapan Penelitian
Tahapan yang dilakukan pada penelitian ini ditunjukkan pada Gambar 1.
Praproses Data
Dataset titik panas yang diperoleh dari FIRMS berupa fail CSV yang
diolah menggunakan perangkat lunak Microsoft Excel 2007. Terdapat 12 atribut
pada setiap data titik panas. Untuk proses clustering, atribut yang digunakan
berupa data spasial yaitu koordinat lintang dan bujur dari lokasi titik panas
tersebut sehingga atribut lain direduksi.

Gambar 1 Tahapan penelitian
Implementasi Aplikasi Web Clustering
Pada tahapan ini aplikasi web clustering dibangun menggunakan perangkat
lunak RStudio. Aplikasi ini memanfaatkan framework Shiny untuk membangun
aplikasi web clustering dari bahasa pemrograman R. Untuk penggunaan algoritme

5
DBSCAN menggunakan bahasa pemograman R dilakukan dengan pemanggilan
fungsi DBSCAN yang terdapat pada package FPC.
Lingkupan Pengembangan
Pembuatan aplikasi web clustering algoritme DBSCAN ini menggunakan
beberapa perangkat keras dan perangkat lunak dengan spesifikasi yang terdapat
pada Tabel 2.
Tabel 2 Spesifikasi perangkat pembuatan aplikasi web clustering
Perangkat Keras
Processor Intel Core 2 Duo 2.10
GHz, RAM 2 GB
Harddisk berkapasitas 160 GB.

Perangkat Lunak
Sistem operasi Windows 8
Bahasa pemrograman R versi 3.1.0
RStudio versi 0.98.501 dengan
package Shiny dan fpc
Microsoft Excel 2007
Browser Google Chrome

HASIL DAN PEMBAHASAN
Praproses Data
Dataset titik panas pulau Kalimantan dan provinsi Sumatera Selatan yang
diperoleh dari FIRMS berupa fail CSV. Contoh dataset titik panas dapat dilihat
pada Lampiran 1. Untuk clustering titik panas dilakukan pada data tersebut akan
dilakukan pemilihan field data yang diperlukan untuk perhitungan clustering. Dari
dataset titik panas yang memiliki 12 field direduksi dengan memilih 2 field saja
yaitu koordinat lintang dan bujur.
Implementasi Aplikasi Web Clustering pada Bahasa R
Aplikasi Shiny tersusun atas komponen server dan antarmuka yang
terdapat dalam satu folder. Bagian server berisi instruksi yang digunakan pada
aplikasi yang disimpan dalam fail server.r. Baris pertama pada fail server.r adalah
library yang dibutuhkan untuk membangun aplikasi. Pada aplikasi ini, diperlukan
library fpc untuk mengimplementasikan algoritme DBSCAN pada bahasa R.
Input dataset pada aplikasi ini adalah fail csv yang berisi koordinat lintang
dan bujur dari titik panas. Dataset ini dijadikan sebuah objek sebagai global
environment. Objek ini digabungkan untuk membentuk data frame baru yang
akan digunakan sebagai input fungsi DBSCAN. Pengguna dapat memilih data
mana yang akan digunakan untuk proses clustering. Objek data ini dibuat reaktif
untuk menanggapi setiap perubahan permintaan pengguna. Potongan program
pada fail server.r dapat dilihat pada Gambar 2.
Fungsi dbscan pada aplikasi ini bersifat reaktif, sehingga setiap
perubahan nilai input akan menyebabkan pemanggilan ulang fungsi dbscan dan
menghasilkan cluster baru tanpa perlu memuat ulang halaman browser. Parameter

6
nilai Epsilon dan jumlah titik minimum (MinPts) dari algoritme DBSCAN
didapatkan dari nilai yang dimasukkan oleh pengguna.
library("fpc")
shinyServer(function(input, output, session) {
#mengambil data koordinat titik panas
selectedData