Aplikasi Berbasis Web Untuk Deteksi Pencilan Titik Panas Menggunakan Algoritme Clustering K-Means Dan Framework Shiny

APLIKASI BERBASIS WEB UNTUK DETEKSI PENCILAN TITIK
PANAS MENGGUNAKAN ALGORITME CLUSTERING
K-MEANS DAN FRAMEWORK SHINY

AGISHA MUTIARA YOGA ASMARANI SUCI

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2015

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Aplikasi Berbasis Web
untuk Deteksi Pencilan Titik Panas Menggunakan Algoritme Clustering K-Means
dan Framework Shiny adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi
mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Juni 2015
Agisha Mutiara Yoga Asmarani Suci
NIM G64110020

ABSTRAK
AGISHA MUTIARA YOGA ASMARANI SUCI. Aplikasi Berbasis Web untuk
Deteksi Pencilan Titik Panas Menggunakan Algoritme Clustering K-Means dan
Framework Shiny. Dibimbing oleh IMAS SUKAESIH SITANGGANG.
Analisis pencilan data titik panas Provinsi Riau tahun 2011 hingga 2012
sebagai indikator terjadinya kebakaran telah dilakukan, tetapi hal tersebut dirasa
kurang membantu dalam upaya pencegahan kebakaran. Hal tersebut dikarenakan
hasil dari analisis pencilan hanya dapat digunakan oleh orang tertentu dan tidak
dapat dengan mudah dan cepat untuk diakses oleh pengguna. Tujuan penelitian ini
adalah membuat aplikasi berbasis web untuk mendeteksi pencilan dan
memvisualisaikan pencilan berdasarkan waktu dan lokasi. Deteksi pencilan telah
dilakukan pada penelitian sebelumnya dengan menggunakan metode clustering kmeans dengan pendekatan pencilan global dan pencilan kolektif pada data titik
panas Provinsi Riau tahun 2001 sampai 2012. Pada penelitian ini dibuat aplikasi
berbasis web menggunakan framework Shiny dengan bahasa pemrograman R.

Aplikasi ini menyediakan beberapa fungsi, yaitu ringkasan dan visualisasi dari
data yang dipilih, clustering data titik panas dengan algoritme k-means, visualisasi
hasil clustering dan sum square error (SSE), serta menampilkan pencilan global
maupun kolektif dan melihat penyebarannya dengan visualisasi pencilan pada peta
Provinsi Riau.
Kata kunci: clustering, k-means, pencilan, Shiny, titik panas

ABSTRACT
AGISHA MUTIARA YOGA ASMARANI SUCI. A Web Based Application for
Outliers Detection on Hotspot Data using the K-Means Clustering Algorithm and
the Shiny Framework. Supervised by IMAS SUKAESIH SITANGGANG.
Outliers analysis on hotspot data as an indicator of fire occurences in Riau
Province between 2001 and 2012 have been done, but it was less helpful in fire
prevention efforts. This is because the results can only be used by certain people
and can not be easily and quickly accessed by users. The purpose of this research
is to create a web-based application to detect outliers on Hotspot data and to
visualize the outliers based on the time and location. Outliers detection was done
in the previous research using the k-means clustering method with global and
collective outlier approach in Riau Province Hotspot data between 2001 and 2012.
This work aims to develop a web-based application using the framework Shiny

with the R programming language. This application provides several functions
including summary and visualization of the selected data, clustering hotspot data
using k-means algorithm, visualization of the clustering results and sum square
error (SSE), and displaying global and collective outliers and visualization of
outlier spread on Riau Province Map.
Keywords: clustering, hotspot, k-means, outlier, Shiny

APLIKASI BERBASIS WEB UNTUK DETEKSI PENCILAN TITIK
PANAS MENGGUNAKAN ALGORITME CLUSTERING
K-MEANS DAN FRAMEWORK SHINY

AGISHA MUTIARA YOGA ASMARANI SUCI

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Ilmu Komputer
pada
Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER

FAKULTAS MATEMATIKA ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2015

Penguji:
1 Aziz Kustiyo, SSi MKom
2 Rina Trisminingsih, SKomp MT

Judul Skripsi

Nama
NIM

: Aplikasi Berbasis Web untuk Deteksi Pencilan Titik Panas
Menggunakan Algoritme Clustering K-Means dan Framework
Shiny
: Agisha Mutiara Yoga Asmarani Suci
: G64110020


Disetujui oleh

Dr Imas Sukaesih Sitanggang, SSi MKom
Pembimbing

Diketahui oleh

Dr Ir Agus Buono, MSi MKom
Ketua Departemen

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang
dipilih dalam penelitian yang dilaksanakan sejak bulan Januari 2015 ini ialah
pencilan, dengan judul Aplikasi Berbasis Web untuk Deteksi Pencilan Titik Panas
Menggunakan Algoritme Clustering K-Means dan Framework Shiny.
Penulis menyadari bahwa dalam proses penulisan skripsi ini banyak
mengalami kendala, namun berkat bantuan, bimbingan, kerjasama dari

berbagai pihak dan berkah dari Allah subhanahu wa ta'ala sehingga kendalakendala yang dihadapi tersebut dapat diatasi. Untuk itu penulis
menyampaikan ungkapan terima kasih juga disampaikan kepada Agus Irianto
selaku ayah, Sri Wahyuni selaku ibu serta seluruh keluarga atas segala doa dan
kasih sayangnya. Serta ucapan terima kasih dan penghargaan kepada Ibu Dr
Imas Sukaesih Sitanggang, SSi MKom selaku pembimbing yang telah dengan
sabar, tekun, tulus dan ikhlas meluangkan waktu, tenaga, dan pikiran
memberikan bimbingan, motivasi, arahan, dan saran-saran yang sangat
berharga kepada penulis selama menyusun skripsi. Terima kasih tak lupa saya
sampaikan juga kepada sahabat-sahabat seperjuangan saya, yaitu Pristi
Sukmasetya, Rachma Hermawati, Lusi Maulina Erman, Yenni Puspitasari, Nadia
Rahmah, Nida Zakiya Nurul Haq, Gita Puspita Siknun, Nalar Istiqomah, dan Pha
Hy Thah yang selalu mendukung saya. Terima kasih juga saya ucapkan kepada
seluruh teman-teman Ilmu Komputer IPB angkatan 48 dan Muhammad Al
Mabruri. Ucapan Terima kasih juga saya saya tujukan kepada Bapak Aziz
Kustiyo, SSi MKom dan Ibu Rina Trisminingsih, SKomp MT selaku penguji
atas segala masukan dan saran yang telah diberikan. Semoga karya ilmiah ini
bermanfaat.
Bogor, Juni 2015
Agisha Mutiara Yoga Asmarani Suci


DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

PENDAHULUAN

1

Latar Belakang

1


Perumusan Masalah

2

Tujuan Penelitian

2

Manfaat Penelitian

2

Ruang Lingkup Penelitian

3

TINJAUAN PUSTAKA

3


Titik Panas (Hotspot)

3

Pencilan

3

Deteksi Pencilan Berbasis Clustering

3

Algoritme K-means

4

Framework Shiny

5


METODE PENELITIAN

5

Data Penelitian

5

Tahapan Penelitian

5

Lingkungan Pengembangan

7

HASIL DAN PEMBAHASAN

8


Clustering Menggunakan Algoritme K-means

8

Deteksi Pencilan Kolektif pada Data Titik Panas Harian

9

Deteksi Pencilan Global pada Data Titik Panas Harian

10

Pembuatan Aplikasi dengan Framework Shiny

11

SIMPULAN DAN SARAN

19

Simpulan

19

Saran

20

DAFTAR PUSTAKA

20

RIWAYAT HIDUP

27

DAFTAR TABEL
1
2
3
4
5
6

Hasil clustering k-means dengan nilai k sebesar 10
Nilai SSE untuk hasil clustering k-means dengan nilai k sebesar 10
Hasil deteksi pencilan kolektif
Hasil deteksi pencilan global
Library yang digunakan dalam pembuatan aplikasi
Evaluasi pengujian

8
9
9
10
12
19

DAFTAR GAMBAR
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Tahapan penelitian
Menu-menu yang tersedia pada aplikasi yang dibangun
Tampilan sub-menu data summary
Tampilan sub-menu data plot
Tampilan sub-menu clustering summary
Tampilan menu SSE
Tampilan sub-menu k-means plot
Tampilan sub-menu collective outlier summary
Tampilan sub-menu collective outlier plot
Tampilan sub-menu global outlier summary
Tampilan sub-menu global outlier plot
Tampilan menu help
Hasil clustering dengan aplikasi yang dibangun
Hasil deteksi pencilan kolektif dengan aplikasi yang dibangun
Hasil deteksi pencilan global dengan aplikasi yang dibangun

6
13
13
14
14
15
15
16
16
17
17
17
18
18
19

DAFTAR LAMPIRAN
1 Data titik panas harian Provinsi Riau
2 Perintah dalam R untuk visualisasi clustering
3 Hasil pengujian aplikasi berbasis web untuk deteksi pencilan titik panas
menggunakan algoritme clustering K-Means dan framework Shiny

22
23
24

PENDAHULUAN
Latar Belakang
Hutan tropis Indonesia dalam hal luasannya menempati urutan ketiga
setelah Brasil dan Republik Demokrasi Kongo, selain itu Indonesia juga memiliki
hutan mangrove yang terluas di dunia (FWI 2001). Menurut BB SDLP (2008),
Indonesia memiliki lahan gambut terluas di antara negara tropis, yaitu sekitar 21
juta ha, yang tersebar terutama di Sumatera, Kalimantan, dan Papua.
Saat ini hutan di Indonesia menghadapi ancaman kerusakan hutan yang
salah satunya, yaitu kebakaran hutan. Kebakaran hutan semakin menarik perhatian
internasional sebagai isu lingkungan dan ekonomi setelah bencana El Nino yang
terjadi pada tahun 1997-1998. Secara total untuk tahun 1997-1998, bencana
tersebut menghanguskan 22 juta hektar lahan yang 14 juta hektarnya adalah hutan
(Rowell dan Moore 2010). Menurut Wanggai (2009) umumnya penyebab
kebakaran hutan adalah manusia dan pada dasarnya manusia kurang hati-hati
dalam mengelola hutan sehingga terjadi kebakaran hutan.
Pada awal Maret 2014, kebakaran hutan dan lahan gambut di provinsi Riau
melonjak hingga melampaui saat terjadinya krisis kabut asap Asia Tenggara pada
Juni 2013. Sejak 20 Februari hingga 11 Maret 2014, Global Forest Watch
mendeteksi 3101 peringatan titik api dengan tingkat keyakinan tinggi di Pulau
Sumatera dengan menggunakan data titik panas aktif NASA (Sizer et al. 2014).
Angka tersebut melebihi 2643 total jumlah peringatan titik panas yang terdeteksi
pada puncak krisis kebakaran dan kabut asap pada 13-30 Juni 2013 (Sizer et al.
2014). Data titik panas aktif NASA diperoleh dari pengamatan satelit yang
menggunakan sensor bernama moderate resolution imaging spectroradiometer
(MODIS).
Strategi yang dapat dilakukan sebagai upaya untuk pencegahan terjadinya
kebakaran diantaranya adalah pendekatan sistem informasi kebakaran dengan
sistem pemantauan titik panas (Adinugroho et al. 2005). Menurut Adinugroho et
al. (2005), data titik panas dapat dijadikan sebagai salah satu indikator tentang
kemungkinan terjadinya kebakaran hutan dan lahan, sehingga diperlukan analisis.
Analisis yang dapat dilakukan untuk kejadian titik panas, yaitu analisis pencilan
dengan menggunakan algoritme clustering.
Penelitian analisis pencilan data titik panas harian telah dilakukan oleh
Baehaki (2014) dengan menggunakan algoritme k-means. Akan tetapi, pada
penelitian tersebut hanya menggunakan fungsi-fungsi yang terdapat pada R dan
tidak dibuat sebuah sistem berbasis web. Hasil penelitian yang telah dilakukan
oleh Baehaki (2014), yaitu objek yang dijadikan pencilan adalah objek dengan
frekuensi titik panas terbesar. Mardhiyyah (2014) telah berhasil membuat sebuah
aplikasi clustering dengan algoritme DBSCAN berbasis web menggunakan
bahasa R dan framework Shiny pada data titik panas kebakaran hutan Pulau
Kalimantan dan Provinsi Sumatera Selatan. Pada penelitiannya, Mardhiyyah
(2014) melakukan clustering menggunakan DBSCAN sehingga menghasilkan
pola-pola cluster hotspot kebakaran hutan. Pola ini merupakan persebaran lokasi
yang memiliki kemunculan yang sering terjadi. Hasil penelitian yang telah
dilakukan oleh Mardhiyyah (2014) selain sebuah aplikasi clustering berbasis web,

2
yaitu wilayah yang memiliki cluster hotspot terluas adalah provinsi Kalimantan
Barat yang memiliki 3528 hotspot.
Saat ini perkembangan tekonologi di Indonesia sangat pesat. Hampir semua
masyarakat Indonesia membutuhkan internet. Dengan menggunakan internet
memungkinkan untuk melakukan komunikasi jarak jauh secara cepat dan murah.
Hasil deteksi pencilan data titik panas perlu didistribusikan secara cepat agar para
pemangku kepentingan dapat mengambil keputusan sedini mungkin sebagai
upaya antisipasi menghadapi kebakaran maupun pemadaman kebakaran. Oleh
karena hal tersebut, menyebabkan perlu dibuatnya sebuah aplikasi berbasis web
sehingga pada penelitian ini akan dibangun aplikasi berbasis web untuk
mendeteksi pencilan global dan kolektif titik panas harian menggunakan algoritme
clustering K-Means. Aplikasi berbasis web tersebut menggunakan Shiny, yaitu
web application framework untuk R.

Perumusan Masalah
Pada penelitian Baehaki (2014) telah dilakukan deteksi pencilan data titik
panas harian dengan menggunakan algoritme k-means, akan tetapi penelitian
tersebut hanya memakai fungsi-fungsi yang terdapat pada R dan belum
diimplementasikan ke dalam sebuah aplikasi berbasis web agar pengguna lebih
mudah dalam mendeteksi pencilan.
Berdasarkan latar belakang di atas, perumusan masalah dalam penelitian ini
adala :
1 Bagaimana penerapan algoritme clustering k-means untuk mendeteksi pencilan
data titik panas?
2 Bagaimana menerapkan Shiny sebagai web application framework dalam
pembuatan aplikasi berbasis web untuk mendeteksi pencilan data titik panas ?
3 Bagaimana memvisualisasikan dan menampilkan pencilan titik panas yang
dihasilkan dari clustering?

Tujuan Penelitian
Tujuan penelitian ini adalah membangun aplikasi berbasis web untuk
mendeteksi pencilan data titik panas harian dengan menggunakan metode
clustering k-means dan framework Shiny dengan bahasa pemrograman R.

Manfaat Penelitian
Manfaat penelitian ini adalah aplikasi berbasis web yang dibangun dapat
mendeteksi pencilan titik panas harian sebagai indikator kebakaran hutan dan
lahan sehingga dapat digunakan oleh pemangku kepentingan atau pembuat
keputusan dengan cepat.

3
Ruang Lingkup Penelitian
1

2

Ruang lingkup penelitian ini, ialah:
Penelitian menggunakan data titik panas harian Provinsi Riau tahun 2001-2012
yang diambil oleh sensor MODIS dan telah dilakukan praproses oleh Baehaki
(2014), dan
Pembuatan aplikasi ini menggunakan framework Shiny dan bahasa
pemrograman R.

TINJAUAN PUSTAKA
Titik Panas (Hotspot)
Menurut Suwarsono et al. (2013), titik panas merupakan suatu daerah di
permukaan bumi yang memiliki suhu relatif lebih tinggi dibandingkan daerah di
sekitarnya berdasarkan ambang batas suhu tertentu. Menurut Guswanto dan
Heriyanto (2009), ambang batas yang digunakan oleh Kementrian Kehutanan dan
Japan International Cooperation Agency untuk data titik panas satelit NOAA
adalah 315 K atau 42o C.
Pemantauan titik panas merupakan suatu upaya untuk mengendalikan
terjadinya kebakaran hutan atau lahan secara dini. Pemantauan titik panas
dilakukan dengan remote sensing atau yang biasa disebut sebagai penginderaan
jarak jauh dengan menggunakan satelit. Satelit Terra (EOS AM) dan satelit Aqua
(EOS PM) adalah dua satelit yang meggunakan sensor MODIS untuk memantau
titik panas. Titik panas merupakan suatu indikasi potensi akan terjadinya
kebakaran hutan atau lahan. Pada semua titik panas belum tentu akan terjadi
kebakaran, sehingga analisis lebih lanjut perlu dilakukan.

Pencilan
Pencilan adalah objek data yang secara signifikan menyimpang dari
kumpulan objek-objek yang dihasilkan dengan mekanisme berbeda. Pencilan
terdiri atas beberapa tipe (Han et al. 2012), yaitu :
1 Pencilan global
Pencilan global adalah objek data yang secara signifikan menyimpang dari
kumpulan data atau tidak sesuai dengan pola pada umumnya. Pencilan global
juga disebut point anomaly dan merupakan tipe pencilan yang paling sederhana.
2 Pencilan kolektif
Pencilan kolektif adalah bagian dari objek-objek data yang seluruhnya
menyimpang secara signifikan dari keseluruhan kumpulan data.
Deteksi Pencilan Berbasis Clustering
Clustering adalah proses pengelompokkan suatu set objek data menjadi
beberapa kelompok atau cluster sehingga objek-objek dalam sebuah cluster

4
memiliki kemiripan yang tinggi, tetapi sangat berbeda dengan kelompok yang lain
(Han et al. 2012). Sebuah cluster adalah kumpulan catatan yang mirip satu sama
lain dan berbeda dengan catatan dalam kelompok yang lainnya (Larose 2005).
Metode berbasis clustering berasumsi bawa objek-objek data normal milik
kelompok yang besar dan padat. Menurut metode berbasis clustering, suatu data
dikatakan pencilan apabila data tersebut milik kelompok kecil atau jarang, atau
tidak tergabung dalam kelompok (Han et al. 2012).
Metode deteksi pencilan berbasis clustering salah satunya, yaitu deteksi
pencilan menggunakan clustering k-means. Dalam metode tersebut, sebuah
pencilan dikatakan pencilan global apabila jarak antara objek dengan pusat cluster
atau centroid jauh atau besar. Pendekatan pencilan global dapat diukur dengan
nilai outlier score. Semakin besar nilai outlier score, semakin besar kemungkinan
objek tersebut merupakan pencilan global. Rasio untuk mengukur jarak sebuah
objek yang didefinisikan sebagai berikut (Han et al. 2012):
outlier score =
dengan
o
co
dist �, ��

� ��

dist o, co
lco

(1)

: objek data,
: centroid atau titik pusat terdekat dari objek data,
: fungsi jarak Euclid antara objek data dan centroid terdekat
dari objek data, dan
: rata-rata dist �, �� .

Teknik dari skala nilai pencilan menetapkan outlier score untuk setiap
pengukuran data yang tergantung pada derajat pengukuran yang dianggap sebagai
pencilan dan memberikan daftar peringkat pencilan. Seorang analis dapat memilih
untuk menganalisis n pencilan teratas yang memiliki nilai pencilan terbesar atau
menggunakan ambang batas cut-off untuk memilih pencilan. Ambang batas
tersebut sering kali sulit untuk dipilih dan biasanya ditentukan dan ditetapkan oleh
pengguna (Zhang et al. 2010).
Selain itu, pendekatan pencilan kolektif dalam metode clustering, yaitu
apabila objek adalah bagian dari anggota cluster yang kecil atau cluster
minoritas, seluruh objek dalam cluster tersebut merupakan pencilan (Han et al.
2012).

Algoritme K-means
Algoritme k-means adalah sebuah teknik yang berbasis centroid dan
merupakan salah satu metode partitioning. Perbedaan antara sebuah objek pCi
dan ci, representasi dari cluster diukur dengan dist(p,ci). Ci adalah cluster ke-i,
sedangkan ci dalah centroid cluster ke-i. Dist(x,y) adalah jarak Euclid antara dua
objek atau titik x dan y. Kualitas sebuah cluster Ci dapat diukur dengan sum
square error (SSE). SSE didefinisikan sebagai berikut (Han et al. 2012)
(2)
SSE = ∑ki=1 ∑p∈Ci dist(p,ci )2
dengan SSE adalah total dari squared error untuk semua objek-objek pada
kumpulan data, p adalah titik yang merepresentasikan objek, k sebagai jumlah dari
cluster-cluster, dan ci adalah titik pusat cluster Ci (Han et al. 2012).

5
Keluaran dari algoritme k-means, yaitu kumpulan dari k cluster. Langkahlangkah untuk melakukan clustering dengan menggunakan algoritme k-means
(Han et al. 2012), yaitu:
1 Pilih k objek sebagai centroid atau titik pusat awal dari cluster,
2 Masukkan objek-objek ke dalam cluster yang objeknya adalah yang paling
mirip berdasarkan nilai rata-rata dari objek-objek yang berada di dalam sebuah
cluster,
3 Memperbaharui titik pusat cluster, yaitu menghitung nilai rata-rata dari objekobjek untuk setiap cluster,
4 Ulangi langkah ke-dua dan ke-tiga sampai objek-objek yang berada pada
cluster tidak ada yang berbeda.

Framework Shiny
Shiny adalah sebuah package dari bahasa pemrograman R yang
memudahkan pengguna dalam membangun aplikasi berbasis web. Shiny
memberikan queries dan ringkasan data kepada pengguna melalui web browser
yang modern dengan mudah. Selain itu, Shiny juga dilengkapi dengan berbagai
widget untuk membangun antarmuka pengguna yang interaktif dan dapat dengan
mudah diintegrasikan dengan HTML maupun CSS, bahkan JavaScript dan JQuery
dapat digunakan untuk memperluas cakupan aplikasi Shiny (Beely 2013).
Shiny membuat sangat mudah untuk membangun aplikasi web interaktif
dengan R. Fungsi reaktif yang otomatis mengikat antara input dan output dan
bermacam-macam widget pada Shiny memungkinkan untuk membangun aplikasi
yang user friendly, responsif, dan baik dengan mudah (RStudio 2014).

METODE PENELITIAN
Data Penelitian
Data yang digunakan pada penelitian ini adalah data titik panas harian di
Provinsi Riau pada tahun 2001-2012. Data titik panas harian ini merupakan data
dari penelitian yang telah dilakukan praproses data oleh Baehaki (2014). Dataset
berisi nomor indeks titik panas, tahun dan indeks titik panas, tanggal terjadinya
titik panas, dan frekuensi titik panas. Data fisik untuk longitude dan latitude titik
panas serta tanggal titik panas diperoleh dari unduh data satelit MODIS milik
National Aeronautics and Space Administration (NASA) yang dapat diunduh
pada halaman web1.

Tahapan Penelitian
Tahapan yang dilakukan pada penelitian ini dapat dilihat pada Gambar 1.
1

https://earthdata.nasa.gov/data/near-real-time-data/firms/active-fire-data#tab-content-6

6

Mulai

Data hasil
praproses

Pengujian
aplikasi

Clustering
menggunakan
algoritme k-means

Pembuatan
aplikasi dengan
framework
Shiny

Hasil
clustering

Deteksi pencilan titik
panas berdasarkan hasil
clustering k-means

Selesai
Gambar 1 Tahapan penelitian
Clustering menggunakan algoritme k-means
Pada penelitian sebelumnya Baehaki (2014) telah melakukan clustering
pada data frekuensi titik panas harian dari tahun 2001 hingga 2012 dan nilai k
sebesar 2 hingga 10. Hasil clustering yang dilakukan oleh Baehaki (2014)
menunjukkan bahwa dengan nilai k sebesar 10, SSE yang dihasilkan paling kecil,
yaitu 18 526.14. Dengan mengetahui nilai SSE dari tiap nilai k maka dapat
diketahui clustering yang menghasilkan nilai kemiripan terbaik. Clustering yang
memiliki nilai SSE terkecil adalah clustering dengan hasil yang terbaik.
Oleh karena hal itu, dalam tahapan pada penelitian ini dilakukan clustering
dengan algoritme k-means pada perangkat lunak R. Algoritme k-means tersebut
diberikan masukkan berupa data frekuensi titik api harian dari tahun 2001 hingga
2012 juga nilai k sebesar10. Selain melakukan clustering, pada tahapan ini juga
dilakukan penghitungan nilai SSE dari nilai k sebesar 10 dengan perangkat lunak
R. Penghitungan nilai SSE dilakukan untuk mengetahui clustering dengan nilai
kemiripan terbaik.
Deteksi pencilan titik panas berdasarkan hasil clustering K-Means
Setelah dilakukan clustering k-means pada data frekuensi titik panas harian
Provinsi Riau tahun 2001 hingga 2012 dengan nilai k sebesar 10 kemudian
dilakukan deteksi pencilan data titik panas. Deteksi pencilan global menggunakan
clustering k-means dilakukan dengan menghitung nilai outlier score masingmasing data titik panas harian. Pada tahapan ini, pencilan global yang dideteksi
sebanyak 30 pencilan, dan 30 pencilan global merupakan pencilan yang memiliki
nilai outlier score terbesar.

7
Deteksi pencilan kolektif menggunakan clustering k-means dilakukan
dengan menentukan persentase minimum jumlah anggota setiap cluster. Pada
tahapan ini, persentase minimum jumlah anggota yang digunakan, yaitu 1%
sehingga pencilan kolektif merupakan cluster-cluster yang memiliki jumlah
anggota kurang dari sama dengan 1%.
Pembuatan aplikasi dengan framework Shiny
Pada tahapan ini, setelah didapatkan hasil deteksi pencilan global dan
pencilan kolektif dengan clustering menggunakan algoritme k-means, lalu dibuat
aplikasi untuk mendeteksi pencilan data titik panas Provinsi Riau. Aplikasi dibuat
di perangkat lunak R dengan menggunakan framework Shiny. Aplikasi yang
dibangun dengan menggunakan framework Shiny terdiri atas dua komponen fail,
yaitu fail server.r serta fail ui.r.
Fail server.r merupakan kumpulan baris program yang berisi fungsi-fungsi
yang digunakan pada apalikasi yang dibangun. Fungsi-fungsi yang terdapat pada
fail server.r, antara lain fungsi clustering dengan algoritme k-means, fungsi
menghitung nilai SSE, fungsi deteksi pencilan global dan kolektif, fungsi
visualiasasi pencilan global dan kolektif pada peta Provinsi Riau dan lain
sebagainya. Fail ui.r merupakan kumpulan baris program yang merepresentasikan
atribut-atribut pada antar muka yang ditampilkan pada halaman web browser.
Atribu-atribut tersebut, yaitu headerPanel, sidebarPanel, mainPanel,
navigationPanel, dan sebagainya.
Pengujian Aplikasi
Pada tahapan ini dilakukan pengujian pada aplikasi yang dibangun dengan
Shiny. Pengujian dilakukan untuk kelima fungsi utama dalam aplikasi yang
dibangun dibandingkan dengan keluaran yang diperoleh dari perangkat lunak R
secara manual.

Lingkungan Pengembangan
Spesifikasi perangkat keras dan perangkat lunak yang digunakan untuk
penelitian ini adalah sebagai berikut:
Perangkat lunak:
1 Sistem operasi Windows 8
2 Bahasa pemrograman R versi 3.1.1
3 RStudio versi 0.98.1062
4 Package Shiny, FPC, Datasets, Rgdal, Ggplot2, dan Maptools
5 Web browser
Perangkat keras:
1 Processor Intel Core i7-3632QM 2.20 GHz
2 RAM 4 GB
3 Hardisk berkapasitas 390 GB

8

HASIL DAN PEMBAHASAN
Clustering Menggunakan Algoritme K-means
Data titik panas Provinsi Riau tahun 2001 hingga 2012 dilakukan clustering
menggunakan algoritme k-means dengan nilai k sebesar 10. Hasil clustering pada
Tabel 1 dengan nilai k sebesar 10, yaitu bahwa cluster yang memiliki jumlah
anggota terbesar adalah cluster 9 dengan jumlah anggota sebanyak 3250 dan
center sebesar 1.825 serta cluster yang memiliki anggota terkecil adalah cluster 7
dengan jumlah anggota sebanyak 17 dengan center 713.471. Kode algoritme kmeans pada data frekuensi titik panas harian Provinsi Riau tahun 2001 hingga
2012 dengan nilai k sebesar 10 dapat sebagai berikut ini:
#membaca data frekuensi titik panas harian
data