Clustering sumber-sumber emisi di Surakarta menggunakan single linkage Artikel TA hartono

perpustakaan.uns.ac.id

digilib.uns.ac.id

CLUSTERING SUMBER-SUMBER EMISI DI SURAKARTA
MENGGUNAKAN SINGLE LINKAGE
Hartono, Isnandar Slamet, dan Yuliana Susanti
Program Studi Matematika Fakultas Matematika dan Ilmu pengetahuan Alam
Universitas Sebelas Maret Surakarta

Abstrak. Diantara penyebab polusi udara adalah adanya emisi gas buang, yaitu jumlah
polutan yang dikeluarkan ke udara dalam satuan waktu. Emisi gas buang terjadi akibat
pembakaran yang tidak sempurna, yaitu lepasnya partikel-partikel karena kurang tercukupi oksigen dalam proses pembakaran. Perkembangan kota Surakarta yang cukup pesat
berpotensi untuk menghasilkan emisi gas buang. Clustering adalah metode untuk klasifikasi objek-objek tertentu menjadi kelompok yang lebih kecil berdasarkan karakteristik
yang dimilikinya. Tujuan dari penelitian ini, melakukan clustering kategori sumber emisi
di Surakarta menggunakan metode hirarki single linkage. Hasil penelitian menunjukkan
terdapat tiga cluster penghasil emisi gas buang yaitu cluster pertama adalah bank, sekolah, restoran, SPBU, perguruan tinggi, perkantoran, mart & sejenisnya, pasar, bengkel,
konstruksi, pergudangan, zonasi parkir, menara pemancar, dan parkir dalam area yang
digolongkan menjadi kelompok dengan nilai emisi rendah. Cluster kedua yaitu pedagang
kaki lima sebagai kelompok dengan nilai emisi yang sedang. Cluster ketiga yaitu perumahan yang merupakan kelompok dengan nilai emisi tinggi.
Kata kunci: clustering, emisi gas buang, single linkage


1. Pendahuluan
Udara merupakan unsur penting yang mendukung kehidupan manusia (Ismiyati dkk. [4]). Udara dibutuhkan manusia dalam pernapasan terutama oksigen (O2 ).
Polusi udara yang beredar tinggi di lingkungan sekitar dapat mengurangi kesehatan
dan daya tahan tubuh. Jika tubuh rentan terhadap penyakit, lama-kelamaan polusi udara tersebut dapat menimbulkan penyakit atau gangguan pernapasan. Oleh
karena itu, polusi udara perlu diwaspadai.
Polusi udara di beberapa kota di Indonesia semakin meningkat, terutama di
daerah dengan kepadatan lalu lintas yang tinggi. Salah satu sumber polusi udara
adalah adanya emisi gas buang. Udara di kota telah tersebar gas-gas yang berbahaya bagi kesehatan manusia seperti carbon dioxide (CO2 ). Menurut laporan World
Resources Institute (W RI) sebagaimana dilansir Daily Mail [6], Indonesia menjadi
negara penghasil emisi CO2 terbesar keenam di dunia dengan total emisi CO2 sebesar 2,05 miliar ton. Hal ini menunjukkan bahwa ada indikasi tingkat polusi udara
di Indonesia cukup tinggi dan perlu penanganan lebih lanjut.
Kota Surakarta berpotensi untuk menghasilkan emisi gas buang. Emisi gas bucommit to user
ang ini akan semakin meningkat seiring perkembangan transportasi (Ismiyati dkk.
[4]). Hasil tes emisi yang dilakukan tim gabungan dari BLH Provinsi, BLH Surakarta, Dishubkom-info Surakarta, Polresta Surakarta dan DKP Surakarta diperoleh
1

perpustakaan.uns.ac.id

digilib.uns.ac.id


informasi bahwa banyak jenis mobil produksi baru yang memiliki gas emisi buang
melebihi ambang batas yang ditentukan oleh pemerintah (Dishubkominfo Surakarta
[3]). Terdapat beberapa kategori sumber yang berpotensi sebagai penghasil emisi
gas buang. Berdasarkan Billionet et al. [2] dan Ismiyati dkk. [4], berbagai jenis gas
buang antara lain CO2 , carbon monoxide (CO), non-methane volatile organic compounds (N M V OC), particulate matter (P M 10), nitrogen oxide (N Ox ), dan sulfur
oxide (SOx ). Setiap gas tersebut merupakan gas beracun yang dapat membuat
sistem pernapasan manusia terganggu.
Analisis multivariat merupakan salah satu metode statistika yang cocok untuk
mengolah data dengan banyak variabel (Rencher [9]). Analisis cluster merupakan
metode dalam analisis multivariat, yaitu clustering terhadap objek-objek tertentu
menjadi kelompok yang lebih kecil berdasarkan karakteristik diantara objek-objek
tersebut (Johnson dan Wichern [5]). Warsito dkk. [10] telah melakukan penelitian
terkait clustering data pencemaran udara di sektor industri Jawa Tengah dengan neural network. Austin et al. [1] mengidentifikasi beberapa polutan dalam pencemaran
udara. Plaisance et al. [8] menerapkan analisis cluster untuk mengelompokkan profil emisi carbonyl compounds dari material-material bangunan dan perkakas rumah
tangga. Mubtadai dkk. [7] melakukan perbandingan clustering metode manual dan
single linkage untuk menentukan kinerja agen pada call centre. Sejalan dengan penelitian Warsito dkk. [10], Austin et al. [1], Plaisance et al. [8] dan Mubtadai dkk.
[7], digunakan single linkage untuk clustering kategori sumber emisi dan identifikasi
hasil cluster terhadap polusi udara di Surakarta.
2. Landasan Teori

2.1. Clustering . Clustering merupakan metode untuk klasifikasi objek-objek ke
dalam kelompok-kelompok yang lebih kecil berdasarkan karakteristik tertentu (Johnson dan Wichern [5]). Jika terdapat n objek dan p variabel, maka observasi xij dengan i = 1, 2, 3, ..., n dan j = 1, 2, 3, ..., p dapat digambarkan seperti dalam Tabel 1.
Analisis cluster memiliki tujuan sebagai konfirmasi dalam pengelompokkan, penyederhanaan data, dan identifikasi suatu hubungan antar observasi. Ciri-ciri cluster
yang baik adalah
(1) homogenitas atau kesamaancommit
yang to
tinggi
user antar anggota dalam satu cluster
(within-cluster ), dan
(2) heterogenitas atau perbedaan yang tinggi antar cluster (between cluster ).
2.2. Istilah-Istilah Clustering . Beberapa istilah analisis cluster sebagai berikut.
Prodi Matematika

2

Desember 2015

perpustakaan.uns.ac.id

digilib.uns.ac.id


Tabel 1. Struktur Data
Objek
1
2
..
.

Var 1
x11
x21
..
.

Var 2
x12
x22
..
.


i
..
.

xi1
..
.

xi2
..
.

n

xn1

xn2

...
...

...
..
.
..
.
..
.
..
.

Var j
x1j
x2j
..
.
xij
..
.
xnj


...
...
...
..
.
..
.
..
.
..
.

Var p
x1p
x2p
..
.
xip
..
.

xnp

(1) Agglomeration schedule ialah jadwal yang memberikan informasi tentang objek atau kasus yang akan dikelompokkan pada setiap tahap.
(2) Cluster memberships adalah keanggotaan yang menunjukkan cluster untuk
setiap objek yang menjadi anggotanya.
(3) Dendogram merupakan grafik pohon yang menggambarkan hasil analisis
cluster yang dilakukan peneliti.
2.3. Proses Clustering . Proses pengelompokan cluster dimulai dengan standardisasi satuan melalui transformasi data, sehingga diperoleh data yang mengikuti
distribusi normal standar N (0, 1). Hal ini dilakukan dengan transformasi berikut.
z=

xi − x¯
,
s

(2.1)

dengan
z : nilai transformasi distribusi normal,


xi : nilai objek ke-i,

x¯ : nilai rata-rata objek,

s : standar deviasi.

Untuk mengelompokkan objek yang memiliki kemiripan, perlu diukur seberapa jauh ada kesamaan antar objek. Dalam mengukur kemiripan antar objek tersebut
dapat digunakan metode ukuran jarak. Ukuran jarak yang biasa dipakai adalah
jarak Euclidean. Johnson dan Wichern [5] mendefinisikan jarak Euclidean sebagai
besarnya jarak suatu garis lurus yang menghubungkan antar objek. Ukuran jarak
nilai emisi antar objek ke-i dengan objek ke-j, disimbolkan dij dengan i, j = 1, . . . , n
dan k = 1, . . . , p. Nilai dij diperoleh melalui perhitungan jarak kuadrat Euclidean
yaitu
dij =



Σpk=1 (zik − zjk )2 ,
commit to user


(2.2)

dengan
n

: banyaknya objek,

dij

: jarak kuadrat Euclidean antar objek ke-i dengan objek ke-j,

Prodi Matematika

p : banyaknya variabel cluster,
3

Desember 2015

perpustakaan.uns.ac.id


digilib.uns.ac.id

zik / zjk : nilai transformasi dari objek ke-i/j pada variabel ke-k,
2.4. Metode Single Linkage. Single linkage merupakan metode hirarki kategori
agglomeration atau penggabungan objek. Dimulai dengan dua objek yang dipisahkan dengan jarak paling pendek, maka keduanya akan ditempatkan pada cluster
pertama, dan seterusnya. Pada setiap tahapan, banyaknya cluster berkurang satu.
Menurut Johnson dan Wichern [5], jarak dua buah cluster antara dij dan sembarang
cluster lain yang belum digabung misal dh didefinisikan sebagai
d(ij)h = min{d(dih , djh )}.

(2.3)

Clustering dengan algoritme single linkage dilakukan dengan beberapa langkah yaitu
(1) dimulai dengan n cluster, setiap cluster mengandung entiti tunggal dan sebuah matriks simetrik dari jarak dik ,
(2) dihitung matriks jarak untuk pasangan cluster yang terdekat. Misal jarak
antara cluster U dan V yang terdekat adalah duv ,
(3) digabungkan cluster U dan V dan label cluster baru dibentuk dengan U V .
diperbarui nilai masukan pada matriks jarak dengan cara
(a) dihapus baris dan kolom yang bersesuaian cluster U dan V ,
(b) ditambahkan baris dan kolom yang memberikan jarak-jarak antara cluster (U V ) dan cluster-cluster yang tersisa.
(4) diulangi langkah (2) dan (3) sebanyak n − 1 kali,
(5) dicatat identitas dari cluster yang digabungkan dan jarak similaritas dimana
penggabungan terjadi.
setelah terbentuk cluster, diberikan ciri atau karakteristik berdasarkan nilai ratarata dari emisi pada masing-masing cluster dan pertimbangan besar polutan udara.
3. Metode Penelitian
Pada penelitian ini, metode yang digunakan adalah penerapan kasus. Adapun
langkah-langkah yang dilakukan sebagai berikut.
(1) Mendeskripsikan data kategori sumber emisi.
(2) Pengolahan data penelitian dengan langkah-langkah sebagai berikut.
(a) Melakukan standardisasi satuan dengan persamaan (2.1).
commit to user
(b) Membentuk matriks ketakmiripan antar objek dengan persamaan (2.2).
(c) Membandingkan jarak ketakmiripan antar objek melalui persamaan (2.3).
(d) Menentukan jumlah cluster berdasarkan dendogram.
Prodi Matematika

4

Desember 2015

perpustakaan.uns.ac.id

digilib.uns.ac.id

(e) Memberikan karakteristik pada tiap cluster.
(3) Memberikan kesimpulan.
4. Hasil dan Pembahasan
4.1. Deskripsi Data Emisi. Terdapat 16 kategori sumber dan 6 variabel polutan
udara sebagai nilai masukan dalam proses clustering. Data yang digunakan adalah
nilai emisi gas buang di Surakarta tahun 2011. Sumber data tersebut diberikan oleh
Prabang Setyono, yang merupakan peneliti di progam studi Biologi FMIPA Universitas Sebelas Maret. Tabel ?? menunjukkan nilai emisi dari setiap kategori sumber
berdasarkan polutan masing-masing. Perhitungan emisi dilakukan dengan sampling
beberapa peralatan pada kategori sumber seperti genset, kompor gas, tungku, boiler,
las, oven, kompresor, kendaraan, cooking set dan cooking machine.
Tabel 2. Nilai Standardisasi Satuan untuk 16 Kategori Sumber Emisi
No.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Kategori
Sumber
Bank
Perumahan
Sekolah
Restoran
SPBU
Perguruan Tinggi
Perkantoran
Mart dan Sejenisnya
Pasar
Bengkel
Konstruksi
Pergudangan
Zonasi Parkir
Pedagang Kaki Lima
Menara Pemancar
Parkir Dalam Area

N Ox
-0,4908
2,9104
-0,1527
-0,1843
-0,5325
0,0037
-0,5299
-0,5313
-0,3910
-0,4694
-0,5325
-0,5325
-0,4135
0,2371
-0,4044
2,0134

Z-Score
SOx N M V OC P M 10
-0,3285
-0,4574 -0,4563
3,7132
-0,2779 -0,1553
0,0076
-0,1972 0,1268
-0,0563
-0,1213 0,3020
-0,3535
3,3180 -0,4603
0,0098
-0,4480 -0,4100
-0,3517
-0,4574 -0,4601
-0,3527
-0,4580 -0,4602
-0,2252
-0,3506 -0,2180
-0,3102
-0,4567 -0,4544
-0,3535
-0,4580 0,2969
-0,3535
-0,4580 0,1116
-0,3535
-0,4303 -0,4594
-0,0610
1,3166 3,5905
-0,2778
-0,4563 -0,4481
-0,3535
0,3922 -0,4464

CO
-0,4812
-0,1527
-0,0052
0,1336
-0,4820
-0,4657
-0,4820
-0,4820
-0,2860
-0,4800
-0,4820
-0,4820
-0,3787
2,7629
-0,4799
2,2426

CO2
-0,3214
3,7242
0,0287
-0,0360
-0,3222
-0,2292
-0,3217
-0,3220
-0,2007
-0,3101
-0,3220
-0,3220
-0,3220
-0,0782
-0,3220
-0,3222

4.2. Clustering Data Emisi dengan Single Linkage. Langkah awal yang dilakukan adalah standardisasi satuan melalui persamaan (2.1) dan diperoleh hasil
pada Tabel 3. Langkah kedua, jarak setiap kategori sumber penghasil emisi dihitung dengan jarak kuadrat Euclidean yaitu persamaan (2.2). Jarak masing-masing
objek ditampilkan dalam matriks jarak yang ada dalam proximitry matrix yaitu
Tabel 4 dan Tabel 5. Langkah ketiga, membandingkan jarak ketakmiripan antar
objek dalam cluster satu dengan cluster lain melalui persamaan (2.3). Pada awal
proses dimiliki 16 cluster, lalu dihitung nilai jarak terdekat dari proximitry matrix.
commit to user
Jarak antara perkantoran dan mart & sejenisnya merupakan jarak terdekat yaitu
sebesar 0,000 sebagai satu cluster. Dilakukan perbaikan matriks jarak dari sisa 14
cluster lain yang belum digabung yaitu
Prodi Matematika

5

Desember 2015

perpustakaan.uns.ac.id

digilib.uns.ac.id

Tabel 3. Nilai Standardisasi Satuan untuk 16 Kategori Sumber Emisi
Kategori
Sumber
Bank
Perumahan
Sekolah
Restoran
SPBU
Perguruan Tinggi
Perkantoran
Mart dan Sejenisnya
Pasar
Bengkel
Konstruksi
Pergudangan
Zonasi Parkir
Pedagang Kaki Lima
Menara Pemancar
Parkir Dalam Area

Z-Score
SOx N M V OC P M 10
-0,3285
-0,4574 -0,4563
3,7132
-0,2779 -0,1553
0,0076
-0,1972 0,1268
-0,0563
-0,1213
0,302
-0,3535
3,318 -0,4603
0,0098
-0,448
-0,41
-0,3517
-0,4574 -0,4601
-0,3527
-0,458 -0,4602
-0,2252
-0,3506
-0,218
-0,3102
-0,4567 -0,4544
-0,3535
-0,458 0,2969
-0,3535
-0,458 0,1116
-0,3535
-0,4303 -0,4594
-0,061
1,3166 3,5905
-0,2778
-0,4563 -0,4481
-0,3535
0,3922 -0,4464

N Ox
-0,4908
2,9104
-0,1527
-0,1843
-0,5325
0,0037
-0,5299
-0,5313
-0,391
-0,4694
-0,5325
-0,5325
-0,4135
0,2371
-0,4044
2,0134

CO
-0,4812
-0,1527
-0,0052
0,1336
-0,482
-0,4657
-0,482
-0,482
-0,286
-0,48
-0,482
-0,482
-0,3787
2,7629
-0,4799
2,2426

CO2
-0,3214
3,7242
0,0287
-0,036
-0,3222
-0,2292
-0,3217
-0,322
-0,2007
-0,3101
-0,322
-0,322
-0,322
-0,0782
-0,322
-0,3222

d{(7, 8), (1)} = min{d(7, 1), d(8, 1)}
= min{0, 002; 0, 002}
= 0, 002
..
.
d{(7, 8), (16)} = min{d(7, 16), d(8, 16)}
= min{14, 613; 14, 622}
= 14, 613
Nilai jarak 0,002 adalah bank sebagai jarak terdekat selanjutnya dan dijadikan satu
cluster dengan sisa 13 cluster. Proses perbaikan matriks jarak kembali berulang dengan cara yang sama hingga semua sumber objek telah dibandingkan dan terbentuk
satu cluster keseluruhan.

Langkah keempat adalah menentukan banyaknya clus-

Tabel 4. Proximitry Matrix untuk Kategori Sumber Emisi 1-8
1
2
1 0 44,501
2
0
3
4
5
6
7
8
..
.

3
4
5
6
7
8
0,984
1,315 14,256 0,370
0,002
0,002
36,879 38,241 57,896 37,985 44,962 44,984
0 0,065 13,326 0,654
1,034
1,036
0
13,08
1,049
1,361
1,363
0 14,612 14,253 14,257
0 0,427
0,429
0
0
0

commit to user

16

ter berdasarkan dendogram yaitu Gambar 1. Pembentukan tiga cluster diperoleh
cluster memberships yaitu
Prodi Matematika

6

Desember 2015

perpustakaan.uns.ac.id

digilib.uns.ac.id

Tabel 5. Proximitry Matrix untuk Kategori Sumber Emisi 9-16
9
10
11
12
13
14
15
1 0,142
0,001
0,570
0,325
0,018 30,709 0,010
2 41,841 44,115 45,110 44,977 44,127 60,923 43,514
3
0,384
0,947
0,722
0,693
0,859 22,119 0,891
4
0,597
1,282
0,784
0,82
1,16 19,975 1,231
5 13,607 14,254 14,831 14,585 14,074 31,681 14,267
6
0,291
0,335
0,928
0,7
0,325 29,622
0,26
7
0159 0,006
0,573
0,327
0,025 30,815 0,021
8
0,16 0,006
0,573
0,327
0,025 30,822 0,022
9
0
0,13 0,366
0,21 0,105 27,011 0,120
10
0
0,57 0,326
0,016 30,638 0,005
11
0
0,034
0,598 25,264 0,577
12
0
352 26,519 0,335
13
0 29,892 0,017
14
0 30,488
15
0
16

16
14,412
39,987
10,674
10,272
22,465
12,221
14,613
14,622
12,808
14,3
15,18
14,939
13,437
20,722
13,983
0

(1) anggota cluster 1 adalah bank, sekolah, restoran, SPBU, perguruan tinggi,
perkantoran, mart & sejenisnya, pasar, bengkel, konstruksi, pergudangan,
zona parkir, menara pemancar dan parkir dalam area.
(2) anggota cluster 2 adalah pedagang kaki lima, dan
(3) anggota cluster 3 adalah perumahan.

Gambar 1. Dendogram dengan Single Linkage

commit to user
Langkah terakhir adalah memberi ciri spesifik untuk menggambarkan isi cluster tersebut melalui rata-rata emisi pada Tabel 6. Cluster pertama merupakan 14 kategori
sumber yang memiliki nilai rata-rata emisi dan beban polutan yang lebih rendah
Prodi Matematika

7

Desember 2015

perpustakaan.uns.ac.id

digilib.uns.ac.id

dari kategori sumber cluster lainnya. Pada cluster kedua memiliki nilai rata-rata
emisi kurang dari cluster ketiga, yang memiliki nilai rata-rata emisi tertinggi.
Tabel 6. Rata-Rata Emisi untuk 16 Kategori Sumber Emisi
No. Kategori Sumber
1
Bank
2
Perumahan
3
Sekolah
4
Restoran
5
SPBU
6
Perguruan Tinggi
7
Perkantoran
8
Mart dan Sejenisnya

Rata-Rata
1,196
5211,63
466,982
388,523
34,456
121,588
0,755
0,076

No. Kategori Sumber
Rata-Rata
9
Pasar
162,859
10
Bengkel
15,792
11
Konstruksi
2,04
12
Pergudangan
1,5407
13
Zonasi Parkir
2,9759
14
Pedagang Kaki Lima 422,497
15
Menara Pemancar
0,5653
16
Parkir Dalam Area
78,819

5. Kesimpulan
Berdasarkan pembahasan, dapat diambil kesimpulan bahwa hasil cluster yang
terbentuk dari data sumber emisi tahun 2011 adalah
(1) cluster pertama : bank, sekolah, restoran, SPBU, perguruan tinggi, perkantoran, mart dan sejenisnya, pasar, bengkel, konstruksi, pergudangan, zonasi
parkir, menara pemancar dan parkir dalam area sebagai kelompok nilai dengan emisi rendah,
(2) cluster kedua : pedagang kaki lima yang digolongkan sebagai kelompok dengan nilai emisi sedang, dan
(3) cluster ketiga : perumahan sebagai kelompok dengan nilai emisi tinggi.
DAFTAR PUSTAKA
1. Austin, E., B. Coull, D. Thomas, and P. Koutakris, A Framework for Identifying Distinct
Multipollutant Profiles in Air Pollution Data, Environment International Journal 45 (2012).
2. Billionnet, C., D. Sherrill, and I. A. Maesano, Estimating the Health Effects of Exposure to
Multi-Pollutant Mixture, AEP 22 (2012), 126–141.
3. Dinas Perhubungan Komunikasi dan Informatika Kota Surakarta, Uji Gas Emisi, Banyak
Mobil Melebihi Ambang Batas Gas Emisi, (2014).
4. Ismiyati, D. Marlita, dan D. Saidah, Pencemaran Udara Akibat Emisi Gas Buang Kendaraan
Bermotor, Jurnal Manajemen Transportasi dan Logistik 01 (2014), no. 03, 241–248.
5. Johnson, R.A., and D.W. Wichern, Applied Multivariate Statistical Analysis, fourth ed., Prentice Hall Inc., United States of America, 1998.
6. Daily Mail, Now that’s Global Warming: Interactive Maps Reveal which Countries have Emitted The Most CO2 Over The Last 160 Years, (2014).
7. Mubtada’i, N.R., M. Yuliana, dan B.I. Priyambodo, Analisa Perbandingan Clustering Metode
Manual dan Metode Single Linkage untuk Menentukan Kinerja Agent di Call Centre Berbasis Asterisk for Java, The 13th Industrial Electronics Seminar 2011 Electronic Engineering
Polytechnic Institute Of Surabaya (2011).
8. Plaisance, H., A. Blondel, V. Desauziers, and P. Mocho, Hierarchical Cluster Analysis of
Carbonyl Compounds Emission Profiles from Building And Furniture Materials, Building And
Environment Journal 75 (2014), 40–45.
commit
to user
9. Rencher, A.C., Methods of Multivariate
Analysis,
second ed., John Wiley and Sons Inc., United
States of America, 2002.
10. Warsito, B., D. Ispriyanti dan H. Widayanti, Clustering Data Pencemaran Udara Sektor Industri di Jawa Tengah dengan Kohonen Neural Network, Jurnal Presipitasi 4 (2008).

Prodi Matematika

8

Desember 2015