Spatial Outlier Detection On Bogor City Regional Election Data Based On Polling Center.

ABSTRACT

ADE TRISETYO. Spatial Outlier Detection On Bogor City Regional Election Data Based On Polling
Center. Under the direction of HARI AGUNG ADRIANTO.
Spatial outlier is a local instability (in values of non'spatial attributes) or a spatially referenced
object whose non'spatial attributes are significantly different from the object surrounding it, even
though the attributes may not significantly different from the entire population. Detecting spatial
outlier is very useful in the application of geographic information system as well as in the spatial data
base. This research focuses on the spatial outlier on Bogor City Regional Election Data in the 2008
election. Before starting the spatial outlier detection, the spatial outlier model was done visually by
using an equal interval and natural breaks methods. This research uses the iterative ratio and iterative
z'value algorithm. Both algorithms uses an iterative process. With this iterative process done by both
algorithm, the falsity of a spatial outlier detection can be minimized. One example algorithm that
potentially make a false detection is Moran scatterplot. For each iteration, there will be one detected
spatial outlier. To determine a spatial outlier, a comparison function is used. On iterative ratio
algorithm, a comparison function used is ratio function. On iterative z'value algorithm, a comparison
function used is the gap function which is later normalized. A polling center’s data is said to be a
spatial outlier if its value out of a comparison function exceeds the threshold. Threshold used in this
research is 3, it means that number of spatial outlier detected is 2% ' 5% from total data. Based on the
research done, the result being detected as the spatial outlier use in iterative ratio and iterative z'value
algorithm owns the difference in the detection amount. Iterative ratio and iterative z'value algorithm

can also reduce a false detection which is done by Moran scatterplot.
Keywords : spatial outlier, iterative z value algorithm, iterative ratio algorithm.

DETEKSI SPATIAL
AL OUTLIER
O
PADA DATA HASIL PILK
PILKADA
KOTA
OTA BOGOR BERDASARKA
TEMPA
EMPAT PEMU GUTA SUARA

ADE TRISETYO

DEPAR
PARTEME ILMU KOMPUTER
FAKULTAS MATEMA
TEMATIKA DA ILMU PE GETAHUA
A A

ALAM
I STITUT
STI
PERTA IA BOGOR
BOGOR
2009

DETEKSI SPATIAL
AL OUTLIER
O
PADA DATA HASIL PILK
PILKADA
KOTA
OTA BOGOR BERDASARKA
TEMPA
EMPAT PEMU GUTA SUARA

ADE TRISETYO

DEPAR

PARTEME ILMU KOMPUTER
FAKULTAS MATEMA
TEMATIKA DA ILMU PE GETAHUA
A A
ALAM
I STITUT
STI
PERTA IA BOGOR
BOGOR
2009

DETEKSI SPATIAL OUTLIER PADA DATA HASIL PILKADA
KOTA BOGOR BERDASARKA
TEMPAT PEMU GUTA SUARA

ADE TRISETYO

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada

Departemen Ilmu Komputer

DEPARTEME ILMU KOMPUTER
FAKULTAS MATEMATIKA DA ILMU PE GETAHUA ALAM
I STITUT PERTA IA BOGOR
BOGOR
2009

ABSTRACT

ADE TRISETYO. Spatial Outlier Detection On Bogor City Regional Election Data Based On Polling
Center. Under the direction of HARI AGUNG ADRIANTO.
Spatial outlier is a local instability (in values of non'spatial attributes) or a spatially referenced
object whose non'spatial attributes are significantly different from the object surrounding it, even
though the attributes may not significantly different from the entire population. Detecting spatial
outlier is very useful in the application of geographic information system as well as in the spatial data
base. This research focuses on the spatial outlier on Bogor City Regional Election Data in the 2008
election. Before starting the spatial outlier detection, the spatial outlier model was done visually by
using an equal interval and natural breaks methods. This research uses the iterative ratio and iterative
z'value algorithm. Both algorithms uses an iterative process. With this iterative process done by both

algorithm, the falsity of a spatial outlier detection can be minimized. One example algorithm that
potentially make a false detection is Moran scatterplot. For each iteration, there will be one detected
spatial outlier. To determine a spatial outlier, a comparison function is used. On iterative ratio
algorithm, a comparison function used is ratio function. On iterative z'value algorithm, a comparison
function used is the gap function which is later normalized. A polling center’s data is said to be a
spatial outlier if its value out of a comparison function exceeds the threshold. Threshold used in this
research is 3, it means that number of spatial outlier detected is 2% ' 5% from total data. Based on the
research done, the result being detected as the spatial outlier use in iterative ratio and iterative z'value
algorithm owns the difference in the detection amount. Iterative ratio and iterative z'value algorithm
can also reduce a false detection which is done by Moran scatterplot.
Keywords : spatial outlier, iterative z value algorithm, iterative ratio algorithm.

Judul

: Deteksi Spatial Outlier pada Data Pilkada Kota Bogor Berdasarkan Tempat Pemungutan
Suara
Nama : Ade Trisetyo
NRP : G64051366

Menyetujui:

Pembimbing,

Hari Agung Adrianto S.Kom, M.Si.
NIP 197609172005011001

Mengetahui :
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Dr. drh. Hasim, DEA
NIP 196103281986011002

Tanggal Lulus:

i

KATA PE GA TAR

Puji Syukur penulis panjatkan kepada Allah SWT atas segala rahmat dan karunia'Nya sehingga
penulis dapat menyelesaikan tugas akhir sebagai salah satu syarat untuk memperoleh gelar Sarjana

Komputer di FMIPA, IPB.
Terima kasih penulis ucapkan kepada semua pihak yang telah membantu penyelesaian tugas akhir
ini, antara lain kepada Bapak M. Syamsul Maarif dan Ibu Eka Budi Rahayu selaku kedua orang tua
penulis, dan kepada Fauzia Agustina Maarif dan Imam Fitrianto selaku kakak penulis yang selalu
memberikan motivasi, semangat, moril, materil, serta kasih sayang yang telah diberikan. Ucapan
terima kasih dan penghargaan yang setinggi'tingginya kepada Bapak Hari Agung, S.Kom, M.Si
selaku pembimbing atas dukungan, bimbingan, serta perhatiannya kepada penulis selama penelitian
berlangsung. Tidak lupa kepada semua dosen pengajar yang telah mendidik, membina, serta mengajar
penulis selama menjadi mahasiswi Departemen Ilmu Komputer. Ucapan terima kasih juga penulis
ucapkan kepada Lena, Mirna, Medria, Ijun, Indra, Huda, Dony, Ovie, Nila, dan seluruh rekan
Ilkomerz 42 atas kebersamaan serta pengalaman yang tak terlupakan.
Penulis menyadari bahwa pelaksanaan penelitian ini masih jauh dari kesempurnaan, namun besar
harapan penulis bahwa apa yang telah dikerjakan dapat memberikan manfaat bagi seluruh pihak.

Bogor, Juni 2009

Ade Trisetyo

ii


RIWAYAT HIDUP

Penulis dilahirkan di Bogor pada tanggal 10 September 1987 sebagai anak ke tiga dari Bapak M.
Syamsul Maarif dan Ibu Eka Budi Rahayu. Pada tahun 2002 penulis menempuh pendidikan di SMA
Negeri 5 Bogor hingga tahun 2005. Pada tahun yang sama penulis diterima sebagai mahasiswi
Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian
Bogor. Penulis tercatat sebagai finalis dalam Pagelaran Mahasiswa Teknologi Informasi Komunikasi
(GEMASTIK) tahun 2008 di bidang Data Mining. Pada tanggal 7 Juli 2008 penulis melaksanakan
Praktik Kerja Lapangan di Direktorat Jenderal Kelautan Pesisir dan Pulau'pulau Kecil Departemen
Kelautan Perikanan sampai dengan tanggal 25 Agustus 2008.

iii

DAFTAR ISI
Halaman
DAFTAR TABEL ............................................................................................................................. v
DAFTAR GAMBAR ........................................................................................................................ v
DAFTAR LAMPIRAN ..................................................................................................................... v
PENDAHULUAN
Latar Belakang ............................................................................................................................ 1

Tujuan.......................................................................................................................................... 1
Ruang Lingkup ............................................................................................................................ 1
Manfaat........................................................................................................................................ 1
TINJAUAN PUSTAKA
Praproses Data ............................................................................................................................. 1
Data Mining ................................................................................................................................ 2
Spatial Data Mining .................................................................................................................... 2
Spatial Outlier Detection ............................................................................................................. 2
K' earest eighbor .................................................................................................................... 3
Algoritme Iterative Ratio ............................................................................................................ 3
Algoritme Iterative Z value ......................................................................................................... 4
METODE PENELITIAN
Pengadaan Data ........................................................................................................................... 5
Praproses Data ............................................................................................................................. 5
Penggabungan Data ..................................................................................................................... 5
Pendugaan Spatial Outlier ........................................................................................................... 5
Load ke Matlab ............................................................................................................................ 6
Membentuk k'NN list .................................................................................................................. 6
Analisis Spatial Outlier ............................................................................................................... 6
Visualisasi ................................................................................................................................... 6

HASIL DAN PEMBAHASAN
Pengadaan Data ........................................................................................................................... 6
Praproses ..................................................................................................................................... 6
Penggabungan Data ..................................................................................................................... 7
Pendugaan Spatial Outlier ........................................................................................................... 7
Load ke Matlab ............................................................................................................................ 9
Membentuk K' earest eighbor List ......................................................................................... 9
Algoritme Iterative Ratio .......................................................................................................... 10
Algoritme Iterative Z value ....................................................................................................... 11
Visualisasi ................................................................................................................................. 11
KESIMPULAN DAN SARAN
Kesimpulan ................................................................................................................................ 12
Saran .......................................................................................................................................... 12
DAFTAR PUSTAKA ..................................................................................................................... 12
LAMPIRAN .................................................................................................................................... 13

iv

DAFTAR TABEL
Halaman

1
2
3
4
5
6
7
8
9

K'NN list......................................................................................................................................... 6
Representasi titik spasial ................................................................................................................. 7
Kandidat Pasangan Walikota dan Wakilnya ................................................................................... 7
Pembagian kelas persentase dengan Equal Interval........................................................................ 7
Persentase hasil Pilkada .................................................................................................................. 8
Pembagian kelas persentase dengan atural Breaks ...................................................................... 8
Persentase hasil Pilkada .................................................................................................................. 9
Matriks jarak antar titik ................................................................................................................... 9
Threshold untuk setiap kandidat pada algoritme Iterative Ratio....................................................10

DAFTAR GAMBAR
Halaman
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

Bentuk praproses data (Han dan Kamber 2006). ............................................................................ 1
Proses knowledge discovery in databases. ...................................................................................... 2
Global outlier (G) dan spatial outlier (S) (Lu et al. 2003). ............................................................ 2
Struktur Moran Scatterplot. ............................................................................................................ 3
Kesalahan deteksi spatial outlier pada Moran Scatterplot. ............................................................. 3
Kesalahan deteksi spatial outlier pada Moran Scatterplot. ............................................................. 4
Ilustrasi perhitungan set
k(xi), g(xi), dan h(xi). ........................................................................... 4
Tahap penelitian. ............................................................................................................................. 5
Global dan spatial outlier. .............................................................................................................. 7
Pembagian kelas persentase untuk kandidat D dengan Equal Interval . ......................................... 8
Spatial outlier dengan Equal Interval . ........................................................................................... 8
Spatial outlier dalam bentuk scatterplot. ........................................................................................ 8
Pembagian kelas persentase untuk kandidat D dengan atural Breaks. ......................................... 8
Spatial outlier dengan atural Breaks . .......................................................................................... 9
Spatial outlier dalam bentuk scatterplot ......................................................................................... 9
Struktur variabel S .......................................................................................................................... 9
Penentuan threshold .......................................................................................................................10
Visualisasi hasil deteksi spatial outlier ..........................................................................................11

DAFTAR LAMPIRA
Halaman
1
2
3
4
5
6
7
8
9
10
11

Pembagian Kelompok dengan Equal Interval................................................................................13
Visualisasi Equal Interval dalam Peta ...........................................................................................15
Pembagian Kelas dengan atural Breaks ......................................................................................16
Visualisasi atural Breaks dalam Peta ..........................................................................................17
Hasil Perhitungan k' earest eighbor List ( k(xi)) ...................................................................18
Hasil Perhitungan Fungsi Perbandingan h(xi) Algoritme Iterative Ratio ......................................21
Histogram nilai z dari fungsi h(xi) ..................................................................................................28
Hasil Deteksi Spatial Outlier dengan Algoritme Iterative Ratio ...................................................29
Hasil Perhitungan Fungsi Normalisasi y(xi) Algoritme Iterative Z value ......................................30
Hasil Deteksi Spatial Outlier dengan Algoritme Iterative Z value ................................................35
Visualisasi Algoritme Iterative Ratio dan Iterative Z value ..........................................................36

v

PE DAHULUA

Latar Belakang
Pemilihan Kepala Daerah dan Wakil Kepala
Daerah, atau seringkali disebut Pilkada, adalah
pemilihan umum untuk memilih Kepala Daerah
dan Wakil Kepala Daerah secara langsung di
Indonesia oleh penduduk daerah setempat yang
memenuhi syarat. Pilkada dilaksanakan setiap
lima tahun sekali. Pilkada Kota Bogor
dilaksanakan pada tanggal 25 Oktober 2008.
Hasil Pilkada Kota Bogor merupakan
akumulasi dari hasil perhitungan suara di setiap
Tempat Pemungutan Suara (TPS). Data hasil
pemilihan tersebut dikumpulkan oleh Komisi
Pemilihan Umum Daerah Kota Bogor.
Salah satu bentuk analisis yang dapat
diterapkan pada data hasil Pilkada adalah
deteksi pencilan (outlier detection). Pada
umumnya, TPS yang jaraknya berdekatan
memiliki hasil pemenang pemungutan suara
yang relatif sama. Data hasil Pilkada Kota
Bogor hanya memiliki atribut non'spasial,
sehingga hanya akan terdeteksi global outlier.
Jika data tersebut digabung dengan data spasial
Kota Bogor, spatial outlier dapat terdeteksi.
Spatial outlier adalah objek yang tereferensi
secara spasial di mana nilai atribut non'spasial
secara signifikan berbeda dari objek yang
tereferensi secara spasial di sekitarnya.
Proses analisis data yang besar dapat
menggunakan teknik data mining. Secara
khusus, jika data yang dianalisis merupakan
data spasial maka teknik tersebut disebut spatial
data mining. Salah satu teknik dalam spatial
data mining adalah spatial outlier detection.
Dalam teknik spatial outlier detection, terdapat
beberapa algoritme. Namun beberapa di
antaranya memiliki kelemahan yaitu masih
mengandung kesalahan dalam mendeteksi
spatial outlier yang sebenarnya. Penggunaan
algoritme Iterative Ratio dan Iterative Z value
dianggap dapat mengurangi kesalahan deteksi.
Penelitian ini akan mengimplementasikan kedua
algoritme tersebut untuk mendeteksi spatial
outlier pada data hasil Pilkada Kota Bogor.
Tujuan
Penelitian ini bertujuan untuk mendeteksi
data TPS di Kecamatan Bogor Tengah Kota
Bogor yang menjadi spatial outlier dengan
menggunakan algoritme Iterative Ratio dan
Iterative Z value.

Ruang Lingkup
Penelitian ini menggunakan data sekunder
hasil Pilkada Kota Bogor tahun 2008 yang
berasal dari Komisi Pemilihan Umum Daerah
(KPUD) Bogor daerah Kecamatan Bogor
Tengah.
Manfaat
Penelitian ini diharapkan dapat mengungkap
data pada TPS mana yang menjadi spatial
outlier. Dengan demikian, hasil tersebut dapat
dijadikan bahan untuk analisis lanjutan agar
dapat memahami proses politik yang terjadi.

TI JAUA PUSTAKA
Praproses Data
Data yang tersimpan dalam suatu basis data
seringkali tidak sempurna, mengandung noise
(data error), atau tidak konsisten. Oleh karena
itu, perlu dilakukan praproses data agar dapat
meningkatkan kualitas data yang pada akhirnya
akan meningkatkan akurasi dan efisiensi data
tersebut. Kualitas data akan menentukan
kualitas keputusan (Han & Kamber 2006).
Tahap dari praproses dapat dilihat pada Gambar
1 yang terdiri atas :

Data cleaning

Data integration

Data transformation
Data reduction

Gambar 1 Bentuk praproses data (Han &
Kamber 2006).
1 Pembersihan data
Permasalahan data
membersihkannya :

kotor

dan

cara

Nilai yang kosong
Untuk mengatasi nilai yang kosong
(missing values) dalam data dapat
dilakukan dengan penghapusan tuple,
mengisi dengan konstanta global

1

seperti ‘tidak tahu’ atau ‘∞’,
menggunakan nilaii rata
rata'rata dari nilai
atribut yang kosong, mengisi
me
dengan
nilai rata'rata dari
ri kelas yang sama,
atau mengisi dengan
engan nilai yang
mungkin dengan menggu
enggunakan metode
regresi, induksi pohon keputusan
(decision tree), dan
n lain sebagainya.
s
Nilai mengandung noise
oise
Data dengan nilai yang mengandung
noise dapat digantii dengan
deng nilai hasil
perhitungan dengann metode
me
binning,
metode regresi, atau dengan cara
clustering.
Data tidak konsisten
Data tidak konsisten
n diperbaiki
dipe
dengan
menggunakan referensi
rensi eksternal.
e
2 Integrasi data
oses penggabungan
Integrasi data adalah proses
data dari berbagai sumber
mber penyimpanan
data.
3 Transformasi data
Transformasi data akan mengubah
meng
data ke
dalam bentuk yang sesuai untuk
untu proses data
mining. Transformasi data mencakup
smoothing,
agregasi,
i,
generalisasi,
normalisasi, atau konstruksi
ksi atribut.
atri
4 Reduksi data
Teknik reduksi data seperti
erti aagregasi kubus
data, reduksi dimensi, kompresi
kompre data, atau
discretization dapat digunakan
digun
untuk
mereduksi
representasi
si
data
d
dengan
meminimalkan informasii yang hilang.
Data Mining
ah pros
proses pencarian
Data mining adalah sebuah
secara otomatis informasi yang
ang berguna
b
dalam
tempat penyimpanan data berukuran
berukur besar (Tan
et al. 2005). Istilah lain yang
ng seri
sering digunakan
diantaranya knowledge discovery
overy (mining) in
databases (KDD), knowledge
edge extraction,
data/pattern analysis, data archeology,
arc
data
dredging, information harvesting,
ting, dan business
intelligence. Teknik data minin
ining digunakan
untuk memeriksa basis data
ta berukuran
beru
besar
sebagai cara untuk menemukan
kan ppola yang baru
dan berguna.
Data mining adalah bagian
integral dari KDD. Keseluruhan
uruhan proses KDD
untuk konversi raw data ke dalam
dal
informasi
yang berguna ditunjukkan dalam Gambar
G
2.

Gambar 2 Proses knowledge discovery
disc
in
databases.
Spatial Data Mining
cu pada
pad ekstraksi
Spatial data mining mengacu
pengetahuan,
hubungan spasial,
asial, atau pola
menarik lainnya yang tidak secara
secar eksplisit
tersimpan pada basis data spasial
ial (Shekhar
(She
et al.
2003). Tantangan terbesar pada
ada spatial data
mining adalah proses eksplorasi.
si. Mengekstraksi
Me
pola yang menarik dan berguna
guna dari kumpulan
data spasial lebih sulit dibandingk
ndingkan dengan
mengekstraksi pola yang berhubunga
hubungan dengan
data kategorik. Hal ini disebabkan
disebabk
oleh
kompleksitas dari tipe data spasial,
pasial, hubungan
spasial, dan otokorelasi spasial.
Spatial Outlier Detection
di
Outlier secara informall didefinisikan
sebagai suatu pengamatan padaa kum
kumpulan data
di mana muncul ketidakkonsistenan
stenan suatu data
dengan data yang lainnya pada
da kumpulan
kum
data
yang sama, atau yang terdeviasi
si terlalu
terl
banyak
dari pengamatan yang lain dengan
ngan mekanisme
yang berbeda (Tan et al. 2005
2005). Secara
informal, spatial outlier merupakan
akan objek yang
tereferensi secara spasial di mana
ana atribut
a
non'
spasialnya relatif sangat berbeda dengan
lingkungannya (Shekhar et al. 2003).
200
Global
outlier merupakan objek yang
ng nilainya
nilain berbeda
secara signifikan dengan seluruh
h nilai yang ada.
Ilustrasi dari global outlier dan spatial
outlier terlihat pada Gambar 3. Pendeteksian
Pe
spatial outlier sangat bergunaa dalam
dala aplikasi
sistem informasi geografis dan basis data
spasial.

Gambar 3 Global outlier (G) dan spatial
spat outlier
(S) (Lu et al. 2003).

2

Sekumpulan data spasial dapat dimodelkan
sebagai kumpulan objek yang tereferensi secara
spasial. Objek spasial memiliki dua kategori
dimensi yang berbeda sesuai dengan atribut
mana yang akan diukur. Kategori tersebut
terdiri atas :
1

Atribut spasial dari objek yang tereferensi
secara spasial seperti lokasi, bentuk, dan
geometrik atau topologi lainnya.

2

Atribut non'spasial dari objek yang
tereferensi secara spasial seperti traffic
sensor identifiers, umur, dan pemilik.

K/ earest eighbor
earest
eighbor merupakan teknik
klasifikasi yang berdasarkan kedekatan objek.
Kedekatan disini didefinisikan dengan ukuran
jarak misalnya Euclidean. Jarak Euclidean antar
dua titik, misal Titik1=(x1, y1) dan Titik2=(x2,
y2) adalah (Han & Kamber 2006) :
Dist Titik1 ,Titik2 = (x1 'x2 )2 +(y1 'y2 )2
K earest
eighbor
(k'NN)
akan
mengklasifikasikan data terhadap k labeled data
terdekat. Algoritme untuk k earest eighbor
adalah :
1

Menentukan nilai k.

2

Menghitung jarak antar setiap titik.

3

Mengelompokkan dengan k titik terdekat
untuk setiap titik.

Algoritme Iterative Ratio
Tantangan yang perlu diperhatikan dalam
pendeteksian
spatial
outlier
adalah
meminimalkan kesalahan deteksi. Kesalahan
terjadi jika spatial outlier yang sebenarnya
akan diabaikan, sedangkan spatial outlier yang
bukan sebenarnya akan teridentifikasi atau
sebaliknya. Salah satu contoh algoritme yang
berpotensi melakukan kesalahan deteksi adalah
Moran Scatterplot.
Moran Scatterplot merupakan plot antara
nilai atribut yang telah dinormalisasi (sumbu x)
dengan nilai rataan tetangga atribut yang telah
dinormalisasi (sumbu y) (Luc 1995). Moran
Scatterplot memiliki empat kuadran. Jika objek
berada pada kuadran low outlier dan high
outlier, maka objek tersebut merupakan spatial
outlier. Low outlier adalah objek yang nilainya
rendah diantara objek yang nilainya tinggi.
High outlier adalah objek yang nilainya tinggi
diantara objek yang nilainya rendah. Jika objek
berada pada kuadran cluster, maka objek
tersebut bukan spatial outlier karena nilai dari

objek tersebut tidak berbeda dengan objek
tetangganya. Hal ini ditunjukkan oleh Gambar
4.

Gambar 4 Struktur Moran Scatterplot.
Kesalahan deteksi spatial outlier yang
dilakukan Moran Scatterplot diperlihatkan pada
Gambar 5 dan 6. Pada Gambar 5(a) dan Gambar
6(a), titik dibagi menjadi tiga kelas yaitu kelas
sedikit, sedang, dan banyak. Ketiga kelas ini
direpresentasikan dengan warna berbeda.
Warna hijau merepresentasikan kelas sedikit,
warna kuning merepresentasikan kelas sedang,
dan warna merah merepresentasikan kelas
banyak.
Titik dengan ID_OBJ=81 merupakan spatial
outlier. Pada Gambar 5(a) terlihat bahwa kelas
titik tersebut berbeda dengan kelas titik di
sekitarnya di mana kelas titik di sekitarnya
adalah kelas sedikit dan sedang. Dengan
menggunakan Morran Scatterplot, titik tersebut
tidak terdeteksi sebagai spatial outlier karena
titik berada pada kuadran cluster.
Spatial Outlier
dengan ID_OBJ=81

(a)

Spatial outlier

(b) Moran Scatterplot
Gambar 5 Kesalahan deteksi spatial outlier
pada Moran Scatterplot.

3

Moran
Scatterplot
juga
melakukan
kesalahan dengan mendeteksi suatu titik sebagai
spatial outlier, tetapi titik tersebut bukan
merupakan spatial outlier. Pada Gambar 6(a),
titik dengan ID_OBJ=136 bukan spatial outlier
karena tetangga dari titik tersebut kelasnya
sama yaitu kelas sedikit (warna hijau). Dengan
Moran Scatterplot, titik tersebut dianggap
sebagai spatial outlier karena berada pada
kuadran high outlier.

1

Untuk setiap titik spasial xi, dihitung k
nearest neighbors set
k(xi) dan fungsi
neighborhood g(xi)
g(xi )

1
k

f(x)


k (xi )

Dihitung juga fungsi hi = h(xi) = f(xi)/g(xi).
Gambar 7 memperlihatkan ilustrasi dari
perhitungan set
k(xi), g(xi), dan h(xi).

ID_OBJ=136

W Z/Score Attribute of values

(a) Spatial outlier
Low outlier

Gambar 7 Ilustrasi perhitungan set
g(xi), dan h(xi).

cluster

2

ID_OBJ=136
3
High outlier

cluster

Z/Score Attribute of values

(b) Morran Scatterplot

4

Gambar 6 Kesalahan deteksi spatial outlier
pada Moran Scatterplot.
Beberapa variabel yang digunakan dalam
algoritme Iterative Ratio dan Iterative Z value
adalah:
xi adalah titik spasial.

Algoritme Iterative Ratio adalah sebagai
berikut (Lu et al. 2003):

Nilai f(xq) diperbaharui sebagai g(xq).
Untuk setiap titik spasial xi di mana
k(xi)
mengandung xq, nilai g(xi) dan hi
diperbaharui.
Langkah 2, 3, dan 4 diulangi sampai nilai hi
tidak melebihi batas θ atau sampai total
jumlah S outlier sebesar m.

Algoritme Iterative Z value adalah sebagai
berikut (Lu et al. 2003):
1

f(x) adalah fungsi yang merepresentasikan
nilai atribut dari xi.

h(x) adalah fungsi yang digunakan untuk
membandingkan g dan f.

Misal hq menunjukkan nilai maksimum
dari h1, h2,…, hn Dengan batas θ yang telah
diketahui, jika hq ≥ θ, maka xq ditentukan
sebagai spatial outlier (S outlier).

Algoritme Iterative Z value

k(xi) adalah k nearest neighbors terhadap
titik x.

g(x) adalah fungsi yang memetakan X (data
set spasial) ke R (bilangan real). Fungsi ini
diimplementasikan dengan fungsi rataan.

k(xi),

Untuk setiap titik spasial xi, dihitung k
fungsi
nearest neighbors set
k(xi),
neighborhood g(xi).
g(xi )

1
k

f(x)


k (xi )

Dihitung juga fungsi hi=h(xi) = f(xi) – g(xi).
2

Misal µ dan σ menunjukkan rataan sampel
dan standar deviasi sampel dari suatu data
set {h1, h2,….,hn}. Selanjutnya, dihitung
nilai absolut yi untuk i = 1, 2,….,n.
hi µ ,
σ
Misal yq adalah nilai maksimum dari
y1,y2,…,yn. Dengan batas θ yang telah
yi =

4

diketahui, jika yq ≥ θ, maka xq ditentukan
S outlier.
3

Nilai f(xq) diperbaharui sebagai g(xq).
Untuk setiap titik spasial xi di mana
k(xi)
mengandung xq, nilai g(xi) dan hi
diperbaharui.

4

Nilai µ dan σ dihitung kembali pada data
set {h1, h2, …, hn}. Untuk i = 1,2,…,n, nilai
diperbaharui.

5

Langkah 2, 3, dan 4 diulangi sampai nilai yi
tidak melebihi batas θ atau sampai total
jumlah S outlier sebesar m.

Penggabungan Data
Proses spatial data mining memerlukan data
spasial dan non'spasial. Oleh karena itu, untuk
proses selanjutnya data spasial dan non'spasial
digabungkan.

Pada algoritme Iterative Ratio dan Iterative
Z value, jika S outlier terdeteksi, maka koreksi
akan dilakukan dengan segera. Koreksi yang
dilakukan adalah dengan
mengganti nilai
atribut S outlier dengan nilai rataan atribut di
sekitarnya. Dengan adanya koreksi ini dapat
mencegah titik normal yang berada dekat
dengan spatial outlier terdeteksi sebagai spatial
outlier.

METODE PE ELITIA
Penelitian ini dilakukan dalam beberapa
tahap seperti yang digambarkan pada Gambar 8
yaitu pengadaan data, praproses data,
penggabungan data, membentuk k'NN list,
analisis spatial outlier dengan algoritme
Iterative Ratio dan Iterative Z value, dan
visualisasi.
Pengadaan Data
Data hasil Pilkada Kota Bogor pada tahun
2008 diperoleh dari KPUD Kota Bogor. Karena
penelitian ini difokuskan pada kecamatan Bogor
Tengah, maka pengadaan data dilanjutkan
dengan meminta data pada Panitia Pemungutan
Suara (PPS) Bogor Tengah. Data tersebut
merupakan data yang memiliki atribut non'
spasial. Data yang juga diperlukan adalah data
spasial Kota Bogor.
Praproses Data
Praproses
dilakukan untuk data hasil
Pilkada dan peta. Beberapa tahapan yang
dilakukan dalam tahap praproses, di antaranya:
Pembersihan data
Transformasi data
Praproses
data
dilakukan
untuk
meningkatkan kualitas data yang dianalisis.
Dengan peningkatan kualitas data maka kualitas
hasil keputusan juga akan lebih baik.

Gambar 8 Tahap penelitian.
Pendugaan Spatial Outlier
Pada langkah ini, akan diduga data pada
TPS mana yang menjadi spatial outlier.
Pendugaan dilakukan dengan melihat pola
sebaran dari kelas persentase. Ada dua metode
yang digunakan yaitu Equal Interval dan
atural Breaks.
Equal interval merupakan proses pembagian
nilai menjadi beberapa kelas dengan interval
yang sama untuk setiap kelas. atural Breaks
merupakan proses pembagian nilai ke dalam
beberapa kelas dengan menggunakan algoritme
Jenk’s
Optimization.
Algoritme
Jenk’s
Optimization adalah sebagai berikut (Slocum
2004) :

5

1

Memilih atribut yang akan diklasifikasikan
ke dalam k kelas, misal atribut yang dipilih
adalah atribut x.

2

Sekumpulan k'1 nilai dibangkitkan secara
acak dalam selang [min{x}, max{x}].
Selang ini digunakan sebagai batas kelas.

3

Nilai rataan dan sum squared deviation
untuk setiap kelas dihitung, kemudian
dihitung pula total sum squared deviation
(TSSD).

4

Masing'masing nilai dalam setiap kelas
secara sistematik ditempatkan pada kelas
yang berdekatan dan batas kelas ditentukan
kembali. Nilai TSSD dihitung kembali.
Langkah 4 diulang sampai nilai TSSD di
bawah threshold.

pengambilan keputusan cukup sulit sehingga
diperlukan visualisasi dari hasil analisis. Setelah
proses analisis, akan didapat titik yang
merupakan spatial outlier. Titik yang menjadi
spatial outlier akan diberi tanda dengan warna
yang berbeda dari titik yang bukan merupakan
spatial outlier.

HASIL DA PEMBAHASA
Pengadaan Data
Pada penelitian ini, data yang tersedia
adalah sebagai berikut:
1

Kecamatan Bogor Tengah memiliki
sebanyak 189 TPS. Pada PILKADA 2008,
terdapat 5 kandidat pasangan walikota dan
wakilnya.

Load ke Matlab
Data hasil penggabungan selanjutnya diolah
menggunakan
Mapping Toolbox
dalam
MATLAB 7.0.1.
Membentuk k/

2

Praproses
Hasil dari praproses data adalah sebagai
berikut :
1

TPS k=1 k=2 k=3 k=4 k=5 k=6
2

18

3

21

22

17

2

3

1

18

9

4

21

3

2

1

4

18

17

21

4

17

5

3

19

6

1

5

6

4

17

7

19

20

Analisis Spatial Outlier
Setelah k'NN list dibentuk, langkah
selanjutnya adalah proses analisis. Pada proses
analisis diperlukan parameter threshold. Proses
analisis menggunakan algoritme Iterative Ratio
dan Iterative Z value.
Visualisasi
Visualisasi berguna untuk memudahkan
dalam merepresentasikan hasil analisis.
Visualisasi diimplementasikan dalam bentuk
peta. Jika masih berbentuk data, proses

Pembersihan data
Banyaknya TPS yang terdapat pada
peta lokasi TPS berbeda dengan banyaknya
TPS pada data hasil Pilkada. Jumlah TPS
yang digunakan pada penelitian ini adalah
jumlah TPS yang terdapat pada data hasil
Pilkada, sehingga dilakukan penghapusan
pada beberapa titik TPS di peta lokasi.

Tabel 1 K'NN list

1

Peta (data spasial)
Peta yang tersedia yaitu peta Kota
Bogor 1996.

list

K'NN list dibentuk untuk memudahkan
proses analisis spatial outlier dengan Algoritme
Iterative Ratio dan Iterative Z value. Dalam
membentuk k'NN list, terlebih dahulu
ditentukan nilai k. List ini berisi k'NN dari
setiap titik yang dibentuk dalam bentuk tabel.
Ilustrasi k'NN list diperlihatkan pada Tabel 1.

Data hasil Pilkada Bogor Tengah 2008
(data non spasial)

2

Transformasi data
Untuk kebutuhan perhitungan average
neighbor, dilakukan pengubahan format
data dan konstruksi atribut. Jumlah hasil
Pilkada diubah ke dalam bentuk persentase
di mana jumlah pemilih kandidat dibagi
dengan total jumlah pemilih di kelurahan
tersebut.
Konstruksi atribut dilakukan dengan
menambah atribut ID_TPS dan ID_OBJ.
ID_TPS merupakan identitas TPS setiap
kelurahan yang mengandung informasi
tentang kelurahan TPS dan nomor TPS.
ID_OBJ merupakan penomoran untuk
seluruh
TPS.
Titik
spasial
akan
direpresentasikan dengan angka mulai dari
1 sampai 189 (sesuai jumlah titik spasial).
Penomoran berdasarkan urutan kelurahan

6

yang dimulai dari kelurahan
keluraha Babakan
hingga Babakan Pasar dan di
dimulai dengan
koordinat x dari kanan ke kiri.
kiri Representasi
fungsi ini diperlihatkan
n oleh Tabel
T
2.

secara signifikan dengan seluruh
uh nilai
nila yang ada.
Pada spatial outlier, informasi yang diperlukan
tidak hanya nilai saja, tetapi diperl
diperlukan juga
atribut spasialnya.

Tabel 2 Representasi titik spasial
pasial TPS
TPS
Koordinat
x

elurahan
Koordinat Kelura
y

ID_OBJ

700010

9271060

B14

1

699968

9271130

B05

2

699913

9271076

B15

3









699589

9269404

BP12

188

699348

9269355

BP20

189

Penambahan kedua atribut ini dilakukan
untuk memudahkan identifikasi
identifi
spatial
outlier. Konstruksi jugaa dilakukan
dilaku
dengan
memisahkan data untuk
uk setiap
set
kandidat.
Terdapat lima kandidat
dat yang
ya
masing'
masing diberi simbol A, B, C, D, dan E
seperti yang terlihat pada
da Tabel
Tab 3.
Tabel 3 Kandidat Pasangan
n Walikota
Walik dan
Wakilnya
Simbol
A
B
C
D
E

ial ooutlier.
Gambar 9 Global dan spatial
Langkah awal sebelum menduga spatial
outlier adalah membagi data menjadi
menja 3 kelas
(sedikit, sedang, banyak) dengan
ngan metode
me
Equal
Interval dan atural breaks. Setiap
etiap ke
kelas diberi
warna yang berbeda kemudian
n divisualisasikan.
divisua
Titik hijau, kuning, dan merah
h masing'masing
mas
merepresentasikan persentase sedikit,
sediki sedang,
dan banyak.
Penjelasan proses pembagian
gian data
da adalah
sebagai berikut:
1

Hasil pembagian kelas untuk
unt
seluruh
TPS disajikan pada Tabel
abel 4. Hasil
pembagian kelas dalam bentuk
entuk histogram
untuk TPS D diperlihatkan
an pada
pad Gambar
10, sedangkan untuk TPS yang lain dapat
dilihat pada Lampiran 1.. Dengan
De
hasil
visualisasi menggunakan Equa
qual Interval,
dapat diduga TPS manaa yang
yan menjadi
spatial outlier dengan melihat
lihat warna
w
yang
berbeda dari warna di sekitarny
kitarnya. Contoh
ini diperlihatkan pada Gamba
ambar 11 yang
mengambil daerah kelurahan
rahan Babakan.
Untuk hasil visualisasi selengkapn
engkapnya, dapat
dilihat pada Lampiran 2. Dari Gambar
G
11
dapat dilihat bahwa titik
k merah
mera diduga
sebagai spatial outlier karena kelasnya
berbeda dari daerah sekitarnya
kitarnya, di mana
daerah sekitarnya dominan
n berwarna
berw
hijau
(kelas sedikit).

Nama
H. Syafei Bratasendjada
Bratase
Drs H. Akik
k Darul Tahkik
Ki Gendengg Pamungkas
Pam
KH. Drs Ahmad
d Chus
Chusairi,MM,
MA.
Dra. Iis Supriatini,
atini, M.Pd.
M
dan
dr.H. Ahani
hani Sp
Sp.PD
H. Dody Rosadi,
osadi, M.Eng
H. Erik Irawan
n Suganda,
Suga
MA.
Drs. H. Diani Budiarto,
Budia
M.Si.
Drh. Achmadd Ru’yat,
Ru’y M.Si

Penggabungan Data
Data spasial dan non'spasia
spasial yang telah
dipraproses digabungkan. Hal
al ya
yang dilakukan
adalah dengan menambahkan
an atri
atribut dari data
non'spasial ke data spasial.

Equal interval

ntase dengan
Tabel 4 Pembagian kelas persentase
Equal Interval

Pendugaan Spatial Outlier
Outlier dapat dideteksi secara global atau
secara spasial. Secara global,
bal, outlier mudah
ditemukan karena hanya memerlu
merlukan informasi
nilainya saja seperti yang terlihat
rlihat pada Gambar
9. Outlier akan memiliki nilai yang berbeda

Kelas (dalam
lam %
%)

Kandidat
Sedikit

Sedang

Banyak

A

1.1 ' 17.8

17.8 ' 34.4

34.4 ' 51.1

B

0 ' 15.5

15.5 ' 30.9

30.9 ' 46.5

7

Tabel 4 Lanjutan
Kelas (dalam
dalam %)

Kandidat
Sedikit

Sedang

Banyak

C

0–8

8 ' 16.1

16.1 ' 24.2

D

1.1 ' 17.7

17.7 ' 34.3

34.4 ' 50.9

E

27.9 ' 47.6

47.6 ' 67.2

67.2 ' 86.9

sedikit

Spatial Outlier juga dapat
at dilihat
dili
dalam
bentuk Scatterplot seperti yang
ng terl
terlihat pada
Gambar 12. Sumbu x dan sumbu
bu y merupakan
koordinat x dan y TPS. Sumbu
bu z merupakan
persentasi hasil Pilkada setiap TPS.
PS.

B02

banyak
sedang

Gambar 12 Spatial outlier dalam bentuk
Scatterplot.
2

atural Breaks
peroleh dengan
Hasil yang berbeda diperol
menggunakan
atural Breaks.
Break
Hasil
pembagian untuk seluruh TPS disajikan
pada Tabel 6. Hasil pembagian
agian kelas untuk
TPS
D dalam
bentuk
tuk
histogram
diperlihatkan Gambar 13 sedangkan
sedan
TPS
yang lain dapat dilihat pada
ada Lampiran
L
3.
Untuk menduga spatial outlier
lier, digunakan
cara yang sama dengan cara pada
pa Equal
Interval.

Gambar 10 Pembagian kelas
as persentase
pers
untuk
kandidat D dengan Equal Interval
I
.
ID_TPS=B02
ID_T

Tabel 6 Pembagian kelas persentase
ntase dengan
atural Breaks
Gambar 11 Spatial outlier dengan
deng Equal
Interval .
Tabel 5 menunjukkan posisi
osisi spatial outlier
(ID_OBJ=B02) yang ditunjukkan
ukkan oleh Gambar
11 dalam tabel, atribut persent
ersentase diurutkan
terlebih dahulu secara menaik.
naik. Dapat dilihat
bahwa spatial outlier tidak memi
memiliki nilai yang
berbeda secara signifikan dengan keseluruhan
nilai yang ada.

Kelas (dalam
alam %
%)

Kandidat
Sedikit

Sedang

Banyak

A

1.1 ' 9.9

9.9 – 20

20 ' 51.1

B

0 ' 9.6

9.6 ' 26.4

26.4 ' 46.5

C

0 ' 4.2

4.2 ' 7.5

7.5 ' 24.2

D

1.1 ' 11

11 ' 22.2

22.2 ' 50.9

E

27.9 ' 55.2

55.2 ' 68.5

68.5 ' 86.9

Tabel 5 Persentase hasil Pilkada
ID_OBJ

ID_TPS

Persentase
Pers

44

T05

0.012







78

CB03

0.34

5

B02

0.364

76

CB05

0.382







Spatial
Outlier

Gambar 13 Pembagian kelas persentase
persent
untuk
kandidat D dengan
atural
Breaks.

8

Dengan contoh daerah
aerah yang sama,
yakni kelurahan Babakan,
kan, secara visual
dapat diduga dua spatial
al outlier
out
seperti
yang ditunjukkan oleh Gambar
Gamb 14. Untuk
hasil visualisasi TPS yang
ng lai
lain dapat dilihat
pada Lampiran 4. Pada Gambar
Gam
14, kelas
yang dominan adalah
h kelas sedikit dan
kelas sedang. TPS yang
ng di
diduga sebagai
spatial outlier juga dapat dilihat dalam
bentuk tabel seperti pada Tabel 7 dan
dalam bentuk scatterplot seperti pada
Gambar 15.

sebagai sebuah variabel (misal S)) dengan
d
tipe
struct. Nomor indeks pada
da variabel
v
S
merepresentasikan urutan objek
ek bersangkutan
be
dalam shapefile. Ilustrasi struktur
ruktur variabel S
diperlihatkan Gambar 16.

ariabel S.
Gambar 16 Struktur variabel
Membentuk K/ earest eighbor List
Li
ID_TPS=B02

ID_TPS=B01

Implementasi dari algoritmee k'NN
k
adalah
sebagai berikut :
1

Nilai k ditentukan dengan
ngan menghitung
m
nilai rata'rata dari jumlah
h TPS di setiap
kelurahan. Hal ini dilakukan
dilaku
agar
pengelompokan dapat mewaki
ewakili data di
mana
proses
perhitungann
ungannya
tidak
mempertimbangkan batas kelurahan.
kelura
Nilai
rata'rata yang diperoleh adalah
dalah 18,1. Nilai
ini dibulatkan menjadi 19 karena
kare nilai k
umumnya ditentukan dalam
m jumlah
jum
ganjil
untuk menghindari munculnya
ulnya jumlah
ju
jarak
yang sama dalam proses pengkla
engklasifikasian.

Gambar 14 Spatial outlier dengan
deng
atural
Breaks .
kada
Tabel 7 Persentase hasil Pilkada
ID_OBJ

ID_TPS

Pers
Persentase

44

6


T05

B01


0.012
0.01

0.29
0.295

5
76


B02
CB05



0.36
0.364

Spatial
Outlier

Menentukan nilai k

2

Menghitung jarak setiap titik
tik TPS.
TPS
Untuk menghitung jarak,
arak, digunakan
perhitungan Euclidean lalu dibentuk
matriks jarak seperti yang
ng di
dicontohkan
pada Tabel 8.

0.382
0.38


Tabel 8 Matriks jarak antartitik

B02
B01

Gambar 15 Spatial outlier dalam
dal bentuk
Scatterplot.
Load ke Matlab
Data yang telah dipraproses
proses di load ke
Matlab. Dalam Matlab, dataa tersebut
terse
disimpan

xi

1

2

3

….

189

1

0

81.633

98.311

….

1829

2

81.63

0

77.078

….

1880.2

3

98.31

77.078

0

….

1811.4

4

241.35

244.81

167.76

….

1667.4

5

366.48

372.06

295.14

….

1567.3

….



....

….

….

…….

189

1829

1880.2

1811.4

….

0

3

Mengelompokkan setiap titik dengan k
nilai terdekat.
Setelah mendapatkan
n matriks
matri
jarak,
maka
langkah
selanjutnya
jutnya
adalah
mengelompokkan k terdekat
kat untuk
un
setiap

9

titik. Pada langkah ini, dihasil
dihasilkan k'nearest
neighbor list yang disajikan
ikan pada
p
Lampiran
5.

adalah T17, TPS kandidatt D adalah
ada
PL06,
dan TPS kandidat E adalah
h B12.

Algoritme Iterative Ratio
Implementasi algoritme
adalah sebagai berikut :
1

Iterative
Ite

Ratio

Menghitung fungsi neighborhoo
ghborhood g(xi).
g(xi )

1
k

f
f(x)


k (xi )

z=3

Dihitung juga fungsi hi = h(xi) =f(xi)/g(xi).
Langkah awal yang dilakukan
dilak
adalah
menghitung fungsi neighb
ighborhood yaitu
fungsi rataan. Untuk memban
embandingkan nilai
atribut persentase suatu
u TPS dengan TPS
tetangganya, dihitung fungsi
ungsi perbandingan
h(xi) yaitu fungsi perbandinga
ndingan rasio. Hasil
perhitungan
akhir
unt
untuk
fungsi
perbandingan diperlihatkan
tkan ppada Lampiran
6.
2

Proses selanjutnya adalah
alah mencari nilai
maksimum dari hasil perhitungan
perh
rasio
h(xi) untuk seluruh TPS.
PS. Jika
Ji nilai rasio
tersebut lebih dari θ (threshol
eshold) yang telah
ditentukan, maka TPS tersebut
terse
dianggap
sebagai spatial outlier.. Nilai θ akan
mempengaruhi banyaknya
nya spatial outlier
yang akan terdeteksi. Nilai θ ditentukan
dengan menormalisasikan
kan hasil
ha dari fungsi
perbandingan. Nilai ini
ni di
ditampilkan ke
bentuk histrogram, dari sini dapat
ditentukan nilai θ di mana
ana terdapat jarak
dari bin yang satu ke bin
n yang lain. Seluruh
histogram dapat dilihatt pada Lampiran 7.
Dari seluruh histogram, jarak rata'rata antar
bin tersebut terdapat pada
da nilai
nila lebih dari 3.
Nilai lebih dari 3 memiliki
iliki makna bahwa
jumlah outlier sebanyak
k kurang
kura lebih 2% '
5% dari data. Dengan demikian
dem
nilai 3
dijadikan sebagai threshold..
Nilai threshold sebesar
ar 3 dikembalikan
menjadi
nilai
h
dengan
den
fungsi

∗! +# sehingga
nilai
ni
threshold
masing'masing
kandidat
ndidat
berbeda.
Contohnya pada TPS dengan kandidat A,
penentuan threshold diperlihatkan
diperl
oleh
Gambar 17. Gambar 17 memperlihatkan
m
histogram persentase untuk kandidat A.
Daftar
threshold
setiap
kandidat
diperlihatkan oleh Tabel
bel 9. Saat iterasi
pertama, spatial outlier yang
ya
terdeteksi
pada TPS kandidat A adalah KK16, TPS
kandidat B adalah G03,
03, TPS
TP kandidat C



∗! +#

h = 3.067

Gambar 17 Penentuan threshold.
hold.
Tabel 9 Threshold untuk setiap kand
kandidat pada
algoritme Iterative Ratio
Kandidat

Threshold
hold

A

3.067

B

2.648

C

2.671

D

2.9

E

1.454

3

Langkah selanjutnya, titik
itik TPS
T
yang
dianggap sebagai spatial outl
outlier diganti
nilainya dengan nilai rataan
an tetangga
tet
dari
TPS tersebut. Dalam setiap
ap iterasi,
ite
hanya
akan terdeteksi satu spatial outl
outlier. Hal ini
dilakukan agar TPS tersebut
terse
tidak
terdeteksi kembali sebagai outlier
out
untuk
iterasi selanjutnya dan mencegah
menc
titik
normal yang berada dekatt dengan
deng spatial
outlier terdeteksi sebagai spatial
spat
outlier.
Fungsi neighborhood kemudia
mudian dihitung
kembali. Langkah ini dilakukan
dilakuka terus
sampai tidak ada nilai h(xi) yang melebihi
threshold.

4

Setelah proses iterasi selesai,
lesai, didapatkan
hasil deteksi spatial outlier.. Jum
Jumlah spatial
outlier yang terdeteksi untuk
tuk TPS
TP kandidat
A sebanyak 3, TPS kandidat
dat B sebanyak
s
2,

10

TPS kandidat C sebanyak 2, TPS kandidat
D sebanyak 4, dan TPS kandidat E
sebanyak 3. Rincian hasil deteksi spatial
outlier dapat dilihat pada Lampiran 8.
Berdasarkan hasil pendugaan spatial
outlier menggunakan metode Equal
Interval dan atural Breaks, titik dengan
ID_OBJ=136 bukan merupakan spatial
outlier. Dengan algoritme Iterative Ratio,
titik dengan ID_OBJ=136 tidak terdeteksi
sebagai spatial outlier, sedangkan dengan
menggunakan Moran Scatterplot titik
dengan ID_OBJ=136 terdeteksi sebagai
spatial outlier.

Jumlah spatial outlier yang terdeteksi untuk
TPS kandidat A sebanyak 12, TPS kandidat B
sebanyak 7, TPS kandidat C sebanyak 1, TPS
kandidat D sebanyak 3, dan TPS kandidat E
sebanyak 1. Rincian hasil deteksi spatial outlier
dapat dilihat pada Lampiran 10. Berdasarkan
hasil pendugaan spatial outlier menggunakan
metode Equal Interval dan atural Breaks, titik
dengan ID_OBJ=81 diduga sebagai spatial
outlier. Dengan algoritme Iterative Z value,
titik dengan ID_OBJ=81 terdeteksi sebagai
spatial outlier, sedangkan dengan menggunakan
Moran Scatterplot titik dengan ID_OBJ=81
tidak terdeteksi sebagai spatial outlier.

Algoritme Iterative Z value

Visualisasi

Implementasi algoritme Iterative Z value
adalah sebagai berikut :

Pada kedua algoritme Iterative Ratio dan
Iterative Z value, keluaran yang dihasilkan
berupa ID dari TPS yang merupakan spatial
outlier dan visualisasi dalam bentuk peta.
Dengan adanya visualisasi dalam bentuk peta,
lebih terlihat letak TPS yang merupakan spatial
outlier. Untuk contoh hasil visualisi algoritme
Iterative Ratio dan Iterative Z value pada TPS
dengan kandidat A diperlihatkan oleh Gambar
18, dan untuk kandidat yang lain dapat dilihat
pada Lampiran 11. Titik yang berwarna merah
merupakan TPS spatial outlier, sedangkan titik
yang berwarna biru merupakan TPS biasa.

1

Menghitung fungsi neighborhood g(xi).
g(xi )

1
k

f(x)


k (xi )

Dihitung juga fungsi hi = h(xi) = f(xi) –
g(xi).
Langkah awal yang dilakukan pada
algoritme Iterative Z value sama dengan
algoritme ratio, yaitu dengan menentukan
set NNk(xi) dan menghitung fungsi
neighborhood. Untuk membandingkan
atribut persentase suatu TPS dengan TPS
tetangganya, dihitung dengan fungsi
perbandingan selisih.
2

3

Nilai tersebut dinormalisasi dengan rataan
dan standar deviasi. Langkah selanjutnya,
seluruh nilai yang sudah dinormalisasi
dicari nilai maksimumnya. Jika nilai
maksimum lebih dari threshold, maka TPS
tersebut dianggap sebagai spatial outlier.
Penentuan threshold sama dengan pada
algoritme sebelumnya. Nilai threshold yang
digunakan adalah 3. Pada iterasi pertama,
spatial outlier yang terdeteksi pada TPS A
adalah S05, TPS B adalah T21, TPS C
adalah T17, TPS D adalah PL06, TPS E
adalah S05.
Sama halnya dengan algoritme Iterative
Ratio, jika terdeteksi suatu spatial outlier,
maka
fungsi
neighborhood,
fungsi
perbandingan, dan fungsi normalisasi
dihitung kembali. Jika tidak ada nilai
normalisasi yang lebih dari threshold, maka
iterasi selesai. Hasil akhir dari perhitungan
fungsi normalisasi diperlihatkan pada
Lampiran 9.

(a) Visualisasi algoritme Iterative Ratio

(b) Visualisasi algoritme Iterative Z value
Gambar 18 Visualisasi hasil deteksi
spatial outlier.

11

KESIMPULA DA SARA
Kesimpulan
Berdasarkan penelitian yang dilakukan
dalam mendeteksi spatial outlier pada data hasil
Pilkada Kota Bogor, dapat diambil kesimpula