OPTIMALISASI PENGELOMPOKAN KECAMATAN BERDASARKAN INDIKATOR PENDIDIKAN MENGGUNAKAN METODE CLUSTERING DAN DAVIES BOULDIN INDEX

TINF-005

ISSN : 2407 - 1846

OPTIMALISASI PENGELOMPOKAN KECAMATAN BERDASARKAN
INDIKATOR PENDIDIKAN MENGGUNAKAN METODE CLUSTERING DAN
DAVIES BOULDIN INDEX
Firli Irhamni1

Fitri Damayanti2

[email protected]
Universitas Trunojoyo Madura

[email protected]
Universitas Trunojoyo Madura

Bain Khusnul K3

Mifftachul A4


[email protected]
Universitas Trunojoyo Madura

[email protected]
Universitas Trunojoyo Madura

ABSTRAK
Bidang pendidikan saat ini merupakan salah satu bidang prioritas yang diutamakan oleh
pemerintah. Diperlukan informasi pendukung mengenai kondisi pendidikan tersebut agar
perencanaan dan kebijakan pemerintah dapat tepat sasaran. Salah satu perencanaan yang
diharapkan pemerintah adalah pemerataan pendidikan. Indikator pendidikan terdapat pada
kecamatan sebagai salah satu organisasi pemerintah. Pengetahuan mengenai informasi pemerataan
pendidikan diperlukan untuk pengelompokan kecamatan berdasarkan indikator pendidikan.
Pengelompokan (clustering) merupakan salah satu metode data mining yang membagi data ke
dalam kelompok – kelompok yang mempunyai objek dengan kemiripan karakteristiknya. Salah
satu metode clustering adalah Self organizing Maps (SOM). Pada penelitian ini, akan
mengoptimalkan kelompok kecamatan untuk mendapatkan tingkat kemiripan yang terbaik
menggunakan metode Davies Bouildin Index (DBI) dari hasil pengelompokan kecamatan
menggunakan SOM. Pada uji coba yang telah dilakukan menggunakan jumlah kelompok dari tiga
sampai dengan sepuluh kelompok dengan menggunakan learning rate sebesar 0.9 dan nilai

centroid acak. Sehingga diperoleh kelompok kecamatan yang paling optimal berdasarkan
kemiripan karakteristiknya.
Kata Kunci: clustering, indikator pendidikan, Self Organizing Map (SOM), Davies Bouldin Index (DBI).
I.

Pendahuluan

Bidang pendidikan saat ini merupakan
salah satu bidang prioritas yang diutamakan
oleh pemerintah. Berdasarkan UU 20 / 2003
tentang Sisdiknas menyatakan bahwa anggaran
pendidikan sekurang-kurangnya adalah 20%
dari APBN. Tujuan dari Undang-Undang
tersebut supaya adanya peningkatan dan
pemerataan
pendidikan
di
Indonesia.
Pemerataan pendidikan diharapkan dapat
mengurangi kesenjangan pendidikan antara

suatu daerah dengan daerah lainnya. Diperlukan
informasi pendukung mengenai kondisi
pendidikan tersebut agar perencanaan dan
kebijakan pemerintah dapat tepat sasaran.
Salah satu perencanaan yang diharapkan
pemerintah adalah pemerataan pendidikan.
Untuk melakukan pemerataan pendidikan
menggunakan indikator pendidikan yang
terdapat pada kecamatan sebagai salah satu
organisasi pemerintah. Salah satu parameter

penyebab keberhasilan pendidikan dapat dilihat
dari indikator pendidikan di suatu daerah.
Kondisi pemerataan pendidikan disuatu daerah
dapat diukur dari rendahnya nilai Angka
Partisipasi Murni (APM) dan nilai Angka
Partisipasi Kasar (APK). Indikator lainnya yang
memepengaruhi kondisi pemerataan pendidikan
adalah factor yang berhubungan dengan sarana
dan prasarana pendidikan yaitu jumlah sekolah,

ruang kelas, dan tenaga pengajar [1].
Pengelompokkan kecamatan berdasarkan
tingkat pendidikan SMA/SMK/MA tersebut
menggunakan metode clustering yaitu Self
Organizing Map (SOM) yang dapat menangani
data dengan jumlah fitur yang cukup banyak.
Clustering data digunakan untuk membagi data
menjadi kelompok berdasar kemiripan pola
yaitu kesamaan indikator pendidikan. Hasil
clustering data tersebut kemudian diolah
dengan metode Davies Bouldin Index (DBI)
untuk menghasilkan jumlah cluster yang paling
optimal. Penelitian ini menggunakan data

Seminar Nasional Sains dan Teknologi 2014
Fakultas Teknik Universitas Muhammadiyah Jakarta , 12 November 2014

1

TINF-005


indikator pendidikan setiap kecamatan di
kabupaten Lamongan -Jawa Timur sebanyak 27
kecamatan dan 10 indikator pendidikan.

ISSN : 2407 - 1846

data dihitung dengan menggunakan rumus
persamaan 1 berikut [2]:
= ∑ (



)

(1)
II. Metode

dimana :


Clustering
Clustering merupakan salah satu metode
dalam
data
mining
yaitu
teknik
pengelompokkan data, pengamatan atau
memperhatiakn dan membentuk kelas obyek
yang memiliki kemiripan. Clustering tidak
mempunyai target output. Pada metode ini tidak
dapat ditentukan hasil output selama proses
pembelajaran. Selama proses pembelajaran,
nilai bobot disusun dalam suatu range tertentu
tergantung pada nilai input yang diberikan.
Tujuan
pembelajaran
ini
adalah
mengelompokkan unit-unit yang hampir sama

dalam suatu area tertentu. Clustering berbeda
dengan klasifikasi, dalam hal tidak ada variabel
target untuk clustering.
Clustering tidak
mengklasifikasikan,
meramalkan,
atau
memprediksi nilai dari sebuah variabel target
dan digunakan ketika kita tidak mengetahui
bagaimana data harus dikelompokkan.

Di
wij
xi

Self organizing maps (SOM)
SOM merupakan metode berdasarkan
model dari pendekatan jaringan syaraf tiruan.
SOM dikembangkan oleh Prof. Teuvo Kohonen
ilmuwan Finlandia pada tahun 1982. Jaringan

SOM merupakan suatu jaringan yang banyak
digunaan untuk membagi pola masukan ke
dalam bebrapa kelompok cluster. SOM
menyediakan suatu teknik visualisasi data yang
membantu memahami data yang memiliki
dimensi yang kompleks dengan mengurangi
dimensi data kedalam peta. Dalam nilai bobot
terdapat pola nilai input yang dikumpulkan
dalam cluster. Selama proses SOM, unit cluster
yang mempunyai nilai bobot akan dicocokkan
dengan pola input yang terdekat dan dilpilih
sebagai pemenang [2].
Euclidean Distance
Dari beberapa penelitian untuk clustering,
pengukuran jarak yang pada umumnya sering
digunakan adalah jarak Euclidean. Eucledian
Distance dianggap sebagai distance matrix yang
mengadopsi prinsip Phytagoras. Hal ini
dikarenakan
pola

perhitungannya
yang
menggunakan aturan pangkat dan akar kuadrat.
Eucledian akan memberikan hasil jarak yang
relatif kecil karena menggunakan aturan akar
kuadrat. Jarak antara Nilai Random/ Bobot dan

: Jarak Euclidean
: Bobot Neuron ke-i (bobot akhir)
: input vector ke xi

Davies Bouldin Index (DBI)
Davies Bouldin Index (DBI) diperkenalkan oleh
David L. Davies dan Donald W. Bouldin pada
tahun 1979 adalah metrik untuk mengevaluasi
hasil algoritma clustering [3].
Rancangan Sistem
Tahapan proses pada pada penelitian ini
sebagai berikut :
1. Menyiapkan data dari kecamatan dan

variabel indikator pendidikan.
2. Data indikator pendidikan akan diproses
menjadi data hasil normalisasi untuk input
indikator pendidikan.
3. Proses data kecamatan akan menggunakan
metode clustering SOM dan disimpan
dengan nama bobot termasuk melakukan
perhitungan jarak dengan menggunakan
Euclidean distance antar bobot tersebut.
4. Bobot yang sudah dihitung jaraknya
menggunakan Euclidean distance akan
ditampilkan dan berkelompok sesuai dengan
kesamaan karakteristik dari data tersebut.
Dari proses Clustering tersebut kemudian
dilakukan penilaian menggunakan DaviesBouldin Index (DBI) untuk menentukan jumlah
cluster paling optimal dalam proses Clustering
tersebut.
Sebelum menghitung Davies- Bouldin
Index (DBI) [3], dihitung terlebih dahulu
variance dari masing-masing cluster.


var( x) 

1 N
 ( xi  x ) 2
N  1 i 1

(2)

dimana :
: rata-rata dari cluster x dan N adalah
x
jumlah anggota cluster.
Kemudian menghitung Davies- Bouldin Index
(DBI) dengan persamaan :

DBI 

1 k
. Ri
k i 1

Seminar Nasional Sains dan Teknologi 2014
Fakultas Teknik Universitas Muhammadiyah Jakarta , 12 November 2014

(3)

2

TINF-005

ISSN : 2407 - 1846

dengan

((0.274-0.18)2)+((0.188-0.79)2)+
((0.635-0.76)2)+((0-0)2)+((0-0.77)2)
+((1-0.97)2)+((0.475-023)2)+
((0.522-0.93)2)+((0.494-0.39)2)+
((0.26-0.03)2)
1.271
((0.274-0.43)2)+((0.188-0.99)2)+
((0.635-0.27)2)+((0-0.84)2)+((00.31)2)+((1-0.76)2)+((0.4750.14)2)+((0.522-0.73)2)+((0.4940.35)2)+((0.26-0.35)2)
1.844

D =

Ri  max Rij

(4)

j 1,..k ,i  j

dan

Rij 

var(Ci )  var(C j )

(5)

|| ci  c j ||

i j

=
D =

dimana :
Ci

III. Hasil dan Pembahasan
Data Uji Coba
Tabel 1. Tabel Data Indikator Pendidikan
No.
1
2
3
4
5

21

Kecamatan
Sukorame
Bluluk
ngimbang
sambeng
Mantup

Laren
solokuro

22
23

Paciran
brondong

24
25

=

: cluster i dan ci adalah centroid dari
cluster i.

Sarirejo

APM
14.5
47.587
48.349
13.105
52.398

20.855
4.611
27.033
10.078
5.686

APK
15.125
75.737
63.365
19.008
66.244

32.757
6.614
52.057
18.936
6.549

AT
APS
107.692 0
89.899 0.354
112.4 0.124
104.167 0
107.203 0


169.697 0
121.739 0
127.5 0.121
74.074 0
104.651 0

AU
0
0.354
0.124
0
0
0
0
0.121
0
0

Perhitungan dengan SOM Eucledian
Distance
Tahapan SOM menggunakan Eucledian
Distance adalah sebagai berikut:
1. Menentukan Learning rate secara manual :
0.6 setiap kenaikan epoch (iterasi)
learning rate = learning rate awal *0.5
2. Inisialisasi Bobot awal secara random
(Banyaknya Kriteria = Jumlah Data).
Pada tabel 2 menunjukkan bobot awal
dengan 3 Cluster.

3. Setelah didapat winner, maka dilakukan
update
bobot
dengan menggunakan
persamaan 6 :
wij (baru )  wij lama    xi  wij lama  (6)
dimana :
Wij(baru)
Wij(lama)

:
:
:
:

Xi

Α

Update bobot
Bobot lama
Input data ke-Xi
Learning rate

Berikut contoh perhitungan update bobot
dengan
menggunakan
persamaan
6
(perhitungan setiap data menggunakan rumus
Euclidean Distance):
Update bobot

= [(0.42 0.6 0.79 0.26 0.57 0.69
0.94 0.17 0.52 0.12) + 0.6
[(0.274 0.188 0.635 0 0 1
0.475 0.522 0.494 0.26) (0.42 0.6 0.79 0.26 0.57 0.69
0.94 0.17 0.52 0.12)]]
= [0.332 0.353 0.697 0.104
0.228 0.876 0.661 0.381 0.504
0.204]
Jadi, bobot baru iterasi ke-1 untuk bobot data
selanjutnya seperti pada tabel 3 berikut:

Tabel 2. Bobot Awal
AP
M
0.42
0.18
0.43

AP
K
0.6
0.79
0.99

AT
0.7
9
0.7
6
0.9
9

AU

0.2
6

0.57

0.69

0.94

0.17

0.52

0.12

0

0.77

0.97

0.23

0.93

0.39

0.03

0.8
4

0.31

0.76

0.14

0.73

0.35

0.35

AL

RS/RB

RK/R
B

AP
S

RM/G

RM/S

Tabel 3.Update Bobot
APM

APK

AT

APS

AU

AL

RS/RB

RR-M/G R-M/S
K/RB

0.332 0.353 0.697
0.18 0.79 0.76

0.1
0

0.228 0.876
0.77 0.97

0.661
0.23

0.381
0.93

0.504
0.39

0.204
0.03

0.43

0.84

0.31

0.14

0.73

0.35

0.35

0.99

0.27

0.76

Untuk setiap data dihitung menggunakan
Selanjutnya hitung update bobot dan jarak
dengan Euclidean Distance. Berikut contoh
Euclidean untuk setiap bobot sampai data ke Xn.
perhitungan setiap data terhadap bobot
Bobot epoch 1 terakhir digunakan untuk bobot
menggunakan persamaan 1 :
awal epoch 2.
D =
((0.274-0.42)2)+((0.188-0.6)2)+
2
2
((0.635-0.79) )+((0-0.26) )+((00.57)2)+((1-0.69)2)+((0.475-0.94)2)
+((0.522-0.17)2)+((0.494-0.52)2)+
((0.26-12)2)
=
1.065
Seminar Nasional Sains dan Teknologi 2014
Fakultas Teknik Universitas Muhammadiyah Jakarta , 12 November 2014

3

TINF-005

ISSN : 2407 - 1846

Tabel 3 : Hasil Pembahasan
Cluster
Set

DBI

3

0,182

Cluster
yang
dihasilkan
3

4

0,139

4

5

0,526

5

Jumlah
anggota cluster
Cluster 1 : 13
Cluster 2 : 2
Cluster 3 : 12
Cluster 1 : 4
Cluster 2 : 4
Cluster 3 : 2
Cluster 4 : 17
Cluster 1 : 1
Cluster 2 : 3
Cluster 3 : 5
Cluster 4 : 2
Cluster 5 : 16

6

0,292

5

Cluster 1 : 1
Cluster 2 : 2

4. Melakukan perhitungan dari data X1 sampai
terakhir
(dinamakan
epoch1/iterasi1),
kemudian setelah perhitungan data X1terakhir, melakukan pengecekan bobot
(sebelum pindah ke epoch2.

Implementasi Davies- Bouldin Index (DBI)
Dalam penelitian ini menggunakan
percobaan perhitungan 3 sampai 10 cluster dan
menghasilkan hasil seperti terlihat dalam tabel
4.
Dari hasil perhitungan pada tabel 4
tersebut maka yang mempunyai DBI paling
rendah 0,139 adalah perhitungan dengan cluster
set 4 menghasilkan 4 cluster. Hasil kecamatan
masing-masing cluster tedapat pada table 4.

Cluster 3 : 6
Cluster 4 : 2
Cluster 5 : 16
7

1,081

5

Cluster 1 : 1
Cluster 2 : 1

Tabel 5. Data Kecamatan pada Cluster 4
Cluster 1
Karangbinangun
Kalitengah
Solokuro
Sarirejo

Cluster 3 : 3
Cluster 4 : 4
Cluster 5 : 18
8

0,436

6

Cluster 1 : 1
Cluster 2 : 2
Cluster 3 : 3
Cluster 4 : 4
Cluster 5 : 5

Cluster 2
Kembangbahu
Pucuk
Lamongan
Brondong

Cluster 3
Sukorame
Bluluk

Cluster 4
Ngimbang
Sambeng
Mantup
Sugio
Kedungpring
Modo
Babat
Sukodadi
Tikung
Deket
Glagah
Turi
Karanggeneng
Sekaran
Maduran
Laren
Paciran

Cluster 6 : 12
9

2,056

8

Cluster 1 : 1
Cluster 2 : 2
Cluster 3 : 2
Cluster 4 : 12
Cluster 5 : 1
Cluster 6 : 5
Cluster 7 : 2
Cluster 8 : 2

10

0,822

6

Cluster 1 : 1
Cluster 2 : 1
Cluster 3 : 5
Cluster 4 : 4
Cluster 5 : 10

IV. Simpulan dan Saran
Dari
hasil
penelitian
Optimalisasi
Pengelompokan
Kecamatan
Berdasarkan
Indikator Pendidikan Menggunakan Metode
Clustering dan Davies-Bouldin Index dapat
diambil simpulan sebagai berikut :
 Penelitian ini memberikan kontribusi
terhadap
pengambilan kebijakan dari
pejabat yang berwenang . Hal ini
disebabkan metode Clustering dan DaviesBouldin Index akan menentukan kelompok
kecamatan
yang
paling
optimal
berdasarkan kemiripan kondisi kecamatan.
 Penggunaan Davies-Bouldin Index (DBI)
menghasilkan cluster set yang paling
optimal.

Cluster 6 : 2
Cluster 7 : 1
Cluster 8 : 1
Cluster 9 : 2

Untuk pengembangan lebih lanjut serta
penyempurnaan perangkat lunak untuk
Pengelompokan
Kecamatan
Berdasarkan
Indikator Pendidikan menggunakan metode

Seminar Nasional Sains dan Teknologi 2014
Fakultas Teknik Universitas Muhammadiyah Jakarta , 12 November 2014

4

TINF-005

ISSN : 2407 - 1846

Clustering, aplikasi ini tidak hanya untuk
menentukan data pemerataan pendidikan saja,
tetapi juga untuk pengelompokkan data yang
lainnya. Disarankan untuk menggunakan
metode yang lain dan dibandingkan agar
kevalidannya lebih optimum.
V. Referensi
[1] Silia Karti, Hanna dan Irhamah. 2013.
Pengelompokkan
kabupaten/kota
di
propinsi jawa Timur Berdasarkan Indikator
Pendidikan
SMA/SMK/MA
dengan
Metode C-Means dan Fuzzy CMeans.Institut
teknologi
Sepuluh
Nopember (ITS). Surabaya Vol. 2(2),
2337-3520 (2301-928X Print).
[2] Pang-Ning Tan, Michael Steinbach, Vipin
Kumar, 2006. Introduction to Data
Mining. Addison Wesley.
[3] Davies, D. L.; Bouldin, D. W. "A Cluster
Separation Measure", IEEE Transactions
on Pattern Analysis and Machine
Intelligence (2): 224, 1979.

Seminar Nasional Sains dan Teknologi 2014
Fakultas Teknik Universitas Muhammadiyah Jakarta , 12 November 2014

5