OPTIMALISASI PENGELOMPOKAN KECAMATAN BERDASARKAN INDIKATOR PENDIDIKAN MENGGUNAKAN METODE CLUSTERING DAN DAVIES BOULDIN INDEX
TINF-005
ISSN : 2407 - 1846
OPTIMALISASI PENGELOMPOKAN KECAMATAN BERDASARKAN
INDIKATOR PENDIDIKAN MENGGUNAKAN METODE CLUSTERING DAN
DAVIES BOULDIN INDEX
Firli Irhamni1
Fitri Damayanti2
[email protected]
Universitas Trunojoyo Madura
[email protected]
Universitas Trunojoyo Madura
Bain Khusnul K3
Mifftachul A4
[email protected]
Universitas Trunojoyo Madura
[email protected]
Universitas Trunojoyo Madura
ABSTRAK
Bidang pendidikan saat ini merupakan salah satu bidang prioritas yang diutamakan oleh
pemerintah. Diperlukan informasi pendukung mengenai kondisi pendidikan tersebut agar
perencanaan dan kebijakan pemerintah dapat tepat sasaran. Salah satu perencanaan yang
diharapkan pemerintah adalah pemerataan pendidikan. Indikator pendidikan terdapat pada
kecamatan sebagai salah satu organisasi pemerintah. Pengetahuan mengenai informasi pemerataan
pendidikan diperlukan untuk pengelompokan kecamatan berdasarkan indikator pendidikan.
Pengelompokan (clustering) merupakan salah satu metode data mining yang membagi data ke
dalam kelompok – kelompok yang mempunyai objek dengan kemiripan karakteristiknya. Salah
satu metode clustering adalah Self organizing Maps (SOM). Pada penelitian ini, akan
mengoptimalkan kelompok kecamatan untuk mendapatkan tingkat kemiripan yang terbaik
menggunakan metode Davies Bouildin Index (DBI) dari hasil pengelompokan kecamatan
menggunakan SOM. Pada uji coba yang telah dilakukan menggunakan jumlah kelompok dari tiga
sampai dengan sepuluh kelompok dengan menggunakan learning rate sebesar 0.9 dan nilai
centroid acak. Sehingga diperoleh kelompok kecamatan yang paling optimal berdasarkan
kemiripan karakteristiknya.
Kata Kunci: clustering, indikator pendidikan, Self Organizing Map (SOM), Davies Bouldin Index (DBI).
I.
Pendahuluan
Bidang pendidikan saat ini merupakan
salah satu bidang prioritas yang diutamakan
oleh pemerintah. Berdasarkan UU 20 / 2003
tentang Sisdiknas menyatakan bahwa anggaran
pendidikan sekurang-kurangnya adalah 20%
dari APBN. Tujuan dari Undang-Undang
tersebut supaya adanya peningkatan dan
pemerataan
pendidikan
di
Indonesia.
Pemerataan pendidikan diharapkan dapat
mengurangi kesenjangan pendidikan antara
suatu daerah dengan daerah lainnya. Diperlukan
informasi pendukung mengenai kondisi
pendidikan tersebut agar perencanaan dan
kebijakan pemerintah dapat tepat sasaran.
Salah satu perencanaan yang diharapkan
pemerintah adalah pemerataan pendidikan.
Untuk melakukan pemerataan pendidikan
menggunakan indikator pendidikan yang
terdapat pada kecamatan sebagai salah satu
organisasi pemerintah. Salah satu parameter
penyebab keberhasilan pendidikan dapat dilihat
dari indikator pendidikan di suatu daerah.
Kondisi pemerataan pendidikan disuatu daerah
dapat diukur dari rendahnya nilai Angka
Partisipasi Murni (APM) dan nilai Angka
Partisipasi Kasar (APK). Indikator lainnya yang
memepengaruhi kondisi pemerataan pendidikan
adalah factor yang berhubungan dengan sarana
dan prasarana pendidikan yaitu jumlah sekolah,
ruang kelas, dan tenaga pengajar [1].
Pengelompokkan kecamatan berdasarkan
tingkat pendidikan SMA/SMK/MA tersebut
menggunakan metode clustering yaitu Self
Organizing Map (SOM) yang dapat menangani
data dengan jumlah fitur yang cukup banyak.
Clustering data digunakan untuk membagi data
menjadi kelompok berdasar kemiripan pola
yaitu kesamaan indikator pendidikan. Hasil
clustering data tersebut kemudian diolah
dengan metode Davies Bouldin Index (DBI)
untuk menghasilkan jumlah cluster yang paling
optimal. Penelitian ini menggunakan data
Seminar Nasional Sains dan Teknologi 2014
Fakultas Teknik Universitas Muhammadiyah Jakarta , 12 November 2014
1
TINF-005
indikator pendidikan setiap kecamatan di
kabupaten Lamongan -Jawa Timur sebanyak 27
kecamatan dan 10 indikator pendidikan.
ISSN : 2407 - 1846
data dihitung dengan menggunakan rumus
persamaan 1 berikut [2]:
= ∑ (
−
)
(1)
II. Metode
dimana :
Clustering
Clustering merupakan salah satu metode
dalam
data
mining
yaitu
teknik
pengelompokkan data, pengamatan atau
memperhatiakn dan membentuk kelas obyek
yang memiliki kemiripan. Clustering tidak
mempunyai target output. Pada metode ini tidak
dapat ditentukan hasil output selama proses
pembelajaran. Selama proses pembelajaran,
nilai bobot disusun dalam suatu range tertentu
tergantung pada nilai input yang diberikan.
Tujuan
pembelajaran
ini
adalah
mengelompokkan unit-unit yang hampir sama
dalam suatu area tertentu. Clustering berbeda
dengan klasifikasi, dalam hal tidak ada variabel
target untuk clustering.
Clustering tidak
mengklasifikasikan,
meramalkan,
atau
memprediksi nilai dari sebuah variabel target
dan digunakan ketika kita tidak mengetahui
bagaimana data harus dikelompokkan.
Di
wij
xi
Self organizing maps (SOM)
SOM merupakan metode berdasarkan
model dari pendekatan jaringan syaraf tiruan.
SOM dikembangkan oleh Prof. Teuvo Kohonen
ilmuwan Finlandia pada tahun 1982. Jaringan
SOM merupakan suatu jaringan yang banyak
digunaan untuk membagi pola masukan ke
dalam bebrapa kelompok cluster. SOM
menyediakan suatu teknik visualisasi data yang
membantu memahami data yang memiliki
dimensi yang kompleks dengan mengurangi
dimensi data kedalam peta. Dalam nilai bobot
terdapat pola nilai input yang dikumpulkan
dalam cluster. Selama proses SOM, unit cluster
yang mempunyai nilai bobot akan dicocokkan
dengan pola input yang terdekat dan dilpilih
sebagai pemenang [2].
Euclidean Distance
Dari beberapa penelitian untuk clustering,
pengukuran jarak yang pada umumnya sering
digunakan adalah jarak Euclidean. Eucledian
Distance dianggap sebagai distance matrix yang
mengadopsi prinsip Phytagoras. Hal ini
dikarenakan
pola
perhitungannya
yang
menggunakan aturan pangkat dan akar kuadrat.
Eucledian akan memberikan hasil jarak yang
relatif kecil karena menggunakan aturan akar
kuadrat. Jarak antara Nilai Random/ Bobot dan
: Jarak Euclidean
: Bobot Neuron ke-i (bobot akhir)
: input vector ke xi
Davies Bouldin Index (DBI)
Davies Bouldin Index (DBI) diperkenalkan oleh
David L. Davies dan Donald W. Bouldin pada
tahun 1979 adalah metrik untuk mengevaluasi
hasil algoritma clustering [3].
Rancangan Sistem
Tahapan proses pada pada penelitian ini
sebagai berikut :
1. Menyiapkan data dari kecamatan dan
variabel indikator pendidikan.
2. Data indikator pendidikan akan diproses
menjadi data hasil normalisasi untuk input
indikator pendidikan.
3. Proses data kecamatan akan menggunakan
metode clustering SOM dan disimpan
dengan nama bobot termasuk melakukan
perhitungan jarak dengan menggunakan
Euclidean distance antar bobot tersebut.
4. Bobot yang sudah dihitung jaraknya
menggunakan Euclidean distance akan
ditampilkan dan berkelompok sesuai dengan
kesamaan karakteristik dari data tersebut.
Dari proses Clustering tersebut kemudian
dilakukan penilaian menggunakan DaviesBouldin Index (DBI) untuk menentukan jumlah
cluster paling optimal dalam proses Clustering
tersebut.
Sebelum menghitung Davies- Bouldin
Index (DBI) [3], dihitung terlebih dahulu
variance dari masing-masing cluster.
var( x)
1 N
( xi x ) 2
N 1 i 1
(2)
dimana :
: rata-rata dari cluster x dan N adalah
x
jumlah anggota cluster.
Kemudian menghitung Davies- Bouldin Index
(DBI) dengan persamaan :
DBI
1 k
. Ri
k i 1
Seminar Nasional Sains dan Teknologi 2014
Fakultas Teknik Universitas Muhammadiyah Jakarta , 12 November 2014
(3)
2
TINF-005
ISSN : 2407 - 1846
dengan
((0.274-0.18)2)+((0.188-0.79)2)+
((0.635-0.76)2)+((0-0)2)+((0-0.77)2)
+((1-0.97)2)+((0.475-023)2)+
((0.522-0.93)2)+((0.494-0.39)2)+
((0.26-0.03)2)
1.271
((0.274-0.43)2)+((0.188-0.99)2)+
((0.635-0.27)2)+((0-0.84)2)+((00.31)2)+((1-0.76)2)+((0.4750.14)2)+((0.522-0.73)2)+((0.4940.35)2)+((0.26-0.35)2)
1.844
D =
Ri max Rij
(4)
j 1,..k ,i j
dan
Rij
var(Ci ) var(C j )
(5)
|| ci c j ||
i j
=
D =
dimana :
Ci
III. Hasil dan Pembahasan
Data Uji Coba
Tabel 1. Tabel Data Indikator Pendidikan
No.
1
2
3
4
5
…
21
Kecamatan
Sukorame
Bluluk
ngimbang
sambeng
Mantup
…
Laren
solokuro
22
23
Paciran
brondong
24
25
=
: cluster i dan ci adalah centroid dari
cluster i.
Sarirejo
APM
14.5
47.587
48.349
13.105
52.398
…
20.855
4.611
27.033
10.078
5.686
APK
15.125
75.737
63.365
19.008
66.244
…
32.757
6.614
52.057
18.936
6.549
AT
APS
107.692 0
89.899 0.354
112.4 0.124
104.167 0
107.203 0
…
…
169.697 0
121.739 0
127.5 0.121
74.074 0
104.651 0
AU
0
0.354
0.124
0
0
0
0
0.121
0
0
Perhitungan dengan SOM Eucledian
Distance
Tahapan SOM menggunakan Eucledian
Distance adalah sebagai berikut:
1. Menentukan Learning rate secara manual :
0.6 setiap kenaikan epoch (iterasi)
learning rate = learning rate awal *0.5
2. Inisialisasi Bobot awal secara random
(Banyaknya Kriteria = Jumlah Data).
Pada tabel 2 menunjukkan bobot awal
dengan 3 Cluster.
3. Setelah didapat winner, maka dilakukan
update
bobot
dengan menggunakan
persamaan 6 :
wij (baru ) wij lama xi wij lama (6)
dimana :
Wij(baru)
Wij(lama)
:
:
:
:
Xi
Α
Update bobot
Bobot lama
Input data ke-Xi
Learning rate
Berikut contoh perhitungan update bobot
dengan
menggunakan
persamaan
6
(perhitungan setiap data menggunakan rumus
Euclidean Distance):
Update bobot
= [(0.42 0.6 0.79 0.26 0.57 0.69
0.94 0.17 0.52 0.12) + 0.6
[(0.274 0.188 0.635 0 0 1
0.475 0.522 0.494 0.26) (0.42 0.6 0.79 0.26 0.57 0.69
0.94 0.17 0.52 0.12)]]
= [0.332 0.353 0.697 0.104
0.228 0.876 0.661 0.381 0.504
0.204]
Jadi, bobot baru iterasi ke-1 untuk bobot data
selanjutnya seperti pada tabel 3 berikut:
Tabel 2. Bobot Awal
AP
M
0.42
0.18
0.43
AP
K
0.6
0.79
0.99
AT
0.7
9
0.7
6
0.9
9
AU
0.2
6
0.57
0.69
0.94
0.17
0.52
0.12
0
0.77
0.97
0.23
0.93
0.39
0.03
0.8
4
0.31
0.76
0.14
0.73
0.35
0.35
AL
RS/RB
RK/R
B
AP
S
RM/G
RM/S
Tabel 3.Update Bobot
APM
APK
AT
APS
AU
AL
RS/RB
RR-M/G R-M/S
K/RB
0.332 0.353 0.697
0.18 0.79 0.76
0.1
0
0.228 0.876
0.77 0.97
0.661
0.23
0.381
0.93
0.504
0.39
0.204
0.03
0.43
0.84
0.31
0.14
0.73
0.35
0.35
0.99
0.27
0.76
Untuk setiap data dihitung menggunakan
Selanjutnya hitung update bobot dan jarak
dengan Euclidean Distance. Berikut contoh
Euclidean untuk setiap bobot sampai data ke Xn.
perhitungan setiap data terhadap bobot
Bobot epoch 1 terakhir digunakan untuk bobot
menggunakan persamaan 1 :
awal epoch 2.
D =
((0.274-0.42)2)+((0.188-0.6)2)+
2
2
((0.635-0.79) )+((0-0.26) )+((00.57)2)+((1-0.69)2)+((0.475-0.94)2)
+((0.522-0.17)2)+((0.494-0.52)2)+
((0.26-12)2)
=
1.065
Seminar Nasional Sains dan Teknologi 2014
Fakultas Teknik Universitas Muhammadiyah Jakarta , 12 November 2014
3
TINF-005
ISSN : 2407 - 1846
Tabel 3 : Hasil Pembahasan
Cluster
Set
DBI
3
0,182
Cluster
yang
dihasilkan
3
4
0,139
4
5
0,526
5
Jumlah
anggota cluster
Cluster 1 : 13
Cluster 2 : 2
Cluster 3 : 12
Cluster 1 : 4
Cluster 2 : 4
Cluster 3 : 2
Cluster 4 : 17
Cluster 1 : 1
Cluster 2 : 3
Cluster 3 : 5
Cluster 4 : 2
Cluster 5 : 16
6
0,292
5
Cluster 1 : 1
Cluster 2 : 2
4. Melakukan perhitungan dari data X1 sampai
terakhir
(dinamakan
epoch1/iterasi1),
kemudian setelah perhitungan data X1terakhir, melakukan pengecekan bobot
(sebelum pindah ke epoch2.
Implementasi Davies- Bouldin Index (DBI)
Dalam penelitian ini menggunakan
percobaan perhitungan 3 sampai 10 cluster dan
menghasilkan hasil seperti terlihat dalam tabel
4.
Dari hasil perhitungan pada tabel 4
tersebut maka yang mempunyai DBI paling
rendah 0,139 adalah perhitungan dengan cluster
set 4 menghasilkan 4 cluster. Hasil kecamatan
masing-masing cluster tedapat pada table 4.
Cluster 3 : 6
Cluster 4 : 2
Cluster 5 : 16
7
1,081
5
Cluster 1 : 1
Cluster 2 : 1
Tabel 5. Data Kecamatan pada Cluster 4
Cluster 1
Karangbinangun
Kalitengah
Solokuro
Sarirejo
Cluster 3 : 3
Cluster 4 : 4
Cluster 5 : 18
8
0,436
6
Cluster 1 : 1
Cluster 2 : 2
Cluster 3 : 3
Cluster 4 : 4
Cluster 5 : 5
Cluster 2
Kembangbahu
Pucuk
Lamongan
Brondong
Cluster 3
Sukorame
Bluluk
Cluster 4
Ngimbang
Sambeng
Mantup
Sugio
Kedungpring
Modo
Babat
Sukodadi
Tikung
Deket
Glagah
Turi
Karanggeneng
Sekaran
Maduran
Laren
Paciran
Cluster 6 : 12
9
2,056
8
Cluster 1 : 1
Cluster 2 : 2
Cluster 3 : 2
Cluster 4 : 12
Cluster 5 : 1
Cluster 6 : 5
Cluster 7 : 2
Cluster 8 : 2
10
0,822
6
Cluster 1 : 1
Cluster 2 : 1
Cluster 3 : 5
Cluster 4 : 4
Cluster 5 : 10
IV. Simpulan dan Saran
Dari
hasil
penelitian
Optimalisasi
Pengelompokan
Kecamatan
Berdasarkan
Indikator Pendidikan Menggunakan Metode
Clustering dan Davies-Bouldin Index dapat
diambil simpulan sebagai berikut :
Penelitian ini memberikan kontribusi
terhadap
pengambilan kebijakan dari
pejabat yang berwenang . Hal ini
disebabkan metode Clustering dan DaviesBouldin Index akan menentukan kelompok
kecamatan
yang
paling
optimal
berdasarkan kemiripan kondisi kecamatan.
Penggunaan Davies-Bouldin Index (DBI)
menghasilkan cluster set yang paling
optimal.
Cluster 6 : 2
Cluster 7 : 1
Cluster 8 : 1
Cluster 9 : 2
Untuk pengembangan lebih lanjut serta
penyempurnaan perangkat lunak untuk
Pengelompokan
Kecamatan
Berdasarkan
Indikator Pendidikan menggunakan metode
Seminar Nasional Sains dan Teknologi 2014
Fakultas Teknik Universitas Muhammadiyah Jakarta , 12 November 2014
4
TINF-005
ISSN : 2407 - 1846
Clustering, aplikasi ini tidak hanya untuk
menentukan data pemerataan pendidikan saja,
tetapi juga untuk pengelompokkan data yang
lainnya. Disarankan untuk menggunakan
metode yang lain dan dibandingkan agar
kevalidannya lebih optimum.
V. Referensi
[1] Silia Karti, Hanna dan Irhamah. 2013.
Pengelompokkan
kabupaten/kota
di
propinsi jawa Timur Berdasarkan Indikator
Pendidikan
SMA/SMK/MA
dengan
Metode C-Means dan Fuzzy CMeans.Institut
teknologi
Sepuluh
Nopember (ITS). Surabaya Vol. 2(2),
2337-3520 (2301-928X Print).
[2] Pang-Ning Tan, Michael Steinbach, Vipin
Kumar, 2006. Introduction to Data
Mining. Addison Wesley.
[3] Davies, D. L.; Bouldin, D. W. "A Cluster
Separation Measure", IEEE Transactions
on Pattern Analysis and Machine
Intelligence (2): 224, 1979.
Seminar Nasional Sains dan Teknologi 2014
Fakultas Teknik Universitas Muhammadiyah Jakarta , 12 November 2014
5
ISSN : 2407 - 1846
OPTIMALISASI PENGELOMPOKAN KECAMATAN BERDASARKAN
INDIKATOR PENDIDIKAN MENGGUNAKAN METODE CLUSTERING DAN
DAVIES BOULDIN INDEX
Firli Irhamni1
Fitri Damayanti2
[email protected]
Universitas Trunojoyo Madura
[email protected]
Universitas Trunojoyo Madura
Bain Khusnul K3
Mifftachul A4
[email protected]
Universitas Trunojoyo Madura
[email protected]
Universitas Trunojoyo Madura
ABSTRAK
Bidang pendidikan saat ini merupakan salah satu bidang prioritas yang diutamakan oleh
pemerintah. Diperlukan informasi pendukung mengenai kondisi pendidikan tersebut agar
perencanaan dan kebijakan pemerintah dapat tepat sasaran. Salah satu perencanaan yang
diharapkan pemerintah adalah pemerataan pendidikan. Indikator pendidikan terdapat pada
kecamatan sebagai salah satu organisasi pemerintah. Pengetahuan mengenai informasi pemerataan
pendidikan diperlukan untuk pengelompokan kecamatan berdasarkan indikator pendidikan.
Pengelompokan (clustering) merupakan salah satu metode data mining yang membagi data ke
dalam kelompok – kelompok yang mempunyai objek dengan kemiripan karakteristiknya. Salah
satu metode clustering adalah Self organizing Maps (SOM). Pada penelitian ini, akan
mengoptimalkan kelompok kecamatan untuk mendapatkan tingkat kemiripan yang terbaik
menggunakan metode Davies Bouildin Index (DBI) dari hasil pengelompokan kecamatan
menggunakan SOM. Pada uji coba yang telah dilakukan menggunakan jumlah kelompok dari tiga
sampai dengan sepuluh kelompok dengan menggunakan learning rate sebesar 0.9 dan nilai
centroid acak. Sehingga diperoleh kelompok kecamatan yang paling optimal berdasarkan
kemiripan karakteristiknya.
Kata Kunci: clustering, indikator pendidikan, Self Organizing Map (SOM), Davies Bouldin Index (DBI).
I.
Pendahuluan
Bidang pendidikan saat ini merupakan
salah satu bidang prioritas yang diutamakan
oleh pemerintah. Berdasarkan UU 20 / 2003
tentang Sisdiknas menyatakan bahwa anggaran
pendidikan sekurang-kurangnya adalah 20%
dari APBN. Tujuan dari Undang-Undang
tersebut supaya adanya peningkatan dan
pemerataan
pendidikan
di
Indonesia.
Pemerataan pendidikan diharapkan dapat
mengurangi kesenjangan pendidikan antara
suatu daerah dengan daerah lainnya. Diperlukan
informasi pendukung mengenai kondisi
pendidikan tersebut agar perencanaan dan
kebijakan pemerintah dapat tepat sasaran.
Salah satu perencanaan yang diharapkan
pemerintah adalah pemerataan pendidikan.
Untuk melakukan pemerataan pendidikan
menggunakan indikator pendidikan yang
terdapat pada kecamatan sebagai salah satu
organisasi pemerintah. Salah satu parameter
penyebab keberhasilan pendidikan dapat dilihat
dari indikator pendidikan di suatu daerah.
Kondisi pemerataan pendidikan disuatu daerah
dapat diukur dari rendahnya nilai Angka
Partisipasi Murni (APM) dan nilai Angka
Partisipasi Kasar (APK). Indikator lainnya yang
memepengaruhi kondisi pemerataan pendidikan
adalah factor yang berhubungan dengan sarana
dan prasarana pendidikan yaitu jumlah sekolah,
ruang kelas, dan tenaga pengajar [1].
Pengelompokkan kecamatan berdasarkan
tingkat pendidikan SMA/SMK/MA tersebut
menggunakan metode clustering yaitu Self
Organizing Map (SOM) yang dapat menangani
data dengan jumlah fitur yang cukup banyak.
Clustering data digunakan untuk membagi data
menjadi kelompok berdasar kemiripan pola
yaitu kesamaan indikator pendidikan. Hasil
clustering data tersebut kemudian diolah
dengan metode Davies Bouldin Index (DBI)
untuk menghasilkan jumlah cluster yang paling
optimal. Penelitian ini menggunakan data
Seminar Nasional Sains dan Teknologi 2014
Fakultas Teknik Universitas Muhammadiyah Jakarta , 12 November 2014
1
TINF-005
indikator pendidikan setiap kecamatan di
kabupaten Lamongan -Jawa Timur sebanyak 27
kecamatan dan 10 indikator pendidikan.
ISSN : 2407 - 1846
data dihitung dengan menggunakan rumus
persamaan 1 berikut [2]:
= ∑ (
−
)
(1)
II. Metode
dimana :
Clustering
Clustering merupakan salah satu metode
dalam
data
mining
yaitu
teknik
pengelompokkan data, pengamatan atau
memperhatiakn dan membentuk kelas obyek
yang memiliki kemiripan. Clustering tidak
mempunyai target output. Pada metode ini tidak
dapat ditentukan hasil output selama proses
pembelajaran. Selama proses pembelajaran,
nilai bobot disusun dalam suatu range tertentu
tergantung pada nilai input yang diberikan.
Tujuan
pembelajaran
ini
adalah
mengelompokkan unit-unit yang hampir sama
dalam suatu area tertentu. Clustering berbeda
dengan klasifikasi, dalam hal tidak ada variabel
target untuk clustering.
Clustering tidak
mengklasifikasikan,
meramalkan,
atau
memprediksi nilai dari sebuah variabel target
dan digunakan ketika kita tidak mengetahui
bagaimana data harus dikelompokkan.
Di
wij
xi
Self organizing maps (SOM)
SOM merupakan metode berdasarkan
model dari pendekatan jaringan syaraf tiruan.
SOM dikembangkan oleh Prof. Teuvo Kohonen
ilmuwan Finlandia pada tahun 1982. Jaringan
SOM merupakan suatu jaringan yang banyak
digunaan untuk membagi pola masukan ke
dalam bebrapa kelompok cluster. SOM
menyediakan suatu teknik visualisasi data yang
membantu memahami data yang memiliki
dimensi yang kompleks dengan mengurangi
dimensi data kedalam peta. Dalam nilai bobot
terdapat pola nilai input yang dikumpulkan
dalam cluster. Selama proses SOM, unit cluster
yang mempunyai nilai bobot akan dicocokkan
dengan pola input yang terdekat dan dilpilih
sebagai pemenang [2].
Euclidean Distance
Dari beberapa penelitian untuk clustering,
pengukuran jarak yang pada umumnya sering
digunakan adalah jarak Euclidean. Eucledian
Distance dianggap sebagai distance matrix yang
mengadopsi prinsip Phytagoras. Hal ini
dikarenakan
pola
perhitungannya
yang
menggunakan aturan pangkat dan akar kuadrat.
Eucledian akan memberikan hasil jarak yang
relatif kecil karena menggunakan aturan akar
kuadrat. Jarak antara Nilai Random/ Bobot dan
: Jarak Euclidean
: Bobot Neuron ke-i (bobot akhir)
: input vector ke xi
Davies Bouldin Index (DBI)
Davies Bouldin Index (DBI) diperkenalkan oleh
David L. Davies dan Donald W. Bouldin pada
tahun 1979 adalah metrik untuk mengevaluasi
hasil algoritma clustering [3].
Rancangan Sistem
Tahapan proses pada pada penelitian ini
sebagai berikut :
1. Menyiapkan data dari kecamatan dan
variabel indikator pendidikan.
2. Data indikator pendidikan akan diproses
menjadi data hasil normalisasi untuk input
indikator pendidikan.
3. Proses data kecamatan akan menggunakan
metode clustering SOM dan disimpan
dengan nama bobot termasuk melakukan
perhitungan jarak dengan menggunakan
Euclidean distance antar bobot tersebut.
4. Bobot yang sudah dihitung jaraknya
menggunakan Euclidean distance akan
ditampilkan dan berkelompok sesuai dengan
kesamaan karakteristik dari data tersebut.
Dari proses Clustering tersebut kemudian
dilakukan penilaian menggunakan DaviesBouldin Index (DBI) untuk menentukan jumlah
cluster paling optimal dalam proses Clustering
tersebut.
Sebelum menghitung Davies- Bouldin
Index (DBI) [3], dihitung terlebih dahulu
variance dari masing-masing cluster.
var( x)
1 N
( xi x ) 2
N 1 i 1
(2)
dimana :
: rata-rata dari cluster x dan N adalah
x
jumlah anggota cluster.
Kemudian menghitung Davies- Bouldin Index
(DBI) dengan persamaan :
DBI
1 k
. Ri
k i 1
Seminar Nasional Sains dan Teknologi 2014
Fakultas Teknik Universitas Muhammadiyah Jakarta , 12 November 2014
(3)
2
TINF-005
ISSN : 2407 - 1846
dengan
((0.274-0.18)2)+((0.188-0.79)2)+
((0.635-0.76)2)+((0-0)2)+((0-0.77)2)
+((1-0.97)2)+((0.475-023)2)+
((0.522-0.93)2)+((0.494-0.39)2)+
((0.26-0.03)2)
1.271
((0.274-0.43)2)+((0.188-0.99)2)+
((0.635-0.27)2)+((0-0.84)2)+((00.31)2)+((1-0.76)2)+((0.4750.14)2)+((0.522-0.73)2)+((0.4940.35)2)+((0.26-0.35)2)
1.844
D =
Ri max Rij
(4)
j 1,..k ,i j
dan
Rij
var(Ci ) var(C j )
(5)
|| ci c j ||
i j
=
D =
dimana :
Ci
III. Hasil dan Pembahasan
Data Uji Coba
Tabel 1. Tabel Data Indikator Pendidikan
No.
1
2
3
4
5
…
21
Kecamatan
Sukorame
Bluluk
ngimbang
sambeng
Mantup
…
Laren
solokuro
22
23
Paciran
brondong
24
25
=
: cluster i dan ci adalah centroid dari
cluster i.
Sarirejo
APM
14.5
47.587
48.349
13.105
52.398
…
20.855
4.611
27.033
10.078
5.686
APK
15.125
75.737
63.365
19.008
66.244
…
32.757
6.614
52.057
18.936
6.549
AT
APS
107.692 0
89.899 0.354
112.4 0.124
104.167 0
107.203 0
…
…
169.697 0
121.739 0
127.5 0.121
74.074 0
104.651 0
AU
0
0.354
0.124
0
0
0
0
0.121
0
0
Perhitungan dengan SOM Eucledian
Distance
Tahapan SOM menggunakan Eucledian
Distance adalah sebagai berikut:
1. Menentukan Learning rate secara manual :
0.6 setiap kenaikan epoch (iterasi)
learning rate = learning rate awal *0.5
2. Inisialisasi Bobot awal secara random
(Banyaknya Kriteria = Jumlah Data).
Pada tabel 2 menunjukkan bobot awal
dengan 3 Cluster.
3. Setelah didapat winner, maka dilakukan
update
bobot
dengan menggunakan
persamaan 6 :
wij (baru ) wij lama xi wij lama (6)
dimana :
Wij(baru)
Wij(lama)
:
:
:
:
Xi
Α
Update bobot
Bobot lama
Input data ke-Xi
Learning rate
Berikut contoh perhitungan update bobot
dengan
menggunakan
persamaan
6
(perhitungan setiap data menggunakan rumus
Euclidean Distance):
Update bobot
= [(0.42 0.6 0.79 0.26 0.57 0.69
0.94 0.17 0.52 0.12) + 0.6
[(0.274 0.188 0.635 0 0 1
0.475 0.522 0.494 0.26) (0.42 0.6 0.79 0.26 0.57 0.69
0.94 0.17 0.52 0.12)]]
= [0.332 0.353 0.697 0.104
0.228 0.876 0.661 0.381 0.504
0.204]
Jadi, bobot baru iterasi ke-1 untuk bobot data
selanjutnya seperti pada tabel 3 berikut:
Tabel 2. Bobot Awal
AP
M
0.42
0.18
0.43
AP
K
0.6
0.79
0.99
AT
0.7
9
0.7
6
0.9
9
AU
0.2
6
0.57
0.69
0.94
0.17
0.52
0.12
0
0.77
0.97
0.23
0.93
0.39
0.03
0.8
4
0.31
0.76
0.14
0.73
0.35
0.35
AL
RS/RB
RK/R
B
AP
S
RM/G
RM/S
Tabel 3.Update Bobot
APM
APK
AT
APS
AU
AL
RS/RB
RR-M/G R-M/S
K/RB
0.332 0.353 0.697
0.18 0.79 0.76
0.1
0
0.228 0.876
0.77 0.97
0.661
0.23
0.381
0.93
0.504
0.39
0.204
0.03
0.43
0.84
0.31
0.14
0.73
0.35
0.35
0.99
0.27
0.76
Untuk setiap data dihitung menggunakan
Selanjutnya hitung update bobot dan jarak
dengan Euclidean Distance. Berikut contoh
Euclidean untuk setiap bobot sampai data ke Xn.
perhitungan setiap data terhadap bobot
Bobot epoch 1 terakhir digunakan untuk bobot
menggunakan persamaan 1 :
awal epoch 2.
D =
((0.274-0.42)2)+((0.188-0.6)2)+
2
2
((0.635-0.79) )+((0-0.26) )+((00.57)2)+((1-0.69)2)+((0.475-0.94)2)
+((0.522-0.17)2)+((0.494-0.52)2)+
((0.26-12)2)
=
1.065
Seminar Nasional Sains dan Teknologi 2014
Fakultas Teknik Universitas Muhammadiyah Jakarta , 12 November 2014
3
TINF-005
ISSN : 2407 - 1846
Tabel 3 : Hasil Pembahasan
Cluster
Set
DBI
3
0,182
Cluster
yang
dihasilkan
3
4
0,139
4
5
0,526
5
Jumlah
anggota cluster
Cluster 1 : 13
Cluster 2 : 2
Cluster 3 : 12
Cluster 1 : 4
Cluster 2 : 4
Cluster 3 : 2
Cluster 4 : 17
Cluster 1 : 1
Cluster 2 : 3
Cluster 3 : 5
Cluster 4 : 2
Cluster 5 : 16
6
0,292
5
Cluster 1 : 1
Cluster 2 : 2
4. Melakukan perhitungan dari data X1 sampai
terakhir
(dinamakan
epoch1/iterasi1),
kemudian setelah perhitungan data X1terakhir, melakukan pengecekan bobot
(sebelum pindah ke epoch2.
Implementasi Davies- Bouldin Index (DBI)
Dalam penelitian ini menggunakan
percobaan perhitungan 3 sampai 10 cluster dan
menghasilkan hasil seperti terlihat dalam tabel
4.
Dari hasil perhitungan pada tabel 4
tersebut maka yang mempunyai DBI paling
rendah 0,139 adalah perhitungan dengan cluster
set 4 menghasilkan 4 cluster. Hasil kecamatan
masing-masing cluster tedapat pada table 4.
Cluster 3 : 6
Cluster 4 : 2
Cluster 5 : 16
7
1,081
5
Cluster 1 : 1
Cluster 2 : 1
Tabel 5. Data Kecamatan pada Cluster 4
Cluster 1
Karangbinangun
Kalitengah
Solokuro
Sarirejo
Cluster 3 : 3
Cluster 4 : 4
Cluster 5 : 18
8
0,436
6
Cluster 1 : 1
Cluster 2 : 2
Cluster 3 : 3
Cluster 4 : 4
Cluster 5 : 5
Cluster 2
Kembangbahu
Pucuk
Lamongan
Brondong
Cluster 3
Sukorame
Bluluk
Cluster 4
Ngimbang
Sambeng
Mantup
Sugio
Kedungpring
Modo
Babat
Sukodadi
Tikung
Deket
Glagah
Turi
Karanggeneng
Sekaran
Maduran
Laren
Paciran
Cluster 6 : 12
9
2,056
8
Cluster 1 : 1
Cluster 2 : 2
Cluster 3 : 2
Cluster 4 : 12
Cluster 5 : 1
Cluster 6 : 5
Cluster 7 : 2
Cluster 8 : 2
10
0,822
6
Cluster 1 : 1
Cluster 2 : 1
Cluster 3 : 5
Cluster 4 : 4
Cluster 5 : 10
IV. Simpulan dan Saran
Dari
hasil
penelitian
Optimalisasi
Pengelompokan
Kecamatan
Berdasarkan
Indikator Pendidikan Menggunakan Metode
Clustering dan Davies-Bouldin Index dapat
diambil simpulan sebagai berikut :
Penelitian ini memberikan kontribusi
terhadap
pengambilan kebijakan dari
pejabat yang berwenang . Hal ini
disebabkan metode Clustering dan DaviesBouldin Index akan menentukan kelompok
kecamatan
yang
paling
optimal
berdasarkan kemiripan kondisi kecamatan.
Penggunaan Davies-Bouldin Index (DBI)
menghasilkan cluster set yang paling
optimal.
Cluster 6 : 2
Cluster 7 : 1
Cluster 8 : 1
Cluster 9 : 2
Untuk pengembangan lebih lanjut serta
penyempurnaan perangkat lunak untuk
Pengelompokan
Kecamatan
Berdasarkan
Indikator Pendidikan menggunakan metode
Seminar Nasional Sains dan Teknologi 2014
Fakultas Teknik Universitas Muhammadiyah Jakarta , 12 November 2014
4
TINF-005
ISSN : 2407 - 1846
Clustering, aplikasi ini tidak hanya untuk
menentukan data pemerataan pendidikan saja,
tetapi juga untuk pengelompokkan data yang
lainnya. Disarankan untuk menggunakan
metode yang lain dan dibandingkan agar
kevalidannya lebih optimum.
V. Referensi
[1] Silia Karti, Hanna dan Irhamah. 2013.
Pengelompokkan
kabupaten/kota
di
propinsi jawa Timur Berdasarkan Indikator
Pendidikan
SMA/SMK/MA
dengan
Metode C-Means dan Fuzzy CMeans.Institut
teknologi
Sepuluh
Nopember (ITS). Surabaya Vol. 2(2),
2337-3520 (2301-928X Print).
[2] Pang-Ning Tan, Michael Steinbach, Vipin
Kumar, 2006. Introduction to Data
Mining. Addison Wesley.
[3] Davies, D. L.; Bouldin, D. W. "A Cluster
Separation Measure", IEEE Transactions
on Pattern Analysis and Machine
Intelligence (2): 224, 1979.
Seminar Nasional Sains dan Teknologi 2014
Fakultas Teknik Universitas Muhammadiyah Jakarta , 12 November 2014
5