ANALISIS DATA KERAWANAN KECELAKAAN LALU LINTAS MENGGUNAKAN METODE K-MEANS (STUDI KASUS POLRES BANTUL)
Seminar Nasional Teknologi Informasi dan Multimedia 2017
ISSN : 2302-3805
STMIK AMIKOM Yogyakarta, 4 Februari 2017
ANALISIS DATA KERAWANAN KECELAKAAN
LALU LINTAS MENGGUNAKAN METODE K-MEANS
(STUDI KASUS POLRES BANTUL)
Eko Andriyanto Wicaksono1), Kusrini2), Emha Taufiq Lutfi3)
1)
Mahasiswa Magister Teknik Informatika , Dosen STMIK AMIKOM Yogyakarta2),3)
Jl Ring road Utara, Condongcatur, Sleman, Yogyakarta 55281
Email : [email protected]), [email protected]), [email protected])
diperkirakan angka korban kecelakaan lalu lintas akan
meningkat 2 kali lipat tiap tahunnya [2].
Abstrak
World Health Organization (WHO) mencatat hampir
3.400 orang meninggal dunia di jalan setiap hari.
Kecelakaan lalu lintas berada diurutan nomor 2
penyebab kematian setelah stroke. Kepolisian Republik
Indonesia (POLRI) mencatat setiap hari ada 80 orang
meninggal dunia akibat kecelakaan lalu lintas atau 3
orang per jam selama 2013.
Berbagai kebijakan dalam menekan angka kecelakaan
lalu lintas telah diterapkan oleh Satlantas Polres Bantul
diantaranya dengan rekayasa lalu lintas dan kegiatan
pendidikan masyarakat. Kebijakan tersebut tentunya
harus berasal dari data yang selama ini telah dihimpun.
Dengan bekal data kecelakaan lalu lintas, peneliti
memproses data menggunakan metode K-Means untuk
mencari informasi baru terkait waktu terjadinya
kecelakaan lalu lintas dan menganalisanya.
Dari analisa hasil pemrosesan menggunakan K-Means,
dapat disimpulkan bahwa waktu rawan kecelakaan lalu
lintas adalah malam hari yaitu dari pukul 19.30 sampai
dengan 23.59.
Kata kunci: K-Means, kecelakaan, lalu lintas, data
mining
1. Pendahuluan
World Health Organization (WHO) mencatat 34.153
orang meninggal dunia di jalan setiap hari [1].
Kepolisian Republik Indonesia (POLRI) mencatat setiap
hari ada 80 orang meninggal dunia akibat kecelakaan
lalu lintas atau 3 orang per jam selama 2013.
Satuan Lalu Lintas Polisi Resort Bantul (Satlantas Polres
Bantul) pada tahun 2015 mencatat telah terjadi 1.339
kecelakaan lalu lintas. Kecelakaan lalu lintas tersebut
mengakibatkan 70 orang korban meninggal dunia, 10
orang korban luka berat, 1.469 korban luka ringan dan
Rp 940.920.000,- kerugian material. Angka kecelakaan
lalu lintas tersebut terjadi peningkatan dari tahun
sebelumnya (2014) yaitu 857 jumlah kecelakaan.
Penanganan angka kecelakaan lalu lintas ini perlu
mendapat penanganan yang lebih efektif, jika tidak
Berbagai kebijakan dalam menekan angka kecelakaan
lalu lintas telah diterapkan oleh Satlantas Polres Bantul
diantaranya dengan rekayasa lalu lintas dan kegiatan
pendidikan masyarakat. Kebijakan tersebut tentunya
harus berasal dari data yang tersedia. Data yang direkam
pada suatu kecelakaan lalu lintas antar lain dimana,
kapan dan bagaimana kecelakaan terjadi. Satlantas
Polres Bantul telah memiliki sistem untuk mengarsipkan
setiap kejadian kecelakaan lalu lintas dari waktu ke
waktu. Berdasarkan rekaman data inilah secara rutin
Satlantas Polres Bantul merekapitulasi jumlah
kecelakaan, jumlah korban, dan jumlah kerugian
material disuatu wilayah yang kemudian dianalisis untuk
menentukan daerah yang rawan terhadap kecelakaan lalu
lintas.
Penelitian ini mengangkat tema pengelompokan data
kecelakaan lalu lintas. Pengelompokan tersebut
ditujukan untuk menentukan waktu rawan kecelakaan
lalu lintas. Metode yang digunakan untuk mencapai
tujuan adalah algoritma K-Means. Algoritma K-Means
dipilih
karena
algoritma
tersebut
mudah
diimplementasikan
dan
memiliki
kemampuan
mengelompokkan data yang besar. Adapun objek
penelitian adalah data kecelakaan lalu lintas di Polres
Bantul tahun 2014 dan 2015. Diharapkan dengan
penelitian ini membantu pihak kepolisan untuk menekan
jumlah kecelakaan lalu lintas.
Pelitian ini memiliki batasan sebagai berikut:
a. Lokasi studi adalah jalan nasional, jalan provinsi,
jalan kabupaten dan jalan kecamatan yang tercatat di
Satlantas Polres Bantul terhadap peristiwa
kecelakaan lalu lintas.
b. Data kecelakaan menggunakan data sekunder tahun
2014 dan 2015 yang diperoleh dari Satlantas Polres
Bantul.
c. Menggunakan data mining metode K-means
clustering untuk menentukan kerawanan kecelakaan
lalu lintas.
Data mining adalah suatu metode pengolahan data untuk
menemukan pola yang tersembunyi dari data tersebut.
Hasil dari pengolahan data dengan metode data mining
2.1-109
ISSN : 2302-3805
Seminar Nasional Teknologi Informasi dan Multimedia 2017
STMIK AMIKOM Yogyakarta, 4 Februari 2017
ini dapat digunakan untuk mengambil keputusan di masa
depan. Data mining ini juga dikenal dengan istilah
pattern recognition [3].
2. Pembahasan
K-means merupakan metode pengklasteran secara
partitioning yang memisahkan data ke dalam kelompok
yang berbeda. Dengan partitioning secara iteratif, KMeans mampu meminimalkan rata-rata jarak setiap data
ke klasternya [4].
Daerah rawan kecelakaan adalah suatu lokasi dimana
angka kecelakaan tinggi dengan kejadian kecelakaan
berulang dalam suatu ruang dan rentang waktu yang
relatif sama, diakibatkan oleh suatu penyebab tertentu.
Suatu daerah dinyatakan sebagai lokasi rawan
kecelakaan apabila memiliki kriteria sebagai berikut [5]:
1. Memiliki angka kecelakaan yang tinggi
2. Lokasi kejadian kecelakaan relatif menumpuk
3. Lokasi kecelakaan berupa simpangan atau segmen
ruas jalan sepanjang 100-300 m untuk jalan
perkotaan, ruas jalan sepanjang 1 km untuk jalan
antar kota.
4. Kecelakaan terjadi dalam ruang dan rentang waktu
yang relatif sama.
5. Memiliki penyebab kecelakaan dengan faktor yang
spesifik.
Untuk mengidentifikasi daerah rawan kecelakaan ada
dua tahapan yang harus dilewati [6], yaitu:
1. Mempelajari sejarah kecelakaan dari seluruh wilayah
studi untuk kemudian memilih lokasi yang diangap
rawan kecelakaan.
2. Mempelajari secara detail lokasi terpilih untuk
menemukan penanganan yang dapat dilakukan.
2.1. Data Selection
Data selection adalah tahap pemilihan data yang akan
diuji atau dievaluasi. Data yang dipilih dalam penelitian
ini adalah data kecelakaan lalu lintas Polres Bantul tahun
2014 sampai tahun 2015 yang berasal dari aplikasi
IRSMS (Integrated Road Safety Management System).
Database IRSMS terdiri dari 4 buah tabel yaitu tabel
KECELAKAAN, tabel KNDRAAN_PNGMDI, tabel
PENUMPANG dan tabel PJL_KAKI.
Gambar 2. Database
Sesuai kebutuhan peneliti maka data yang dipakai berada
di tabel KECELAKAAN. Tabel KECELAKAAN
mempunyai 20 atribut
Tabel 1. Atribut Tabel Kecelakaan
Penelitian ini menggunakan alur penelitian yang
tunjukkan pada gambar 1.
Gambar 1. Alur Penelitian
2.1-110
NO
NAMA
TIPE
1
Id_laka
Int
2
No_urut_laka
Int
3
Tgl
Date
4
Jam
Time
5
Latitude
Text
6
Longitude
Text
7
Tipe_laka
Text
8
Info_tmbhn
Text
9
Pencahayaan
Text
10
Cuaca
Text
11
Geometri_jln
Text
DESKRIPSI
Nomor kecelakaan, auto
numbering, primary key
Nomor urut kecelakaan,
nomor lokal
Tanggal, bulan dan
tahun kecelakaan
Waktu terjadinya
kecelakaan
Lokasi berdasarkan
garis lintang
Lokasi berdasarkan
garis bujur
Tipe kecelakaan: depanbelakang, depan-depan,
depan-samping dll
Pencahayaan: terang,
redup atau gelap
Cuaca: cerah, mendung,
hujan, kabut.
Geometri jalan:
simpang 4, simpang Y,
simpang T dll.
ISSN : 2302-3805
Seminar Nasional Teknologi Informasi dan Multimedia 2017
STMIK AMIKOM Yogyakarta, 4 Februari 2017
Text
Permukaan jalan: bagus
atau berlubang.
Fungsi jalan: kolektor,
arteri, lokal
Status jalan: desa,
kab/kota, provinsi,
nasioal.
Jumlah korban
meninggal dunia
Jumlah korban luka
berat
Jumlah korban luka
ringan
Nama jalan
Int
KM jalan (lokasi jalan)
12
Permukaan_jln
Text
13
Fungsi_jln
Text
14
Status_jln
Text
15
MD
Int
16
LB
Int
17
LR
Int
18
Nama_jln
19
Km_jln
20
Uraian_singkat
Text
Kronologi kejadian
secara singkat
Pada tabel KECELAKAAN dari tahun 2014 sampai
dengan 2015 data diperoleh sebanyak 2.182 data
kecelakaan.
2.2. Preprocessing
Pada tahap ini data diteliti untuk memastikan bahwa
tidak ada data kosong, data salah sebelum diproses.
Selain itu pada tahap ini data dilakukan proses
perubahan dari waktu (jam, menit) menjadi format
menit. Hal ini dilakukan untuk mempermudah proses
klustering.
Gambar 4. Hasil Klustering Waktu
2.4. Postprocessing
Setelah diperoleh hasil klustering diperoleh, langkah
selanjutnya adalah menggabungkan dengan data awal
(menggunakan Microsoft excel). Pada tahap ini
memastikan data valid dan bisa digunakan.
Tabel 1. Klustering (3 kluster)
2.3. Data Mining
Pada tahap ini data siap untuk diproses. Peneliti
menggunakan aplikasi Rapidminer untuk membantu
proses klustering menggunakan metode K-Means.
Jumlah kluster yang dicoba peneliti adalah 2, 3 dan 4.
Hasil clustering ditunjukkan pada tabel 1.
Keterangan
MD: Meninggal Dunia, LB : Luka Berat, LR: Luka
Ringan
2.5. Analisa Hasil
Dari proses klustering waktu kecelakaan lalu lintas
dengan jumlah kluster 2 dapat diperoleh informasi yang
ditunjukkan oleh tabel 2.
Gambar 3. Penggunaan Rapidminer
2.1-111
Seminar Nasional Teknologi Informasi dan Multimedia 2017
ISSN : 2302-3805
STMIK AMIKOM Yogyakarta, 4 Februari 2017
Tabel 2. Hasil clustering (2 kluster)
KLUSTER
WAKTU
JML
MD
LB
LR
0
15.15 – 23.59
1390
98
14
1588
1
00.05 – 15.10
791
59
12
953
Dengan proses klustering waktu kecelakaan lalu lintas
dengan jumlah kluster 3 dapat diperoleh informasi yang
ditunjukkan oleh tabel 3.
Tabel 3. Hasil clustering (3 kluster)
KLUSTER
WAKTU
JML
MD
LB
LR
0
18.25 - 23.59
1020
71
12
1145
1
11.59 - 18.20
652
42
6
786
2
00.05 - 11.50
509
44
8
610
3. Kesimpulan
Dengan proses klustering waktu kecelakaan lalu lintas
dengan jumlah kluster 4 dapat diperoleh informasi yang
ditunjukkan oleh tabel 4.
Tabel 4. Hasil clustering (4 kluster)
KLUSTER
WAKTU
JML
MD
LB
0
00.05- 08.55
253
32
6
279
1
19.30- 23.59
845
57
10
938
2
14.25- 19.25
633
45
5
767
3
09.00- 14.20
450
23
5
557
LR
Dengan proses klustering waktu kecelakaan lalu lintas
dengan jumlah kluster 5 dapat diperoleh informasi yang
ditunjukkan oleh tabel 5.
Tabel 5. Hasil clustering (5 kluster)
KLUSTER
JML
MD
LB
0
00:05-05:45
WAKTU
68
15
5
64
1
19:55-23:59
771
52
7
854
2
15:30-19:53
608
44
7
722
3
10:50-15:20
399
23
5
500
4
06:00-10:45
335
23
2
401
LR
Dengan proses klustering waktu kecelakaan lalu lintas
dengan jumlah kluster 6 dapat diperoleh informasi yang
ditunjukkan oleh tabel 6.
Tabel 6. Hasil clustering (6 kluster)
KLUSTER
WAKTU
JML
MD
LB
0
05:00-09:20
240
21
3
276
LR
1
09:25-13:05
311
16
1
399
2
20:30-23:59
685
45
5
763
3
16:55-20:25
539
38
7
629
4
00:05-04:45
48
12
4
44
5
13:10-16:50
358
25
6
430
Dari percobaan pengklusteran dengan jumlah kluster 2,
3, 4, 5 dan 6 dapat dihasilkan range waktu jumlah
kecelakaan lalu lintas dan jumlah korban. Semakin
banyak jumlah klusternya maka semakin detail range
waktu.
Dari tabel 6 ditunjukkan waktu rawan kecelakaan lalu
lintas terjadi dari pukul 20:30 sampai dengan 23:59
dengan jumlah kecelakaan 685, korban meninggal dunia
45 orang, korban luka berat 5 orang dan korban luka
ringan 763 orang.
Dari penelitian yang telah dilakukan terdapat beberapa
kesimpulan yaitu :
a. Jumlah kecelakaan paling tinggi terjadi pada pukul
19.55 sampai dengan 23.59 dengan jumlah
kecelakaan 771 (meningal dunia 52 orang, luka
berat 7 orang dan luka ringan 854 orang).
b. Jumlah kecelakaan paling rendah terjadi pada pukul
00.05 sampai dengan 05.45 dengan jumlah
kecelakaan 68 (minggal dunia 15 orang, luka berat
5 orang, dan luka ringan tidak ada).
c. Dari hasil kluster 4, 5 dan 6, kecelakaan tertinggi
terjadi pada malam hari.
d. Dari hasil kluster 1, 2, 3, 4, 5 dan 6, kecelakaan
paling rendah terjadi pada pagi/dini hari.
e. Semakin banyak jumlah kluster, maka semakin
akan diperoleh range waktu kecelakaan yang detail.
Daftar Pustaka
[1] WHO, “Global status report on road safety”, 2015.
[2] Prihartono, “Koordinasi Keselamatan Jalan (Implementasi RUNK
Jalan 2011-2035), Jakarta: Bappenas, 2012.
[3] B. Santosa, “Data Mining: Teknik Pemanfaatan Data untuk
Keperluan Bisnis”, Yogyakarta: Graha Ilmu, 2007.
[4] J.B. MacQueen, “Some Methods for classification and Analysis of
Multivariate Observastions, Proceedings of 5 th Berkeley
Symposium on Mathematical Statistics and Probablility,”
Berkeley: University of California Press.
[5] Depkimpraswil, “Penanganan Lokasi Rawan Kecelakaan Lalu
Lintas”, Departemen Pemukiman dan Prasarana Wilayah, Jakarta.
[6] A.S. Wedasana, “Analisa Daerah Rawan Kecelakaan dan
Penyusunan Database Berbasis Sistem Informasi Geografis (Studi
Kasus Kota Denpasar)”, Program Magister Teknik Sipil
Universitas Udayana Denpasar.
Biodata Penulis
Eko Andriyanto Wicaksono, memperoleh gelar Sarjana
Komputer (S.Kom), Jurusan Teknik Informatika STMIK
AMIKOM Yogyakarta, lulus tahun 2009.
Kusrini, memperoleh gelar Doktoral di Program Pasca
Sarjana Ilmu Komputer UGM pada tahun 2010.
Sebelumnya beliau mendapatkan gelar Magister Ilmu
Komputer (M.Kom) pada Program Pasca Sarjana Ilmu
Komputer UGM pada tahun 2006 dan sarjana Ilmu
Komputer dari Program Studi Ilmu Komputer UGM
pada tahun 2002. Kini menjadi dosen tetap Strata-1 dan
Pascasarjana di STMIK AMIKOM Yogyakarta.
2.1-112
Seminar Nasional Teknologi Informasi dan Multimedia 2017
STMIK AMIKOM Yogyakarta, 4 Februari 2017
Emha Taufik Lutfi, memperoleh gelar Magister Ilmu
Komputer (M.Kom) pada Program Pasca Sarjana Ilmu
Komputer UGM dan sarjana Teknik Elektro pada
Program Studi Teknik Elektro UGM. Kini menjadi
dosen tetap Strata-1 di STMIK AMIKOM Yogyakarta.
2.1-113
ISSN : 2302-3805
Seminar Nasional Teknologi Informasi dan Multimedia 2017
STMIK AMIKOM Yogyakarta, 4 Februari 2017
2.1-114
ISSN : 2302-3805
ISSN : 2302-3805
STMIK AMIKOM Yogyakarta, 4 Februari 2017
ANALISIS DATA KERAWANAN KECELAKAAN
LALU LINTAS MENGGUNAKAN METODE K-MEANS
(STUDI KASUS POLRES BANTUL)
Eko Andriyanto Wicaksono1), Kusrini2), Emha Taufiq Lutfi3)
1)
Mahasiswa Magister Teknik Informatika , Dosen STMIK AMIKOM Yogyakarta2),3)
Jl Ring road Utara, Condongcatur, Sleman, Yogyakarta 55281
Email : [email protected]), [email protected]), [email protected])
diperkirakan angka korban kecelakaan lalu lintas akan
meningkat 2 kali lipat tiap tahunnya [2].
Abstrak
World Health Organization (WHO) mencatat hampir
3.400 orang meninggal dunia di jalan setiap hari.
Kecelakaan lalu lintas berada diurutan nomor 2
penyebab kematian setelah stroke. Kepolisian Republik
Indonesia (POLRI) mencatat setiap hari ada 80 orang
meninggal dunia akibat kecelakaan lalu lintas atau 3
orang per jam selama 2013.
Berbagai kebijakan dalam menekan angka kecelakaan
lalu lintas telah diterapkan oleh Satlantas Polres Bantul
diantaranya dengan rekayasa lalu lintas dan kegiatan
pendidikan masyarakat. Kebijakan tersebut tentunya
harus berasal dari data yang selama ini telah dihimpun.
Dengan bekal data kecelakaan lalu lintas, peneliti
memproses data menggunakan metode K-Means untuk
mencari informasi baru terkait waktu terjadinya
kecelakaan lalu lintas dan menganalisanya.
Dari analisa hasil pemrosesan menggunakan K-Means,
dapat disimpulkan bahwa waktu rawan kecelakaan lalu
lintas adalah malam hari yaitu dari pukul 19.30 sampai
dengan 23.59.
Kata kunci: K-Means, kecelakaan, lalu lintas, data
mining
1. Pendahuluan
World Health Organization (WHO) mencatat 34.153
orang meninggal dunia di jalan setiap hari [1].
Kepolisian Republik Indonesia (POLRI) mencatat setiap
hari ada 80 orang meninggal dunia akibat kecelakaan
lalu lintas atau 3 orang per jam selama 2013.
Satuan Lalu Lintas Polisi Resort Bantul (Satlantas Polres
Bantul) pada tahun 2015 mencatat telah terjadi 1.339
kecelakaan lalu lintas. Kecelakaan lalu lintas tersebut
mengakibatkan 70 orang korban meninggal dunia, 10
orang korban luka berat, 1.469 korban luka ringan dan
Rp 940.920.000,- kerugian material. Angka kecelakaan
lalu lintas tersebut terjadi peningkatan dari tahun
sebelumnya (2014) yaitu 857 jumlah kecelakaan.
Penanganan angka kecelakaan lalu lintas ini perlu
mendapat penanganan yang lebih efektif, jika tidak
Berbagai kebijakan dalam menekan angka kecelakaan
lalu lintas telah diterapkan oleh Satlantas Polres Bantul
diantaranya dengan rekayasa lalu lintas dan kegiatan
pendidikan masyarakat. Kebijakan tersebut tentunya
harus berasal dari data yang tersedia. Data yang direkam
pada suatu kecelakaan lalu lintas antar lain dimana,
kapan dan bagaimana kecelakaan terjadi. Satlantas
Polres Bantul telah memiliki sistem untuk mengarsipkan
setiap kejadian kecelakaan lalu lintas dari waktu ke
waktu. Berdasarkan rekaman data inilah secara rutin
Satlantas Polres Bantul merekapitulasi jumlah
kecelakaan, jumlah korban, dan jumlah kerugian
material disuatu wilayah yang kemudian dianalisis untuk
menentukan daerah yang rawan terhadap kecelakaan lalu
lintas.
Penelitian ini mengangkat tema pengelompokan data
kecelakaan lalu lintas. Pengelompokan tersebut
ditujukan untuk menentukan waktu rawan kecelakaan
lalu lintas. Metode yang digunakan untuk mencapai
tujuan adalah algoritma K-Means. Algoritma K-Means
dipilih
karena
algoritma
tersebut
mudah
diimplementasikan
dan
memiliki
kemampuan
mengelompokkan data yang besar. Adapun objek
penelitian adalah data kecelakaan lalu lintas di Polres
Bantul tahun 2014 dan 2015. Diharapkan dengan
penelitian ini membantu pihak kepolisan untuk menekan
jumlah kecelakaan lalu lintas.
Pelitian ini memiliki batasan sebagai berikut:
a. Lokasi studi adalah jalan nasional, jalan provinsi,
jalan kabupaten dan jalan kecamatan yang tercatat di
Satlantas Polres Bantul terhadap peristiwa
kecelakaan lalu lintas.
b. Data kecelakaan menggunakan data sekunder tahun
2014 dan 2015 yang diperoleh dari Satlantas Polres
Bantul.
c. Menggunakan data mining metode K-means
clustering untuk menentukan kerawanan kecelakaan
lalu lintas.
Data mining adalah suatu metode pengolahan data untuk
menemukan pola yang tersembunyi dari data tersebut.
Hasil dari pengolahan data dengan metode data mining
2.1-109
ISSN : 2302-3805
Seminar Nasional Teknologi Informasi dan Multimedia 2017
STMIK AMIKOM Yogyakarta, 4 Februari 2017
ini dapat digunakan untuk mengambil keputusan di masa
depan. Data mining ini juga dikenal dengan istilah
pattern recognition [3].
2. Pembahasan
K-means merupakan metode pengklasteran secara
partitioning yang memisahkan data ke dalam kelompok
yang berbeda. Dengan partitioning secara iteratif, KMeans mampu meminimalkan rata-rata jarak setiap data
ke klasternya [4].
Daerah rawan kecelakaan adalah suatu lokasi dimana
angka kecelakaan tinggi dengan kejadian kecelakaan
berulang dalam suatu ruang dan rentang waktu yang
relatif sama, diakibatkan oleh suatu penyebab tertentu.
Suatu daerah dinyatakan sebagai lokasi rawan
kecelakaan apabila memiliki kriteria sebagai berikut [5]:
1. Memiliki angka kecelakaan yang tinggi
2. Lokasi kejadian kecelakaan relatif menumpuk
3. Lokasi kecelakaan berupa simpangan atau segmen
ruas jalan sepanjang 100-300 m untuk jalan
perkotaan, ruas jalan sepanjang 1 km untuk jalan
antar kota.
4. Kecelakaan terjadi dalam ruang dan rentang waktu
yang relatif sama.
5. Memiliki penyebab kecelakaan dengan faktor yang
spesifik.
Untuk mengidentifikasi daerah rawan kecelakaan ada
dua tahapan yang harus dilewati [6], yaitu:
1. Mempelajari sejarah kecelakaan dari seluruh wilayah
studi untuk kemudian memilih lokasi yang diangap
rawan kecelakaan.
2. Mempelajari secara detail lokasi terpilih untuk
menemukan penanganan yang dapat dilakukan.
2.1. Data Selection
Data selection adalah tahap pemilihan data yang akan
diuji atau dievaluasi. Data yang dipilih dalam penelitian
ini adalah data kecelakaan lalu lintas Polres Bantul tahun
2014 sampai tahun 2015 yang berasal dari aplikasi
IRSMS (Integrated Road Safety Management System).
Database IRSMS terdiri dari 4 buah tabel yaitu tabel
KECELAKAAN, tabel KNDRAAN_PNGMDI, tabel
PENUMPANG dan tabel PJL_KAKI.
Gambar 2. Database
Sesuai kebutuhan peneliti maka data yang dipakai berada
di tabel KECELAKAAN. Tabel KECELAKAAN
mempunyai 20 atribut
Tabel 1. Atribut Tabel Kecelakaan
Penelitian ini menggunakan alur penelitian yang
tunjukkan pada gambar 1.
Gambar 1. Alur Penelitian
2.1-110
NO
NAMA
TIPE
1
Id_laka
Int
2
No_urut_laka
Int
3
Tgl
Date
4
Jam
Time
5
Latitude
Text
6
Longitude
Text
7
Tipe_laka
Text
8
Info_tmbhn
Text
9
Pencahayaan
Text
10
Cuaca
Text
11
Geometri_jln
Text
DESKRIPSI
Nomor kecelakaan, auto
numbering, primary key
Nomor urut kecelakaan,
nomor lokal
Tanggal, bulan dan
tahun kecelakaan
Waktu terjadinya
kecelakaan
Lokasi berdasarkan
garis lintang
Lokasi berdasarkan
garis bujur
Tipe kecelakaan: depanbelakang, depan-depan,
depan-samping dll
Pencahayaan: terang,
redup atau gelap
Cuaca: cerah, mendung,
hujan, kabut.
Geometri jalan:
simpang 4, simpang Y,
simpang T dll.
ISSN : 2302-3805
Seminar Nasional Teknologi Informasi dan Multimedia 2017
STMIK AMIKOM Yogyakarta, 4 Februari 2017
Text
Permukaan jalan: bagus
atau berlubang.
Fungsi jalan: kolektor,
arteri, lokal
Status jalan: desa,
kab/kota, provinsi,
nasioal.
Jumlah korban
meninggal dunia
Jumlah korban luka
berat
Jumlah korban luka
ringan
Nama jalan
Int
KM jalan (lokasi jalan)
12
Permukaan_jln
Text
13
Fungsi_jln
Text
14
Status_jln
Text
15
MD
Int
16
LB
Int
17
LR
Int
18
Nama_jln
19
Km_jln
20
Uraian_singkat
Text
Kronologi kejadian
secara singkat
Pada tabel KECELAKAAN dari tahun 2014 sampai
dengan 2015 data diperoleh sebanyak 2.182 data
kecelakaan.
2.2. Preprocessing
Pada tahap ini data diteliti untuk memastikan bahwa
tidak ada data kosong, data salah sebelum diproses.
Selain itu pada tahap ini data dilakukan proses
perubahan dari waktu (jam, menit) menjadi format
menit. Hal ini dilakukan untuk mempermudah proses
klustering.
Gambar 4. Hasil Klustering Waktu
2.4. Postprocessing
Setelah diperoleh hasil klustering diperoleh, langkah
selanjutnya adalah menggabungkan dengan data awal
(menggunakan Microsoft excel). Pada tahap ini
memastikan data valid dan bisa digunakan.
Tabel 1. Klustering (3 kluster)
2.3. Data Mining
Pada tahap ini data siap untuk diproses. Peneliti
menggunakan aplikasi Rapidminer untuk membantu
proses klustering menggunakan metode K-Means.
Jumlah kluster yang dicoba peneliti adalah 2, 3 dan 4.
Hasil clustering ditunjukkan pada tabel 1.
Keterangan
MD: Meninggal Dunia, LB : Luka Berat, LR: Luka
Ringan
2.5. Analisa Hasil
Dari proses klustering waktu kecelakaan lalu lintas
dengan jumlah kluster 2 dapat diperoleh informasi yang
ditunjukkan oleh tabel 2.
Gambar 3. Penggunaan Rapidminer
2.1-111
Seminar Nasional Teknologi Informasi dan Multimedia 2017
ISSN : 2302-3805
STMIK AMIKOM Yogyakarta, 4 Februari 2017
Tabel 2. Hasil clustering (2 kluster)
KLUSTER
WAKTU
JML
MD
LB
LR
0
15.15 – 23.59
1390
98
14
1588
1
00.05 – 15.10
791
59
12
953
Dengan proses klustering waktu kecelakaan lalu lintas
dengan jumlah kluster 3 dapat diperoleh informasi yang
ditunjukkan oleh tabel 3.
Tabel 3. Hasil clustering (3 kluster)
KLUSTER
WAKTU
JML
MD
LB
LR
0
18.25 - 23.59
1020
71
12
1145
1
11.59 - 18.20
652
42
6
786
2
00.05 - 11.50
509
44
8
610
3. Kesimpulan
Dengan proses klustering waktu kecelakaan lalu lintas
dengan jumlah kluster 4 dapat diperoleh informasi yang
ditunjukkan oleh tabel 4.
Tabel 4. Hasil clustering (4 kluster)
KLUSTER
WAKTU
JML
MD
LB
0
00.05- 08.55
253
32
6
279
1
19.30- 23.59
845
57
10
938
2
14.25- 19.25
633
45
5
767
3
09.00- 14.20
450
23
5
557
LR
Dengan proses klustering waktu kecelakaan lalu lintas
dengan jumlah kluster 5 dapat diperoleh informasi yang
ditunjukkan oleh tabel 5.
Tabel 5. Hasil clustering (5 kluster)
KLUSTER
JML
MD
LB
0
00:05-05:45
WAKTU
68
15
5
64
1
19:55-23:59
771
52
7
854
2
15:30-19:53
608
44
7
722
3
10:50-15:20
399
23
5
500
4
06:00-10:45
335
23
2
401
LR
Dengan proses klustering waktu kecelakaan lalu lintas
dengan jumlah kluster 6 dapat diperoleh informasi yang
ditunjukkan oleh tabel 6.
Tabel 6. Hasil clustering (6 kluster)
KLUSTER
WAKTU
JML
MD
LB
0
05:00-09:20
240
21
3
276
LR
1
09:25-13:05
311
16
1
399
2
20:30-23:59
685
45
5
763
3
16:55-20:25
539
38
7
629
4
00:05-04:45
48
12
4
44
5
13:10-16:50
358
25
6
430
Dari percobaan pengklusteran dengan jumlah kluster 2,
3, 4, 5 dan 6 dapat dihasilkan range waktu jumlah
kecelakaan lalu lintas dan jumlah korban. Semakin
banyak jumlah klusternya maka semakin detail range
waktu.
Dari tabel 6 ditunjukkan waktu rawan kecelakaan lalu
lintas terjadi dari pukul 20:30 sampai dengan 23:59
dengan jumlah kecelakaan 685, korban meninggal dunia
45 orang, korban luka berat 5 orang dan korban luka
ringan 763 orang.
Dari penelitian yang telah dilakukan terdapat beberapa
kesimpulan yaitu :
a. Jumlah kecelakaan paling tinggi terjadi pada pukul
19.55 sampai dengan 23.59 dengan jumlah
kecelakaan 771 (meningal dunia 52 orang, luka
berat 7 orang dan luka ringan 854 orang).
b. Jumlah kecelakaan paling rendah terjadi pada pukul
00.05 sampai dengan 05.45 dengan jumlah
kecelakaan 68 (minggal dunia 15 orang, luka berat
5 orang, dan luka ringan tidak ada).
c. Dari hasil kluster 4, 5 dan 6, kecelakaan tertinggi
terjadi pada malam hari.
d. Dari hasil kluster 1, 2, 3, 4, 5 dan 6, kecelakaan
paling rendah terjadi pada pagi/dini hari.
e. Semakin banyak jumlah kluster, maka semakin
akan diperoleh range waktu kecelakaan yang detail.
Daftar Pustaka
[1] WHO, “Global status report on road safety”, 2015.
[2] Prihartono, “Koordinasi Keselamatan Jalan (Implementasi RUNK
Jalan 2011-2035), Jakarta: Bappenas, 2012.
[3] B. Santosa, “Data Mining: Teknik Pemanfaatan Data untuk
Keperluan Bisnis”, Yogyakarta: Graha Ilmu, 2007.
[4] J.B. MacQueen, “Some Methods for classification and Analysis of
Multivariate Observastions, Proceedings of 5 th Berkeley
Symposium on Mathematical Statistics and Probablility,”
Berkeley: University of California Press.
[5] Depkimpraswil, “Penanganan Lokasi Rawan Kecelakaan Lalu
Lintas”, Departemen Pemukiman dan Prasarana Wilayah, Jakarta.
[6] A.S. Wedasana, “Analisa Daerah Rawan Kecelakaan dan
Penyusunan Database Berbasis Sistem Informasi Geografis (Studi
Kasus Kota Denpasar)”, Program Magister Teknik Sipil
Universitas Udayana Denpasar.
Biodata Penulis
Eko Andriyanto Wicaksono, memperoleh gelar Sarjana
Komputer (S.Kom), Jurusan Teknik Informatika STMIK
AMIKOM Yogyakarta, lulus tahun 2009.
Kusrini, memperoleh gelar Doktoral di Program Pasca
Sarjana Ilmu Komputer UGM pada tahun 2010.
Sebelumnya beliau mendapatkan gelar Magister Ilmu
Komputer (M.Kom) pada Program Pasca Sarjana Ilmu
Komputer UGM pada tahun 2006 dan sarjana Ilmu
Komputer dari Program Studi Ilmu Komputer UGM
pada tahun 2002. Kini menjadi dosen tetap Strata-1 dan
Pascasarjana di STMIK AMIKOM Yogyakarta.
2.1-112
Seminar Nasional Teknologi Informasi dan Multimedia 2017
STMIK AMIKOM Yogyakarta, 4 Februari 2017
Emha Taufik Lutfi, memperoleh gelar Magister Ilmu
Komputer (M.Kom) pada Program Pasca Sarjana Ilmu
Komputer UGM dan sarjana Teknik Elektro pada
Program Studi Teknik Elektro UGM. Kini menjadi
dosen tetap Strata-1 di STMIK AMIKOM Yogyakarta.
2.1-113
ISSN : 2302-3805
Seminar Nasional Teknologi Informasi dan Multimedia 2017
STMIK AMIKOM Yogyakarta, 4 Februari 2017
2.1-114
ISSN : 2302-3805