Pemetaan Klasifikasi Data Tweet Kemacetan Lalu Lintas Menggunakan Algoritma C4.5 Halaman Awal

perpustakaan.uns.ac.id

digilib.uns.ac.id

PEMETAAN KLASIFIKASI DATA TWEET KEMACETAN
LALU LINTAS MENGGUNAKAN ALGORITMA C4.5

SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu
Program Studi Informatika

Disusun Oleh:
FACHRI YAFELLI
NIM. M0512019

PROGRAM STUDI INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET
SURAKARTA
2016


i

commit to user

perpustakaan.uns.ac.id

digilib.uns.ac.id

SKRIPSI
PEMETAAN KLASIFIKASI DATA TWET KEMACETAN
LALU LINTAS MENGGUNAKAN ALGORITMA C4.5

Disusun Oleh :
FACHRI YAFELLI
M0512019

Skripsi ini telah disetujui untuk dipertahankan di hadapan dewan penguji,
pada tanggal:

Pembimbing I


Pembimbing II

Dr. Wiranto M.Kom., M.Cs.

Afrizal DoewesS.Kom., M.Sc

NIP.19661230 199302 1 001

NIP.198508312012121004

ii

commit to user

perpustakaan.uns.ac.id

digilib.uns.ac.id

SKRIPSI

PEMETAAN KLASIFIKASI DATA TWEETKEMACETAN
LALU LINTAS MENGGUNAKAN ALGORITMA C4.5

Disusun Oleh :
FACHRI YAFELLI
M0512019
Skripsi ini telah disetujui untuk dipertahankan di hadapan dewan penguji,
pada tanggal:

Susunan Dewan Penguji
1.
2.
3.
4.

Dr. Wiranto M.Kom., M.Cs.
NIP. 19661230 199302 1 001
Afrizal Doewes S.Kom., M.Sc
NIP. 198508312012121004
Sari Widya Sihwi S.Kom.,MTI

NIP. 198304122009122003
Ristu Saptono S.Si, M.T
NIP. 197902102002121001

(

)

(

)

(

)

(

)


Disahkan Oleh
Kepala Program Studi Informatika

Drs Bambang Harjito M.App.Sc, PhD
NIP. 196211301991031002

iii

commit to user

perpustakaan.uns.ac.id

digilib.uns.ac.id

MOTTO

“Semua orang pernah jatuh dan terpuruk tetapi yang membedakan orang keren
dengan orang biasa adalah orang keren apabila jatuh, jatuhnya orang keren itu
tidak jauh-jauh dari kesuksesan”Ewin Yafelli


“Allah SWT hanya memberikan kepada orang yang siap bukan kepada orang
yang hanya menginginkan, maka persiapkanlah! ”Yafrizal

iv

commit to user

perpustakaan.uns.ac.id

digilib.uns.ac.id

PERSEMBAHAN

Karya ini penulis persembahkan kepada:
“Ibu Elli Yanti dan Bapak Yafrizal atas segala kasih sayang, cinta, doa, semangat
dan motivasi yang tiada henti”
“Ewin Yafelli, abang terbaik”
“Dwi Puspita Yafelli, bu dokter, kakak tercinta”

v


commit to user

perpustakaan.uns.ac.id

digilib.uns.ac.id

KATA PENGANTAR

Segala puji dan syukur penulis ucapkan kepada Allah SWT, yang hanya
karena rahmat dan karunia-Nya, penulis dapat menyelesaikan skripsi dengan judul
“PemetaanKlasifikasi Data Tweet Kemacetan Lalu Lintas Menggunakan
Algoritma C4.5”, yang merupakan salah satu syarat untuk mendapatkan gelar
strata satu program studi Informatika Universitas Sebelas Maret.
Keberhasilan dalam penyusunan skripsi ini tidak terlepas dari bantuan
beberapa pihak. Untuk itu, penulis ingin mengucapkan terima kasih untuk
bimbingan, dukungan, saran dan doa serta semangat tanpa batas selama penelitian
ini. Penulis mengucapkan terima kasih kepada:
1. Allah SWT atas segala limpahan rahmat dan karunia-Nya sehingga skripsi ini
dapat diselesaikan.

2.

Bapak Prof. Ir. Ari Handono Ramelan M.Sc.(Hons), Ph.D. selaku Dekan
FMIPA UNS.

3.

Bapak Drs Bambang Harjito M.App.Sc, PhD selaku Kepala Program Studi
S1 Informatika FMIPA UNS.

4. Bapak Dr. Wiranto M.Kom., M.Cs. dan Bapak Afrizal Doewes S.Kom., M.Sc
selaku Pembimbing yang telah memberikan banyak bimbingan, pengarahan
dan motivasi kepada penulis selama proses penyusunan skripsi ini.
5. Ibu Elli Yanti dan Bapak Yafrizal, selaku kedua orang tua yang selalu
mendukung, membimbing dan mendoakan tiada henti.
6. Abang Ewin Yafelli dan Uni Dwi Puspita Yafelli, selaku saudara kandung
yang luar biasa yang selalu memberikan kejutan dan semangat yang tak
terduga kepada penulis.
7. Bapak dan Ibu dosen Program Studi S1 Informatika FMIPA UNS yang telah
memberikan pengajaran kepada penulis selama masa studi.

8.

Keluarga besar S1 Informatika FMIPA UNS, khususnya angkatan 2012.
Surakarta, 24 Juni 2016

Penulis

vi

commit to user

perpustakaan.uns.ac.id

digilib.uns.ac.id

PEMETAAN KLASIFIKASIDATA TWEETKEMACETAN
LALU LINTAS MENGGUNAKAN ALGORITMA C4.5

FACHRI YAFELLI
Program Studi Informatika,

Fakultas Matematika dan Ilmu Pengetahuan Alam,
Universitas Sebelas Maret

ABSTRAK
Informasi mengenai kemacetan pasti sangat dibutuhkan oleh pengendara dalam
menghindari kemacetan.Informasi ini dapat diperoleh dengan mudah melalui
jejaring sosial sepertitwitter .Akan tetapi, informasi yang dibagikan di twitter
tersebut masih berupa teks dan belum terkategori.Selain itu informasi tersebut
masih belum tervisualisasi ke dalam bentuk peta. Maka dalam penelitian ini akan
dilakukan pemetaan klasifikasi data tweet kemacetan lalu lintas menggunakan
algoritma C4.5. Tujuan dari penelitian ini adalah mengimplementasikan algoritma
C4.5

dalam

mengklasifikasi

data

teks


kemacetan

lalu

lintas

dan

memvisualisasikannya ke dalam bentuk peta sehingga mampu memberikan
informasi seputar kemacetan.Pada peneltian iniakandigunakan algoritma C4.5
untuk membentuk pohon keputusan yang akan digunakan dalam proses klasifikasi
data kemacetan. Untuk setiap data lokasi yang terdapat pada tweetakan melewati
proses geocoding sehingga data lokasi dapat dipetakan ke dalam peta digital.
Proses klasifikasi akan diuji menggunakan metode k-fold cross validation dengan
nilai k=10 dengan menghitung nilai accuracy, precision dan recall. Hasil dalam
penelitian ini menunjukkan tingkat accuracy pohon keputusan yang dibangun
sebesar 99.92% sementara itu nilai masing-masing precision dan recall pohon
keputusan yang dibangun sebesar99.94% dan 96.74%.

Kata kunci: Algoritma C4.5, Kemacetan, Pemetaan, Pohon Keputusan

vii

commit to user

perpustakaan.uns.ac.id

digilib.uns.ac.id

TRAFFIC CONGESTION DATA TWEET MAPPING USING
C4.5 ALGORITHM

FACHRI YAFELLI
Department of Informatics, Mathematics
and Natural Science Faculty, Sebelas
Maret University

ABSTRACT
Traffic Congestion Information certainly needed by the driver to avoiding
congestion. Information can be obtained easily through social network like
twitter. However, the information shared on twitter is still in the form of text and
still not categorized. Moreover the information has not yet been visualized in the
map. So in this study will be carried out traffic congestion data tweet
classification mapping using C4.5 algorithm. The purpose of this study is to
implement the C4.5 Algorithm in classifying traffic congestion text data and
visualize it to a map so it can provide information about traffic congestion. This
research will use the C4.5 algorithm to form a decision tree to be used in the
process of classifying data traffic congestion. For each location data contained in
tweet will go through the process of geocoding so that location data can be
mapped into the digital map. Classification will be tested using k-fold cross
validation with k = 10 to calculate the value of accuracy, precision and recall.
The results in this study indicate the level of accuracy of decision trees
constructed by 99.92% while the respective values of precision and recall
decision tree constructed by 99.94% and 96.74%.

Keywords: C4.5 Algorithm, Decision Trees, Mapping, Traffic Jam.

viii
viii
commit toviiiuser

perpustakaan.uns.ac.id

digilib.uns.ac.id

DAFTAR ISI
HALAMAN JUDUL .............................................................................................. i
HALAMAN PERSETUJUAN .............................................................................. ii
HALAMAN PENGESAHAN............................................................................... iii
MOTTO .................................................................................................................. iv

PERSEMBAHAN ................................................................................................... v
KATA PENGANTAR ........................................................................................... vi
ABSTRAK ............................................................................................................ vii
ABSTRACT ......................................................................................................... viii
DAFTAR ISI .......................................................................................................... ix
DAFTAR TABEL .................................................................................................. xi
DAFTAR GAMBAR ............................................................................................ xii
DAFTAR LAMPIRAN ........................................................................................ xiii
BAB I PENDAHULUAN ....................................................................................... 1
1.1.

Latar Belakang ......................................................................................... 1

1.2.

Rumusan Masalah .................................................................................... 2

1.3.

Batasan Masalah ....................................................................................... 2

1.4.

Tujuan Penelitian...................................................................................... 3

1.5.

Manfaat Penelitian.................................................................................... 3

1.6.

Sistematika Penulisan ............................................................................... 3

BAB II TINJAUAN PUSTAKA............................................................................. 4
2.1.

Dasar Teori ............................................................................................... 4

2.1.1.

Smart City ......................................................................................... 4

2.1.2.

Text Mining ....................................................................................... 5

2.1.3.

Algoritma C4.5 .................................................................................. 6

2.2.

Penelitian Terkait ..................................................................................... 7

2.3.

Kerangka Pemikiran ................................................................................. 9

BAB III METODOLOGI ...................................................................................... 12
3.1.

Pengumpulan Data ................................................................................. 12

3.2.

Implementasi dan Pengembangan Aplikasi............................................ 13

3.3.

Pengujian dan Hasil ................................................................................ 16

ix

commit to user

perpustakaan.uns.ac.id

digilib.uns.ac.id

BAB IV PEMBAHASAN..................................................................................... 18
4.1.

Pengumpulan Data ................................................................................. 18

4.2.

Pre-processing Data ............................................................................... 19

4.3.

Algoritma C4.5 ....................................................................................... 20

4.4.

Pengujian dan Hasil ................................................................................ 21

4.5.

Geocoding dan Pemetaan ....................................................................... 23

BAB V PENUTUP................................................................................................ 25
5.1.

Kesimpulan............................................................................................. 25

5.2.

Saran ....................................................................................................... 25

DAFTAR PUSTAKA ........................................................................................... 26
LAMPIRAN .......................................................................................................... 28

x

commit to user

perpustakaan.uns.ac.id

digilib.uns.ac.id

DAFTAR TABEL
Tabel 2.1 Matriks Penelitian ................................................................................... 9
Tabel 3.1 Contoh data yang dibutuhkan dan tidak dibutuhkan............................. 13
Tabel 3.2 Penerapan case folding.......................................................................... 13
Tabel 3.3 Penerapan tokenizing ............................................................................ 14
Tabel 3.4 Penerapan filtering ................................................................................ 14
Tabel 3.5 Contoh klasifikasi kemacetan ............................................................... 15
Tabel 3.6 Confusionmatrix yang digunakan ......................................................... 16
Tabel 4.1 Data Sample .......................................................................................... 18
Tabel 4.2 Data sample setelah melewati tahap pre-processing ............................ 19
Tabel 4.3 Perhitungan iterasi ke-1 ........................................................................ 20
Tabel 4.4 Perhitungan iterasi ke-2 ........................................................................ 20
Tabel 4.5 Confusion matrix kemacetan lalu lintas ................................................ 22

xi

commit to user

perpustakaan.uns.ac.id

digilib.uns.ac.id

DAFTAR GAMBAR
Gambar 3.1 Metodologi penelitian ....................................................................... 12
Gambar 4.1 Hasil pohon keputusan yang didapatkan ........................................... 21
Gambar 4.2 Hasil aturan yang didapatkan ............................................................ 21
Gambar 4.3 Hasil Pemetaan Menggunakan Geocoding ....................................... 23
Gambar 4.4 Hasil pemetaan dengan kasus lancar ................................................. 24
Gambar 4.5 Hasil pemetaan dengan kasus macet ................................................. 24
Gambar 4.6 Hasil pemetaan dengan kasus macet sekali ....................................... 24
Gambar 4.7 Hasil pemetaan dengan kasus tidak bisa lewat.................................. 24

xii

commit to user

perpustakaan.uns.ac.id

digilib.uns.ac.id

DAFTAR LAMPIRAN
Lampiran 1. Database Wordlist Klasifikasi.......................................................... 28
Lampiran 2. Database Nama Jalan ....................................................................... 29
Lampiran 3. Perubahan kondisi jalan.................................................................... 34

xiii

commit to user