Ekstraksi informasi kemacetan pada media digital
Bandung, 25 Februari 2013 Perihal : Plagiat Skripsi Saya yang bertanda tangan dibawah ini: Nama : Andi Insanudin NIM : 10108048 Judul Skripsi : Ekstraksi Informasi Kemacetan Pada Media Digital
Menyatakan bahwa saya tidak melakukan tindakan meniru, menyalin atau
menjiplak skripsi / karya ilmiah yang telah ada. Apabila saya terbukti melakukan
kegiatan tersebut, maka saya bersedia menerima sanksi yang diberikan sesuai dengan
ketentuan yang ditetapkan dan berlaku di Program Studi Teknik Informatika
Universitas Komputer Indonesia.Mengetahui, Yang memberi pernyataan (Andi Insanudin)
BIODATA PENULIS
1. DATA PRIBADI Nama Lengkap : Andi Insanudin Tempat, Tanggal Lahir : Bandung, 27 Agustus 1990 Jenis Kelamin : Laki-laki Agama : Islam Kewarganegaraan : Indonesia Anak ke : Tiga dari tiga bersaudara Status : Belum MenikahAlamat Lengkap : Jalan Cibatu 2 nomor 43 RT 02 RW 18 Kelurahan
Antapani Kecamatan Antapani Tengah Bandung 40291.
Telepon : +6285624503400 Email : andiisfh@gmail.com
2. RIWAYAT PENDIDIKAN
1. Sekolah Dasar : SD Negeri Cicadas 8 Bandung Tahun 1996-2002
2. Sekolah Menengah Pertama : SMP Negeri 45 Bandung Tahun 2002-2005
3. Sekolah Menengah Atas : SMA Kartika Siliwangi 1 Bandung Tahun 2005-2008
4. Perguruan Tinggi : FTIK UNIKOM Bandung Tahun 2008-2013
Demikian riwayat hidup ini saya buat dengan sebenar-benarnya dalam keadaan
sadar dan tanpa paksaan.Bandung (Andi Insanudin)
EKSTRAKSI INFORMASI KEMACETAN PADA MEDIA DIGITAL SKRIPSI
Diajukan untuk memenuhi Ujian Akhir Sarjana Program Strata Satu Program Studi Teknik Informatika Fakultas Teknik dan Ilmu Komputer Universitas Komputer Indonesia
ANDI INSANUDIN 10108048 PROGRAM STUDI S1 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK DAN ILMU KOMPUTER UNIVERSITAS KOMPUTER INDONESIA 2013
KATA PENGANTAR
Assalamu’alaikum Wr. Wb.Puji dan syukur penulis panjatkan kehadirat Allah SWT karena berkat
Rahmat dan Karunia-Nya, penulis dapat menyelesaikan skripsi yang berjudul
“EKSTRAKSI INFORMASI KEMACETAN PADA MEDIA DIGITAL”
selesai pada waktu yang penulis harapkan. Skripsi ini dibuat untuk memenuhi
salah satu syarat kelulusan untuk Program Strata I, program studi Teknik
Informatika di Fakultas Teknik dan Ilmu Komputer, Universitas Komputer
Indonesia.Melalui kata pengantar ini, penulis mengucapkan terima kasih yang
sebesar-besarnya kepada semua pihak yang telah membantu penulis,
menyemangati penulis, dan bersedia meluangkan waktunya dalam pelaksaanaan
penelitian dan penyusunan skripsi penulis, yaitu sebagai berikut:1. Allah SWT atas nikmat dan karunia yang telah diberikan kepada penulis di sepanjang kehidupan penulis.
2. Bapak Prof. Dr. H. Denny Kurniadie, Ir., M.Sc., selaku Dekan Fakultas Teknik dan Ilmu Komputer, Universitas Komputer Indonesia.
3. Bapak Irawan Afrianto S.T., M.T., selaku Ketua Program Studi Strata I Teknik Informatika, Fakultas Teknik dan Ilmu Komputer, Universitas Komputer Indonesia.
4. Bapak Adam Mukharil Bachtiar S.Kom., selaku dosen pembimbing penulis dalam pembuatan skripsi ini dan juga selaku dosen wali penulis.
5. Kedua orang tua penulis, ibu dan bapak penulis khususnya, kakak-kakak penulis, dan seluruh keluarga penulis.
6. Teman-teman satu kelas penulis di program studi Teknik Informatika angkatan 2008, khususnya kelas IF-2.
7. Beserta pihak-pihak lain yang tidak bisa penulis sebutkan satu persatu yang telah memberikan bantuan serta dukungannya.
Penulis memohon maaf atas segala kekurangan yang ada pada skripsi ini,
baik di dalam isi, maupun di dalam pengetikan, karena penulis menyadari bahwa
skripsi ini belum sempurna dan tentunya masih jauh dari kesempurnaan.Akhir kata, penulis berharap semoga skripsi ini bisa berguna bagi
mahasiswa atau pihak lain yang tertarik untuk mengetahui dan menggali lebih
jauh mengenai penelitian ekstraksi informasi pada media digital..
Wassalamu’alaikum Wr. Wb.
Penulis Andi Insanudin
DAFTAR ISI
ABSTRAK .............................................................................................................. i
ABSTRACT ............................................................................................................ ii
KATA PENGANTAR .......................................................................................... iii
DAFTAR ISI .......................................................................................................... v
DAFTAR GAMBAR .......................................................................................... viii
DAFTAR TABEL ................................................................................................. x
DAFTAR SIMBOL ............................................................................................. xii
DAFTAR LAMPIRAN ..................................................................................... xvii
BAB 1 PENDAHULUAN ..................................................................................... 1
1.1 Latar Belakang Masalah .................................................................................... 1
1.2 Perumusan Masalah .......................................................................................... 2
1.3 Maksud dan Tujuan ........................................................................................... 2
1.4 Batasan Masalah................................................................................................ 3
1.5 Metodologi Penelitian ....................................................................................... 3
1.5.1 Metode Pengumpulan Data ............................................................................ 3
1.5.2 Metode Pembangunan Perangkat Lunak ........................................................ 4
1.6 Sistematika Penulisan ....................................................................................... 5
BAB 2 LANDASAN TEORI ................................................................................ 7
2.1 Kemacetan ......................................................................................................... 7
2.1.1 Pengertian Kemacetan .................................................................................... 7
2.1.2 Penyebab Kemacetan ..................................................................................... 7
2.2 Text Mining ....................................................................................................... 8
2.3 Ekstraksi Informasi ........................................................................................... 8
2.3.1 Pengertian Ekstraksi Informasi ...................................................................... 8
2.3.2 Manfaat Ekstraksi Informasi .......................................................................... 8
2.4 Algoritma KNN ................................................................................................. 9
2.5 Sumber Data .................................................................................................... 11
2.5.1 Twitter .......................................................................................................... 11
2.5.2 Lewat Mana .................................................................................................. 12
2.6 Web Service dan CodeIgniter ......................................................................... 12
2.7 Android ........................................................................................................... 13
BAB 3 ANALISIS DAN PERANCANGAN ...................................................... 15
3.1 Analisis Sistem ................................................................................................ 15
3.1.1 Analisis Masalah .......................................................................................... 15
3.1.2 Analisis Karakteristik Sumber Data Informasi Kemacetan ......................... 15
3.1.2.1 Media Sosial Twitter ................................................................................. 15
3.1.2.2 Website Lewat Mana ................................................................................. 19
3.1.3 Analisis Sistem ............................................................................................. 21
3.1.3.1 Analisis Preprocessing Ekstraksi Informasi Dari Sumber Data Informasi
Kemacetan ............................................................................................................ 22
3.1.3.1.1 Case Folding ......................................................................................... 23
3.1.3.1.2 Tokenizing.............................................................................................. 24
3.1.3.1.3 Filtering (Word List) ............................................................................. 26
3.1.3.2 Analisis Algoritma KNN .......................................................................... 34
3.1.3.3 Menampilkan Hasil Ekstraksi ................................................................... 51
3.1.4 Analisis Kebutuhan Non Fungsional ........................................................... 51
3.1.4.1 Analisis Kebutuhan Perangkat Lunak ....................................................... 52
3.1.4.2 Analisis Kebutuhan Perangkat Keras ........................................................ 52
3.1.4.3 Analisis Kebutuhan Perangkat Pikir ......................................................... 53
3.1.5 Analisis Kebutuhan Fungsional ................................................................... 53
3.1.5.1 Deksripsi Global Perangkat Lunak ........................................................... 53
3.1.5.2 Use Case Diagram .................................................................................... 53
3.1.5.2.1 Definisi Aktor ........................................................................................ 54
3.1.5.2.2 Definisi Use Case ................................................................................... 54
3.1.5.2.3 Skenario Use Case ................................................................................. 54
3.1.5.3 Activity Diagram ....................................................................................... 55
3.1.5.3.1 Activity Diagram Penyajian Kondisi Kemacetan .................................. 55
3.1.5.3.1.1 Sub Activity Case Folding .................................................................. 56
3.1.5.3.1.2 Sub Activity Tokenizing ...................................................................... 56
3.1.5.3.1.3 Sub Activity Filtering ......................................................................... 57
3.1.5.3.2 Activity Diagram Request Informasi Kemacetan .................................. 57
3.1.5.4 Class Diagram ........................................................................................... 59
3.1.5.5 Sequance Diagram .................................................................................... 60
3.2 Perancangan Sistem ........................................................................................ 61
3.2.1 Perancangan Antarmuka .............................................................................. 61
3.2.2 Perancangan Pesan ....................................................................................... 62
3.2.3 Perancangan Prosedural ............................................................................... 63
BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM ................................. 65
4.1 Implementasi Sistem ....................................................................................... 65
4.1.1 Implementasi Perangkat Keras ..................................................................... 65
4.1.2 Implementasi Perangkat Lunak .................................................................... 65
4.1.3 Implementasi Basis Data .............................................................................. 66
4.1.4 Implementasi Kelas Client ......................................................................... 67
4.1.5 Implementasi Kelas Web Service ............................................................... 67
4.1.6 Implementasi Antarmuka Pengguna (Client) ............................................. 67
4.2 Pengujian Sistem ........................................................................................... 68
4.2.1 Skenario Pengujian Aplikasi ...................................................................... 68
4.2.1.1 Pengujian BlackBox ................................................................................ 69
4.2.1.2 Pengujian WhiteBox ................................................................................ 70
4.2.1.3 Pengujian Beta ........................................................................................ 73
4.2.1.3.1 Aturan Pengujian .................................................................................. 74
4.2.1.3.2 Kuesioner ............................................................................................. 74
BAB 5 KESIMPULAN DAN SARAN .............................................................. 79
5.1 Kesimpulan ..................................................................................................... 79
5.2 Saran ............................................................................................................... 79
DAFTAR PUSTAKA .......................................................................................... 80
DAFTAR PUSTAKA [1] "Undang-undang No. 22," 2009.
[2] Zocialrank, "http://zocialrank.com/twitter/". [Online] Waktu Akses: 18 September 2012
[3] Marti Hearest, "What is Text Mining?," October 2003. [4] Juniar Prima Rakhman, "Translasi Bahasa Isyarat". [5] Ian Sommerville, "Software Engineering," vol. 8th ed.: Addison-Wesley, 2007.[6] Twitter, "http://blog.twitter.com/twitter-turns-six," Mar. 2012. [Online] Waktu Akses: 31
Oktober 2012 [7] Wandana Narayana Putra, I Gede Putra Budiyasa, I Nyoman Agi Bismantara M,Nyoman Sarasuartha Mahajaya I.G.A Oka Widiarsana, "DATA MINING METODE
CLASIFIKATION K-NEARST NEIGHBOR (KNN)," 2011. [8] Wikipedia, "http://id.wikipedia.org/wiki/Kemacetan,". [Online] Waktu Akses: 3 Nopember 2012
[9] Wikipedia, "http://id.wikipedia.org/wiki/Twitter,". [Online] Waktu Akses: 4 Nopember
2012
[10] Burhan Adi Wicaksana Riri Fitru Sari, "Teknik Ekstraksi Informasi di Web," Juli 2011.
[11] Wikipedia, "http://id.wikipedia.org/wiki/Android_(sistem_operasi)",. [Online] Waktu Akses: 15 Desember 2012 [12] Lewat Mana, "http://lewatmana.com/about/",. [Online] Waktu Akses: 11 Januari 2013 [13] Even-Johar, Y. "Introduction to Text Mining. Supercomputing ", 2002.[14] Wikipedia, "http://id.wikipedia.org/wiki/CodeIgniter". [Online] Waktu Akses: 11 Januari 2013
[15] W3C, "http://www.w3.org/standards/webofservices/". [Online] Waktu Akses: 11 Januari
2013BAB 1 PENDAHULUAN
1.1 Latar Belakang Masalah
Lalu lintas merupakan gerak Kendaraan dan orang di Ruang Lalu Lintas
Jalan, sedang yang dimaksud dengan Ruang Lalu Lintas Jalan adalah prasarana
yang diperuntukkan bagi gerak pindah Kendaraan, orang, dan/atau barang yang
berupa Jalan dan fasilitas pendukung [1] . Di samping itu, lalu lintas juga
merupakan hal yang berkaitan erat dengan aspek kehidupan lainnya dalam
bermasyarakat. Namun, ada beberapa masalah yang timbul dalam pelaksanaan
proses berlalu lintas, salah satunya adalah kemacetan. Saat ini, di kota-kota besar
seperti Jakarta dan Bandung, kemacetan merupakan masalah mendasar yang sulit
untuk diselesaikan. Berbagai macam cara telah dilaksanakan oleh instansi
pemerintah terkait, seperti Kepolisian dan Dinas Perhubungan untuk mengatasi
masalah kemacetan tersebut, misalnya memperlebar jalan dan membangun jalan
layang, akan tetapi, upaya tersebut belum bisa mengurangi tingkat kemacetan.Di samping itu, masyarakat mempunyai cara sendiri untuk untuk
mengatasi masalah tersebut, yaitu dengan melihat dan atau mencari tahu informasi
kemacetan dari berbagai situs di internet. Banyak sekali situs yang menyediakan
informasi seputar kemacetan, seperti infolalulintas.com, tmcmetro.com,
bandung247.com, mainyoyo.com, lewatmana.com, maps.google.com dan
twitter.com.Pada kenyataannya, beberapa situs tersebut masih memiliki kekurangan
dalam penyampaian informasi kemacetan, yaitu tidak disertai dengan kombinasi
pencarian lokasi kemacetan dan data spasial (peta), karena berdasarkan pada hasil
kuesioner yang telah dilakukan oleh penulis, umumnya masyarakat lebih tertarik
melihat informasi yang disertai dengan data spasial (peta).Berdasarkan alasan-alasan di atas, diperlukan suatu solusi yang dapat
menampilkan informasi yang lebih jelas, yaitu dengan cara mengekstrak informasi
menggunakan text mining. merupakan cara pengekstraksian informasi
Text mining
yang tidak diketahui sebelumnya dari suatu sumber data yang berbeda ke dalam
2
bentuk baru dimana bentuk baru dan sumber data tersebut mempunyai keterkaitan
[3].Salah satu algoritma yang dapat dipakai dalam proses pengekstraksian
informasi pada text mining adalah algoritma KNN. Algoritma KNN adalah sebuah
metode untuk melakukan klasifikasi terhadap objek berdasarkan data
pembelajaran yang jaraknya paling dekat dengan objek tersebut. Data
pembelajaran diproyeksikan ke ruang berdimensi banyak, dimana masing-masing
dimensi merepresentasikan fitur dari data. Ruang ini dibagi menjadi bagian-
bagian berdasarkan klasifikasi data pembelajaran [4]. Sehingga, informasi
kemacetan pada media digital dapat diklasifikasikan sesuai dengan kelas target
yang telah ditentukan sebelumnya.1.2 Perumusan Masalah Berdasarkan latar belakang diatas, maka perumusan masalah pada
penelitian ini adalah bagaimana cara mengekstrak informasi kemacetan pada
media sosial twitter sehingga dapat membantu dalam mengetahui kondisi
kemacetan.1.3 Maksud dan Tujuan Maksud dari penelitian ini adalah untuk mengekstrak informasi kemacetan berdasarkan kelas-kelas yang telah di tentukan.
Adapun tujuannya yaitu:
1. Memudahkan dalam penyampaian informasi keadaan kemacetan
kepada para pengguna secara jelas berdasarkan kelas-kelas yang telah ditentukan.2. Memudahkan penyampaian informasi keadaan kemacetan kepada para pengguna dengan memvisualisasikan hasil ekstraksi informasi tersebut ke dalam bentuk peta di smartphone Android
3
1.4 Batasan Masalah
Dalam pembuatan perangkat lunak ini, pembahasan masalah dibatasi agar
tidak menyimpang dari tujuan yang ingin dicapai, adapun batasan masalahnya
adalah :1. Algoritma yang digunakan adalah algoritma K-Nearest Neighbor (KNN).
2. Data informasi mengenai keadaan kemacetan diambil dari Twitter dan Lewat Mana dengan kota Bandung sebagai tahapan awal pembangunan perangkat lunak
3. Kelas target pada pengklasifikasiannya adalah kelas macet sekali dan kelas macet.
4. Web Service menggunakan framework CodeIgniter.
5. Informasi kemacetan dengan data spasial atau peta berjalan di Google Maps pada sistem operasi Android sebagai tahapan awal pembangunan perangkat lunak.
6. Pendekatan analisis pembangunan perangkat lunak menggunakan analisis beriorientasi objek
1.5 Metodologi Penelitian
Metodologi yang digunakan dalam penulisan tugas akhir ini
menggunakan dua metode, yaitu metode pengumpulan data dan metode
pembangunan perangkat lunak.1.5.1 Metode Pengumpulan Data
Teknik pengumpulan data yang digunakan dalam membantu tugas akhir ini menggunakan dua cara, yaitu:
1. Studi literatur Pada Studi Literatur ini, penulis mengumpulkan literatur, jurnal, paper dan bacaan-bacaan yang ada kaitannya dengan judul penelitian.
4
2. Kuesioner Pada Kuesioner ini, penulis membuat sejumlah pertanyaan yang diajukan kepada responden untuk mendapatkan informasi yang berhubungan dengan penelitian dengan menggunakan Google Docs sebagai media pembuatan kuesioner tersebut.
1.5.2 Metode Pembangunan Perangkat Lunak
Dalam pembangunannya, perangkat lunak ini menggunakan waterfall
model sebagai tahapan pengembangan perangkat lunaknya [5], proses tersebut
antara lain: a.Requirements analysis and definition Tahap Requirements analysis and definition merupakan tahap pengumpulan kebutuhan secara lengkap kemudian dianalisis dan didefinisikan kebutuhan yang harus dipenuhi oleh program yang akan dibangun. Fase ini harus dikerjakan secara lengkap untuk bisa menghasilkan desain yang lengkap.
b.
System and software design Tahap System and software design merupakan tahap mendesain perangkat lunak yang dikerjakan setelah kebutuhan selesai dikumpulkan secara lengkap.
c.
Implementation and unit testing Tahap Implementation and unit testing merupakan tahap hasil desain program diterjemahkan ke dalam kode-kode dengan menggunakan bahasa pemrograman yang sudah ditentukan. Program yang dibangun langsung diuji baik secara unit.
d.
Integration and system testing Tahap Integration and system testing merupakan tahap penyatuan unit-unit program kemudian diuji secara keseluruhan (system testing).
e.
Operation and maintenance Tahap Operation and maintenance merupakan tahap mengoperasikan program dilingkungannya dan melakukan pemeliharaan, seperti
5 penyesuaian atau perubahan karena adaptasi dengan situasi sebenarnya.
Requirements definition System and Software Design
Implementation and unit
testing
Integration and sytem testing Operation and maintenance
Gambar 1-1 Fase-fase dalam Waterfall Model menurut referensi Sommerville [5]
1.6 Sistematika Penulisan
Sistematika penulisan proposal penelitian ini disusun untuk memberikan
gambaran umum mengenai penelitian yang dikerjakan. Sistematika penulisan
tugas akhir ini adalah sebagai berikut:BAB 1 PENDAHULUAN Bab ini menguraikan latar belakang permasalahan, merumuskan inti
permasalahan, mencari solusi atas masalah tersebut, merumuskan masalah
tersebut, menentukan maksud dan tujuan, kegunaan penelitian, pembatasan
masalah, asumsi masalah, dan sistematika penulisan.BAB 2. LANDASAN TEORI Bab ini mengkaji dan menggunakan berbagai konsep dasar teori-teori dari para
ahli yang berkaitan dengan topik penelitian. Meninjau permasalahan dan hal-hal
yang berguna dari penelitian-penelitian dan sintesis serupa yang pernah
dikerjakan sebelumnya dan menggunakannya sebagai acuan pemecahan masalah
pada penelitian ini.6
BAB 3. ANALISIS MASALAH DAN PERANCANGAN Bab ini menganalisis masalah dari objek penelitian untuk mengetahui hal atau
masalah apa yang timbul dan mencoba memecahkan permasalahan tersebut
dengan mengperangkat lunakkan perangkat-perangkat yang digunakan.
Sedangkan perancangan adalah suatu tahap pada penelitian dimana perangkat
yang akan digunakan ditentukan, mengidentifikasi data yang diperlukan dan cara
pengumpulannya, serta menentukan cara kerja perangkat yang digunakan terhadap
objek penelitian yang dirumuskan dari awal persiapan hingga penarikan
kesimpulan.BAB 4. IMPLEMENTASI DAN PENGUJIAN Bab ini menjelaskan proses dimana analisis dan perancangan yang telah
dipersiapkan untuk selanjutnya diimplementasikan menjadi perangkat lunak dan
dilakukan pengujian terhadap perangkat lunak tersebut.BAB 5. KESIMPULAN DAN SARAN Bab ini berisi mengenai kesimpulan dari semua hal yang dibahas pada bab sebelumnya dan saran untuk tahap pengembangan berikutnya.
BAB 2 LANDASAN TEORI
2.1 Kemacetan
2.1.1 Pengertian Kemacetan “Kemacetan adalah situasi atau keadaan tersendatnya atau bahkan
terhentinyayang disebabkan oleh banyaknya jumlah kendaraan
melebihi kapasitas jalan. Kemacetan banyak terjadi diyang baik atau memadai
ataupun juga tidak seimbangnya kebutuhan jalan dengan kepadatan penduduk
” [8].Berdasarkan penjelasan tersebut, penulis berpendapat bahwa kemacetan
merupakan suatu masalah lalu lintas yang timbul akibat tidak seimbangnya jumlah
populasi penduduk dan jumlah kendaraan dengan sarana atau prasarana lalu lintas.
Di samping itu, berdasarkan fakta-fakta yang terlihat pada keadaaan lalu lintas di
kota-kota besar, kemacetan juga merupakan faktor utama timbulnya masalah-
masalah lain yang berkaitan erat dengan penggunaan lalu lintas dan juga
merupakan masalah yang masih sulit untuk diselesaikan.2.1.2 Penyebab Kemacetan Salah satu faktor yang menyebabkan kemacetan adalah karena kurangnya
informasi mengenai kemacetan itu sendiri. Pada kenyataannya, pemerintah kota
hanya menyediakan sarana dan pra-sarana sebagai pendukung lalu lintas. Akan
tetapi, faktor dalam pengaturan sistemnya sendiri terabaikan. Sehingga, faktor-
faktor yang terabaikan tersebut menyebabkan kemacaten. Disamping itu,
informasi mengenai kemacetan yang telah terjadi pun kurang tersampaikan
dengan baik. Oleh karena itu, perlu adanya suatu sistem yang baik agar
penyampaian informasi mengenai kemacetan dapat tersampaikan dengan baik
pula.8
2.2 Text Mining adalah cara pengekstraksian informasi yang tidak diketahui
Text mining
sebelumnya dari suatu sumber data yang berbeda ke dalam bentuk baru dimana
bentuk baru dan sumber data tersebut mempunyai keterkaitan [3]. Text Mining
merupakan salah satu bentuk explorasi dan analisis data teks yang bertujuan untuk
mendapatkan pengetahuan baru baik itu melalui cara otomatis maupun semi
otomatis [13].Berdasarkan kutipan-kutipan diatas, penulis berpendapat bahwa Text merupakan proses penggalian informasi-informasi baru dan berguna dari mining data lama menjadi data baru dimana kedua data tersebut saling berhubungan.
2.3 Ekstraksi Informasi
2.3.1 Pengertian Ekstraksi Informasi Ekstraksi Informasi adalah pengambilan fakta dan informasi terstruktur
dari isi koleksi teks yang besar. Pengertian fakta disini adalah beragam entitas
yang diperhitungkan. Secara singkat ekstraksi informasi adalah sebuah proses
mendapatkan fakta-fakta terstruktur dari data yang tersedia [10].Berdasarkan penjelasan dari kutipan di atas, penulis berpendapat bahwa
ekstraksi informasi adalah proses penyaringan parameter-parameter informasi
fakta dari data yang telah tersedia.2.3.2 Manfaat Ekstraksi Informasi Ekstraksi Informasi, mempunyai banyak sekali manfaat tergantung hasil
ekstraksi apa yang ingin kita capai. “Pada tahun 1959, Calvin Mooers membuat
istilah pengambilan informasi (information reetrival) dan membuat kategori
informasi. Tujuan awalnya adalah untuk memungkinkan pencarian (searching)
secara cepat pada jumlah data set yang banyak. Selanjutnya, Maron dan Kuhn di
tahun 1961 membahas lebih jauh tentang relevansi antardokumen dalam
permasalahan pengurutan (sorting) dan pemberian peringkat dalam pengelolaan
dokumen.” [10].9 Meskipun pengambilan informasi dan ekstraksi informasi adalah dua
metode yang berbeda, akan tetapi perannya hampir sama, perebedaannya adalah
“ekstraksi informasi memberikan pengetahuan dengan tingkat (level) yang lebih
dalam dibanding pengambilan informasi yang dilakukan secara tradisional yang
menganalisa fakta- fakta dari berbagai dokumen.” [10].2.4 Algoritma KNN
Algoritma KNN adalah sebuah metode untuk melakukan klasifikasi
terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan
objek tersebut. Data pembelajaran diproyeksikan ke ruang berdimensi banyak,
dimana masing-masing dimensi merepresentasikan fitur dari data. Ruang ini
dibagi menjadi bagian-bagian berdasarkan klasifikasi data pembelajaran [4].Adapun langkah-langkah dari algoritma KNN, yaitu: 1 Menentukan parameter K (jumlah tetangga paling dekat);.
2 Menghitung kuadrat jarak query euclid masing-masing objek terhadap data sample yang diberikan;
3 Urutkan objek-objek tersebut berdasarkan urutan jarak euclid terkecil; 4 Hitung jumlah mayoritas kelas berdasarkan K (jumlah terdekat ).
Dalam penelitian ini, proses perhitungan kuadrat jarak query menggunakan Euclidean Distance. Euclidean Distance memiliki rumus: D = =
Dimana adalah nilai dari penyebab dan kondisi dari data uji dan adalah nilai
dari masing-masing penyebab dan kondisi dari data uji.10
Hasil Tahap
Preprocessing
Menentukan nilai parameter K Menghitung kuadrat jarak
query euclid dengan rumus
D = Pengurutan data berdasarkan kuadrat jarak query Euclid terkecil
Hitung jumlah mayoritas kelas
Gambar 2-1 Alur kerja algoritma KNN Berikut adalah pseudocode dari algoritma KNN: Procedure Knn(input: k:integer, querySet:larikPoint,
trainingSet:larikPoint) {I.S: Menentukan kelas pada kueri terbaru berdasarkan mayoritas kelas} {F.S: Mendapatkan kelas pada kueri terbaru berdasarkan mayoritas kelas}
Kamus:
d: double map: SortedMap query: pointer
Algoritma:
foreach (query in querySet) do
foreach (training in trainingSet) do
map SortedMap(k);
if (query != 0) do
11
d EuclideanDistance(query, training); map(d, training);
else query
0; d EuclideanDistance(query, training); map(d, training);
endif endfor
query label majorityVote(map);
endfor
2.5 Sumber Data
2.5.1 Twitter
Twitter merupakan sebuahang dimiliki dan
dioperasikan oleh Twitter Inc. Twitter merupakan media sosial
hingga memungkinkan penggunanya untuk mengirim dan membaca
pesan yang disebut tweet [9]. Tweet adalah teks tulisan berjumlah 140 karakter
yang ditampilkan pada halaman profil pengguna. Tweet bisa dilihat secara luar,
namun pengirim dapat membatasi pengiriman pesan ke daftar teman-teman
mereka saja.Selain itu, Twitter mempunyai pilihan untuk memproteksi akun twitter
para penggunanya, agar tweet mereka tidak dapat dilihat oleh sembarang orang.
Biasanya pengguna akun yang membuka hak akses mereka adalah akun-akun
publik seperti akun @BandungTraffic yang melakukan tweet mengenai informasi-
informasi seputar kemacetan di kota Bandung.“Pengguna dapat melihat tweet penulis lain yang dikenal dengan sebutan
follower. Semua pengguna dapat mengirim dan menerima tweet melalui situs
Twitter, aplikasi eksternal yang kompatibel (telepon seluler), atau dengan pesan
singkat (SMS) yang tersedia di negara-negara tertentu“ [9]. Selain itu, Twitter
memiliki beberapa fitur andalan yang membuat Twitter menjadi salah satu media
sosial yang digemari oleh para penggiat internet. Berdasarkan hasil survei
pengguna Twitter di Indonesia sebanyak 1.028.332 akun.
12 Adapun objek-objek seperti, tweet, re-tweet, at atau mention (@), hashtag (#), waktu tweet dan tweetsearch.
2.5.2 Lewat Mana
Lewat Mana merupakan salah satu website yang menyediakan informasi kemacetan. Lewat mana dibangun dengan tujuan untuk menghadirkan informasi terkini kepada penguna jalan dengan harapan dapat
membantu merencanakan perjalanan dengan lebih efektif dan efisien [12].
Dalam penyampaian informasi kemacetan, website Lewat Mana mempunyai kemiripan dengan sumber data yang telah dijelaskan sebelumnya, yaitu media sosial Twitter. Kemiripan tersebut adalah pada bentuk penyampaiannya yang berupa timeline.
2.6 Web Service dan CodeIgniter
Web Service adalah sebuah software aplikasi yang dapat teridentifikasi
oleh URI dan memiliki interface yang didefiniskan, dideskripsikan, dan
dimengerti oleh XML dan juga mendukung interaksi langsung dengan software
aplikasi yang lain dengan menggunakan message berbasis XML melalui protokol
internet [15].Web Service merupakan jembatan koneksi antara server dan client agar
keduanya dapat saling berkomunikasi dengan baik, selain itu dengan adanya web
dapat memungkinkan banyak client dengan platform yang berbeda-beda. serviceSalah satu framework yang biasa digunakan untuk pembangunan web service
adalah CodeIgniter.CodeIgniter adalahdinamis
dengan menggunakanmembuat
aplikasi web dengan cepat dan mudah dibandingkan dengan membuatnya dari
awal. [14]13
2.7 Android
Android merupakan sebuah sistem operasi yang dimiliki oleh perusahaan
Google, Inc. Pada saat perilisan perdana Android, 5 November 2007, Android
bersama Open Handset Alliance menyatakan mendukung pengembangan standar
terbuka pada perangkat seluler. Di lain pihak, Google merilis kode- –kode Android
di bawahsebuah lisensi perangkat lunak dan standar terbuka
perangkat seluler [11].
Saat ini, Android menjadi salah satu smartphone yang paling banyak
digemari, karena dengan segala fitur yang dimiliki oleh Google seperti Google
Maps, Google Drive dan Google Search, hal tersebut sudah dapat terintegrasi
dengan smartphone Android.14
BAB 3 ANALISIS DAN PERANCANGAN
3.1 Analisis Sistem
Analisis sistem berjutuan untuk mengidentifikasi masalah yang muncul
pada pembangunan sistem, hal ini bertujuan untuk membantu ketika proses
perancangan berlangsung. Dalam analisa sistem ini, meliputi beberapa bagian,
yaitu:1. Analisis Masalah
2. Analisis Karakteristik Sumber Data Informasi Kemacetan
3. Analisis Sistem
4. Analisis Kebutuhan Non Fungsional
5. Analisis Kebutuhan Fungsional
3.1.1 Analisis Masalah
Analisis Masalah dari pengekstraksian informasi yang akan di bangun
adalah:1 Bagaimana cara mengekstrak informasi dari media sosial Twitter ke dalam kelas-kelas yang telah ditentukan sebelumnya.
2 Bagaimana caranya agar hasil pengekstraksian informasi dapat di visualisasikan pada peta smartphone berbasis Android.
3.1.2 Analisis Karakteristik Sumber Data Informasi Kemacetan
Langkah pertama yang harus dilakukan agar dapat menghasilkan
pengkestraksian informasi kemacetan yang baik adalah dengan mempelajari
bagaimana sumber data dalam menyampaikan informasi. Dalam menyampaikan
informasi sumber data tersebut memiliki beberapa aturan dan objek.16
3.1.2.1 Media Sosial Twitter
Dalam menyampaikan informasi media Sosial Twitter mempunyai
beberapa objek. Berikut adalah penjelasan mengenai objek-objek yang ada pada
Twitter dengan contoh informasi kemacetan di kota Bandung Jalan Supratman.a. Tweet Tweet merupakan pesan yang dapat menyampaikan informasi setiap penggunanya dengan maksimal karakter yaitu, 140 karakter. Setiap ada tweet yang baru, maka tweet tersebut akan berada pada history tweet paling atas.
Gambar 3-1 Kumpulan tweet yang menyampaikan informasi kemacetan dan tweet dari akun Irfa Yuliandhari yang berada pada history tweet paling atas
b. Hashtag (#) Hashtag merupakan simbol untuk menandai kata kunci atau topik informasi dari sebuah tweet. Untuk daerah Bandung biasanya menandai kondisi kemacetan di kota Bandung dengan menggunakan hastag #LalinBdg atau #lalinBdg.
17 Gambar 3-2 Hashtag (#) dengan kata kunci #LalinBdg
c. Re-Tweet Re-Tweet adalah cara untuk mengulang tweet pada sebuah topik yang sedang dibicarakan, selain itu re-tweet juga berfungsi untuk membalas tweet akun lain dengan mengetikan kata “RT” didepan nama akun yang di-re-tweet.
Gambar 3-3 Tweet dari akun All About Bandung yang di-re-tweet oleh akun Irfa Yuliandhari
18 d. At (@) Merupakan tanda yang manandakan nama akun dari pengguna
Twitter, atau bisa juga sebagai tanda untuk menandai seseorang pada sebuah tweet (mention).
Gambar 3-4 @infobdg merupakan nama akun Twitter dari All About Bandung Gambar 3-5 Mention yang dilakukan oleh akun Dewi U Prasetiowati (@dewiutarip) kepada akun All About Bandung (@infobdg)
19 Selain dari kelima objek di atas, adapula beberapa objek umum lainnya
seperti twittersearch dan waktu tweet berlangsung. Twittersearch akan mencari
kata sesuai inputan dengan mengabaikan besar kecilnya huruf.