Ekstraksi informasi kemacetan pada media digital

  Bandung, 25 Februari 2013 Perihal : Plagiat Skripsi Saya yang bertanda tangan dibawah ini: Nama : Andi Insanudin NIM : 10108048 Judul Skripsi : Ekstraksi Informasi Kemacetan Pada Media Digital

  Menyatakan bahwa saya tidak melakukan tindakan meniru, menyalin atau

menjiplak skripsi / karya ilmiah yang telah ada. Apabila saya terbukti melakukan

kegiatan tersebut, maka saya bersedia menerima sanksi yang diberikan sesuai dengan

ketentuan yang ditetapkan dan berlaku di Program Studi Teknik Informatika

Universitas Komputer Indonesia.

  Mengetahui, Yang memberi pernyataan (Andi Insanudin)

  

BIODATA PENULIS

1. DATA PRIBADI Nama Lengkap : Andi Insanudin Tempat, Tanggal Lahir : Bandung, 27 Agustus 1990 Jenis Kelamin : Laki-laki Agama : Islam Kewarganegaraan : Indonesia Anak ke : Tiga dari tiga bersaudara Status : Belum Menikah

Alamat Lengkap : Jalan Cibatu 2 nomor 43 RT 02 RW 18 Kelurahan

  Antapani Kecamatan Antapani Tengah Bandung 40291.

  Telepon : +6285624503400 Email : andiisfh@gmail.com

2. RIWAYAT PENDIDIKAN

  1. Sekolah Dasar : SD Negeri Cicadas 8 Bandung Tahun 1996-2002

  2. Sekolah Menengah Pertama : SMP Negeri 45 Bandung Tahun 2002-2005

  3. Sekolah Menengah Atas : SMA Kartika Siliwangi 1 Bandung Tahun 2005-2008

  4. Perguruan Tinggi : FTIK UNIKOM Bandung Tahun 2008-2013

Demikian riwayat hidup ini saya buat dengan sebenar-benarnya dalam keadaan

sadar dan tanpa paksaan.

  Bandung (Andi Insanudin)

EKSTRAKSI INFORMASI KEMACETAN PADA MEDIA DIGITAL SKRIPSI

  Diajukan untuk memenuhi Ujian Akhir Sarjana Program Strata Satu Program Studi Teknik Informatika Fakultas Teknik dan Ilmu Komputer Universitas Komputer Indonesia

  ANDI INSANUDIN 10108048 PROGRAM STUDI S1 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK DAN ILMU KOMPUTER UNIVERSITAS KOMPUTER INDONESIA 2013

  

KATA PENGANTAR

Assalamu’alaikum Wr. Wb.

  Puji dan syukur penulis panjatkan kehadirat Allah SWT karena berkat

Rahmat dan Karunia-Nya, penulis dapat menyelesaikan skripsi yang berjudul

“EKSTRAKSI INFORMASI KEMACETAN PADA MEDIA DIGITAL”

selesai pada waktu yang penulis harapkan. Skripsi ini dibuat untuk memenuhi

salah satu syarat kelulusan untuk Program Strata I, program studi Teknik

Informatika di Fakultas Teknik dan Ilmu Komputer, Universitas Komputer

Indonesia.

  Melalui kata pengantar ini, penulis mengucapkan terima kasih yang

sebesar-besarnya kepada semua pihak yang telah membantu penulis,

menyemangati penulis, dan bersedia meluangkan waktunya dalam pelaksaanaan

penelitian dan penyusunan skripsi penulis, yaitu sebagai berikut:

  1. Allah SWT atas nikmat dan karunia yang telah diberikan kepada penulis di sepanjang kehidupan penulis.

  2. Bapak Prof. Dr. H. Denny Kurniadie, Ir., M.Sc., selaku Dekan Fakultas Teknik dan Ilmu Komputer, Universitas Komputer Indonesia.

  3. Bapak Irawan Afrianto S.T., M.T., selaku Ketua Program Studi Strata I Teknik Informatika, Fakultas Teknik dan Ilmu Komputer, Universitas Komputer Indonesia.

  4. Bapak Adam Mukharil Bachtiar S.Kom., selaku dosen pembimbing penulis dalam pembuatan skripsi ini dan juga selaku dosen wali penulis.

  5. Kedua orang tua penulis, ibu dan bapak penulis khususnya, kakak-kakak penulis, dan seluruh keluarga penulis.

  6. Teman-teman satu kelas penulis di program studi Teknik Informatika angkatan 2008, khususnya kelas IF-2.

  7. Beserta pihak-pihak lain yang tidak bisa penulis sebutkan satu persatu yang telah memberikan bantuan serta dukungannya.

  Penulis memohon maaf atas segala kekurangan yang ada pada skripsi ini,

baik di dalam isi, maupun di dalam pengetikan, karena penulis menyadari bahwa

skripsi ini belum sempurna dan tentunya masih jauh dari kesempurnaan.

  Akhir kata, penulis berharap semoga skripsi ini bisa berguna bagi

mahasiswa atau pihak lain yang tertarik untuk mengetahui dan menggali lebih

jauh mengenai penelitian ekstraksi informasi pada media digital.

  .

  Wassalamu’alaikum Wr. Wb.

  Penulis Andi Insanudin

  

DAFTAR ISI

ABSTRAK .............................................................................................................. i

ABSTRACT ............................................................................................................ ii

KATA PENGANTAR .......................................................................................... iii

DAFTAR ISI .......................................................................................................... v

DAFTAR GAMBAR .......................................................................................... viii

DAFTAR TABEL ................................................................................................. x

DAFTAR SIMBOL ............................................................................................. xii

DAFTAR LAMPIRAN ..................................................................................... xvii

BAB 1 PENDAHULUAN ..................................................................................... 1

  

1.1 Latar Belakang Masalah .................................................................................... 1

  

1.2 Perumusan Masalah .......................................................................................... 2

  

1.3 Maksud dan Tujuan ........................................................................................... 2

  

1.4 Batasan Masalah................................................................................................ 3

  

1.5 Metodologi Penelitian ....................................................................................... 3

  

1.5.1 Metode Pengumpulan Data ............................................................................ 3

  

1.5.2 Metode Pembangunan Perangkat Lunak ........................................................ 4

  

1.6 Sistematika Penulisan ....................................................................................... 5

  

BAB 2 LANDASAN TEORI ................................................................................ 7

  

2.1 Kemacetan ......................................................................................................... 7

  

2.1.1 Pengertian Kemacetan .................................................................................... 7

  

2.1.2 Penyebab Kemacetan ..................................................................................... 7

  

2.2 Text Mining ....................................................................................................... 8

  

2.3 Ekstraksi Informasi ........................................................................................... 8

  

2.3.1 Pengertian Ekstraksi Informasi ...................................................................... 8

  

2.3.2 Manfaat Ekstraksi Informasi .......................................................................... 8

  

2.4 Algoritma KNN ................................................................................................. 9

  

2.5 Sumber Data .................................................................................................... 11

  

2.5.1 Twitter .......................................................................................................... 11

  

2.5.2 Lewat Mana .................................................................................................. 12

  

2.6 Web Service dan CodeIgniter ......................................................................... 12

  

2.7 Android ........................................................................................................... 13

  

BAB 3 ANALISIS DAN PERANCANGAN ...................................................... 15

  

3.1 Analisis Sistem ................................................................................................ 15

  

3.1.1 Analisis Masalah .......................................................................................... 15

  

3.1.2 Analisis Karakteristik Sumber Data Informasi Kemacetan ......................... 15

  

3.1.2.1 Media Sosial Twitter ................................................................................. 15

  

3.1.2.2 Website Lewat Mana ................................................................................. 19

  

3.1.3 Analisis Sistem ............................................................................................. 21

  3.1.3.1 Analisis Preprocessing Ekstraksi Informasi Dari Sumber Data Informasi

Kemacetan ............................................................................................................ 22

  

3.1.3.1.1 Case Folding ......................................................................................... 23

  

3.1.3.1.2 Tokenizing.............................................................................................. 24

  

3.1.3.1.3 Filtering (Word List) ............................................................................. 26

  

3.1.3.2 Analisis Algoritma KNN .......................................................................... 34

  

3.1.3.3 Menampilkan Hasil Ekstraksi ................................................................... 51

  

3.1.4 Analisis Kebutuhan Non Fungsional ........................................................... 51

  

3.1.4.1 Analisis Kebutuhan Perangkat Lunak ....................................................... 52

  

3.1.4.2 Analisis Kebutuhan Perangkat Keras ........................................................ 52

  

3.1.4.3 Analisis Kebutuhan Perangkat Pikir ......................................................... 53

  

3.1.5 Analisis Kebutuhan Fungsional ................................................................... 53

  

3.1.5.1 Deksripsi Global Perangkat Lunak ........................................................... 53

  

3.1.5.2 Use Case Diagram .................................................................................... 53

  

3.1.5.2.1 Definisi Aktor ........................................................................................ 54

  

3.1.5.2.2 Definisi Use Case ................................................................................... 54

  

3.1.5.2.3 Skenario Use Case ................................................................................. 54

  

3.1.5.3 Activity Diagram ....................................................................................... 55

  

3.1.5.3.1 Activity Diagram Penyajian Kondisi Kemacetan .................................. 55

3.1.5.3.1.1 Sub Activity Case Folding .................................................................. 56

3.1.5.3.1.2 Sub Activity Tokenizing ...................................................................... 56

3.1.5.3.1.3 Sub Activity Filtering ......................................................................... 57

  

3.1.5.3.2 Activity Diagram Request Informasi Kemacetan .................................. 57

  

3.1.5.4 Class Diagram ........................................................................................... 59

  

3.1.5.5 Sequance Diagram .................................................................................... 60

  

3.2 Perancangan Sistem ........................................................................................ 61

  

3.2.1 Perancangan Antarmuka .............................................................................. 61

  

3.2.2 Perancangan Pesan ....................................................................................... 62

  

3.2.3 Perancangan Prosedural ............................................................................... 63

  

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM ................................. 65

  

4.1 Implementasi Sistem ....................................................................................... 65

  

4.1.1 Implementasi Perangkat Keras ..................................................................... 65

  

4.1.2 Implementasi Perangkat Lunak .................................................................... 65

  

4.1.3 Implementasi Basis Data .............................................................................. 66

  

4.1.4 Implementasi Kelas Client ......................................................................... 67

  

4.1.5 Implementasi Kelas Web Service ............................................................... 67

  

4.1.6 Implementasi Antarmuka Pengguna (Client) ............................................. 67

  

4.2 Pengujian Sistem ........................................................................................... 68

  

4.2.1 Skenario Pengujian Aplikasi ...................................................................... 68

  

4.2.1.1 Pengujian BlackBox ................................................................................ 69

  

4.2.1.2 Pengujian WhiteBox ................................................................................ 70

  

4.2.1.3 Pengujian Beta ........................................................................................ 73

  

4.2.1.3.1 Aturan Pengujian .................................................................................. 74

  

4.2.1.3.2 Kuesioner ............................................................................................. 74

  

BAB 5 KESIMPULAN DAN SARAN .............................................................. 79

  

5.1 Kesimpulan ..................................................................................................... 79

  

5.2 Saran ............................................................................................................... 79

DAFTAR PUSTAKA .......................................................................................... 80

  DAFTAR PUSTAKA [1] "Undang-undang No. 22," 2009.

  

[2] Zocialrank, "http://zocialrank.com/twitter/". [Online] Waktu Akses: 18 September 2012

[3] Marti Hearest, "What is Text Mining?," October 2003. [4] Juniar Prima Rakhman, "Translasi Bahasa Isyarat". [5] Ian Sommerville, "Software Engineering," vol. 8th ed.: Addison-Wesley, 2007.

[6] Twitter, "http://blog.twitter.com/twitter-turns-six," Mar. 2012. [Online] Waktu Akses: 31

Oktober 2012 [7] Wandana Narayana Putra, I Gede Putra Budiyasa, I Nyoman Agi Bismantara M,

Nyoman Sarasuartha Mahajaya I.G.A Oka Widiarsana, "DATA MINING METODE

  CLASIFIKATION K-NEARST NEIGHBOR (KNN)," 2011. [8] Wikipedia, "http://id.wikipedia.org/wiki/Kemacetan,". [Online] Waktu Akses: 3 Nopember 2012

[9] Wikipedia, "http://id.wikipedia.org/wiki/Twitter,". [Online] Waktu Akses: 4 Nopember

2012

  

[10] Burhan Adi Wicaksana Riri Fitru Sari, "Teknik Ekstraksi Informasi di Web," Juli 2011.

[11] Wikipedia, "http://id.wikipedia.org/wiki/Android_(sistem_operasi)",. [Online] Waktu Akses: 15 Desember 2012 [12] Lewat Mana, "http://lewatmana.com/about/",. [Online] Waktu Akses: 11 Januari 2013 [13] Even-Johar, Y. "Introduction to Text Mining. Supercomputing ", 2002.

  [14] Wikipedia, "http://id.wikipedia.org/wiki/CodeIgniter". [Online] Waktu Akses: 11 Januari 2013

[15] W3C, "http://www.w3.org/standards/webofservices/". [Online] Waktu Akses: 11 Januari

2013

BAB 1 PENDAHULUAN

1.1 Latar Belakang Masalah

  Lalu lintas merupakan gerak Kendaraan dan orang di Ruang Lalu Lintas

Jalan, sedang yang dimaksud dengan Ruang Lalu Lintas Jalan adalah prasarana

yang diperuntukkan bagi gerak pindah Kendaraan, orang, dan/atau barang yang

berupa Jalan dan fasilitas pendukung [1] . Di samping itu, lalu lintas juga

merupakan hal yang berkaitan erat dengan aspek kehidupan lainnya dalam

bermasyarakat. Namun, ada beberapa masalah yang timbul dalam pelaksanaan

proses berlalu lintas, salah satunya adalah kemacetan. Saat ini, di kota-kota besar

seperti Jakarta dan Bandung, kemacetan merupakan masalah mendasar yang sulit

untuk diselesaikan. Berbagai macam cara telah dilaksanakan oleh instansi

pemerintah terkait, seperti Kepolisian dan Dinas Perhubungan untuk mengatasi

masalah kemacetan tersebut, misalnya memperlebar jalan dan membangun jalan

layang, akan tetapi, upaya tersebut belum bisa mengurangi tingkat kemacetan.

  Di samping itu, masyarakat mempunyai cara sendiri untuk untuk

mengatasi masalah tersebut, yaitu dengan melihat dan atau mencari tahu informasi

kemacetan dari berbagai situs di internet. Banyak sekali situs yang menyediakan

informasi seputar kemacetan, seperti infolalulintas.com, tmcmetro.com,

bandung247.com, mainyoyo.com, lewatmana.com, maps.google.com dan

twitter.com.

  Pada kenyataannya, beberapa situs tersebut masih memiliki kekurangan

dalam penyampaian informasi kemacetan, yaitu tidak disertai dengan kombinasi

pencarian lokasi kemacetan dan data spasial (peta), karena berdasarkan pada hasil

kuesioner yang telah dilakukan oleh penulis, umumnya masyarakat lebih tertarik

melihat informasi yang disertai dengan data spasial (peta).

  Berdasarkan alasan-alasan di atas, diperlukan suatu solusi yang dapat

menampilkan informasi yang lebih jelas, yaitu dengan cara mengekstrak informasi

menggunakan text mining. merupakan cara pengekstraksian informasi

  Text mining

yang tidak diketahui sebelumnya dari suatu sumber data yang berbeda ke dalam

  2

bentuk baru dimana bentuk baru dan sumber data tersebut mempunyai keterkaitan

[3].

  Salah satu algoritma yang dapat dipakai dalam proses pengekstraksian

informasi pada text mining adalah algoritma KNN. Algoritma KNN adalah sebuah

metode untuk melakukan klasifikasi terhadap objek berdasarkan data

pembelajaran yang jaraknya paling dekat dengan objek tersebut. Data

pembelajaran diproyeksikan ke ruang berdimensi banyak, dimana masing-masing

dimensi merepresentasikan fitur dari data. Ruang ini dibagi menjadi bagian-

bagian berdasarkan klasifikasi data pembelajaran [4]. Sehingga, informasi

kemacetan pada media digital dapat diklasifikasikan sesuai dengan kelas target

yang telah ditentukan sebelumnya.

  1.2 Perumusan Masalah Berdasarkan latar belakang diatas, maka perumusan masalah pada

penelitian ini adalah bagaimana cara mengekstrak informasi kemacetan pada

media sosial twitter sehingga dapat membantu dalam mengetahui kondisi

kemacetan.

  1.3 Maksud dan Tujuan Maksud dari penelitian ini adalah untuk mengekstrak informasi kemacetan berdasarkan kelas-kelas yang telah di tentukan.

  Adapun tujuannya yaitu:

  

1. Memudahkan dalam penyampaian informasi keadaan kemacetan

kepada para pengguna secara jelas berdasarkan kelas-kelas yang telah ditentukan.

  2. Memudahkan penyampaian informasi keadaan kemacetan kepada para pengguna dengan memvisualisasikan hasil ekstraksi informasi tersebut ke dalam bentuk peta di smartphone Android

  3

1.4 Batasan Masalah

  Dalam pembuatan perangkat lunak ini, pembahasan masalah dibatasi agar

tidak menyimpang dari tujuan yang ingin dicapai, adapun batasan masalahnya

adalah :

  1. Algoritma yang digunakan adalah algoritma K-Nearest Neighbor (KNN).

  2. Data informasi mengenai keadaan kemacetan diambil dari Twitter dan Lewat Mana dengan kota Bandung sebagai tahapan awal pembangunan perangkat lunak

  3. Kelas target pada pengklasifikasiannya adalah kelas macet sekali dan kelas macet.

  4. Web Service menggunakan framework CodeIgniter.

  5. Informasi kemacetan dengan data spasial atau peta berjalan di Google Maps pada sistem operasi Android sebagai tahapan awal pembangunan perangkat lunak.

  6. Pendekatan analisis pembangunan perangkat lunak menggunakan analisis beriorientasi objek

1.5 Metodologi Penelitian

  Metodologi yang digunakan dalam penulisan tugas akhir ini

menggunakan dua metode, yaitu metode pengumpulan data dan metode

pembangunan perangkat lunak.

1.5.1 Metode Pengumpulan Data

  Teknik pengumpulan data yang digunakan dalam membantu tugas akhir ini menggunakan dua cara, yaitu:

  1. Studi literatur Pada Studi Literatur ini, penulis mengumpulkan literatur, jurnal, paper dan bacaan-bacaan yang ada kaitannya dengan judul penelitian.

  4

  2. Kuesioner Pada Kuesioner ini, penulis membuat sejumlah pertanyaan yang diajukan kepada responden untuk mendapatkan informasi yang berhubungan dengan penelitian dengan menggunakan Google Docs sebagai media pembuatan kuesioner tersebut.

1.5.2 Metode Pembangunan Perangkat Lunak

  Dalam pembangunannya, perangkat lunak ini menggunakan waterfall

model sebagai tahapan pengembangan perangkat lunaknya [5], proses tersebut

antara lain: a.

   Requirements analysis and definition Tahap Requirements analysis and definition merupakan tahap pengumpulan kebutuhan secara lengkap kemudian dianalisis dan didefinisikan kebutuhan yang harus dipenuhi oleh program yang akan dibangun. Fase ini harus dikerjakan secara lengkap untuk bisa menghasilkan desain yang lengkap.

  b.

   System and software design Tahap System and software design merupakan tahap mendesain perangkat lunak yang dikerjakan setelah kebutuhan selesai dikumpulkan secara lengkap.

  c.

   Implementation and unit testing Tahap Implementation and unit testing merupakan tahap hasil desain program diterjemahkan ke dalam kode-kode dengan menggunakan bahasa pemrograman yang sudah ditentukan. Program yang dibangun langsung diuji baik secara unit.

  d.

   Integration and system testing Tahap Integration and system testing merupakan tahap penyatuan unit-unit program kemudian diuji secara keseluruhan (system testing).

  e.

   Operation and maintenance Tahap Operation and maintenance merupakan tahap mengoperasikan program dilingkungannya dan melakukan pemeliharaan, seperti

  5 penyesuaian atau perubahan karena adaptasi dengan situasi sebenarnya.

  Requirements definition System and Software Design

Implementation and unit

testing

Integration and sytem testing Operation and maintenance

  

Gambar 1-1 Fase-fase dalam Waterfall Model menurut referensi Sommerville [5]

1.6 Sistematika Penulisan

  

Sistematika penulisan proposal penelitian ini disusun untuk memberikan

gambaran umum mengenai penelitian yang dikerjakan. Sistematika penulisan

tugas akhir ini adalah sebagai berikut:

  BAB 1 PENDAHULUAN Bab ini menguraikan latar belakang permasalahan, merumuskan inti

permasalahan, mencari solusi atas masalah tersebut, merumuskan masalah

tersebut, menentukan maksud dan tujuan, kegunaan penelitian, pembatasan

masalah, asumsi masalah, dan sistematika penulisan.

  BAB 2. LANDASAN TEORI Bab ini mengkaji dan menggunakan berbagai konsep dasar teori-teori dari para

ahli yang berkaitan dengan topik penelitian. Meninjau permasalahan dan hal-hal

yang berguna dari penelitian-penelitian dan sintesis serupa yang pernah

dikerjakan sebelumnya dan menggunakannya sebagai acuan pemecahan masalah

pada penelitian ini.

  6

  BAB 3. ANALISIS MASALAH DAN PERANCANGAN Bab ini menganalisis masalah dari objek penelitian untuk mengetahui hal atau

masalah apa yang timbul dan mencoba memecahkan permasalahan tersebut

dengan mengperangkat lunakkan perangkat-perangkat yang digunakan.

Sedangkan perancangan adalah suatu tahap pada penelitian dimana perangkat

yang akan digunakan ditentukan, mengidentifikasi data yang diperlukan dan cara

pengumpulannya, serta menentukan cara kerja perangkat yang digunakan terhadap

objek penelitian yang dirumuskan dari awal persiapan hingga penarikan

kesimpulan.

  BAB 4. IMPLEMENTASI DAN PENGUJIAN Bab ini menjelaskan proses dimana analisis dan perancangan yang telah

dipersiapkan untuk selanjutnya diimplementasikan menjadi perangkat lunak dan

dilakukan pengujian terhadap perangkat lunak tersebut.

BAB 5. KESIMPULAN DAN SARAN Bab ini berisi mengenai kesimpulan dari semua hal yang dibahas pada bab sebelumnya dan saran untuk tahap pengembangan berikutnya.

BAB 2 LANDASAN TEORI

2.1 Kemacetan

  2.1.1 Pengertian Kemacetan “Kemacetan adalah situasi atau keadaan tersendatnya atau bahkan

terhentinyayang disebabkan oleh banyaknya jumlah kendaraan

melebihi kapasitas jalan. Kemacetan banyak terjadi diyang baik atau memadai

ataupun juga tidak seimbangnya kebutuhan jalan dengan kepadatan penduduk

” [8].

  Berdasarkan penjelasan tersebut, penulis berpendapat bahwa kemacetan

merupakan suatu masalah lalu lintas yang timbul akibat tidak seimbangnya jumlah

populasi penduduk dan jumlah kendaraan dengan sarana atau prasarana lalu lintas.

Di samping itu, berdasarkan fakta-fakta yang terlihat pada keadaaan lalu lintas di

kota-kota besar, kemacetan juga merupakan faktor utama timbulnya masalah-

masalah lain yang berkaitan erat dengan penggunaan lalu lintas dan juga

merupakan masalah yang masih sulit untuk diselesaikan.

  2.1.2 Penyebab Kemacetan Salah satu faktor yang menyebabkan kemacetan adalah karena kurangnya

informasi mengenai kemacetan itu sendiri. Pada kenyataannya, pemerintah kota

hanya menyediakan sarana dan pra-sarana sebagai pendukung lalu lintas. Akan

tetapi, faktor dalam pengaturan sistemnya sendiri terabaikan. Sehingga, faktor-

faktor yang terabaikan tersebut menyebabkan kemacaten. Disamping itu,

informasi mengenai kemacetan yang telah terjadi pun kurang tersampaikan

dengan baik. Oleh karena itu, perlu adanya suatu sistem yang baik agar

penyampaian informasi mengenai kemacetan dapat tersampaikan dengan baik

pula.

  8

  2.2 Text Mining adalah cara pengekstraksian informasi yang tidak diketahui

  Text mining

sebelumnya dari suatu sumber data yang berbeda ke dalam bentuk baru dimana

bentuk baru dan sumber data tersebut mempunyai keterkaitan [3]. Text Mining

merupakan salah satu bentuk explorasi dan analisis data teks yang bertujuan untuk

mendapatkan pengetahuan baru baik itu melalui cara otomatis maupun semi

otomatis [13].

  Berdasarkan kutipan-kutipan diatas, penulis berpendapat bahwa Text merupakan proses penggalian informasi-informasi baru dan berguna dari mining data lama menjadi data baru dimana kedua data tersebut saling berhubungan.

  2.3 Ekstraksi Informasi

  2.3.1 Pengertian Ekstraksi Informasi Ekstraksi Informasi adalah pengambilan fakta dan informasi terstruktur

dari isi koleksi teks yang besar. Pengertian fakta disini adalah beragam entitas

yang diperhitungkan. Secara singkat ekstraksi informasi adalah sebuah proses

mendapatkan fakta-fakta terstruktur dari data yang tersedia [10].

  Berdasarkan penjelasan dari kutipan di atas, penulis berpendapat bahwa

ekstraksi informasi adalah proses penyaringan parameter-parameter informasi

fakta dari data yang telah tersedia.

  2.3.2 Manfaat Ekstraksi Informasi Ekstraksi Informasi, mempunyai banyak sekali manfaat tergantung hasil

ekstraksi apa yang ingin kita capai. “Pada tahun 1959, Calvin Mooers membuat

istilah pengambilan informasi (information reetrival) dan membuat kategori

informasi. Tujuan awalnya adalah untuk memungkinkan pencarian (searching)

secara cepat pada jumlah data set yang banyak. Selanjutnya, Maron dan Kuhn di

tahun 1961 membahas lebih jauh tentang relevansi antardokumen dalam

permasalahan pengurutan (sorting) dan pemberian peringkat dalam pengelolaan

dokumen.” [10].

  9 Meskipun pengambilan informasi dan ekstraksi informasi adalah dua

metode yang berbeda, akan tetapi perannya hampir sama, perebedaannya adalah

  

“ekstraksi informasi memberikan pengetahuan dengan tingkat (level) yang lebih

dalam dibanding pengambilan informasi yang dilakukan secara tradisional yang

menganalisa fakta- fakta dari berbagai dokumen.” [10].

2.4 Algoritma KNN

  Algoritma KNN adalah sebuah metode untuk melakukan klasifikasi

terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan

objek tersebut. Data pembelajaran diproyeksikan ke ruang berdimensi banyak,

dimana masing-masing dimensi merepresentasikan fitur dari data. Ruang ini

dibagi menjadi bagian-bagian berdasarkan klasifikasi data pembelajaran [4].

  Adapun langkah-langkah dari algoritma KNN, yaitu: 1 Menentukan parameter K (jumlah tetangga paling dekat);.

  2 Menghitung kuadrat jarak query euclid masing-masing objek terhadap data sample yang diberikan;

3 Urutkan objek-objek tersebut berdasarkan urutan jarak euclid terkecil; 4 Hitung jumlah mayoritas kelas berdasarkan K (jumlah terdekat ).

  Dalam penelitian ini, proses perhitungan kuadrat jarak query menggunakan Euclidean Distance. Euclidean Distance memiliki rumus: D = =

Dimana adalah nilai dari penyebab dan kondisi dari data uji dan adalah nilai

dari masing-masing penyebab dan kondisi dari data uji.

  10

  Hasil Tahap

  Preprocessing

  Menentukan nilai parameter K Menghitung kuadrat jarak

  query euclid dengan rumus

  D = Pengurutan data berdasarkan kuadrat jarak query Euclid terkecil

  Hitung jumlah mayoritas kelas

  Gambar 2-1 Alur kerja algoritma KNN Berikut adalah pseudocode dari algoritma KNN: Procedure Knn(input: k:integer, querySet:larikPoint,

  trainingSet:larikPoint) {I.S: Menentukan kelas pada kueri terbaru berdasarkan mayoritas kelas} {F.S: Mendapatkan kelas pada kueri terbaru berdasarkan mayoritas kelas}

  Kamus:

  d: double map: SortedMap query: pointer

  Algoritma:

  foreach (query in querySet) do

   foreach (training in trainingSet) do

  map SortedMap(k);

   if (query != 0) do

  11

  d EuclideanDistance(query, training); map(d, training);

   else query

  0; d EuclideanDistance(query, training); map(d, training);

   endif endfor

  query label majorityVote(map);

   endfor

2.5 Sumber Data

2.5.1 Twitter

  Twitter merupakan sebuahang dimiliki dan

dioperasikan oleh Twitter Inc. Twitter merupakan media sosial

hingga memungkinkan penggunanya untuk mengirim dan membaca

pesan yang disebut tweet [9]. Tweet adalah teks tulisan berjumlah 140 karakter

yang ditampilkan pada halaman profil pengguna. Tweet bisa dilihat secara luar,

namun pengirim dapat membatasi pengiriman pesan ke daftar teman-teman

mereka saja.

  Selain itu, Twitter mempunyai pilihan untuk memproteksi akun twitter

para penggunanya, agar tweet mereka tidak dapat dilihat oleh sembarang orang.

Biasanya pengguna akun yang membuka hak akses mereka adalah akun-akun

publik seperti akun @BandungTraffic yang melakukan tweet mengenai informasi-

informasi seputar kemacetan di kota Bandung.

  “Pengguna dapat melihat tweet penulis lain yang dikenal dengan sebutan

follower. Semua pengguna dapat mengirim dan menerima tweet melalui situs

Twitter, aplikasi eksternal yang kompatibel (telepon seluler), atau dengan pesan

singkat (SMS) yang tersedia di negara-negara tertentu

  “ [9]. Selain itu, Twitter

memiliki beberapa fitur andalan yang membuat Twitter menjadi salah satu media

sosial yang digemari oleh para penggiat internet. Berdasarkan hasil survei

pengguna Twitter di Indonesia sebanyak 1.028.332 akun.

  12 Adapun objek-objek seperti, tweet, re-tweet, at atau mention (@), hashtag (#), waktu tweet dan tweetsearch.

2.5.2 Lewat Mana

  Lewat Mana merupakan salah satu website yang menyediakan informasi kemacetan. Lewat mana dibangun dengan tujuan untuk menghadirkan informasi terkini kepada penguna jalan dengan harapan dapat

membantu merencanakan perjalanan dengan lebih efektif dan efisien [12].

  Dalam penyampaian informasi kemacetan, website Lewat Mana mempunyai kemiripan dengan sumber data yang telah dijelaskan sebelumnya, yaitu media sosial Twitter. Kemiripan tersebut adalah pada bentuk penyampaiannya yang berupa timeline.

2.6 Web Service dan CodeIgniter

  Web Service adalah sebuah software aplikasi yang dapat teridentifikasi

oleh URI dan memiliki interface yang didefiniskan, dideskripsikan, dan

dimengerti oleh XML dan juga mendukung interaksi langsung dengan software

aplikasi yang lain dengan menggunakan message berbasis XML melalui protokol

internet [15].

  Web Service merupakan jembatan koneksi antara server dan client agar

keduanya dapat saling berkomunikasi dengan baik, selain itu dengan adanya web

dapat memungkinkan banyak client dengan platform yang berbeda-beda. service

Salah satu framework yang biasa digunakan untuk pembangunan web service

adalah CodeIgniter.

  CodeIgniter adalahdinamis

dengan menggunakanmembuat

aplikasi web dengan cepat dan mudah dibandingkan dengan membuatnya dari

awal. [14]

  13

2.7 Android

  Android merupakan sebuah sistem operasi yang dimiliki oleh perusahaan

Google, Inc. Pada saat perilisan perdana Android, 5 November 2007, Android

bersama Open Handset Alliance menyatakan mendukung pengembangan standar

terbuka pada perangkat seluler. Di lain pihak, Google merilis kode

  • –kode Android

    di bawahsebuah lisensi perangkat lunak dan standar terbuka

    perangkat seluler [11].

  Saat ini, Android menjadi salah satu smartphone yang paling banyak

digemari, karena dengan segala fitur yang dimiliki oleh Google seperti Google

Maps, Google Drive dan Google Search, hal tersebut sudah dapat terintegrasi

dengan smartphone Android.

  14

BAB 3 ANALISIS DAN PERANCANGAN

3.1 Analisis Sistem

  Analisis sistem berjutuan untuk mengidentifikasi masalah yang muncul

pada pembangunan sistem, hal ini bertujuan untuk membantu ketika proses

perancangan berlangsung. Dalam analisa sistem ini, meliputi beberapa bagian,

yaitu:

  1. Analisis Masalah

  2. Analisis Karakteristik Sumber Data Informasi Kemacetan

  3. Analisis Sistem

  4. Analisis Kebutuhan Non Fungsional

  5. Analisis Kebutuhan Fungsional

3.1.1 Analisis Masalah

  

Analisis Masalah dari pengekstraksian informasi yang akan di bangun

adalah:

  1 Bagaimana cara mengekstrak informasi dari media sosial Twitter ke dalam kelas-kelas yang telah ditentukan sebelumnya.

  2 Bagaimana caranya agar hasil pengekstraksian informasi dapat di visualisasikan pada peta smartphone berbasis Android.

3.1.2 Analisis Karakteristik Sumber Data Informasi Kemacetan

  Langkah pertama yang harus dilakukan agar dapat menghasilkan

pengkestraksian informasi kemacetan yang baik adalah dengan mempelajari

bagaimana sumber data dalam menyampaikan informasi. Dalam menyampaikan

informasi sumber data tersebut memiliki beberapa aturan dan objek.

  16

3.1.2.1 Media Sosial Twitter

  Dalam menyampaikan informasi media Sosial Twitter mempunyai

beberapa objek. Berikut adalah penjelasan mengenai objek-objek yang ada pada

Twitter dengan contoh informasi kemacetan di kota Bandung Jalan Supratman.

  a. Tweet Tweet merupakan pesan yang dapat menyampaikan informasi setiap penggunanya dengan maksimal karakter yaitu, 140 karakter. Setiap ada tweet yang baru, maka tweet tersebut akan berada pada history tweet paling atas.

  Gambar 3-1 Kumpulan tweet yang menyampaikan informasi kemacetan dan tweet dari akun Irfa Yuliandhari yang berada pada history tweet paling atas

  b. Hashtag (#) Hashtag merupakan simbol untuk menandai kata kunci atau topik informasi dari sebuah tweet. Untuk daerah Bandung biasanya menandai kondisi kemacetan di kota Bandung dengan menggunakan hastag #LalinBdg atau #lalinBdg.

  17 Gambar 3-2 Hashtag (#) dengan kata kunci #LalinBdg

  c. Re-Tweet Re-Tweet adalah cara untuk mengulang tweet pada sebuah topik yang sedang dibicarakan, selain itu re-tweet juga berfungsi untuk membalas tweet akun lain dengan mengetikan kata “RT” didepan nama akun yang di-re-tweet.

  Gambar 3-3 Tweet dari akun All About Bandung yang di-re-tweet oleh akun Irfa Yuliandhari

  18 d. At (@) Merupakan tanda yang manandakan nama akun dari pengguna

  Twitter, atau bisa juga sebagai tanda untuk menandai seseorang pada sebuah tweet (mention).

  Gambar 3-4 @infobdg merupakan nama akun Twitter dari All About Bandung Gambar 3-5 Mention yang dilakukan oleh akun Dewi U Prasetiowati (@dewiutarip) kepada akun All About Bandung (@infobdg)

  19 Selain dari kelima objek di atas, adapula beberapa objek umum lainnya

seperti twittersearch dan waktu tweet berlangsung. Twittersearch akan mencari

kata sesuai inputan dengan mengabaikan besar kecilnya huruf.