View of ANALISA PREDIKSI LAJU KENDARAAN MENGGUNAKAN METODE LINEAR REGRESION SEBAGAI INDIKATOR TINGKAT KEMACETAN

  

ANALISA PREDIKSI LAJU KENDARAAN

MENGGUNAKAN METODE LINEAR REGRESION SEBAGAI

INDIKATOR TINGKAT KEMACETAN

  1 Givy Devira Ramady

  2 Rolty Glendy Wowiling

  Program Studi Teknik Elektro, Sekolah Tinggi Teknologi Mandala Jl.Soekarno Hatta No.597 Bandung

  

Telp. (022) 7301738, 70791003 Fax. (022) 7304854

Abstract

  

The growth of population is directly proportional to the growth of motor vehicle users both two-

wheeled vehicles and four-wheeled vehicles. The thing that is certain is the emergence of

congestion problems because the growth rate of vehicles is not matched by the growth of the road

lane, so it takes a solution to handle it. Our analysis is to take a sample of one of the crossroads in

the city of Bandung which is relatively solid and prone to congestion. The criteria for hazard-prone

roads are known by many vehicles passing within a certain time frame. In this research we use

linear regression algorithm commonly used to predict things based on previously collected data.

So with someone already know the density pattern of a road segment, it will provide information for

a person to take a decision whether to avoid the road and look for alternative ways or keep using

the path because the travel time has been calculated before.

  Keywords : Vehicles, Data, Solids, Congestion, Solutions.

  

Abstrak

  Pertumbuhan jumlah penduduk berbanding lurus dengan pertumbuhan pengguna kendaraan bermotor baik kendaraan roda dua maupun kendaraan roda empat. Hal yang sudah pasti adalah timbulnya permasalahan kemacetan karena laju pertumbuhan kendaraan tidak diimbangi dengan pertumbuhan lajur jalan , sehingga diperlukan suatu solusi untuk menanganinya. Analisa yang kami lakukan adalah dengan mengambil sample salah satu perempatan jalan di kota Bandung yang memang relative padat dan rawan kemacetan. Kriteria jalan rawan macet diketahui berdasarkan banyak kendaraan yang melintas dalam rentang waktu tertentu. Pada penelitian ini kami menggunakan Algoritma linear regression yang biasa digunakan untuk memprediksi sesuatu hal berdasarkan data yang sebelumnya sudah dihimpun. Sehingga dengan seseorang telah mengetahui pola kepadatan suatu ruas jalan , maka akan memberikan informasi bagi seseorang untuk mengambil sebuah keputusan apakah menghindari jalan tersebut dan mencari jalan alternative atau tetap menngunakan jalur tersebut karena waktu tempuh sudah diperhitungkan sebelumnya.

  Kata Kunci : Kendaraan, Data, Padat, Kemacetan, Solusi.

  [1]. Pemanfaatan algoritma komputasi cerdas telah banyak digunakan untuk

I. PENDAHULUAN

  menyelesaikan permasalahan termasuk peramalan jumlah kendaraan [2] [3]. Berdasarkan statistic dari data kepolisian

  Dengan mengetahui pola yang dihasilkan tercatat bahwa rata-rata kenaikan jumlah dari perhitungan algoritma komputasi cerdas kendaraan di Indonesia adalah sebesar 10% tersebut maka pengguna jalan diberikan pertahun. Agar dapat menentukan jalan yang pilihan berdasarkan informasi yang telah rawan kemacetan , jumlah kendaraan yang diolah sebelumnya.Pengguna diberikan melintas pada suatu jalan dalam rentang alternatif apakah tetap melanjutkan waktu tertentu harus diketahui terlebih dahulu perjalanan menggunakan lajur umum yang biasa digunakan namun berpotensi terjebak dalam kemacetan atau mencari jalur alternatif lain sebagai jalan pintas untuk mempersingkat waktu berkendara serta menghindari kemacetan.

  • Proses penemuan pola yang menarik

  Tingkat akurasi pola kepadatan jalur lalu- lintas bergantung kepada periode waktu data yang diinputkan untuk diproses. Semakin banyak data yang diinputkan untuk diproses semakin presisi dan akurat data yang diperoleh.

  berguna atau menarik (non-trivial, implisit, sebefumnya belum diketahui potensial kegunaannya) pola atau pengetahuan dari data yang disimpan dalam jumfah besar. Ekplorasi dari analisa secara otomatis atau semiotomatis terhadap data-data dalam jumlah besar untuk mencari pola dan aturan yang berarti.

  dari data yang tersimpan dalam jumlah besar.

  • Ekstraksi dari suatu informasi yang

II. LANDASAN PUSTAKA Sistem Cerdas

  • Proses penemuan pola yang menarik

  Sistem cerdas adalah sistem yang dapat mengadopsi sebagaian kecil dari tingkat kecerdasan manusia untuk berinteraksi dengan keadaan eksternal suatu sistem. Sebagian kecil dari tingkat kecerdasan itu antara lain: kemampuan untuk dilatih, mengingat kembali kondisi yang pernah dialami, mengolah data-data untuk memberikan aksi yang tepat sesuai yang telah diajarkan, dan kemampuan menyerap kepakaran seorang ahli melalui perintah yang dituliskan dalam sebuah bahasa pemrograman tertentu

  • Ekstraksi dari suatu informasi yang

  Data Mining adalah Serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis data dengan melakukan penggalian pola-pola dari data dengan tujuan untuk memanipulasi data menjadi informasi yang lebih berharga yang diperoleh dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang terdapat dalam basis data. Data mining biasa juga dikenal nama lain seperti : Knowledge discovery (mining) in databases (KDD), ekstraksi pengetahuan (knowledge extraction) Analisa data/pola dan kecerdasan bisnis (business intelligence) dan merupakan alat yang penting untuk memanipulasi data untuk penyajian informasi sesuai kebutuhan user dengan tujuan untuk membantu dalam analisis koleksi pengamatan perilaku, secara umum definisi data-mining dapat diartikan sebagai berikut :

  dari data yang tersimpan dalam jumlah besar.

  berguna atau menarik (non-trivial, implisit, sebefumnya belum diketahui potensial kegunaannya) pola atau pengetahuan dari data yang disimpan dalam jumfah besar. Ekplorasi dari analisa secara otomatis atau semiotomatis terhadap data-data dalam jumlah besar untuk mencari pola dan aturan yang berarti. Alasan utama mengapa data mining sangat menarik perhatian industri informasi dalam beberapa tahun belakangan ini adalah karena tersedianya data dalam jumlah yang besar dan semakin besarnya kebutuhan untuk mengubah data tersebut menjadi informasi dan pengetahuan yang berguna karena sesuai fokus bidang ilmu ini yaitu melakukan kegiatan mengekstraksi atau menambang pengetahuan dari data yang berukuran/berjumlah besar[4], informasi inilah yang nantinya sangat berguna untuk pengembangan. berikut langkah-langkahnya :

  • Data cleaning (untuk menghilangkan

  noise data yang tidak konsisten) Data integration (di mana sumber data yang terpecah dapat disatukan)

  • Data selection (di mana data yang

  relevan dengan tugas analisis dikembalikan ke dalam database)

  Data Minning

  • pemasaran dengan n memakai kupon diskon

  Data transformation (d n (di mana data berubah atau bersatu tu menjadi bentuk untuk kombinasi bara rang tertentu. yang tepat untuk mena nambang dengan

  2.Klasifikasi

  ringkasan performa a atau operasi Klasifikasi adalah a proses untuk agresi) menemukan model del atau fungsi yang

  • Knowledge Disco Discovery (proses

  menjelaskan atau me membedakan konsep atau esensial di mana metode yang kelas data, dengan gan tujuan untuk dapat intelejen digunak akan untuk memperkirakan kelas las dari suatu objek yang mengekstrak pola data ta) labelnya tidak diketa etahui. Model itu sendiri

  • Pattern evolutio tion (untuk

  bisa berupa aturan ran “jika-maka”, berupa mengidentifikasi pola la yang benar- pohon keputusan, fo formula matematis atau benar menarik ya yang mewakili neural network. Prose roses klasifikasi biasanya pengetahuan berda rdasarkan atas dibagi menjadi dua f a fase : learning dan test. beberapa tindakan yan ang menarik)

  Pada fase learning, se , sebagian data yang telah

  • Knowledge presentat tation (di mana

  diketahui kelas data atanya diumpankan untuk gambaran teknik v visualisasi dan membentuk model el perkiraan. Kemudian pengetahuan digun unakan untuk pada fase test mode del yang sudah terbentuk memberikan pengetah ahuan yang telah diuji dengan sebagi agian data lainnya untuk ditambang kepada use ser). mengetahui akurasi si dari model tsb. Bila akurasinya mencuk cukupi model ini dapat dipakai untuk prediksi iksi kelas data yang belum diketahui.

  3.Clustering

  Berbeda den dengan association rule mining dan klasifika fikasi dimana kelas data telah ditentukan se sebelumnya, clustering melakukan pengelo elompokan data tanpa berdasarkan kelas s data tertentu. Bahkan clustering dapat dipa ipakai untuk memberikan label pada kelas data ata yang belum diketahui. Karena itu clusterin ering sering digolongkan sebagai metode u unsupervised learning. Prinsip dari clustering adalah memaksimalkan kesa esamaan antar anggota satu kelas dan mem eminimumkan kesamaan

  Gbr 2.1 Tahap-tahap da data minning antar cluster. Ada banyak jenis teknik anal nalisa yang dapat digolongkan dalam data minin ining. Namun ada

  Pohon Keputusan n

  tiga teknik data mining yang po popular, yaitu: Salah satu meto etode data mining yang

1.Association Rule Mining g umum digunakan ad adalah pohon keputusan.

  Association rule mining ing adalah teknik Metode pohon kepu putusan mengubah fakta mining untuk menemukan a aturan asosiatif yang sangat besar m menjadi pohon keputusan antara suatu kombinasi atribu ribut. Contoh dari yang merepresentasi tasikan rule. Konsep dari aturan asosiatif dari analisa isa pembelian di pohon keputusan a adalah mengubah data suatu pasar swalayan diketahu ahui berapa besar menjadi pohon keput putusan dan aturan-aturan kemungkinan seorang pelan langgan membeli keputusan. roti bersamaan dengan su susu. Dengan pengetahuan tersebut p pemilik pasar swalayan dapat mengatur tur penempatan barangnya atau meranca ncang strategi proses data mining ka karena memiliki beberapa kelebihan, yaitu:

  1. Tidak memerl erlukan biaya yang mahal saat membang angun algoritma.

  2. Mudah untuk d k diinterpetasikan.

  3. Mudah men engintegrasikan dengan sistem basis d s data.

  4. Memiliki nilai ilai ketelitian yang lebih Gbr 2.2 Konsep Dasar Poh ohon Keputusan baik.

  Bagian awal dari pohon on keputusan ini

  5. Dapat mene nemukan hubungan tak adalah titik akar (root), sed sedangkan setiap terduga dan su suatu data. cabang dari pohon keputusa tusan merupakan pembagian berdasarkan hasi asil uji, dan titik

  III. PERA ANCANGAN

  akhir (leaf) merupakan pem pembagian kelas Adapun tahap hapan perancangan yang yang dihasilkan. kami lakukan adal dalah untuk mengetahui

  Pohon keputusan mempunya yai 3 tipe simpul volume kendaraan n pada suatu perepatan yaitu: lampu lalu lintas da dan hasil akhirnya akan

  • Simpul akar, diman ana tidak memiliki

  mendapat suatu hipo ipotesa yang merujuk pada cabang yang masu suk dan memiliki prediksi kemacetan p n pada jam atau hari – hari cabang lebih dari sa ri satu, terkadang tertentu. tidak memiliki caban bang sama sekali. Simpul ini biasanya ya berupa atribut yang paling mem emiliki pengaruh terbesar pada suatu atu kelas tertentu.

  • Simpul internal, d , dimana hanya

  memiliki 1 cabang ng yang masuk, dan memiliki lebih ih dari 1 cabang yang keluar.

  • Gbr.3.1 Gambar Perancangan Gbr.3.1 Gambar Perancangan Gbr.3.1 Gambar Perancangan Simpul daun, atau tau simpul akhir dimana hanya mem emiliki 1 cabang yang masuk, dan an tidak memiliki

  Traffic Collected Da Data

  cabang sama sekal kali dan menandai bahwa simpul terse rsebut merupakan Pada perco ercobaan ini kami label kelas. menggunakan meto etode linear regression untuk mendapatkan p n prediksi atau peramalan

  Tahap awal dilakukan pe pengujian simpul kemacetan. Kami me mengambil sample sebuat akar, jika pada pengujian ian simpul akar perempatan diwilaya yah Kota Bandung untuk menghasilkan sesuatu m maka proses dijadikan acuan. Adapun pengambilan pengujian juga dilakukan pada da setiap cabang datanya dilakukan n melalui pengamatan berdasarkan hasil dari peng engujian. Hal ini langsung pada cctv tv ( aplikasi mobile NTMC berlaku juga untuk simpul in l internal dimana suatu kondisi pengujian baru a u akan diterapkan Polri ) dan melalui pe pengamatan langsung. pada simpul daun. Pada um umumnya proses dari sistem pohon kepu putusan adalah mengadopsi strategi penca carian top-down untuk solusi ruang penca cariannya. Pada proses mengklasifikasikan sam sampel yang tidak diketahui, nilai atribut akan di diuji pada pohon keputusan dengan cara mel elacak jalur dari titik akar sampai titik akhir, k r, kemudian akan diprediksikan kelas yang dit ditempati sampel baru tersebut.

  Gbr.3.2 Tabel l Rekapitulasi Jumlah

  Pohon keputusan banyak dig digunakan dalam

  Kendaraan

  • Pagi ( 06.00 – 08.00 )
  • Siang ( 11.00 – 13.00 )
  • Sore ( 16.00 – 18.00 )
  • Malam ( 19.00 – 21.00 )

  3 X

  Xi2=xi*xi’; XiYi=xi*yi’; Sx=sum(xi); Sy=sum(yi); N=7; a = (Xi2*Sy-Sx*XiYi)/(N*Xi2-Sx^2); b = (N*XiYi-Sx*Sy) / (N*Xi2-Sx^2); a b xx=0:25; yy=a+b*xx; plot(xi,yi,’o’,xx,yy) axis([0 25 0 15]) title(’data pengamatan’) xlabel(’x’) ylabel(’y’) fprintf(’Persamaan Regresi Linear Y=[%2.4f]+[%2.4f]x\n’,a,b) Dengan menerapkan persamaan rumus diatas , kemudian kita memasukan inputan data yang bersumber dari table data pengamatan jumlah kendaraan yang sebelumnya kita record. Inputan data dikategorikan berdasarkan segmentasi waktu yang sebelumnya sudah dibuat. Adapun hasil pengujian y sebagai berikut :

  3 Y 4 …….Y n-1 ];

  2 Y

  1 Y

  ]; yi=[Y

  n-1

  …..X

  4

  2 X

  Clustering yang kami lakukan adalah dengan menjadikan segmentasi waktu pengambilan sample ke dalam empat periode waktu , yaitu :

  1 X

  Dimana: : Y = Variabel Response atau Variabel akibat X = Variabel Predictor atau Variabel penyebab a = Konstanta b = Koefisien Regresi Program regresi linear pada matlab: clear;clc; xi=[X

  Y = a + bX

  Kuantitas[6]. Adapun persamaan sederhana dari simple linear regression ini adalah :

  Regresi Linear Sederhana adalah Metode Statistik yang berfungsi untuk menguji sejauh mana hubungan sebab akibat [5] antara Variabel Faktor Penyebab (X) terhadap Variabel Akibatnya. Faktor Penyebab pada umumnya dilambangkan dengan X atau disebut juga dengan Predictor sedangkan Variabel Akibat dilambangkan dengan Y atau disebut juga dengan Response. Regresi Linear Sederhana atau sering disingkat dengan SLR (Simple Linear Regression) juga merupakan salah satu Metode Statistik yang dipergunakan dalam produksi untuk melakukan peramalan ataupun prediksi tentang karakteristik kualitas maupun

  Tabel diatas dipereroleh dengan cara membagi jumlah kendaraan per cluster dengan periode waktu traffictlight yang dalam kasus ini ( t=120s ). Adapun hasil pengkategorian berdasarkan skala rata-rata kendaraan perdetik berdasarkan tabel parameter tingkat kemacetan sebagai berikut:

  Gbr 3.3 Tabel Skala Jumlah kendaraan Per detik

  Masing-masing segmen diambil sample setiap per tiga puluh menit sekali , dan lamanya durasi pengambilan sample disesuaikan dengan lamanya waktu yang sudah ditetapkan pada traffictlight.

IV. PENGUJIAN

Gambar 4.1 Grafik pengamatan segmen pagi

  Dari data diatas dapat dilihat bahwa terjadi pola kepadatan dengan pola yang rapat setiap harinya pada segmen ke-1 (06.00-08.00) yaitu skala 2 ( kategori C ) , yang mana pada jam tersebut mayoritas pengguna adalah siswa/siswi sekolah dan Gambar 4.3 Grafik pengamatan cluster sore pekerja kantoran.

  Berdasarkan data diatas dapat dilihat bahwa terjadi pola kepadatan dengan pola yang rapat setiap harinya yaitu skala 3 (D) dan 4 (E) yang mana pada cluster inilah terjadi puncak kepadatan kendaraan.

Gambar 4.2 Grafik pengamatan cluster siang

  Berdasarkan data diatas dapat dilihat bahwa terjadi pola kepadatan dengan pola Gambar 4.4 Grafik pengamatan cluster malam yang rapat setiap harinya yaitu pada segmen ke-2 ( 11.00-13.00 ) skala 2 (C) dan 3(D)) Berdasarkan data diatas terlihat bahwa yang mana pada jam tersebut kendaraan terjadi pola kepadatan dengan pola yang pengangkut dan pribadi yang menuju arah cenderung rapat setiap harinya terutama luar kota mendominasi lajur jalan. pada segmen ke-4 ( 19.00-21.00 ) , yaitu skala 4 (E).

  Gaul, eds.) 167–176. Springer, Berlin. MR2113607

  ESIMPULAN

V. K

  JAMES, G. M. (2002). Generalized linear Dari pengujian sample yang kami lakukan models with functional predictors. J. R. Stat. diperoleh suatu pola segmentasi kemacetan Soc. Ser. B Stat. Methodol. 64 411–432. diperempatan kiaracondong-buahbatu . Pada

  MR1924298 segmen I ( pagi ) , tingkat kepadatan kendaraan relative tinggi karenakan banyak siswa/siswi yang hendak berangkat sekolah ditambah para pekerja yang menuju lokasi kerjanya. Pada segmen II ( siang ) , tingkat kepadatan kendaraan masih cukup tinggi namun cenderung lancer. Pada segmen III ( Sore ) , kepadatan kendaraan mencapai puncaknya. Pada segmen IV ( malam ) kendaraan relative padat namun lancer. Data tersebut memberikan informasi kepada pengguna jalan untuk mengambil keputusan mengenai jalur yang akan dipilih apakah terus melalui jalan tersebut dengan estimasi waktu kemacetan yang sudah diperkirakan . atau mencari solusi alternatif jalur lain

  Daftar Pustaka

  Purwitasari, Edwadr, Mukhtar, Buliali — Algoritma Komputasi Cerdas untuk Prediksi Jumlah Pengguna Kendaraan sebagai Indikator Rawan Macet , ITS Y. Kao and S.-Y. Lee, 2009,"Combining K- means and particle swarm optimization for dynamic data clustering problems," in IEEE

  International Conference on Intelligent Computing and Intelligent Systems,

  Shanghai.

  V. Topuz, 2010, "Hourly Traffic Flow Prediction Using Different ANN Models," in

  Urban Transport and Hybrid Vehicles, InTech.

  Han, J.K., 2001, Data Mining: Concept and

  Technique. San Fransisco: Morgan Kaufmann Publisher.

  PREDA, C. and SAPORTA, G. (2004). PLS approach for clusterwise linear regression on functional data. In Classification, Clustering, and Data Mining Applications (D. Banks, L. House, F. R. McMorris, P. Arabie and W.