Konsep Dasar Clustering Teknik Analisis Data Kecelakaan

remang-remang. sehingga mempengaruhi penglihatan pengemudi sewaktu mengendarai kendaraannya. 3. Volume Lalu Lintas Arus atau volume lalu lintas pada suatu jalan raya diukur berdasarkan jumlah kendaraan yang melewati titik tertentu selama selang waktu tertentu Oglesby, 1988. Volume lalu lintas dinyatakan dengan “Lalu lintas Harian Ratarata Pertahun” yang disebut AADT Average Annual Daily Traffic atau LHR Lalu lintas Harian Rata-rata bila periode pengamatan kurang dari satu tahun. Kapasitas jalan dapat bervariasi secara substansial tergantung pada volume kendaraan atau pengguna jalan lainnya. Ini berarti model rekayasa lalu lintas atau tindakan tidak dapat diterapkan tanpa analisis yang cermat dari kondisi setempat, misalnya berbagai kendaraan dan moda transportasi dapat melakukan evaluasi ulang mendasar dari asumsi yang mendasari dan perhitungan parameter Bent, 2005: 100.

2.4. Teknik Analisis Data Kecelakaan

2.4.1 Konsep Dasar Clustering

Mengorganisasi data ke dalam kelompok merupakan salah satu pendekatan yang paling mendasar dari pemahaman dan pembelajaran. Cluster Analysis adalah studi formal metode dan algoritma untuk pengelompokan, atau clustering, objek yang diukur memiliki karakteristik intrinsik atau kesamaan. Sampel untuk clustering diwakili sebagai vektor pengukuran dan sebagai titik dalam ruang multidimensi. Sampel dalam cluster yang valid lebih mirip satu sama lain daripada sampel cluster yang berbeda. Metodologi clustering sangat cocok untuk eksplorasi hubungan timbal balik antara sampel untuk membuat penilaian awal pada struktur sampel. Kemampuan manusia yang kompetitif dengan otomatis pengelompokan prosedur dalam satu, dua, atau tiga dimensi, tetapi kebanyakan masalah nyata melibatkan pengelompokan dalam dimensi yang lebih tinggi. Hal ini sangat sulit bagi manusia untuk intuitif menginterpretasikan data tertanam dalam dimensi ruang yang tinggi Mehmed Kantardzic, 2011: 250. Teknik cluster analysis berfokus pada mengeksplorasi data set untuk menilai apakah data dapat diringkas bermakna dalam hal yang relatif pada kelompok kecil atau kelompok objek atau individu yang mirip satu sama lain dan yang berbeda dalam beberapa hal dari individu dalam kelompok lain. analisis cluster memeriksa beberapa pendekatan grafis yang dapat membantu dalam mengungkap cluster struktur, dan kemudian mempertimbangkan pengukuran kesamaan, perbedaan dan jarak, yang merupakan pusat untuk banyak teknik clustering Brian S. et al, 2011: 13. Tabel 2.1 menunjukkan contoh sederhana mengelompokkan informasi untuk sembilan pelanggan, didistribusikan di tiga cluster. Dua fitur menggambarkan pelanggan: fitur pertama adalah jumlah item pelanggan membeli, dan fitur kedua menunjukkan harga mereka dibayar untuk setiap. Terdiri dari beberapa objek yang serupa. Tabel 2.1 Contoh Data Set Dari Cluster Banyak Barang Harga Cluster 1 2 1700 3 2000 4 23000 Cluster 2 10 1800 12 2100 11 2500 Cluster 3 2 100 3 200 3 350 Gambar 2.1 Analisis cluster pada titik 2D. a Inisial data; b tiga cluster data; c empat cluster data. Pelanggan di Cluster 1 pembelian beberapa item dengan harga tinggi; pelanggan di Cluster 2 membeli banyak item dengan harga tinggi; dan pelanggan di Cluster 3 membeli beberapa item dengan harga rendah. Bahkan ini contoh sederhana dan interpretasi cluster berdasarkan karakteristik yang menunjukkan bahwa analisis pengelompokan dalam beberapa referensi disebut juga klasifikasi unsupervised mengacu pada situasi di mana tujuannya adalah untuk membangun keputusan batas permukaan klasifikasi berdasarkan data set training berlabel. Sampel dalam set data hanya memiliki dimensi input, dan proses pembelajaran diklasifikasikan sebagai tanpa pengawasan Mehmed Kantardzic, 2011: 250-255.

2.4.2 Konsep Dasar K-means Clustering