Metode Analisis Lingkungan dan Legalitas

grup dan semakin besar tingkat perbedaan diantara grup, maka semakin baik atau lebih berbeda clustering tersebut. Algoritma clustering K-Means dikembangkan oleh J. MacQueen 1967 dan kemudian oleh J. A. Hartigan dan M. A. Wong sekitar tahun 1975 . Algoritma clustering K-Means adalah algoritma untuk mengklasifikasikan atau mengkelompokkan objek berbasis atribut atau ciri tertentu ke dalam K jumlah klaster . K adalah sebuah angka integer positif . Pengelompokkan dilakukan dengan cara meminimalisir jarak data dan centroid klaster yang ditentukan. Algoritma K-means cluster merupakan sebuah algoritma clustering tanpa pengawasan, K diartikan sebagai jumlah klaster yang biasanya digunakan sebagai input pengguna untuk algoritma. Beberapa kriteria dapat digunakan untuk secara otomatis memperkirakan K. Algoritma K-means adalah sebuah pendekatan untuk masalah optimasi kombinatorial NP-hard. K-means algoritma sangat iteratif di alam, konvergen, namun hanya menghasilkan minimum lokal. Bekerja hanya untuk data numerik, mudah untuk diterapkan.. Kesamaan ukuran atau jarak ukuran perbedaan digunakan untuk menghitung kesamaan atau ketidaksamaan dua titik data atau dua kelompok. Kesamaan dan jarak merupakan elemen dasar dari algoritma clustering, dengan kemungkinan analisis kelompok. Secara umum, jarak dan kesamaan adalah konsep timbal balik. Seringkali, kesamaan langkah dan koefisien kesamaan yang digunakan untuk menggambarkan secara kuantitatif seberapa mirip dua titik data yang atau bagaimana serupa dua cluster adalah: semakin besar kesamaan koefisien, yang lebih mirip adalah dua titik data. Ketidaksamaan ukuran dan jarak adalah sebaliknya: semakin besar ketidaksamaan ukuran atau jarak, semakin berbeda adalah titik data dua atau dua cluster. Pertimbangkan dua titik data 1 2 , ,..., d x x x x T  dan 1 2 , ,..., d y y y y T  . Jarak Euclidean mungkin jarak yang paling umum kita yang pernah digunakan untuk numerik data. Selama dua titik data x dan y dalam ruang d-dimensi, jarak Euclidean antara mereka didefinisikan sebagai : dimana j x dan j y adalah nilai-nilai atribut ke- j dari x dan y , masing-masing. Diagram alir proses analisis k-means cluster dapat dilihat pada Gambar 11 dibawah ini. Gambar 11. Diagram alir proses analisis K-means Cluster 1 2 2 1 , d j j j d x y x y          