Analisis Cluster LANDASAN TEORI

27 Jika data yang digunakan adalah data yang sudah dibakukan maka persamaan komponen utamanya menjadi: Yi = ′ = 1 1 + 2 2 +... + � � 2.16

2.5 Analisis Cluster

Menurut Dillon dan Goldstein 1984 analisis cluster adalah analisis statistik peubah ganda yang digunakan apabila ada n buah individu atau objek yang mempunyai p peubah dan n objek tersebut ingin dikelompokkan kedalam k kelompok berdasarkan sifat-sifat yang diamati, sehingga individu atau objek yang terletak dalam satu cluster memiliki kemiripan sifat yang lebih besar dibandingkan dengan indvidu yang terletak dalam cluster lain. Analisis cluster bertujuan untuk memisahkan objek menjadi beberapa kelompok yang mempunyai sifat berbeda antar kelompok yang satu dengan yang lain. Pada awalnya individu-individu atau objek penelitian belum dikelompokkan, kemudian dikelompokkan kedalam cluster-cluster yang bersifat homogeny berdasarkan pengukuran peubah-peubah yang diamati. Pengclusteran didasarkan pada ukuran kedekatan masing-masing individu yang disebut jarak. Dalam penghitungan jarak diperlukan adanya kesamaan satuan untuk semua peubah, jika tidak maka akan dilakukan transformasi menjadi skor baru yang berfungsi untuk menghilangkan pengaruh keragaman data atau dengan kata lain semua peubah memberikan kontribusi yang sama untuk jarak. Ukuran jarak yang digunakan dalam penelitian ini adalah jarak Euclidean. Jarak Euclid antara dua pengamatan dituliskan dengan persamaan: d ij = − 2 � =1 ; i ,j = 1,2,3, … n 2.17 Dimana: d ij adalah jarak euclidan dari individu i dan j x ik adalah nilai observasi ke-i pada variabel ke-k x jk adalah nilai observasi ke-j pada variabel ke-k Universitas Sumatera Utara 28 Metode yang digunakan untuk melakukan pengclusteran adalah sebagai berikut: 1. Berhierarki Metode ini digunakan untuk individu yang tidak terlalu banyak dan jumlah cluster yang hendak dibentuk belum diketahui. Dalam metode ini terdapat dua teknik yaitu: a. Teknik Penggabungan Agglomerative Pada awalnya masing-masing objek merupakan satu cluster tersendiri, lalu dua cluster yang mempunyai kesamaan terdekat digabungkan dan begitu seterusnya sehingga akhirnya diperoleh satu cluster yang berunsur semua objek. Objek yang telah diclusterkan pada suatu cluster tidak dapat pindah lagi ke cluster lainnya. Untuk menggabungkan dua cluster diperlkan ukuran ketidakmiripan dissimilarity antar cluster yang dinyatakan dalam fungsi jarak distance, misalnya jarak euclidan. jarak antar cluster tersebut disajikan dalam matriks proximity. Jarak euclidan digunakan jika tidak ada korelasi antar peubah yang diamati. Jika terdapat korelasi yang nyata antar peubah maka data awal perlu ditransformasi terlebih dahulu melalui Analisis Komponen Utama AKU. Cluster-cluster dengan ukuran ketidakmiripan terkecil yang nantinya akan digabungkan nenjadi cluster baru. Dengan teknik ini kita dapat menelusuri kenapa objek yang bersangkutan menyatu kesuatu kelompok. Dalam teknik penggabungan ini, ukuran ketidakmirian antar cluster adalah sebagai berikut: 1. Pautan tunggal Single linkagefurthest nighbour Metode ini didasarkan pada jarak minimum. Dimulai dengan dua objek yang dipisahkan dengan jarak paling pendek maka keduanya akan ditempatkan pada cluster pertama, dan seterusnya. Metode ini dikenal pula dengan nama pendekatan tetangga terdekat. dituliskan dengan persamaan: Universitas Sumatera Utara 29 d kij = min d ki .d kj Dimana: d ki adalah jarak antara cluster k dan cluster i d kj adalah jarak antara cluster k dan cluster j d kij adalah jarak antara cluster k dengan cluster ij 2.18 2. Pautan lengkap complete linkagefurthest neighbor Disebut juga pendekatan tetangga terjauh. Dasarnya adalah jarak maksimum. Dalam metode ini seluruh objek dalam suatu cluster dikaitkan satu sama lain pada suatu jarak maksimum atau dengan kesamaan minimum. Dituliskan dengan persamaan: d kij = max d ki .d kj Dimana: d ki adalah jarak antara cluster k dan cluster i d kj adalah jarak antara cluster k dan cluster j d kij adalah jarak antara cluster k dengan cluster ij 2.19 3. Rataan group group average Dasarnya adalah jarak rata-rata antar observasi. pengelompokan dimulai dari tengan atau pasangan observasi dengan jarak paling mendekati jarak rata-rata . D ituliskan dengan persamaan: = + + + 2.20 Dimana: n i adalah jumlah individu pada kelompok X n j adalah jumlah individu dalam kelompok Y d ki adalah jarak antara cluster k dan cluster i d kj adalah jarak antara cluster k dan cluster j d kij adalah jarak antara cluster k dengan cluster ij Universitas Sumatera Utara 30 4. Metode Wards Dalam metode ini jarak antara dua cluster adalah jumlah kuadrat antara dua cluster untuk seluruh variabel. Metode ini cenderung digunakan untuk mengkombinasi cluster-cluster dengan jumlah kecil . Dituliskan dengan persamaan: = + + + − + + 2.21 5. Centroid Jarak antara dua kelompok merupakan jarak centroids rata-rata seluruh variabel dalam suatu kelompok yang dihitung dengan rumus: = + + + − + 2.22 b. Teknik pembagian divisive Bermula dari satu cluster yang berunsur semua objek yang ada. Cluster ini kemudian dibagi lagi menjadi dua cluster, dan seterusnya. Bila ada n objek maka pembagian menjadi dua cluster ini juga dapat dilakukan berdasarkan peubah biner, yaitu peubah yang hanya mempunyai dua kategori. 2. Tidak berhierarki Teknik ini dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan. Setelah jumlah cluster diketahui, beberapa proses pengclusteran dilakukan tanpa mengikuti proses hirarki. Yang termasuk dalam teknik ini antara lain teknik penyekatan partitioning dan penggunaan grafik. Metode yang sering digunakan adalah K-Means yang bertujuan mengelompokkan data sedemikian sehingga jarak tiap-tiap data kepusat kelompok dalam satu kelompok minimum. Pada teknik penyekatan seperti K-Rataan K-Means, objek dapat berpindah cluster ada setiap tahap pengclusteran. Universitas Sumatera Utara 31 Prosedur pengelompokan sangat sederhana yaitu dengan langkah- langkah sebagai berikut: 1. Menentukan banyaknya kelompok yang akan dibentuk, misal sebanyak k kelompok. 2. Tentukan pusat cluster dapat ditentukan secara sembarang. Hal ini merupakan salah satu kelemahan metode non Hierarki. 3. Mengalokasikan individu ke kelompok yang terdekat dengan pusat cluster. 4. Pusat cluster dihitung kembali, yang merupakan rata-rata dari individu didalam kelompok itu sendiri. 5. Alokasikan kembali individu. 6. Proses ini dilakukan terus – menerus hingga tidak ada lagi individu yang berpindah kelompok. Dalam penelitian ini analisis cluster yang digunakan adalah metode hierarki dengan pautan lengkap complete linkage. Universitas Sumatera Utara 1

BAB 1 PENDAHULUAN

1.1 Latar Belakang

Kemiskinan merupakan masalah yang sulit untuk diatasi. Salah satu sasaran pembangunan nasional adalah penurunan tingkat kemiskinan. Menurut Badan Pusat Statistik, kemiskinan merupakan ketidakmampuan seseorang untuk memenuhi kebutuhan makanan dan bukan makanan yang diukur dari pengeluaran. Sedangkan Bappenas 2004 mendefenisikan kemiskinan sebagai kondisi dimana seseorang atau sekelompok orang, laki-laki maupun perempuan tidak mampu memenuhi- hak-hak dasarnya untuk mempertahankan dan mengembangkan kehidupan yang bermartabat. Kemiskinan merupakan masalah multidimensional yang bukan hanya mencakup kondisi ekonomi tetapi juga sosial, budaya, dan politik. Masalah kemiskinan juga dijadikan salah satu indikator untuk mengevaluasi kinerja pemerintah baik pemerintah pusat maupun pemerintah daerah. Semakin tinggi jumlah dan persentase penduduk miskin disuatu daerah maka semakin tinggi juga beban pembangunannya. sejalan dengan pelaksanaan otonomi daerah, pemerintah daerah diharapkan lebih peka terhadap isu kemiskinan sebagai dasar dalam penyusunan suatu kebijakan yang berkaitan dengan program pengentasan kemiskinan yang akurat sehingga program tersebut lebih tepat sasaran. Indonesia sebagai salah satu negara berkembang juga tidak luput dari masalah kemiskinan. Salah satu provinsi yang mengalami masalah kemiskinan di Indonesia adalah Sumatera Utara. Tingkat kemiskinan antar kota dan kabupaten di Provinsi Sumatera Utara mengalami kesenjangan yang cukup tinggi. Kondisi ini menghadapkan Sumatera Utara pada tantangan untuk meningkatkan dan memeratakan kesejahteraan rakyat. Persentase penduduk miskin di Sumatera Utara lebih rendah dibanding persentase penduduk miskin di Indonesia. Pada periode September 2011 sampai September 2015 perkembangan tingkat kemiskinan di Sumatera Utara dan Universitas Sumatera Utara