27
Jika data yang digunakan adalah data yang sudah dibakukan maka persamaan komponen utamanya menjadi:
Yi = ′ =
1 1
+
2 2
+... +
� �
2.16
2.5 Analisis Cluster
Menurut Dillon dan Goldstein 1984 analisis cluster adalah analisis statistik peubah ganda yang digunakan apabila ada n buah individu atau objek yang
mempunyai p peubah dan n objek tersebut ingin dikelompokkan kedalam k kelompok berdasarkan sifat-sifat yang diamati, sehingga individu atau objek yang
terletak dalam satu cluster memiliki kemiripan sifat yang lebih besar dibandingkan dengan indvidu yang terletak dalam cluster lain.
Analisis cluster bertujuan untuk memisahkan objek menjadi beberapa kelompok yang mempunyai sifat berbeda antar kelompok yang satu dengan yang
lain. Pada awalnya individu-individu atau objek penelitian belum dikelompokkan, kemudian dikelompokkan kedalam cluster-cluster yang bersifat homogeny
berdasarkan pengukuran peubah-peubah yang diamati. Pengclusteran didasarkan pada ukuran kedekatan masing-masing individu
yang disebut jarak. Dalam penghitungan jarak diperlukan adanya kesamaan satuan untuk semua peubah, jika tidak maka akan dilakukan transformasi menjadi skor
baru yang berfungsi untuk menghilangkan pengaruh keragaman data atau dengan kata lain semua peubah memberikan kontribusi yang sama untuk jarak.
Ukuran jarak yang digunakan dalam penelitian ini adalah jarak Euclidean. Jarak Euclid antara dua pengamatan dituliskan dengan persamaan:
d
ij
= −
2 �
=1
; i ,j = 1,2,3, … n
2.17 Dimana:
d
ij
adalah jarak euclidan dari individu i dan j x
ik
adalah nilai observasi ke-i pada variabel ke-k x
jk
adalah nilai observasi ke-j pada variabel ke-k
Universitas Sumatera Utara
28
Metode yang digunakan untuk melakukan pengclusteran adalah sebagai berikut:
1. Berhierarki
Metode ini digunakan untuk individu yang tidak terlalu banyak dan jumlah cluster yang hendak dibentuk belum diketahui. Dalam metode
ini terdapat dua teknik yaitu: a.
Teknik Penggabungan Agglomerative Pada awalnya masing-masing objek merupakan satu cluster tersendiri,
lalu dua cluster yang mempunyai kesamaan terdekat digabungkan dan begitu seterusnya sehingga akhirnya diperoleh satu cluster yang
berunsur semua objek. Objek yang telah diclusterkan pada suatu cluster tidak dapat pindah lagi ke cluster lainnya.
Untuk menggabungkan dua cluster diperlkan ukuran ketidakmiripan dissimilarity antar cluster yang dinyatakan dalam fungsi jarak
distance, misalnya jarak euclidan. jarak antar cluster tersebut disajikan dalam matriks proximity. Jarak euclidan digunakan jika
tidak ada korelasi antar peubah yang diamati. Jika terdapat korelasi yang nyata antar peubah maka data awal perlu ditransformasi terlebih
dahulu melalui Analisis Komponen Utama AKU. Cluster-cluster dengan ukuran ketidakmiripan terkecil yang nantinya akan
digabungkan nenjadi cluster baru. Dengan teknik ini kita dapat menelusuri kenapa objek yang bersangkutan menyatu kesuatu
kelompok. Dalam teknik penggabungan ini, ukuran ketidakmirian antar cluster
adalah sebagai berikut: 1.
Pautan tunggal Single linkagefurthest nighbour Metode ini didasarkan pada jarak minimum. Dimulai dengan
dua objek yang dipisahkan dengan jarak paling pendek maka keduanya akan ditempatkan pada cluster pertama, dan
seterusnya. Metode ini dikenal pula dengan nama pendekatan tetangga terdekat. dituliskan dengan persamaan:
Universitas Sumatera Utara
29
d
kij
= min d
ki
.d
kj
Dimana: d
ki
adalah jarak antara cluster k dan cluster i d
kj
adalah jarak antara cluster k dan cluster j d
kij
adalah jarak antara cluster k dengan cluster ij 2.18
2. Pautan lengkap complete linkagefurthest neighbor
Disebut juga pendekatan tetangga terjauh. Dasarnya adalah jarak maksimum. Dalam metode ini seluruh objek dalam suatu
cluster dikaitkan satu sama lain pada suatu jarak maksimum atau
dengan kesamaan
minimum. Dituliskan
dengan persamaan:
d
kij
= max d
ki
.d
kj
Dimana: d
ki
adalah jarak antara cluster k dan cluster i d
kj
adalah jarak antara cluster k dan cluster j d
kij
adalah jarak antara cluster k dengan cluster ij 2.19
3. Rataan group group average
Dasarnya adalah
jarak rata-rata
antar observasi.
pengelompokan dimulai dari tengan atau pasangan observasi dengan jarak paling mendekati jarak rata-rata
. D
ituliskan dengan persamaan:
=
+
+
+
2.20 Dimana:
n
i
adalah jumlah individu pada kelompok X n
j
adalah jumlah individu dalam kelompok Y d
ki
adalah jarak antara cluster k dan cluster i d
kj
adalah jarak antara cluster k dan cluster j d
kij
adalah jarak antara cluster k dengan cluster ij
Universitas Sumatera Utara
30
4. Metode Wards
Dalam metode ini jarak antara dua cluster adalah jumlah kuadrat antara dua cluster untuk seluruh variabel. Metode ini
cenderung digunakan untuk mengkombinasi cluster-cluster dengan jumlah kecil
.
Dituliskan dengan persamaan: =
+ +
+ −
+ +
2.21 5.
Centroid Jarak antara dua kelompok merupakan jarak centroids rata-rata
seluruh variabel dalam suatu kelompok yang dihitung dengan rumus:
=
+
+
+
−
+
2.22
b. Teknik pembagian divisive
Bermula dari satu cluster yang berunsur semua objek yang ada. Cluster ini kemudian dibagi lagi menjadi dua cluster, dan
seterusnya. Bila ada n objek maka pembagian menjadi dua cluster ini juga dapat dilakukan berdasarkan peubah biner, yaitu peubah
yang hanya mempunyai dua kategori.
2. Tidak berhierarki
Teknik ini dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan. Setelah jumlah cluster diketahui, beberapa proses
pengclusteran dilakukan tanpa mengikuti proses hirarki. Yang termasuk dalam teknik ini antara lain teknik penyekatan partitioning
dan penggunaan grafik. Metode yang sering digunakan adalah K-Means yang bertujuan mengelompokkan data sedemikian sehingga
jarak tiap-tiap data kepusat kelompok dalam satu kelompok minimum. Pada teknik penyekatan seperti K-Rataan K-Means, objek dapat
berpindah cluster ada setiap tahap pengclusteran.
Universitas Sumatera Utara
31
Prosedur pengelompokan sangat sederhana yaitu dengan langkah- langkah sebagai berikut:
1. Menentukan banyaknya kelompok yang akan dibentuk, misal
sebanyak k kelompok. 2.
Tentukan pusat cluster dapat ditentukan secara sembarang. Hal ini merupakan salah satu kelemahan metode non Hierarki.
3. Mengalokasikan individu ke kelompok yang terdekat dengan pusat
cluster. 4.
Pusat cluster dihitung kembali, yang merupakan rata-rata dari individu didalam kelompok itu sendiri.
5. Alokasikan kembali individu.
6. Proses ini dilakukan terus
– menerus hingga tidak ada lagi individu yang berpindah kelompok.
Dalam penelitian ini analisis cluster yang digunakan adalah metode hierarki dengan pautan lengkap complete linkage.
Universitas Sumatera Utara
1
BAB 1 PENDAHULUAN
1.1 Latar Belakang
Kemiskinan merupakan masalah yang sulit untuk diatasi. Salah satu sasaran pembangunan nasional adalah penurunan tingkat kemiskinan. Menurut Badan
Pusat Statistik, kemiskinan merupakan ketidakmampuan seseorang untuk memenuhi kebutuhan makanan dan bukan makanan yang diukur dari pengeluaran.
Sedangkan Bappenas 2004 mendefenisikan kemiskinan sebagai kondisi dimana seseorang atau sekelompok orang, laki-laki maupun perempuan tidak mampu
memenuhi- hak-hak dasarnya untuk mempertahankan dan mengembangkan kehidupan yang bermartabat. Kemiskinan merupakan masalah multidimensional
yang bukan hanya mencakup kondisi ekonomi tetapi juga sosial, budaya, dan politik. Masalah kemiskinan juga dijadikan salah satu indikator untuk
mengevaluasi kinerja pemerintah baik pemerintah pusat maupun pemerintah daerah. Semakin tinggi jumlah dan persentase penduduk miskin disuatu daerah
maka semakin tinggi juga beban pembangunannya. sejalan dengan pelaksanaan otonomi daerah, pemerintah daerah diharapkan lebih peka terhadap isu
kemiskinan sebagai dasar dalam penyusunan suatu kebijakan yang berkaitan dengan program pengentasan kemiskinan yang akurat sehingga program tersebut
lebih tepat sasaran. Indonesia sebagai salah satu negara berkembang juga tidak luput dari
masalah kemiskinan. Salah satu provinsi yang mengalami masalah kemiskinan di Indonesia adalah Sumatera Utara. Tingkat kemiskinan antar kota dan kabupaten di
Provinsi Sumatera Utara mengalami kesenjangan yang cukup tinggi. Kondisi ini menghadapkan Sumatera Utara pada tantangan untuk meningkatkan dan
memeratakan kesejahteraan rakyat. Persentase penduduk miskin di Sumatera Utara lebih rendah dibanding
persentase penduduk miskin di Indonesia. Pada periode September 2011 sampai September 2015 perkembangan tingkat kemiskinan di Sumatera Utara dan
Universitas Sumatera Utara