Analisis Cluster Metode Analisis

di mana T adalah matriks transformasi yang dipilih sehingga, TT = TT = I 18 Matriks transformasi T ditentukan sedemikian serupa hingga total keragaman kuadrat loading L, yaitu:                                       q j p i p i i ij i ij p h h p 1 1 2 1 2 4 1   V 19 menjadi maksimum, di mana:    q 1 i V keragaman dari kuadrat loading untuk faktor ke-j 2 2 2 2 1 2 ... iq i i i h        komunalitas, yaitu jumlah varians dari suatu variable ke-i yang dapat dijelaskan oleh sejumlah m common factors. Dari perumusan diatas, rotasi merupakan suatu upaya untuk menghasilkan faktor penimbang baru yang lebih mudah diinterpretasikan yaitu dengan mengalikan faktor penimbang awal dengan matriks transformasi yang bersifat orthogonal, sehingga matriks korelasinya tidak akan berubah. Dari merotasi matriks loading tadi menyebabkan setiap variabel asal mempunyai korelasi yang tinggi dan faktor tertentu saja, sedangkan dengan faktor lain mempunyai korelasi relatif rendah sehingga pada akhirnya setiap faktor akan lebih mudah diinterpretasikan.

3.2.3 Analisis Cluster

Analisis Cluster bertujuan untuk memisahkan obyek ke dalam beberapa kelompok yang mempunyai sifat berbeda antar kelompok yang satu dengan yang lain. Dalam analisis ini tiap-tiap kelompok bersifat homogen antar anggota dalam kelompok atau variasi obyek dalam satu kelompok yang terbentuk sekecil mungkin. Analisis ini digunakan untuk mengelompokan n individu unit observasi dengan p peubah ke dalam k kelompok. Bila yang akan dikelompokan berupa obyek maka pendekatan ukuran kemiripan biasanya ditunjukkan oleh ukuran jarak. Salah satu ukuran kemiripan yang digunakan adalah jarak euclidean. Jarak euclidean antar dua obyek X i = [X 1 , X 2 , ..., X P ] dan Y j = [Y 1 , Y 2 , ..., Y P ] yang berdimensi p adalah:         2 2 2 2 2 1 1 , ... P P Y X Y X Y X Y X D        =     Y X Y X   20 Sehingga akan diperoleh matrik jarak sebagai berikut: ... . . . ... ... 2 1 2 21 1 12 n n n n d d d d d d  D Semakin kecil nilai D, maka semakin besar kemiripan antara kedua pengamatan tersebut. Sebaliknya bila D besar, semakin besar ketidakmiripan dari pengamatan tersebut. Asumsi yang harus dipenuhi dalam penerapan Analisis Cluster adalah: 1. Sampel yang diambil harus dapat mewakili populasi yang ada. Dalam penelitian ini, digunakan data populasi, sehingga asumsi ini tidak perlu diuji lagi. 2. Multikolinieritas Multikolinieritas adalah kemungkinan adanya korelasi antar peubah bebas. Sebaiknya tidak ada atau seandainya ada, besar multikolinieraitas tersebut tidaklah tinggi yaitu kurang dari 0,8 Gujarati, 2004. Bila data yang digunakan dalam Analisis Cluster adalah data skor komponen dari hasil AKU, maka tidak akan ditemukan lagi adanya Multikolinieritas. Tahap selanjutnya dalam Analisis Cluster adalah menentukan metode pengelompokanklasifikasi. Terdapat dua metode yaitu: 1. Metode Kelompok Hierarki Hierarchical Clustering Methods Metode ini digunakan bila banyaknya kelompok yang diinginkan belum diketahui. Metode ini paling banyak digunakan karena pembentukan kelompoknya bersifat alamiah. Pengelompokannya disajikan secara visual berbentuk dendogram yaitu suatu bagan yang menyajikan banyaknya kelompok terbesar hingga terkecil. Cara menentukan banyaknya kelompok yang tepat didasarkan pada jumlah anggota kelompok yang relatif merata. Proses pengelompokan diawali dengan memandang setiap obyek n sebagai sebuah kelompok, sehingga jumlah kelompok sebanyak jumlah obyeknya. Dua obyekkelompok yang paling mirip dalam hal ini dilihat dari jarak adalah obyek yang pertama kali digabungkan menjadi satu kelompok, sehingga jumlah kelompok menjadi n-1. jarak kelompok baru dengan kelompok sebelumnya di hitung kembali. Prosedur ini diulang sampai akhirnya kemiripan berkurang, sehingga semua kelompok tergabung dalam suatu kelompok tunggal. Pada pengelompokan Hirarki terdapat tiga jenis metode, yaitu: 1 Metode Pautan Tunggal Single Linkage Metode ini di lakukan dengan meminimumkan jarak antara kelompok yang di gabungkan. Jarak antar kelompok di bentuk dari individu-individu dalam dua kelompok yang mempunyai jarak terkecil atau kemiripan terbesar. Proses dimulai dengan menentukan jarak terkecil dalam D = {d ih } dan gabungkan obyek- obyek, misal U dan V, untuk memperoleh kelompok I atau {UV}, maka jarak antara {UV} dan kelompok W yang lain adalah: D UVW = min {d UW , d VW } 21 di mana: d UW adalah jarak terdekat dari kelompok U dan W d VW adalah jarak terdekat dari kelompok V dan W 2 Metode Pautan Lengkap Complete Linkage Dalam metode ini, jarak antar kelompok dibentuk dari individu-individu dalam dua kelompok yang mempunyai jarak yang paling jauh. Jadi pautan lengkap memastikan bahwa semua individu dalam suatu kelompok berada dalam jarak maksimum pada masing-masing kelompok yang lain. Pengelompokan dimulai dengan mencari jarak pada D = {d ih } dan penggabungan antara U dan V untuk mendapatkan kelompok I UV. Selanjutnya jarak antara UV dan setiap kelompok W dihitung dengan: D UVW = max {d UW , d VW } 22 di mana: d UW adalah jarak kelompok yang paling jauh U dan W d VW adalah jarak kelompok yang paling jauh V dan W 3 Metode Rataan Grup Group Average Metode ini dilakukan dengan meminimumkan rata-rata jarak antara semua pasangan individu dari kelompok yang digabungkan. Proses pengelompokan dimulai dengan mencari jarak D = {d ih } untuk mendapatkan obyek yang terdekat. Kelompok ini dihubungkan untuk membentuk kelompok I atau UV. Selanjutnya jarak antara UV dengan kelompok W lainnya ditentukan dengan:   WV V U V WU V U U W UV d n n n d n n n d     23 4 Metode Sentroid Centroid Ukuran ketidakmiripannya adalah:     UV V U V U WV V U V WU V U U W UV d n n n n d n n n d n n n d 2       24 5 Median Pada metode ini jarak antara dua gerombol yang terbentuk adalah:   UV WV WU W UV d d d d 4 1 2 1 2 1    25 6 Ragam Minimum Minimum Variance Ukuran ketidakmiripan yang digunakan ialah:       W V U UV W WV W V WU V U W UV n n n d n d n n d n n d        27 di mana: U n = banyaknya obyek dalam gerombol U V n = banyaknya obyek dalam gerombol V W n = banyaknya obyek dalam gerombol W 2. Metode Non Hierarki Metode ini digunakan bila banyaknya kelompok yang akan dibentuk telah diketahui lebih dahulu. Sifat pengelompokannya tidak alamiah karena telah di kondisikan untuk jumlah kelompok tertentu. Proses pengelompokan dimulai dengan menentukan nilai k yang merupakan pusat kelompok, dengan cara random dari data. Metode non hierarki yang sering digunakan adalah metode K_Means, yaitu metode yang bertujuan mengelompokan data sedemikian hingga jarak tiap- tiap data ke pusat kelompok dalam satu kelompok minimum. Analisis Cluster yang digunakan dalam penelitian ini adalah metode tidak berhierarki K-means Clustering. Banyaknya gerombol cluster yang ingin dibentuk terlebih dahulu ditentukan. Didalam metode ini diasumsikan bahwa analisis terdiri dari n individu dan p pengukuran. X i,j adalah nilai dari individu ke-i dalam variabel ke- j; i = 1,2,…,n dan j = 1,2,…,p. Misal P n,K adalah pengelompokan yang merupakan hasil dari masing-masing individu yang dialokasikan ke dalam sebuah gerombol cluster 1,2,…,K. Rata-rata variabel ke-j dalam gerombol cluster ke-l akan dinotasikan dengan X l,j, dan jumlah individu-individu yang termasuk dalam gerombol cluster ke-l dinyatakan dengan nl. Dalam notasi ini kita dapat menampilkan jarak antara individu ke-i dan gerombol ke-l sebagai berikut:       p j j l X j i X l i D 1 2 1 2 , , , 28 dengan komponen kesalahan tiap-tiap kelompok dapat didefinisikan sebagai berikut:     2 1 , ,    n i i l i D K n P E 29 di mana li adalah gerombol cluster yang terdiri individu ke-i, dan D[i,li] adalah jarak Euclidean antara individu i dan rata-rata klaster yang terdiri dari individu. Prosedur untuk pengelompokan adalah mengikuti langkah-langkah: mencari pengelompokan dengan komponen kesalahan E yang kecil dengan menempatkan individu-individu dari satu kelompok ke kelompok lainnya sampai tidak terjadi perpindahan hasil individu dalam pereduksian E. Dalam melakukan Analisis Cluster, sebaiknya pola nilai matriks korelasi data asal diamati terlebih dahulu. Selanjutnya dihitung persentase korelasi sedang 0,31-0,75 dan besar 0,76-1,00. Jika persentase korelasi sedang dan besar berkisar antara 10 hingga 80 persen, maka data skor faktor dapat memberikan hasil yang lebih baik daripada data asal untuk proses penggerombolan Handayani dalam Naibaho, 2003. Kemudian dari hasil Analisis Cluster tersebut, dapat diketahui rata-rata maupun standar deviasi masing-masing indikator pada tiap kelompok. Dalam penelitian ini, indikator-indikator dari masing-masing kelompok dikategorikan menjadi lima tingkatan yaitu sangat rendah, rendah, sedang, tinggi ataupun sangat tinggi untuk mendapatkan informasi yang lebih cermat. Penentuan tingkatan kategori tersebut mengacu pada penelitian Abdullah 2008 dengan batasan pengkategorian sebagaimana terlihat pada Tabel 3.1. Untuk mempermudah penilaian, masing-masing kategori dikonversikan dalam bentuk angka. Tabel 3.1 Kategori, Nilai Konversi dan Nilai Selang Skor Faktor Kategori Nilai Konversi Nilai Selang 1 2 3 Sangat Tinggi 5 j + 1,5S j SF Tinggi 4 j + 0,5S j SF ≤ j + 1,5S j Sedang 3 j - 0,5S j SF ≤ j + 0,5S j Rendah 2 j - 1,5S j SF ≤ j - 0,5S j Sangat Rendah 1 SF ≤ j - 1,5S j Sumber: Abdullah, 2008, diolah. di mana: j = 1,2,3…n, n = banyaknya kelompok j = rata-rata total peubah j S j = standar deviasi peubah j SF = skor faktor

BAB IV HASIL DAN PEMBAHASAN

4.1 Gambaran Umum Provinsi Jawa Timur

Provinsi Jawa Timur terletak di antara 111 dan 4 114 Bujur Timur serta 12 7 dan 48 8 Lintang Selatan. Provinsi berpenduduk sekitar 37 juta jiwa Sensus Penduduk 2010 ini mempunyai luas 147.130,15 km 2 yang terbagi atas kawasan hutan 12.261,64 km 2 26,02, persawahan seluas 12.286,71 km 2 26,07, pertanian tanah kering mencapai 11.449,15 km 2 24,29, pemukimankampung seluas 5.712,15 km 2 12,12, perkebunan seluas 1.581,94 km 2 3,36, tanah tandusrusak seluas 1.293,78 km 2 2,75, tambakkolam mencapai 737,71 km 2 1,57, kebun campuran seluas 605,65 km 2 1,29, selebihnya terdiri dari rawadanau, padang rumput dan lain-lain seluas 1.201,42 km 2 2,55. Jawa Timur memiliki 60 buah pulau termasuk Pulau Madura yang merupakan pulau terbesar serta 48 gunung. Gunung yang tertinggi adalah Gunung Semeru yang mencapai ketinggian 3.676 meter di atas permukaan laut dan Gunung Lamongan yang merupakan gunung berapi yang terendah dengan tinggi 1.668 m. Secara administratif, provinsi ini terbagi menjadi 29 kabupaten dan 9 kota. Provinsi yang terletak di ujung timur Pulau Jawa ini sebelah utara berbatasan dengan Laut Jawa; sebelah timur dengan Pulau Bali; sebelah selatan dengan Samudera Indonesia; dan sebelah barat berbatasan dengan Provinsi Jawa Tengah.