Langkah-langkah yang dilakukan dalam analisis ini adalah : 1. Ortogonalisasi Variabel
Tujuannya adalah membuat variabel baru Z =1,2,...,qp yang memiliki karakteristik:
1 satu sama lain tidak saling berkorelasi, yakni: r’ = 0,
2 nilai rataan masing-masing, tetap sama dengan nol, dan 3 nilai ragam masing-masing Z sama dengan 0, dimana = p.
2. Penyederhanaan jumlah variabel Mengurutkan masing-masing faktorkomponen utama F yang dihasilkan,
dari yang memiliki eigenvalue λ tertinggi hingga terendah, yakni :
a. Memilih faktor-faktor atau komponen-komponen utama yang memiliki 1, artinya faktor atau komponen utama yang memiliki kandungan informasi
ragam setara dengan informasi yang terkandung dalam satu variabel asal. b. Membuang faktor atau komponen utama yang mempunyai eigenvalue
antar dua faktor atau komponen utama yang berdekatantidak begitu signifikan, jika - - 11. Sebagai alternatif lain digunakan juga metode
The Scree Test yang diperkenalkan oleh Catell dimana dari hasil scree plot
yang dipilih adalah yang paling curam. c. Menentukan faktor-faktor atau komponen-komponen utama yang memiliki
koefisien korelasi nyata minimal satu variabel asal. Kriteria yang digunakan adalah | rj|0.7 Hal ini dimaksudkan agar setiap faktor atau
komponen utama yang terpilih, paling tidak memiliki satu penciri dominan dari variabel asalnya.
Hasil PCA antara lain: Akar ciri eigen value merupakan suatu nilai yang menunjukkan keragaman
dari peubah komponen utama yang dihasilkan dari analisis, semakin besar nilai eigen value, maka semakin besar pula keragaman data awal yang mampu
dijelaskan oleh data baru. Componentfactor score adalah nilai yang menggambarkan besarnya titik-titik
data baru dari hasil komponen utama dan digunakan setelah PCA. Factor loading menggambarkan besarnya korelasi antar variabel awal dengan
komponen ke-i. PC scores ini yang digunakan jika terjadi analisis lanjutan
setelah PCA. Factor Loadings L adalah sama dengan Factor Score
Coefficients C kali Eigenvalue Faktor atau Komponen Utamanya.
2.8 ClusterAnalysis
Cluster Analysis atau analisis gerombol pada prinsipnya digunakan untuk
mengelompokkan obyek atau merupakan proses untuk meringkas sejumlah obyek menjadi lebih sedikit dan menamakannya sebagai klaster. Dalam analisis klaster
tidak ada variabel bebas maupun variabel tergantung. Dasar pengelompokan yang digunakan dalam analisis klaster adalah kesamaan similarity atau jarak
distance ketidaksamaan dissimilarity. Obyek yang berada dalam satu klaster relatif memiliki kemiripan dibandingkan dengan obyek yang berada pada klaster
yang lain. Analisis klaster juga sering disebut analisis klasifikasi classification analysis
. Hasil analisis klaster yang diharapkan adalah adanya perbedaan yang tinggi antara satu klaster dengan klaster yang lain, sehingga jelas adanya
perbedaan karakteristik antar klaster yang terbentuk, dan memiliki kesamaan yang tinggi antar anggota dalam satu klaster, sehingga dalam satu klaster akan berisi
obyek yang sama Saefulhakim, 2006. Secara umum terdapat dua metode pengelompokan dalam analisis klaster
gerombol yaitu: 1 metode berhirarki dan 2 metode tak berhirarki Saefulhakim 2006. Metode tak berhirarki merupakan metode pengelompokan
dimana jumlah kelompok yang terbentuk sudah diketahui sebelumnya. Misalnya orde pembangunan wilayah secara umum diketahui berjumlah 5 lima, yaitu:
sangat tinggi, tinggi, sedang, rendah, dan sangat rendah, atau 3 tiga yaitu: tinggi, sedang dan rendah. Pengklasifikasian selanjutnya akan dilakukan berdasarkan
jumlah yang kita inginkan tersebut. Unit-unit analisis yang dikelompokkan akan bergerombol sesuai dengan kedekatankemiripan karakteristiknya masing-masing.
Salah satu metode tak berhirarki yang sering digunakan adalah K-Mean Cluster. Sedangkan pada klaster berhirarki jumlah kelompok yang terbentuk belum
diketahui. Pengelompokan selanjutnya dilakukan terhadap seluruh unit berdasarkan seluruh karakteristik yang diamati. Selanjutnya berdasarkan
kenampakan hasil pengklasteranpenggerombolan ditentukan pemotongan seberapa banyak klaster yang akan digunakan Saefulhakim, 2006.
Sebelum melakukan penggabungan data perlu dihitung terlebih dahulu jarak antara dua data atau jarak antara dua klaster data dengan ciri yang serupa. Untuk
dapat melakukan penggerombolan diperlukan suatu skala pengukuran yang sama. Jika skala data tidak sama maka data perlu ditransformasikan dalam suatu bentuk
skor tertentu yang disebut jarak baku. Dalam analisis klaster terdapat beberapa ukuran jarak antara lain: jarak mahalanobis, jarak eucledian, jarak kuadrat
eucledian, jarak manhattan city-block, jarak chebycev, power distance, dan percent disagreement
. Ukuran jarak yang sering digunakan adalah jarak eucledian euclidean distance. Persamaan penghitungan jarak eucledian antara dua titik
atau dua klaster atau gerombol adalah: D =
{
2
}
12
Nilai D merupakan jarak antara titik data gerombol X dan Y. Makin kecil nilai D makin besar kemiripan data X dan Y. Asumsi yang harus dipenuhi dalam
penggunaan jarak eucledian ini adalah bahwa antar variabel tidak terjadi multicollinearity
atau variabel-variabel yang ada saling tegak lurus ortogonal. Berhubung pengkelasan suatu wilayah pada umumnya didasarkan pada
karakteristik variabel dalam jumlah cukup besar, maka kemungkinan terjadinya multicollinearity
cukup besar. Oleh karena itu, perlu dilakukan teknik antara dengan menghilangkan kondisi tersebut melalui transformasi PCA. Dengan
transformasi PCA tersebut variabel-variabel yang digunakan akan saling ortogonal satu dengan yang lain.
Pada tahap selanjutnya, dalam teknik penggerombolan, dilakukan amalgamasi antar gerombol sesuai dengan kedekatan jaraknya. Terdapat banyak
teknik amalgamasi diantaranya: single linkage, complete linkage, unweighted pair group-average, weighted pair-group average, unweighted pair-group centroid,
weighted pair-group centroid, dan
ward’s. Dalam penelitian ini digunakan metode Ward’s. Penggabungan antara dua klaster atau gerombol data berdasarkan
Metode Ward’s dilakukan berdasarkan penghitungan jumlah kuadrat jarak dari
kedua klaster hipotetis tersebut. Metode ini sangat efisien, namun demikian, umumnya metode ini cenderung membentuk ukuran gerombol yang kecil.
Dalam penelitian ini, analisis klaster bertujuan mengelompokan wilayah berdasarkan faktor-faktor utama yang mempengaruhi tingkat perkembangan
wilayah. Pengelompokan wilayah-wilayah menjadi beberapa kelompok didasarkan pada pengukuran variabel-variabel yang diamati, sehingga diperoleh
kemiripan wilayah dalam kelompok yang sama dibandingkan antara wilayah dari kelompok yang berbeda.
2.9 Discriminant Analysis
Discriminant Analysis atau analisis diskriminan merupakan salah satu
analisis multivariabel untuk menentukan variabel mana yang membedakan secara nyata dengan kelompok-kelompok yang telah ada secara alami, sehingga
digunakan untuk menentukan variabel mana yang merupakan penduga terbaik dari pembagian kelompok-kelompok yang ada.
Pada prinsipnya, penentuan dalam analisis diskriminan ini berbalikan dengan metode analisis klaster. Jika analisis klaster khususnya klaster unit
menentukan klaster dari ciri-ciri yang diduga mirip, maka analisis diskriminan menentukan dengan kelompok yang sudah tentu yang terbentuk secara alamiah
ingin ditentukan variabel yang mana yang sebenarnya secara nyata membedakan kelompok-kelompok tersebut. Selain itu, analisis diskriminan juga dapat
dilakukan untuk menguji ketepatan pengelompokan wilayah hasil analisis pengelompokan yang lain, yaitu pengelompokan berdasarkan hasil analisis
tipologi Klassen. Asumsi-asumsi yang digunakan dalam analisis diskriminan antara lain adalah Saefulhakim, 2006:
a. Data contoh merupakan data multivariabel yang menyebar normal. Walaupun demikian, jika syarat penyebaran normal ini tidak dipenuhi, perbedaan hasil
pengujian tidak ”fatal”. Artinya hasil pengujian masih layak untuk dipercaya; b. Matriks ragam variances atau peragam covariances variabel antar
kelompok bersifat homogen. Jika terdapat deviasi kecil masih bisa diterima. Oleh karena itu, akan lebih baik jika sebelum menggunakan hasil pengujian
terlebih dahulu dilihat lagi nilai korelasi dan ragam variabel dalam setiap kelompoknya;
c. Tidak terdapat korelasi antara nilai tengah variabel antar kelompok dengan nilai ragam atau standar deviasinya;