13 Sumber: data olah lampiran 5
Gambar 4.6 Box Plot Data Riil
Pada gambar Box Plot diatas, dapat diketahui bahwa 11 dari 13 variabel yang digunakan memiliki data yang berada di luar batas bawah dan batas atas whisker yang
berpotensi sebagai pencilan outlier yang ditandai dengan lingkaran kecil. Dengan data riil yang telah berdistribusi multivariat normal, maka tahapan
berikutnya adalah melakukan pengelompokan dengan mengunakan terpilih, yaitu LCCA. Jumlah cluster yang digunakan sebagai input adalah c=2 hingga c=6. Dengan melakukan
10 kali pengulangan, hasil selengkapnya disajikan berikut ini.
4.5 Pembentukan Cluster Optimal Data Riil
Penentuan cluster optimal dilakukan dengan menghitung indeks validitas cluster melalui bantuan program R library clValid. Sehingga diperoleh tabulasi berikut:
Tabel 4.7 Indeks Validitas 2-6 Cluster Pengelompokan Data Riil
Metode Jenis Indeks
Validitas Banyaknya Cluster
2 3
4 5
6
1 2
3 4
5 6
7
LCCA Connectivity
54.7151 51.496
58.6079 94.7413
54.7151
Dunn
0.0478 0.0684
0.0755 0.1172
0.1075
Silhouette 0.2534
0.3505 0.2886
0.1842 0.2534
Sumber: data olah Dari tabel diatas, indeks Connectivity terkecil, dan Silhouette terbesar menunjukkan
cluster optimal pada 3 cluster, sedangkan indeks Dunn terbesar mengarahkan pada cluster sebanyak 5. Namun output Mclust hanya bisa menunjukkan bentuk model terbaik yaitu EEE
dengan 3 cluster, tanpa menguraikan parameter dan summary model. Model EEE bermakna
14
bahwa model yang dihasilkan memiliki bentuk ellipsoidal, nilai varians setiap cluster sama equal volume, bentuk setiap cluster sama equal shape dan arah orientasi cluster juga sama equal
orientation. Oleh karena itu, untuk melengkapi profiling metode LCCA 3 cluster dengan menggunakan Latent Gold. 4.0 harus dibangun model yang memiliki karakteristik EEE tersebut.
4.6 Output M odel LCCA
Memperhatikan tabulasi dari masing-masing parameter model cluster LCCA yang dihasilkan Lampiran 6, maka dapat dirumuskan Persamaan model untuk
masing-masing cluster tersebut ebagai berikut:
1. Cluster 1: 0,75
∏
2 |
| exp
− −
− , dengan
adalah rata-rata variabel indikator ke-i pada cluster pertama, dan adalah matriks
varians-kovarians cluster pertama. 2.
Cluster 2:
0,23
∗ ∏
2 |
| exp
− −
− , dengan
adalah rata-rata variabel indikator ke-i pada cluster kedua, dan adalah matriks
varians-kovarians cluster kedua. 3.
Cluster 3:
0,02
∗ ∏
2 |
| exp
− −
− , dengan
adalah rata-rata variabel indikator ke-i pada cluster ketiga, dan adalah matriks
varians-kovarians cluster ketiga.
4.7 Profiling Pengelompokan Kabupaten Kota