Dekomposisi Nilai Singular Analisis Biplot .1 Gambaran Umum Analisis Biplot

9 Jolliffe2002,p.90-94,dimisalkan = �� � dan = � 1 −� � dengan 0 � 1, maka : � = � � � = �� � � 1 −� � = dan unsur baris ke-i dan kolom ke-j dari matriks X dapat dinyatakan sebagai: = � ℎ Pemilihan nilai � pada = �� � dan = � 1 −� � bersifat sembarang dengan syarat � 1. Pengambilan dua nilai � berguna dalam interpretasi Biplot. 1. Jika nilai � = 0 diperoleh = �� � = � dan = � 1 −� � = � � maka � � = = � � = Sehingga diperoleh: a. = � − 1 � dengan � banyak objek pengamatan dan � adalah matriks kovarians variabel ke-i dan variabel ke-j. b. = � − 1 � dengan � = � menggambarkan keragaman variabel ke-i. c. Korelasi antar variabel ke-i dan variabel ke-j dijelaskan oleh cosines sudut antara dan , missal sudut yang terbentuk adalah , yaitu cos � = = � � � = d. Jika X berpangkat � maka − � −1 − = � − 1 − − Terlihat bahwa jarak mahalanobis sebanding dengan jarak Euclid. Ini menunjukkan bahwa jarak Euclid mampu menggambarkan objek pengamatan seperti data pengamatan yang sesungguhnya. 2. Jika nilai � = 1 diperoleh = �� � = �� dan = � 1 −� � = � maka � � = = � � = atau − − = − − , artinya kuadrat jarak Euclid antara dan sama dengan jarak Euclid antara dan . 10

2.3 Analisis Gerombol

Cluster Analysis Analisis gerombol Cluster Analysis merupakan salah satu analisis peubah ganda yang digunakan untuk mengelompokkan objek-objek pengamatan berdasarkan karakteristik peubah-peubah yang diamati.Tujuan utama analisis gerombol adalah mengelompokkan objek-objek berdasarkan kesamaan karakteristik, Johnson Wichern2007 dan Hair,et al2007. Objek tersebut akan diklasifikasikan ke dalam satu atau beberapa cluster sehingga objek-objek yang berada dalam satu cluster akan mempunyai kemiripan satu dengan yang lain. Homogenitas kesamaan yang tinggi antar anggota dalam cluster within cluster dan heterogenitas perbedaan yang tinggi antar cluster satu dengan cluster lainnya between cluster merupakan dua hal yang harus dimiliki sebuah cluster agar dapat dikatakan cluster tersebut baik, Brown, et al2012, Izenman2008, Tabachnik Fidell2007. Tahapan penggerombolan dapat disajikan dalam bentuk diagram pohon dendogram yang memungkinkan penelusuran penggerombolan objek-objek yang diamati dengan lebih mudah dan informatif.Hal yang perlu diperhatikan dalam cluster analysis diantaranya:1 himpunan objek yang ingin di cluster , 2 peubah yang diamati peubah indikator, 3 skala peubah nominal, ordinal, interval dan rasio, 4 ukuran kemiripan dan ketakmiripan, dan 5 teknik penggerombolanpengelompokan. Misalkan r dan s adalah dua objek pada ruang dimensi-p dan d rs menunjukkan ukuran ketakmiripan dua objek tersebut, maka d rs memenuhi kondisi sebagai berikut : 1. d rs ≥ 0 untuk setiap objek r dan s : ukuran tidak pernah negatif 2. d rs = 0 jika dan hanya jika r = s: ukuran bernilai nol bila objek r sama dengan objek s 3. d rs = d sr : ukuran bersifat simetris Ukuran ketakmiripan yang sering digunakan adalah jarak Euclidean antara dua objek. Misalkan terdapat n objek dengan p peubah dalam matriks X berukuran n x p maka jarak Euclidean antara objek ke r dan ke-s adalah: � = − 2 � =1 1 2 Dengan d rs menyatakan jarak objek ke-r dan objek ke-s, x rk menyatakan nilai amatan pada objek ke-r dan peubah ke-k, dan x sk menyatakan nilai amatan pada objek ke-s dan peubah ke-k. Hasil ukuran jarak ini kemudian disusun ke dalam matriks jarak. Terdapat dua macam teknik dalam cluster analysis yaitu teknik berhirarki dan teknik tak berhirarki. Teknik berhirarki digunakan bila banyaknya cluster yang 11 diinginkan belum diketahui. Sedangkan teknik tak berhirarki digunakan bila banyaknya cluster yang diinginkan telah diketahui. Secara umum langkah-langkah yang digunakan pada teknik berhirarki adalah: 1. Mulai dengan n gerombol, di mana tiap cluster hanya mengandung objek tunggal dan sebuah matriks jarak kemiripan D= d ik 2. Cari matriks jarak untuk pasangan cluster paling mirip. Jarak antara cluster r dan s yang paling mirip menjadi d rs 3. Gabung cluster r dan s ke dalam cluster baru rs. Perbarui elemen dalam matriks jarak dengan:a hapus baris dan kolom yang menghubungkan cluster r dan s, b tambahkan sebuah baris dan kolom yang memberi jarak antara gerombol rs dan cluster yang tersisa 4. Ulangi langkah 2 dan 3 sampai n-1 kali sehingga semua objek terbentuk dalam satu cluster . Catat identitas dan level jarak kemiripan pada cluster yang digabung. Metode penggabunganpautan dalam cluster analysis antara lain single linkage , complete linkage , average linkage , ward , dan centroid . Teknik dasar masing-masing metode pautan secara singkat diuraikan sebagai berikut. a Single linkage Metode pautan ini didasarkan pada jarak minimum yang sering disebut pendekatan tetangga terdekat nearest-neighbor . Jarak minimum antara cluster dengan cluster lain misalkan cluster dituliskan sebagai: = min � , � dengan � dan � secara berturut-turut adalah jarak dari cluster ke cluster dan dari cluster ke cluster cluster , merupakan jarak terdekat antara cluster dan serta cluster dan Johnson, 2007. Sebagai contoh misalkan dimiliki matriks jarak Euclidean D, dengan elemen-elemen matriks sebagai berikut: D = � = 1 2 3 4 5 9 3 6 11 7 5 10 9 2 8 0 maka cluster dengan jarak terdekat adalah cluster 3 dan 5 pertama bergabungterpaut menjadi cluster baru yaitu cluster 35 , selanjutnya dilakukan perhitungan matriks jarak baru. Elemen-elemen matriks jarak baru dihitung dengan perhitungan: � 351 = min � 31 , � 51 = min 3,11 = 3