Menghitung PCA Principal Componen Analysis Analisis Korelasi

3.4 Analisis Cluster

Analisis cluster merupakan teknik multivariat ∑∑ − = = = G g n i g x x i W 1 1 2 yang mempunyai tujuan utama untuk mengelompokkan beberapa objek berdasarkan karakteristik yang dimilikinya. Analisis cluster mengklasifikasi objek sehingga setiap objek yang paling dekat kesamaannya dengan objek lain berada dalam kelompok yang sama. Kelompok yang terbentuk memiliki homogenitas internal yang tinggi dan heterogenitas eksternal yang tinggi. Banyaknya cluster ditentukan dengan plot jarak antar data sebagai fungsi dari jumlah cluster. Bila terjadi lompatan signifikan jarak antar data maka dapat di tetapkan sebagai referensi jumlah cluster. Metode pemecahan dimulai dari satu kelompok besar yang mengandung seluruh observasi, selanjutnya observasi yang paling tidak sama dipisah dan dibentuk kelompok yang lebih kecil. Proses ini dilakukan hingga tiap observasi menjadi beberapa kelompok kecil objek. Kesamaan antar objek merupakan ukuran korespodensi antar objek. Teknik untuk mengukur jarak dalam metode ini yaitu metode ward’s, dengan menghitung jumlah kuadrat antara dua kelompok untuk seluruh variabel, formulasinya adalah : Dimana ; W : Jarak G : Kelompok Besar g : Objek kelompok kecil

3.5 Menghitung PCA Principal Componen Analysis

PCA telah mulai dilakukan oleh Pearson 1901 dan kemudian dikembangkan oleh Hotelling 1933. Aplikasi dari PCA didiskusikan oleh Rao 1964, Cooley dan Lohnes 1971, dan Gnanadesikan 1977. Perlakuan statistik yang menakjubkan dengan PCA ditemukan oleh Kshirsagar 1972, Morrison 1976, dan Mardia, Kent, dan Bibby 1979. Tujuan utama metode PCA adalah mereduksi sejumlah data dengan variasi yang besar ke dalam bentuk variabel baru. Data yang dihitung dalam PCA merupakan anomali yaitu dengan mengurangi tiap variable dengan rata-ratanya.                 −                 = k k x x x x x x x x x   3 2 1 3 2 1 Variabel baru u m x e u T m m = menunjukan jumlah maksimum variasi dengan sebelumnya menghitung eigenvector. Sehingga komponen utama dapat dihitung dengan formula : Elemen eigen vector adalah bobot a ij dan biasanya disebut sebagai loading. Elemen diagonal matrik S y , varian-covarian matrik komponen utama atau sering disebut eigen values. Eigen value adalah variasi yang dijelaskan oleh komponen utama. Posisi data awal observasi pada sistim koordinat baru komponen utama disebut skor dan dihitung sebagai kombinasi linier antara data awal asli dan nilai bobot a ij. Sebagai contoh, bila skor untuk r th sample pada k th kp kp k k k k kr x a x a x a Y + + + =  2 2 1 1 komponen utama maka dapat di hitung dengan :

3.6 Analisis Korelasi

Dengan memperhatikan korelasi antara komponen satuan grid SML dan PC-1 AMH selanjutnya dapat dianalisis keeratan hubungan antara AMH dan SML di suatu wilayah 15°S – 15°N; 80°E- 100°W. Nilai korelasi tiap grid di petakan, sehingga dapat diketahui pola keeratan hubungan kedua variabel. Tingkat hubungan SML dan AMH di satu grid dinyatakan dengan formulasi : ∑ ∑ ∑ ∑ ∑ ∑ ∑ = = = = = = =       −       −             − = n t n t j j i j j i n t n t t t n t n t t j i n t t t j i t Y Y X X Y X Y X n n n r 1 2 1 , , 2 , , 2 1 1 2 1 1 , , 1 , , Dimana : r = besarnya korelasi antara AMH dengan SST X t = AMH bulan ke t Y i,j,t

3.7 Principal Componen Regression PCR