Matriks Korelasi Matriks korelasi adalah matriks yang di dalamnya terdapat korelasi-korelasi.

22 �� − ��� = 0 � − ��� = 0 � ≠ 0 → � − �� = 0 Untuk memperoleh nilai λ, � − �� = 0 2.3 Jika nilai eigen � disubstitusi pada persamaan � − ��� = 0, maka solusi dari vektor eigen � adalah: � − � �� = 0 . 2.4 Jadi apabila matriks � mempunyai akar karakteristik � 1 , � 2 , … , � dan ada kemungkinan bahwa diantaranya mempunyai nilai yang sama, bersesuaian dengan akar-akar karakteristik ini adalah himpunan vektor-vektor karakteristik yang ortogonal artinya masing-masing nilai akar karakteristik akan memberikan nilai vektor karakteristik yaitu � 1 , � 2 , … , � .

2.3.6 Matriks Korelasi Matriks korelasi adalah matriks yang di dalamnya terdapat korelasi-korelasi.

� = � � � � � � … … ⋱ … � � � Dimana: r ik = Korelasi antara peubah ke-i dan ke-k Universitas Sumatera Utara 23 2.4 Analisis Komponen Utama Analisis komponen utama merupakan suatu teknik analisis statistik untuk mentransformasi peubah-peubah asli yang masih saling berkorelasi satu dengan yang lain menjadi satu set peubah baru yang tidak berkorelasi lagi Johnson dan Wichern, 2002. Analisis komponen utama adalah teknik penyusun data data reduction dimana tujuan utamanya untuk mengurangi banyaknya dimensi peubah yang saling berkorelasi menjadi peubah-peubah baru yang tidak berkorelasi dengan mempertahankan sebanyak mungkin keragaman dalam himpunan data tersebut Dillon dan Goldstein, 1984. Dengan kata lain, melalui analisis komponen utama diharapkan banyaknya dimensi dapat disusutkan, sehingga dengan dimensi yang lebih kecil diharapkan lebih mudah melakukan penafsiran tanpa kehilangan banyak informasi tentang data, bahkan informasi yang didapat lebih padat dan bermakna. Peubah-peubah baru itu disebut sebagai komponen utama principal component. Secara aljabar komponen utama adalah kombinasi linear khusus dari p variabel acak X 1 , X 2 ,…,X P . Secara geometris, kombinasi linear ini menggambarkan pemilihan dari system koordinat yang diperoleh dengan merotasikan sistem awal dengan X 1 , X 2 ,…,X P sebagai sumbu koordinat. Komponen utama hanya bergantung pada matriks kovarians Σ atau matriks korelasi р dari X 1 , X 2 ,…,X P.. dalam perkembangannya tidak membutuhkan asumsi multivariate normal. Misalkan vektor acak X’= [X 1 , X 2 ,…,X p ] memiliki matriks kovarians Σ dengan nilai eigen λ 1 ≥ λ 2 ≥…≥ λ p ≥ 0. Perhatikan kombinasi linear Y 1 = 1 �′ = 11 � 1 + 12 � 2 +... + 1 � � � Y 2 = 2 �′ = 21 � 1 + 22 � 2 +... + 2 � � � Y p = � �′ = �1 � 1 + �2 � 2 +... + �� � � 2.9 Universitas Sumatera Utara 24 Besarnya proporsi dari keragaman total populasi yang dapat diterangkan oleh komponen utama ke- j adalah: � � 1 + � 2 + + � � ; k = 1,2,...,p Sehingga nilai proporsi dari keragaman total yang dapat diterangkan oleh komponen utama pertama, kedua, atau sampai sejumlah komponen utama secara bersama-sama adalah semaksimal mungkin dengan meminimalkan informasi yang hilang. Meskipun jumlah komponen utama berkurang dari peubah asal tetapi informasi yang diberikan tidak berubah. Banyaknya komponen utama yang dipilih sudah cukup memadai jika komponen-komponen tersebut memiliki persentase keragaman kumulatif tidak kurang dari 75 dari total keragaman data Morrison, 1990. Prosedur lain adalah pendekatan yang diberikan oleh Kaiser 1958 yaitu pengambilan komponen utama yang mempunyai akar ciri yang lebih besar dari satu. Adapun urutan langkah-langkah dalam analisis komponen utama adalah: 1. Pembakuan data Analisis komponen utama sangat bergantung pada data asal yang digunakan. Jika satuan peubah yang digunakan tidak sama, maka peubah asal perlu dibakukan terlebih dahulu kedalam bentuk baku. Pembakuan digunakan dengan menggunakan rumus: Pembakuan dilakukan dengan rumus: = −x s 2.10 Dimana: Z jk = nilai peubah baku untuk pengamatan baris ke-j dan kolom ke-k = pengamatan baris ke- j dan kolom ke-k x = nilai rata-rata peubah ke-k s = simpangan baku peubah ke-k Johnson dan Wichern, 2007 Universitas Sumatera Utara 25 2. Menyusun matriks korelasi Sebelum analisis komponen utama dilakukan, terlebih dahulu dilihat hubungan antar peubah. Jika terdapat korelasi yang kuat antar peubah, maka dilakukan transformasi terhadap data awal dengan menggunakan analisis komponen utama. Korelasi antar peubah ke-i dan peubah ke-j dinotasikan dengan r ij dan didefenisikan sebagai berikut: � = S s S jj 2.11 Dimana: r ij = korelasi antara peubah ke-i dan peubah ke-j S ij = kovariansi sampel peubah ke-i dengan peubah ke-j S ii = variansi peubah ke-i S jj = variansi peubah ke-j Priyanto 2008 menyatakan bahwa “nilai koefisien korelasi antar peubah ke-i dan peubah ke-j dikatakan memiliki hubungan yang kuat apabila nilai koefiien korelasi mendekati +1 dan -1. Sebaliknya apabila nilai koefisien korelasi mendekati 0, maka kedua peubah memiliki hubungan yang lemah”. Selain itu Supranto 2004 menyatakan bahwa hubungan antar variabel dikatakan cukup kuat ditunjukkan dengan angka koefiien korelasi yang umumnya lebih besar dari 0,5. 3. Melalui matriks korelasi diperoleh nilai akar ciri eigen values sebanyak jumlah peubah p peubah, dengan perhitungan: � − �� = 0 2.12 Dimana: R= matriks korelasi λ= akar ciri I = matriks identitas Jumlah seluruh akar ciri sama dengan banyaknya peubah yang dianalisis, dituliskan dengan persamaan: Universitas Sumatera Utara 26 � = � 1 + � 2 + + � � = � � =1 Persentase keragaman yang diterangkan oleh masing-masing komponen adalah: � � � =1 x 100 = � � x 100, 2.13 Sehingga jika jumlah komponen yang diambil sebagai m komponen, m ≤ p, maka persentase keragaman kumulativ yang diterangkan oleh m komponen adalah: � 1 + � 2 + � 3 + + � � � =1 x 100 2.14 Karakteristik dari akar cirinya adalah beberapa komponen utama pertama adalah: λ 1 ≥ λ 2 ≥ ... ≥ λ p ≥ 0, sehingga komponen utama yang diambil adalah beberapa komponen utama pertama karena mampu menerangkan keragaman data lebih banyak. 4. Mencari vektor ciri eigen vector Vector ciri e ij diperoleh dari persamaan ciri: � − λ� = 0 2.15 Dimana: R= matriks korelasi λ= akar ciri I = matriks identitas e ij = vector eigen observasi ke-i dan peubah ke-j Masing-masing akar ciri mempunyai vektor ciri sebanyak p akar ciri. 5. Vektor ciri tersebut merupakan koefisien dari kombinasi linear atau disebut juga sebagai koefisien dari persamaan komponen utama, yaitu: Y i = �′ = 1 � 1 + 2 � 2 +... + � � � ; i = 1, 2, …, p Universitas Sumatera Utara 27 Jika data yang digunakan adalah data yang sudah dibakukan maka persamaan komponen utamanya menjadi: Yi = ′ = 1 1 + 2 2 +... + � � 2.16

2.5 Analisis Cluster

Menurut Dillon dan Goldstein 1984 analisis cluster adalah analisis statistik peubah ganda yang digunakan apabila ada n buah individu atau objek yang mempunyai p peubah dan n objek tersebut ingin dikelompokkan kedalam k kelompok berdasarkan sifat-sifat yang diamati, sehingga individu atau objek yang terletak dalam satu cluster memiliki kemiripan sifat yang lebih besar dibandingkan dengan indvidu yang terletak dalam cluster lain. Analisis cluster bertujuan untuk memisahkan objek menjadi beberapa kelompok yang mempunyai sifat berbeda antar kelompok yang satu dengan yang lain. Pada awalnya individu-individu atau objek penelitian belum dikelompokkan, kemudian dikelompokkan kedalam cluster-cluster yang bersifat homogeny berdasarkan pengukuran peubah-peubah yang diamati. Pengclusteran didasarkan pada ukuran kedekatan masing-masing individu yang disebut jarak. Dalam penghitungan jarak diperlukan adanya kesamaan satuan untuk semua peubah, jika tidak maka akan dilakukan transformasi menjadi skor baru yang berfungsi untuk menghilangkan pengaruh keragaman data atau dengan kata lain semua peubah memberikan kontribusi yang sama untuk jarak. Ukuran jarak yang digunakan dalam penelitian ini adalah jarak Euclidean. Jarak Euclid antara dua pengamatan dituliskan dengan persamaan: d ij = − 2 � =1 ; i ,j = 1,2,3, … n 2.17 Dimana: d ij adalah jarak euclidan dari individu i dan j x ik adalah nilai observasi ke-i pada variabel ke-k x jk adalah nilai observasi ke-j pada variabel ke-k Universitas Sumatera Utara