Definisi 2.4.15
Suatu matriks A dikatakan orthogonal jika memiliki sifat A
T
A=I=AA
2.5 Analisis Komponen Utama Prinsip
Di dalam statistika terdapat usaha-usaha untuk menyederhanakan struktur data atau mereduksi dimensi data tanpa mengabaikan variabel-variabel yang telah diukur
tersebut. Salah satu metode statistika tersebut adalah analisis komponen utama principal component analysis.
Analisis komponen utama prinsip adalah salah satu teknik eksplorasi data yang digunakan sangat luas ketika menghadapi data multivariat. Analisis komponen utama
merupakan teknik statistik yang dapat digunakan untuk menjelaskan struktur variansi- kovariansi dari sekumpulan variabel melalui beberapa variabel baru dimana variabel
baru ini saling bebas dan merupakan kombinasi linier dari variabel asal. Selanjutnya variabel baru ini dinamakan komponen utama principal component.
2.5.1 Akar Ciri dan Vektor Ciri
Definisi : Jika A adalah matriks berukuran n x n, maka vektor tak nol x di dalam R
n
dinamakan vektor ciri dari A jika Ax adalah kelipatan skalar dari x, yaitu:
x x
A
Untuk suatu skalar
. Skalar disebut akar ciri dari A dan x dikatakan vektor ciri yang
bersesuaian dengan .
Untuk mencari akar ciri matrik A yang berukuran n x n maka ditulis
x A
x sebagai
x x
I A
A -
I
x
Dan persamaan di atas akan mempunyai penyelesaian jika
A -
I det
2.5 Persamaan 2.5 disebut persamaan karakteristik A.
Contoh Carilah nilai-nilai akar ciri dan vektor ciri dari
1
- 2
3 A
Jawab Persamaan karakteristik
1 ,
2 2
3 -2
- 3
- A
- I
det 1
2 3
1 2
3 1
1 A
- I
2 1
2
Jadi nilai-nilai akar ciri dari A adalah 1
dan 2
2 1
Ruang vektor:
1 2
- 3
-
2 1
x x
Jika 2
diperoleh:
2 1
2 -
1
2 1
x x
2 2
2 1
2 1
x
x x
x
dengan eliminasi diperoleh s
x s
x
2 1
, 2
Jadi vektor-vektor ciri dari A yang bersesuaian dengan adalah vektor-vektor tak nol
yang berbentuk
1
2 2
s s
s x
Jadi basisnya adalah
1
2 untuk
2
2.5.2 Menentukan Komponen Utama
Dipunyai matriks kovarian Σ dari p buah variabel
p
x x
x ,...,
,
2 1
. Total varian dari variabel-variabel tersebut didefinisikan sebagai tr
Σ = trace Σ yaitu penjumlahan dari unsur diagonal matriks Σ. Komponen utama pertama dari vektor berukuran p x 1,
T p
x x
x x
,..., ,
2 1
adalah kombinasi linear :
p p
x a
x a
x a
x a
y
1 2
12 1
11 1
1
...
dimana :
T p
x a
a a
1 12
11 1
,..., ,
dan
1
1
a
a
T
Varian dari komponen pertama adalah :
ij j
p i
p j
i T
y
a a
a a
a
1 1
1 1
1 1
2 1
2.6
vektor
1
a dipilih sedemikian sehingga
2 1
y
mencapai maksimum dengan kendala 1
1
a
a
T
. Menggunakan teknik pemaksimuman berkendala lagrange diperoleh persamaan :
1 1
,
1 1
1 1
1 1
2 1
1
a a
a a
a a
a f
T T
T y
2.7 Jika persamaan 2.7 diturunkan terhadap vektor
1
a dan disamadengankan nol diperoleh :
1 1
1 1
1 1
atau 2
2 ,
a a
a a
da a
df
2.8 Persamaan 2.8 dipenuhi oleh
1
dan a
yang merupakan pasangan akar ciri dan vektor
ciri matriks Σ. Akibatnya
1 1
1 1
1 1
a a
a a
a a
T T
T
. Oleh karena itu varian
1 1
2 1
1
a a
y
T y
harus maksimum, maka adalah akar ciri yang terbesar dari
matriks Σ dan
1
a adalah vektor ciri yang bersesuaian dengannya. Komponen
utama kedua
adalah kombinasi
linear dari
x a
2
adalah
p p
x a
x a
x a
x a
y
2 2
22 1
21 2
2
...
, dimana
T p
x a
a a
2 22
21 2
,..., ,
dan
1
2 2
a
a
T
dipilih sedemikian sehingga x
a y
2 2
tidak berkorelasi dengan
x a
y
1 1
. Varian
2
y adalah
2 2
2 2
a a
T y
2.9
Varian tersebut akan dimaksimumkan dengan kendala 1
2 2
a
a
T
dan cov
2 1
, y y
= cov
,
2 1
2 1
a a
a x
a
T x
. Karena
1
a adalah vektor ciri dari Σ dan Σ adalah matriks
simetrik, maka
T T
T T
T T
a a
a a
a
1 1
1 1
1
. Kendala
2 1
2 1
a a
a a
T T
dapat dituliskan sebagai
2 1
a
a
T
. Jadi fungsi Lagrange yang dimaksimumkan adalah
1 ,
,
2 1
2 2
2 1
2 2
2 1
2
a a
a a
a a
a f
T T
T
2.10 fungsi Lagrange yang dimaksimumkan diturunkan terhadap vektor
2
a diperoleh
2 2
, ,
1 2
1 1
2 2
2 1
2
a a
a da
a df
2.11 Jika persamaan 2.11 dikalikan dengan
T
a
1
maka diperoleh
2 2
2 2
2 2
2
2 2
1 1
1 2
2 1
1 2
1 1
1 1
1 2
2 1
1 2
1 1
1 2
2 1
1 2
1
a a
a a
a a
a a
a a
karena a
a a
a a
a a
a a
a a
a
T T
T T
T T
T T
T T
Oleh karena 2
2 1
a a
T
maka
2
. Dengan demikian persamaan 2.11 setelah diturunkan terhadap
2
a menjadi
2 2
, ,
2 1
2 1
1 2
2 2
1 2
a a
a a
da a
df
2.12
Jadi
2 1
dan a
merupakan pasangan akar ciri dan vektor ciri dari matriks varian-
kovarian Σ. Seperti halnya penurunan pada pencarian
1
a , akan diperoleh bahwa
2
a adalah vektor ciri yang bersesuaian dengan akar ciri terbesar kedua da
ri matriks Σ. Logika yang sama digunakan untuk mendapatkan komponen utama yang lain.
2.5.3 Kriteria Pemilihan Komponen Utama