Oleh karena itu
Σ.a
2
=
λ
2
a
2
yang berarti bahwa vektor a
2
merupakan vektor eigen dari
Σ yang bersesuaian dengan nilai eigen terbesar ke dua, λ
2
.
Penentuan a
i
Memperhatikan cara diatas, maka vektor a
i
merupakan vektor eigen dari matriks
Σ yang bersesuaian dengan nilai eigen terbesar ke i, yaitu λ
i
, atau dengan kata lain berlaku:
ΣΑ Α
= Λ
Τ
dengan matriks
{ }
i
diag λ
= Λ
dan A = [a
1,
a
2
, ….., a
p
]
T
Berapa banyak nilai komponen utama diperlukan sebagai data penelitian, atau seberapa efektif dimensi data dapat dijadikan data penelitian. Pertanyaan
tersebut dapat dijawab dengan menerapkan perhitungan proporsi nilai eigen, yaitu
membagi jumlah r nilai eigen dengan jumlah seluruh nilai eigen, kita akan
mendapatkan hasil pengukuran untuk kualitas dari representasi yang didasarkan
pada r komponen utama. Hasil penghitungan di ekspresikan sebagai persentasi.
Untuk jelasnya, kriteria nilai ciri yang representatif, didasarkan pada rasio
dari jumlah r nilai eigen terbesar, untuk mencuplik nilai komponen utama dari
dalam matriks. Jika nilai eigen diberi label
λ
1
≥ λ
2
≥ …≥ λ
q
, maka penghitungan
rasio dapat dituliskan sebagai berikut Kantardzic 2003:
∑ ∑
= =
=
q i
i r
i i
Rasio
1 1
λ λ
. 24 Menurut Johnson dan Wichern, persentasi rasio 80, dan 90 dari total
nilai eigen, akan memberikan sebanyak r kompenen utama untuk menggantikan
data asli tanpa banyak kehilangan informasi Johnson et. al 1998.
2.10 Normalisasi Data
Untuk meningkatkan hasil identifikasi dilakukan normalisasi terhadap data penelitian. Salah satu teknik yang dapat digunakan untuk menormalisasi data
adalah metode standar deviasi. Normalisasi menggunakan standar deviasi dilakukan untuk mengukur jarak, dengan mentransformasi data asli kedalam
bentuk lain. Untuk vektor ciri v, dimana nilai rata – rata vektor adalah meanv dan standar deviasi vektor adalah sdv di hitung untuk semua sampel data,
kemudian, untuk nilai ciri ke i ditransformasikan menggunakan persamaan
Kantardzic 2003.
v’i = vi – meanv sdv 25
Contoh: Jika nilai ciri v = {1, 2, 3}, maka meanv = 2, sdv = 1, maka nilai ciri hasil normalisasi adalah v = {-1, 0, 1}.
2.11 Kaidah Bayes
Kaidah Bayes dapat digunakan untuk melakukan klasifikasi terhadap sejumlah kategori. Pengambilan keputusan didasarkan pada hasil perhitungan
jarak antar fungsi kepekatan peluang dari vektor ciri. Kaidah Bayes mengasumsikan bahwa kesalahan dalam pengambilan
keputusan mempunyai nilai sama, nilai benar dalam pengambilan keputusan adalah 0 nol, dan kaidah pengambilan keputusan Bayes dapat dinyatakan dengan
dx =
θ
i
, anggaplah ada sejumlah i kelas θ
1
, θ
2
, θ
3
, .., θ
i
, dimana vektor x
dinyatakan masuk dalam kelas θ
i
, jika
P θ
i
. px | θ
i
≥ Pθ
j
. px | θ
j
,
∀
i,j = 1, 2, 3, .. N 26
Dimana: P
θ
i
adalah peluang, dimana vektor masukkan berada dalam kelas θ
i
. Terjadinya peluang terdahulu dapat di nyatakan dengan h
i
, untuk kelas
θ
i
, dimana i = 1, 2, 3, …., N. px|
θ
i
adalah fungsi kepekatan peluang kelas bersyarat dari x yang di
berikan, di mana x masuk dalam kelas θ
i
. Fungsi kepekatan peluang kelas bersyarat terdahulu dari x untuk setiap kelas
θ
i
, dapat juga di nyatakan dengan f
i
x. g
i
x = P θ
i
. px|
θ
i
, g
i
x adalah fungsi pengambilan keputusan Bayes. g
i
x g
k
x untuk k ≠ i, adalah kaidah pengambilan keputusan Bayes.
Dalam kaidah pengambilan keputusan Bayes, dx =
θ
i
, hasil pengujian
vektor x, akan masuk dalam kelas
θ
i
jika h
i
.l
i
.f
i
x h
k
.l
k
.f
k
x, untuk k
≠ i,
dimana l
i
adalah nilai peluang kesalahan dalam pengambilan keputusan pada kelas θ
i
, dalam banyak kasus, nilai peluang kesalahan pengambilan keputusan l
i
dapat
di anggap sama, sehingga dapat di abaikan, dan h
i
adalah nilai peluang dari kejadian fungsi peluang terdahulu f
i-1
dari vektor – vektor pada kelas θ
i
, dan sering di asumsikan sama, sehingga dapat di abaikan.
Pengambilan keputusan, dilakukan berdasarkan nilai tertinggi yang mendekati nilai fungsi kepekatan peluang f
i
x dari vektor x untuk dapat masuk
dalam kelas tertentu θ
i
, argmax{ h
n
.l
n
.f
n
x}, dimana n = 1, …,K, Specht 1992, Zaknich 1995.
2.12 Jaringan Syaraf Tiruan Probabilistik