Normalisasi Data Kaidah Bayes untuk k

Oleh karena itu Σ.a 2 = λ 2 a 2 yang berarti bahwa vektor a 2 merupakan vektor eigen dari Σ yang bersesuaian dengan nilai eigen terbesar ke dua, λ 2 . Penentuan a i Memperhatikan cara diatas, maka vektor a i merupakan vektor eigen dari matriks Σ yang bersesuaian dengan nilai eigen terbesar ke i, yaitu λ i , atau dengan kata lain berlaku: ΣΑ Α = Λ Τ dengan matriks { } i diag λ = Λ dan A = [a 1, a 2 , ….., a p ] T Berapa banyak nilai komponen utama diperlukan sebagai data penelitian, atau seberapa efektif dimensi data dapat dijadikan data penelitian. Pertanyaan tersebut dapat dijawab dengan menerapkan perhitungan proporsi nilai eigen, yaitu membagi jumlah r nilai eigen dengan jumlah seluruh nilai eigen, kita akan mendapatkan hasil pengukuran untuk kualitas dari representasi yang didasarkan pada r komponen utama. Hasil penghitungan di ekspresikan sebagai persentasi. Untuk jelasnya, kriteria nilai ciri yang representatif, didasarkan pada rasio dari jumlah r nilai eigen terbesar, untuk mencuplik nilai komponen utama dari dalam matriks. Jika nilai eigen diberi label λ 1 ≥ λ 2 ≥ …≥ λ q , maka penghitungan rasio dapat dituliskan sebagai berikut Kantardzic 2003: ∑ ∑ = = = q i i r i i Rasio 1 1 λ λ . 24 Menurut Johnson dan Wichern, persentasi rasio 80, dan 90 dari total nilai eigen, akan memberikan sebanyak r kompenen utama untuk menggantikan data asli tanpa banyak kehilangan informasi Johnson et. al 1998.

2.10 Normalisasi Data

Untuk meningkatkan hasil identifikasi dilakukan normalisasi terhadap data penelitian. Salah satu teknik yang dapat digunakan untuk menormalisasi data adalah metode standar deviasi. Normalisasi menggunakan standar deviasi dilakukan untuk mengukur jarak, dengan mentransformasi data asli kedalam bentuk lain. Untuk vektor ciri v, dimana nilai rata – rata vektor adalah meanv dan standar deviasi vektor adalah sdv di hitung untuk semua sampel data, kemudian, untuk nilai ciri ke i ditransformasikan menggunakan persamaan Kantardzic 2003. v’i = vi – meanv sdv 25 Contoh: Jika nilai ciri v = {1, 2, 3}, maka meanv = 2, sdv = 1, maka nilai ciri hasil normalisasi adalah v = {-1, 0, 1}.

2.11 Kaidah Bayes

Kaidah Bayes dapat digunakan untuk melakukan klasifikasi terhadap sejumlah kategori. Pengambilan keputusan didasarkan pada hasil perhitungan jarak antar fungsi kepekatan peluang dari vektor ciri. Kaidah Bayes mengasumsikan bahwa kesalahan dalam pengambilan keputusan mempunyai nilai sama, nilai benar dalam pengambilan keputusan adalah 0 nol, dan kaidah pengambilan keputusan Bayes dapat dinyatakan dengan dx = θ i , anggaplah ada sejumlah i kelas θ 1 , θ 2 , θ 3 , .., θ i , dimana vektor x dinyatakan masuk dalam kelas θ i , jika P θ i . px | θ i ≥ Pθ j . px | θ j , ∀ i,j = 1, 2, 3, .. N 26 Dimana: P θ i adalah peluang, dimana vektor masukkan berada dalam kelas θ i . Terjadinya peluang terdahulu dapat di nyatakan dengan h i , untuk kelas θ i , dimana i = 1, 2, 3, …., N. px| θ i adalah fungsi kepekatan peluang kelas bersyarat dari x yang di berikan, di mana x masuk dalam kelas θ i . Fungsi kepekatan peluang kelas bersyarat terdahulu dari x untuk setiap kelas θ i , dapat juga di nyatakan dengan f i x. g i x = P θ i . px| θ i , g i x adalah fungsi pengambilan keputusan Bayes. g i x g k x untuk k ≠ i, adalah kaidah pengambilan keputusan Bayes. Dalam kaidah pengambilan keputusan Bayes, dx = θ i , hasil pengujian vektor x, akan masuk dalam kelas θ i jika h i .l i .f i x h k .l k .f k

x, untuk k

≠ i, dimana l i adalah nilai peluang kesalahan dalam pengambilan keputusan pada kelas θ i , dalam banyak kasus, nilai peluang kesalahan pengambilan keputusan l i dapat di anggap sama, sehingga dapat di abaikan, dan h i adalah nilai peluang dari kejadian fungsi peluang terdahulu f i-1 dari vektor – vektor pada kelas θ i , dan sering di asumsikan sama, sehingga dapat di abaikan. Pengambilan keputusan, dilakukan berdasarkan nilai tertinggi yang mendekati nilai fungsi kepekatan peluang f i x dari vektor x untuk dapat masuk dalam kelas tertentu θ i , argmax{ h n .l n .f n x}, dimana n = 1, …,K, Specht 1992, Zaknich 1995.

2.12 Jaringan Syaraf Tiruan Probabilistik