Gambar 6 mel filter-bank dengan triangular bandpass
2.8 Peubah Acak Kontinyu.
1
Dalam kehidupan nyata, banyak dijumpai permasalahan dimana nilai-nilai pengamatan tidak dapat dihitung. Sebagai contoh, waktu tunggu suatu job hingga
diproses sampai selesai, waktu hidup komponen perangkat keras komputer CPU, RAM, Harddisk, dsb. Peubah – peubah acak dengan nilai seperti di atas disebut
sebagai peubah acak kontinyu. Nilai peubah acak kontinyu adalah dalam domain real.
Pernyataan bahwa: fungsi distribusi kumulatif, untuk suatu peubah acak y adalah sama dengan peluang
y y
P y
F ≤
= , dari pernyataan tersebut, maka
untuk peubah acak diskret dan kontinyu dapat di tuliskan menjadi: a Peubah acak diskret
:
∑
≤ ∀
= =
y y
y y
P y
F 11
b Peubah acak kontinyu :
12
∫
∞ −
=
y
dy y
f y
F
Karena bentuk distribusi fungsi untuk peubah acak diskret dan kontinyu berbeda, untuk peubah acak diskret bentuknya seperti tangga, sedang untuk
peubah acak kontinyu bentuknya berupa kurva mulus, dalam hal ini disebut
sebagai fungsi kepekatan peluang probability density function --PDF--. Beberapa pustaka menuliskan sebagai
y f
y f
y
, yang artinya fungsi kepekatan peluang peubah acak y. Perbedaan mendasar antara kedua jenis peubah tersebut
adalah bahwa nilai peluang peubah acak diskret untuk suatu titik tertentu, dapat
1
Ir. Agus Buono, M.Si, M.Kom.,
Diktat matakuliah Matematika dan Statistik Komputasi
saja tidak nol, sedangkan untuk peubah acak kontinyu, peluang untuk munculnya suatu titik, pasti nol. Hal ini karena nilai peluang diartikan sebagai luas daerah di
bawah kurva fungsi kepekatan peluang. Pernyataan bahwa: jika
y F
adalah fungsi distribusi kumulatif peubah acak y, maka fungsi kepekatan peluang dari peubah acak y tersebut adalah
y f
y
yang dirumuskan sebagai:
dy y
dF y
f
y
=
13
Sifat dari fungsi kepekatan peluang adalah:
a. ,
≥ y
f
y
∞ ≤
≤ ∞
− y
14 b.
15
∫
∞ ∞
−
= ∞
= 1
F dy
y f
y
Pernyataan bahwa: jika y adalah peubah acak kontinyu dengan fungsi kepekatan peluang
, maka nilai harapan dan ragam dari y dinyatakan sebagai:
y f
y
16
∫
∞ ∞
−
= dy
y f
y y
E
y y
17
∫
∞ ∞
−
− =
− =
dy y
f y
E y
y E
y E
y Var
y 2
2
Fungsi kepekatan untuk peubah acak Uniform menjelaskan nilai kejadian untuk cakupan terbatas, dinyatakan dengan
⎪⎩ ⎪
⎨ ⎧
≤ ≤
− =
lainnya y
nilai untuk
b y
a a
b y
f
x
, 1
18 Fungsi kepekatan untuk peubah acak eksponensial, menjelaskan nilai
kejadian untuk cakupan semi terbatas, dinyatakan dengan rumusan,
⎪⎩ ⎪
⎨ ⎧
≤ ≤
≤ ⋅
=
− −
a y
b y
a e
b y
f
b a
y x
, 1
19 Fungsi kepekatan peluang untuk peubah acak normal y, mempunyai
persamaan sebagai berikut
∞ ≤
≤ ∞
− ⎟⎟
⎠ ⎞
⎜⎜ ⎝
⎛ −
− =
y y
y f
, 2
exp .
2 1
2 2
σ μ
π σ
20
persamaan ini dapat digunakan untuk menjelaskan banyak bentuk, seperti noise atau gangguan sinyal.
2.9 Analisis Komponen Utama PCA
2
Metode statistik yang paling popler untuk mereduksi dimensi data adalah metode Karhunen-Loeve, disebut juga Principal Component Analysis PCA.
PCA merupakan salah satu teknik analisis peubah ganda yang sering digunakan untuk mereduksi dimensi data tanpa harus kehilangan nilai informasi berarti.
Peubah, hasil transformasi pca merupakan kombinasi linier dari peubah asli, tidak berkorelasi antar sesama, tersusun berdasarkan informasi yang dikandungnya.
Andaikan peubah asli adalah suatu vektor X, berdimensi p: X = x
1
, x
2
, …, x
p T
,
maka peubah hasil transformasi adalah vektor Y, berdimensi q: Y = y
1
, y
2
, …, y
q
, dengan q p. Dalam hal ini y
i
dirumuskan sebagai: y
1
= a
11
.x
1
+ a
12
.x
2
+ …….. + a
1p
.x
p
= a
1 T
x y
2
= a
21
.x
1
+ a
22
.x
2
+ …….. + a
2p
.x
p
= a
2 T
x ………………….
y
q
= a
q1
.x
1
+ a
q2
.x
2
+ …….. + a
qp
.x
p
= a
q T
x
Jika matriks koragam covariance matrix dari vektor X adalah Σ, maka
ragam variance y
i
dirumuskan sebagai: ragamy
i
= a
=
2
i
y
σ
i T
. Σ.a
i
, 21
Dari penjabaran diatas diketahui bahwa permasalahan transformasi, adalah bagaimana memilih koefisien dari kombinasi linier tersebut, sehingga:
Informasi y
1
informasi y
2
……. informasi y
q
dengan kata lain ragamy
1
ragamy
2
……….. ragamy
q
Dari sudut pandang geometrik, unsur – unsur dalam vektor a
i
merupakan
komponen penyusun sumbu koordinat. Oleh karenanya dapat dipilih vektor a
i
yang mempunyai panjang satu dan saling ortogonal. Dengan demikian ini menjadi
2
Ir. Agus Buono, M.Si, M.Kom.,
Diktat matakuliah Matematika dan Statistik Komputasi
masalah optimasi dengan fungsi tujuan memaksimumkan ragamy
i
, dengan
kendala a
i T
a
i
= 1, dan cova
i
,a
j
= 0, untuk i
≠ j.
Penentuan a
1
Masalah optimasi Maksimumkan : ragamy
1
= a
1 T
Σ a
1
Kendala : a
1 T
a
1
= 1 Melalui pengganda Lagrange, fungsi yang dimaksimumkan adalah:
fa
1
= a
1 T
Σ a
1
– λ a
1 T
a
1
– 1 22
Optimasi dilakukan dengan cara menurunkan fungsi f, terhadap peubah – peubah yang dicari, dan diperoleh
a a
a 2
a 2
a f
1 1
1 1
1
= −
Σ ⇔
= −
Σ =
∂ ∂
λ λ
Ini berarti a
1
merupakan vektor eigen dari matriks
Σ dengan nilai eigen λ.
Berdasarkan hasil di atas, maka λ
λ λ
λ λ
λ =
= =
= Σ
⇔ =
Σ ⇔
= −
Σ
Τ Τ
Τ
1 a
a a
a a
a a
a a
a
1 1
1 1
1 1
1 1
1 1
Ini berarti ragamy
1
, adalah
λ yang merupakan nilai eigen matriks Σ. Karena di inginkan peubah hasil transformasi tersusun berdasarkan ‘pentingnya’,
maka vektor a
1
adalah vektor eigen yang bersesuaian dengan nilai eigen terbesar pertama.
Penentuan a
2
Masalah optimasi Maksimumkan : ragamy
2
= a
2 T
Σ a
2
Kendala :
a
2 T
a
2
= 1 dan a
1 T
a
2
= 0 Melalui pengganda larange, fungsi yang dimaksimumkan adalah
fa
2
= a
2 T
Σ a
2
–
λ
2
a
2 T
a
2
– 1.
δa
1 T
a
2
23 Setelah dideferensialkan, diperoleh:
a a
2 a
2 a
f
1 2
2 2
2
= −
− Σ
= ∂
∂
δ λ
Dengan mengalikan a
2 T
pada ruas kiri dan kanan diperoleh
2 2
2 1
2 2
2 2
2 2
a a
a a
a a
2 a
a 2
λ δ
λ =
Σ ⇔
= −
− Σ
Τ Τ
Τ Τ
Oleh karena itu
Σ.a
2
=
λ
2
a
2
yang berarti bahwa vektor a
2
merupakan vektor eigen dari
Σ yang bersesuaian dengan nilai eigen terbesar ke dua, λ
2
.
Penentuan a
i
Memperhatikan cara diatas, maka vektor a
i
merupakan vektor eigen dari matriks
Σ yang bersesuaian dengan nilai eigen terbesar ke i, yaitu λ
i
, atau dengan kata lain berlaku:
ΣΑ Α
= Λ
Τ
dengan matriks
{ }
i
diag λ
= Λ
dan A = [a
1,
a
2
, ….., a
p
]
T
Berapa banyak nilai komponen utama diperlukan sebagai data penelitian, atau seberapa efektif dimensi data dapat dijadikan data penelitian. Pertanyaan
tersebut dapat dijawab dengan menerapkan perhitungan proporsi nilai eigen, yaitu
membagi jumlah r nilai eigen dengan jumlah seluruh nilai eigen, kita akan
mendapatkan hasil pengukuran untuk kualitas dari representasi yang didasarkan
pada r komponen utama. Hasil penghitungan di ekspresikan sebagai persentasi.
Untuk jelasnya, kriteria nilai ciri yang representatif, didasarkan pada rasio
dari jumlah r nilai eigen terbesar, untuk mencuplik nilai komponen utama dari
dalam matriks. Jika nilai eigen diberi label
λ
1
≥ λ
2
≥ …≥ λ
q
, maka penghitungan
rasio dapat dituliskan sebagai berikut Kantardzic 2003:
∑ ∑
= =
=
q i
i r
i i
Rasio
1 1
λ λ
. 24 Menurut Johnson dan Wichern, persentasi rasio 80, dan 90 dari total
nilai eigen, akan memberikan sebanyak r kompenen utama untuk menggantikan
data asli tanpa banyak kehilangan informasi Johnson et. al 1998.
2.10 Normalisasi Data