2 Pada estimasi fungsi dengan metode wavelet thresholding, tingkat kemulusan
estimator ditentukan oleh pemilihan fungsi wavelet, level resolusi, fungsi thresholding, dan parameter threshold. Namun yang paling dominan menentukan tingkat kemulusan
estimator adalah parameter threshold. Nilai threshold yang kecil memberikan estimasi fungsi yang sangat tidak mulus under smooth, sedangkan nilai threshold yang besar
memberikan estimasi yang sangat mulus over smooth. Oleh karena itu perlu dipilih nilai threshold yang optimal.
Makalah ini membahas penentuan nilai threshold optimal pada estimator wavelet thresholding untuk fungsi regresi non parametrik dengan prosedur FDR.
2. Bahan dan Metode
Penelitian ini merupakan kajian literatur yang kemudian dikembangkan dengan simulasi menggunakan software S-Plus For Windows. Dalam tulisan ini dilakukan
pembahasan tentang estimator fungsi regresi non parametrik dengan wavelet thresholding dan cara mendapatkan parameter threshold optimal dengan prosedur False Discovery Rate
FDR serta contoh aplikasinya.
3. Hasil dan Pembahasan Estimator Deret Orthogonal
Diasumsikan bahwa f ∈L
2
R dengan L
2
R =
{ }
∫
∞ ∞
−
∞ dx
x f
f
2
:
. Didefinisikan sebuah hasil kali dalam pada ruang L
2
R adalah fungsi yang mengasosiasikan bilangan riil g
, f
, dengan masing-masing pasangan fungsi fx dan gx pada L
2
R. Hasil kali dalam L
2
R dari dua fungsi dan norma sebuah fungsi didefinisikan
dx x
g x
f g
, f
∫
∞ ∞
−
=
dan
∫
∞ ∞
−
= =
dx x
f f
f f
2
, . Menurut Vetterli dan Kovacevic
[9]
, L
2
R merupakan ruang Hilbert.
Jika
{ }
,... 2
, 1
j j
=
ϕ sistem ortonormal lengkap CONS dari L
2
R, maka sembarang f
∈L
2
R dapat dinyatakan sebagai
∑
∞ =
=
1 j
j j
f ϕ
α dengan
j j
f ϕ
α ,
= dan memenuhi
identitas Parseval
∑
∞ =
=
1 2
2 j
j
f α . Karena
∫
∞ ∞
−
∞ dx
x f
2
maka
∑
=
∞
n j
j 1
2
α sehingga
j
→ α
, untuk ∞
→ j
. Oleh karena itu, f dapat didekati oleh
∑
=
=
J j
j j
f
1
ϕ α
untuk bilangan bulat J cukup besar. Khususnya jika f
∈ L
2
[0,2 π], maka f dapat didekati dengan deret
Fourier,
∑
=
+ +
=
J j
j j
J
jx b
jx a
a x
f
1
sin cos
2 1
2 dengan koefisien Fourier
∫
= =
π
π π
2 j
dx jx
cos x
f 1
. j
cos ,
f 1
a dengan j = 0,1,…,J dan
dx jx
sin x
f 1
. j
sin ,
f 1
b
2 j
∫
= =
π
π π
dengan j=1,2,…,J. Jika
{ }
n 1
i i
i
Y ,
X
=
merupakan data observasi independen mempunyai model 1 dengan
n i
X
i
π 2
= dan
[ ]
π ∈ 2
, X
i
, maka estimator deret Fourier dari regresi f adalah
3
∑
=
+ +
=
J 1
j j
j J
jx sin
bˆ jx
cos aˆ
aˆ 2
1 x
fˆ 3
dengan .
cos ,
1 ˆ
~
j X
f a
i j
π =
,j = 0,1,…,J dan .
sin ,
1 ˆ
~
j X
f b
i j
π =
, j=1,2,3,…,J. Dalam hal ini
j j
bˆ dan
aˆ merupakan estimator tak bias dari a
j
dan b
j
.
Fungsi Wavelet Fungsi wavelet adalah suatu fungsi matematika yang mempunyai sifat- sifat tertentu
diantaranya berosilasi di sekitar nol seperti fungsi sinus dan cosinus dan terlokalisasi dalam domain waktu artinya pada saat nilai domain relatif besar, fungsi wavelet berharga
nol. Fungsi wavelet dibedakan atas dua jenis, yaitu wavelet ayah
φ dan wavelet ibu ψ yang mempunyai sifat
∫
∞ ∞
−
= φ
1 dx
x dan
∫
∞ ∞
−
= ψ
dx x
. Dengan dilatasi diadik dan translasi integer, wavelet ayah dan wavelet ibu melahirkan keluarga wavelet
yaitu k
x 2
p 2
p x
j j
k ,
j
2 1
− φ
= φ
dan k
x 2
p 2
p x
j j
k ,
j
2 1
− ψ
= ψ
untuk suatu skalar p0, dan tanpa mengurangi keumuman dapat diambil p=1, sehingga
k x
2 2
x
j 2
j k
, j
− φ
= φ
dan k
x 2
2 x
j 2
j k
, j
− ψ
= ψ
. Fungsi x
k ,
j
φ dan
x
k ,
j
ψ mempunyai sifat
∫
∞ ∞
−
δ =
φ φ
k ,
k k
, j
k ,
j
dx x
x ,
∫
∞ ∞
−
= φ
ψ dx
x x
k ,
j k
, j
, dan
∫
∞ ∞
−
δ δ
= ψ
ψ
k ,
k j
, j
k ,
j k
, j
dx x
x dengan
⎩ ⎨
⎧ ≠
= =
. 1
,
j i
jika j
i jika
j i
δ Contoh wavelet paling sederhana adalah wavelet Haar yang mempunyai rumus
⎪ ⎩
⎪ ⎨
⎧ ≤
− ≤
= ψ
lain yang
x ,
1 x
2 1
, 1
2 1
x ,
1 x
dan ⎩
⎨ ⎧
≤ =
lain. yang
, 1
, 1
x x
x φ
4 Beberapa contoh wavelet selain wavelet haar diantaranya adalah wavelet Daubechies
Daublet, symmetris Symmlet, dan Coifman Coiflet
[2]
. Visualisasi beberapa wavelet dapat ditunjukkan pada gambar 1 berikut:
Gambar 1. Visualisasi beberapa Wavelet Analisis Multiresolusi
Analisis multiresolusi L
2
R adalah ruang bagian tertutup {V
j
,j ∈Z} yang memenuhi :
i …⊂V
-2
⊂V
-1
⊂V ⊂V
1
⊂V
2
⊂ …
4 ii
Z j
∈
∩ V
j
= {0},
Z j
∈
∪ V
j
= L
2
R iii
f∈V
j
1
. 2
+
∈ ⇔
j
V f
iv Z
k V
k f
V f
∈ ∀
∈ −
⇒ ∈
, .
v Terdapat sebuah fungsi
V ∈
φ sehingga
Z k
, k
.
k ,
∈ −
φ =
φ membentuk basis
ortonormal untuk V dimana untuk semua j,k
∈ Z, k
x 2
2 x
j 2
j k
, j
− φ
= φ
. Jika {V
j
, j ∈ Z} analisis multiresolusi dari L
2
R, maka ada basis ortonormal
{ }
Z k
, j
;
k ,
j
∈ ψ
untuk L
2
R: ,
2 2
2 ,
k x
j j
k j
− =
ψ ψ
sehingga untuk sembarang f ∈ L
2
R,
∑
∈ −
− −
+ =
Z k
k j
k j
j j
f f
P f
P .
,
, 1
, 1
1
ψ ψ
, yaitu x
ψ yang diturunkan dari
∑
∈ +
−
− =
Z k
k k
k
x c
x 1
, 1
1
φ ψ
.
Akibat. Bila
φ adalah fungsi skala yang membangun analisis multiresolusi dan
∑
∈ +
−
− =
Z k
,k k
k
x c
ψx
1 1
1 φ
maka dekomposisi ke dalam wavelet ortonormal untuk sembarang f
∈L
2
R dapat dilakukan menjadi
ψ d
jo j
Z k
k j,
k j,
, ,
x x
c x
f
Z k
k jo
k jo
∑ ∑∑
∈ ≥
∈
+ =
φ
5 dengan
=
k jo
k jo
f c
, ,
, φ
dan =
k j
k j
f d
, ,
, ψ
. Estimator Wavelet Linier
Jika terdapat sekumpulan data berpasangan independen
{ }
n i 1
Yi Xi,
=
yang mempunyai model 1 dan n = 2
m
dengan m bilangan bulat positip. Jika X
i
rancangan titik reguler pada interval [0,1] dengan X
i
= in, maka proyeksi f pada ruang V
J
dapat ditulis menjadi P
J
fx=
∑
∈Z k
k J
k J
x c
, ,
φ atau
∑
∈
=
Z k
k J
k J
J
x c
x f
, ,
φ dengan
∫
= =
1 k
, J
k ,
J k
, J
dx x
x f
, f
c φ
φ . Berdasarkan dekomposisi fungsi ke dalam wavelet
ortonormal 5 untuk sembarang fungsi
2
R L
f ∈
diperoleh x
ψ d
x c
x f
Z k
1 J
jo j
Z k
k j,
k j,
k ,
jo k
, jo
J
∑ ∑∑
∈ −
≥ ∈
+ =
φ dengan
=
k jo
k jo
f c
, ,
, φ
=
∫
1 k
, jo
dx x
x f
φ dan
=
k j
k j
f d
, ,
, ψ
=
∫
1 k
, j
dx x
x f
ψ . Karena fungsi regresi f tidak diketahui maka estimator
f pada ruang V
J
dapat ditulis sebagai
∑
∈
=
Z k
k J
k J
J
x c
x f
ˆ ˆ
, ,
φ dengan
=
k J
c
,
ˆ
∑
= n
i i
k J
i
X Y
n
1 ,
1 φ
, atau
x ψ
dˆ x
cˆ x
fˆ
Z k
1 J
jo j
Z k
k j,
k j,
k ,
jo k
, jo
J
∑ ∑∑
∈ −
≥ ∈
+ =
φ 6
dengan
∑
=
φ =
n 1
i i
k ,
jo i
k ,
jo
X Y
n 1
cˆ dan
∑
=
ψ =
n 1
i i
k ,
j i
k ,
j
X Y
n 1
dˆ , yang merupakan estimator
tak bias dari
k j,
k jo,
d dan
c . Estimator wavelet 6 dinamakan estimator wavelet linier.
5 Estimator Wavelet Shrinkage
Jika diberikan data
{ }
1 ,
= i
n Y
X
i i
dengan model 1,
m
n 2
= dan
n i
X
i
= , maka
i
Y ~
2
, σ
n i
g N
. Mean dan varian dari
k j
d
,
ˆ adalah
[ ]
k j
k j
d d
E
, ,
ˆ =
dan
n σ
dˆ Var
2 k
j,
=
sehingga
k j
d
,
ˆ ~ Nd
j,k
, n
σ
2
. Jadi koefisien wavelet empiris
k j
d
,
ˆ memuat sejumlah noise dan hanya
relatif sedikit yang memuat sinyal signifikan sehingga dapat direkonstruksi estimator wavelet dengan menggunakan sejumlah koefisien terbesar. Oleh karena itu HallPatil
[4]
dan Ogden
[7]
memberikan metode yang menekankan rekonstruksi wavelet dengan menggunakan sejumlah koefisien wavelet terbesar, yakni hanya koefisien yang lebih besar
dari suatu nilai tertentu yang diambil, sedangkan koefisien selebihnya diabaikan, karena dianggap 0. Nilai tertentu tersebut dinamakan nilai threshold nilai ambang dan
estimatornya menghasilkan
∑ ∑∑
− ≥
− =
∂ +
=
k 1
J jo
j 1
2 o
k k
, j
k ,j
k ,
jo k
, jo
j
x dˆ
x cˆ
x fˆ
ψ φ
λ λ
7 dengan
λ
∂ menyatakan fungsi thresholding atau fungsi ambang dengan nilai ambang atau threshold
λ . Estimator 7 dinamakan estimator wavelet non linier, estimator wavelet shrinkage, atau estimator wavelet thresholding.
Prinsip dari estimator wavelet thresholding adalah mempertahankan koefisien wavelet yang nilainya lebih besar dari suatu nilai ambang atau nilai threshold tertentu dan
mengabaikan koefisien wavelet yang kecil. Selanjutnya koefisien yang besar ini digunakan untuk merekonstruksi fungsi estimator yang dicari. Karena thresholding ini dirancang
untuk membedakan antara koefisien wavelet empiris yang masuk dan yang keluar dari rekonstruksi wavelet, sedangkan untuk membuat keputusan ada 2 faktor yang
mempengaruhi ketepatan estimator, yaitu ukuran sampel n dan tingkat noise
2
σ , maka setiap koefisien merupakan calon kuat masuk didalam rekonstruksi wavelet jika ukuran
sampel besar atau tingkat noise kecil. Karena σ
k j
d n
,
ˆ berdistribusi normal dengan
varian 1 untuk seluruh n dan σ, maka estimator thresholding dari
k j
d
,
adalah
⎟ ⎟
⎠ ⎞
⎜ ⎜
⎝ ⎛
∂ =
σ σ
λ k
j k
j
d n
n d
, ,
ˆ ~
sehingga estimator wavelet thresholding adalah
∑ ∑ ∑
− ≥
− =
⎟ ⎟
⎠ ⎞
⎜ ⎜
⎝ ⎛
∂ +
=
k 1
J jo
j 1
2 k
k ,
j k
, j
k ,
jo k
, jo
j
x dˆ
n n
x cˆ
x fˆ
ψ σ
σ φ
λ λ
8 dengan
k jo
c
,
ˆ : penduga koefisien fungsi skala,
k ,
j
dˆ : penduga koefisien wavelet
k ,
j
d λ : parameter nilai threshold
λ
∂ : fungsi threshold Langkah-langkah Thresholding
Langkah-langkah thresholding terdiri dari : 1.
Pemilihan Fungsi Thresholding
6 Ada dua jenis fungsi thresholding
λ
∂ , yaitu Hard Thresholding,
⎩ ⎨
⎧ =
∂ lain
yang x
0, λ
x x,
x
H λ
dan Soft Thresholding,
λ x
λ x
λ x
λ, x
0, λ,
x x
S λ
− ≤
⎪ ⎩
⎪ ⎨
⎧ +
− =
∂
dengan λ
merupakan parameter thresholding. Fungsi Hard thresholding lebih dikenal karena terdapat diskontinyu dalam fungsi
thresholding sehingga nilai x yang berada diatas threshold λ tidak disentuh. Sebaliknya,
fungsi soft thresholding kontinyu yaitu sejak nilai x berada diatas threshold λ . Motivasi
penggunaan soft thresholding berasal dari prinsip bahwa noise mempengaruhi seluruh koefisien wavelet. Juga kekontinyuan dari fungsi soft shrinkage membuat kondisi yang
lebih baik untuk alasan statistik.
2. Estimasi