5. SIFAT-SIFAT STATISTIK PENDUGAAN MODEL KALIBRASI
MELALUI METODE TRANSFORMASI WAVELET DISKRET
Abstrak
Pemodelan kalibrasi dapat dipandang sebagai proses untuk memodelkan hubungan peubah bebas X, ukuran yang mudahmurah diperoleh,
dengan peubah tak bebas Y. Permasalahan dalam pemodelan kalibrasi adalah multikolinearitas antar peubah bebas, dan banyaknya pengamatan
n lebih kecil dari banyaknya peubah bebas p. Dari beberapa kajian empiris dan pustaka ternyata metode transformasi wavelet diskret
TWD sebagai pra-pemrosesan untuk mereduksi dimensi data X akan memberikan hasil pendugaan model kalibrasi yang lebih memuaskan.
Bab ini memfokuskan pada bagaimana sifat-sifat statistik dari dugaan model kalibrasi yang diperoleh dengan pra-pemrosesan metode
transformasi wavelet diskret. Penduga parameter pada model regresi terhadap koefisien wavelet ternyata merupakan penduga berbias, tetapi
besarnya bias ini dapat dikompensasi dengan ragam penduga yang makin kecil.
Kata kunci : model kalibrasi, wavelet
Abstract
The calibration modeling can be viewed as a process to find relationships between a set of measurements which are easy or cheap to
acquire and other measurements which are either expensive or labour intensive. The problems in calibration modeling is multicollinearity and
the number of observations less than the number of independent variables. Empirical and literature studies showed that discrete wavelet
transform DWT produced regression model with better goodness of fit than the other transform methods. This chapter focused on statistical
properties estimator of calibration models using DWT as a preprocessing method. The research showed that parameter estimator is
bias, but this bias can be compensated with smaller standard deviation. Key Words : calibration model, wavelet
Pendahuluan
Pemodelan kalibrasi dapat dipandang sebagai proses untuk memodelkan hubungan peubah bebas X, ukuran yang mudahmurah diperoleh, dengan peubah tak
bebas Y, ukuran yang mahal diperoleh. Permasalahan yang sering muncul dalam pemodelan kalibrasi adalah terjadi multikolinearitas antar peubah bebas, dan
banyaknya pengamatan n lebih kecil dari banyaknya peubah bebas p. Sehingga pendugaan model dengan metode regesi baku tidak bisa dilakukan.
Metode yang sering digunakan adalah Principal Component Regression PCR dan Partial Least Square PLS. Tetapi dari beberapa kajian empiris dan
pustaka ternyata metode-metode tersebut dapat diperbaiki hasilnya dengan metode transformasi wavelet diskret sebagai pemrosesan awal untuk mereduksi dimensi data
X Sunaryo dan Notodiputro 2004, 2005a; Shao dan Yadong 2004; Yi-yu dan Chen min-jun 2000. Perbaikan model dapat dievaluasi dari nilai ukuran-ukuran kebaikan
model seperti R
2
, R
2 adj
, S, PRESS dan RMSEP Root Mean Square of Prediction yang dihasilkan McNulty dan Ganapati 1998; Shao dan Yadong 2004;Yi-yu dan
Chen min-jun 2000. Bab ini memfokuskan pada bagaimana sifat-sifat statistik dari dugaan model
kalibrasi yang diperoleh dengan pemrosesan awal metode transformasi wavelet diskret. Sebagai pendukung hasil kajian teoristis akan dilakukan analisis terhadap
data simulasi yang mencerminkan kondisi data real yaitu antar peubah bebas saling berkorelasi dan n p. Bab ini merupakan penjelasan lebih mendalam dari artikel
Sunaryo dan Notodiputro 2005b, dan gagasan dasar untuk memperoleh bukti-bukti dari suatu sifat diperoleh dari Searle 1971, Myer 1990, Naes dan Mevik 2001.
Metode dan Bahan Penelitian
Metode yang digunakan pada penelitian ini berupa analisis teori tentang sifat- sifat statistik dari model regresi dengan pra-pemrosesan transformasi wavelet diskret.
Sifat-sifat statistik yang akan dianalisis adalah bias, ragam dan mean square error MSE dari penduga parameter model regresi dan prediksi, baik untuk rata-rata
pengamatan baru, maupun pengamatan tunggal.
Hasil analisis teori akan dijustifikasi pada data simulasi yang mencerminkan permasalahan pemodelan dengan kasus multikolinearitas antar peubah bebas dan
jumlah pengamatan lebih kecil dari jumlah peubah bebas.
Hasil dan Pembahasan Regresi Terhadap Koefisien
Wavelet dan Sifat-sifat Statistiknya
Misalkan matriks X berukuran nxp dan matriks X yang terkoreksi terhadap nilai rata-ratanya adalah :
= −
=
T n
T
T T
x X
. .
2 .
1
. .
. 1
X X
X
X
. 64
Dengan transformasi wavelet diskret W
j d
T T
j
.
.
=
X
akan diperoleh W
D =
X
, sehingga bentuk regresi e
b b
y +
+ =
X
1 dapat ditulis menjadi
regresi terhadap koefisien wavelet : e
q D
b e
b W
D b
y +
+ =
+ +
= 1
1 .
65 Karena D adalah hasil TWD dari matriks X yang terkoreksi terhadap nilai tengahnya,
maka rata-rata tiap kolom D juga sama dengan nol yang telah dibuktikan pada Bab 4, sehingga pemodelan regresi identik dengan regresi antara y dengan peubah
bebas yang terkoreksi terhadap nilai tengah. Dengan metode kuadrat terkecil dugaan parameter dari persamaan 65 adalah :
. ˆ
ˆ
1 1
b W
y W
y D
D D
q
T T
T T
= =
=
− −
X X
X
66 Karena bˆ merupakan pend uga tak bias dari b maka
q W
T
ˆ juga merupakan penduga tak bias dari b . Dengan penguraian nilai singular SVD matriks
T
A L
P D
= maka akan diperoleh :
1. y
p a
q
T j
p j
j j
∑
=
=
1
1 ˆ
τ 67
Bukti :
T
A L
P D
= ,
=
p
L τ
τ τ
. .
. .
. .
. .
. .
. .
. .
. .
. .
2 1
, untuk
p
τ τ
τ ≥
≥ ≥
. .
.
2 1
.
T T
T T
A L
A A
L P
P L
A D
D
2
= =
T T
A L
A D
D
2 1
− −
=
. 1
1 1
2 1
T j
p j
j j
T T
T T
T
p a
P L
A P
L A
A L
A D
D D
∑
= −
− −
= =
=
τ 2.
T j
p j
j j
T
a a
D D
q COV
∑
= −
= =
1 2
2 1
1 ˆ
τ σ
σ 68
Bukti : y
D D
D q
T T
1
ˆ
−
=
T
A L
P D
=
T T
A L
A D
D
2 1
− −
=
. 1
ˆ
1 2
2 2
2 1
T j
p j
j j
T T
a a
A L
A D
D q
COV
∑
= −
−
= =
=
τ σ
σ σ
Dimana akar ciri dan vektor ciri ke-j dari D
D
T
masing-masing adalah
j
τ dan
j
a .
Pada model regresi yang terkoreksi terhadap nilai tengah e
b y
+ +
=
X
1 β
. Misalkan y
adalah pengamatan yang berhubungan dengan
o
X
. Jika b
o y
T
ˆ ˆ
ˆ
X
+ = β
digunakan untuk memprediksi y
E =
µ , maka
ˆy adalah penduga tak bias bagi
y E
= µ
. Dengan ragam sebesar :
2 1
2
ˆ σ
σ o
o n
y Var
T T
X X
X X
−
+ =
69 Bukti lihat Searle 1971.
Sehingga
. ˆ
ˆ
2 1
2
σ σ
o o
n y
Var y
MSE
T T
X X
X X
−
+ =
=
70
Dengan penguraian nilai singular dari
X
, persamaan 70 bisa ditulis
∑
=
+ =
p j
j j
t n
y MSE
1 2
2 2
, ˆ
λ σ
σ 71
dimana
j j
v o
t
T
X
= disebut skor
o
X
pada
j
v .
Jika b
o y
T
ˆ ˆ
ˆ
X
+ = β
digunakan untuk memprediksi pengamatan tunggal y
, maka :
2 1
2
1 1
ˆ ˆ
ˆ
σ
+
+ =
− =
− =
−
f f
n y
y Var
y y
E y
MSE
T T
X X
X X
72
Bukti lihat Searle 1971. Untuk model regresi terhadap koefisien wavelet
e q
D b
y +
+ =
1 , dimana
telah diketahui mempunyai sifat bahwa jumlah elemen tiap kolom dari D sama dengan nol. Misalkan
y adalah pengamatan yang berhubungan dengan pengamatan
baru vektor koefisien wavelet d , maka analog terhadap penurunan menemukan ragam dan MSE dari
ˆy akan diperoleh MSE untuk pengamatan tunggal adalah :
, 2
2 ˆ
1 2
2 2
1 2
2
σ τ
σ σ
σ σ
σ
+ +
= +
+ =
∑
= −
j p
j j
T T
l n
d D
D d
n y
MSE 73
dimana d adalah vektor pengamatan baru dan
j T
j
a d
l =
menyatakan skor dari d sepanjang vektor ciri ke-j.
Jika
T
pxm W
nxp nxm
D
X
=
dan
T
W masing-masing merupakan m kolom dari
D
dan
T
W dengan m p, maka regresi terhadap m koefisien wavelet berbentuk
f q
D q
y +
+ =
1 dan
q diduga dengan :
y D
D D
q
T T
1
ˆ
−
= .
74 ˆq
W
T
merupakan penduga bias bagi b dengan bias sebesar :
, 1
1 ˆ
ˆ
1 1
y p
a W
y p
a W
q W
q W
bias
T i
m i
i i
T T
j p
j j
j T
T T
∑ ∑
= =
− =
− =
τ τ
75 dimana
i
a dan
i
τ adalah vektor ciri dan akar ciri ke-i dari
D D
T
. Dari persamaan 75 terlihat bahwa bias akan menuju nol, jika m mendekati p. Dapat
ditunjukkan pula bahwa
T i
m i
i i
T
a a
D D
q COV
1 2
2 1
1 ˆ
∑
= −
= =
τ σ
σ
, 76
. 2
ˆ 2
2 ˆ
2 ˆ
1 2
2 2
1 2
2
y bias
l n
y bias
d D
D d
n y
MSE
i m
i i
T T
+ +
+ =
+ +
+ =
∑
= −
σ τ
σ σ
σ σ
σ
77
Dari persamaan 76 berarti
2 2
2 2
2 1
2 1
... ˆ
σ τ
τ τ
+ +
+ =
m im
i i
i
a a
a q
Var .
78 Yang berarti dengan adanya akar ciri dari
D D
T
yang mendekati nol, maka makin tinggi ragam dari dugaan parameter regresi. Pada persamaan 73 dan 77
menunjukkan bahwa selisih ragam prediksi yang besar, yaitu
1 2
2 1
2 2
i m
i i
j p
j j
l l
τ σ
τ σ
∑ ∑
= =
−
akan diganti dengan MSE yang cenderung lebih kecil pada persamaan 77.
Jika dimensi matriks nxp
X
direduksi menjadi koefisien wavelet
nxm D
dengan m p, maka regresi terhadap koefisien wavelet akan menghasilkan dugaan parameter regresi yang berbias. Kebaikan model dugaan yang diperoleh akan
tergantung pada kemampuan reduksi yang menghasilkan akar ciri dari D
D
T
yang relatif besar, sehingga ragam koefisien regresi yang diperoleh akan kecil.
Ilustrasi Data Simulasi
Untuk menggambarkan data real dalam kalibrasi maka dilakukan simulasi untuk memperoleh data X
10x16
yang saling berkorelasi sangat tinggi. Kemudian dengan menentukan koefisien b
, b
1
, ..., b
16
dan membangkitkan 10 bilangan acak sebagai vektor residual
e , akan diperoleh data vektor e
b X
b y
+ +
= 1
. Koefisien regresi yang dipakai dalam data simulasi ini adalah :
b b
1
.... b
16
= -1.90 1.25 0.75 1.00 -1.25 0.75 0.75 -0.50 -0.50 0.25 0.75 -0.75 0.50 -1.00 0.25 1.00 0.50 .
Karena antar kolom X berkorelasi sangat tinggi dan n p, maka matriks X
X
T
adalah matriks singular, sehingga dugaan koefisien regresi dengan metode kuadrat terkecil biasa tidak bisa dilakukan. Dengan mengambil 3 level resolusi untuk
TWD dari matriks X yang terkoreksi terhadap nilai tengahnya
X
, maka akan
diperoleh nilai akar ciri yang sama dengan akar ciri dari
X X
T
. Akar ciri yang tidak nol adalah
1.15835 0.00179 0.00116 0.00048 0.00020 . Nilai akar ciri
D D
T
pada berbagai kombinasi dapat dilihat pada Tabel 4. Tabel 4 Akar ciri D
T
D pada beberapa kombinasi
Akar ciri D
T
D dengan elemen D
adalah c
0,0
dan d hanya
level 3 c
0,0
, d
3,0
,d
3,1
,d
3,2
,d
3,3
c
0,0
, d
3,3
c
0,0
, d
2,0
,d
2,1
,d
1,0
c
0,0
, dan d level 0,1
dan 2 d
2,0
-d
0,0
1.15819 1.15811 1.15805
1.15811 1.15818 0.0009045
0.00099 0.00049
0.0003 0.00043
0.00086 0.0006392 0.00068
0.00034 0.00026
0.00053 0.0001099 0.00037
0.00019 0.00005
0.00010 0.00010
0.00005
Karena mengandung akar ciri nol maka pendugaan model regresi yang tidak dapat diduga adalah Y terhadap :
• c
0,0
dan koefisien wavelet resolusi level 3 •
c
0,0
serta koefisien wavelet resolusi level 0, 1 dan 2 •
d
2,0
, d
2,1
, d
2,2
, d
2,3
, d
1,0
, d
1,1
dan d
0,0
. Terlihat dari Tabel 2 dengan adanya c
0,0
akar ciri pertama akan besar, sehingga untuk data ini c
0,0
bisa dipertimbangkan masuk model. Nilai beberapa ukuran kebaikan model untuk berbagai regresi yang dapat dilakukan dapat dilihat pada Tabel 5.
Tabel 5 Nilai beberapa ukuran kebaikan model Peubah Indepeden
dalam model R
2
R
2
adj s
PRESS c
0,0
, d
3,0
,d
3,1
,d
3,2
,d
3,3
95.0 88.8 0.137 0.889
c
0,0
, d
2,0
,d
2,1
,d
1,0
93.5 88.3 0.140 0.442
c
0,0
, d
3,3
94.4 82.8 0.110 0.192
Jika ada pengamatan baru, ringkasan hasil prediksi dengan berbagai model regresi yang dapat dilakukan dapat dilihat pada Tabel 6.
Tabel 6 Ringkasan hasil prediksi untuk suatu pengamatan baru
95 CI 95 PI
Peubah Indepeden
dalam model Fits
SE Fits batas
bawah batas atas
lebar 95 CI
batas bawah
batas atas lebar 95
PI c
0,0
, d
3,0
,d
3,1
,d
3,2
,d
3,3
0.19469 0.119694
0.527014 0.527014
-0.30953 0.69891
1.008436 c
0,0
, d
2,0
,d
2,1
,d
1,0
0.29440 0.080644
0.087103 0.501705
0.414602 -0.12012
0.70892 0.829038
c
0,0
, d
3,3
0.22753
0.059117
0.087738 0.367318
0.279580
-0.06767 0.52273
0.590404
Tabel 6 menunjukkan bahwa dengan penambahan akar ciri dari
D T
D
yang lebih kecil akan menyebabkan ragam prediksi yang makin besar, walaupun secara
teoritis bias prediksinya makin kecil. Dari berbagai alasan di atas maka regresi y terhadap c
0,0
dan d
3,3
menunjukkan kecenderungan lebih baik dibanding yang lain. Model dugaan regresi wavelet adalah
yˆ = 0.725 + 1.15 c
0,0
+ 11.1 d
3,3
. Jika dikembalikan ke peubah asli diperoleh model prediksi :
yˆ = -1.58972 + 0.28685 X
1
+ 0.28685 X
2
+ 0.28685 X
3
+ 0.28685 X
4
+ 0.28685 X
5
+ 0.28685 X
6
+ 8.12843 X
7
- 7.55474 X
8
+ 0.28685 X
9
+ 0.28685 X
10
+ 0.28685 X
11
+ 0.28685 X
12
+ 0.28685 X
13
+ 0.28685 X
14
+ 0.28685 X
15
+ 0.28685 X
16
. Plot y dengan yˆ duga dapat dilihat pada Gambar 10.
Y duga Y
1.4 1. 2
1. 0 0.8
0. 6 0.4
0.2 1. 6
1. 4 1. 2
1. 0 0. 8
0. 6 0. 4
0. 2
S 0.102855
R- Sq 94.4
R- Sq adj 93.7
Fit te d Line Plot
Y = - 0.0 0000 + 1. 000 Ydug a coo dan d33 da lam m odel
Gambar 10 Plot y dengan yˆ
Simpulan
1. Jika dimensi matriks X yang terkoreksi terhadap rata-rata
nxp
X
direduksi menjadi koefisien wavelet nxm
D untuk m p, maka diperoleh
dugaan parameter regresi yang berbias. 2. Keragaman koefisien regresi akan dipengaruhi oleh besar kecilnya akar ciri
dari D
D
T
yang diperoleh. 3. Penghapusan ragam-ragam yang besar dari prediksi nilai y pengamatan baru
akan diganti dengan MSE Mean Square Error yang cenderung lebih kecil dalam regresi terhadap koefisien wavelet
nxm D
.
Daftar Pustaka
McNulty C S, Ganapati M. 1998. Application of wavelet analysis for determining glucose concentration of aqueous solutions using NIR spectroscopy. Hewlett-
Packard company. Myers RH. 1990. Classical and Modern Regression with Applicatios. PWS-KENT
Pub. Co. Naes T, Mevik BH. 2001. Understanding The Collinearity Problem in Regression and
Discriminant Analysis. Journal of Chemometrics 15 : 413-426. Percival DB. 2005. Wavelets : Data Analysis, Algorithms and Theory. University
Washington. http:www.ms.washington.edu~s530 [18 april 2005]. Searle SR. 1971. Linear Models. John Willey Sons.
Shao X, Yadong Zhuang. 2004. Determining of Chlorogenic Acid in Plant Samples by Using Near-Infrared Spectrum with Wavelet Transform Preprocessing.
Analytical Sciences 20.
Sunaryo S, Notodiputro KA. 2004. Penerapan Metode Transformasi Wavelet Diskret untuk Menentukan Kandungan Senyawa Gingerol pada Tanaman Jahe. Statistika
- Forum Teori dan Aplikasi Statistika 4: 181-185, Jurusan Statistika FMIPA
UNISBA Sunaryo S, Notodiputro KA. 2005a. Penerapan Metode Transformasi Wavelet
Diskret untuk Menentukan Kandungan Senyawa Kurkumin pada Tanaman Temulawak. Prosiding Seminar Nasional Matematika, halaman 100-107, Jurusan
Matematika UNS, Surakarta, 7 Mei 2005. Sunaryo S, Notodiputro KA. 2005b. Sifat-sifat Statistik Pendugaan Model Kalibrasi
melalui Metode Transformasi Wavelet Diskret. Prosiding Seminar Nasional Matematika , halaman 159-168, Jurusan Matematika UNS, Surakarta, 7 Mei
2005. Vidacovic B, Meuller P. 1991. Wavelets for Kids. A Tutorial Introduction. AMS
Subject Classification , Duke University.
Yi-yu Cheng, Chen min-jun. 2000. A New Computing Multivariate Spectral Analysis Method Based on Wavelet Transform. Journal of Zhejiang University Science 1:
15-19.
6. PENERAPAN MODEL KALIBRASI DENGAN