3. EKSPLORASI BERBAGAI METODE PRA-PEMROSESAN DALAM MODEL KALIBRASI
Abstrak
Dalam pendugaan model kalibrasi, permasalahan yang sering muncul adalah kasus multikolinearitas dan jumlah pengamatan contoh jauh lebih
kecil dari jumlah peubah bebas. Salah satu cara untuk mengatasinya adalah dengan mereduksi dimensi peubah bebas, yang disebut pra-
pemrosesan data. Ada banyak metode pra-pemrosesan, diantaranya analisis komponen utama, transformasi Fourier dan transformasi
wavelet
. Pada Bab ini dilakukan eksplorasi dari ketiga metode tersebut. Analisis data simulasi menunjukkan bahwa metode transformasi wavelet
mempunyai potensi untuk diteliti lebih lanjut, karena dari beberapa ukuran kebaikan model yang diperoleh transformasi wavelet lebih
unggul dibanding yang lainnya. Kata kunci : model kalibrasi, wavelet, Fourier, pra-pemrosesan.
Abstract
The problems in prediction of calibration model are multicollinearity and the number of sample observations is less than the number of
independent variables. Reduction of dimension of independent variables preprocessing method is useful to solve these problems. There are
many preprocessing methods such as principal component analysis, Fourier transformation and wavelet transformation that commonly used
in calibration modeling. The exploration of these three methods based on simulated data showed that wavelet transformation produced better
goodness of fit when compared with other preprocessing methods. Therefore, it is instructive to investigate further aspects of the wavelet
transformation in calibration modeling. Key words : calibration model, wavelet, Fourier, preprocessing
Pendahuluan
Kita perhatikan model kalibrasi e
b X
b y
+ +
= 1
, dimana y adalah vektor berukuran nx1 dan
] ,
... ,
, [
2 1
p
x x
x X
= adalah matriks berukuran nxp. Jika
korelasi antara
i
x dan
j
x untuk
j i
≠ semua sama dengan 1 atau -1, maka
X X
T
menjadi matriks singular. Sehingga b
dan b tidak dapat diduga dengan metode kuadrat terkecil. Tetapi jika besarnya korelasi antara
i
x dan
j
x mendekati 1
atau -1 kasus multikolinearitas, maka X
X
T
mendekati singular, b
dan b masih dapat diduga tetapi tidak stabil atau keragamannya besar. Jika n p maka
permasalahan menjadi tambah kompleks, karena selain penduga b
dan b tidak stabil, juga derajat bebas sisaan bernilai negatif.
Salah satu cara untuk menangani kasus multikolinear dan n p adalah dengan mereduksi dimensi matriks X
nxp
menjadi peubah baru, misalkan D
nxm
sehingga m n-1 p. Hal inilah yang disebut metode pra-pemrosesan dalam model kalibrasi. Ada
beberapa metode pra-pemrosesan, diantaranya adalah analisis komponen utama PCA, transformasi Fourier dan transformasi wavelet Naes et al. 2002. Ketiga
metode ini mempunyai kemiripan dalam reduksi dimensi data, yaitu melakukan transformasi X menjadi peubah baru D dengan rumus
T
W X
D =
, dimana W adalah matriks transformasi yang ortogonal.
Pada bab ini dilakukan eksplorasi terhadap ketiga metode pra-pemrosesan tersebut dengan cara mengaplikasikannya terhadap data simulasi, agar diketahui
potensi ketiga metode pra-pemrosesan tersebut.
Metode dan Bahan Penelitian
Untuk mengevaluasi metode pra-pemrosesan dengan PCA, transformasi Fourier dan transformasi wavelet yang dalam penelitian ini diambil fungsi wavelet
yang paling sederhana yaitu Haar wavelet, maka akan dibangkitkan 3 data simulasi yang masing-masing menggambarkan kasus multikolinearitas dan n p.
Tahapan simulasi data tersebut dapat dijelaskan sebagai berikut : •
Pembangkitan ...,
, ,
2 1
p
x x
x x
= ∼
, Σ
µ N
, dengan korelasi antar peubah sangat tinggi mendekati 1 dan -1 yang dalam penelitian ini diambil 0.99
, dengan langkah-langkah :
1. Tentukan matriks Ó yang mencerminkan koragam dari p peubah yang saling berkorelasi.
2. Dari Ó temukan matriks G sedemikian hingga Ó = G
T
G .
3. Bangkitkan p peubah acak normal baku yang saling bebas, z
1
, z
2
, ... , z
p
, dan ambil z = z
1
, z
2
, ... , z
p T
. 4. Tetapkan
µ = Ex
1
, Ex
2
, … , Ex
p T
. 5. Hitung
µ +
= z
G x
T
6. Ulangi langkah 1 sampai 5, sebanyak n kali, sehingga akan diperoleh matriks X ukuran nxp yang saling berkorelasi.
• Membangkitkan
ε β +
= X
y , dengan langkah sebagai berikut :
a. Tetapkan vektor β
b. Hitung β
X y
= ˆ
c. Bangkitkan vektor ε
d. Hitung nilai pengamatan ε
+ =
y y
ˆ .
Untuk penelitian ini data simulasi pertama diambil n = 20 dan p = 64, data simulasi kedua n = 40 dan p = 128, serta data simulasi ketiga n = 20 dan p = 256.
Program simulasi dalam SAS dapat dilihat pada Lampiran 4, 5 dan 6. Untuk ketiga data simulasi X yang dihasilkan dikoreksi terhadap nilai tengah, kemudian
ditransformasi menjadi peubah baru, dari peubah baru ditentukan model regresi terbaik terhadap respon y dengan analisis regresi bertatar. Ukuran kebaikan model
dilihat dari R
2
, R
2 adjust
, S dan PRESS yang dihasilkan Myers 1990. Perhitungan
Tanda desimal dalam bilangan dinyatakan dengan titik
matriks koefisien wavelet dengan menggunakan software wavetresh 3 seperti yang dijelaskan oleh Nason 1994 dan 1998.
Hasil dan Pembahasan
Jika
X
adalah matriks X yang terkoreksi terhadap nilai tengahnya, maka matriks peubah baru hasil transformasi dengan PCA, transformasi Fourier dan
transformasi wavelet secara umum adalah :
T pxp
nxp nxp
W D
X
= 42
] ,
... ,
, [
. 2
. 1
p T
pxp
w w
w W
= .
Untuk PCA
. i
w adalah vektor berukuran px1 yang merupakan vektor ciri ke-i dari
matriks kovarian contoh
X
.
Untuk transformasi Fourier :
=
p p
p p
p p
p p
p p
p p
p p
p p
p p
p p
p p
p p
p p
p p
p p
T
W
]. 2
[ 2
sin .
. .
. 2
2 sin
. 1
2 sin
]. 2
[ 2
cos .
. .
. 2
2 cos
. 1
2 cos
1 .
. .
. .
. .
. .
. .
. .
. .
. .
. .
. .
. .
. .
. .
2 ].
2 [
2 sin
. .
. 2
. 2
2 sin
2 .
1 2
sin 2
]. 2
[ 2
cos .
. .
2 .
2 2
cos 2
. 1
2 cos
1 1
]. 2
[ 2
sin .
. .
1 .
2 2
sin 1
. 1
2 sin
1 ].
2 [
2 cos
. .
. 1
. 2
2 cos
1 .
1 2
cos 1
π π
π π
π π
π π
π π
π π
π π
π π
π π
43 W
adalah ortogonal karena fungsi sinus dan kosinus saling ortogonal. Hal ini dapat ditunjukkan dengan memanfaatkan identitas trigono metri sebagai berikut William
1994 :
≠
= =
∑
=
, ,
2 cos
1
j j
p p
j i
p j
π 44
] 2
[ ,
... ,
1 ,
, 2
sin
1
p j
p j
i
p j
= =
∑
=
π ,
dimana ]
2 [ p
adalah bilangan bulat terbesar kurang dari atau sama dengan 2
p .
≠ ≠
= =
= =
∑
=
m k
p p
m k
p p
p m
k p
p j
m p
j k
p j
, genap
2 atau
, 2
genap 2
atau ,
2 cos
2 cos
1
π π
≠ ≠
= =
= =
∑
=
m k
p p
m k
p p
p m
k p
j m
p j
k
p j
, genap
2 atau
, 2
genap 2
atau ,
2 sin
2 sin
1
π π
45
j k
p j
m p
j k
p j
dan semua
untuk ,
2 sin
2 sin
1
=
∑
=
π π
. Sedangkan untuk transformasi wavelet,
. i
w diperoleh dari nilai fungsi father
dan mother wavelet misal Haar wavelet pada interval [0,1. Reduksi dimensi diambil
nxm
D dimana m p. Matriks
T
W dalam transformasi wavelet adalah
ortogonal Percival 2005. Ukuran kebaikan model regresi y terhadap peubah baru
nxm
D untuk masing-
masing data simulasi dengan pra-pemrosesan transformasi Haar wavelet, transformasi Fourier dan PCA ringkasannya dapat dilihat pada Tabel 3. Hasil lengkap dapat dilihat
di Lampiran 1 sampai Lampiran 3. Tabel 3 Ringkasan hasil analisis model
nxm
D terhadap y
Metode Pra-pemrosesan
Haar Wavelet
Fourier PCA
R
2
97.9 74.0
89.0
R
2 adjust
96.7 69.1
85.1
S
0.1947 0.5974
0.4144
Simulasi 1 n = 20
p = 64 PRESS
1.1959 9.4450
5.2301
R
2
98.4 97.3
96.8
R
2 adjust
97.9 96.8
96.2
S
0.0477 0.0587
0.0640
Simulasi 2 n = 40
p = 128
PRESS
0.1280 0.1697
0.1922
Sedangkan plot antara y dengan yˆ dapat dilihat pada Gambar 7 sampai Gambar 9.
Y DUGA Y
5 4
3 2
1 5
4 3
2 1
Var iab le F I TSF our ier ao,b 1, b5
F I TSPCA1, 4, 5,9,12 F I TSHaar jad i
Scatt erplot of Y vs FI TSPCA1,4,5,9,1, FI TSHaarjadi, FI TSFour ier ao,b
Gambar 7 Plot y vs yˆ untuk data simulasi 1
Y DUGA Y
2.50 2.25
2.00 1.75
1.50 1.25
1.00 2.50
2.25 2.00
1.75 1.50
1.25 1.00
Var iable F IT SHaar wav elet
F IT S33PCA F IT SFO URI ER
Scatterplot of Y vs FI TS33PCA, FI TSFOURI ER, FI TSHaarwavelet
Gambar 8 Plot y vs yˆ untuk data simulasi 2
Y DUGA Y
4.0 3.5
3.0 2.5
2.0 1.5
1.0 0.5
4.0 3.5
3.0 2.5
2.0 1.5
1.0 0.5
Var iable FI TS19PCA
FI TSHaarw av elet FI TSFour ier
Scatter pl ot of Y vs FI TSHaar w av elet , FI TSFour i er , FI TS1 9 PCA
Gambar 9 Plot y vs yˆ untuk data simulasi 3
Tabel 3, Gambar 7 sampai dengan Gambar 9 menunjukkan bahwa dari berbagai ukuran kebaikan model, transformasi wavelet dengan mother wavelet yang
paling sederhana saja ternyata lebih unggul dibanding PCA dan transformasi Fourier. Selain itu dari segi korelasi yang dihasilkan ternyata transformasi wavelet mampu
memperkecil korelasi dari sekitar 1 dan -1 menjadi banyak yang dibawah 0.5, walaupun ada sebagian yang masih tinggi. Hasil hasil inilah yang akan dikaji lebih
lanjut dalam bab-bab berikutnya, karena adanya dugaan dengan mother wavelet yang paling sederhana saja ternyata lebih unggul dibanding metode pra-pemrosesan yang
lain. Selain itu hasil simulasi yang diperoleh dalam bab ini dapat memberi penguatan alasan mengapa metode transformasi wavelet sering digunakan sebagai metode pra-
pemrosesan dalam kalibrasi peubah ganda untuk mengatasi kasus n p, seperti yang dilakukan oleh McMulty dan Ganapati 1998, Shao dan Yadong 2004, Yi-yu dan
Chen min-jun 2000, Fearn 1999 dan Brown et al. 2001.
Simpulan
Dari eksplorasi data simulasi ternyata transformasi wavelet mempunyai potensi untuk diteliti lebih lanjut, karena walaupun hanya dengan mother wavelet yang paling
sederhana yaitu Haar wavelet telah memberikan hasil ukuran kebaikan model yang lebih baik dibanding PCA dan transformasi Fourier.
Daftar Pustaka
Brown PJ, Fearn T, Vanucci M. 2001. Bayesian Wavelet Regression on Curves with Application to a Spectroscopic Calibration Problem. J Amer Statist Assoc 96:
398-408. Fearn T. 1999. Data Compression : FT or Wavelet. Spectroscopy Europe, London
http:195.173.150.81td_col.html. McNulty SC, Ganapati M. 1998. Application of Wavelet Analysis Determining
Glucose Concentration of Aqueous Solution Using NIR Spectroscopy. Hewlett- Packard comp
. Myers RH. 1990. Classical and Modern Regression with Applicatios. PWS-KENT
Pub. Co. Naes T, Isaksoon T, Fearn T, Davies T. 2002. A User Friendly Guide to Multivariate
Calibration and Classification. NIR publications, UK. Nason GP, Silverman BW. 1994. The discrete wavelet transform in S. J.comp graph.
Stat. 3: 163-191.
Nason GP. 1998. Wavethresh 3 software. Department of Mathematics, University of Bristol, UK. http:www.stats.bris.ac.uk~wavethresh [ 20 juni 2003]
Percival DB. 2005. Wavelets : Data Analysis, Algorithms and Theory. University Washington. http:www.ms.washington.edu~s530 [18 april 2005].
Shao X, Yadong Zhuang. 2004. Determining of Chlorogenic Acid in Plant Samples by Using Near-Infrared Spectrum with Wavelet Transform Preprocessing.
Analytical Sciences 20.
William WWS. 1994. Time Series Analysis. Addison-Wesley Pub. Comp. Yi-yu Cheng, Chen min-jun. 2000. A New Computing Multivariate Spectral Analysis
Method Based on Wavelet Transform. Journal of Zhejiang University Science 1: 15-19.
4. REDUKSI DIMENSI DENGAN TRANSFORMASI WAVELET