EKSPLORASI BERBAGAI METODE PRA-PEMROSESAN DALAM MODEL KALIBRASI

3. EKSPLORASI BERBAGAI METODE PRA-PEMROSESAN DALAM MODEL KALIBRASI

Abstrak Dalam pendugaan model kalibrasi, permasalahan yang sering muncul adalah kasus multikolinearitas dan jumlah pengamatan contoh jauh lebih kecil dari jumlah peubah bebas. Salah satu cara untuk mengatasinya adalah dengan mereduksi dimensi peubah bebas, yang disebut pra- pemrosesan data. Ada banyak metode pra-pemrosesan, diantaranya analisis komponen utama, transformasi Fourier dan transformasi wavelet . Pada Bab ini dilakukan eksplorasi dari ketiga metode tersebut. Analisis data simulasi menunjukkan bahwa metode transformasi wavelet mempunyai potensi untuk diteliti lebih lanjut, karena dari beberapa ukuran kebaikan model yang diperoleh transformasi wavelet lebih unggul dibanding yang lainnya. Kata kunci : model kalibrasi, wavelet, Fourier, pra-pemrosesan. Abstract The problems in prediction of calibration model are multicollinearity and the number of sample observations is less than the number of independent variables. Reduction of dimension of independent variables preprocessing method is useful to solve these problems. There are many preprocessing methods such as principal component analysis, Fourier transformation and wavelet transformation that commonly used in calibration modeling. The exploration of these three methods based on simulated data showed that wavelet transformation produced better goodness of fit when compared with other preprocessing methods. Therefore, it is instructive to investigate further aspects of the wavelet transformation in calibration modeling. Key words : calibration model, wavelet, Fourier, preprocessing Pendahuluan Kita perhatikan model kalibrasi e b X b y + + = 1 , dimana y adalah vektor berukuran nx1 dan ] , ... , , [ 2 1 p x x x X = adalah matriks berukuran nxp. Jika korelasi antara i x dan j x untuk j i ≠ semua sama dengan 1 atau -1, maka X X T menjadi matriks singular. Sehingga b dan b tidak dapat diduga dengan metode kuadrat terkecil. Tetapi jika besarnya korelasi antara i x dan j x mendekati 1 atau -1 kasus multikolinearitas, maka X X T mendekati singular, b dan b masih dapat diduga tetapi tidak stabil atau keragamannya besar. Jika n p maka permasalahan menjadi tambah kompleks, karena selain penduga b dan b tidak stabil, juga derajat bebas sisaan bernilai negatif. Salah satu cara untuk menangani kasus multikolinear dan n p adalah dengan mereduksi dimensi matriks X nxp menjadi peubah baru, misalkan D nxm sehingga m n-1 p. Hal inilah yang disebut metode pra-pemrosesan dalam model kalibrasi. Ada beberapa metode pra-pemrosesan, diantaranya adalah analisis komponen utama PCA, transformasi Fourier dan transformasi wavelet Naes et al. 2002. Ketiga metode ini mempunyai kemiripan dalam reduksi dimensi data, yaitu melakukan transformasi X menjadi peubah baru D dengan rumus T W X D = , dimana W adalah matriks transformasi yang ortogonal. Pada bab ini dilakukan eksplorasi terhadap ketiga metode pra-pemrosesan tersebut dengan cara mengaplikasikannya terhadap data simulasi, agar diketahui potensi ketiga metode pra-pemrosesan tersebut. Metode dan Bahan Penelitian Untuk mengevaluasi metode pra-pemrosesan dengan PCA, transformasi Fourier dan transformasi wavelet yang dalam penelitian ini diambil fungsi wavelet yang paling sederhana yaitu Haar wavelet, maka akan dibangkitkan 3 data simulasi yang masing-masing menggambarkan kasus multikolinearitas dan n p. Tahapan simulasi data tersebut dapat dijelaskan sebagai berikut : • Pembangkitan ..., , , 2 1 p x x x x = ∼ , Σ µ N , dengan korelasi antar peubah sangat tinggi mendekati 1 dan -1 yang dalam penelitian ini diambil 0.99 , dengan langkah-langkah : 1. Tentukan matriks Ó yang mencerminkan koragam dari p peubah yang saling berkorelasi. 2. Dari Ó temukan matriks G sedemikian hingga Ó = G T G . 3. Bangkitkan p peubah acak normal baku yang saling bebas, z 1 , z 2 , ... , z p , dan ambil z = z 1 , z 2 , ... , z p T . 4. Tetapkan µ = Ex 1 , Ex 2 , … , Ex p T . 5. Hitung µ + = z G x T 6. Ulangi langkah 1 sampai 5, sebanyak n kali, sehingga akan diperoleh matriks X ukuran nxp yang saling berkorelasi. • Membangkitkan ε β + = X y , dengan langkah sebagai berikut : a. Tetapkan vektor β b. Hitung β X y = ˆ c. Bangkitkan vektor ε d. Hitung nilai pengamatan ε + = y y ˆ . Untuk penelitian ini data simulasi pertama diambil n = 20 dan p = 64, data simulasi kedua n = 40 dan p = 128, serta data simulasi ketiga n = 20 dan p = 256. Program simulasi dalam SAS dapat dilihat pada Lampiran 4, 5 dan 6. Untuk ketiga data simulasi X yang dihasilkan dikoreksi terhadap nilai tengah, kemudian ditransformasi menjadi peubah baru, dari peubah baru ditentukan model regresi terbaik terhadap respon y dengan analisis regresi bertatar. Ukuran kebaikan model dilihat dari R 2 , R 2 adjust , S dan PRESS yang dihasilkan Myers 1990. Perhitungan Tanda desimal dalam bilangan dinyatakan dengan titik matriks koefisien wavelet dengan menggunakan software wavetresh 3 seperti yang dijelaskan oleh Nason 1994 dan 1998. Hasil dan Pembahasan Jika X adalah matriks X yang terkoreksi terhadap nilai tengahnya, maka matriks peubah baru hasil transformasi dengan PCA, transformasi Fourier dan transformasi wavelet secara umum adalah : T pxp nxp nxp W D X = 42 ] , ... , , [ . 2 . 1 p T pxp w w w W = . Untuk PCA . i w adalah vektor berukuran px1 yang merupakan vektor ciri ke-i dari matriks kovarian contoh X . Untuk transformasi Fourier :                                                                                                                                         = p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p T W ]. 2 [ 2 sin . . . . 2 2 sin . 1 2 sin ]. 2 [ 2 cos . . . . 2 2 cos . 1 2 cos 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 ]. 2 [ 2 sin . . . 2 . 2 2 sin 2 . 1 2 sin 2 ]. 2 [ 2 cos . . . 2 . 2 2 cos 2 . 1 2 cos 1 1 ]. 2 [ 2 sin . . . 1 . 2 2 sin 1 . 1 2 sin 1 ]. 2 [ 2 cos . . . 1 . 2 2 cos 1 . 1 2 cos 1 π π π π π π π π π π π π π π π π π π 43 W adalah ortogonal karena fungsi sinus dan kosinus saling ortogonal. Hal ini dapat ditunjukkan dengan memanfaatkan identitas trigono metri sebagai berikut William 1994 :    ≠ = = ∑ = , , 2 cos 1 j j p p j i p j π 44 ] 2 [ , ... , 1 , , 2 sin 1 p j p j i p j = = ∑ = π , dimana ] 2 [ p adalah bilangan bulat terbesar kurang dari atau sama dengan 2 p .     ≠ ≠ = = = = ∑ = m k p p m k p p p m k p p j m p j k p j , genap 2 atau , 2 genap 2 atau , 2 cos 2 cos 1 π π     ≠ ≠ = = = = ∑ = m k p p m k p p p m k p j m p j k p j , genap 2 atau , 2 genap 2 atau , 2 sin 2 sin 1 π π 45 j k p j m p j k p j dan semua untuk , 2 sin 2 sin 1 = ∑ = π π . Sedangkan untuk transformasi wavelet, . i w diperoleh dari nilai fungsi father dan mother wavelet misal Haar wavelet pada interval [0,1. Reduksi dimensi diambil nxm D dimana m p. Matriks T W dalam transformasi wavelet adalah ortogonal Percival 2005. Ukuran kebaikan model regresi y terhadap peubah baru nxm D untuk masing- masing data simulasi dengan pra-pemrosesan transformasi Haar wavelet, transformasi Fourier dan PCA ringkasannya dapat dilihat pada Tabel 3. Hasil lengkap dapat dilihat di Lampiran 1 sampai Lampiran 3. Tabel 3 Ringkasan hasil analisis model nxm D terhadap y Metode Pra-pemrosesan Haar Wavelet Fourier PCA R 2 97.9 74.0 89.0 R 2 adjust 96.7 69.1 85.1 S 0.1947 0.5974 0.4144 Simulasi 1 n = 20 p = 64 PRESS 1.1959 9.4450 5.2301 R 2 98.4 97.3 96.8 R 2 adjust 97.9 96.8 96.2 S 0.0477 0.0587 0.0640 Simulasi 2 n = 40 p = 128 PRESS 0.1280 0.1697 0.1922 Sedangkan plot antara y dengan yˆ dapat dilihat pada Gambar 7 sampai Gambar 9. Y DUGA Y 5 4 3 2 1 5 4 3 2 1 Var iab le F I TSF our ier ao,b 1, b5 F I TSPCA1, 4, 5,9,12 F I TSHaar jad i Scatt erplot of Y vs FI TSPCA1,4,5,9,1, FI TSHaarjadi, FI TSFour ier ao,b Gambar 7 Plot y vs yˆ untuk data simulasi 1 Y DUGA Y 2.50 2.25 2.00 1.75 1.50 1.25 1.00 2.50 2.25 2.00 1.75 1.50 1.25 1.00 Var iable F IT SHaar wav elet F IT S33PCA F IT SFO URI ER Scatterplot of Y vs FI TS33PCA, FI TSFOURI ER, FI TSHaarwavelet Gambar 8 Plot y vs yˆ untuk data simulasi 2 Y DUGA Y 4.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5 4.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5 Var iable FI TS19PCA FI TSHaarw av elet FI TSFour ier Scatter pl ot of Y vs FI TSHaar w av elet , FI TSFour i er , FI TS1 9 PCA Gambar 9 Plot y vs yˆ untuk data simulasi 3 Tabel 3, Gambar 7 sampai dengan Gambar 9 menunjukkan bahwa dari berbagai ukuran kebaikan model, transformasi wavelet dengan mother wavelet yang paling sederhana saja ternyata lebih unggul dibanding PCA dan transformasi Fourier. Selain itu dari segi korelasi yang dihasilkan ternyata transformasi wavelet mampu memperkecil korelasi dari sekitar 1 dan -1 menjadi banyak yang dibawah 0.5, walaupun ada sebagian yang masih tinggi. Hasil hasil inilah yang akan dikaji lebih lanjut dalam bab-bab berikutnya, karena adanya dugaan dengan mother wavelet yang paling sederhana saja ternyata lebih unggul dibanding metode pra-pemrosesan yang lain. Selain itu hasil simulasi yang diperoleh dalam bab ini dapat memberi penguatan alasan mengapa metode transformasi wavelet sering digunakan sebagai metode pra- pemrosesan dalam kalibrasi peubah ganda untuk mengatasi kasus n p, seperti yang dilakukan oleh McMulty dan Ganapati 1998, Shao dan Yadong 2004, Yi-yu dan Chen min-jun 2000, Fearn 1999 dan Brown et al. 2001. Simpulan Dari eksplorasi data simulasi ternyata transformasi wavelet mempunyai potensi untuk diteliti lebih lanjut, karena walaupun hanya dengan mother wavelet yang paling sederhana yaitu Haar wavelet telah memberikan hasil ukuran kebaikan model yang lebih baik dibanding PCA dan transformasi Fourier. Daftar Pustaka Brown PJ, Fearn T, Vanucci M. 2001. Bayesian Wavelet Regression on Curves with Application to a Spectroscopic Calibration Problem. J Amer Statist Assoc 96: 398-408. Fearn T. 1999. Data Compression : FT or Wavelet. Spectroscopy Europe, London http:195.173.150.81td_col.html. McNulty SC, Ganapati M. 1998. Application of Wavelet Analysis Determining Glucose Concentration of Aqueous Solution Using NIR Spectroscopy. Hewlett- Packard comp . Myers RH. 1990. Classical and Modern Regression with Applicatios. PWS-KENT Pub. Co. Naes T, Isaksoon T, Fearn T, Davies T. 2002. A User Friendly Guide to Multivariate Calibration and Classification. NIR publications, UK. Nason GP, Silverman BW. 1994. The discrete wavelet transform in S. J.comp graph. Stat. 3: 163-191. Nason GP. 1998. Wavethresh 3 software. Department of Mathematics, University of Bristol, UK. http:www.stats.bris.ac.uk~wavethresh [ 20 juni 2003] Percival DB. 2005. Wavelets : Data Analysis, Algorithms and Theory. University Washington. http:www.ms.washington.edu~s530 [18 april 2005]. Shao X, Yadong Zhuang. 2004. Determining of Chlorogenic Acid in Plant Samples by Using Near-Infrared Spectrum with Wavelet Transform Preprocessing. Analytical Sciences 20. William WWS. 1994. Time Series Analysis. Addison-Wesley Pub. Comp. Yi-yu Cheng, Chen min-jun. 2000. A New Computing Multivariate Spectral Analysis Method Based on Wavelet Transform. Journal of Zhejiang University Science 1: 15-19.

4. REDUKSI DIMENSI DENGAN TRANSFORMASI WAVELET