SIFAT-SIFAT STATISTIK PENDUGAAN MODEL KALIBRASI

5. SIFAT-SIFAT STATISTIK PENDUGAAN MODEL KALIBRASI

MELALUI METODE TRANSFORMASI WAVELET DISKRET Abstrak Pemodelan kalibrasi dapat dipandang sebagai proses untuk memodelkan hubungan peubah bebas X, ukuran yang mudahmurah diperoleh, dengan peubah tak bebas Y. Permasalahan dalam pemodelan kalibrasi adalah multikolinearitas antar peubah bebas, dan banyaknya pengamatan n lebih kecil dari banyaknya peubah bebas p. Dari beberapa kajian empiris dan pustaka ternyata metode transformasi wavelet diskret TWD sebagai pra-pemrosesan untuk mereduksi dimensi data X akan memberikan hasil pendugaan model kalibrasi yang lebih memuaskan. Bab ini memfokuskan pada bagaimana sifat-sifat statistik dari dugaan model kalibrasi yang diperoleh dengan pra-pemrosesan metode transformasi wavelet diskret. Penduga parameter pada model regresi terhadap koefisien wavelet ternyata merupakan penduga berbias, tetapi besarnya bias ini dapat dikompensasi dengan ragam penduga yang makin kecil. Kata kunci : model kalibrasi, wavelet Abstract The calibration modeling can be viewed as a process to find relationships between a set of measurements which are easy or cheap to acquire and other measurements which are either expensive or labour intensive. The problems in calibration modeling is multicollinearity and the number of observations less than the number of independent variables. Empirical and literature studies showed that discrete wavelet transform DWT produced regression model with better goodness of fit than the other transform methods. This chapter focused on statistical properties estimator of calibration models using DWT as a preprocessing method. The research showed that parameter estimator is bias, but this bias can be compensated with smaller standard deviation. Key Words : calibration model, wavelet Pendahuluan Pemodelan kalibrasi dapat dipandang sebagai proses untuk memodelkan hubungan peubah bebas X, ukuran yang mudahmurah diperoleh, dengan peubah tak bebas Y, ukuran yang mahal diperoleh. Permasalahan yang sering muncul dalam pemodelan kalibrasi adalah terjadi multikolinearitas antar peubah bebas, dan banyaknya pengamatan n lebih kecil dari banyaknya peubah bebas p. Sehingga pendugaan model dengan metode regesi baku tidak bisa dilakukan. Metode yang sering digunakan adalah Principal Component Regression PCR dan Partial Least Square PLS. Tetapi dari beberapa kajian empiris dan pustaka ternyata metode-metode tersebut dapat diperbaiki hasilnya dengan metode transformasi wavelet diskret sebagai pemrosesan awal untuk mereduksi dimensi data X Sunaryo dan Notodiputro 2004, 2005a; Shao dan Yadong 2004; Yi-yu dan Chen min-jun 2000. Perbaikan model dapat dievaluasi dari nilai ukuran-ukuran kebaikan model seperti R 2 , R 2 adj , S, PRESS dan RMSEP Root Mean Square of Prediction yang dihasilkan McNulty dan Ganapati 1998; Shao dan Yadong 2004;Yi-yu dan Chen min-jun 2000. Bab ini memfokuskan pada bagaimana sifat-sifat statistik dari dugaan model kalibrasi yang diperoleh dengan pemrosesan awal metode transformasi wavelet diskret. Sebagai pendukung hasil kajian teoristis akan dilakukan analisis terhadap data simulasi yang mencerminkan kondisi data real yaitu antar peubah bebas saling berkorelasi dan n p. Bab ini merupakan penjelasan lebih mendalam dari artikel Sunaryo dan Notodiputro 2005b, dan gagasan dasar untuk memperoleh bukti-bukti dari suatu sifat diperoleh dari Searle 1971, Myer 1990, Naes dan Mevik 2001. Metode dan Bahan Penelitian Metode yang digunakan pada penelitian ini berupa analisis teori tentang sifat- sifat statistik dari model regresi dengan pra-pemrosesan transformasi wavelet diskret. Sifat-sifat statistik yang akan dianalisis adalah bias, ragam dan mean square error MSE dari penduga parameter model regresi dan prediksi, baik untuk rata-rata pengamatan baru, maupun pengamatan tunggal. Hasil analisis teori akan dijustifikasi pada data simulasi yang mencerminkan permasalahan pemodelan dengan kasus multikolinearitas antar peubah bebas dan jumlah pengamatan lebih kecil dari jumlah peubah bebas. Hasil dan Pembahasan Regresi Terhadap Koefisien Wavelet dan Sifat-sifat Statistiknya Misalkan matriks X berukuran nxp dan matriks X yang terkoreksi terhadap nilai rata-ratanya adalah :                   = − = T n T T T x X . . 2 . 1 . . . 1 X X X X . 64 Dengan transformasi wavelet diskret W j d T T j . . = X akan diperoleh W D = X , sehingga bentuk regresi e b b y + + = X 1 dapat ditulis menjadi regresi terhadap koefisien wavelet : e q D b e b W D b y + + = + + = 1 1 . 65 Karena D adalah hasil TWD dari matriks X yang terkoreksi terhadap nilai tengahnya, maka rata-rata tiap kolom D juga sama dengan nol yang telah dibuktikan pada Bab 4, sehingga pemodelan regresi identik dengan regresi antara y dengan peubah bebas yang terkoreksi terhadap nilai tengah. Dengan metode kuadrat terkecil dugaan parameter dari persamaan 65 adalah : . ˆ ˆ 1 1 b W y W y D D D q T T T T = = = − − X X X 66 Karena bˆ merupakan pend uga tak bias dari b maka q W T ˆ juga merupakan penduga tak bias dari b . Dengan penguraian nilai singular SVD matriks T A L P D = maka akan diperoleh : 1. y p a q T j p j j j ∑ = = 1 1 ˆ τ 67 Bukti : T A L P D = ,                     = p L τ τ τ . . . . . . . . . . . . . . . . . . 2 1 , untuk p τ τ τ ≥ ≥ ≥ . . . 2 1 . T T T T A L A A L P P L A D D 2 = = T T A L A D D 2 1 − − = . 1 1 1 2 1 T j p j j j T T T T T p a P L A P L A A L A D D D ∑ = − − − = = = τ 2. T j p j j j T a a D D q COV ∑ = − = = 1 2 2 1 1 ˆ τ σ σ 68 Bukti : y D D D q T T 1 ˆ − = T A L P D = T T A L A D D 2 1 − − = . 1 ˆ 1 2 2 2 2 1 T j p j j j T T a a A L A D D q COV ∑ = − − = = = τ σ σ σ Dimana akar ciri dan vektor ciri ke-j dari D D T masing-masing adalah j τ dan j a . Pada model regresi yang terkoreksi terhadap nilai tengah e b y + + = X 1 β . Misalkan y adalah pengamatan yang berhubungan dengan o X . Jika b o y T ˆ ˆ ˆ X + = β digunakan untuk memprediksi y E = µ , maka ˆy adalah penduga tak bias bagi y E = µ . Dengan ragam sebesar : 2 1 2 ˆ σ σ o o n y Var T T X X X X −       + = 69 Bukti lihat Searle 1971. Sehingga . ˆ ˆ 2 1 2 σ σ o o n y Var y MSE T T X X X X −     + = = 70 Dengan penguraian nilai singular dari X , persamaan 70 bisa ditulis ∑ = + = p j j j t n y MSE 1 2 2 2 , ˆ λ σ σ 71 dimana j j v o t T X = disebut skor o X pada j v . Jika b o y T ˆ ˆ ˆ X + = β digunakan untuk memprediksi pengamatan tunggal y , maka : 2 1 2 1 1 ˆ ˆ ˆ σ       +       + = − = − = − f f n y y Var y y E y MSE T T X X X X 72 Bukti lihat Searle 1971. Untuk model regresi terhadap koefisien wavelet e q D b y + + = 1 , dimana telah diketahui mempunyai sifat bahwa jumlah elemen tiap kolom dari D sama dengan nol. Misalkan y adalah pengamatan yang berhubungan dengan pengamatan baru vektor koefisien wavelet d , maka analog terhadap penurunan menemukan ragam dan MSE dari ˆy akan diperoleh MSE untuk pengamatan tunggal adalah : , 2 2 ˆ 1 2 2 2 1 2 2 σ τ σ σ σ σ σ + + = + + = ∑ = − j p j j T T l n d D D d n y MSE 73 dimana d adalah vektor pengamatan baru dan j T j a d l = menyatakan skor dari d sepanjang vektor ciri ke-j. Jika T pxm W nxp nxm D X = dan T W masing-masing merupakan m kolom dari D dan T W dengan m p, maka regresi terhadap m koefisien wavelet berbentuk f q D q y + + = 1 dan q diduga dengan : y D D D q T T 1 ˆ − = . 74 ˆq W T merupakan penduga bias bagi b dengan bias sebesar : , 1 1 ˆ ˆ 1 1 y p a W y p a W q W q W bias T i m i i i T T j p j j j T T T ∑ ∑ = = − = − = τ τ 75 dimana i a dan i τ adalah vektor ciri dan akar ciri ke-i dari D D T . Dari persamaan 75 terlihat bahwa bias akan menuju nol, jika m mendekati p. Dapat ditunjukkan pula bahwa T i m i i i T a a D D q COV 1 2 2 1 1 ˆ ∑ = − = = τ σ σ , 76 . 2 ˆ 2 2 ˆ 2 ˆ 1 2 2 2 1 2 2 y bias l n y bias d D D d n y MSE i m i i T T + + + = + + + = ∑ = − σ τ σ σ σ σ σ 77 Dari persamaan 76 berarti 2 2 2 2 2 1 2 1 ... ˆ σ τ τ τ       + + + = m im i i i a a a q Var . 78 Yang berarti dengan adanya akar ciri dari D D T yang mendekati nol, maka makin tinggi ragam dari dugaan parameter regresi. Pada persamaan 73 dan 77 menunjukkan bahwa selisih ragam prediksi yang besar, yaitu 1 2 2 1 2 2 i m i i j p j j l l τ σ τ σ ∑ ∑ = = − akan diganti dengan MSE yang cenderung lebih kecil pada persamaan 77. Jika dimensi matriks nxp X direduksi menjadi koefisien wavelet nxm D dengan m p, maka regresi terhadap koefisien wavelet akan menghasilkan dugaan parameter regresi yang berbias. Kebaikan model dugaan yang diperoleh akan tergantung pada kemampuan reduksi yang menghasilkan akar ciri dari D D T yang relatif besar, sehingga ragam koefisien regresi yang diperoleh akan kecil. Ilustrasi Data Simulasi Untuk menggambarkan data real dalam kalibrasi maka dilakukan simulasi untuk memperoleh data X 10x16 yang saling berkorelasi sangat tinggi. Kemudian dengan menentukan koefisien b , b 1 , ..., b 16 dan membangkitkan 10 bilangan acak sebagai vektor residual e , akan diperoleh data vektor e b X b y + + = 1 . Koefisien regresi yang dipakai dalam data simulasi ini adalah : b b 1 .... b 16 = -1.90 1.25 0.75 1.00 -1.25 0.75 0.75 -0.50 -0.50 0.25 0.75 -0.75 0.50 -1.00 0.25 1.00 0.50 . Karena antar kolom X berkorelasi sangat tinggi dan n p, maka matriks X X T adalah matriks singular, sehingga dugaan koefisien regresi dengan metode kuadrat terkecil biasa tidak bisa dilakukan. Dengan mengambil 3 level resolusi untuk TWD dari matriks X yang terkoreksi terhadap nilai tengahnya X , maka akan diperoleh nilai akar ciri yang sama dengan akar ciri dari X X T . Akar ciri yang tidak nol adalah 1.15835 0.00179 0.00116 0.00048 0.00020 . Nilai akar ciri D D T pada berbagai kombinasi dapat dilihat pada Tabel 4. Tabel 4 Akar ciri D T D pada beberapa kombinasi Akar ciri D T D dengan elemen D adalah c 0,0 dan d hanya level 3 c 0,0 , d 3,0 ,d 3,1 ,d 3,2 ,d 3,3 c 0,0 , d 3,3 c 0,0 , d 2,0 ,d 2,1 ,d 1,0 c 0,0 , dan d level 0,1 dan 2 d 2,0 -d 0,0 1.15819 1.15811 1.15805 1.15811 1.15818 0.0009045 0.00099 0.00049 0.0003 0.00043 0.00086 0.0006392 0.00068 0.00034 0.00026 0.00053 0.0001099 0.00037 0.00019 0.00005 0.00010 0.00010 0.00005 Karena mengandung akar ciri nol maka pendugaan model regresi yang tidak dapat diduga adalah Y terhadap : • c 0,0 dan koefisien wavelet resolusi level 3 • c 0,0 serta koefisien wavelet resolusi level 0, 1 dan 2 • d 2,0 , d 2,1 , d 2,2 , d 2,3 , d 1,0 , d 1,1 dan d 0,0 . Terlihat dari Tabel 2 dengan adanya c 0,0 akar ciri pertama akan besar, sehingga untuk data ini c 0,0 bisa dipertimbangkan masuk model. Nilai beberapa ukuran kebaikan model untuk berbagai regresi yang dapat dilakukan dapat dilihat pada Tabel 5. Tabel 5 Nilai beberapa ukuran kebaikan model Peubah Indepeden dalam model R 2 R 2 adj s PRESS c 0,0 , d 3,0 ,d 3,1 ,d 3,2 ,d 3,3 95.0 88.8 0.137 0.889 c 0,0 , d 2,0 ,d 2,1 ,d 1,0 93.5 88.3 0.140 0.442 c 0,0 , d 3,3 94.4 82.8 0.110 0.192 Jika ada pengamatan baru, ringkasan hasil prediksi dengan berbagai model regresi yang dapat dilakukan dapat dilihat pada Tabel 6. Tabel 6 Ringkasan hasil prediksi untuk suatu pengamatan baru 95 CI 95 PI Peubah Indepeden dalam model Fits SE Fits batas bawah batas atas lebar 95 CI batas bawah batas atas lebar 95 PI c 0,0 , d 3,0 ,d 3,1 ,d 3,2 ,d 3,3 0.19469 0.119694 0.527014 0.527014 -0.30953 0.69891 1.008436 c 0,0 , d 2,0 ,d 2,1 ,d 1,0 0.29440 0.080644 0.087103 0.501705 0.414602 -0.12012 0.70892 0.829038 c 0,0 , d 3,3 0.22753 0.059117 0.087738 0.367318 0.279580 -0.06767 0.52273 0.590404 Tabel 6 menunjukkan bahwa dengan penambahan akar ciri dari D T D yang lebih kecil akan menyebabkan ragam prediksi yang makin besar, walaupun secara teoritis bias prediksinya makin kecil. Dari berbagai alasan di atas maka regresi y terhadap c 0,0 dan d 3,3 menunjukkan kecenderungan lebih baik dibanding yang lain. Model dugaan regresi wavelet adalah yˆ = 0.725 + 1.15 c 0,0 + 11.1 d 3,3 . Jika dikembalikan ke peubah asli diperoleh model prediksi : yˆ = -1.58972 + 0.28685 X 1 + 0.28685 X 2 + 0.28685 X 3 + 0.28685 X 4 + 0.28685 X 5 + 0.28685 X 6 + 8.12843 X 7 - 7.55474 X 8 + 0.28685 X 9 + 0.28685 X 10 + 0.28685 X 11 + 0.28685 X 12 + 0.28685 X 13 + 0.28685 X 14 + 0.28685 X 15 + 0.28685 X 16 . Plot y dengan yˆ duga dapat dilihat pada Gambar 10. Y duga Y 1.4 1. 2 1. 0 0.8 0. 6 0.4 0.2 1. 6 1. 4 1. 2 1. 0 0. 8 0. 6 0. 4 0. 2 S 0.102855 R- Sq 94.4 R- Sq adj 93.7 Fit te d Line Plot Y = - 0.0 0000 + 1. 000 Ydug a coo dan d33 da lam m odel Gambar 10 Plot y dengan yˆ Simpulan 1. Jika dimensi matriks X yang terkoreksi terhadap rata-rata nxp X direduksi menjadi koefisien wavelet nxm D untuk m p, maka diperoleh dugaan parameter regresi yang berbias. 2. Keragaman koefisien regresi akan dipengaruhi oleh besar kecilnya akar ciri dari D D T yang diperoleh. 3. Penghapusan ragam-ragam yang besar dari prediksi nilai y pengamatan baru akan diganti dengan MSE Mean Square Error yang cenderung lebih kecil dalam regresi terhadap koefisien wavelet nxm D . Daftar Pustaka McNulty C S, Ganapati M. 1998. Application of wavelet analysis for determining glucose concentration of aqueous solutions using NIR spectroscopy. Hewlett- Packard company. Myers RH. 1990. Classical and Modern Regression with Applicatios. PWS-KENT Pub. Co. Naes T, Mevik BH. 2001. Understanding The Collinearity Problem in Regression and Discriminant Analysis. Journal of Chemometrics 15 : 413-426. Percival DB. 2005. Wavelets : Data Analysis, Algorithms and Theory. University Washington. http:www.ms.washington.edu~s530 [18 april 2005]. Searle SR. 1971. Linear Models. John Willey Sons. Shao X, Yadong Zhuang. 2004. Determining of Chlorogenic Acid in Plant Samples by Using Near-Infrared Spectrum with Wavelet Transform Preprocessing. Analytical Sciences 20. Sunaryo S, Notodiputro KA. 2004. Penerapan Metode Transformasi Wavelet Diskret untuk Menentukan Kandungan Senyawa Gingerol pada Tanaman Jahe. Statistika - Forum Teori dan Aplikasi Statistika 4: 181-185, Jurusan Statistika FMIPA UNISBA Sunaryo S, Notodiputro KA. 2005a. Penerapan Metode Transformasi Wavelet Diskret untuk Menentukan Kandungan Senyawa Kurkumin pada Tanaman Temulawak. Prosiding Seminar Nasional Matematika, halaman 100-107, Jurusan Matematika UNS, Surakarta, 7 Mei 2005. Sunaryo S, Notodiputro KA. 2005b. Sifat-sifat Statistik Pendugaan Model Kalibrasi melalui Metode Transformasi Wavelet Diskret. Prosiding Seminar Nasional Matematika , halaman 159-168, Jurusan Matematika UNS, Surakarta, 7 Mei 2005. Vidacovic B, Meuller P. 1991. Wavelets for Kids. A Tutorial Introduction. AMS Subject Classification , Duke University. Yi-yu Cheng, Chen min-jun. 2000. A New Computing Multivariate Spectral Analysis Method Based on Wavelet Transform. Journal of Zhejiang University Science 1: 15-19.

6. PENERAPAN MODEL KALIBRASI DENGAN