Validasi Pendekatan Regresi Kontinum dalam Model Kalibrasi

31 Karena dimensi dari B sangat besar p , maka dipilih level-level resolusi tertentu sedemikian hingga banyaknya koefisien wavelet yang terpilih sebesar p dengan p n p − 1 akibatnya akan diperoleh T pxp nxp nxp B X D = 32 yang mereduksi pengamatan dari p titik tiap-tiap contoh menjadi p titik koefisien wavelet yang terpilih. Adapun sifat-sifat dari matriks koefisien wavelet D adalah : 1. Koragam antar kolom pada matriks D secara umum tidak sama dengan nol, sehingga antar kolom D masih dimungkinkan terjadi korelasi. 2. Jumlah akar ciri dari D T D akan sama dengan jumlah akar ciri X T X , yang berarti pada reduksi dimensi dengan TWD T pxp nxp nxp B X D = proporsi keragaman peubah asal X yang dapat diterangkan oleh D tergantung pada kemampuan memperoleh jumlah akar ciri yang tidak nol yang proporsinya masih besar dibanding dengan jumlah akar ciri yang diperoleh oleh D T D atau X T X Sunaryo 2005. Dari sifat-sifat tersebut maka transformasi wavelet diskret mempunyai keunggulan dibandingkan transformasi Fourier atau analisis komponen utama dalam hal banyaknya alternatif memilih berbagai fungsi wavelet yang jumlah akar ciri T D D masih besar, sehingga hasil reduksi dimensi masih cukup mendekati peubah asal. Sedangkan kelemahannya, ternyata tidak ada jaminan secara matematis bahwa korelasi antar koefesien wavelet menjadi relatif kecil semua, sehingga masih dimungkinkan terjadi kasus kolinearitas ganda. Akibatnya transformasi wavelet diskret sebaiknya digabung dengan metode lainnya dalam pemodelan regresi.

2.8 Validasi

Dalam pemodelan, setelah dilakukan pendugaan parameter, maka langkah berikutnya adalah menggunakan model tersebut untuk memprediksi nilai peubah respon berdasarkan nilai peubah bebas yang diketahui. Model dapat digunakan untuk tujuan prediksi jika model tersebut baik. Beberapa ukuran kebaikan model 32 adalah s R R , , 2 2 . Dalam kenyataannya ukuran-ukuran tersebut masih terdapat kelemahan. Tingginya R 2 belum menjamin bahwa model juga baik untuk tujuan prediksi. Hal ini karena ukuran-ukuran tersebut diperoleh dengan melibatkan semua pengamatan n buah data. Oleh karena itu perlu dilakukan pengujian kemampuan model dengan cara validasi. Dalam validasi, data amatan sebanyak n buah dibagi dalam dua kelompok, yaitu kelompok pertama sebanyak 1 n digunakan untuk membangun model, serta sisanya 2 n digunakan untuk menguji model validasi. Beberapa jenis pengujian dalam validasi adalah : 1. Root mean square error of prediction RMSEP RMSEP = 2 1 2 ˆ 2 n y y n i i i ∑ = − 33 dengan y i = nilai pengamatan data ke-i pada kelompok data validasi ˆ i y = nilai dugaan pengamatan ke-i dengan menggunakan model yang dibangun dengan hanya melibatkan data kelompok-1. 2. Standard error of prediction SEP SEP = ∑ = − − − 2 1 2 2 1 BIAS ˆ n i i i n y y 34 dengan ∑ = − = 2 1 2 2 ˆ BIAS n i i i n y y 35 BIAS dapat diinterpretasikan sebagai rata-rata selisih antara nilai dugaan dan nilai pengamatan dalam kelompok data validasi. Hubungan antara SEP dengan RMSEP secara sederhana dapat ditulis sebagai berikut : 2 2 2 BIAS SEP RMSEP + ≈ 36 Persamaan 36 tidak persis sama karena pembagi yang digunakan untuk menghitung SEP adalah 1 2 − n , sedangkan RMSEP adalah 2 n . 3. Selang kepercayaan Teori statistika standar yang berdasarkan sebaran normal, formula untuk mencari selang kepercayaan 95 untuk y adalah : 96 . 1 y y σ ± . 37 33 Bila asumsi kenormalan tidak dipenuhi formula untuk mencari selang kepercayaan adalah : nilai dugaan ± 2xsimpangan baku dari dugaan. 38 Formula ini merupakan aproksimasi yang baik untuk selang kepercayaan yang sebenarnya Naes et al. 2002. 4. Selang prediksi Selang prediksi atau disebut juga selang kepercayaan untuk prediksi untuk model dengan BIAS yang kecil digunakan formula xRMSEP 2 ˆ xSEP 2 ˆ ± ≈ ± i i y y 39 merupakan aproksimasi selang prediksi 95 untuk y Naes et al. 2002. 3 KINERJA DAN PERMASALAHAN REGRESI KONTINUM Abstrak Regresi Kontinum RK merupakan salah satu alternatif untuk mengatasi masalah ill conditioned dan singularitas. RK merupakan generalisasi dari Regresi Kuadrat Terkecil RKT, Regresi Komponen Utama RKU, serta Regresi Kuadrat Terkecil Parsial RKTP. Sehingga diharapkan secara empirik menghasilkan dugaan yang lebih baik dari pada RKU dan RKTP. Di samping memiliki keunggulan, RK mengandung beberapa permasalahan yang perlu dikaji, antara lain : a bagaimana menentukan optimasi dari fungsi kriteria umum, b bagaimana kinerja RK pada berbagai struktur korelasi matriks peubah bebas, serta c bagaimana mengatasi masalah jika . p n Hasil kajian empirik dengan data simulasi disimpulkan bahwa kinerja RK sangat baik untuk mengatasi berbagai struktur korelasi matriks peubah bebas. Kombinasi RK dengan transformasi wavelet diskret TWD sebagai metode prapemrosesan, dan disebut metode Regresi Kontinum dengan Transformasi Wavelet Diskret RK-TWD, mempunyai potensi sangat baik untuk mengatasi masalah banyaknya pengamatan jauh lebih kecil daripada banyaknya peubah bebas p n serta ill conditioned. Kata kunci : fungsi kriteria umum, regresi kontinum, singularitas, transformasi wavelet diskret, ill conditioned Abstract Continuum regression CR is one of the alternatives to overcome the problems of ill conditioned and singularity. CR is a generalization of the least squares regression LSR, principal component regression PCR, and partial least squares regression PLSR. Hence, it is expected that CR will empirically provide better estimations compared to that of PCR and PLSR. Beside of its advantages, there are some problems that need to be studied, mainly on: a how to determine the optimum generalized criterion function, b how the asses the CR performance at various correlation matrix structure of independent variables, and c how to overcome the problem if . p n The results of empirical research using data simulation has concluded that the performance of CR is very good in overcoming various correlation matrix structure of independent variables. The combination of CR with discrete wavelet transformation DWT as method of preprocessing, called continuum regression with discrete wavelet transformation CR-DWT, has very good potency to overcome the problems of the number of observations that is much less than the number of independent variables p n and ill conditioned. Key word: generalized criterion function, continuum regression, singularity, discrete wavelet transformation, ill conditioned 35 Pendahuluan Regresi kontinum merupakan salah satu alternatif untuk mengatasi ill conditioned akibat kolinearitas ganda, maupun singularitas akibat banyaknya pengamatan lebih kecil daripada banyaknya peubah bebas p n . Kedua kondisi tersebut sering terjadi pada pemodelan dengan regresi ganda khususnya kalibrasi. Di samping keunggulan tersebut, terdapat beberapa permasalahan yang perlu dikaji, antara lain : a bagaimana menentukan optimasi dari fungsi kriteria umum generalized criterion function, GCF dalam RK, b bagaimana kinerja RK pada berbagai struktur korelasi matriks peubah bebas pada kasus , p n serta c bagaimana mengatasi masalah jika . p n Pada bab ini dibahas ketiga permasalahan tersebut yang merupakan pengembangan dari artikel yang telah ditulis oleh Setiawan dan Notodiputro 2005a, 2005b, 2007b. Dari aspek komputasi, RK mengalami kendala terutama jika dimensi matriks X sangat besar . n p Oleh karena itu perlu dilakukan pemampatan data yang disebut metode prapemrosesan. Pada penelitian ini metode prapemrosesan yang digunakan adalah transformasi wavelet diskret TWD, karena TWD merupakan metode yang paling unggul dibandingkan metode lain Sunaryo 2005. Tujuan penelitian ini adalah : a mendapatkan formula matematis serta algoritma untuk mencari optimasi GCF dalam RK, b mengkaji kinerja RK pada berbagai struktur korelasi matriks peubah bebas pada kasus , p n dan c mendapatkan metode untuk mengatasi masalah jika p n serta mengkaji kinerjanya. Metode Penelitian ini mencakup dua aspek, yaitu aspek teoritis dan aspek empirik. Secara rinci diuraikan sebagai berikut : 1. Penentuan optimasi dari fungsi kriteria umum dalam RK digunakan kajian teoritis. 2. Untuk melihat kinerja RK pada berbagai struktur korelasi matriks peubah bebas pada kasus p n digunakan kajian empirik dengan menggunakan dua macam data yaitu : 36 a Data hasil percobaan kalibrasi pengukuran konsentrasi lemak ikan yang diamati absorbsinya pada tiap panjang gelombang, dengan ukuran contoh 36 dan 9 titik gelombang yang diukur dengan alat spektrometer NIR Naes 1985. b Data hasil simulasi untuk n=40 dan p=20 dengan tingkat korelasi antar peubah bebas 0.70, 0.80, 0.90 serta 0.99, simulasi dilakukan berulang-ulang dengan cara pembangkitan data matriks peubah bebas X sebanyak 1000 kali. Pada setiap simulasi, data dibagi menjadi dua kelompok, yaitu : a kelompok pertama sebanyak n 1 =30 data untuk membangun model, serta b kelompok kedua sebanyak n 2 =10 data untuk valdasi. Tahapan simulasi data dapat dilihat pada Lampiran 1, sedangkan program simulasi dalam SAS dapat dilihat pada Lampiran 2 yang merupakan modifikasi program yang dibuat Sunaryo 2005. Pengolahan kedua jenis data tersebut menggunakan perangkat lunak SAS Malpass 1996 dan diulang pada berbagai level parameter penyesuaian pendekatan 1 dan 2. 3. Cara mengatasi masalah jika pada RK banyaknya pengamatan jauh lebih kecil daripada banyaknya peubah bebas digunakan kajian teoritis dan empirik. Pada kajian empirik, data yang digunakan adalah data hasil simulasi yang terdiri dari dua macam, yaitu : 1 n=20 dan p=128, serta 2 n =20 dan p=256. Kedua jenis data tersebut mempunyai tingkat korelasi antar peubah bebas yang sangat tinggi r = 0.99. Program simulasi dalam SAS dapat dilihat pada Lampiran 3 dan 4 Sunaryo 2005. Sedangkan tahapan-tahapan pengolahan data digunakan algoritma yang dihasilkan dari kajian teoritis. Untuk mengevalusi kinerja RK ada beberapa kriteria yang diperbandingkan, antara lain : koefisien determinasi R 2 , simpangan baku s, RMSEP, serta plot antara y pengamatan dengan yˆ . Model dikatakan lebih baik jika R 2 lebih tinggi, s dan RMSEP lebih kecil, serta hasil pengepasan lebih dekat ke garis lurus dengan gradien 45 melalui pusat koordinat. Hasil pendugaan dengan menggunakan metode RK dibandingkan dengan hasil RKU dan RKTP. 37 Hasil dan Pembahasan Sesuai dengan tujuan dari penelitian, hasil penelitian mencakup tiga hal yang akan dibahas berikut ini. Optimasi Fungsi Kriteria Umum dalam Regresi Kontinum Misalkan X matriks data hasil pengamatan yang sudah dipusatkan centred berukuran nxp dan disebut peubah bebas, sedangkan y adalah vektor peubah respon berukuran nx1 pengamatan yang sudah dipusatkan. Prinsip dasar regresi kontinum adalah generalisasi dari RKTP, RKU serta RKT dengan model umum ε β + = Χ y . Karena pada matriks X terdapat masalah singularitas dan atau ill conditioned, maka dilakukan transformasi peubah dengan formula sebagai berikut : h h XW T = dan h h w w w ,..., , 2 1 = W adalah matriks berukuran pxh dengan ] 1 [ − n p h dan disebut matriks pembobot, T h adalah matriks peubah baru berukuran nxh. Dengan demikian persamaan regresi dapat diubah menjadi sebagai berikut : ε ξ + = h y T . Untuk mendapatkan matriks pembobot W h dilakukan dengan cara memaksimumkan GCF dengan formula yang dikembangkan Stone dan Brooks 1990 sebagai berikut : [ ] 1 1 2 − − = δ δ w w y w G T T T T X X X [ ] 1 1 2 − − = δ δ w w s w G T T T S 40 dengan kendala 1 = w w T dan = j T i w w S untuk h j i ,..., 2 , 1 = ≠ sedangkan parameter penyesuaian δ merupakan bilangan real 1 ≤ δ . Implikasi dari persamaan 40 adalah mendapatkan parameter penyesuaian δ dan vektor pembobot w agar nilai GCF maksimum. Pada kondisi inilah pemodelan hubungan antara peubah bebas X dengan peubah respon Y optimum terbaik berdasarkan kriteria tertentu. Ada dua pendekatan untuk memaksimumkan nilai GCF yaitu parameter penyesuaian ditentukan, serta mencari optimasi parameter penyesuaian dan matriks pembobot secara serentak. 38 Parameter Penyesuaian ditentukan Pada bagian berikut ini akan dibahas pendekatan pertama, yaitu memaksimumkan nilai GCF dengan parameter penyesuaian δ ditentukan bilangan real 1 ≤ ≤ δ . Prosedur ini dilakukan berulang-ulang sampai diperoleh suatu model terbaik. Untuk menyederhanakan persoalan, didefinisikan 1 + = γ γ δ sehingga GCF pada persamaan 40 menjadi : 1 2 − = γ w w s w G T T S . 41 Untuk mendapatkan nilai GCF maksimum, maka dicari turunan pertama terhadap w dan disamakan dengan 0 dengan memasukkan kendala 1 = w w T dan = j T i w w S , sehingga menjadi d w w w w w s w f T T T T SQ S − − − = − 1 1 2 λ γ 42 dengan ,..., , 2 1 h w w w = Q , λ , serta T h d ,..., , 2 1 λ λ λ = merupakan pengganda Lagrange. 2 1 2 2 2 2 1 = − − − + = ∂ ∂ − − d w w w w s w s w w s w w f T T T T SQ S S S λ γ γ γ 43 dengan menggunakan kendala 1 = w w T dan = SQ T w , dapat diperoleh λ dan d dengan cara sebagai berikut : persamaan 43 diubah menjadi d w w w s w w w w s w s w w s w w T T T T T T SQ S S S S S 2 1 2 2 2 2 1 + − + = − − − γ γ γ γ λ . 44 Selanjutnya ruas kiri dan kanan pada persamaan 44 dikalikan dengan T w sehingga menjadi : d w w w w w s w w w w w s w s w w w s w w w T T T T T T T T T T T SQ S S S S S 2 1 2 2 2 2 1 + − + = − − − γ γ γ γ λ 45 1 2 1 2 1 2 − − − − + = γ γ γ γ λ w w s w w w s w w w s w T T T T T T S S S 1 2 − = γ γ w w s w T T S . 46 Sedangkan d dapat dicari dengan cara melakukan substitusi persamaan 46 ke persamaan 43 sebagai berikut : w w w s w w w w s w s w w s w d T T T T T T 1 2 2 2 1 2 1 2 2 − − − − − + = γ γ γ γ γ S S S S SQ . 47 39 Ruas kiri dan kanan pada persamaan 47 dikalikan dengan T T Q SQ Q 1 − sehingga menjadi : + = − − − s w w s w d T T T T T T Q S SQ Q SQ Q SQ Q 1 1 1 2 γ w w w s w w w w s w T T T T T T T T Q S SQ Q S Q S SQ Q 1 2 1 2 2 1 2 1 2 − − − − − − γ γ γ γ − − = − − − ] [ 2 1 2 1 1 w w w s w s w w s w d T T T T T T T Q S Q S SQ Q γ γ γ 2 2 1 1 2 − − − γ γ w w s w w T T T T S SQ Q SQ ] [ 2 1 2 1 1 w w w s w s w w s w d T T T T T T T Q S Q S SQ Q − − − − = γ γ γ . 48 Selanjutnya persamaan 46 dan 48 disubstitusikan ke persamaan 43 ] [ 2 2 1 2 2 1 2 1 1 1 2 2 2 1 = − − − − + − − − − − − w w w s w s w w s w w w w s w w w w s w s w w s w T T T T T T T T T T T T T Q S Q S SQ Q SQ S S S S γ γ γ γ γ γ γ γ 49 Ruas kiri dan kanan pada persamaan 49 dikalikan dengan 2 1 2 1 + − − γ w w s w T T S sehingga menjadi : − − − + w w w s w w s w s w w T T T T 1 S S S γ γ 1 1 = + − − w w w s w s w w T T T T T T T Q S SQ Q SQ Q S SQ Q SQ γ . 50 Definisikan : T T Q SQ Q SQ I 1 − − = dan w w T S = τ . Maka persamaan 50 dapat diubah menjadi : 1 = − + − − − − + w s w s w s w w s w s T T T τ γ τ τ γ γ τ I I S 1 = − + Α − w s w w s w s T T S γ τ γ τ . 51 Ruas kiri dan kanan pada persamaan 51 dikalikan dengan 1 1 − − τ s w T sehingga menjadi 1 1 1 = − + − − − τ γ γ w w s s w T S A ] 1 [ 1 1 = − − − − − w s s w T τ γ γ S A . 52 Ruas kiri dan kanan pada persamaan 52 dikalikan dengan s w T w s w s T ] 1 [ 1 A S γ τ γ + − = − s w s w T A A S 1 1 ] 1 [ − − + − = γ τ γ 40 s 1 1 1 ] 1 [ − − − + − = I SA γ τ γ s T T 1 1 1 1 } ] [ 1 { − − − − + − − = I Q SQ Q SQ I S γ τ γ s T T 1 1 1 1 1 } ] [ 1 { − − − − − + − − = I Q SQ Q Q S γ τ γ s 1 1 1 } 1 { − − − + − = I R γ τ γ 53 dengan T T Q SQ Q Q S R 1 1 − − − = . Selanjutnya diperoleh : } 1 { 1 1 1 s w s w T − − − + − = I R γ τ γ . 54 Bila didefinisikan 1 1 1 } 1 { − − − + − = I R H γ τ γ τ maka persamaan 54 menjadi s w s w T τ H = 55 2 1 2 ] [ s w s w T τ H = 2 1 ] [ s w w s s T T τ H = 2 1 ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ = s w s w s s s T T T τ τ H H 2 1 ] [ s s s T τ τ H H = . 56 Dengan demikian untuk mencari 1 + p w diperoleh dengan cara : = − s s s s T T τ τ τ τ H SH H . 57 Nilai τ ini disubstitusikan ke persamaan 56 untuk mendapatkan w . Parameter Penyesuaian dan Matriks Pembobot dicari secara serentak Pendekatan kedua adalah memaksimumkan GCF dengan mencari parameter penyesuaian δ dan matriks pembobot W secara serentak. GCF pada persamaan 43 diturunkan terhadap w dan γ . Langkah awal mencari log dari 41 GCF pada persamaan 42 dengan kendala 1 = w w T dan = j T i w w S , sehingga menjadi sebagai berikut : d w w w w w s w f T T T T SQ S − − − − + = 1 log 1 log 2 log λ γ 58 d w w w w s s w w f T T SQ S S + + − + = ∂ ∂ λ γ 2 2 1 2 log 59 I S S S λ γ 2 1 2 2 log 2 2 2 2 + − − − = ∂ ∂ T T T T w w w w s s s w w f 60 w w w w f T S S 2 log 2 = ∂ ∂ ∂ γ 61 log log w w f T S = ∂ ∂ γ 62 log 2 2 = ∂ ∂ γ f . 63 Selanjutnya dicari matriks Hessian sebagai berikut : ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ = 2 2 2 2 2 2 log log log log γ γ γ f w f w f w f H 64 ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ ∂ ∂ ∂ ∂ = γ f w f g log log . 65 Dengan metode Gauss Newton diperoleh : m m m m g g g 1 1 − + − = H 66 m =0,1,.... sampai konvergen. Kinerja Regresi Kontinum pada berbagai Struktur Korelasi Matriks Peubah Bebas pada Kasus np Ringkasan ukuran kebaikan model hasil pengolahan data Naes disajikan pada Tabel 4, sedangkan Gambar 6 menunjukkan plot antara y hasil pengamatan dengan yˆ pada beberapa tingkat δ . Tabel 5 menyajikan ringkasan ukuran kebaikan model hasil pengolahan data simulasi, sedangkan Gambar 7 sampai Gambar 10 menunjukkan diagram pencar antara y hasil pengamatan dengan yˆ 42 pada berbagai tingkat δ untuk data simulasi. Sedangkan hasil pengolahan 1000 contoh hasil pembangkitan data simulasi disajikan pada Gambar 11 sampai Gambar 14. Tabel 4 Ringkasan ukuran kebaikan model pada beberapa tingkat δ untuk data Naes Kriteria Pendekatan 1 δ ditentukan 0.1 0.2 0.25 0.3 0.5 RKTP 0.6 0.7 1 RKU Pendekatan 2 h 4 3 3 3 3 3 3 3 3 2 R 0.957 0.946 0.945 0.945 0.943 0.943 0.942 0.937 0.945 2 R 0.953 0.943 0.942 0.941 0.941 0.939 0.938 0.933 0.942 s 0.220 0.243 0.244 0.246 0.249 0.251 0.252 0.263 0.245 y- d u g a y 2 1 - 1 - 2 - 3 2 1 - 1 - 2 - 3 V a r ia b le y - d u g a 0 . 5 y - d u g a 1 y - d u g a 0 . 1 y - d u g a 0 . 5 P lo t a n t a r a y d e n ga n y - d u ga 0 . 1 , y - d u ga 0 . 5 , y - d u ga 1 , y - d u ga o p t Gambar 6 Diagram pencar antara y dengan yˆ pada beberapa tingkat δ untuk data Naes Dari hasil analisis data Naes yang disajikan pada Tabel 4 tampak bahwa pada 1 . = δ menghasilkan ukuran kebaikan model terbaik, yaitu koefisien determinasi paling besar R 2 =95.7 serta simpangan baku paling kecil s=0.220. Hal ini ditunjang dengan Gambar 6 yang menunjukkan bahwa pada 1 . = δ titik-titik yang ada lebih dekat ke garis 45 . Sedangkan hasil pendugaan dengan metode RKU 1 = δ dan RKTP 5 . = δ diperoleh koefisien determinasi berturut-turut 93.7 dan 94.3, serta simpangan baku 0.263 dan 0.249. 43 Tabel 5 Ringkasan ukuran kebaikan model pada beberapa δ untuk data simulasi pada berbagai tingkat koefisien korelasi antar peubah bebas Data Kriteria Pendekatan 1 δ ditentukan 0.2 0.25 0.3 0.5 RKTP 0.6 0.7 1 RKU Pendekatan 2 Simulasi h 2 3 3 3 3 3 1 4 r =0.70 2 R 0.899 0.903 0.901 0.888 0.882 0.874 0.784 0.896 2 R 0.897 0.897 0.894 0.882 0.875 0.867 0.784 0.888 s 0.325 0.325 0.329 0.345 0.358 0.369 0.472 0.341 RMSEP 0.355 0.328 0.340 0.385 0.407 0.425 0.473 0.380 Simulasi h 3 3 3 4 4 5 4 4 r =0.80 2 R 0.960 0.959 0.958 0.942 0.952 0.948 0.900 0.962 2 R 0.959 0.957 0.956 0.940 0.948 0.943 0.895 0.959 s 0.207 0.209 0.213 0.250 0.232 0.243 0.269 0.206 RMSEP 0.250 0.255 0.267 0.279 0.270 0.287 0.315 0.211 Simulasi h 2 2 2 2 2 3 2 3 r =0.90 2 R 0.928 0.926 0.925 0.921 0.918 0.923 0.895 0.966 2 R 0.926 0.925 0.923 0.919 0.915 0.919 0.892 0.962 s 0.276 0.278 0.281 0.289 0.295 0.289 0.333 0.270 RMSEP 0.377 0.385 0.354 0.325 0.340 0.355 0.376 0.273 Simulasi h 3 3 3 3 3 3 3 3 r =0.99 2 R 0.977 0.977 0.976 0.926 0.917 0.915 0.910 0.973 2 R 0.976 0.975 0.975 0.920 0.909 0.910 0.908 0.971 s 0.158 0.159 0.161 0.216 0.227 0.229 0.235 0.173 RMSEP 0.235 0.225 0.149 0.223 0.250 0.253 0.262 0.213 y-duga y 2 1 - 1 - 2 3 2 1 - 1 - 2 - 3 Var iab le y - d u g a 1 y - d u g a o p t y - d u g a 0.25 y - d u g a 0.5 P lot antara y dengan y-duga0.25, y-dugaRKT P , y-dugaRKU, y-dugaopt Gambar 7 Diagram pencar antara y dengan yˆ pada beberapa tingkat δ untuk data simulasi dengan koefisien korelasi 0.70 44 y-duga y 2 1 - 1 - 2 3 2 1 - 1 - 2 Var iab le y - d u g a 1 y - d u g a o p t y - d u g a 0.2 y - d u g a 0.5 P lot antara y dengan y-duga0.2, y-duga0.5, y-duga1, y-dugaopt Gambar 8 Diagram pencar antara y dengan yˆ pada beberapa tingkat δ untuk data simulasi dengan koefisien korelasi 0.80 y-duga y 2 1 - 1 - 2 - 3 3 2 1 - 1 - 2 - 3 Var iab le y - d u g a 1 y - d u g a o p t y - d u g a 0.2 y - d u g a 0.5 P lot antara y dengan y-duga0.2, y-duga0.5, y-duga1, y-dugaopt Gambar 9 Diagram pencar antara y dengan yˆ pada beberapa tingkat δ untuk data simulasi dengan koefisien korelasi 0.90 45 y-duga y 2 1 - 1 - 2 - 3 2 1 - 1 - 2 - 3 Var iab le y - d u g a 1 y - d u g a o p t y - d u g a 0.2 y - d u g a 0.5 P lot antara y dengan y-duga0.2, y-duga0.5, y-duga1, y-dugaopt Gambar 10 Diagram pencar antara y dengan yˆ pada beberapa tingkat δ untuk data simulasi dengan koefisien korelasi 0.99 Hasil analisis data simulasi yang disajikan pada Tabel 5 tampak bahwa pada 5 . = δ RKTP serta 1 = δ RKU menghasilkan RMSEP lebih besar dari pada metode RK. Untuk data simulasi dengan koefisien korelasi antar peubah bebas 0.70 model terbaiknya adalah metode RK pada 25 . = δ dengan menghasilkan RMSEP=0.328. Untuk data simulasi dengan koefisien korelasi 0.80 dan 0.90 model terbaiknya adalah metode RK pada pendekatan 2 dengan menghasilkan RMSEP berturut-turut 0.211 dan0.273. Sedangkan untuk data simulasi dengan koefisien korelasi antar peubah bebas 0.99 model terbaiknya adalah metode RK pada 3 . = δ dengan menghasilkan RMSEP=0.149. Hal ini ditunjang dengan Gambar 7 sampai Gambar 10 yang terlihat bahwa pada 5 . = δ RKTP serta 1 = δ RKU titik-titik yang ada relatif agak jauh ke garis 45 dibandingkan dengan hasil metode RK. Hasil simulasi data 1000 kali untuk berbagai struktur korelasi matriks peubah bebas X disajikan pada Gambar 11 sampai Gambar 14. Dari histogram RMSEP yang disajikan pada gambar-gambar tersebut dapat dilihat bahwa metode RK lebih unggul dibandingkan dengan metode RKTP maupun RKU. Pada Gambar 11 data simulasi dengan koefisien korelasi 0.70, metode RK memberikan RMSEP rata-rata yang paling kecil 0.329 dan histogram yang sempit yang berarti ragamnya paling kecil galat baku dari RMSEP=0.019. Hal yang sama juga terlihat pada Gambar 12 sampai Gambar 14. Pada Gambar 12 data simulasi dengan koefisien korelasi 0.80, metode RK memberikan RMSEP 46 rata-rata yang paling kecil 0.211 dan histogram yang sempit yang berarti ragamnya paling kecil galat baku dari RMSEP=0.026. Pada Gambar 13 data simulasi dengan koefisien korelasi 0.90, metode RK memberikan RMSEP rata- rata yang paling kecil 0.273 dan histogram yang sempit yang berarti ragamnya paling kecil galat baku dari RMSEP=0.027. Sedangkan pada Gambar 14 data simulasi dengan koefisien korelasi 0.99, metode RK memberikan RMSEP rata- rata yang paling kecil 0.149 dan histogram yang sempit yang berarti ragamnya paling kecil galat baku dari RMSEP=0.010. Jadi secara umum dapat dikatakan bahwa pada berbagai tingkat koefisien korelasi antar peubah bebas X, metode RK memberikan RMSEP dengan rata-rata yang paling kecil dengan ragam paling kecil. Kecilnya RMSEP berarti model semakin baik, sedangkan kecilnya ragam menyempitnya histogram menunjukkan pendugaan untuk RMSEP lebih stabil. Dari hasil kajian tersebut dapat ditarik kesimpulan bahwa metode RK memberikan ukuran kebaikan model yang paling baik dibandingkan dengan metode RKTP maupun RKU. Hal ini dapat diartikan bahwa kinerja regresi kontinum lebih baik dari pada RKU serta RKTP dalam mengatasi kolinearitas ganda pada berbagai sruktur korelasi matriks peubah bebas. RMSEP Fr e k u e n si 0.55 0.50 0.45 0.40 0.35 0.30 0.25 250 200 150 100 50 Variable RK RKTP RKU Histogram RMSEP hasil simulasi 1000 kali RK rata-rata = 0.329 st dev = 0.019 RKT P rata-rat a = 0.384 stdev = 0.035 RKU rat a-rata = 0.473 stdev = 0.036 Gambar 11 Histogram RMSEP hasil pendugaan metode RK, RKTP, serta RKU untuk data simulasi 1000 kali dengan tingkat koefisien korelasi 0.70 47 RMSEP F re k ue ns i 0.40 0.36 0.32 0.28 0.24 0.20 0.16 0.12 160 140 120 100 80 60 40 20 Variable RK RKTP RKU Histogram RMSEP hasil simulasi 1000 kali RK rata-rata = 0.211 stdev = 0.026 RKT P rata-rata = 0.279 st dev = 0.033 RKU rata-rata = 0.315 st dev = 0.037 Gambar 12 Histogram RMSEP hasil pendugaan metode RK, RKTP, serta RKU untuk data simulasi 1000 kali dengan tingkat koefisien korelasi 0.80 RMSEP Fr e k u e n si 0.50 0.45 0.40 0.35 0.30 0.25 0.20 160 140 120 100 80 60 40 20 Variable RK RKTP RKU Histogram RMSEP hasil simulasi 1000 kali RK rata-rata = 0.273 stdev = 0.027 RKT P rat a-rata = 0.325 stdev = 0.041 RKU rata-rata = 0.376 stdev = 0.045 Gambar 13 Histogram RMSEP hasil pendugaan metode RK, RKTP, serta RKU untuk data simulasi 1000 kali dengan tingkat koefisien korelasi 0.90 48 RMSEP F re kue n si 0.36 0.32 0.28 0.24 0.20 0.16 400 300 200 100 Variable RK RKTP RKU Histogram RMSEP hasil simulasi 1000 kali RK rata-rata = 0.149 stdev = 0.010 RKT P rat a-rata = 0.223 stdev = 0.016 RKU rat a-rata = 0.262 stdev = 0.024 Gambar 14 Histogram RMSEP hasil pendugaan metode RK, RKTP, serta RKU untuk data simulasi 1000 kali dengan tingkat koefisien korelasi 0.99 Regresi Kontinum dengan prapemrosesan Transformasi Wavelet Diskret Regresi Kontinum dengan prapemrosesan Transformasi Wavelet Diskret RK-TWD pada dasarnya adalah regresi kontinum antara peubah respon Y dengan peubah bebas D hasil TWD. Salah satu sifat matriks D hasil transformasi wavelet adalah tidak ada jaminan bahwa saling bebas. Sunaryo 2005 menunjukkan bahwa peubah baru hasil TWD masih mempunyai korelasi yang cukup tinggi walaupun nilainya lebih kecil dari pada korelasi antar peubah asal. Oleh karena itu pemodelan regresi antara peubah respon Y dengan peubah hasil TWD tidak dapat menggunakan RKT karena masih ada masalah kolinearitas ganda. Di sisi lain, hasil kajian Setiawan dan Notodiputro 2005a, 2005b RK mempunyai perilaku yang sangat baik untuk mengatasi kolinearitas ganda. Dengan demikian kombinasi antara RK dengan prapemrosesan TWD yang disebut metode RK-TWD sangat menjanjikan untuk mengatasi masalah ill conditioned serta singularitas. Tahapan-tahapan dalam RK-TWD dapat dijelaskan sebagai berikut : Tahap 1. Mendapatkan matriks D dengan menggunakan TWD. Secara umum TWD dapat ditulis sebagai : 49 ∑ ∑ − = − = + = 1 1 2 , , , M j k k j k j j t d t c t f ψ φ . 67 Koefisien c 0,0 disebut koefisien pemulusan atau bagian pendekatan dari suatu fungsi, sedang d j,k disebut koefisien wavelet atau juga disebut bagian detail suatu fungsi. Dengan mengambil nilai , t k j ψ dan t φ untuk berbagai t, maka persamaan 67 dapat dituliskan dengan notasi matriks, d x T B = 68 dan karena B ortonormal Percival 2005 maka x d B = 69 dimana T n d d d d c d , ... , , , , , 1 , 1 1 , 1 , , − = dan B adalah matriks yang elemen-elemen kolomnya adalah nilai dari t φ dan , t k j ψ untuk berbagai t [ ] 1 , ∈ . Matriks TWD, B adalah matriks ortogonal, untuk jenis apapun mother wavelet yang digunakan. Jika matriks T p p n x x x ] , ... , , [ 2 1 x = Χ dengan M q p 2 = = M=bilangan bulat positif maka TWD dapat ditulis : T pxp nxp nxp B X D = . 70 Karena dimensi dari B T sangat besar p , maka dipilih level-level resolusi tertentu sedemikian hingga banyaknya koefisien wavelet yang terpilih sebesar p dengan p n p − 1 akibatnya akan diperoleh T pxp nxp nxp B X D = 71 yang mereduksi pengamatan dari p titik tiap-tiap contoh menjadi p titik koefisien wavelet yang terpilih. Tahap 2. Langkah selanjutnya adalah meregresikan antara peubah respon 1 nx y terhadap peubah bebas nxp D dengan menggunakan metode regresi kontinum. ε β + = nxp y D . 72 Walaupun dimensi dari nxp D sudah kecil banyaknya peubah bebas lebih kecil dari banyaknya pengamatan, tetapi korelasi di antara koefisien-koefisien wavelet 50 masih tinggi Sunaryo 2005. Sehingga dari matriks peubah bebas nxp D dilakukan transformasi menjadi : h h W D T = 73 dengan h h w w w ,..., , 2 1 = W matriks berukuran h p x dengan ] 1 [ − n p h dan disebut matriks pembobot, sedangkan h T adalah matriks peubah baru berukuran nxh. Dengan demikian persamaan 72 dapat diubah menjadi sebagai berikut : ε ξ + = h y T 74 Karena pada matriks h T sudah tidak ada masalah singularitas dan ill conditioned, maka pendugaan parameter ξ pada persamaan 74 dapat dilakukan dengan menggunakan metode kuadrat terkecil yang diformulasikan sebagai berikut : y T h h T h h T T T 1 , ˆ − = δ ξ 75 h h h h h y , , , ˆ ˆ ˆ δ δ δ ξ ξ W D T = = 76 y T h h T h h h h h T T T W W 1 , , ˆ ˆ − = = δ δ ξ β . 77 Kajian empirik untuk metode RK-TWD dilakukan dengan data simulasi. Untuk mendapatkan matriks D digunakan perangkat lunak Wavethresh 3 Nason 1998. Sedangkan pengolahan data dengan RK digunakan perangkat lunak SAS Malpass 1996. Ringkasan ukuran kebaikan model hasil pendugaan RK, RKTP, RKU dengan metode prapemrosesan TWD disajikan pada Tabel 6. Sedangkan diagram pencar antara y dengan yˆ hasil pendugaan metode RK-TWD, RKU- TWD, RKTP-TWD disajikan pada Gambar 15 dan Gambar 16. 51 Tabel 6 Ringkasan ukuran kebaikan model hasil pendugaan RK, RKTP, RKU dengan metode prapemrosesan TWD Data Kriteria Pendekatan 1 δ ditentukan 0.15 0.2 0.3 0.5 RKTP- TWD 0.6 0.7 1 RKU- TWD Pendekatan 2 Simulasi h 2 3 4 4 4 5 4 4 n =20, p=128 2 R 0.929 0.942 0.941 0.883 0.848 0.828 0.575 0.909 2 R 0.926 0.934 0.929 0.861 0.808 0.783 0.495 0.884 s 0.281 0.264 0.274 0.384 0.382 0.422 0.734 0.352 RMSEP 0.451 0.285 0.385 0.397 0.390 0.450 0.750 0.426 Simulasi h 2 3 3 3 4 4 7 4 n =20, p=256 2 R 0.973 0.975 0.973 0.962 0.966 0.960 0.962 0.975 2 R 0.971 0.971 0.970 0.957 0.960 0.953 0.945 0.966 s 0.175 0.173 0.180 0.213 0.207 0.225 0.244 0.192 RMSEP 0.324 0.185 0.206 0.316 0.250 0.273 0.325 0.217 y- d u g a y 2 1 - 1 - 2 2 1 - 1 - 2 V a r ia b le y - d u g a 1 y - d u g a o p t y - d u g a 0 . 2 y - d u g a 0 . 5 P lo t a n ta r a y d e n ga n y -d u ga 0 . 2 , y - d u ga 0 . 5 , y - d u ga 1 , y - d u ga o p t Gambar 15 Diagram pencar antara y dengan yˆ hasil pendugaan metode RK-TWD, RKU-TWD, RKTP-TWD untuk data simulasi n=20, p= 128 y- d u g a y 2 1 - 1 - 2 - 3 2 1 - 1 - 2 - 3 V a r ia b le y - d u g a 1 y - d u g a o p t y - d u g a 0 . 2 y - d u g a 0 . 5 P lo t a n ta r a y d e n ga n y - d u ga 0 . 2 , y - d u ga 0 . 5 , y - d u ga 1 , y - d u ga o p t Gambar 16 Diagram pencar antara y dengan yˆ hasil pendugaan metode RK-TWD, RKU-TWD, RKTP-TWD untuk data simulasi n=20, p=256 52 Hasil pendugaan untuk data simulasi n=20, p=128 dengan mengambil 8 koefisien wavelet pada resolosi 0, 1, 2, serta 1 koefisien untuk fungsi skala, transformasi wavelet diskret memberikan hasil yang memuaskan. Hal ini dapat dilihat pada Tabel 5 yang tampak bahwa pada 2 . = δ RK-TWD menghasilkan RMSEP paling kecil 0.285 serta simpangan baku paling kecil s=0.281 dibandingkan dengan pada 5 . = δ RKTP-TWD serta pada 1 = δ RKU-TWD yang menghasilkan RMSEP dan s masing-masing 0.397, 0.384 serta 0.750 dan 0.734. Hal ini ditunjang dengan Gambar 14 yang terlihat bahwa pada 2 . = δ titik-titik yang ada lebih dekat ke garis 45 dari pada 5 . = δ serta 1 = δ . Untuk data simulasi n=20, p=256 hasil TWD terbaik pada 8 koefisein wavelet dengan resolusi 0, 1, 2 serta 1 koefisien fungsi skala. Pada Tabel 5 dapat dilihat bahwa pada 2 . = δ RK-TWD menghasilkan RMSEP paling kecil 0.185 serta simpangan baku paling kecil s=0.173 dibandingkan dengan pada 5 . = δ RKTP-TWD serta pada 1 = δ RKU-TWD. Pada RKTP-TWD diperoleh RMSEP 0.316, sedangkan pada RKU-TWD diperoleh RMSEP 0.325. Hal ini ditunjang dengan Gambar 15 yang terlihat bahwa pada 2 . = δ titik-titik yang ada lebih dekat ke garis 45 dari pada 5 . = δ RKTP-TWD serta 1 = δ RKU-TWD. Dari kajian empirik tersebut dapat ditunjukkan bahwa metode RK-TWD memberikan hasil yang lebih baik dari pada hasil RKU-TWD serta RKTP-TWD. Simpulan Dari hasil kajian teoritis maupun empirik, dapat disimpulkan beberapa hal sebagai berikut : a. Untuk mencari optimasi fungsi kriteria umum terdapat dua pendekatan, yaitu parameter penyesuaian ditentukan serta parameter penyesuaian dan matriks pembobot dicari serentak. Pada pendekatan pertama, karena parameter penyesuaian ditentukan secara manual, maka kriteria model terbaik dapat dilakukan dengan beberapa kriteria secara serentak, antara lain , , , , 2 2 2 pred R s R R serta RMSEP. Sedangkan pada pendekatan kedua, optimasi hanya dilakukan untuk mendapatkan model hubungan antara X dengan Y pada data yang dianalisis, tidak mempertimbangkan data validasi prediksi. 53 b. Dari hasil kajian empirik dengan data simulasi, metode RK sangat potensial untuk mengatasi kolinearitas ganda pada berbagai struktur korelasi matriks peubah bebas. Tetapi karena RK merupakan pengembangan dari RKT, maka beberapa asumsi yang melekat pada RKT masih tetap diperlukan. Asumsi-asumsi tersebut adalah Y merupakan peubah acak yang menyebar normal dengan ragam konstan, serta di antara y i dengan y j saling bebas ,..., 2 , 1 n j i = ≠ . Sedangkan asumsi kolinearitas ganda sudah tidak diperlukan. c. Kombinasi antara RK dengan TWD sebagai metode prapemrosesan menghasilkan metode RK-TWD yang mempunyai potensi sangat baik untuk mengatasi masalah ill conditioned dan singularitas. 4 SIFAT-SIFAT STATISTIK DARI REGRESI KONTINUM Abstrak Matriks pembobot W pada Regresi Kontinum diperoleh dengan memaksimumkan fungsi kriteria umum ternyata menimbulkan masalah dari aspek statistika. Prinsip dari fungsi kriteria umum adalah memaksimumkan koragam antara X dengan Y dan pada saat yang bersamaan juga memaksimumkan ragam dari X. Dengan demikian, pada matriks pembobot W mengandung peubah Y yang bersifat acak. Bila matriks W diasumsikan ditentukan fixed variable maka penduga koefisien regresi bersifat tak bias dengan ragam minimum, sedangkan untuk mendapatkan selang prediksi y digunakan aproksimasi. 112Kata kunci : fungsi kriteria umum, matriks pembobot, aproksimasi selang prediksi Abstract Weighted matrix W in the continuum regression obtained from maximizing the generalized criterion function has generated statistical problems. The principle of the generalized criterion function is to maximize covariance XY and variance of X. Therefore, Y variable in the weighted matrix W has random character. If the matrix W can be determined fixed variable, the estimator of regression parameters are unbiased with minimum variance and while the prediction interval of y can be used approximation. Keyword: generalized criterion function, weighted matrix, prediction interval approximation 55 Pendahuluan Regresi kuadrat terkecil parsial RKTP, regresi komponen utama RKU dan regresi kontinum RK dikembangkan dari model regresi linear ganda ε β + = X y dengan X adalah matriks peubah bebas berukuran nxp, y adalah vektor peubah respon berukuran nx1, β adalah parameter regresi berukuran px1, dan ε adalah vektor galat berukuran nx1. Sejumlah asumsi yang melekat pada metode kuadrat terkecil juga masih diperlukan. Prinsip yang membedakan ketiga metode tersebut terletak pada matriks pembobot W yang besarnya dicari dengan cara memaksimumkan fungsi kriteria umum. Matriks pembobot W dalam RK mengandung peubah Y yang bersifat acak, sehingga untuk mencari sifat-sifat statistik dari hasil dugaan RK sulit dilakukan secara analitik. Penelitian ini bertujuan untuk mengkaji sifat-sifat statistik dari RK, khususnya sifat-sifat dari hasil pendugaan RK, dan menerapkannya pada data simulasi. Bab ini merupakan pengembangan dari artikel yang ditulis Setiawan dan Notodiputro 2006b. Metode Metode yang digunakan dalam penelitian ini mencakup kajian teoritis dan empirik. Untuk mendapatkan formula sifat-sifat statistik dari RK digunakan kajian teoritis, selanjutnya formula tersebut diterapkan untuk kajian empirik dengan menggunakan data hasil simulasi. Tahapan simulasi disajikan pada Lampiran 1. Analisis data dengan menggunakan metode RK-TWD terbagi dalam dua tahap yaitu membangun model dan validasi model. Tahap 1 Membangun model dengan langkah-langkah sebagai berikut : a. Data hasil simulasi berupa matriks peubah bebas X berukuran nxp ,... 2 , 1 ; 2 = = = M q p M yang merupakan syarat dalam TWD, pada kajian ini 30x32, dan peubah respon y berukuran nx1 30x1 dibagi menjadi dua kelompok secara acak, kelompok pertama 1 n 25 pengamatan digunakan untuk membangun model dan kelompok kedua 2 n 5 pengamatan untuk validasi model. 56 b. Dapatkan matriks TWD B berukuran pxp. c. Dapatkan matriks D dengan rumus T pxp xp n xp n 1 1 B X D = , kemudian pilih level-level resolusi tertentu sedemikian hingga banyaknya koefisien wavelet yang terpilih sebesar p dengan p n p − 1 1 . Selanjutnya diperoleh T pxp xp n xp n 1 1 B X D = yang mereduksi pengamatan dari p titik tiap-tiap contoh menjadi p titik koefisien wavelet yang terpilih. Dalam software wavetresh 3 Nason 1998 terdapat 10 level mother wavelet Daubechies D-1 sampai D-10 sehingga akan diperoleh 10 matriks D berukuran . x 1 p n d. Meregresikan peubah respon 1 1 x n y terhadap matriks peubah bebas 1 xp n D D-1 sampai D-10 dengan menggunakan metode regresi kontinum. Sedangkan dalam mencari matriks pembobot digunakan dua pendekatan yaitu pendekatan 1 dan pendekatan 2. Pada pendekatan 1, langkah ini diulang pada δ tertentu yang terletak antara 1 ≤ ≤ δ sampai mendapatkan model terbaik, sehingga mendapatkan model : ε β + = D y . Karena pada matriks D masih terdapat masalah kolinearitas ganda, maka dilakukan transformasi h h W D T = sehingga model menjadi ε ξ + = h y T . Selanjutnya dilakukan pendugaan parameter regresi dengan metode kuadrat terkecil sebagai berikut : y T h h T h h T T T 1 , ˆ − = δ ξ β ξ ξ δ δ ˆ ˆ ˆ ˆ , , D W D T = = = h h h y Tahap 2 Validasi model dengan langkah-langkah sebagai berikut : a. Melakukan prediksi nilai y pada kelompok data validasi dengan menggunakan model yang dihasilkan pada tahap 1, dengan langkah- langkah sebagai berikut : • Perkalian antara vektor pengamatan ke-i T i x berukuran 1xp dengan matriks transformasi wavelet B sehingga diperoleh vektor T i d dengan rumus T pxp T i T i x d B = . 57 • Selanjutnya dapatkan W T i T i d t = . • Memprediksi nilai y dengan rumus : β ξ ξ ˆ ˆ ˆ ˆ T i T i T i i predik i d d t y y = = = = W ; 2 ,..., 2 , 1 n i = . b. Selanjutnya dilakukan validasi model dengan kriteria : • RMSEP yang merupakan salah satu ukuran kebaikan hasil prediksi • koefisien determinasi hasil prediksi 2 predik R • sifat-sifat statistik dari hasil dugaan regresi kontinum. Untuk mengevalusi kinerja RK-TWD ada beberapa kriteria yang dibandingkan, antara lain : 2 2 2 , , , predik R s R R , RMSEP, plot antara y dengan yˆ , plot antara y dengan predik y , serta lebar selang prediksi. Model dikatakan lebih baik jika 2 2 2 , , predik R R R lebih tinggi, s dan RMSEP lebih kecil, hasil pengepasan lebih dekat ke garis lurus dengan gradien 45 melalui pusat, serta lebar selang prediksi yang sempit. Sifat-sifat Statistik dari Regresi Kontinum Sifat-sifat statistik yang dikaji meliputi : bias, ragam dari penduga parameter regresi dan prediksi, serta selang prediksi. Ketakbiasan dalam Pendugaan Parameter Model umum regresi ganda ε β + = Χ y . Karena pada matriks X terdapat masalah singularitas dan atau ill conditioned, maka dilakukan transformasi peubah dengan formula sebagai berikut : h h XW T = dan h h w w w ,..., , 2 1 = W matriks berukuran pxh dengan } 1 { − n p h dan disebut matriks pembobot, T h adalah matriks peubah baru berukuran nxh. Dengan demikian model dapat diubah menjadi ε ξ + = h y T . Karena pada matriks h T sudah tidak ada masalah singularitas atau ill conditioned, maka pendugaan parameter ξ dapat dilakukan dengan menggunakan metode kuadrat terkecil yang diformulasikan sebagai berikut : y T h h T h h T T T 1 , ˆ − = δ ξ . 78 58 Nilia harapan dari ξˆ dengan syarat W ditentukan fixed variable adalah : [ ] W T T T W ˆ 1 , y E E T h h T h h − = ⎥⎦ ⎤ ⎢⎣ ⎡ δ ξ = ] [ 1 W T T T T ε ξ + − h T h h T h E ξ = + ] [ 1 W T T T ε T h h T h E − = ξ + ] [ 1 W X W XW X W ε T T h h T T h E − ξ = + ] [ 1 ε E T T h h T T h X W XW X W − = ξ . 79 Jadi h , ˆ δ ξ merupakan penduga takbias bagi ξ bila matriks W bersifat fixed variable bukan peubah acak. Prisnsip dari matriks pembobot W pada RK sama dengan peranan matriks pembobot pada regresi kuadrat terkecil tertimbang weighted least squares. Pada regresi kuadrat terkecil tertimbang, bila matriks pembobot diketahui fixed variable , maka penduga yang dihasilkan bersifat takbias dengan ragam minimum. Dalam prakteknya hal tersebut sulit dipenuhi, sehingga matriks pembobot diperoleh dari hasil pendugaan. Pada keadaan ini harus hati-hati, karena bagaimanapun penggunaan penduga sebagai pengganti tidak mungkin sesuai jika didasarkan pada informasi yang terbatas Myers 1990. Logika inilah yang digunakan untuk mempelajari sifat-sifat statistik dari RK, khususnya dalam menyikapi matriks pembobot W. Ragam dan Simpangan Baku untuk h , ˆ δ ξ Untuk mendapatkan ragam dari ξˆ dengan syarat W diketahui digunakan formula sebagai berikut : ] [ ˆ 1 , W T T W y Var Var T h h T h h − = δ ξ = ] [ 1 W X W XW X W y Var T T h h T T h − = 1 1 − − h T T h h T T h h T T h y Var XW X W XW X W XW X W = 2 1 σ − h T T h XW X W . 80 59 Pendugaan y untuk data rata-rata Salah satu tujuan dari pemodelan adalah menduga meramal nilai peubah respon Y berdasarkan nilai peubah bebas X yang dimiliki. Misalkan terdapat nilai pengamatan x untuk menduga nilai y digunakan formula sebagai berikut : h h T h T x t y , , ˆ ˆ ˆ δ δ ξ ξ W = = . 81 Sedangkan untuk mencari ragam dan simpangan baku digunakan formula : W W ˆ ˆ , h T t Var y Var δ ξ = = W W ˆ , h h T x Var δ ξ = ˆ x Var x T h h T W W W ξ Sedangkan untuk simpangan baku digunakan formula : ˆ ˆ y Var y s = . 82 Prediksi nilai y untuk Pengamatan Baru Untuk memprediksi nilai peubah respon pengamatan baru digunakan formula sebagai berikut : h T i h T i i i predik x t y y , , ˆ ˆ ˆ δ δ ξ ξ W = = = . 83 Untuk mendapatkan selang prediksi dari y digunakan formula : xRMSEP 2 ˆ xSEP 2 ˆ ± ≈ ± i i y y 84 yang merupakan aproksimasi selang prediksi 95. Regresi Kontinum dengan prapemrosesan transformasi wavelet diskret RK-TWD pada dasarnya adalah regresi kontinum terhadap koefisien wavelet. Sehingga matriks peubah bebas X pada regresi kontinum diganti dengan matriks koefisien wavelet D . Dengan demikian sifat-sifat statistik dari RK-TWD sama dengan pada RK dengan mengganti matriks peubah bebas X dengan matriks koefisien wavelet D . 60 Hasil Simulasi Pemodelan antara peubah respon Y terhadap matriks koefisien wavelet diskret D dilakukan dengan menggunakan data kelompok-1. Model terbaik terbentuk dengan mengambil 16 koefisien wavelet pada resolusi 0, 1, 2, 3 serta 1 koefisien untuk fungsi skala untuk mother wavelet Daubechies-10. Ringkasan ukuran kebaikan model disajikan pada Tabel 7. Tabel 7 Ringkasan ukuran kebaikan model δ h 2 R 2 R s 2 predik R RMSEP Pendekatan-1 0.125 2 0.9321 0.9291 0.0709 0.968 0.0443 0.200 2 0.9268 0.9255 0.0727 0.945 0.0589 0.250 2 0.9268 0.9255 0.0727 0.957 0.0534 0.300 2 0.9268 0.9237 0.0736 0.955 0.0555 0.450 2 0.9176 0.9140 0.0781 0.953 0.0602 RKTP 0.500 2 0.9122 0.9084 0.0806 0.953 0.0617 RKU 1.000 2 0.8935 0.8888 0.0888 0.883 0.0831 Pendekatan-2 3 0.9245 0.9176 0.0760 0.944 0.0598 Dari Tabel 7 tersebut dapat dilihat bahwa model terbaiknya adalah hasil metode RK pada 125 . = δ , karena pada kondisi tersebut diperoleh 2 2 , predik R R serta RMSEP terbaik. Selanjutnya model yang dianalisis adalah model RK pada 125 . = δ . Tabel 8 menyajikan dugaan dari y serta ragam dari yˆ , sedangkan Tabel 9 menyajikan prediksi dan selang prediksi untuk y yang diperoleh dari aproksimasi. Dari Tabel 8 dapat dilihat bahwa selang prediksi untuk y relative sempit dan semua nilai y μ maupun nilai pengamatan y berada dalam selang prediksi. 61 Tabel 8 Nilai dugaan y untuk data kelompok 1 asli y y = μ y yˆ ˆ y s 0.94064 1.09311 1.0397 0.0106210 1.12288 1.34589 1.3043 0.0130583 1.31909 1.48550 1.413 0.0208842 0.81541 0.81581 0.8542 0.0131145 0.93446 0.90300 0.8777 0.0122812 1.01848 0.99009 1.0516 0.0107356 0.57549 0.57864 0.5728 0.0098598 0.92242 0.88554 0.9605 0.0291648 0.90469 0.90095 0.8156 0.0329777 1.23650 1.11228 1.2538 0.0138891 1.34353 1.27481 1.3099 0.0197314 0.77198 0.81608 0.8602 0.0166272 1.01421 1.06923 1.0539 0.0111853 0.97891 1.03137 1.0817 0.0183996 1.05472 1.09139 1.1330 0.0157096 0.98066 1.07211 1.0279 0.0257986 0.62839 0.70565 0.6915 0.0139662 0.47088 0.47593 0.5652 0.0462254 1.23178 1.05922 1.1309 0.0354258 1.13605 1.41614 1.2807 0.0130686 1.17056 1.27384 1.2271 0.0428627 0.90895 0.89968 0.7905 0.0139753 1.45847 1.47027 1.5342 0.0283029 1.28500 1.28511 1.2684 0.0118321 0.93130 1.01107 0.9642 0.0132541 Tabel 9 Hasil prediksi nilai y untuk data kelompok validasi Selang prediksi 95 asli y y = μ y predik y Batas bawah Batas atas Lebar selang 0.98135 1.17228 1.09616 1.00756 1.18476 0.1772 1.29393 1.29776 1.30266 1.21406 1.39126 0.1772 0.60471 0.64659 0.65368 0.56508 0.74228 0.1772 1.25904 1.24146 1.19549 1.10689 1.28409 0.1772 1.15720 1.18232 1.22551 1.13691 1.31411 0.1772 62 Simpulan Pada RK dengan model ε β + = Χ y kemudian dilakukan transformasi peubah baru h h XW T = sehingga model menjadi ε ξ + = h y T . ξˆ merupakan penduga takbias bagi ξ dan mempunyai ragam minimum bila W diasumsikan diketahui fixed variable. Sedangkan untuk mendapatkan selang prediksi y digunakan aproksimasi. RK-TWD pada dasarnya merupakan kombinasi antara RK dengan TWD, oleh karena itu sifat-sifat statistik pada RK juga berlaku pada RK- TWD. Dari formula yang digunakan untuk mencari selang prediksi y, ternyata secara empirik didapatkan lebar selang yang relatif sempit. Sehingga dapat disimpulkan bahwa pendugaan dengan metode RK-TWD akan diperoleh model dengan tingkat akurasi yang tinggi 5 PENERAPAN REGRESI KONTINUM PADA MODEL KALIBRASI UNTUK DATA KADAR SENYAWA AKTIF TEMULAWAK DAN JAHE Abstrak Metode regresi kontinum dengan prapemrosesan transformasi wavelet diskret RK-TWD merupakan pendekatan yang sangat baik untuk mengatasi masalah ill conditioned maupun singularitas. Aplikasi pendekatan RK-TWD pada model kalibrasi gingerol dan kurkuminoid memberikan hasil root mean squares error of prediction RMSEP 0.0453 dan 0.0867. Nilai ini lebih kecil dibandingkan dengan hasil pendekatan RKU-TWD maupun RKTP-TWD. Model kalibrasi gingerolkurkuminoid dapat digunakan untuk memprediksi kadar gingerolkurkuminoid suatu serbuk jahetemulawak bila diketahui spektrum hasil FTIR. Kata kunci : RK-TWD, RMSEP. Abstract Continuum regression method with discrete wavelet transformation CR- DWT is a very good approach to overcome the ill conditioned and singularity problems. The application of CR-DWT approach on gingerol and curcuminoid calibration model has produced root mean squares error of prediction RMSEP of 0.0453 and 0.0867. These results have smaller values than that of PCR-DWT and PLSR-DWT approaches. Gingerolcurcuminoid calibration models can predict the content of gingerolcurcuminoid of gingertemulawak if the results of FTIR are known. Key word: CR-DWT, RMSEP 64 Pendahuluan Kajian tentang metode regresi kontinum dengan prapemrosesan transformasi wavelet diskret RK-TWD sudah dibahas pada bab-bab terdahulu. Dari hasil kajian tersebut dapat disimpulkan bahwa metode RK-TWD merupakan pendekatan yang sangat baik untuk mengatasi masalah ill conditioned akibat adanya kolinearitas ganda serta masalah singularitas akibat . p n Dua masalah tersebut sering terjadi pada model kalibrasi Naes 1985. Pada bab ini akan dibahas pengembangan model kalibrasi pada kasus tanaman obat jahe dan temulawak dengan menggunakan metode RK-TWD yang merupakan pengembangan dari artikel yang telah ditulis oleh Setiawan dan Notodiputro 2006a, 2007a. Model kalibrasi yang diperoleh diharapkan dapat digunakan untuk memprediksi kadar senyawa aktif pada rimpang jahe gingerol serta rimpang temulawak kurkuminoid berdasarkan data spektrum persen transmitans yang dihasilkan dari pengukuran FTIR dengan tingkat ketepatan yang tinggi. Dengan diperolehnya model kalibrasi yang akurat akan menghemat waktu dan biaya, karena untuk dapat menentukan kandungan senyawa aktif dapat dilakukan melalui contoh secara sederhana dan cepat. Selain itu penentuan ini dapat dilakukan berdasarkan serbuk kasar sehingga tidak perlu proses yang panjang. Dengan demikian tujuan dari penelitian ini adalah mendapatkan model kalibrasi kadar senyawa aktif pada temulawak dan jahe. Metode Ada dua model kalibrasi yang akan dikembangkan, yaitu model kalibrasi kadar senyawa aktif rimpang jahe gingerol serta kadar senyawa aktif rimpang temulawak kurkuminoid. Contoh rimpang jahe dan temulawak yang digunakan dalam penelitian ini diambil secara acak dari tiga sumber, yaitu : a petani di sentra produksi tanaman obat di daerah Kulonprogo Jawa Tengah dan Karanganyar DIY, b hasil percobaan di kebun percobaan Biofarmaka IPB Bogor, serta c pembelian dari BALITRO, Bogor, Majalengka dan Sukabumi. Selanjutnya rimpang jahe dan temulawak tersebut dilakukan analisis kimia di Laboratorium Kimia Analitik Juruan Kimia IPB, Laboratorium Terpadu IPB, dan Laboratorium Pusat Studi Biofarmaka LPPM-IPB. 65 Pada penelitian ini banyaknya pengamatan ukuran contoh adalah 20 rimpang jahe yang diukur kandungan gingerol serta 40 rimpang temulawak yang diukur kandungan kurkuminoid melalui metode HPLC selanjutnya disebut peubah respon Y. Selain itu, dengan metode FTIR dihasilkan spektrum infrared, selanjutnya melalui proses diskretisasi diperoleh data persen transmitans yang diamati 1866 titik, pada bilangan gelombang 4000–400 cm -1 yang mencerminkan kadar gingerolkurkuminoid, selanjutnya disebut peubah bebas X. Spektrometer infrared yang digunakan adalah Spektrometer infrared IRP restige-21FTIR-8400s, Shimadzu Fourier Transform Infrared Spektrophotometer dengan spesifikasi resolusi: 4 cm -1 , pada kisaran bilangan gelombang 4000– 400 cm -1 dan scan : 10, sehingga dihasilkan persen transmitans dari 1866 titik bilangan gelombang untuk setiap contoh. Proses diskretisasi untuk mendapatkan titik sebanyak 1866 berdasarkan jarak antar titik yang sama 1.92869 cm -1 di sepanjang kisaran bilangan gelombang 4000-400 cm -1 . Pertimbangannya semata- mata agar mudah sederhana, dengan memperhatikan kemampuan alat serta daerah identifikasi dan daerah sidik jari. Penyajian grafik spektrum infrared grafik hubungan persen transmitans dan bilangan gelombang disesuaikan dengan spektrum aslinya, dimana sumbu vertikal untuk persen transmitans dan sumbu horizontal untuk bilangan gelombang. Perlakuan analisis dilakukan pada serbuk dan ekstrak etanol untuk masing- masing contoh dengan dua ulangan. Secara umum spektrum FTIR dari serbuk jahe dan ekstrak etanol 70 dikarakterisasi, pita serapan pada daerah 4000-3200 cm -1 memperlihatkan adanya gugus rentangan O-H, puncak 3000-2800 cm -1 rentangan C-H asimetri aromatik dan alifatik pada ekstrak mengalami pembelahan puncak sedangkan serbuk hanya terbentuk satu puncak diduga terjadi tumpang tindih senyawa penyususun. Pita serapan keton terbentuk pada daerah serapan 1725-1705 cm -1 , pita serapan 1625-1450 cm -1 merupakan rentangan C=C aromatik atau rentangan C=C cm -1 senyawa olefinik alkana. Daerah serapan 1310-1210 cm -1 dan 1050-1010 cm -1 adalah ikatan R-O-Ar eter aromatik. Pita serapan 900-670 cm -1 merupakan pita serapan C-H bidang luar. Salah satu syarat dalam TWD adalah jumlah titik harus 2 M M bilangan bulat positif. Oleh karena jumlah titik hasil pengamatan adalah 1866, maka hanya 66 diambil 1024 titik M=10 dengan memperhatikan daerah identifikasi spektrum infrared gingerolkurkuminoid yang memberikan informasi. Pemilihan dari 1866 titik menjadi 1024 titik berarti terdapat 842 titik yang dibuang tidak digunakan. Pada spektrum infrared gingerol, titik-titik yang dibuang terletak pada daerah kisaran bilangan gelombang 4000-2000 cm -1 dengan rincian : a pada kisaran bilangan gelombang 4000-3555 cm -1 terdapat 230 titik, b pada kisaran bilangan gelombang 3227-2940 cm -1 terdapat 150 titik, serta c pada kisaran bilangan gelombang 2915-2025 cm -1 sebanyak 462 titik lihat Gambar 16 dan 17. Jika diperhatikan daerah identifikasi pada Tabel 2, maka terlihat bahwa pada kisaran bilangan gelombang tersebut tidak ada ikatan kimia yang mencirikan gingerol. Pada spektrum infrared kurkuminoid, titik-titik yang dibuang sebanyak 842 dengan rincian : a pada kisaran bilangan gelombang 4000-3670 cm -1 terdapat 170 titik, b pada kisaran bilangan gelombang 3285-3020 cm -1 sebanyak132 titik, c pada kisaran bilangan gelombang 2793-1945 cm -1 sebanyak 440 titik, serta d pada kisaran bilangan gelombang 591-400 cm -1 terdapat 100 titik lihat Gambar 21 dan 22. Jika diperhatikan daerah identifikasi pada Tabel 3, maka terlihat bahwa pada kisaran bilangan gelombang tersebut tidak ada ikatan kimia yang mencirikan kurkuminoid. Dari 1024 titik yang terpilih dilakukan transformasi wavelet diskret dengan melihat berbagai kemungkinan resolusi yang menghasilkan koefisien-koefisien wavelet yang jumlahnya lebih kecil dari pada ukuran contoh, serta berbagai fungsi mother wavelet keluarga Daubechies. Alasan pemilihan mother wavelet keluarga Daubechies karena sering dipakai dalam aplikasi dan memberikan hasil pemodelan yang baik Sunaryo 2005. Ada dugaan bahwa lama penyimpanan berpengaruh terhadap kadar senyawa aktif gingerol Erfiani 2005; Sunaryo 2005. Oleh karena itu untuk mencari model terbaik, lama penyimpanan dilibatkan dalam membangun model sebagai peubah dummy pada penelitian ini 3 bulan dan 10 bulan. Analisis data dengan menggunakan metode RK-TWD terbagi dalam dua tahap yaitu membangun model kalibrasi dan validasi model. 67 Tahap 1 Membangun model kalibrasi dengan langkah-langkah sebagai berikut : a. Mencari matriks koefisien wavelet • Matriks X nxp hasil diskretisasi dari spektrum infrared gingerol kurkuminoid merupakan peubah bebas, sedangkan peubah respon 1 nx y adalah kadar senyawa aktif serbuk jahetemulawak dari hasil pengukuran HPLC. Data dibagi dalam dua kelompok, yaitu : kelompok-1 sebanyak 1 n data untuk membangun model, dan kelompok-2 sebanyak 2 n data untuk validasi. • Dapatkan matriks TWD B dengan melibatkan 1024 titik M=10 yang ditentukan berdasarkan mother wavelet. Perhitungan matriks wavelet pada penelitian ini menggunakan software wavetresh Nason 1998. • Dapatkan matriks koefisien wavelet D dengan rumus T pxp xp n xp n 1 1 B X D = kemudian pilih level-level resolusi tertentu sedemikian hingga banyaknya koefisien wavelet yang terpilih sebesar p dengan p n p − 1 1 . Selanjutnya diperoleh T pxp xp n xp n 1 1 B X D = yang mereduksi pengamatan dari p titik tiap-tiap contoh menjadi p titik koefisien wavelet yang terpilih. Dalam software wavetresh 3 Nason 1998 terdapat 10 level mother wavelet Daubechies D-1 sampai D-10 sehingga akan diperoleh 10 matriks . D b. Meregresikan peubah respon 1 1 x n y terhadap matriks peubah bebas 1 xp n D D-1 sampai D-10 dengan menggunakan metode regresi kontinum. Sedangkan untuk mencari matriks pembobot digunakan dua pendekatan yaitu pendekatan 1 dan pendekatan 2. Pada pendekatan 1, langkah ini diulang pada δ tertentu yang terletak antara 1 ≤ ≤ δ sampai mendapatkan model terbaik yang menggambarkan hubungan ε β + = D y . Karena pada matriks D masih terdapat masalah kolinearitas ganda, maka dilakukan transformasi h h W D T = sehingga model menjadi ε ξ + = h y T . Selanjutnya dilakukan pendugaan parameter regresi dengan metode kuadrat terkecil sebagai berikut : 68 y T h h T h h T T T 1 , ˆ − = δ ξ β ξ ξ δ δ ˆ ˆ ˆ ˆ , , D W D T = = = h h h y Tahap 2 Validasi model dengan langkah-langkah sebagai berikut : c. Melakukan prediksi nilai y pada kelompok data validasi dengan menggunakan model yang dihasilkan pada tahap 1, dengan langkah- langkah sebagai berikut : • Perkalian antara vektor pengamatan ke-i T i x berukuran 1xp dengan matriks transformasi wavelet B sehingga diperoleh vektor T i d dengan rumus T pxp T i T i x d B = . • Selanjutnya dapatkan W T i T i d t = . • Memprediksi nilai y dengan rumus : β ξ ξ ˆ ˆ ˆ ˆ T i T i T i i predik i d d t y y = = = = W ; 2 ,..., 2 , 1 n i = . d. Selanjutnya dilakukan validasi model dengan kriteria RMSEP, koefisien determinasi hasil prediksi 2 predik R , serta sifat-sifat statistik dari hasil dugaan regresi kontinum. Untuk mengevalusi kinerja RK-TWD ada beberapa kriteria yang dibandingkan, antara lain : , , , , 2 2 2 predik R s R R RMSEP, plot antara y dengan yˆ , plot antara y dengan predik y , serta lebar selang prediksi. Model dikatakan lebih baik jika 2 2 2 , , predik R R R lebih tinggi, s dan RMSEP lebih kecil, hasil pengepasan lebih dekat ke garis lurus dengan gradien 45 melalui pusat, serta lebar selang prediksi yang sempit. Hasil dan Pembahasan Pada penelitian ini dihasikan dua model kalibrasi, yaitu model kalibrasi kadar gingerol dan model kalibrasi kadar kurkuminoid. Untuk mencari model terbaik, pada masing-masing model digunakan dua pendekatan dalam mencari 69 optimasi GCF, yaitu : 1 parameter penyesuaian ditentukan, serta 2 mencari optimasi parameter penyesuaian dan matriks pembobot secara serentak. Model Kalibrasi Kadar Gingerol Hasil pengukuran dengan FTIR diperoleh data persen transmitans serbuk jahe untuk 20 contoh pada 1866 titik seperti terlihat pada Gambar 17. Selanjutnya dipilih 1024 titik untuk setiap pengamatan. Hal ini untuk memenuhi persyaratan pada TWD yang memerlukan M 2 M=10 dan spektrumnya disajikan pada Gambar 18. B ilangan gelo mbang cm -1 T ran sm it an s 40 00 30 00 2 00 0 10 00 0. 9 0. 8 0. 7 0. 6 0. 5 0. 4 0. 3 0. 2 0. 1 0. 0 Spektrum infrared gingerol pada 1866 titik Gambar 17 Spektrum infrared gingerol untuk 20 contoh serbuk jahe pada 1866 titik Gambar 18 Spektrum infrared gingerol untuk 20 contoh serbuk jahe pada 1024 titik B ila n g a n g e lo m b a n g c m -1 T ra n sm it an s 4 0 0 0 3 0 0 0 2 0 0 0 1 0 0 0 0 . 9 0 . 8 0 . 7 0 . 6 0 . 5 0 . 4 0 . 3 0 . 2 0 . 1 0 . 0 S p e k tru m in fra re d gin ge ro l p a d a 1 0 2 4 titik 70 Dari Gambar 17 dan Gambar 18 tersebut terlihat bahwa spektrum tersebut seirama hampir sejajar. Akibatnya, proses diskretisasi spektrum infrared yang menghasilkan 1024 titik dan digunakan untuk mendapatkan peubah bebas X 1 sampai X 1024 sebagai penyusun matriks X, akan timbul masalah kolinearitas ganda karena terjadinya korelasi yang tinggi diantara X 1 sampai X 1024 . Selain itu dengan banyaknya jumlah titik yang dihasilkan 1024 berakibat banyaknya peubah bebas jauh lebih besar dibandingkan dengan banyaknya pengamatan. Oleh karena itu perlu dilakukan pemampatan data dengan menggunakan TWD sehingga diperoleh matriks koefisien transformasi wavelet D . Model kalibrasi dibangun dengan menggunakan 16 data. Dari hasil analisis data disimpulkan bahwa model terbaik untuk prediksi kadar gingerol dibangun dengan menggunakan 11 koefisien wavelet untuk mother wavelet Daubechies-10 pada resolusi 0, 1 dan 3 serta 1 koefisien fungsi skala hasil transformasi wavelet diskret. Hal ini karena pada kondisi ini diperoleh hasil yang perilakunya relatif lebih baik dibandingkan dengan yang lainnya, artinya dapat menangkap ukuran- ukuran kebaikan model seperti R 2 dan 2 R yang relatif lebih baik. Dari hasil pengolahan data ternyata vektor-vektor yang membentuk matriks D masih mempunyai korelasi yang tinggi, sehingga jika diregresikan antara peubah respon Y dengan D timbul masalah kolinearitas ganda. Untuk mengatasi permasalahan tersebut digunakan metode RK. Ringkasan hasil pengolahan metode RK-TWD dengan perangkat lunak SAS untuk pendekatan 1 dan 2 disajikan pada Tabel 10. Sedangkan Gambar 19 menyajikan diagram pencar antara δ dengan RMSEP , , 2 2 predik R R . 71 Tabel 10 Ringkasan ukuran kebaikan model kadar gingerol δ h 2 R 2 R s 2 predik R RMSEP Pendekatan 1 0 1 0.9975 0.9875 0.0450 0.986 0.06518 0.10 3 0.9973 0.9968 0.0193 0.978 0.06544 0.15 4 0.9975 0.9969 0.0192 0.985 0.06503 0.20 5 0.9975 0.9965 0.0203 0.985 0.06383 0.25 5 0.9967 0.9954 0.0233 0.976 0.06185 0.30 5 0.9918 0.9888 0.0364 0.982 0.08152 0.35 3 0.9425 0.9337 0.0882 0.950 0.21539 0.40 3 0.9339 0.9237 0.0945 0.953 0.21996 0.45 5 0.9794 0.9719 0.0578 0.992 0.04527 0.50 5 0.9769 0.9685 0.0612 0.988 0.05734 0.55 5 0.9757 0.9669 0.0628 0.991 0.05399 0.60 4 0.9511 0.9389 0.0849 0.934 0.20546 0.65 4 0.9490 0.9362 0.0868 0.935 0.20904 0.70 4 0.9465 0.9331 0.0889 0.936 0.21281 0.75 4 0.9436 0.9295 0.0912 0.937 0.21655 0.80 4 0.9403 0.9254 0.0938 0.939 0.22032 0.85 4 0.9366 0.9207 0.0967 0.941 0.22403 0.90 3 0.8823 0.8723 0.1223 0.947 0.22397 0.95 3 0.8865 0.8690 0.1239 0.946 0.22372 1.00 3 0.8830 0.8659 0.1253 0.945 0.22372 Pendekatan 2 δ = 0.33, 0.33, 0.32, 0.32, 0.31 5 0.9712 0.9608 0.0683 0.987 0.08790 δ y- d at a 1 . 0 0 . 8 0 . 6 0 . 4 0 . 2 0 . 0 1 . 0 0 . 8 0 . 6 0 . 4 0 . 2 0 . 0 V a r ia b le RM S E P R- 2 R- 2 p r e d P lo t a n t a ra d e lt a d e n g a n R -2 , R -2 p re d ik , R M S E P R MS E P R -2 R -2 p re d ik Gambar 19 Diagram pencar antara δ dengan RMSEP , , 2 2 predik R R model kadar gingerol 72 y-duga0.45 dan y-duga0.5 y 1.75 1.50 1.25 1.00 0.75 0.50 1.75 1.50 1.25 1.00 0.75 0.50 Var iab le alp h a 0.45 alp h a 0.5 Plot antara y dengan y-duga pada delta0.45, delta0.5 Gambar 20 Diagram pencar antara y dengan 45 . ˆ = δ y serta 5 . ˆ = δ y kadar Gingerol Dari Tabel 10 dan Gambar 19 dapat dilihat bahwa hasil metode RK pada 45 . = δ diperoleh nilai kebaikan model yang terbaik, dengan 9794 . 2 = R , 992 . 2 = predik R serta RMSEP=0.04527. Hasil ini lebih baik dari pada metode RKTP-TWD 5 . = δ , RKU-TWD 1 = δ maupun pendekatan 2. RKTP-TWD menghasilkan 9768 . 2 = R , 988 . 2 = predik R serta RMSEP=0.05734, sedangkan RKU-TWD menghasilkan 8830 . 2 = R , 945 . 2 = predik R serta RMSEP=0.2237. Pada pendekatan 2 0.31 0.32, 0.32, 0.33, , 33 . = δ menghasilkan 9712 . 2 = R , 987 . 2 = predik R dan RMSEP=0.0879. Hal ini diperkuat dengan Gambar 20 yang menunjukkan bahwa titik-titik hasil pendugaan dengan metode RK-TWD 45 . = δ diperoleh titik-titik yang lebih dekat dengan garis lurus melalui pusat koordinat dan bersudut 45 o . Hal yang sama juga dapat dilihat pada Gambar 17, hasil prediksi dengan metode RK-TWD lebih dekat ke garis 45 o . Sehingga dapat dikatakan bahwa model untuk prediksi data eksternal data yang tidak dilibatkan dalam pemodelan cukup memuaskan. Dengan demikian model kalibrasi kadar senyawa gingerol adalah model RK dengan . 45 . = δ Model tersebut merupakan hubungan antara peubah respon Y kadar gingerol dengan peubah bebas D koefisien wavelet. Selanjutnya dari model ini digunakan untuk memprediksi kadar gingerol jika diketahui data persen transmitans dari hasil pengukuran FTIR X. 73 Tabel 11 berikut menyajikan hasil dugaan titik kadar gingerol untuk data kelompok 1 dan 2, sedangkan Tabel 12 menyajikan dugaan selang prediksi kadar gingerol untuk data kelompok 2. Dari kedua tabel tersebut dapat dilihat bahwa lebar selang prediksi yang relatif sempit. Hal ini menunjukkan bahwa model tersebut mempunyai tingkat akurasi yang tinggi. Tabel 11 Kadar Gingerol hasil pengamatan, hasil dugaan serta hasil prediksi Kadar Gingerol Kelompok Data Kalibrasi Kadar Gingerol Kelompok Data Validasi Hasil Pengamatan Hasil Dugaan pada 45 . = δ RK-TWD Hasil Dugaan pada 5 . = δ RKTP-TWD Hasil Pengamatan Hasil Prediksi pada 45 . = δ RK-TWD Hasil Prediksi pada 5 . = δ RKTP-TWD 0.63 0.7157 0.7139 0.78 0.74851 0.74554 0.72 0.6914 0.7138 0.79 0.73841 0.72049 0.58 0.5548 0.5328 1.14 1.17249 1.18111 0.53 0.6019 0.6006 1.07 1.12907 1.14378 0.52 0.6049 0.6092 0.54 0.5320 0.5391 RMSEP= 0.04527 RMSEP= 0.05734 0.79 0.7426 0.7338 0.78 0.7483 0.7457 0.63 0.5745 0.5636 0.63 0.6084 0.6185 0.78 0.7420 0.7366 1.26 1.2849 1.2887 1.60 1.6150 1.6092 1.18 1.1890 1.1903 1.24 1.1879 1.1878 0.53 0.5466 0.5564 Tabel 12 Selang prediksi 95 kadar gingerol y Selang Prediksi 95 y predik y Batas bawah Batas atas Lebar selang 0.78 0.7485 0.65796 0.83904 0.18108 0.79 0.7384 0.64786 0.82894 0.18108 1.14 1.1725 1.08196 1.26304 0.18108 1.07 1.1291 1.03856 1.21964 0.18108 74 y-predik0.45 dan y-predik0.5 y 1.2 1.1 1.0 0.9 0.8 0.7 1.15 1.10 1.05 1.00 0.95 0.90 0.85 0.80 Var iab le y - p r ed - 0.45 y - p r ed - 0.50 P lot antara y dengan y-predik0.45, y-predik0.50 Gambar 21 Diagram pencar antara y dengan predik y kadar gingerol Hasil pendugaan dengan metode RK-TWD pada penelitian ini juga lebih baik dari metode terdahulu. Hasil kajian Erfiani 2005 dengan pendekatan Bayes menghasilkan 8252 . 2 = R serta RMSEP=0.0622. Sedangkan hasil penelitian Sunaryo 2005 dengan metode RKU-TWD diperoleh 967 . 2 = R serta RMSEP=0.1072. Dengan demikian dapat disimpulkan bahwa RK-TWD mempunyai potensi yang sangat baik untuk pemodelan kalibrasi. Model kalibrasi kadar gingerol dengan menggunakan pendekatan RK- TWD hasil penelitian ini dapat digunakan untuk memprediksi kandungan senyawa aktif gingerol pada semua jenis jahe, bila diketahui spektrum hasil FTIR. Hal ini karena semua jenis jahe mempunyai kandungan zat aktif gingerol yang mempunyai rumus kimia yang sama serta pola spektrum yang sama. Perbedaannya adalah pada tinggi rendahnya persen transmitans. Oleh karena itu bila pola spektrum hasil FTIR menyerupai pola spektrum pada Gambar 17, maka model ini dapat digunakan untuk memprediksi kadar gingerol suatu serbuk jahe. Model kalibrasi kadar gingerol tersebut dapat digunakan untuk memprediksi kadar senyawa aktif gingerol pada jahe dengan tingkat akurasi yang tinggi, tetapi tidak dapat digunakan untuk memprediksi kadar senyawa aktif pada rimpang tanaman obat yang lain misal kencur, kunyit. Hal ini karena jenis senyawa aktif pada setiap tanaman obat berbeda, berarti rumus kimianya juga berbeda, yang berakibat spektrum hasil FTIR juga berbeda dengan gingerol. Spektrum infrared dari senyawa organik mempunyai sifat fisik yang karakteristik, 75 artinya kemungkinan dua senyawa mempunyai spektrum sama adalah sangat kecil Nur dan Adijuwana 1989. Perbedaan pola spektrum inilah yang berdampak tiap- tiap senyawa aktif mempunyai model kalibrasi yang berbeda. Tetapi metode RK- TWD hasil penelitian ini dapat digunakan untuk mendapatkan model kalibrasi kadar senyawa aktif untuk semua jenis tanaman obat. Model Kalibrasi Kadar Kurkuminoid Gambar 22 dan Gambar 23 berikut ini menunjukkan hasil pengukuran FTIR berupa spektrum infrared kurkuminoid pada 1866 titik dan 1024 titik untuk 40 contoh serbuk rimpang temulawak. Dari gambar-gambar tersebut dapat dilihat pola spektrum yang seirama hampir sejajar, yang berakibat data persen transmitans hasil proses diskretisasi mempunyai korelasi yang tinggi. Selain itu jumlah titik amatan yang besar 1024 sehingga jumlah ini jauh lebih besar dibandingkan dengan jumlah pengamatan . n p Dua hal inilah yang menimbulkan masalah kolinearitas ganda serta singularitas. B ilangan gelo m bang cm -1 T ra n sm ita n s 4 0 0 0 3 0 0 0 2 0 0 0 1 0 0 0 0 . 8 0 . 7 0 . 6 0 . 5 0 . 4 0 . 3 S p e k tru m in frared k u rk u m in o id p ad a 1 8 6 6 titik Gambar 22 Spektrum infrared kurkuminoid untuk 40 contoh serbuk temulawak pada 1866 titik 76 B ila n g a n g e lo m b a n g c m - 1 T ran sm it an s 4 0 0 0 3 5 0 0 3 0 0 0 2 5 0 0 2 0 0 0 1 5 0 0 1 0 0 0 5 0 0 0 . 8 0 . 7 0 . 6 0 . 5 0 . 4 0 . 3 S p e k tr u m in fr a r e d k u r k u m in o id p a d a 1 0 2 4 titik Gambar 23 Spektrum infrared kurkuminoid untuk 40 contoh serbuk temulawak pada 1024 titik Dengan menggunakan 30 contoh untuk membangun model kalibrasi kadar kurkuminoid dan 10 contoh untuk validasi model, perilaku mother wavelet Daubechies-9 dengan level resolusi 0, 1, 2, dan 4 lebih baik dari yang lain. Dengan demikian terdapat 23 koefisien wavelet serta satu koefisien fungsi skala yang digunakan untuk mencari model terbaik. Sama dengan model kadar gingerol, kasus kolinearitas ganda juga terjadi pada matriks koefisien wavelet dan untuk mengatasinya digunakan metode RK. Ringkasan ukuran kebaikan model hasil pengolahan data dengan metode RK-TWD disajikan pada Tabel 13. Sedangkan Gambar 24 menyajikan diagram pencar antara δ dengan RMSEP , , 2 2 predik R R kadar kurkuminoid. Gambar 25 memperlihatkan diagram pencar antara nilai pengamatan dengan nilai dugaan. 77 Tabel 13 Ringkasan ukuran kebaikan model kadar kurkuminoid δ h 2 R 2 R s 2 predik R RMSEP Pendekatan 1 0.10 3 0.9987 0.9986 0.0136 0.529 0.2546 0.15 5 0.9985 0.9982 0.0151 0.541 0.3321 0.20 6 0.9986 0.9983 0.0147 0.484 0.3337 0.25 6 0.9986 0.9983 0.0147 0.541 0.2477 0.30 7 0.9985 0.9981 0.0157 0.555 0.2438 0.35 10 0.9985 0.9978 0.0169 0.547 0.2443 0.40 12 0.9981 0.9968 0.0201 0.579 0.2352 0.45 11 0.9707 0.9553 0.0766 0.908 0.1216 0.50 13 0.9661 0.9421 0.0874 0.910 0.1186 0.55 15 0.9696 0.9412 0.0885 0.904 0.1274 0.60 12 0.9544 0.9265 0.0984 0.952 0.0962 0.65 12 0.9355 0.8961 0.1170 0.869 0.1108 0.70 12 0.9555 0.9282 0.0972 0.952 0.0961 0.75 12 0.9270 0.8831 0.1241 0.693 0.2089 0.80 11 0.8777 0.8177 0.1555 0.919 0.1068 0.85 14 0.9412 0.8934 0.1888 0.892 0.1148 0.90 11 0.9176 0.8742 0.1285 0.915 0.1007 0.95 11 0.9262 0.8872 0.1216 0.891 0.1205 1.00 10 0.9182 0.8813 0.1246 0.817 0.1302 Pendekatan 2 13 0.9554 0.9282 0.0972 0.928 0.0867 Keterangan : = δ 0.62, 0.62, 0.63, 0.62, 0.63, 0.64, 0.64, 0.67, 0.67, 0.68, 0.68, 0.68, 0.68 δ y- d at a 1.0 0.8 0.6 0.4 0.2 0.0 1.0 0.8 0.6 0.4 0.2 0.0 Var iab le RMSEP R- 2 R- 2 p r ed Plot antara delta dengan R-2, R-2predik, RMSEP RMSEP R-2predik R-2 Gambar 24 Diagram pencar antara δ dengan RMSEP , , 2 2 predik R R model kadar kurkuminoid 78 y-duga0.5 dan y-dugaopt y 2.00 1.75 1.50 1.25 1.00 0.75 0.50 2.00 1.75 1.50 1.25 1.00 0.75 0.50 Var iab le y - d u g a 0.5 y - d u g a o p t P lot antara y dengan y-duga0.5, y-dugaopt Gambar 25 Diagram pencar antara y dengan 5 . ˆ = δ y serta ˆ opt y = δ model kadar kurkuminoid Dari Tabel 13 dan Gambar 24 dapat dilihat bahwa pada pendekatan 2 diperoleh nilai kebaikan model yang terbaik, dengan 9554 . 2 = R , 928 . 2 = predik R serta RMSEP=0.0867. Hasil ini lebih baik dari pada metode RKTP-TWD 5 . = δ yang menghasilkan 9661 . 2 = R , 910 . 2 = predik R , RMSEP=0.1186 serta RKU-TWD yang menghasilkan 9182 . 2 = R , 817 . 2 = predik R , RMSEP=0.1302. Hal ini diperkuat dengan Gambar 21 yang menunjukkan bahwa titik-titik hasil pendugaan dengan metode RK-TWD pada pendekatan 2 diperoleh titik-titik yang lebih dekat dengan garis lurus melalui pusat koordinat bersudut 45 o . Dengan demikian model kalibrasi kadar senyawa Kurkuminoid adalah model RK-TWD dengan pendekatan 2 = δ 0.62, 0.62, 0.63, 0.62, 0.63, 0.64, 0.64, 0.67, 0.67, 0.68, 0.68, 0.68, 0.68. Model tersebut merupakan hubungan antara peubah respon Y kadar kurkuminoid dengan peubah bebas D koefisien wavelet. Selanjutnya dari model ini digunakan untuk memprediksi kadar kurkuminoid jika diketahui data persen transmitan dari hasil pengukuran FTIR X. Tabel 14 berikut menyajikan hasil dugaan titik kadar gingerol untuk data kelompok 1 dan 2, sedangkan Tabel 15 menyajikan dugaan selang prediksi kadar gingerol untuk data kelompok 2. Dari kedua tabel tersebut dapat dilihat bahwa lebar selang prediksi yang relatif sempit. Hal ini menunjukkan bahwa model tersebut mempunyai tingkat akurasi yang tinggi 79 Tabel 14 Kadar kurkuminoid, hasil dugaan serta hasil prediksi Kadar Gingerol Kelompok Data Kalibrasi Kadar Gingerol Kelompok Data Validasi Hasil Pengamatan Hasil Dugaan pada pendekatan-2 RK-TWD Hasil Dugaan pada 5 . = δ RKTP-TWD Hasil Pengamatan Hasil Prediksi pada pendekatan-2 RK-TWD Hasil Prediksi Pada 5 . = δ RKTP-TWD 0.71 0.6791 0.7314 0.85 0.82219 0.78452 0.70 0.6908 0.6733 0.83 0.83425 0.71781 0.85 0.8699 0.8638 0.67 0.62095 0.72318 0.78 0.7080 0.6394 0.76 0.98175 0.97766 0.80 0.7839 0.8384 0.83 0.77145 0.74286 0.70 0.7710 0.6982 0.71 0.61724 0.60701 0.63 0.6679 0.6101 0.84 0.77065 0.71666 0.74 0.8746 0.8337 0.65 0.61612 0.55247 0.61 0.5645 0.5975 1.57 1.63557 1.73869 0.80 0.7416 0.7685 1.24 1.26402 1.28614 0.87 0.9043 0.9101 0.81 0.8259 0.8417 RMSEP= 0.0867 RMSEP= 0.1186 0.60 0.5135 0.6295 0.85 0.8677 0.8283 0.72 0.6942 0.6629 0.84 0.8307 0.8965 0.72 0.7937 0.7264 0.63 0.6271 0.6301 1.01 0.9427 0.9679 1.13 1.1631 1.1482 1.61 1.6579 1.6046 1.66 1.7253 1.6822 0.92 1.0691 1.0453 0.90 0.8596 0.8551 0.47 0.5901 0.5981 0.50 0.4959 0.4777 1.38 1.2331 1.3097 1.57 1.3803 1.3998 1.74 1.7419 1.8194 1.30 1.2827 1.2620 80 y-pre dik o p t y 1 . 7 5 1 . 5 0 1 . 2 5 1 . 0 0 0 . 7 5 0 . 5 0 1 . 6 1 . 4 1 . 2 1 . 0 0 . 8 0 . 6 D ia gra m p e n c a r a n ta ra y d g y -p re d ik o p t Gambar 26 Diagram pencar antara y dengan predik y kadar kurkuminoid Tabel 15 Selang prediksi 95 kadar kurkuminoid y Selang prediksi 95 y pred y Batas bawah Batas atas Lebar selang 0.85 0.82219 0.64879 0.99559 0.3468 0.83 0.83425 0.66085 1.00765 0.3468 0.67 0.62095 0.44755 0.79435 0.3468 0.76 0.98175 0.80835 1.15515 0.3468 0.83 0.77145 0.59805 0.94485 0.3468 0.71 0.61724 0.44384 0.79064 0.3468 0.84 0.77065 0.59725 0.94405 0.3468 0.65 0.61612 0.44272 0.78952 0.3468 1.57 1.63557 1.46217 1.80897 0.3468 1.24 1.26402 1.09062 1.43742 0.3468 Hasil pendugaan dengan metode RK-TWD pada penelitian ini juga lebih baik dari hasil penelitian terdahulu. Hasil kajian Sunaryo 2005 dengan metode RKU-TWD diperoleh 976 . 2 = R serta RMSEP=0.1715. Sedangkan hasil kajian Erfiani 2005 dengan pendekatan Bayes menghasilkan RMSEP=0.107. Dengan demikian dapat disimpulkan bahwa RK-TWD mempunyai potensi yang sangat baik untuk model kalibrasi. Model kalibrasi kadar kurkuminoid dengan menggunakan pendekatan RK- TWD yang diperoleh pada penelitian ini dapat digunakan untuk memprediksi kandungan senyawa aktif kurkuminoid pada semua jenis temulawak, bila diketahui spektrum hasil FTIR. Hal ini karena semua jenis temulawak mempunyai 81 kandungan zat aktif kurkuminoid dengan rumus kimia yang sama serta pola spektrum yang sama. Perbedaannya adalah pada tinggi rendahnya persen transmitans. Temulawak dengan kandungan kurkuminoid besar akan memiliki spektrum di atas lebih tinggi dari pada temulawak yang mempunyai kadar kurkuminoid yang lebih rendah, tetapi pola spektrumnya serupa. Sehingga bila pola spektrum hasil FTIR menyerupai pola spektrum pada Gambar 21, maka model ini dapat digunakan untuk memprediksi kadar kurkuminoid suatu serbuk temulawak. Model kalibrasi tersebut dapat digunakan untuk memprediksi kadar senyawa aktif kurkuminoid pada temulawak dengan tingkat akurasi yang tinggi, tetapi tidak dapat digunakan untuk memprediksi kadar senyawa aktif pada rimpang tanaman obat yang lain misal kencur, kunyit, lengkuas. Walaupun demikian, metode RK-TWD hasil penelitian ini dapat digunakan untuk mendapatkan model kalibrasi kadar senyawa aktif untuk semua jenis tanaman obat. Pada penelitian diperoleh model kalibrasi gingerol yang lebih baik dari pada model kalibrasi kurkuminoid. Hal ini dapat dilihat dari nilai RMSEP untuk model gingerol lebih kecil dari pada model kurkuminoid, serta lebar selang prediksi untuk model gingerol lebih sempit dari pada model kurkuminoid. Hal ini karena kemurnian gingerol pada jahe. Pada jahe hanya terdapat satu senyawa aktif, yaitu gingerol, sedangkan pada temulawak terdapat tiga senyawa aktif. Simpulan Dari hasil penelitian ini dapat ditunjukkan bahwa dengan mengunakan metode RK-TWD diperoleh model kalibrasi kadar gingerol dan kadar kurkuminoid dengan tingkat akurasi yang tinggi. Hal ini dapat dilihat dari nilai RMSEP yang kecil sehingga diperoleh selang prediksi yang sempit. Sempitnya selang prediksi dapat diartikan bahwa hasil prediksi tersebut mempunyai peluang yang besar 95 mendekati nilai sesunguhnya. Model tersebut dapat digunakan untuk memprediksi kadar senyawa gingerol pada rimpang jahe dan kadar kurkuminoid pada rimpang temulawak dengan hasil yang memuaskan, tetapi tidak dapat digunakan untuk memprediksi kadar senyawa aktif tanaman obat yang lain. Namun demikian metode RK-TWD dapat digunakan untuk mendapatkan model kalibrasi semua jenis tanaman obat. 6 PEMBAHASAN UMUM Masalah klasik dalam pemodelan regresi ganda adalah banyaknya pengamatan lebih kecil dari pada banyaknya peubah bebas serta kolinearitas. Jawaban atas kedua masalah tersebut penting dan sangat berguna. Regresi kontinum merupakan salah satu alternatif untuk mengatasi kedua masalah tersebut. RK pada dasarnya merupakan generalisasi dari RKT, RKU serta RKTP sehingga diharapkan menghasilkan dugaan yang lebih baik dalam mengatasi masalah tersebut. Pada bab 3 dilakukan eksplorasi untuk mengkaji secara empirik kinerja RK pada berbagai struktur korelasi matriks peubah bebas dan dibandingkan dengan metode RKU serta RKTP. Dari kajian yang dilakukan terhadap data simulasi dapat ditunjukkan bahwa RK mempunyai ukuran kebaikan model 2 2 2 , , , predik R s R R , dan RMSEP yang lebih unggul dibandingkan dengan dua metode yang lain. Sehingga dapat disimpulkan bahwa RK mempunyai potensi yang sangat baik dalam mengatasi masalah kolinearitas pada berbagai tingkat korelasi antar peubah bebas. Hal ini kiranya mudah dipahami, karena secara logika RK merupakan kombinasi konsep RKU, yang memaksimumkan keragaman peubah bebas X, dan RKTP yang memaksimumkan koragam antara X dengan Y. RK memaksimumkan keduanya secara bersamaan. Sedangkan pada kondisi data dengan tingkat korelasi yang tidak terlalu besar, maka koefisien penyesuaian δ akan mendekati 0, yang berarti mendekati RKT. Namun demikian karena RK merupakan pengembangan dari RKT, maka beberapa asumsi yang melekat pada RKT masih tetap diperlukan. Asumsi-asumsi tersebut adalah Y merupakan peubah acak yang menyebar normal dengan ragam konstan, serta di antara y i dengan y j saling bebas ,..., 2 , 1 n j i = ≠ . Selain itu model yang digunakan harus linear, serta rentan terhadap adanya pencilan. Sedangkan asumsi kolinearitas ganda dapat diabaikan. Regresi kontinum RK merupakan pendekatan yang dapat digunakan untuk mengatasi masalah ill conditioned, tetapi bila p n akan mengalami kendala komputasi, sehingga diperlukan metode prapemrosesan dalam bentuk pereduksian dimensi peubah bebas. Terdapat beberapa metode prapemrosesan di 83 antaranya : analisis komponen utama, transformasi Fourier, dan transformasi wavelet. Dari hasil kajian empiris dan pustaka dapat ditunjukkan bahwa transformasi wavelet diskret TWD memberikan hasil pendugaan model regresi yang lebih baik dibandingkan dengan metode prapemrosesan yang lain. Kombinasi antara RK dengan TWD sebagai metode prapemrosesan dan dinamakan metode regresi kontinum dengan transformasi wavelet diskret RK-TWD diharapkan dapat digunakan untuk mengatasi masalah kolinearitas ganda dan p n . Kajian terhadap metode RK-TWD dilakukan secara empiris maupun teoritis pada bab 3. Dari kajian tersebut dapat disimpulkan bahwa hasil pendugaan metode RK- TWD mempunyai ukuran kebaikan model yang lebih unggul dibandingkan dengan hasil RKU-TWD maupun RKTP-TWD. Ukuran kebaikan model yang digunakan adalah 2 2 2 , , , predik R s R R , RMSEP, serta selang prediksi untuk y. Dengan kata lain, metode RK-TWD dapat digunakan sebagai salah satu alternatif untuk mengatasi masalah kolinearitas ganda dan banyaknya pengamatan jauh lebih kecil dari pada banyaknya peubah bebas. Karena metode RK-TWD merupakan kombinasi antara metode RK dengan TWD, maka kelemahan-kelamahan yang terdapat pada RK maupun TWD juga terjadi pada metode tersebut. Pada RK-TWD masih diperlukan asumsi seperti yang terdapat pada RKT, kecuali asumsi kolinearitas ganda dan np dapat diabaikan. Sedangkan jumlah peubah bebas harus M 2 dengan M bilangan bulat positif. Pada bab 4 dilakuakan kajian tentang sifat-sifat statistik dari RK. Matriks pembobot W h pada RK diperoleh dengan memaksimumkan fungsi kriteria umum ternyata menimbulkan masalah dari aspek statistika. Hal ini karena prinsip pada fungsi kriteria umum adalah memaksimumkan koragam antara X dengan Y dan pada saat yang bersamaan juga memaksimumkan ragam dari X. Dengan demikian, pada matriks pembobot W mengandung peubah Y yang bersifat acak. Bila matriks W ditentukan fixed variable seperti yang diterapkan pada regresi kuadrat terkecil tertimbang weighted least squares, maka penduga yang dihasilkan metode RK maupun RK-TWD bersifat takbias dengan ragam minimum. Pada keadaan ini harus hati-hati, karena bagaimanapun penggunaan penduga sebagai pengganti tidak mungkin sesuai jika didasarkan pada informasi yang terbatas. 84 Masalah ill conditioned dan singularitas sering dijumpai pada model kalibrasi peubah ganda. Salah satu penerapan real kalibrasi di bidang kimia adalah pemodelan hubungan antara konsentrasi zat aktif yang dihasilkan oleh High Performance Liquid Chromatography HPLC dengan persen transmitans keluaran Fourier Transform Infrared FTIR. Pada penelitian ini banyaknya pengamatan ukuran contoh adalah 20 rimpang jahe yang diukur kandungan gingerol serta 40 rimpang temulawak yang diukur kandungan kurkuminoid melalui metode HPLC selanjutnya disebut peubah respon Y. Selain itu, dengan metode FTIR dihasilkan data persen transmitans yang diamati 1866 titik, pada bilangan gelombang 4000–400 cm -1 yang mencerminkan kadar gingerol dan kadar kurkuminoid yang selanjutnya disebut peubah bebas X. Model kalibrasi gingerol dan kurkuminoid dengan menggunakan pendekatan RK-TWD memberikan hasil RMSEP 0.0453 dan 0.0867. Nilai ini lebih kecil dibandingkan dengan pendekatan RKU-TWD maupun RKTP-TWD. Pada kasus data dan masalah yang sama telah dilakukan kajian dengan menggunakan pendekatan Bayes dan TWD. Dengan pendekatan Bayes menghasilkan besaran RMSEP 0.0622 untuk model gingerol dan 0.107 untuk model kurkuminoid, sedangkan dengan pendekatan transformasi wavelet menghasilkan besaran RMSEP 0.1072 untuk model gingerol dan 0.1715 untuk model kurkuminoid Erfiani 2005; Sunaryo 2005. Dengan menggunakan pendekatan RK-TWD diperoleh model kalibrasi kadar gingerol dan kadar kurkuminoid dengan tingkat akurasi yang tinggi. Hal ini dapat dilihat dari nilai RMSEP yang kecil sehingga diperoleh selang prediksi yang sempit. Model kalibrasi gingerol dapat digunakan untuk memprediksi kadar senyawa gingerol pada rimpang jahe, sedangkan model kalibrasi kurkuminoid dapat digunakan untuk memprediksi kurkuminoid pada rimpang temulawak dengan hasil yang memuaskan. Tetapi model-model tersebut tidak dapat digunakan untuk memprediksi kadar senyawa aktif tanaman obat yang lain. Namun demikian metode RK-TWD dapat digunakan untuk mendapatkan model kalibrasi semua jenis tanaman obat dengan kasus terdapat kolinearitas ganda serta banyaknya pengamatan lebih kecil dari pada banyaknya peubah bebas np. Secara umum, metode RK-TWD merupakan salah satu alternatif yang dapat digunakan untuk mengatasi masalah ill conditioned dan singularitas pada pemodelan regresi ganda. 7 SIMPULAN DAN SARAN

7.1 Simpulan