Pereduksian Dimensi Matriks A bersifat ortonormal. Jika X adalah peubah acak berdimensi p dengan

38 Friedman Stuetzle 1981, terutama berhubungan dengan struktur data yang nonlinear. Metode ini sering digunakan untuk eksplorasi data Posse 1995. Dalam bidang ilmu komputer Jimenez Landgrebe 1999 menggunakan metode PP untuk menganalisis citra satelit. Metode PP dapat digunakan untuk mengatasi struktur nonlinear dalam data berdimensi besar dengan cara pemulusan kernel atau spline. Xia An 1999 menggunakan metode PP untuk analisis data deret waktu yang nonlinear. PPR memodelkan secara iteratif permukaan regresi regression surface sebagai penjumlahan fungsi- fungsi pemulusan dari kombinasi linear peubah-peubah prediktor. Aplikasinya dalam bidang kimia, model PPR memberikan hasil dugaan yang lebih baik daripada model PCR dalam pendugaan konsentrasi atau kandungan protein dalam gandum berdasarkan sejumlah peubah prediktor absorbans spektrum yang bersifat multikolinearitas Malthouse 1995. Dalam Bab ini dibahas tentang aplikasi metode PP dan model PPR dalam bidang klimatologi, khusus nya dalam pemodelan SD, dan pembandingan model PPR dengan model PCR. Kajian ini bertujuan menyusun model PPR dan membandingkannya dengan model PCR.

4.2. Pereduksian Dimensi

Metode PP termasuk ke dalam kelompok metode pereduksian dimensi yang bersifat unsupervised berdasarkan pencarian suatu proyeksi informasi utama interesting dari data berdimensi besar Friedman Tukey 1974, diacu dalam Li Sailor 2000. Ide dasar metode PP adalah untuk memperoleh informasi penting dalam data berdimensi besar banyak peubah prediktor melalui proyeksi ke data berdimensi lebih kecil dengan cara memaksimumkan fungsi objektif yang disebut Indeks Proyeksi Projection Index. Informasi dalam data berdimensi kecil mencerminkan informasi yang ada dalam data berdimensi besar. Informasi penting itulah yang akan dicapai pursue oleh proyeksinya. Metode PP berbeda dengan PCA dalam hal prosedur reduksi dimensi. Pereduksian dalam PCA berdasarkan keragaman terbesar dalam data asal. Komponen-komponen utama sebagai hasil reduksi merupakan kombinasi linear dari peubah-peubah asal dengan total keragaman terbesar. Sedangkan metode PP berdasarkan pemaksimuman indeks proyeksi sehingga informasi yang ada dalam 39 data asal, seperti keadaan data nonlinear, akan tercermin dalam data hasil proyeksi. Transformasi reduksi dimensi yang biasa digunakan adalah proyeksi linear atau kombinasi linear dari peubah-peubah asal karena proyeksi ini paling sederhana dan mudah diinterpretasi. Jika X = {x 1 , x 2 , ... , x p } adalah matriks berdimensi p yang terdiri dari p vektor peubah asal maka proyeksi linear ℜ p à ℜ k adalah: Z T = A X T , X ∈ ℜ p , Z ∈ ℜ k , kp 4.1 di mana A adalah matriks pemetaan atau proyeksi berukuran k×p dengan pangkat

k. Matriks A bersifat ortonormal. Jika X adalah peubah acak berdimensi p dengan

sebaran F maka Z berdimensi k dengan sebaran F A . Metode PP menggunakan suatu indeks proyeksi, IF A , untuk mendapatkan proyeksi A. Indeks proyeksi ini mencirikan struktur yang akan ada dalam proyeksinya, yang dimaksimumkan melalui optimisasi numerik terhadap parameternya. Indeks proyeksi ini bersifat invariant Huber 1985, yaitu bahwa indeks proyeksi tidak tergantung pada penskalaan dan translasi: IsZ+t = IZ, s ? 0 4.2 di mana s dan t adalah bilangan riil.

4.3. Model Regresi