Pendahuluan PENGGUNAAN PROJECTION PURSUIT UNTUK

37

4. PENGGUNAAN PROJECTION PURSUIT UNTUK

REDUKSI DIMENSI DAN PEMODELAN STATISTICAL DOWNSCALING

4.1. Pendahuluan

Analisis data dengan dimensi besar sering dipengaruhi oleh keadaan data yang disebut curse of dimensionality, yang sering menjadi masalah, terutama kalau dimensinya semakin besar Scott 1992, sehingga diperlukan data yang lebih banyak. Keadaan data seperti ini mendorong penggunaan suatu metode yang dapat mengatasi masalah tersebut atau yang dapat menghasilkan informasi penting dalam data dengan dimensi yang lebih kecil, yaitu pereduksian dimensi berbasis proyeksi dari peubah berdimensi besar menjadi peubah baru yang berdimensi kecil. Metode pereduksian dimensi dilakukan dengan tetap mempertahankan struktur informasi penting pada data asal di dalam data tereduksi. PCA dan Projection Pursuit PP dapat digunakan untuk mereduksi dimensi. Hasil reduksi dimensi dapat diterapkan antara lain untuk pendugaan model regresi berganda. Hasil proyeksi atau pereduksian dimensi dengan PCA, yang disebut komponen- komponen utama, digunakan dalam model PCR, sedangkan hasil reduksi dimensi dengan PP digunakan untuk pemodelan regresi PP atau PPR. Oleh karena itu kedua model ini termasuk dalam kategori model regresi berbasis proyeksi. Model PCR digunakan untuk fX linear, sedangkan model PPR untuk pendugaan fX nonlinear. Keduanya dapat digunakan untuk keadaan multikolinearitas antar peubah-peubah. Dalam pemodelan regresi berbasis proyeksi, masalah data berdimensi besar dapat diatasi dengan cara pengepasan sejumlah sekuen fungsi sederhana yang disebut fungsi ridge Donoho Johnstone 1989. Setiap fungsi memproyeksikan peubah-peubah prediktor terhadap suatu vektor dan menghubungkan panjang proyeksi ini terhadap peubah respon dengan suatu fungsi pemulus. Jumlah fungsi- fungsi ridge merupakan penduga bagi f X pada persamaan 2.1. Beberapa aplikasi dari metode PP antara lain untuk klasifikasi atau analisis diskriminan, pendugaan fungsi kepekatan, dan pemodelan regresi nonparametrik 38 Friedman Stuetzle 1981, terutama berhubungan dengan struktur data yang nonlinear. Metode ini sering digunakan untuk eksplorasi data Posse 1995. Dalam bidang ilmu komputer Jimenez Landgrebe 1999 menggunakan metode PP untuk menganalisis citra satelit. Metode PP dapat digunakan untuk mengatasi struktur nonlinear dalam data berdimensi besar dengan cara pemulusan kernel atau spline. Xia An 1999 menggunakan metode PP untuk analisis data deret waktu yang nonlinear. PPR memodelkan secara iteratif permukaan regresi regression surface sebagai penjumlahan fungsi- fungsi pemulusan dari kombinasi linear peubah-peubah prediktor. Aplikasinya dalam bidang kimia, model PPR memberikan hasil dugaan yang lebih baik daripada model PCR dalam pendugaan konsentrasi atau kandungan protein dalam gandum berdasarkan sejumlah peubah prediktor absorbans spektrum yang bersifat multikolinearitas Malthouse 1995. Dalam Bab ini dibahas tentang aplikasi metode PP dan model PPR dalam bidang klimatologi, khusus nya dalam pemodelan SD, dan pembandingan model PPR dengan model PCR. Kajian ini bertujuan menyusun model PPR dan membandingkannya dengan model PCR.

4.2. Pereduksian Dimensi