37
4. PENGGUNAAN PROJECTION PURSUIT UNTUK
REDUKSI DIMENSI DAN PEMODELAN STATISTICAL
DOWNSCALING
4.1. Pendahuluan
Analisis data dengan dimensi besar sering dipengaruhi oleh keadaan data yang disebut curse of dimensionality, yang sering menjadi masalah, terutama
kalau dimensinya semakin besar Scott 1992, sehingga diperlukan data yang lebih banyak. Keadaan data seperti ini mendorong penggunaan suatu metode yang
dapat mengatasi masalah tersebut atau yang dapat menghasilkan informasi penting dalam data dengan dimensi yang lebih kecil, yaitu pereduksian dimensi berbasis
proyeksi dari peubah berdimensi besar menjadi peubah baru yang berdimensi kecil.
Metode pereduksian dimensi dilakukan dengan tetap mempertahankan struktur informasi penting pada data asal di dalam data tereduksi. PCA dan
Projection Pursuit PP dapat digunakan untuk mereduksi dimensi. Hasil reduksi dimensi dapat diterapkan antara lain untuk pendugaan model regresi berganda.
Hasil proyeksi atau pereduksian dimensi dengan PCA, yang disebut komponen- komponen utama, digunakan dalam model PCR, sedangkan hasil reduksi dimensi
dengan PP digunakan untuk pemodelan regresi PP atau PPR. Oleh karena itu kedua model ini termasuk dalam kategori model regresi berbasis proyeksi. Model
PCR digunakan untuk fX linear, sedangkan model PPR untuk pendugaan fX
nonlinear. Keduanya dapat digunakan untuk keadaan multikolinearitas antar peubah-peubah.
Dalam pemodelan regresi berbasis proyeksi, masalah data berdimensi besar dapat diatasi dengan cara pengepasan sejumlah sekuen fungsi sederhana
yang disebut fungsi ridge Donoho Johnstone 1989. Setiap fungsi memproyeksikan peubah-peubah prediktor terhadap suatu vektor dan
menghubungkan panjang proyeksi ini terhadap peubah respon dengan suatu
fungsi pemulus. Jumlah fungsi- fungsi ridge merupakan penduga bagi f X pada
persamaan 2.1. Beberapa aplikasi dari metode PP antara lain untuk klasifikasi atau analisis
diskriminan, pendugaan fungsi kepekatan, dan pemodelan regresi nonparametrik
38 Friedman Stuetzle 1981, terutama berhubungan dengan struktur data yang
nonlinear. Metode ini sering digunakan untuk eksplorasi data Posse 1995. Dalam bidang ilmu komputer Jimenez Landgrebe 1999 menggunakan metode
PP untuk menganalisis citra satelit. Metode PP dapat digunakan untuk mengatasi struktur nonlinear dalam data berdimensi besar dengan cara pemulusan kernel
atau spline. Xia An 1999 menggunakan metode PP untuk analisis data deret waktu yang nonlinear. PPR memodelkan secara iteratif permukaan regresi
regression surface sebagai penjumlahan fungsi- fungsi pemulusan dari kombinasi linear peubah-peubah prediktor. Aplikasinya dalam bidang kimia,
model PPR memberikan hasil dugaan yang lebih baik daripada model PCR dalam pendugaan konsentrasi atau kandungan protein dalam gandum berdasarkan
sejumlah peubah prediktor absorbans spektrum yang bersifat multikolinearitas Malthouse 1995. Dalam Bab ini dibahas tentang aplikasi metode PP dan model
PPR dalam bidang klimatologi, khusus nya dalam pemodelan SD, dan pembandingan model PPR dengan model PCR. Kajian ini bertujuan menyusun
model PPR dan membandingkannya dengan model PCR.
4.2. Pereduksian Dimensi