PRINCIPAL COMPONENT REGRESSION 1 Analisis Komponen Utama

Kerjasama Bappeda Kota Bandung LQC Unpad 18 P0115 7. PRINCIPAL COMPONENT REGRESSION 7.1 Analisis Komponen Utama Analisis komponen utama merupakan teknik statistik yang dapat digunakan untuk menjelaskan struktur variansi-kovariansi dari sekumpulan variabel melalui beberapa variabel baru dimana variabel baru ini saling bebas, dan merupakan kombinasi linier dari variabel asal. Selanjutnya variabel baru ini dinamakan komponen utama principal component . Secara umum tujuan dari analisis komponen utama adalah mereduksi dimensi data dan untuk kebutuhan interpretasi. Salah satu tujuan dari analisis komponen utama adalah mereduksi dimensi data asal yang semula terdapat p variabel bebas menjadi k komponen utama dimana k p. Kriteria pemilihan k yaitu:1. Proporsi kumulatif keragaman data asal yang dijelaskan oleh k komponen utama minimal 80 , dan proporsi total variansi populasi bernilai cukup besar Johnson, 2002. Pemilihan nilai k berdasarkan scree plot scree plot yaitu plot antara i dengan λi, ditentukan dengan melihat letak terjadinya belokan dengan menghapus komponen utama yang menghasilkan beberapa nilai eigen kecil membentuk pola garis lurus Rencher, 1998. 7.1 Pembentukan Komponen Utama 1. Regresi komponen utama yang dibentuk berdasarkan matriks kovariansi Misal matriks P adalah matriks orthogonal dengan memenuhi persamaan P1P = P P1,=I, karena W=XCP Maka proses persamaan regresi linier berganda menjadi regresi komponen utama yaitu: Y = XC +ε Y = XC P1P +ε Y = Wα +ε Dengan XC merupakan matriks yang elemen-elemennya dikurang oleh rata-rata centered dengan asumsi rata- rata nol dan variansi σ2, Y adalah variabel acak bebas, Wk adalah suatu matriks berukuran nxk yangkolom-kolomnya terdapat komponen utama ke- k, αk adalah vektor koefesien komponen utama berukuran kx1, dan ε adalah vektor berukuran nxk Kerjasama Bappeda Kota Bandung LQC Unpad 19 P0115 2. Komponen Utama Yang Dibentuk Berdasarkan Matriks Korelasi Komponen utama ke-i ; W i yang dibentuk berdasarkan variabel-variabel yang telah dibakukan Z’ = Z 1, Z 2,. .... .... Z p . dengan covZ =ρ didefenisikan sebagai berikut : . W i = e i1 Z 1 + e i2 Z 2 + ...+ e ip Z p i=1,2...p Sementara itu, proporsi total variansi yang dapat dijelaskan oleh komponen ke –k berdasarkan variabel bebas yang telah dibakukan didefenisiskan sebagai berikut: Proporsi total varians populasi yang dijelaskan oleh komponen utama ke-k disingfkat PTVP . PTVP ..........7 k k tr p p     Dengan λ k =adalah eigen dari ρ , dan k = 1,2,…,p Adapun cara pembentukan regresi komponen utama melalui analisis komponen utama ada dua cara. Pertama, pembentukan komponen utama berdasarkan matriks kovariasi. Kedua, pembentukan komponen utama berdasarkan matriks korelasi. Dalam penelitian ini dipilih cara kedua. Untuk menghasilkan susunan faktor yang paling optimal, maka dilakukan beberapa tahapan pengolahan data secara iteratif berulang dan berurutan sekuensial. Kriteria untuk menentukan apakah susunan faktor yang dihasilkan pada suatu tahapan tertentu merupakan susunan yang paling optimal adalah sebagai berikut: • Eigenvalue bernilai lebih dari 1 satu; • Total variance explained ditetapkan bernilailebih besar daripada 60 ; • Loading factor setiap item atau variabel teramati pada Pattern Matrix bernilai lebih besar dari pada 0,4. Jika pada suatu tahapan kalkulasi faktor ternyata terjadi setidaknya salah satu dari 3 tiga kriteria di atas yang tidak dipenuhi, maka tahapan iteratif dan sekuensial selanjutnya dilaksanakan. Variabel yang memiliki nilai absolut loading terkecil akan dikeluarkan dari data dan dilanjutkan dengan eksekusi program terhadap variabel-variabel tersisa di data. Tahapan ini dilakukan secara iteratif dan sekuensial sampai dihasilkan susunan faktor yang memenuhi ketiga kriteria di atas. Kerjasama Bappeda Kota Bandung LQC Unpad 20 P0115 Susunan faktor dinyatakan optimum jika nilai total variance explained minimal 60 persen dan semua loading pada pattern matrix minimal 0,4. Dari kalkulasi pertama dengan metode ini mengharuskan beberapa item di kuesioner dihapus dari data karena nilai absolut loading-nya di bawah 0.4. Proses demikian dilakukan secara berulang hingga diperoleh hasil optimal. 8. SAMPLING 8.1 SAMPLING ACAK SEDERHANA