Format Data Dasar Identifikasi Penciri Utama: Principal Components Analysis PCA

l 11 dan l 12 : Masing-masing merupakan koefisien pembobot untuk Principal Components atau Common Factors F 1 dan F 2 dalam merekonstruksi variabel Y 1 ; atau disebut juga sebagai Principal Component Loadings atau Factor Loadings untuk variabel Y 1 l 21 dan l 22 : Masing-masing merupakan koefisien pembobot untuk Principal Components atau Common Factors F 1 dan F 2 dalam merekonstruksi variabel Y 2 ; atau disebut juga sebagai Principal Component Loadings atau Factor Loadings untuk variabel Y 2 e 1 : Koefisien pembobot untuk Specific Factor ε 1 dalam merekonstruksi variabel Y 1 e 2 : Koefisien pembobot untuk Specific Factor ε 2 dalam merekonstruksi variabel Y 2 Dari Gambar 2.1, dapat ditulis hubungan matematis sebagai berikut: 2 22 1 21 2 2 12 1 11 1 Y c Y c F Y c Y c F + = + = Secara matriks, dapat ditulis: ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ 2 1 22 21 12 11 2 1 Y Y c c c c F F Atau: CY F =

2.6.4. Format Data Dasar

Format data dasar yang kita akan analisis dengan PCA adalah seperti disajikan pada Tabel 2.1. Struktur data dasar pada tabel ini mengilustrasikan hasil pengukuran dalam skala kuantitatif, yakni: skala interval atau skala ratiokardinal terhadap p buah variabel dari n buah kasus sampel, individu, dsb. yang diteliti. Tabel 2.1: Struktur data asal Variabel Asal X 1 X 2 ... X j ... X p 1 x 11 x 12 ... x 1j ... x 1p 2 x 21 x 22 ... x 2j ... x 2p ... ... ... ... ... ... ... i x i1 x i2 ... x ij ... x ip ... ... ... ... ... ... ... Kasus n x n1 x n2 ... x nj ... x np Rataan μ 1 μ 2 ... μ j ... μ j Simpangan Baku s 1 s 2 ... s j ... s j 2.6.5. Standarisasi Variabel Asal Sebelum kita melakukan analisis PCA, kita perlu menstandardisasikan masing-masing variabel pada Tabel 2.1 tersebut. Artinya, kita transformasikan masing-masing variabel X j j=1,2,...,p yang memiliki nilai rataan masing-masing sama dengan μ j dan simpangan baku masing-masing sama dengan s j , menjadi variabel baku Y j j=1,2,...,p yang memiliki nilai rataan masing-masing sama dengan nol dan simpangan baku dan ragam masing-masing sama dengan satu. Secara matematis hubungan antara data untuk variabel asal x ij dengan data untuk variabel yang telah distandarisasikan y ij dapat ditulis sebagai berikut: j j ij ij s x y μ − = 1 Tujuan dasar dari penstandardisasian variabel ini adalah menghilangkan variasi data antar variabel yang diakibatkan oleh hal-hal yang tidak esensial, seperti: 1. Hanya karena perbedaan titik nol pengukuran yang digunakan untuk masing-masing variabel, seperti perbedaan data pengukuran temperatur titik beku air antara metode Fahrenheit dengan metode Celcius °C=32°F, dan 2. Hanya karena perbedaan sistem penskalaan yang digunakan untuk masing- masing variabel, seperti perbedaan data pengukuran temperatur titik didih air antara metode Celcius dengan metode Reaumur 100 °C=80°R, padahal °C=0°R. Setelah distandardisasikan, maka kita memperoleh data seperti pada Tabel 2.2 berikut. Tabel 2.2. Struktur data setelah semua variabel distandardisasikan Variabel Baku Y 1 Y 2 ... Y j ... Y p 1 y 11 y 12 ... y 1j ... y 1p 2 y 21 y 22 ... y 2j ... y 2p ... ... ... ... ... ... ... i y i1 y i2 ... y ij ... y ip ... ... ... ... ... ... ... Kasus n y n1 y n2 ... y nj ... y np Rataan 0 0 ... 0 ... 0 Ragam 1 1 ... 1 ... 1 Kalau sekiranya perbedaan variasi data antar variabel dalam Tabel 2.1 sama seperti perbedaan variasi data antar ketiga metode pengukuran temperatur Celcius vs. Fahrenheit vs. Reamur, maka setelah distandardisasikan akan ditunjukkan dalam Tabel 2.2 bahwa antar variabel tersebut tidak ada perbedaan sama sekali. Karakteristik penting lainnya dari variabel-variabel yang telah distandardisasikan adalah: 1. Perkalian vektor antar dua variabel yang berbeda adalah sama dengan koefisien korelasi antar kedua variabel tersebut. 2 1 2 1 jj nj j j nj j j r y y y y y y = ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ = ′ M L j j Y Y 2 2. Perkalian matriks antar variabel adalah sama dengan matriks koefisien korelasi antar variabel tersebut. R Y Y = ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ = ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ = ′ 1 1 1 2 1 2 21 1 12 2 1 2 22 21 1 12 11 2 1 2 22 12 1 21 11 L M O M M L L L M O M M L L L M O M M L L p p p p np n n p p np p p n n r r r r r r y y y y y y y y y y y y y y y y y y 3 2.6.6. Ortogonalisasi Variabel Selanjutnya, baik dalam PCA maupun FA, kita melakukan ortogonalisasi terhadap variabel-variabel pada Tabel 2 tersebut. Artinya, kita mentransformasikan masing-masing variabel Y j j=1,2,...,p yang memiliki karakteristik: 1. Satu sama lain saling berkorelasi dengan koefisien korelasi sebesar r jj’ ≠ 0, 2. Nilai rataan masing-masing sama dengan nol, dan 3. Nilai ragam masing-masing sama dengan satu, menjadi variabel baru Z α α=1,2,...,q≤p yang memiliki karakteristik: 1. Satu sama lain tidak saling berkorelasi, yakni: r αα ’ = 0, 2. Nilai rataan masing-masing tetap sama dengan nol, dan 3. Nilai ragam masing-masing Z α sama dengan λ α ≥ 0, dimana ∑ α λ α = p. Struktur data baru yang dihasilkan setelah proses ortogonalisasi dapat disajikan seperti dalam Tabel 2.3 berikut. Tabel 2.3. Struktur Data Setelah Diortogonalisasikan Variabel Baru Ortogonal Z 1 Z 2 ... Z α ... Z q ≤p 1 z 11 z 12 ... z 1 α ... z 1q 2 z 21 z 22 ... z 2 α ... z 2q ... ... ... ... ... ... ... i z i1 z i2 ... z i α ... z iq ... ... ... ... ... ... ... Kasus n z n1 z n2 ... z n α ... z nq Rataan 0 0 ... 0 ... 0 Ragam λ 1 λ 2 ... λ α ... λ q Secara matematis hubungan antara data pada Tabel 2.3 dengan data pada Tabel 2.2 adalah sebagai berikut: ∑ = = p j ij j i y b z 1 α α 4 Secara perkalian matriks Persamaan 4 dapat ditulis sebagai berikut: α α Yb Z = 5 dimana: α α α α α α α λ = ⎟⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜⎜ ⎜ ⎜ ⎜ ⎝ ⎛ = ′ n n z z z z z z M L 2 1 2 1 α α Z Z 6 1 2 1 2 1 = ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ = ′ α α α α α α p p b b b b b b M L α α b b 7

2.6.7. Standarisasi Variabel Baru Ortogonal