Komponen Utama Berdasarkan Matriks Kovarian Ʃ

5. Menginterpretasi dan Memprofil Klaster

2.8 Analisis Komponen utama

Analisis komponen utama merupakan teknik statsistik yang dapat digunakan untuk mereduksi sejumlah variabel bebas menjadi beberapa variabel baru yang bersifat orthogonal dan tetap mempertahankan total keragaman dari variabel asalnya. Analisis komponen utama bertujuan untuk mengubah dari sebagian besar variabel asli yang digunakan yang saling berkorelasi menjadi satu set variabel baru yang lebih kecil saling bebas dan merupakan kombinasi linier dari variabel asalnya. Selanjutnya variabel baru ini dinamakan komponen utama principal component. Secara umum tujuan dari analisis komponen utama adalah mereduksi dimensi data sehingga lebih mudah untuk menginterpretasikan data tersebut.

2.8.1 Menentukan Komponen Utama

Komponen utama ditentukan melalui matriks kovarian Ʃ dan matriks korelasi � dari � 1 , � 2 , … , � � . Matriks kovarian Ʃdigunakan untuk membentuk komponen utama apabila semua variabel yang diamati mempunyai satuan pengukuran yang sama. Sedangkan matriks korelasi � digunakan apabila variabel yang diamati tidak mempunyai satuan pengukuran yang sama. Variabel tersebut perlu dibakukan, sehingga komponen utama berdasarkan matriks korelasi ditentukan dari variabel baku.

2.8.1.1 Komponen Utama Berdasarkan Matriks Kovarian Ʃ

Dipunyai matriks kovarian Ʃdari � buah variabel, � 1 , � 2 , … , � � . Total varian dari variabel-variabel tersebut didefinisikan sebagai ��Ʃ = �����Ʃ yaitu penjumlahan dari unsur diagonal matriks Ʃ. Melalui matriks kovarian Ʃ bisa diturunkan akar ciri-akar cirinya, yaitu: � 1 ≥ � 2 ≥ ⋯ ≥ � � ≥ 0 dan vektor ciri-vektor cirinya � 1 , � 2 , … , � � . Komponen utama dari vektor berukuran � × 1, � = �� 1 , � 2 , … , � � � ′ adalah kombinasi linier terbobot dari variabel asal yang dapat menerangkan keragaman terbesar. Komponen utama pertama dapat dituliskan sebagai: � 1 = � 11 � 1 + � 12 � 2 + ⋯ + � 1 � � � � 1 = � 1 ′ � 2.29 dengan: � 1 ′ � = �� 11 , � 12 , … , � 1 � � ′ dan � 1 ′ � 1 = 1 Varian dari komponen utama pertama adalah: � 2 � 1 = � � � �1 � �1 � �� � � =1 � �=1 = � 1 ′ ∑ � 1 2.30 Vektor pembobot � ′ adalah vektor normal, koefisisen � �1 adalah unsur-unsur dari vektor ciri yang berhubungan dengan akar ciri terbesar � 1 yang diturunkan dari matriks kovarian Ʃ dipilih sedemikian sehingga � 2 � 1 mencapai maksimum dengan kendala � 1 ′ � 1 = 1. Menggunakan teknik pemaksimuman berkendala Lagrange diperoleh persamaan: �� 1 , � 1 = � 2 � 1 − � 1 � 1 ′ � 1 − 1 = � 1 ′ � � 1 − � 1 � 1 ′ � 1 − 1 Fungsi ini mencapai maksimum jika turunan parsial pertama �� 1 , � 1 terhadap � 1 sama dengan nol. �� � 1 , � 1 �� 1 = 2 ∑ � 1 − 2� 1 � 1 = 0 atau ∑ � 1 = � 1 � 1 2.31 Persamaan 2.31 dipenuhi oleh � 1 dan � 1 yang merupakan pasangan akar ciri dan vektor ciri matriks Ʃ. Akibatnya, � 1 ′ ∑ � 1 = � 1 ′ � 1 � 1 = � 1 � 1 ′ � 1 = � 1 . Oleh karena itu, varian � 1 = � 2 � 1 = � 1 ′ ∑ � 1 = � 1 harus maksimum, maka � 1 adalah akar ciri yang terbesar dari matriks Ʃdan� 1 adalah vektor ciri yang bersesuaian dengan � 1 . Komponen utama kedua adalah kombinasi linier terbobot variabel asal yang tidak berkorelasi dengan komponen utama pertama, serta memaksimumkan sisa kovarian data setelah diterangkan oleh komponen utama pertama. Komponen utama kedua dapat dituliskan sebagai: � 2 = � 21 � 1 + � 22 � 2 + ⋯ + � 2 � � � � 2 = � 2 ′ � 2.32 dengan: � 2 ′ � = �� 21 , � 22 , … , � 2 � � ′ dan � 2 ′ � 2 = 1 Vektor pembobot � ′ adalah vektor normal yang dipilih sehingga keragaman komponen utama kedua maksimum, serta orthogonal terhadap vektor pembobot � 1 ′ dari komponen utama pertama. Agar varian dari komponen utama kedua maksimum, serta antara komponen utama kedua tidak berkorelasi dengan komponen utama pertama, maka vektor pembobot � 2 dipilih sedemikan sehingga � 2 = � 2 ′ � tidak berkorelasi dengan � 1 = � 1 ′ �. Varian komponen utama kedua � 2 adalah: � 2 � 2 = � � � �2 � �2 � �� � � =1 � �=1 = � 2 ′ ∑ � 2 2.33 Varian tersebut akan dimaksimumkan dengan kendala � 2 ′ � 2 = 1 dan ���� 1 , � 2 = ���� 1 �, � 2 � = � 1 ′ ∑ � 2 = 0. Karena � 1 adalah vektor ciri dari Ʃ dan Ʃ adalah matriks simetris, maka: � 1 ′ Ʃ = Ʃ� 1 ′ = �� 1 ′ = �� 1 ′ . Kendala � 1 ′ ∑ � 2 = �� 1 ′ � 2 = 0 dapat dituliskan sebagai � 1 ′ � 2 = 0. Jadi fungsi Lagrange yang dimaksimumkan adalah: �� 2 , � 2 , � = � 2 ′ ∑ � 2 − � 2 � 2 ′ � 2 − 1 − �� 1 ′ � 2 − 0 2.34 Fungsi ini mencapai maksimum jika turunan parsial pertama �� 2 , � 2 , � terhadap � 2 sama dengan nol, sehingga diperoleh: �� � 1 , � 1 , � �� 2 = 2 ∑ � 2 − 2� 2 � 2 − � ∑ � 1 = 0 2.35 Jika persamaan 2.35 dikalikan dengan � 1 ′ maka diperoleh: 2 � 1 ′ ∑ � 2 − 2� 2 � 1 ′ � 2 − �� 1 ′ ∑ � 1 = 0 karena ∑ � 1 = � 1 � 1 2 � 1 ′ � � 2 − 2� 2 � 1 ′ � 2 − �� 1 � 1 ′ � 1 = 0 2 � 1 ′ � � 2 − 0 − �� 1 = 0 Oleh karena 2 � 1 ′ ∑ � 2 = 0 maka � = 0. Dengan demikian persamaan 2.35 setelah diturunkan terhadap � 2 menjadi ��� 1 , � 1 , � �� 2 = 2 � � 2 − 2� 2 � 2 = 0 ∑ � 2 − � 2 � 2 = 0 2.36 Jadi � 2 dan � 2 merupakan pasangan akar ciri dan vektor ciri dari matriks varian kovarian Ʃ. Seperti halnya penurunan pada pencarian � 1 , akan diperoleh bahwa � 1 adalah vektor yang bersesuaian dengan akar ciri terbesar kedua dari matriks Ʃ. Secara umum komponen utama ke-j dapat dituliskan sebagai berikut: � � = � 1 � � 1 + � 2 � � 2 + ⋯ + � �� � � � � = � � ′ � 2.37 dengan: � � ′ = �� �1 , � �2 , … , � �� � ′ dan � � ′ � � = 1 vektor pembobot � � ′ diperoleh dengan memaksimumkan keragaman komponen utama ke-j, yaitu: � 2 � � = � � ′ ∑ � � 2.38 dengan kendala: � � ′ � � = 1 serta � � ′ � � = 0 untuk i ≠ j Dengan kendala ini, maka akar ciri � � dapat diinterpretasikan sebagai ragam komponen utama ke-j sesama komponen utama tidak berkorelasi. Vektor pembobot � � ′ yang merupakan koefisien pembobot variabel asal bagi komponen utama ke- j diperoleh dari matriks peragam Ʃ yang diduga dengan matriks S berikut: � = 1 �−1 ∑ � ℎ − �̅� ℎ − �̅ ′ � ℎ=1 2.39

2.8.1.2 Komponen Utama Berdasarkan Matriks Korelasi �