Seleksi peubah dengan analisis komponen utama dan procrustes

SELEKSI PEUBAH DENGAN
ANALISIS KOMPONEN UTAMA DAN PROCRUSTES

ACHMAD MUSLIM

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2011

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI
Dengan ini saya menyatakan bahwa tesis berjudul Seleksi Peubah dengan
Analisis Komponen Utama dan Procrustes adalah karya saya dengan arahan dari
komisi pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan
tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang
diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks
dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.

Bogor, Agustus 2011


Achmad Muslim
NIM G551090121

ABSTRACT

ACHMAD MUSLIM. Variable Selection Using Principal Component and
Procrustes Analysis. Supervised by SISWADI and TONI BAKHTIAR.

Principal component analysis (PCA) is a dimension-reducing tool that
replaces the variables in a multivariate dataset by a smaller number of derived
variables. Dimension reduction is often undertaken to help in interpreting the data
set but, as each principal component usually involves all the original variables,
interpretation of a PCA can still be difficult. One way to overcome this difficulty
is to select a subset of the original variables and use this subset to approximate the
data. Procrustes analysis as a measure of similarity, is used to measure the
efficiencies of the alternative variable selection methods in extracting
representative variables Because of its unavailability in statistical software, a
package program, using Mathematica 8.0, is composed for variable selection.
There are four variable selection methods, based on PCA and procrustes analysis,
which have been described and examined along with different criteria levels for

deciding on the number of variables to retain in the analysis. The methods are B2,
B4, procrustes analysis in the principal component score, and procrustes analysis
method. The result show that variable selection programs B2 as the best variable
selection method followed by procrustes analysis method. Moreover, it is found
that all of the methods considered give the measure of efficiency of more than
99.04%.

Keywords: variable selection, principal component analysis, procrustes analysis

RINGKASAN
ACHMAD MUSLIM. Seleksi Peubah dengan Analisis Komponen Utama dan
Procrustes. Dibimbing oleh SISWADI dan TONI BAKHTIAR.

Pada umumnya penelitian-penelitian yang berkaitan dengan dunia nyata
melibatkan banyak peubah. Setiap peubah diukur secara individual untuk
menelusuri pengaruh antarpeubah. Masalah yang kemudian dihadapi adalah
kesulitan untuk menginterpretasikan himpunan data yang besar.
Oleh karena itu diperlukan sebuah metode untuk mengidentifikasi peubahpeubah yang dipandang memiliki kontribusi yang besar pada variasi data sebelum
dilakukan analisis hasil penelitian. Pendekatan yang dapat dilakukan adalah
mengurangi peubah-peubah yang mungkin tidak memiliki kaitan dengan masalah

yang ingin diteliti ataupun dengan mengurangi peubah-peubah yang memberikan
kontribusi informasi yang sedikit pada variasi data dengan seleksi peubah.
Analisis komponen utama merupakan salah satu teknik analisis peubah
ganda yang berkaitan dengan penjelasan struktur varians-kovarians peubah
dengan cara mentransformasi peubah-peubah awal menjadi peubah-peubah baru
yang tidak saling berkorelasi dengan tujuan mereduksi dimensi matriks data
sehingga lebih mudah dalam menginterpretasi hasil yang diperoleh. Peubahpeubah baru yang terbentuk disebut komponen utama (principal components).
Analisis procrustes adalah alat analisis berdasarkan asas kuadrat-terkecil
yang dapat digunakan untuk mengukur kemiripan maksimal antarkonfigurasi titik
melalui serangkaian transformasi linear (Bakhtiar & Siswadi 2011). Untuk
melihat kesamaan bentuk dan ukuran dari dua konfigurasi maka salah satu
konfigurasi dibuat tetap sementara konfigurasi yang lainnya ditransformasi
sehingga sesuai dengan konfigurasi pertama.
Data penelitian yang digunakan adalah data yang diperoleh dari Direktorat
Pendidikan Tingkat Persiapan Bersama Institut Pertanian Bogor (TPB IPB), yang
terdiri atas data nilai mutu 14 mata kuliah yang diikuti 3223 mahasiswa TPB IPB
tahun akademik 2008/2009 dan 3053 mahasiswa pada tahun akademik 2009/2010
baik pada semester ganjil maupun semester genap. Peubah yang digunakan dalam
penelitian ini merupakan mata kuliah di TPB IPB yang terdiri dari Agama (AG),
Bahasa Indonesia (ID), Bahasa Inggris (IG), Biologi (BI), Ekonomi Umum (EU),

Fisika (FI), Kalkulus (KA), Kimia (KI), Olahraga dan Seni (OS), Pendidikan
Kewarganegaraan (KN), Pengantar Ilmu Pertanian (PI), Pengantar Kewirausahaan
(PK), Pengantar Matematika (PM), dan Sosiologi Umum (SU).
Metode B2 menyeleksi peubah-peubah yang bersesuaian dengan nilai
mutlak terbesar dari koefisien setiap 岫喧 伐 圏岻 komponen utama terakhir pada
matriks data yang mengandung 券 objek dan 喧 peubah, dengan asumsi 圏 peubah
yang dipertahankan. Metode B4 mempertahankan peubah-peubah yang
bersesuaian dengan nilai mutlak terbesar dari koefisien setiap 圏 komponen utama
pertama pada matriks data yang mengandung 券 objek dan 喧 peubah, dengan
asumsi 圏 peubah yang dipertahankan.

Metode analisis procrustes pada skor komponen utama membentuk
matriks skor komponen utama dan membandingkannya dengan matriks skor yang
dibentuk dengan menghilangkan setiap kolom matriks data secara berurutan.
Peubah yang bersesuaian dengan hasil analisis procrustes yang memberikan nilai
jarak antarkonfigurasi terkecil dalam setiap iterasi dihilangkan. Metode analisis
procrustes membandingkan matriks data dengan matriks data yang telah direduksi
dengan menghilangkan setiap kolomnya secara berurutan. Untuk mendapatkan
dimensi yang sama, ditambahkan sebuah kolom nol. Peubah yang bersesuaian
dengan nilai jarak procrustes terkecil dalam setiap iterasi dihilangkan.

Untuk menentukan kesesuaian konfigurasi yang dihasilkan metode-metode
seleksi peubah dengan data sebenarnya, dilakukan pengukuran berdasarkan
ukuran kesesuaian analisis procrustes. Hasil seleksi yang memiliki nilai ukuran
efisiensi terbesar dipandang sebagai hasil seleksi 圏 peubah terbaik.
Algoritma implementasi metode-metode seleksi peubah disusun
menggunakan software Mathematica versi 8.0. Berkaitan dengan data yang
digunakan, nilai 圏 didasarkan pada proporsi varians komponen utama dengan
menentukan nilai 糠0 = 0.80 (Jolliffe 1972). Dengan demikian dalam penelitian
ini dipilih 圏 = 7 dan 圏 = 8.
Untuk kemudahan dalam penulisan dalam tabel, metode seleksi peubah
dengan analisis procrustes pada skor komponen utama akan disebut dengan
APSKU dan metode seleksi peubah dengan analisis procrustes akan disebut
dengan AP.
Hasil pengukuran ukuran kesesuaian, 迎2 , hasil seleksi peubah dengan
konfigurasi data awal diberikan pada tabel 1. Pada data TPB IPB tahun akademik
2008/2009 metode seleksi peubah yang dipandang paling mewakili data yang
sebenarnya adalah metode B2, dengan nilai kesesuaian 99.36% untuk 圏 = 7 dan
99.60% untuk 圏 = 8 . Metode seleksi terbaik kedua adalah metode analisis
procrustes pada skor komponen utama dengan 倦 = 3 dan B4 dengan nilai
kesesuaian 99.27% dan 99.45% berturut-turut.

Tabel 1 Urutan metode seleksi peubah yang mempertahankan 圏 peubah
berdasarkan ukuran efisiensi
Ukuran
Efisiensi

迎2

Urutan Metode Seleksi Terbaik
Tahun Akademik 2008/2009
Tahun Akademik 2009-2010
圏= 7
圏= 8
圏 = 7
圏=8

B2

B2

B2


B2

APSKU 倦 = 3

B4

AP

AP

APSKU 倦 = 3

APSKU 倦 = 3

APSKU 倦 = 3

APSKU 倦 = 2

B4


B4

AP
B4

APSKU 倦 = 2

AP

APSKU 倦 = 2

APSKU 倦 = 2

Hasil pengukuran ukuran efisiensi pada data TPB IPB tahun akademik
2009/2010 juga menyatakan metode B2 merupakan metode seleksi terbaik dengan
memberikan nilai efisiensi 99.44% dan 99.61% untuk 圏 = 7 dan 圏 = 8. Metode
seleksi kedua adalah metode analisis procrustes dengan nilai efisiensi 99.44% dan

99.56% untuk 圏 = 7 dan 圏 = 8 berturut-turut. Namun demikian, keempat metode

yang diuji memberikan ukuran efisiensi lebih dari 99.04%.
Berdasarkan pemilihan metode seleksi terbaik mata kuliah yang dipandang
dapat mewakili data TPB IPB tahun akademik 2008/2009 adalah Biologi, Fisika,
Bahasa Indonesia, Bahasa Inggris, Kalkulus, Pengantar Ilmu Pertanian, dan
Pendidikan Kewarganegaraan, termasuk Ekonomi Umum jika ada 8 mata kuliah
yang dipertahankan.
Untuk tahun akademik 2009/2010 mata kuliah yang mewakili data TPB
IPB adalah Biologi, Ekonomi Umum, Fisika, Bahasa Indonesia, Pengantar
Matematika, Pengantar Ilmu Pertanian, dan Pendidikan Kewarganegaraan,
termasuk Bahasa Inggris jika ada 8 mata kuliah yang dipertahankan.

Kata kunci : seleksi peubah, analisis komponen utama, analisis procrustes

© Hak Cipta milik IPB, tahun 2011
Hak Cipta dilindungi Undang-Undang

1.

2.


Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa
mencantumkan atau menyebutkan sumbernya.
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan
karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu
masalah; dan
b. Pengutipan tersebut tidak merugikan kepentingan yang wajar IPB.
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya
tulis dalam bentuk apapun tanpa izin IPB.

SELEKSI PEUBAH DENGAN
ANALISIS KOMPONEN UTAMA DAN PROCRUSTES

ACHMAD MUSLIM

Tesis
sebagai salah satu syarat untuk meraih gelar
Magister Sains pada
Program Studi Matematika Terapan

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR
BOGOR
2011

Penguji Luar Komisi pada Ujian Tesis: Dr. Ir. Endar Hasafah Nugrahani, M.S.

Judul Tesis
Nama
NRP

: Seleksi Peubah dengan Analisis Komponen Utama dan
Procrustes
: Achmad Muslim
: G551090121

Disetujui,
Komisi Pembimbing

Dr. Ir. Siswadi, M.Sc.
Ketua

Dr. Toni Bakhtiar, M.Sc.
Anggota

Diketahui,

Ketua Program Studi
Matematika Terapan

Dekan Sekolah Pascasarjana

Dr. Ir. Endar Hasafah Nugrahani, M.S.

Dr. Ir. Dahrul Syah, M.Sc.Agr.

Tanggal Ujian: 4 Agustus 2011

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah SWT atas segala rahmat
dan karunia-Nya, sehingga karya ilmiah ini berhasil diselesaikan. Judul yang
dipilih dalam penelitian yang dilaksanakan sejak bulan Februaru 2011 ini ialah
Seleksi Peubah dengan Analisis Komponen Utama dan Procrustes.
Penulis menyampaikan ucapan terima kasih dan penghargaan kepada
Bapak Dr. Ir. Siswadi, M.Sc. dan Bapak Dr. Toni Bakhtiar, M.Sc. selaku
pembimbing yang telah banyak membimbing dan mengarahkan, serta kepada
Ibu Dr. Ir. Endar Hasafah Nugrahani, M.S. selaku penguji dan selaku ketua
Program Studi Matematika Terapan yang telah banyak memberikan saran dalam
tesis ini. Ucapan terima kasih juga penulis sampaikan kepada Kementerian Agama
Republik Indonesia yang telah memberikan bantuan berupa beasiswa.
Ucapan terima kasih dan penghargaan juga penulis sampaikan kepada istri,
kedua orang tua, dan seluruh keluarga yang selalu memberikan motivasi,
semangat, doa dan kasih sayang serta kepada semua pihak yang telah membantu
dalam penyelesaian karya ilmiah ini. Semoga karya ilmiah ini bermanfaat dan
berguna sebagai bahan informasi dalam kemajuan ilmu pengetahuan.

Bogor, Agustus 2011

Achmad Muslim.

RIWAYAT HIDUP

Penulis dilahirkan di Jakarta pada tanggal 25 Juni 1980 dari seorang Ayah
H. Nasruddin Ilyas dan Ibu Hj. Sa’amah. Penulis merupakan putra kedua dari tiga
bersaudara.
Pendidikan sarjana ditempuh di Universitas Negeri Jakarta dengan memilih
Jurusan Pendidikan Matematika pada Fakultas Matematika dan Ilmu Pengetahuan
Alam dan menyelesaikannya pada tahun 2004. Pada tahun 2005 penulis menjadi
staf pengajar di Madrasah Aliyah Negeri (MAN) 12 Jakarta.
Pada tahun 2009 penulis memperoleh kesempatan untuk melanjutkan
pendidikan magister pada Sekolah Pascasarjana Institut Pertanian Bogor (SPs
IPB) Program Studi Matematika Terapan melalui jalur Beasiswa Utusan Daerah
Kementerian Agama Republik Indonesia.

DAFTAR ISI
Halaman
DAFTAR TABEL .............................................................................................. xv
DAFTAR GAMBAR .......................................................................................... xvii
DAFTAR LAMPIRAN ....................................................................................... xviii
PENDAHULUAN ..............................................................................................

1

Latar Belakang .............................................................................................
Tujuan Penelitian .........................................................................................
Manfaat Penelitian .......................................................................................

1
4
4

TINJAUAN PUSTAKA......................................................................................

5

Peubah .........................................................................................................
Analisis Peubah Ganda ................................................................................
Analisis Komponen Utama ..........................................................................
Memilih Komponen Utama .........................................................................
Seleksi Peubah dalam Analisis Komponen Utama ......................................
Metode B1 .............................................................................................
Metode B2 .............................................................................................
Metode B3 .............................................................................................
Metode B4 .............................................................................................
Masalah Procrustes ......................................................................................
Analisis Procrustes .......................................................................................
Urutan Optimal dalam Analisis Procrustes ..................................................
Metode Seleksi Peubah dengan Analisis Procrustes pada Skor
Komponen Utama .......................................................................................
Ukuran Efisiensi ..........................................................................................

5
5
6
10
12
12
13
13
14
15
16
20
21
22

METODE PENELITIAN .................................................................................... 25
Sumber Data.................................................................................................
Peubah Penelitian .........................................................................................
Objek Penelitian ...........................................................................................
Langkah-langkah Penelitian .........................................................................
Diagram Alir Metode Seleksi Peubah ..........................................................

25
25
26
26
27

HASIL DAN PEMBAHASAN ........................................................................... 31
Program Seleksi Peubah Menggunakan software Mathematica .................
Algoritma Program Analisis ........................................................................
Algoritma Program Seleksi Peubah .............................................................
Eksplorasi Data ............................................................................................
Analisis Hasil ...............................................................................................
Seleksi Peubah dengan Analisis Procrustes .................................................
Ukuran Efisiensi ...........................................................................................
Interpretasi Hasil Seleksi Peubah pada Data TPB IPB ................................

31
31
32
34
46
52
56
59

KESIMPULAN DAN SARAN ........................................................................... 61
DAFTAR PUSTAKA ......................................................................................... 63
LAMPIRAN ...................................................................................................... 67

DAFTAR TABEL
1.

Halaman
Peubah penelitian ......................................................................................... 25

2.

Konversi huruf mutu .................................................................................... 26

3.

Sebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik
2008/2009 berdasarkan rata-rata nilai mata kuliah ...................................... 34

4.

Ukuran pemusatan dan penyebaran nilai mata kuliah mahasiswa
TPB IPB tahun akademik 2008/2009 berdasarkan simpangan baku ........... 35

5.

Matriks korelasi Pearson nilai mata kuliah TPB IPB tahun akademik
2008/2009..................................................................................................... 37

6.

Varians komponen utama dan persentase total variasi yang dijelaskan
setiap komponen utama pada data TPB IPB tahun akademik 2008/2009 ... 38

7.

Vektor eigen dari matriks kovarians data TPB IPB tahun akademik
2008/2009..................................................................................................... 40

8.

Sebaran nilai mata kuliah mahasiswa TPB IPB tahun akademik
2009/2010 berdasarkan rata-rata nilai mata kuliah ...................................... 40

9.

Ukuran pemusatan dan penyebaran nilai mata kuliah mahasiswa TPB
IPB tahun akademik 2009/2010 berdasarkan simpangan baku .................. 41

10. Matriks korelasi Pearson nilai mata kuliah TPB IPB tahun akademik ........ 43
11. Varians komponen utama dan persentase total variasi yang dijelaskan
setiap komponen utama pada data TPB IPB tahun akademik 2008/2009 ... 44
12. Vektor eigen dari matriks kovarians data TPB IPB tahun
akademik 2009/2010 .................................................................................... 45
13. Hasil seleksi peubah dengan metode B2 ...................................................... 48
14. Hasil seleksi peubah dengan metode B4 ...................................................... 48
15. Hasil seleksi peubah berdasarkan pada analisis komponen utama .............. 50
16. Hasil seleksi peubah dengan analisis procrustes pada komponen utama ... 51
17. Urutan peubah yang terseleksi berdasarkan metode seleksi dengan
analisis procrustes pada komponen utama ................................................... 52
18. Hasil seleksi peubah dengan analisis procrustes .......................................... 55

19. Perbandingan seleksi peubah dengan analisis procrustes pada komponen
utama dengan seleksi peubah dengan analisis procrustes pada data
TPB IPB tahun akademik 2008/2009.......................................................... 56
20. Perbandingan seleksi peubah berdasarkan analisis procrustes pada
komponen utama dengan seleksi peubah dengan analisis procrustes
pada data TPB IPB tahun akademik 2009/2010 .......................................... 56
21. Hasil seleksi peubah untuk data TPB tahun akademik 2008/2009 .............. 57
22. Hasil seleksi peubah untuk data TPB tahun akademik 2009/2010 .............. 57
23. Urutan metode seleksi peubah yang mempertahankan 圏 peubah

berdasarkan ukuran efisiensi ........................................................................ 58

DAFTAR GAMBAR
Halaman
1. Diagram kotak garis nilai mata kuliah mahasiswa TPB IPB tahun
akademik 2008/2009 berdasarkan nilai rata-rata .................................... 36
2. Scree plot dari matriks kovarians data nilai TPB IPB tahun akademik
2008/2009................................................................................................ 40
3. Diagram kotak garis nilai mata kuliah mahasiswa TPB IPB tahun
akademik 2009/2010 berdasarkan nilai rata-rata .................................... 42
4. Scree plot dari matriks kovarians data nilai TPB IPB tahun akademik
2009/2010................................................................................................ 46
5. Diagram alir metode seleksi peubah dengan analisis procrustes ............ 53

DAFTAR LAMPIRAN
1.

Halaman
Data nilai mahasiswa TPB IPB tahun akademik 2008/2009 .................. 69

2.

Data nilai mahasiswa TPB IPB tahun akademik 2009/2010 ................. 71

3.

Diagram alir metode B1 ......................................................................... 73

4.

Diagram alir metode B3 ......................................................................... 74

5.

Analisis komponen utama menggunakan software Mathematica 8.0
pada seleksi peubah ................................................................................. 75

6.

Jarak procrustes menggunakan software Mathematica 8.0 pada seleksi
peubah ..................................................................................................... 77

7.

Implementasi seleksi peubah dengan metode B2 ................................... 79

8.

Implementasi seleksi peubah dengan metode B4 ................................... 81

9.

Implementasi seleksi peubah dengan analisis procrustes pada
skor komponen utama ............................................................................. 83

10. Implementasi seleksi peubah dengan analisis procrustes ....................... 85
11. Implementasi ukuran efisiensi berdasarkan analisis procrustes ............. 87
12. Statistik 警(倹2 ) pada metode seleksi peubah dengan analisis procrustes

pada skor komponen utama tahun akademik 2008/2009, 倦 = 2 ............ 89

13. Statistik 警(倹2 ) pada metode seleksi peubah dengan analisis procrustes

pada skor komponen utama tahun akademik 2008/2009, 倦 = 3 ............ 89

14. Statistik 警(倹2 ) pada metode seleksi peubah dengan analisis procrustes

pada skor komponen utama tahun akademik 2009/2010, 倦 = 2 ............ 90

15. Statistik 警(倹2 ) pada metode seleksi peubah dengan analisis procrustes

pada skor komponen utama tahun akademik 2009/2010, 倦 = 3 ............ 90

16. Statistik 警(倹茅2) pada metode seleksi peubah dengan analisis procrustes

tahun akademik 2008/2009 .................................................................... 91

17. Statistik 警(倹茅2) pada metode seleksi peubah dengan analisis procrustes

tahun akademik 2009/2010 ..................................................................... 91

18. Ukuran efisiensi 迎2 ................................................................................ 92

19. Petunjuk penggunaan implementasi software Mathematica 8.0 pada

seleksi peubah ........................................................................................ 93

Ku persembahkan untuk

Istriku Silvi Nurjanah, S.Pd.I
**Enya & Babeh**
Suryanih, S.Pd & Patmawati, S.Kom

1

PENDAHULUAN
Latar Belakang
Dalam proses pengambilan keputusan diperlukan informasi yang
mendukung pengambilan keputusan secara tepat berdasarkan data yang ada. Oleh
karena itu dibutuhkan cara yang tepat untuk menganalisis data yang tersedia agar
diperoleh informasi yang bermanfaat.
Pada umumnya penelitian-penelitian yang berkaitan dengan dunia nyata
melibatkan banyak peubah. Setiap peubah diukur secara individual untuk
menelusuri pengaruh antarpeubah. Namun kurangnya informasi pendukung yang
dapat menjadi acuan dalam menentukan peubah-peubah yang memiliki pengaruh
yang besar berkaitan dengan penelitian yang dilakukan, menyebabkan pengukuran
dilakukan dengan sebanyak mungkin peubah dengan harapan tidak ada peubah
penting yang tertinggal. Masalah yang kemudian dihadapi adalah kesulitan untuk
menginterpretasikan himpunan data yang besar.
Salah satu cara untuk membantu menyelesaikan masalah ini adalah dengan
pengurangan dimensi. Teknik pengurangan dimensi yang telah dikenal secara
umum adalah analisis komponen utama (Principal Component Analysis). Analisis
komponen utama merupakan alat untuk mengurangi dimensi yang menggantikan
peubah dalam data peubah ganda dengan sejumlah peubah turunan yang lebih
sedikit (Al-Kandari & Jolliffe 2005). Analisis komponen utama dilakukan untuk
membantu dalam penginterpretasian data, di mana komponen utama yang
diperoleh merupakan kombinasi linear dari semua peubah asli yang memiliki
varians terbesar secara berurutan dan tidak berkorelasi dengan komponen utama
sebelumnya. Menurut Jolliffe (2002) adalah mungkin untuk mengurangi sejumlah
喧 peubah menjadi sejumlah 倦, 倦 企 喧, komponen utama agar lebih mudah untuk

diinterpretasikan, akan tetapi karena setiap komponen utama merupakan
kombinasi linear dari semua peubah asli, tidak ada jaminan untuk mendapatkan
interpretasi yang sederhana.
Salah satu pendekatan dalam menyelesaikan masalah ini adalah dengan
seleksi peubah yaitu mengurangi peubah-peubah yang mungkin tidak memiliki

2

kaitan dengan masalah yang ingin diteliti ataupun dengan mengurangi peubahpeubah yang memberikan kontribusi informasi yang sedikit pada variasi data.
Alasan seleksi peubah untuk merepresentasikan varians total pada
keseluruhan data dapat berdasarkan pada pertimbangan bahwa beberapa peubah
mungkin sulit ataupun mahal untuk diukur pada studi berikutnya, atau meskipun
peubah tersebut biasanya dapat diinterpretasikan, komponen utama yang telah
ditentukan dapat menjadi sulit diinterpretasikan jika terlalu banyak peubah yang
terlibat.
Analisis procrustes adalah alat analisis berdasarkan asas kuadrat-terkecil
yang dapat digunakan untuk mengukur kemiripan maksimal antarkonfigurasi titik
melalui serangkaian transformasi linear (Bakhtiar & Siswadi 2011).
Analisis procrustes menggunakan transformasi linear berupa translasi,
rotasi, dan dilasi, dengan salah satu konfigurasi dibuat tetap dan konfigurasi yang
lain ditransformasi untuk dibandingkan agar sedekat mungkin dengan konfigurasi
yang dibuat tetap. Analisis procrustes mendasarkan pengukurannya pada norma
kuadrat perbedaan konfigurasi matriks. Nilai numerik yang dihasilkan dapat
digunakan untuk memperkirakan tingkat kesesuaian antarkonfigurasi.
Analisis procrustes pertama kali dikemukakan oleh Hurley & Cattel
(1962) untuk menyelesaikan masalah persamaan regresi berganda dengan
mengestimasi matriks transformasi yang mengaitkan struktur faktor matriks.
Namun demikian Green (1952) telah memberikan ide yang sama pada analisis
faktor dengan aproksimasi ortogonal pada struktur oblique. Schönemann (1966)
memberikan solusi umum untuk masalah procrustes ortogonal yang memberikan
solusi langsung pada masalah kuadrat terkecil dengan menggunakan matriks
transformasi yang ortogonal serta dapat diterapkan pada matriks yang memiliki
rank tidak penuh. Schönemann & Carroll (1970) menguraikan prosedur dalam
penyuaian dua buah matriks berdasarkan pada rotasi, translasi, dan dilasi yang
belum diketahui.
Solusi dari masalah procrustes ortogonal umum dari dua atau lebih matriks
dilaporkan oleh Gower (1975), dengan demikian kasus dua matriks merupakan
kasus khusus analisis procrustes klasik. Lissitz et al. (1976) memberikan
generalisasi masalah procrustes dengan memberikan bobot pada kolom dengan

3

solusi memiliki syarat ortogonalitas pada transformasinya. Ten Berge (1977)
memberikan kondisi yang dibutuhkan dalam memaksimalkan penyesuaian rotasi
matriks dalam sudut pandang kuadrat terkecil dan memberikan modifikasi pada
metode Gower pada analisis procrustes umum. Borg (1978) menguraikan analisis
procrustes pada kasus dengan matriks yang memiliki jumlah baris berbeda
sedangkan Ten Berge & Knol (1984) menguraikan rotasi procrustes ortogonal
untuk memaksimalkan kesesuaian antara dua matriks yang memiliki jumlah
kolom yang berbeda dan kemudian memperumum untuk kasus lebih dari dua
matriks. Koschat & Swayne (1991) mendeskripsikan dan menganalisis kriteria
dan algoritma rotasi pada matriks dengan kolom terboboti. Dijksterhuis & Gower
(1991) merangkum masalah procrustes dalam sebuah buku. Perkembangan
terakhir diberikan oleh Bakhtiar & Siswadi (2011) yang memaparkan urutan
transformasi optimal pada analisis procrustes.
Ide untuk seleksi peubah diawali oleh Beale et al. (1967) yang
mengusulkan penghapusan atau pengurangan peubah pada analisis regresi yang
tidak memberikan kontribusi secara signifikan. Jolliffe (1972) memaparkan
beberapa metode penghapusan peubah berdasarkan pada koefisien korelasi,
analisis komponen utama, dan berdasarkan analisis kelompok, yang dapat
digunakan untuk menentukan peubah-peubah yang dapat dikeluarkan dari analisis.
King & Jackson (1999) mencoba mengaplikasikan metode seleksi peubah
berdasarkan analisis komponen utama, dan menyarankan metode B4 sebagai
metode seleksi peubah dalam studi ekologi. George (2000) membahas masalah
seleksi peubah sebagai kasus khusus dalam masalah seleksi model dalam regresi
berganda. Al-Kandari & Jollife (2001) mendeskripsikan beberapa kriteria seleksi
peubah berdasarkan pada kovarians terbesar pada komponen utama, dan
mengusulkan penggunaan kriteria seleksi peubah yang tidak tunggal. Al-Kandari
& Jolliffe (2005) meninjau ulang beberapa metode dalam seleksi peubah dan
interpretasi terhadap variasi data.
Institut Pertanian Bogor (IPB) merupakan salah satu perguruan tinggi yang
memiliki komitmen untuk memberikan pendidikan kepada seluruh anak bangsa
dengan standar mutu pendidikan yang tinggi. Mahasiswa IPB berasal dari
berbagai sekolah di Indonesia yang telah mengikuti berbagai jalur seleksi yang

4

telah disediakan IPB. Karena beragamnya input yang dimiliki oleh IPB perlu
diadakan standardisasi kualitas yang melibatkan seluruh mahasiswa baru melalui
program pendidikan komprehensif ditahap awal melaui program Pendidikan
Tingkat Persiapan Bersama (PTPB) yang diasuh oleh Direktorat Pendidikan
Tingkat Persiapan Bersama.
Untuk memberikan gambaran mata kuliah-mata kuliah yang memiliki
pengaruh terbesar dalam mendeskripsikan standar mutu TPB IPB diperlukan
analisis yang mendalam terhadap hasil belajar yang diperoleh mahasiswa TPB
IPB dengan menganalisis mata kuliah-mata kuliah dominan dalam menjelaskan
variasi data TPB IPB sehingga diperoleh hasil interpretasi yang lebih baik.

Tujuan dan Manfaat Penelitian
Berdasarkan latar belakang masalah, tujuan dari penelitian ini (dalam studi
kasus mahasiswa TPB IPB tahun akademik 2008/2009 dan 2009/2010) ialah:
1. Mengkaji dan membandingkan metode seleksi peubah berdasarkan pada
analisis komponen utama dan procrustes.
2. Menyusun

program

seleksi

peubah

dengan

menggunakan

software

Mathematica 8.0.
3. Mengaplikasikan program seleksi peubah pada data TPB IPB.
Adapun manfaat dari penelitian ini adalah:
1. Menghasilkan program seleksi peubah dengan menggunakan software
Mathematica 8.0.
2. Memberikan sebuah cara untuk melakukan pra-analisis dalam sebuah
penelitian sebelum melakukan analisis yang sebenarnya agar mendapatkan
hasil yang maksimal sesuai dengan penelitian yang dilakukan.
3. Analisis hasil seleksi program seleksi peubah yang diaplikasikan pada data
TPB IPB tahun akademik 2008/2009 dan 2009/2010 dapat dijadikan sebagai
acuan bagi Direktorat Pendidikan Tingkat Persiapan Bersama IPB dalam
melakukan analisis hasil pembelajaran mahasiswa TPB IPB.

5

TINJAUAN PUSTAKA
Peubah
Peubah (variable) adalah beberapa karakteristik yang berbeda dari objek
yang satu dengan objek yang lain atau berbeda dari waktu ke waktu (Everitt &
Skrondal 2010). Dasar dari analisis peubah ganda adalah kombinasi linear dari
peubah-peubah yang diberikan bobot secara empiris. Peubah ditentukan dan
dijelaskan oleh peneliti sedangkan bobotnya ditentukan dengan teknik peubah
ganda yang sesuai dengan tujuan penelitian. Sejumlah 喧 peubah dengan bobotnya
dapat dinyatakan secara matematis

軽件健欠件 喧結憲決欠月 = 拳1 隙1 + 拳2 隙2 + 橋 + 拳喧 隙喧 ,

dengan 隙件 merupakan peubah yang diamati dan 拳件 merupakan bobot yang

ditentukan dengan teknik peubah ganda.

Analisis peubah ganda
Analisis peubah ganda (multivariate analysis) merupakan istilah umum
untuk metode-metode analisis yang penting dalam menganalisis data peubah
ganda (Everitt & Skrondal 2010). Dengan demikian analisis data yang melibatkan
lebih dari satu peubah secara serempak dapat dipandang sebagai analisis peubah
ganda.
Berbagai teknik analisis peubah ganda ada yang merupakan perluasan dari
analisis peubah tunggal. Untuk dapat melakukan analisis peubah ganda diperlukan
pemahaman konsep pada penelitian berkaitan dengan jenis skala pengukuran.
Beberapa teknik analisis peubah ganda antara lain analisis komponen
utama dan analisis faktor, regresi berganda dan korelasi berganda, analisis
diskriminan, analisis korelasi kanonik, analisis varians dan kovarians peubah
ganda, conjoint analysis, analisis gerombol, analisis korespondensi, structural
equation modeling, dan confirmatory factor analysis.

6

Analisis Komponen Utama
Analisis komponen utama merupakan salah satu teknik analisis peubah
ganda yang berkaitan dengan penjelasan struktur varians-kovarians peubah
dengan cara mentransformasi peubah-peubah awal menjadi peubah-peubah baru
yang tidak saling berkorelasi dengan tujuan mereduksi dimensi matriks data
sehingga lebih mudah dalam menginterpretasi data yang diperoleh.
Analisis komponen utama membentuk peubah baru yang merupakan
kombinasi linear dari seluruh peubah asli, yang disebut komponen utama
(principal components). Meskipun dibutuhkan 喧 komponen untuk menunjukkan

keseluruhan variasi data, seringkali variasi ini dapat diwakili oleh 倦 komponen
utama, dengan 倦 企 喧 (Jollife 2002). Dengan demikian data awal yang
mengandung 券 pengukuran dengan 喧 peubah dapat direduksi menjadi 券
pengukuran dengan 倦 komponen utama.

Secara aljabar, komponen utama merupakan kombinasi linear dari peubah

隙1 , 隙2 , . . . , 隙喧 yang memaksimalkan varians data. Secara geometris, kombinasi

linear

ini

menunjukkan

perubahan

koordinat

yang

diperoleh

dengan

memproyeksikan sistem awal pada 隙1 , 隙2 , . . . , 隙喧 sebagai sumbu koordinat.
Sumbu koordinat baru ini menyatakan arah dengan variasi maksimum dan
memberikan interpretasi yang lebih sederhana pada struktur kovarians.
Misalkan kombinasi linear 始1劇 散 dari vektor 散 memiliki varians terbesar,

dengan 始1 merupakan vektor koefisien 拳11 , 拳12 , 橋 , 拳1喧 , sehingga
始1劇 散



= 拳11 隙1 + 拳12 隙2 + 橋 + 拳1喧 隙喧 = 布 拳1件 隙件 .

(1)

件=1

Kombinasi linear kedua, 始劇2 散, tidak berkorelasi dengan 始1劇 散. Kombinasi

linear ini memiliki varians terbesar kedua, dan seterusnya, sehingga kombinasi

linear ke-倦, 始劇倦 散, memiliki varians maksimum ke-倦 dan tidak berkorelasi dengan

始1劇 散, 始劇2 散, 橋 , 始劇倦伐1 散. Dengan demikian terdapat matriks bobot yang tidak


diketahui 始件 = 盤拳件1 , 拳件2 , 橋 , 拳件喧 匪 .

Misalkan 散 memiliki matriks kovarians 鮮 dengan elemen 購件倹 merupakan

kovarians antara peubah ke-i dan peubah ke-j dari 散 pada saat 件 塙 倹 dan

7

merupakan varians peubah ke-j pada saat 件 = 倹. Jika 隙 memiliki nilai harapan
継岷隙峅 maka kovarians 隙 diberikan oleh

cov岷隙峅 = 継 岷岫隙 伐 継 岷隙峅岻岫隙 伐 継 岷隙峅岻劇 峅.

Misalkan 姿件 = 始劇件 散 maka

継岷姿件 峅 = 継岷始劇件 散峅 = 始劇件 継岷散峅.

Kovarians 姿件 diberikan oleh

cov岷姿i 峅 = E岷岫姿件 伐 E岷姿件 峅岻岫姿件 伐 E岷姿件 峅岻T 峅

cov岷Yi 峅 = E岷姿件 姿件 劇 峅 伐 E岷姿件 峅岫E[姿件 ]岻T

Var岷桁峅 = E岷始劇件 散散劇 始件 峅 伐 継 岷始劇件 散峅岫継[始劇件 散]岻劇

Var岷桁峅 = 始劇件 継 岷散散劇 峅始件 伐 始劇件 継 岷散峅岫始劇件 継[散]岻劇
Var岷桁峅 = 始劇件 継 岷散散劇 峅始件 伐 始劇件 継 岷散峅岫継[散]岻劇 始件
Var岷桁峅 = 始劇件 岫継岷散散劇 峅 伐 継 岷散峅岫継[散]岻劇 岻始件
Var岷桁峅 = 始劇件 cov岷散峅始件
Var岷桁峅 = 始劇件 鮮始件

(2)

Untuk menentukan bentuk komponen utama, pandang kombinasi linear
pertama 始1劇 散 dan vektor 始1 yang memaksimumkan var岷始1劇 散峅 = 始1劇 鮮始1 . Nilai

var岷始1劇 散峅 dapat dibuat sebesar mungkin dengan memilih nilai 始1 yang besar,

oleh karena itu dibutuhkan batasan 始1劇 始層 = 1, yaitu jumlah kuadrat elemen 始1
sama dengan 1.

Untuk memaksimumkan 始1劇 鮮始1 dengan syarat 始1劇 始1 = 1, pendekatan

standar yang digunakan adalah menggunakan metode pengganda Lagrange.

Misalkan fungsi 血岫拳岻 akan dimaksimumkan dengan syarat 訣岫拳岻 = 潔.

Didefiniskan fungsi Lagrange

失岫拳, 膏岻 = 血岫拳岻 伐 膏岫訣岫拳岻 伐 潔岻,

(3)

dengan 膏 adalah pengganda Lagrange. Diferensiasi fungsi Lagrange terhadap

kedua argumen dan mengaturnya sama dengan nol diperoleh
項訣
項失 項血
=
伐膏
=0
項拳
項拳 項拳

項失
= 伐訣岫拳岻 + 潔 = 0.
項膏

(4)

(5)

8

Diferensiasi fungsi 失 pada persamaan (5) memberikan kembali syarat awal

訣岫拳岻 = 潔. Pada persamaan (4) jika nilai 膏 = 0 maka diperoleh masalah optimasi

tanpa syarat. Dengan demikian, apabila syarat telah terpenuhi nilai fungsi objektif

失 sama dengan nilai fungsi objektif 血. Apabila terdapat lebih dari satu syarat,
cukup dengan menambahkan pengganda Lagrange yang lain.

Berdasarkan uraian di atas didefinisikan fungsi Lagrange
失 = 始1劇 鮮始1 伐 膏岫始1劇 始1 伐 1岻,

(6)

鮮始1 伐 膏始1 = 0

(7)

盤鮮 伐 膏薩喧 匪始1 = 0,

(8)

dengan 膏 adalah pengganda Lagrange. Diferensiasi fungsi Lagrange terhadap 始1

memberikan

atau

dengan 薩喧 merupakan matriks identitas berukuran 喧 × 喧. Dengan demikian 膏

adalah nilai eigen dari 鮮 dan 始1 merupakan vektor eigen yang bersesuaian. Untuk

menentukan vektor eigen yang memberikan kombinasi linear 始1劇 散 nilai varians

terbesar, kuantitas yang akan dimaksimumkan ialah

Jadi,

始1劇 鮮始1 = 始1劇 始1 = 始1劇 始1 = .

(9)

harus sebesar mungkin. Dengan demikian, 始1 adalah vektor eigen yang

bersesuaian dengan nilai eigen

terbesar dari 鮮, dan var岷始1劇 散峅 = 始1劇 鮮始1 = 膏1 ,

yang merupakan nilai eigen yang terbesar.

Komponen utama kedua, 始劇2 散, memaksimumkan 始劇2 鮮始2 dengan syarat

始劇2 始2 = 1 dan tidak berkorelasi dengan 始1劇 散, atau ekivalen dengan syarat

cov岷始1劇 散, 始劇2 散峅 = 0, dengan cov岷捲, 検峅 menyatakan kovarians antara peubah x

dan y. Diperoleh

cov岷始1劇 散, 始劇2 散峅 = 始1劇 鮮始2 = 始劇2 鮮始1 = 始劇2 1 始1劇
=

Didefinisikan kembali fungsi Lagrange


1 始2 始1

=


1 始1 始2

=0

失 茅 = 始劇2 鮮始2 伐 膏岫始劇2 始2 伐 1岻 伐 剛始劇2 始1 ,

(10)
(11)

dengan 膏 dan 剛 adalah pengganda Lagrange. Diferensiasi 失 茅 terhadap 始2 dan

mengaturnya sama dengan nol memberikan

鮮始2 伐 膏始2 伐 剛始1 = 0.

(12)

9

Dengan menggandakan persamaan (12) dengan 始1劇 diperoleh
始1劇 鮮始2 伐 膏始1劇 始2 伐 剛始1劇 始1 = 0.

(13)

鮮始2 伐 膏始2 = 0

(14)

盤鮮 伐 膏薩喧 匪始2 = 0.

(15)

Berdasarkan (10) dan (13) memberikan 剛 = 0, sehingga dari persamaan (12)
atau

Dengan demikian 膏 merupakan nilai eigen 鮮 dan 始2 merupakan vektor eigen

yang bersesuaian. Oleh karena 膏 = 始劇2 鮮始2 maka 膏 juga harus sebesar mungkin.

Dengan asumsi 鮮 tidak memiliki nilai eigen yang berulang maka 膏 merupakan
nilai eigen 鮮 terbesar kedua dan 始2 merupakan vektor eigen yang bersesuaian.

Berdasarkan uraian di atas, dapat ditunjukkan bahwa untuk komponen

utama ketiga, keempat sampai dengan ke-p, vektor koefisien 始3 , 始4 , 橋 , 始喧
merupakan vektor eigen 鮮 yang bersesuaian dengan nilai eigen 膏3 , 膏4 , 橋 , 膏喧

ketiga, keempat, sampai nilai eigen terkecil berturut-turut. Secara umum,
komponen utama ke-k dari 散 adalah 始劇倦 散 dan

var岷始劇倦 散峅 = 膏倦 untuk 倦 = 1, 2, 橋 , 喧,

(16)

dengan 膏倦 merupakan nilai eigen 鮮 terbesar ke-k dan 始倦 adalah vektor eigen yang
bersesuaian.

Secara umum, transformasi peubah asal menjadi komponen utama dapat
dinyatakan sebagai 桟 = 撒散, dengan 撒 merupakan matriks bobot yang disebut

matriks koefisien komponen utama yang terdiri dari vektor eigen 鮮 . Posisi setiap
objek pada sistem koordinat komponen utama yang baru disebut skor yang
diberikan oleh
燦 = 散撒,

dengan 燦 disebut matriks skor komponen utama.


Total varians yang dijelaskan oleh komponen utama adalah デ件=1 膏件

sehingga proporsi dari total varians yang dijelaskan 倦 komponen utama pertama
ialah

dengan 倦 = 1, 2, . . . . , p.

デ倦件=1 膏件
,
デ喧件=1 膏件

(17)

10

Memilih Komponen Utama
Jolliffe (2002) dan Andrade et al. (2004) memaparkan beberapa aturan
dalam menentukan banyaknya komponen utama pertama yang harus dipilih untuk
mewakili variasi matriks data 散.
Persentase Kumulatif Variasi Total
Komponen utama merupakan kombinasi linear dari peubah acak 隙1 ,

隙2 , . . . , 隙喧 yang memaksimalkan variasi data secara berurutan, dengan varians


komponen utama ke-倦 adalah 膏倦 dan total varians デ件=1 膏件 . Dengan demikian

persentase variasi yang dijelaskan oleh 倦 komponen utama pertama adalah
建倦 = 100

デ倦件=1 膏件
,
デ喧件=1 膏件

(18)

dengan 倦 判 喧. Apabila menggunakan matriks korelasi, (18) dapat direduksi

menjadi



100
建倦 =
布 膏件 .


(19)

件=1

Pemilihan 建倦 pada interval 70% hingga 90% akan memberikan aturan penentuan
nilai 倦 komponen utama yang mempertahankan sebagian besar informasi yang

dimiliki 散.

Ukuran Variasi Komponen Utama
Aturan ini khusus digunakan saat menggunakan matriks korelasi,
meskipun dapat diadopsi untuk beberapa matriks kovarians tertentu. Pada aturan
ini jika semua elemen 散 independen, maka komponen utama sama dengan peubah

awal dan memiliki varians pada mariks korelasi. Dengan demikian komponen
utama yang memiliki varians kurang dari 1 atau 膏倦 < 1 dianggap kurang memiliki

informasi sehingga dapat dihilangkan.

Metode Cross-Validatory
Eastment & Krzanowski (1982) pada Andrade et al. (2004) memberikan
pendekatan dalam penentuan 倦 komponen utama dengan menggunakan

penguraian nilai singular secara langsung. Misalkan penguraian nilai singular 散

11

ialah 散 = 山拶惨劇 dan 捲件倹 , 憲件倹 , 穴倹 , 懸件倹 menyatakan elemen dari matriks 散, 山, 拶,

dan 惨. Jika 倦 komponen utama pertama dipandang dapat mewakili variasi data

dan 岫喧 伐 倦岻 komponen dipandang kurang memiliki informasi yang signifikan
maka 捲件倹 = デ倦兼 =1 憲件兼 穴兼 懸倹兼 + 綱件倹

dengan 綱件倹

merupakan residual noise.

Prediktor dari 捲件倹 ditentukan dengan formula


捲葡件倹 = 布 憲件兼 穴兼 懸倹兼 .
兼 =1

Ukuran kesesuaian untuk 倦 dapat diperoleh dari prediktor semua elemen 散

dengan menentukan jumlah kuadrat selisih antara elemen observasi dengan
elemen prediksi, yaitu




1
2
PRESS岫倦岻 =
布 布盤捲葡件倹 伐 捲件倹 匪 .
券喧

(21)

件=1 倹 =1

Akan tetapi data 捲件倹 seharusnya tidak dipergunakan dalam memprediksi

捲葡件倹 . Untuk mencegah hal tersebut adalah dengan menghapus baris ke-i dari 散,
kemudian mengoreksi kolomnya terhadap rataan dan menyatakan hasilnya

sebagai 散岫伐件岻 . Demikian pula menghapus kolom ke-j dari 散, mengoreksi
kolomnya terhadap rataannya dan menyatakan hasilnya dengan 散(伐倹 ) . Selanjutnya

dengan melakukan penguraian nilai singular dua matriks ini menjadi
拍拶
拍惨
拍劇
散岫伐件岻 = 山

拍 = diag盤穴1違 , 穴違2 , 橋 , 穴違喧 匪 dan
拍 = 岫懸違嫌建 岻 dan 拶
拍 = 岫憲博嫌建 岻, 惨
dengan 山
風拶
風惨
風劇
散(伐倹 ) = 山

風 = 岫憲葡嫌建 岻, 惨
風 = diag盤穴寞1 , 穴寞2 , 橋 , 穴寞喧伐1 匪. Dari konstruksi ini,
風 = 岫懸葡嫌建 岻 dan 拶
dengan 山

maka prediktor dapat dinyatakan sebagai


捲葡件倹 = 布 峭憲葡件兼 謬穴寞兼 嶌 峭謬穴違兼 懸違倹兼 嶌.

(22)

兼 =1

Perbedaan dengan (20), prediktor (22) tidak menggunakan 捲件倹 . Untuk

menentukan nilai optimum 倦, PRESS岫倦岻 dihitung untuk nilai 倦 yang berbeda dari
倦 sampai 岫喧 伐 1岻. Eastment & Krzanowski (1982) menyarankan untuk
menentukan

12

激倦 = 犯

岷PRESS 岫倦伐1岻伐PRESS 岫倦岻峅エ経倦
PRESS 岫倦岻斑経堅結嫌 岫倦岻

般,

(23)

dengan 経倦 adalah derajat bebas yang dibutuhkan untuk menyesuaikan komponen

ke-倦 dan 経堅結嫌 岫倦岻 adalah derajat bebas yang tersisa setelah penyesuaian komponen

ke-倦. Nilai 経倦 = 券 + 喧 伐 2倦 dan 経堅結嫌 岫倦岻 diperoleh dengan pengurangan secara
berurutan yang dimulai dari derajat bebas 岫券 伐 1岻喧 dari matriks 散 yang telah

terkoreksi

terhadap

rataannya,

yaitu

経堅結嫌 岫倦伐1岻 伐 岷券 + 喧 伐 2岫倦 伐 1岻峅.

経堅結嫌 岫1岻 = 岫券 伐 1岻喧

dan

経堅結嫌 岫倦岻 =

Nilai 撒暫 menyatakan peningkatan kekuatan prediksi saat penambahan

komponen ke-k, dan dibandingkan dengan rataan informasi prediksi pada
komponen yang tersisa. Dengan demikian nilai komponen yang signifikan, k,
diberikan oleh nilai terbesar dari 撒暫 yang lebih besar dari 1. Notasi PRESS
merupakan akronim dari PREdiction Sum of Square.

Seleksi Peubah dalam Analisis Komponen Utama
Jolliffe (1972) menyarankan beberapa metode dalam memilih subset 圏

peubah terbaik yang tetap mempertahankan variasi data berdasarkan pada analisis
komponen utama.

Metode B1
Metode B1 pertama kali dikembangkan oleh Beale et al. (1967). Metode
B1 diawali dengan melakukan analisis komponen utama pada matriks data yang
mengandung 券 objek dan 喧 peubah, dan penentuan nilai-nilai eigen. Jika terdapat

喧1 nilai eigen yang lebih kecil dari suatu nilai tertentu, 膏0 , maka vektor eigen
yang bersesuaian, yaitu komponen utama itu sendiri, dibandingkan secara

berurutan, mulai dari komponen yang bersesuaian dengan nilai eigen terkecil
pertama dilanjutkan dengan komponen utama yang bersesuaian dengan nilai eigen
terkecil kedua dan seterusnya. Satu peubah kemudian dikaitkan dengan setiap 喧1

komponen utama, yaitu peubah yang memiliki koefisien terbesar pada komponenkomponen yang sedang dibandingkan dan belum dikaitkan dengan komponen
yang dibandingkan sebelumnya. Peubah yang dikaitkan dengan 喧1 komponen
utama tersebut kemudian dihilangkan.

13

Setelah satu peubah dihilangkan, proses dilanjutkan dengan melakukan
kembali analisis komponen utama untuk matriks data dengan 岫喧 伐 1岻 peubah.

Jika terdapat 喧2 nilai eigen yang lebih kecil dari 膏0 , maka sebuah peubah kembali

dikaitkan dengan setiap 喧2 komponen utama yang bersesuaian dengan cara yang
sama dengan sebelumnya. Peubah yang dikaitkan ini kemudian dihilangkan.

Analisis komponen utama kembali dilakukan untuk 岫喧 伐 2岻 peubah yang

tersisa, dan prosedur ini terus dilakukan hingga semua nilai eigen pada analisis

komponen terakhir lebih dari 膏0 , sehingga tersisa 圏 peubah. Nilai 圏 ini akan
bergantung pada pemilihan 膏0 .

Metode B1 melakukan analisis komponen utama dalam setiap proses

penghilangan peubah. Oleh karena itu metode B1 membutuhkan waktu komputasi
yang besar sehingga tidak direkomendasikan.

Metode B2
Metode B2 sama seperti metode B1, akan tetapi hanya menggunakan satu
kali analisis komponen utama. Metode B2 diawali dengan melakukan analisis
komponen utama pada matriks data yang mengandung mengandung 券 objek dan 喧

peubah. Jika telah ditentukan bahwa 圏 peubah akan dipertahankan maka dipilih

koefisien dengan nilai mutlak terbesar untuk setiap (喧 伐 圏) komponen utama
terakhir dan dikaitkan dengan peubah yang bersesuaian. Setelah dibandingkan

岫喧 伐 圏岻 peubah ini kemudian dihilangkan mulai dari komponen utama yang
terakhir.

Metode B3
Metode B3 membutuhkan satu kali analisis komponen utama dan
penentuan 圏 peubah yang akan dipertahankan seperti metode B2. Metode B3

diawali dengan melakukan analisis komponen utama pada matriks data yang
mengandung 券 objek dan 喧 peubah. Proses seleksi dilanjutkan dengan

menentukan nilai dari jumlah kuadrat koefisien setiap 喧 peubah pada (喧 伐 圏)

komponen utama terakhir. Jumlah-jumlah ini selanjutnya diurutkan secara

menurun dan peubah yang bersesuaian dengan jumlah kuadrat 岫喧 伐 圏岻 pertama

14

dalam urutan tersebut dihilangkan. Dengan demikian peubah yang dipilih adalah
peubah yang memiliki nilai
デ喧倹=圏+1 結倹件2

(24)

yang minimum. Dalam formula ini 結倹件 adalah koefisien dari peubah ke-i pada
komponen utama ke-j.

Metode yang secara komputasi serupa dengan B3 ialah menggunakan
proporsi varians peubah ke-i yang dijelaskan oleh 圏 komponen utama pertama.

Proporsi varians peubah ke-i yang dijelaskan oleh 圏 komponen utama pertama
ialah



布 膏倹 結倹件2 ,

(25)

倹 =1

dengan 膏倹 adalah nilai eigen ke-j dan 結倹件 adalah koefisien peubah ke-i pada

komponen utama ke-j. Metode ini memilih 圏 peubah yang memiliki nilai

maksimum dari デ倹 =1 膏倹 結倹件2 , yaitu

1伐



布 膏倹 結倹件2
倹 =1



= 布 膏倹 結倹件2
倹 =圏+1

(26)



minimum, sementara B3 memilih peubah di mana デ倹 =圏+1 膏倹 結倹件2 minimum.
Metode B4
Metode B4 membutuhkan satu analisis komponen utama dan penentuan 圏

peubah yang akan dipertahankan. Metode B4 dapat dipandang sebagai versi
backward B2. Metode B4 diawali dengan melakukan analisis komponen utama
pada matriks data yang mengandung mengandung 券 objek dan 喧 peubah. Untuk
melakukan proses seleksi, dipilih koefisien dengan nilai mutlak terbesar untuk
setiap 圏 komponen utama pertama dan dibandingkan mulai dari komponen utama

pertama secara berurutan seperti halnya pada metode B1 dan metode B2. Dengan
demikian, 圏 peubah akan dipertahankan dan (喧 伐 圏) peubah dihilangkan.

Pada metode B1 jumlah peubah yang dipertahankan, 圏, ditentukan dengan

pemilihan 膏0 , dan pada metode B2, B3 dan B4 nilai 圏 dapat dipilih sama dengan

banyak