Kajian Pengaruh Noise dalam Analisis Komponen Utama untuk Peubah-Peubah yang Berkorelasi

KAJIAN PENGARUH NOISE DALAM ANALISIS
KOMPONEN UTAMA UNTUK PEUBAH-PEUBAH
YANG BERKORELASI

FAJRIANZA ADI NUGRAHANTO

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Kajian Pengaruh Noise
dalam Analisis Komponen Utama untuk Peubah-Peubah yang Berkorelasi adalah
benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan
dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang
berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari
penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di
bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, April 2014
Fajrianza Adi Nugrahanto
NIM G14090014

ABSTRAK
FAJRIANZA ADI NUGRAHANTO. Kajian Pengaruh Noise dalam Analisis
Komponen Utama untuk Peubah-Peubah yang Berkorelasi. Dibimbing oleh
KUSMAN SADIK dan YENNI ANGRAINI.
Analisis Komponen Utama (AKU) merupakan salah satu teknik peubah
ganda yang pada umumnya digunakan untuk mereduksi dimensi data. AKU
menggunakan matriks ragam-peragam sebagai informasi awal analisisnya.
Perubahan nilai pada matriks ragam-peragam dapat mengubah skor AKU yang
dihasilkan. Salah satu kondisi yang dapat menyebabkan perubahan ini adalah
adanya pengaruh noise pada data. Kondisi tersebut telah diteliti oleh Tsakiri dan
Zurbenko (2011), dengan hasilnya menunjukkan bahwa terdapat perbedaan dari
skor AKU ketika data dipengaruhi oleh noise. Penelitian ini dilakukan untuk
melihat pengaruh noise pada data dengan peubah-peubah yang saling berkorelasi.
Hasil penelitian menunjukkan bahwa noise memberikan pengaruh yang besar

pada hasil AKU untuk nilai koefisien korelasi tertentu.
Kata kunci: analisis komponen utama, korelasi, matriks ragam-peragam, noise

ABSTRACT
FAJRIANZA ADI NUGRAHANTO. Study on Effect of Noise on Principal
Component Analysis for Correlated Variables. Supervised by KUSMAN SADIK
and YENNI ANGRAINI.
Principal Component Analysis (PCA) is one of multivariate techniques that
generally used for dimension reduction. PCA uses covariance matrices as initial
information. Change in values of those matrices can result in different PCA scores.
One of conditions that can cause the change is noise presence, which was studied
by Tsakiri and Zurbenko (2011). It showed that PCA results will be different
when the data were affected by noise. This study was conducted to see the effect
of noise on PCA results for data with correlated variables. The results showed that
noise have greater influence on PCA results for certain correlation coefficient
values.
Keywords: correlation, covariance matrices, noise, principal component analysis

KAJIAN PENGARUH NOISE DALAM ANALISIS
KOMPONEN UTAMA UNTUK PEUBAH-PEUBAH

YANG BERKORELASI

FAJRIANZA ADI NUGRAHANTO

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika
pada
Departemen Statistika

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

Judul Skripsi : Kajian Pengaruh Noise dalam Analisis Komponen Utama untuk
Peubah-Peubah yang Berkorelasi
Nama
: Fajrianza Adi Nugrahanto

NIM
: G14090014

Disetujui oleh

Dr Ir Kusman Sadik, MSi
Pembimbing I

Yenni Angraini, SSi, MSi
Pembimbing II

Diketahui oleh

Dr Ir Anang Kurnia, MSi
Ketua Departemen

Tanggal Lulus:

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas

segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang
dipilih dalam penelitian ini ialah pengaruh noise terhadap matriks ragam-peragam,
dengan judul Kajian Pengaruh Noise dalam Analisis Komponen Utama untuk
Peubah-Peubah yang Berkorelasi.
Terima kasih penulis ucapkan kepada Bapak Dr Ir Kusman Sadik, MSi dan
Ibu Yenni Angraini, SSi MSi selaku pembimbing. Ungkapan terima kasih juga
disampaikan kepada ayah, ibu, serta seluruh keluarga, dan teman-teman Statistika
46 atas segala doa dan kasih sayangnya.
Semoga karya ilmiah ini bermanfaat.

Bogor, April 2014
Fajrianza Adi Nugrahanto

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR


vi

DAFTAR LAMPIRAN

vi

PENDAHULUAN

1

Latar Belakang

1

Tujuan Penelitian

1

TINJAUAN PUSTAKA


2

Pengaruh Noise terhadap Nilai Akar Ciri dan Vektor Akar Ciri
METODE

2
4

Bahan

4

Tahapan Analisis

4

Tahapan Penentuan Parameter

6


HASIL DAN PEMBAHASAN
Hasil Simulasi Pertama

8
8

Hasil Simulasi Kedua

16

SIMPULAN DAN SARAN

18

Simpulan

18

Saran


18

DAFTAR PUSTAKA

18

LAMPIRAN

19

RIWAYAT HIDUP

32

DAFTAR TABEL
1 Matriks ragam-peragam
2 Nilai

pada


7

untuk seluruh nilai

matriks
matriks

9

dan

3 Selisih nilai vektor akar ciri matriks
4 Nilai

9
untuk

dan

10

matriks

5 Nilai

pada

dan

11
6 Vektor akar ciri pertama dan kedua matriks

pada
12
14

7 Parameter simulasi modifikasi nilai konstanta
pada kondisi
matriks
8 Nilai

!

untuk
15
17
17

9 Nilai vektor akar ciri data bangkitan
10 Nilai akar ciri dan % proporsi keragaman kumulatif data bangkitan

DAFTAR GAMBAR
1
2
3
4
5
6
7

Proses pembuatan matriks simulasi
Grafik
untuk
untuk
Grafik
dengan berbagai nilai rasio ! "
Grafik
Grafik besaran nilai rotasi vektor akar ciri
dengan berbagai nilai #
Grafik
pada kondisi simulasi
Grafik
!

$

8
10
11
13
13
14
!

dan
16

DAFTAR LAMPIRAN
1
2
3
4
5
6
7
8
9
10

Syntax simulasi untuk nilai
Syntax simulasi untuk nilai
Syntax simulasi untuk nilai rotasi vektor akar ciri
Syntax pembangkitan data regresi
$ !
Daftar nilai parameter untuk simulasi pada kondisi
$ !
Daftar nilai parameter untuk simulasi pada kondisi
dengan modifikasi nilai konstanta (#)
Daftar nilai parameter untuk simulasi pada kondisi
$ !
dan kondisi
!
Hasil simulasi pada kondisi
$ !
$ ! dengan modifikasi nilai
Hasil simulasi pada kondisi
konstanta (#)
Hasil simulasi pada kondisi
$ ! dan kondisi
!

19
21
23
25
26
27
28
29

30
31

PENDAHULUAN
Latar Belakang
Analisis Komponen Utama (AKU) merupakan salah satu teknik peubah
ganda yang banyak diterapkan dalam berbagai bidang. Analisis ini pada umumnya
digunakan untuk mereduksi dimensi dari data sehingga menjadi lebih sederhana
(Johnson dan Wichern 1988). AKU menggunakan informasi dari matriks ragamperagam atau matriks korelasi untuk membuat beberapa kombinasi linear dari
peubah-peubah awal. Kombinasi linear ini yang kemudian disebut sebagai
komponen utama. Komponen-komponen utama tersebut kemudian dipilih
sedemikian rupa sehingga banyaknya komponen utama yang dipilih lebih sedikit
dibandingkan dengan banyaknya peubah awal yang ada.
Joliffe (2002) menjelaskan bahwa nilai komponen utama dari AKU dapat
berubah pada kondisi tertentu. Pengujian sensitifitas dan stabilitas untuk nilai
komponen utama ini telah dilakukan untuk berbagai kondisi, salah satunya adalah
ketika terjadi perubahan pada keragaman data. Krzanowski (1984) menyatakan
bahwa komponen utama hanya dapat diinterpretasikan dengan baik apabila nilai
skornya stabil untuk perubahan nilai akar ciri yang kecil. Pengujian yang telah
dilakukan menunjukkan bahwa nilai skor komponen utama menjadi tidak stabil
ketika suatu nilai akar ciri % berubah sebesar & pada kondisi nilai % dan %
saling berdekatan.
Tsakiri dan Zurbenko (2011) melakukan pengujian yang sama terhadap
stabilitas komponen utama ketika terdapat pengaruh noise pada data. Statistical
noise merupakan sebuah istilah yang merujuk kepada keragaman yang tidak dapat
dijelaskan dari sebuah data (Tsakiri dan Zurbenko 2011). Secara umum, statistical
noise ditemukan pada data riil dalam bentuk galat (error) atau residual. Berdasarkan Pirker (2009), nilai pencilan atau amatan berpengaruh juga dapat
dikatakan sebagai statistical noise.
Terdapatnya noise pada data dapat mempengaruhi hasil dari AKU, terutama
untuk nilai skor komponen utama. Hasil penelitian Tsakiri dan Zurbenko (2011)
dengan menggunakan kondisi vektor data yang saling bebas menunjukkan bahwa
apabila suatu matriks ragam-peragam dengan perbedaan nilai akar ciri yang lebih
kecil dari besarnya noise digunakan pada AKU, maka hasil yang didapat dari
analisis tersebut akan sangat berbeda jauh dengan hasil analisis tanpa adanya
noise. Dalam penelitian ini, akan dilakukan simulasi terkait pengaruh noise
terhadap AKU dengan menggunakan vektor data yang memiliki korelasi. Hasil
dari simulasi yang dilakukan akan dibandingkan dengan teorema yang
dikemukakan dari hasil penelitian Tsakiri dan Zurbenko (2011).

Tujuan Penelitian
Tujuan dari penelitian yang akan dilakukan adalah mengkaji hasil simulasi
terkait pengaruh noise terhadap analisis komponen utama untuk data dengan
peubah-peubah yang berkorelasi.

2

TINJAUAN PUSTAKA
Pengaruh Noise terhadap Nilai Akar Ciri dan Vektor Akar Ciri
Tsakiri dan Zurbenko (2011) mengemukakan tiga buah teorema yang
berkaitan dengan pengaruh noise terhadap nilai akar ciri dan vektor akar ciri untuk
analisis komponen utama. Didefinisikan ' sebagai ( x 1 vektor acak yang
' * + sebagai
berasosiasi dengan matriks peragam ) . Didefinisikan juga '
vektor acak yang memiliki noise, dengan + merupakan vektor noise acak yang
berasosiasi dengan matriks peragam ! . Matriks peragam yang berasosiasi
dengan ' adalah ) . Dekomposisi spektral dari matriks peragam ) diberikan
oleh
)

,

*

,

*

*

,
% % %

(1)

dengan
% merupakan nilai akar ciri dari
) yang memenuhi
$
$
$ % , dan - .
merupakan
vektor
akar ciri yang
/
berasosiasi dengan nilai-nilai akar ciri tersebut. Norma dari matriks peragam )
didefinisikan sebagai )
, dengan
merupakan nilai akar ciri terbesar
dari matriks peragam ) . Didefinisikan juga norma dari suatu vektor acak ( x 1
sebagai
'

0', '1

2

03 * 3 * 4 * 3% 1

2

(2)

Teorema 1
Teorema
pertama
menyebutkan
bahwa
apabila
didefinisikan
1
0
0 % % 1 sebagai dekomposisi spektral dari ' yang memenuhi
$ ! untuk
(
dengan
pertidaksamaan
! .
!
1
Maka dekomposisi spektral dari ' , yaitu 0
0 % % 1 , memenuhi
5 ! untuk
(.
5 ! dan
kondisi:
a. Pembuktian 67
67 5 8.+
Didefinisikan + 0& &
&% 1, sebagai suatu vektor noise yang berasosiasi
1
0 % %1
1 0
dengan matriks ragam-peragam 9: . Diasumsikan 0
adalah pasangan akar ciri dan vektor akar ciri dari matriks ragam-peragam dengan
noise, ) . Berdasarkan definisi 9;
< , akan didapat:
9;
9; 5 9;
9;
9:
! . Perubahan nilai terbesar akar ciri
dengan noise dan nilai terbesar akar ciri tanpa noise tidak akan melebihi nilai ! ,
5 !.
sehingga
,
Matriks ragam-peragam ) dapat didekomposisi sebagai 9;
*
9=> dan matriks ragam-peragam
) dapat didekomposisi sebagai 9;
,
* 9=> . ) akan diasumsikan sebagai sebuah operator. Perbedaan dari
9=>
nilai akar ciri kedua dapat diestimasi sebagai berikut:
5
,
sehingga
dapat
disimpul5 9=>
9=>
?9: => ?
9=>
!
! %>
kan
5 !.

3
Proses selanjutnya adalah menunjukkan bahwa %
% 5 ! . Matriks
,
ragam-peragam
dapat
didekomposisi
sebagai
9
* *
)
;
,
dan matriks ragam-peragam ) dapat didekomposisi
%> %> %> * 9
,
,
* 9 , sehingga perbedaan antara
sebagai 9;
* * %> %> %>
9
9
nilai akar ciri ke-( didapat dengan: %
5 9
9
%
5 !.
?9: ?
! 5 ! . Pada akhirnya, dapat disimpulkan bahwa
5 78+
b. Pembuktian 7
7
Penentuan kondisi selisih vektor eigen akan dibagi menjadi tiga kasus yang
didasarkan dari persamaan
* + . Kasus pertama adalah apabila vektor
noise memiliki arah yang sama dengan . Selisih vektor eigen dengan noise dan
vektor eigen tanpa noise dalam kasus ini adalah sama dengan !@ , sehingga
!@ 5 ! , dengan
! merupakan nilai standar deviasi dari
komponen noise dengan panjang maksimum.
.
Kasus kedua adalah apabila vektor noise tegak lurus dengan
Berdasarkan teorema Phytagoras dan persamaan (2), perbedaan antara vektor akar
ciri dengan noise dan vektor akar ciri tanpa noise dapat diestimasi berdasarkan
DE@
DEF
DE
ABC #
5
, dengan # merupakan sudut antara vektor
H F2H
H F2H
? ?
F

G

DE@ I

G

DE I

akar ciri dengan noise dan vektor akar ciri tanpa noise.
Kasus ketiga adalah apabila arah vektor noise tidak sama maupun tegak
lurus dengan . Perbedaan antar vektor akar ciri dengan noise dan vektor akar
DE
.
ciri tanpa noise dapat diestimasi berdasarkan ABC #
H F2H
G

DE I

Akibat dari adanya ketiga kasus ini adalah nilai norma dari perbedaan
vektor akar ciri dengan noise dan vektor akar ciri tanpa noise tidak akan melebihi
5 ! . Pemeriksaan lebih lanjut akan menghasilkan
!,
dan
dengan
mengetahui bahwa JKL M MN +
! , dapat disimpulkan
!
5 !.
bahwa
Penentuan selisih vektor eigen kedua dari ketiga kasus di atas dimulai
dengan cara memproyeksikan vektor
pada bidang yang tegak lurus terhadap ,
yang kemudian akan disebut sebagai OPQR0 1. Berdasarkan persamaan (2), maka
5
OPQR0 1 * OPQR0 1
dapat disimpulkan bahwa:
5 !.
OPQR0 1 * OPQR0 1
$ ! berlaku untuk
Dari bagian sebelumnya, diketahui bahwa
semua
(
, sehingga dapat ditunjukkan dengan induksi matematika
5 ! berlaku untuk seluruh
(. Diasumsikan bahwa
bahwa
kondisi sebelumnya dipenuhi untuk sebanyak S dan perbedaan antara vektor
eigen dengan noise dan vektor eigen tanpa noise ditentukan oleh pertidaksamaan
5 S ! . Maka akan diperoleh
N
N
N
N
N
OPQR0 N 1 * OPQR0 N 1
5
OPQR0 N 1 * OPQR0 N 1
N
N
5 S ! * ! 0S * 1 ! dengan OPQR0TN 1 merupakan proyeksi N
N
pada bidang yang tegak lurus terhadap N . Dari hasil ini dapat disimpulkan bahwa
pertidaksamaan untuk perbedaan antara vektor eigen dengan noise dan vektor
eigen tanpa noise,
5 ! , berlaku untuk seluruh
(.

4
Teorema 2
,
Teorema kedua menyebutkan bahwa apabila didefinisikan U
V sebagai
$ ! untuk
komponen utama ke-i dari matriks peragam ' dan
(
. Maka panjang dari komponen utama dengan noise, U , dapat
ditentukan oleh pertidaksamaan: U 5 0 1 2 * ! untuk
( dan
perbedaan antara U dengan U dapat didefinisikan oleh
5 ! untuk
(.
Pembuktian teorema ini diperoleh dengan melakukan langkah sebagai
1 ditentukan oleh persamaan:
1 ` ! a
# _ 0]
(3)
^
0^> 1
dengan nilai # berupa # $ !
Membuat matriks ragam-peragam data populasi ( ) ) berdasarkan poin
[d].
Membuat matriks ragam-peragam data noise ( ) *) dengan cara
menjumlahkan ) dengan ! .
Menghitung nilai akar ciri ( ) dan vektor akar ciri ( ) untuk setiap
matriks ) *dan ) .
untuk setiap
Menghitung nilai 7
7 , yaitu vektor akar ciri,
pasang matriks ( ) *, ) ).
Mengulang proses dari poin [a]-[h] untuk nilai koefisien korelasi ( )
yang berbeda. Nilai
yang digunakan adalah 0.1-0.9 dengan
peningkatan sebesar 0.01.

Simulasi kedua
Tahapan simulasi yang dilakukan untuk mencapai tujuan dari simulasi
kedua adalah sebagai berikut:
a.
b.

c.
d.
e.
f.
g.
h.
i.

1 , V b c0
1 ,
Membangkitkan peubah bebas V b c0
Vd b c0e 1 dan Vf b c0
1 dengan masing-masing S
.
Membangkitkan nilai galat (noise) & berdasarkan sebaran peluang
normal dengan parameter tertentu ( & b c0 1 , & b c0 1 dan
& b c0 11.
Menentukan nilai parameter regresi gh
g
g
gd
gf
.
Membangkitkan nilai U berdasarkan persamaan (4)
U
*
V *
V *
Vd *
Vf
(4)
Membangkitkan nilai U berdasarkan persamaan (5)
U
*
V *
V *
Vd *
Vf * &
(5)
Melakukan analisis komponen utama untuk gugus peubah V V Vd
Vf U .
Melakukan analisis komponen utama untuk gugus peubah V V Vd
Vf U .
Membandingkan hasil analisis berdasarkan poin [f] dan [g].
Mengulang tahapan simulasi [d]-[h] untuk nilai & dengan parameter
sebaran yang berbeda.

6
Tahapan Penentuan Parameter
Tahapan penentuan parameter merupakan tahapan yang dilakukan untuk
menentukan nilai dari parameter yang digunakan dalam simulasi pertama.
Parameter yang digunakan dalam simulasi pertama meliputi matriks ragamperagam populasi, matriks noise dan matriks simulasi.
Matriks ragam-peragam populasi
Matriks ragam-peragam populasi merupakan matriks ragam-peragam yang
menggambarkan karakteristik dari data populasi. Matriks ini berdimensi 3 .
Penentuan dimensi dilakukan berdasarkan dari hasil simulasi pendahuluan.
Matriks ragam-peragam dengan dimensi lebih dari 2 x 2 tidak mampu memenuhi
kondisi awal yang disyaratkan oleh teorema untuk beberapa nilai koefisien
korelasi, sedangkan matriks ragam-peragam dengan dimensi 2 x 2 mampu
memenuhi kondisi awal yang disyaratkan untuk seluruh nilai koefisien korelasi,
sehingga dipilih matriks ragam-peragam dengan dimensi 2 x 2 untuk digunakan
dalam simulasi.
Matriks ragam-peragam populasi dibentuk dari suatu matriks ragamperagam yang memiliki nilai di luar diagonal utama berupa nol. Pembuatan
matriks ini adalah dengan cara menentukan terlebih dahulu nilai-nilai ragam
setiap peubah, yaitu nilai-nilai pada diagonal utama matriks. Nilai-nilai ini
ditentukan dengan menggunakan persamaan (3). Nilai konstanta ( # ) dengan
$ ! menggunakan nilai # yang lebih besar atau
kondisi simulasi
sama dengan ! . Nilai pada kolom diagonal utama ke-1 pada matriks ditentukan
secara subjektif agar nilai pada kolom diagonal terakhir tidak bernilai negatif
maupun nol. Hal ini dilakukan karena nilai ragam tidak dapat bernilai negatif dan
apabila nilai ragam adalah nol, maka nilai peragam akan juga bernilai nol untuk
semua nilai koefisien korelasi. Seluruh nilai konstanta dan matriks ragamperagam populasi awal yang digunakan dalam simulasi dapat dilihat pada
Lampiran 5.
Pada penelitian ini, nilai-nilai di luar diagonal utama (peragam) pada
matriks ragam-peragam populasi menjadi salah satu fokus penelitian. Nilai
peragam akan berubah sesuai dengan besarnya nilai koefisien korelasi antar dua
peubah, sehingga matriks ragam-peragam populasi yang digunakan dalam
penelitian akan memiliki nilai peragam yang berbeda-beda disesuaikan dengan
nilai koefisien korelasi yang diinginkan dengan tetap menggunakan nilai diagonal
utama yang sama. Penentuan nilai peragam ini dilakukan dengan menggunakan
persamaan (6).
ijk l

ll

l

m

nm

(6)

dan ll merupakan akar kuadrat dari nilai diagonal utama pada kolom ke- dan
kolom ke- m . Sebagai contoh kasus, matriks ragam-peragam populasi awal
pada
dapat dilihat pada Tabel 1. Dalam simulasi
yang dilakukan, nilai di luar diagonal utama pada matriks ragam-peragam
akan disesuaikan untuk nilai koefisien korelasi 0.1 - 0.9
populasi awal
dengan peningkatan sebesar 0.01 (
1, sehingga akan

7
terdapat 81 matriks ragam-peragam yang berbeda. Setiap peningkatan
0.01 akan meningkatkan nilai di luar diagonal utama sebesar 0.353.
pada

Tabel 1 Matriks ragam-peragam
Matriks RagamPeragam

Matriks RagamPeragam

0

0.5

0.1

0.6

0.2

0.7

0.3

0.8

0.4

e e

e e

sebesar

e

e

0.9

Matriks noise
Matriks noise merupakan matriks ragam-peragam yang menggambarkan
karakteristik dari noise. Matriks noise memiliki dimensi 3 , yang disesuaikan
dengan dimensi matriks ragam-peragam populasi. Matriks ini dibentuk dengan
menentukan terlebih dahulu nilai terbesar pada diagonal utamanya. Nilai terbesar
ini kemudian akan dijadikan sebagai nilai ! . Nilai-nilai diagonal utama lainnya
akan ditentukan secara subjektif dengan memperhitungkan agar setiap elemen
diagonal utama tidak memiliki nilai yang sama, bernilai nol maupun negatif. Hal
ini dilakukan karena apabila elemen diagonal utama bernilai sama, maka
komponen utama yang dihasilkan oleh matriks ragam-peragam dengan noise dan
tanpa noise akan sama sehingga nilai selisihnya akan sama dengan nol. Seluruh
matriks noise yang digunakan memiliki ! yang bernilai setengah dari nilai ! ,
yang dimaksudkan untuk mempermudah simulasi. Nilai-nilai di luar diagonal
utama akan diisi dengan nilai nol yang bertujuan untuk memenuhi asumsi, yaitu
bahwa antar noise tidak terdapat korelasi (saling bebas). Seluruh matriks noise
yang digunakan dapat dilihat pada Lampiran 5.
Matriks simulasi
Matriks simulasi merupakan matriks yang dibentuk dengan menjumlahkan
matriks ragam-peragam populasi dengan matriks noise. Hasil dari penjumlahan ini
akan menghasilkan suatu matriks ragam-peragam yang telah berubah
keragamannya dikarenakan telah ditambahkan aspek noise. Salah satu contoh
kasus proses pembuatan matriks ini dapat dilihat pada Gambar 1 yang

8
menggunakan matriks matriks ragam-peragam populasi awal

dengan

.

dan matriks noise

=

+
Matriks ragam-peragam
populasi

Matriks noise

Matriks simulasi

Gambar 1 Proses pembuatan matriks simulasi

HASIL DAN PEMBAHASAN
Hasil Simulasi Pertama
Pembahasan simulasi pertama terdiri atas tiga sub pembahasan, yaitu hasil
$ ! , hasil simulasi dengan modifikasi nilai
simulasi pada kondisi
konstanta ( # ), dan hasil simulasi pada kondisi
! . Seluruh
pembahasan simulasi pertama akan mengacu kepada teorema pertama mengenai
pengaruh noise yang dikemukakan oleh Tsakiri dan Zurbenko (2011).
Hasil simulasi pada kondisi 67 67 - $ 8.+
Bagian pertama dari pembahasan hasil simulasi ini merupakan pembahasan
hasil simulasi pada kondisi
$ ! dengan menggunakan parameter
yang telah ditentukan. Simulasi ini dilakukan dengan tujuan untuk melihat
pengaruh noise pada hasil analisis komponen utama ketika data yang digunakan
merupakan data dengan peubah-peubah yang berkorelasi. Parameter-parameter
yang digunakan dalam bagian simulasi ini telah disesuaikan dengan kondisi yang
dibutuhkan agar teorema berlaku. Hasil akhir dari simulasi ini kemudian akan
dibandingkan dengan teorema yang ada.
Langkah awal yang dilakukan dalam simulasi ini adalah pemeriksaan awal
pada matriks ragam-peragam populasi untuk nilai koefisien
nilai
korelasi yang berbeda. Pemeriksaan ini dilakukan agar kondisi yang dibutuhkan
$ ! , terpenuhi. Sebagai contoh kasus, pada Tabel
oleh teorema, yaitu
2 dapat dilihat nilai
yang didapat dari matriks ragam-peragam awal
, dengan nilai
yang didapat selalu lebih besar dari ! untuk
setiap nilai koefisien korelasi, sehingga syarat awal teorema telah terpenuhi.
Langkah berikutnya dari simulasi ini adalah menjalankan proses simulasi
untuk mendapatkan nilai
dan
untuk seluruh nilai . Tahapan
dimulai dengan menghitung selisih antara vektor
penghitungan nilai
akar ciri matriks ragam-peragam simulasi dengan vektor akar ciri matriks ragamperagam tanpa noise, yaitu matriks ragam-peragam populasi. Salah satu contoh
kasus perhitungan nilai vektor akar ciri dan nilai selisihnya dapat dilihat pada
, yaitu matriks
Tabel 3 yang menggunakan matriks tanpa noise

9
dengan

ragam-peragam populasi awal

= 0.5, dan matriks simulasi

(matriks ragam-peragam populasi dengan noise)
Tabel 2 Nilai

0.10
0.11
0.12
0.13
0.14
0.15
0.16
0.17
0.18
0.19
0.20
0.21
0.22
0.23
0.24
0.25
0.26
0.27
0.28
0.29

25.98
26.18
26.40
26.64
26.89
27.16
27.44
27.74
28.05
28.38
28.72
29.08
29.44
29.82
30.22
30.62
31.03
31.46
31.89
32.33

0.30
0.31
0.32
0.33
0.34
0.35
0.36
0.37
0.38
0.39
0.40
0.41
0.42
0.43
0.44
0.45
0.46
0.47
0.48
0.49

untuk seluruh nilai

matriks

32.79
33.25
33.72
34.20
34.68
35.18
35.68
36.19
36.70
37.22
37.75
38.28
38.82
39.36
39.91
40.47
41.02
41.59
42.15
42.73

..

0.50
0.51
0.52
0.53
0.54
0.55
0.56
0.57
0.58
0.59
0.60
0.61
0.62
0.63
0.64
0.65
0.66
0.67
0.68
0.69

43.30
43.88
44.46
45.05
45.64
46.23
46.83
47.43
48.03
48.64
49.24
49.85
50.47
51.08
51.70
52.32
52.94
53.57
54.19
54.82

0.70
0.71
0.72
0.73
0.74
0.75
0.76
0.77
0.78
0.79
0.80
0.81
0.82
0.83
0.84
0.85
0.86
0.87
0.88
0.89
0.90

55.45
56.08
56.72
57.35
57.99
58.63
59.27
59.91
60.56
61.20
61.85
62.49
63.14
63.79
64.44
65.10
65.75
66.40
67.06
67.72
68.37

Tabel 3 Selisih nilai vektor akar ciri matriks
dan
Nilai Vektor Akar Ciri
Vektor Akar Ciri Ke-1
Vektor Akar Ciri Ke-2
dengan tanpa
dengan tanpa
selisih
selisih
noise
noise
noise
noise
-0.929 -0.888
0.041
0.369
0.460
0.091
-0.369 -0.460
0.091
-0.929 -0.888 0.041
Tahapan berikutnya adalah menghitung nilai norma dari masing-masing
selisih vektor akar ciri. Penghitungan nilai norma selisih vektor akar ciri ini
menggunakan persamaan (2). Nilai
untuk
dengan
dapat
dan matriks ragam-peragam populasi awal
matriks noise
dilihat pada Tabel 4.

10
Tabel 4 Nilai

dan

matriks

untuk
7

7

1
0.045
0.077
0.094
0.100
0.099
0.096
0.090
0.085
0.079

0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9

Total

2
0.045
0.077
0.094
0.100
0.099
0.096
0.090
0.085
0.079

0.090
0.154
0.188
0.200
0.198
0.192
0.180
0.170
0.158

0.15
0.10
Deviasi
0.05
0.00

0.00

0.05

Deviasi

0.10

0.15

Hasil dari simulasi yang dilakukan menunjukkan bahwa nilai
yang
untuk
didapat untuk
selalu lebih kecil dari nilai ! , serta nilai
juga selalu lebih kecil dari nilai ! . Hal ini menunjukkan bahwa teorema
tetap berlaku untuk data dengan dua peubah yang berkorelasi. Sebagai contoh
kasus, pada Gambar 2 dan 3 dapat dilihat hasil dari simulasi ini untuk matriks
. Gambar 2
dengan matriks noise
ragam-peragam awal
menunjukkan hasil simulasi untuk nilai
. Dari Gambar 2 dapat dilihat
bahwa nilai
akan naik dimulai dari = 0.1 sampai
kemudian
turun dimulai dari
sampai
.
Gambar 3 menunjukkan hasil simulasi untuk nilai
. Garis lurus
, sedangkan garis putus-putus ( ) menunjukkan
( ) menunjukkan nilai
nilai ! . Garis lurus pada Gambar 3 selalu berada di bawah garis putus-putus,
5 !
.
sehingga dapat disimpulkan bahwa

0.2

0.4

0.6

0.8

0.2

Korelasi
Koefisien
Korelasi 0 1

Gambar 2 Grafik

0.4

0.6

Korelasi
Koefisien
Korelasi 0 1

untuk

0.8

30
25
20
15

Deviasi

0

5

10

15
0

5

10

Deviasi

20

25

30

11

0.2

0.4

0.6

0.8

0.2

0.4

Korelasi
Koefisien
Korelasi 0 1

0.6

0.8

Korelasi
Koefisien
Korelasi 0 1

Gambar 3 Grafik

untuk

Pada bagian hasil simulasi ini, di samping pembahasan mengenai
perbandingan antara hasil simulasi dan teorema, akan dibahas juga mengenai
beberapa hal lain terkait dengan hasil simulasi yang didapat. Pembahasan pertama
. Pada Gambar 3 dapat dilihat bahwa nilai
yaitu mengenai grafik
akan berkurang nilainya ketika nilai koefisien korelasi data semakin
besar, sedangkan nilai
akan bertambah ketika nilai koefisien korelasi
data semakin besar. Hal ini disebabkan karena penjumlahan nilai
untuk
akan bernilai sama dengan penjumlahan nilai diagonal utama pada matriks
noise yang digunakan, atau secara matematis dapat dituliskan sebagai
! . Nilai
! yang tetap untuk seluruh nilai koefisien korelasi
akan membuat nilai
membesar ketika nilai
semakin menurun.
Salah contoh kasus untuk pembahasan ini dapat dilihat pada Tabel 5 yang
.
dan matriks noise
menggunakan matriks ragam-peragam awal
Tabel 5 Nilai

matriks
pada

dan

o

0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9

24.84
24.43
23.90
23.36
22.87
22.44
22.07
21.76
21.50

12.66
13.07
13.60
14.14
14.63
15.06
15.43
15.74
16.00

37.5
37.5
37.5
37.5
37.5
37.5
37.5
37.5
37.5

12
Pembahasan kedua yaitu pada Gambar 2 dapat dilihat bahwa grafik
.
akan memiliki bentuk dan nilai yang sama dengan grafik
Hal ini disebabkan karena penggunaan data dengan peubah sebanyak dua akan
menghasilkan dua komponen utama yang bernilai sama tetapi berbeda tanda
positif dan negatif serta posisinya. Pada Tabel 6 dapat dilihat nilai kedua
pada berbagai nilai
komponen utama untuk matriks ragam-peragam awal
koefisien korelasi. Kondisi ini berlaku baik untuk matriks ragam-peragam awal
maupun matriks ragam-peragam dengan noise, sehingga nilai
dari kedua
matriks tersebut akan sama untuk seluruh komponen utama.
Tabel 6 Vektor akar ciri pertama dan kedua matriks
pada

0.1

0.2

0.3

e
e

e
e

0.4

e

0.5

e

0.6

e

e

0.7

e

0.8

e

0.9

e
e

e
e

Pembahasan ketiga adalah pembahasan mengenai pengaruh rasio antara
nilai ! dan nilai ragam terbesar dari matriks ragam-peragam populasi awal ( 1.
Pada Lampiran 5 dapat dilihat nilai rasio ini untuk seluruh parameter yang
digunakan. Hasil simulasi menunjukkan bahwa semakin besar rasio antara nilai
akan mengakibatkan semakin besarnya nilai
. Hal ini
! dan nilai
dapat dilihat dari keempat grafik pada Gambar 4. Masing-masing grafik
menggambarkan nilai rasio yang berbeda.
Pembahasan keempat yaitu pembahasan mengenai besarnya rotasi yang
terjadi antara komponen utama yang mengandung noise dengan komponen utama
tanpa noise. Grafik dari besarnya rotasi ini akan memiliki bentuk yang sama
dengan grafik
. Hal ini disebabkan karena perubahan nilai pada
komponen utama disebabkan karena adanya rotasi dari vektor akar ciri, sehingga
perubahan nilai komponen utama dan besarnya rotasi akan saling berhubungan.
Semakin besar rotasi yang terjadi, maka akan semakin besar pula perubahan nilai
komponen utama. Gambar 5 menunjukkan besarnya rotasi yang terjadi untuk
.
dengan matriks noise
matriks ragam-peragam awal
Hasil simulasi dengan modifikasi nilai konstanta (p)
Bagian kedua dari simulasi dilakukan dengan melakukan modifikasi nilai
konstanta (#1 dalam pembentukan matriks ragam-peragam awal. Terdapat dua
kondisi modifikasi nilai konstanta yang digunakan dalam simulasi ini, yaitu nilai
konstanta yang lebih besar dari nilai konstanta kontrol ( # $ # ) dan nilai
konstanta yang lebih kecil dari nilai konstanta kontrol (#
#1. Nilai-nilai

0.15
0.10
Deviasi
0.05
0.00

0.00

0.05

Deviasi

0.10

0.15

13

0.2

0.4

0.6

0.8

0.2

0.4

Korelasi
Koefisien
Korelasi 0 1

!"

0.6

0.8

Korelasi
Koefisien
Korelasi 0 1

!"

0.05

Deviasi

0.10

0.15

0.3

0.00

0.00

0.05

Deviasi

0.10

0.15

0.2

0.2

0.4

0.6

0.8

0.2

0.4

Korelasi
Koefisien
Korelasi 0 1

!"

0.6

0.8

Korelasi
Koefisien
Korelasi 0 1

!"

0.4

0.5

dengan berbagai nilai rasio

!"

0

2

4

Theta

6

8

10

Gambar 4 Grafik

0.2

0.4

0.6

0.8

Koefisien
Korelasi 0 1
Korelasi

Gambar 5 Grafik besaran nilai rotasi vektor akar ciri
konstanta yang digunakan selengkapnya dapat dilihat pada Lampiran 6. Bagian
simulasi ini dilakukan dengan tujuan untuk melihat pengaruh perubahan hasil
komponen utama ketika nilai konstanta diubah dengan tetap memperhatikan
kondisi yang diperlukan agar teorema terpenuhi.
Pada bagian simulasi ini, nilai
dari matriks ragam-peragam populasi
akan diubah sesuai dengan nilai # yang dipakai. Penentuan nilai #
awal
untuk kedua kondisi dilakukan secara subjektif agar dapat mempermudah simulasi.
Pada Tabel 7 dapat dilihat kondisi simulasi yang digunakan sebagai contoh kasus.

14
Tabel 7 Parameter simulasi modifikasi nilai konstanta
# $ #
#

Garisa

Kondisi simulasi

#

Garisa

Matriks

25b

b
c

Matriks

25b

26a

a

#

#

24c

e

27a

23a

28a

22a

Bentuk garis mengacu kepada grafik pada Gambar 6
Nilai konstanta ini dijadikan sebagai kontrol
Matriks noise yang digunakan adalah

0.08
0.06

0.07

Deviasi

0.06
0.05

0.05

0.04

0.04

0.03

Deviasi

0.07

0.09

0.08

0.10

Hasil simulasi pada Gambar 6 menunjukkan bahwa kedua kondisi
modifikasi yang digunakan mampu memberikan hasil yang berbeda. Pada kondisi
(# $ #), nilai
yang didapat akan semakin kecil ketika nilai konstanta
dibuat lebih besar, sedangkan pada kondisi (#
#1, nilai
yang didapat
akan semakin besar ketika nilai konstanta dibuat lebih kecil. Dari hasil simulasi
ini dapat disimpulkan bahwa di bawah pengaruh noise, hasil analisis komponen
utama yang didapat akan lebih baik apabila selisih nilai ragam pada matriks
ragam-peragamnya semakin besar.

0.2

0.4

0.6

Korelasi
Koefisien
Korelasi 0 1

# $ #
Gambar 6 Grafik

0.8

0.2

0.4

0.6

Korelasi
Koefisien
Korelasi 0 1

#

#

dengan berbagai nilai #

0.8

15
8.+
Hasil simulasi pada kondisi 67 67 Bagian ketiga dari simulasi dilakukan dengan mencoba kondisi simulasi
yang tidak mendukung kondisi yang dibutuhkan agar teorema terpenuhi, yaitu
kondisi
! . Hasil dari kondisi simulasi ini akan dibandingkan
$ ! . Simulasi ini
dengan kondisi yang memenuhi teorema, yaitu
dilakukan dengan tujuan untuk melihat dampak dari tidak terpenuhinya kondisi
awal dari teorema untuk hasil analisis komponen utama. Seluruh parameter yang
digunakan dalam bagian simulasi ini dapat dilihat pada Lampiran 7.
Langkah awal yang dilakukan dalam simulasi ini adalah pemeriksaan awal
nilai pada matriks ragam-peragam populasi untuk nilai koefisien korelasi yang
berbeda. Pemeriksaan ini dilakukan agar matriks ragam-peragam awal tidak
memenuhi syarat awal teorema. Sebagai contoh kasus, pada Tabel 9 dapat dilihat
dengan matriks
nilai yang didapat dari matriks ragam-peragam awal

. Kondisi yang harus dicapai agar teorema tidak terpenuhi adalah
. Nilai pada Tabel 8 menunjukkan bahwa kondisi yang
dibutuhkan agar teorema tidak terpenuhi hanya dapat tercapai hingga nilai
, sehingga dalam simulasi ini nilai yang digunakan dimulai dari
sampai
dengan peningkatan sebesar 0.005.
noise

Tabel 8 Nilai

pada kondisi

matriks
! untuk
*

0.10
0.11
0.12
0.13
0.14
0.15
0.16
0.17

21.45*
21.74*
22.05*
22.39*
22.75*
23.13*
23.53*
23.95*

0.18
0.19
0.20
0.21
0.22
0.23
0.24
0.25

*

24.38*
24.83*
25.30*
25.78*
26.28*
26.78*
27.31*
27.84*

Langkah berikutnya adalah menjalankan simulasi untuk mendapatkan nilai
untuk
pada kondisi
dan
! dan
untuk
$ ! . Hasil simulasi menunjukkan bahwa nilai
kondisi
! selalu lebih kecil dari nilai
! walaupun matriks
ragam-peragam awal yang digunakan tidak memenuhi syarat dari teorema.
untuk kedua kondisi yang berbeda menunjukkan
Perbandingan nilai
yang lebih besar
bahwa kondisi
! memiliki nilai
$ ! . Salah satu hasil simulasi ini dapat
dibandingkan kondisi
(kondisi
dilihat pada Gambar 7 dengan matriks ragam-peragam awal
$ ! ) berasosiasi dengan garis lurus ( ) dan matriks ragam-peragam
(kondisi
awal
! ) berasosiasi dengan garis putus-putus
( ). Matriks noise yang digunakan adalah

.

0.06
0.00

0.02

0.04

Deviasi

0.08

0.10

16

0.00

0.05

0.10

0.15

Korelasi
Koefisien
Korelasi 0 1

Gambar 7 Grafik

pada kondisi simulasi
!

$

!

dan

Hasil Simulasi Kedua
Bagian simulasi ini dilakukan untuk melihat pengaruh noise pada data yang
dibangkitkan dari sebaran normal. Data yang dibangkitkan merupakan data yang
digunakan dalam analisis regresi. Peubah yang digunakan yaitu empat peubah
bebas dan satu peubah tak bebas serta banyak data yang dibangkitkan adalah
seribu data. Keempat peubah bebas dibangkitkan berdasarkan sebaran normal
1 , V b c0
1 , Vd b c0e 1 dan Vf b c0
1.
dengan V b c0
Peubah tak bebas dibangkitkan dalam dua bentuk, yaitu peubah tak bebas dengan
adanya pengaruh noise dan peubah tak bebas tanpa adanya pengaruh noise.
Peubah tak bebas tanpa adanya pengaruh noise dibentuk berdasarkan persamaan
(4), sedangkan peubah tak bebas dengan adanya pengaruh noise dibentuk
berdasarkan persamaan (5).
Analisis komponen utama kemudian dilakukan untuk empat gugus peubah,
yaitu gugus AKU 1 untuk peubah qV V Vd Vf U r, gugus AKU 2 untuk peubah
qV V Vd Vf U r dengan & b c0 1 , gugus AKU 3 untuk peubah qV V Vd
Vf U r dengan & b c0 1, dan gugus AKU 4 untuk peubah qV V Vd Vf U r
dengan & b c0 1. Hasil analisis komponen utama ini dapat dilihat pada Tabel 9
dan 10. Pengaruh noise pada analisis komponen utama dalam kasus data
bangkitan ini pada umumnya meliputi perubahan nilai vektor akar ciri, tetapi
ketika nilai noise semakin besar (kasus AKU 4), posisi vektor akar ciri tersebut
juga dapat berubah (perubahan pada tanda positif dan negatif). Besarnya %
proporsi keragaman secara kumulatif tidak mengalami perubahan yang signifikan
pada data yang dikenakan pengaruh noise, tetapi dengan semakin besarnya nilai
noise, nilai % proporsi keragaman kumulatif dari beberapa komponen utama
pertama akan berkurang.

17
Tabel 9 Nilai vektor akar ciri data bangkitan
Vektor akar ciri keGugus
1
2
3
4

5

AKU 1

0.743
0.033
0.055
0.223
0.628

-0.559
-0.031
-0.106
-0.721
-0.394

-0.227
-0.162
-0.735
-0.494
-0.371

-0.150
-0.786
-0.496
-0.218
-0.258

-0.248
-0.595
-0.447
-0.372
-0.496

AKU 2

0.741
0.033
0.056
0.224
0.629

-0.562
-0.031
-0.108
-0.718
-0.396

-0.230
-0.161
-0.725
-0.503
-0.376

-0.150
-0.779
-0.506
-0.218
-0.259

-0.243
-0.605
-0.450
-0.366
-0.488

0.709
0.034
0.061
0.225
0.665

-0.610
-0.031
-0.111
-0.665
-0.414

-0.262
-0.152
-0.594
-0.612
-0.425

-0.167
-0.585
-0.693
-0.250
-0.297

-0.167
-0.796
-0.389
-0.265
-0.344

-0.652
-0.034
-0.064
-0.225
-0.720

-0.684
-0.030
-0.110
-0.579
-0.428

-0.277
-0.123
-0.418
-0.736
-0.437

-0.149
-0.320
-0.868
-0.225
-0.267

-0.085
-0.938
-0.236
-0.146
-0.188

& b c0

AKU 3

& b c0

AKU 4

& b c0

1

1

1

Tabel 10 Nilai akar ciri dan % proporsi keragaman kumulatif data bangkitan
Vektor akar ciri keNilai
Gugus
1
2
3
4
5

% proporsi
keragaman
kumulatif

AKU 1
AKU 2
AKU 3
AKU 4

313.76
313.76
322.07
339.28

133.17
133.51
138.19
145.74

36.40
36.87
42.12
50.48

12.16
12.21
13.97
16.92

0.00
0.23
4.23
6.71

AKU 1
AKU 2
AKU 3
AKU 4

63.32
63.18
61.87
60.68

90.20
90.07
88.41
86.75

97.55
97.49
96.51
95.77

100.00
99.95
99.19
98.80

100.00
100.00
100.00
100.00

18

SIMPULAN DAN SARAN
Simpulan
Hasil simulasi menunjukkan bahwa teorema mengenai pengaruh noise yang
dikemukakan oleh Tsakiri dan Zurbenko (2011) berlaku untuk kondisi data
dengan dua peubah yang berkorelasi. Nilai norma selisih vektor akar ciri akan
mengalami kenaikan dimulai dari
hingga
, kemudian akan
mengalami penurunan hingga
. Nilai konstanta yang digunakan dalam
pembentukan matriks ragam-peragam awal akan mempengaruhi besarnya nilai
. Nilai konstanta yang memiliki perbandingan yang lebih besar terhadap
besaran noise akan membuat nilai
semakin kecil. Penggunaan kondisi
simulasi yang tidak mendukung syarat awal teorema menghasilkan hasil simulasi
yang lebih besar
dengan karakteristik yang sama tetapi dengan nilai
dibandingkan dengan penggunaan kondisi simulasi yang mendukung syarat awal
teorema.
Saran
Penelitian ini dapat dilanjutkan dengan menambahkan berbagai kondisi
simulasi baik pada matriks ragam-peragam awal maupun matriks noise sehingga
didapat hasil yang lebih baik.

DAFTAR PUSTAKA
Johnson RA, Wichern DW. 1988. Applied Multivariate Statistical Analysis. 2nd
Ed. New Jersey (US): Prentice-Hall.
Joliffe IT. 2002. Principal Component Analysis. 2nd Ed. New York (US):
Springer-Verlag.
Krzanowski WJ. 1984. Sensitivity of Principal Components. J R Statist Soc B.
46(3):558-563.
Pirker, Clemens. 2009. Statistical Noise of Valuable Information: The Role of
Extreme Cases in Marketing Research [dissertation]. Germany: University of
Innsbruck.
Tsakiri KG, Zurbenko IG. 2011. Effect of Noise in Principal Component Analysis.
J Stat Math. 2(2):40-48.

19
Lampiran 1 Syntax simulasi untuk nilai
fp