PROS Hanna A Parhusip Deva W Bernadeta Desinova Kr Property Dan Perdagangan Sebagai Sektor Full text
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
PROPERTY DAN PERDAGANGAN SEBAGAI
SEKTOR DOMINAN PADA DATA BURSA SAHAM
DENGAN PRINCIPAL COMPONENT ANALYSIS (PCA)
Hanna A Parhusip, Deva Widyananto1 ,dan Bernadeta Desinova Kr2
Center of Applied Mathematics (CAM), Program Studi Matematika
Fakultas Sains dan Matematika (FSM)
Universitas Kristen Satya Wacana (UKSW) (www.uksw.edu)
1
2
mahasiswa S1, matematika – FSM – UKSW
mahasiswa S1, matematika – FSM – UKSW
ABSTRAK
Pada makalah ini dibahas tentang analisa beberapa sektor saham yang ada di Indonesia. Data diambil dari
Bursa Efek Jakarta ( BEJ ) dan menggunakan data pada bulan Januari 2008 sampai dengan Januari 2010.
Analisa menggunakan PCA (Principal Component Analysis). Metode ini dilakukan dengan cara menyusun
matriks kovariansi dari data.Variabel mula-mula X ditransformasi menjadi variabel baru Y dengan P=XY dan
P adalah matriks yang vektor-vektor kolomnya adalah vektor eigen dari matriks kovariansi. Vektor eigen dari
nilai eigen terbesar disebut komponen prinsip dan merupakan bobot penyusun variabel baru sebagai
kombinasi linear dari variabel yang lama.
Data menunjukkan bahwa ada 8 variabel sebagai sektor – sektor yang memiliki nilai sahan cukup tinggi.
Variabel tersebut adalah pertanian, industri dasar, aneka industri, barang konsumsi, keuangan, pertambangan,
properti, dan perdagangan. Seluruh variabel diuji untuk mendapatkan variabel yang dominan. Diperoleh
bahwa properti dan perdagangan adalah variabel yang dominan yang ditunjukkan dengan variansi terbesar
melalui Principal Component Analysis. Jika variabel distandarisasi maka tidak dapat ditunjukkan variabel
yang dominan.
Kata Kunci : komponen prinsip, nilai eigen, vektor eigen.
PENDAHULUAN
Saham merupakan bagian terpenting didalam dunia bisnis dan cukup menjanjikan. Keuntungan
yang didapat dari menanamkan uang dalam bentuk uang cukup besar, begitu pula kerugian yang
dapat diterima. Oleh karena itu banyak orang berlomba – lomba untuk menanamkan sebagian
kekayaan yang dimiliki dalam bentuk saham. Saham sendiri terbagi kedalam beberapa sektor /
bidang seperti pertanian, industri, pertambangan, keuangan, konsumsi / bahan pangan, property dan
perdagangan. Penulis melakukan observasi data di website bursa efek untuk mengetahui variabel
yang dapat memberikan keuntungan cukup besar dan meminimalkan kerugian yang didapat.
Agar semua variabel yang ada pada data saham tersebut dapat diketahui mana yang berpengaruh
terhadap untung rugi yang didapat maka penulis mencari variabel – variabel yang dominan terhadap
saham tersebut. Semua variabel dominan yang mempengaruhi nilai saham tersebut dipilih
menggunakan metode Principal Component Analisys ( PCA ).
666
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
Pada makalah ini teori yang digunakan ditunjukkan pada bagian PCA sedangkan penjelasan metode
yang digunakan ditunjukkan pada Bab 3. Hasil analisa dijelaskan pada Bab 4 dan kesimpulan
dituliskan pada bagian akhir makalah ini.
PCA (PRINCIPAL COMPONENT ANALYSIS)
PCA telah digunakan oleh berbagai peneliti untuk memilih variabel yang dominan agar variabel
yang banyak dapat tereduksi. Sebagai salah satu contoh adalah mencari variabel dominan pada
berbagai jenis variabel pakan yang diberikan pada sapi untuk mengenali variabel yang dominan
yang berpengaruh terhadap berat sapi optimum untuk memproduksi susu sapi (Parhusip dan
Siska. 2009). Teori yang telah diulas pada literatur tersebut ditulis kembali pada makalah
ini. Akan tetapi pada makalah ini ditambahkan penyusunan komponen prinsip dengan PCA
untuk variabel yang telah distandarisasi.
Secara aljabar PCA merupakan suatu kombinasi linear khusus untuk p variabel random X1, . . . , Xp.
Secara geometri, kombinasi linear menyatakan pemilihan sistem koordinat baru yang diperoleh dari
merotasi sistem mula-mula X1, . . . , Xp sebagai sumbu-sumbu koordinat. Sumbu koordinat yang
baru sangat tergantung dari matriks kovariansi (atau matrik korelasi). Matriks kovariansi pada
makalah ini disimbolkan dan haruslah positif tegas (positive definite). Istilah ini dijelaskan pada
Definisi 1.
Definisi 1: (Peressini,1988)
Misalkan a ij sebuah matriks simetri nn maka matriks a ij positif (negatif) tegas
(definite positive (negative)) jika dan hanya jika semua nilai eigennya positif (negatif) . Sedangkan
mattriks yang semipositif (seminegatif) tegas jika dan hanya jika semua nilai eigennya taknegatif
(takpositif) .
Teorema 2. (Johnson , and Wichern, 2002)
Sebutlah matriks X = [X1, . . . , Xp] adalah matriks yang vektor-vektor kolomnya adalah vektor
random (dianggap berdistribusi normal) yang mempunyai matriks kovariansi (simetris dan
positif tegas (positive definite)) dengan nilai eigen 1 2 ... p 0 dan sebutlah vektor eigen
yang bersesuaian untuk setiap 1 2 ... p 0 adalah e1 ,..., e p yang saling ortogonal.
Komponen prinsip ke-i adalah
T
(1.a)
Yi ei X e1i X 1 e 21 X 2 ... e pi X p , i= 1,2,...,p .
Dengan pemilihan ini
Var (Yi ) eiT ei i , i =1,2,...,p ,
(1.b)
Cov( Yi , Yk )= eiT ek 0 , i k .
(1.c)
Perlunya e1 ,..., e p yang saling ortogonal adalah bahwa kita dapat menyusun kombinasi linear Yi
dengan basis { e1 ,..., e p }. Jika beberapa i ada yang sama maka pemilihan vektor eigen ada yang
sama. Sebenarnya dapat dipilih vektor eigen yang berbeda dengan menggunakan generalisasi vektor
eigen (generalized eigenvector) tetapi tidak dibahas pada makalah ini. Oleh karena itu Yi tidak
tunggal.
Bukti : (Johnson and Wichern, 2002, hal.358) .
667
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
Akibat 3.
Sebutlah matriks X = [X1, . . . , Xp] adalah matriks yang vektor-vektor kolomnya adalah vektor
random yang mempunyai matriks kovariansi dengan nilai eigen 1 2 ... p 0 dan
sebutlah vektor eigen yang bersesuaian untuk setiap 1 2 ... p 0 adalah e1 ,..., e p dan
11 22 ... pp Var ( X i ) 1 ... p Var (Yi )
komponen-komponen prinsip ditentukan oleh persamaan (1.a). Maka
p
p
i 1
i 1
ii menyatakan variansi populasi yang ke-ii.
(1.d)
Bukti :
Diketahui dari aljabar linear bahwa jumlahan elemen diagonal dari suatu matriks disebut sebagai
trace (tr) matriks tersebut (Lay,2003). Dalam hal ini berarti
11 ... pp tr ( ) .
T
Kita dapat menuliskan PDP dengan D adalah matriks diagonal yang elemen diagonal
adalah i dan P = [e1 e p ] adalah matriks yang vektor-vektor kolomnya merupakan vektor eigen
dan saling ortogonal sehingga PP T P T P I (matriks identitas). Dari sifat tr bahwa tr dari
perkalian matriks A dan B berlaku tr(AB) = tr(BA). Sehingga berlaku
tr () tr ( P ( DP T ))
tr ( DP T P ) tr ( DI ) tr ( D ) 1 ... p
Jadi
.
Var ( X i ) tr () tr ( D) Var (Yi ) .
p
p
i 1
i 1
Akibat 1 menyatakan bahwa total variansi populasi = 11 ... pp 1 ... p .
k
Akibat 4. Proporsi variansi komponen prinsip ke-i didefinisikan sebagai
1 2 ... p
, k =1,..., p.
Nilai eki menyatakan ukuran pentingnya variabel ke-k terhadap komponen prinsip ke-i. Secara
khusus, eki menyatakan korelasi antara komponen-komponen Yi dan variabel-variabel X k . Hal ini
ditunjukkan pada Teorema 5.
Teorema 5.
T
Jika Y1 e1T X, Y2 e2T X,..., Y p e p X adalah komponen prinsip yang diperoleh dari matriks
kovariansi maka
Y , X
i
eki i
k
kk
,
i,k =1,2,...,p
adalah koefisien korelasi antara komponen-komponen Yi dan variabel-variabel X k .
Bukti : (Johnson and Wichern, 2007, hal. 360) .
668
(2a)
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
Kita telah mempunyai informasi bahwa korelasi antara variabel mula-mula yang tidak memuat
dimensi sehingga variansi data bebas dari variansi yang memuat dimensi yaitu dengan koefisien
korelasi populasi ik yang didefinisikan sebagai
ik
ik
ii kk
.
(2b)
Koefisien korelasi ini mengukur hubungan linear antara variabel random X i dan X k . Matriks
korelasi merupakan matriks simetri p x p yaitu
1p
11
12
12 1 p
1
11 22
11 pp
11 11
1 2 p
= 12
2p
12
22
.
(2c)
11 22
22 22
22 pp
1p
11 pp
2p
22 pp
pp
pp pp
1 p
2 p
1
Komponen prinsip secara geometri memenuhi persamaan ellipsoida
c2
1
1
y12
2
1
y 22 ...
p
1
y 2p , c : konstan .
(3)
Karena 1 2 ... p 0 , persamaan (3) menyatakan sistem koordinat dengan sumbu-sumbu
y1 ,..., y p pada arah berturut-turut diberikan oleh e1 ,..., e p (yang telah saling ortonormal).
Untuk selanjutnya akan ditentukan variabel dominan yang mempengaruhi nilai saham di berbagai
sektor maka dapat digunakan PCA dengan menyusun matriks kovariansi terlebih dahulu dengan
mengasumsikan bahwa data disimpan dalam sebuah vektor random X dimana elemen baris
menyatakan N observasi X= [X1...Xp] dan banyaknya kolom menyatakan p variabel X1, . . . , Xp
pada matriks p x N. Rata-rata untuk vektor X didefinisikan sebagai
M
1
X 1 ... X p .
p
Akan dicari Xˆ k untuk k=1....p, dimana: Xˆ k X k M .
Sehingga kolom matriks N x p dapat ditulis sebagai:
B = [ Xˆ 1
Xˆ 2 ... Xˆ p ]
(4.a)
(4.b)
(4.c)
dimana B merupakan bentuk deviasi rata-rata untuk setiap X yang diperoleh dari persamaan (4.b).
Sedangkan matriks kovariansi matriks adalah p x p matriks S yang didefinisikan sebagai:
S
1
BB T
p 1
(4.d)
BB T merupakan matriks positive definite (nilai eigen matriks tersebut semua positif) sesuai dengan
Teorema 1.
Total variansi didefinisikan sebagai jumlahan semua variansi sebagaimana ditunjukkan pada
persamaan (1.d). Hal ini diperoleh dengan cara jumlahan dari elemen diagonal matriks S. Jumlahan
dari semua diagonal matriks S yang dikuadratkan merupakan trace dari matriks S ( tr(S) ) .
Nilai eigen dari S harus diurutkan dari besar ke kecil agar diketahui variabel apa yang paling
dominan yang mempengaruhi nilai saham.
669
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
Untuk selanjutnya perlu disusun matriks P = X Y dengan P adalah matriks yang terdiri dari vektorvektor kolom dari setiap vektor eigen yang diperoleh. Vektor eigen ini diperoleh dengan
menyelesaikan
S i I ei 0 ,
dengan n banyaknya sampel saham. Sedangkan nilai eigen perlu diperoleh terlebih dahulu
dengan menyelesaikan persamaan karakteristik yaitu det(S- I ) = 0 yang diperoleh dari
Se e .
(5b)
i = 1,...,p
PCA dengan standardisasi Variabel
Variabel random dapat distandarisasi dengan cara
Z1
X 1 1 ,
11
Z2
X 2 2
22
, ... , Z p
Dengan notasi matriks vektor persamaan (5c) ditulis sebagai
Z = (V1/2)-1 (X - )
1/2 -1
dengan (V ) merupakan matriks diagonal yaitu
1/2 -1
(V ) =
1
11
0 0
0
0
0
. 0
0 .
0
0 0
0
0
1
pp
(5a)
X
p
p
pp
.
(5c)
(5d)
.
(5e).
Dengan menggunakan persamaan (2c) dan (5e) dapat diperoleh
(5f)
= (V1/2)-1 (V1/2)-1 .
Dengan variabel random yang sudah distandarisasi kita dapat menyusun komponen prinsip
berdasarkan Teorema 6 .
Teorema 6.
Komponen prinsip ke-i dari variabel standard ZT = [Z1, Z2,...,Zp], dengan Cov(Z) = diberikan
oleh
(5g)
Yi eiT Z = eiT (V1/2)-1 (X - ) , i =1,2,..., p .
Selain itu
Var (Yi ) Var (Z i ) p dan Yi , Z k eki i ,
p
p
i 1
i 1
i,k = 1,2, ... , p.
(5h)
Pada Teorema ini nilai eigen dan vektor eigen diperoleh dari matriks korelasi (5f).
Agar PCA dapat diperkenalkan dengan jelas berikut ini diberikan contoh penggunaaannya dengan
menggunakan bantuan MATLAB.
Contoh : Misal data yang diperoleh saham dari sektor Pertanian, Industri Dasar, Aneka Industri
dan Barang Konsumsi ditunjukkan pada Tabel 1.
670
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
Tabel 1. Data pengukuran variabel untuk 4 sektor saham
Tahun
2008
2009
2010
Akhir Periode
Pertanian
Industri Dasar
Aneka Industri
Barang Konsumsi
2006
1218.45
147.1
284.12
392.46
2007
2754.76
238.05
477.35
436.04
September
1489.57
162.93
326.15
381.36
Oktober
738.17
112.18
199.97
321.92
November
803.89
114.45
215.82
320.9
Desember
918.77
134.99
214.94
326.84
Januari
969.43
126.39
246.57
337.85
Februari
1046.64
124.08
220.41
346.16
Maret
1094.59
134.66
287.9
352.8
April
1333.25
151.15
316.67
381.32
Mei
1576.52
182.05
362.72
433.73
Juni
1527
192.92
416.21
495.73
Juli
1659.55
222.8
504.6
591.2
Agustus
1797.12
229.12
538.05
559.18
September
1784.21
238.46
584.96
597.63
Oktober IV
1823.1
256.83
572.19
591.66
November I
1733.43
260.78
533.45
595.51
November II
1760.16
259.53
267.64
608.09
November III
1786.82
263.74
578.61
631.32
November IV
1745.19
252.88
261.22
625.73
Desember I
1838.58
260.48
271.65
661.59
Desember II
1831.67
264.47
587.64
651.07
Desember III
1785.5
268.77
598.88
654.62
Desember IV
1753.09
273.93
601.47
671.31
Januari I
1952.19
284.24
596.89
684.48
Januari II
1935.65
283.42
624.27
690.27
Januari III
1901.58
282.08
595.27
702.4
Januari IV
1850.31
280.11
626.53
699.78
671
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
Tahun
2008
2009
2010
Tabel 2. Data pengukuran variabel untuk 4 sektor saham (tak berdimensi)
Akhir
Periode
Pertanian
Industri Dasar
Aneka Industri
Barang Konsumsi
2006
0.4423
0.5175
0.4535
0.5587
2007
1.0000
0.8375
0.7619
0.6208
September
0.5407
0.5732
0.5206
0.5429
Oktober
0.268
0.3947
0.3192
0.4583
November
0.2918
0.4027
0.3445
0.4569
Desember
0.3335
0.4749
0.3431
0.4653
Januari
0.3519
0.4447
0.3935
0.481
Februari
0.3799
0.4365
0.3518
0.4928
Maret
0.3973
0.4738
0.4595
0.5023
April
0.0484
0.5318
0.5054
0.5429
Mei
0.5723
0.6405
0.5789
0.6175
Juni
0.5543
0.6787
0.6643
0.7058
Juli
0.6024
0.7838
0.8054
0.8417
Agustus
0.6524
0.8061
0.8588
0.7961
September
0.6477
0.8389
0.9337
0.8508
Oktober IV
0.6618
0.9036
0.9133
0.8423
November I
0.6292
0.9175
0.8514
0.8478
November II
0.639
0.9131
0.4272
0.8657
November III
0.6486
0.9279
0.9235
0.8988
November IV
0.6335
0.8897
0.4169
0.8908
Desember I
0.6674
0.9164
0.4336
0.9419
Desember II
0.6649
0.9304
0.9379
0.9269
Desember III
0.6482
0.9456
0.9559
0.932
Desember IV
0.6364
0.9637
0.96
0.9557
Januari I
0.7087
1.0000
0.9527
0.9745
Januari II
0.7027
0.9971
0.9964
0.9827
Januari III
0.6903
0.9924
0.9501
1.0000
Januari IV
0.6717
0.9855
1.0000
0.9963
Data pada Tabel 1 perlu dinyatakan dalam bentuk tak berdimensi. Hal ini dilakukan dengan cara
membagi data tiap baris dengan maksimum per baris yang ditunjukkan pada Tabel 2.
Matriks kovariansi dari Tabel 2 dapat dicari dengan menghitung rata-rata data tiap baris yang
disebut dalam vektor M dan dicari matriks deviasi B menggunakan bantuan MATLAB. Sehingga
matriks kovariansinya adalah
672
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
0.0251
S = 0.0292
0.0285
0.0229
0.0292 0.0285 0.0229
0.0471 0.0445 0.0420 .
0.0445 0.0644 0.0397
0.0420 0.0397 0.0398
Setelah matriks kovariansi(S) diperoleh, maka dapat dicari nilai eigennya. yaitu harus memenuhi
Sx x (persamaan 5b) dengan x [x1 x2 x3 x4 ]T bukan vektor nol (dan disebut sebagai
vektor eigen) yang harus dicari. Untuk itu berarti ( S I ) x 0 , agar x [ x1
bukan vektor nol maka disyaratkan det ( S I ) =0 (Lay,2003).
x2
x3
x 4 ]T
1 0 . 1526 , 2 0 . 0149 3 0 . 0085 , 4 0 . 004 dan diperoleh nilai
Dengan
menggunakan
vektor eigen
bantuan
MATLAB
maka
dapat
diperoleh
4
nilai
eigen
0.3117
0.2377
0.8533
0.3439
0.7341
0.4081
0
.
0627
, e
, 0.5390
, e
e1
0.0032 2 0.0175 3 0.8002 e4 0.5994 .
0.6032
0.5174
0.3695
0.4815
Dapat ditunjukkan bahwa e i , e j = 0 dan dengan i j dimana i , j 1, 2 , 3 , 4 . Hal ini berarti
masing – masing vektor saling tegak lurus dan mempunyai nilai 1, sehingga dapat digunakan
sebagai basis untuk Y i .Oleh karena itu komponen prinsip adalah
Y1 0.3117 X 1 0.7341 X 2 0.0032 X 3 0.6032 X 4
Y2 0.8533 X 1 0.0627 X 2 0.0175 X 3 0.5174 X 4
Y3 0.2377 X 1 0.4081 X 2 0.8002 X 3 0.3695 X 4
,
,
,
Y4 0.3439 X 1 0.5390 X 2 0.5994 X 3 0.4815 X 4 .
Untuk selanjutnya korelasi antara Y1 dan X i , i =1,…,4 dapat ditunjukkan dengan mengikuti
formula (2) yaitu berturut-turut
Y , X
1
1
Y ,X
1
3
e21 1
e11 1 =-0.0383;
=0.0267;
Y1 , X 2
s 22
s11
e31 1
s33
=0.3852; Y1 , X 4
e41 1
= 0.9425.
s 44
Karena nilai korelasi X 4 (barang konsumsi) dekat dengan 1 ( Y1 , X 4 = 0.9425), maka variabel X 4
mempengaruhi nilai sahan Indonesia periode Januari 2008 – Januari 2010.
METODE PENELITIAN
1. Pengumpulan Data : data yang digunakan adalah data saham Januari 2008 – 2010 yang
ditunjukkan pada Tabel 3. Data setiap vektor-vektor kolom dianggap sebagai variabel
random yang berdistribusi normal. Dapat pula dilakukan pengujian normalitas data.
2. Menyusun matriks kovariansi menggunakan persamaan (4a)-(4d).
673
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
3. Menghitung nilai eigen dan vektor eigen yang bersesuaian dengan nilai eigennya
menurut persamaan (5a)-(5b). Vektor eigen sebagai penyusun koefisien pada
komponen prinsip.
4. Menyatakan variabel prinsip sebagai kombinasi linear dari variabel mula-mula
menggunakan persamaan (1a).
5. Menentukan koefisisen korelasi antara komponen prinsip dan variabel mula mula
dengan persamaan (2).
Tahun
2008
2009
2010
Akhir
Periode
Tabel 3. Data Saham Januari 2008 – Januari 2010
Sumber : http //: bankindonesia/statistic/moneter/semi11
Industri
Aneka
Barang
Pertanian
Dasar
Industri Konsumsi Keuangan Pertambangan
Properti
Perdagangan
2006
1218.45
147.1
284.12
392.46
206.57
933.33
122.92
275.08
2007
2754.76
238.05
477.35
436.04
260.57
3270.09
251.82
392.24
September
1489.57
162.93
326.15
381.36
203.37
1833.24
142.42
261.33
Oktober
738.17
112.18
199.97
321.92
151.79
1095.87
101.35
158.76
November
803.89
114.45
215.82
320.9
150.9
897.51
105.63
137.78
Desember
918.77
134.99
214.94
326.84
176.33
877.68
103.49
148.33
Januari
969.43
126.39
246.57
337.85
161.24
922.16
96.03
147.6
Februari
1046.64
124.08
220.41
346.16
145.95
963.89
96.56
147.9
Maret
1094.59
134.66
287.9
352.8
172.71
1045.31
100.54
161.37
April
1333.25
151.15
316.67
381.32
215.73
1444.46
112.32
185.56
Mei
1576.52
182.05
362.72
433.73
227.65
1818.96
130.99
205.21
Juni
1527
192.92
416.21
495.73
243.66
1848.54
144.79
217.84
Juli
1659.55
222.8
504.6
591.2
272.79
2144.91
159398
250.01
Agustus
1797.12
229.12
538.05
559.18
280.46
2140.43
157.96
259.85
September
1784.21
238.46
584.96
597.63
300.7
2238.59
162.29
277.4
Oktober IV
1823.1
256.83
572.19
591.66
288.32
2231.36
159.22
272.33
November I
1733.43
260.78
533.45
595.51
293.81
2068.46
156.21
256.74
November II
1760.16
259.53
267.64
608.09
296.37
2129.23
152.96
256.38
November III
1786.82
263.74
578.61
631.32
298.2
2230.38
153.95
264.14
November IV
1745.19
252.88
261.22
625.73
293.48
2129.87
143.64
248.47
Desember I
1838.58
260.48
271.65
661.59
301.75
2248.63
147.95
255.4
Desember II
1831.67
264.47
587.64
651.07
300.32
2211.08
146.86
260.62
Desember III
1785.5
268.77
598.88
654.62
296.4
2152.68
144.28
267.77
Desember IV
1753.09
273.93
601.47
671.31
301.42
2203.48
146.8
275.76
Januari I
1952.19
284.24
596.89
684.48
306.24
2409.81
150.37
287.02
Januari II
1935.65
283.42
624.27
690.27
310.84
2375.03
154.26
306.99
Januari III
1901.58
282.08
595.27
702.4
311.05
2294.4
152.99
301.17
Januari IV
1850.31
280.11
626.53
699.78
311.66
2236.4
153.49
299.44
674
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
ANALISA DAN PEMBAHASAN
Dengan mengikuti Bab 2, berikut ini akan dianalisa data Tabel 3 untuk mencari variabel yang
dominan pada nilai saham tiap sektor. Langkah pertama yang dilakukan adalah menghitung rata
rata data tiap kolom, dan ditunjukkan dalam vektor x yaitu
x T 0.5757 0.7542 0.6790 0.7496 0.8114 0.5722 0.0366 0.6172
Dengan menggunakan persamaan (4.d) matriks kovariansi S dapat diperoleh dan ditunjukkan pada
Tabel 4.
Tabel 4. Matriks kovariansi (S)
S1
S2
S3
S4
S5
S5
S5
S5
0.0251
0.0292
0.0285
0.0229
0.0250
0.0287
0.0010
0.0227
0.0292
0.0471
0.0445
0.0420
0.0402
0.0354
0.0011
0.0268
0.0285
0.0445
0.0644
0.0397
0.0382
0.0346
0.0047
0.0280
0.0229
0.0420
0.0397
0.0398
0.0363
0.0286
0.0034
0.0213
0.0250
0.0402
0.0382
0.0363
0.0356
0.0303
0.0024
0.0232
0.0287
0.0354
0.0346
0.0286
0.0303
0.0346
0.0031
0.0256
0.0010
0.0011
0.0047
0.0034
0.0024
0.0031
0.0357
0.0008
0.0227
0.0268
0.0280
0.0213
0.0232
0.0256
0.0008
0.0238
Tampak bahwa matriks kovariansi S adalah matriks simetris. Kita dapat mencari nilai eigen
sebagaimana ditunjukkan pada Teori Ujinormalitas dan dengan menggunakan bantuan MATLAB
maka nilai eigen adalah
T 1 2
3 4
5
6
7
8
0.2312 0.0358 0.0191 0.0154 0.0029 0.0008 0.0006 0.0003 .
Sedangkan vektor eigen untuk tiap nilai eigen diperoleh berturut-turut ditunjukkan pada tiap kolom
pada Tabel 5 dan dapat ditunjukkan bahwa vektor eigen tersebut saling ortonormal.
Tabel 5. Nilai Vektor eigen untuk data Tabel 3.
u1
u2
u3
u4
u5
u6
u7
u8
0.4043
-0.6881
0.0070
0.5947
-0.0354
-0.0487
-0.0402
-0.0635
0.6699
0.3835
0.0086
-0.0871
-0.2525
-0.5485
0.0456
-0.1726
0.1841
-0.2473
0.0249
-0.3955
0.8242
-0.2184
0.0044
-0.1445
-0.1714
-0.0466
-0.0667
0.1113
0.0760
-0.5459
0.0324
0.8043
-0.2206
0.3426
-0.5731
0.5286
0.3240
-0.1750
0.0360
-0.2987
0.4298
-0.0002
-0.6643
-0.2029
0.0055
0.4399
0.1035
0.3585
-0.0566
-0.0703
0.0763
0.0152
-0.0212
-0.0096
0.9910
-0.0563
0.2965
0.4402
0.4683
0.3861
0.3800
0.3562
0.0336
0.2785
Menurut Bab 2, maka perlu didefinisikan variabel random yang disusun berdasarkan vektor-vektor
kolom dari matriks kovariansi S, yaitu
0.4043
0.6699
0.1841
0.1714
0.2206
0.4298
0.0566
0.2965
0.6881
0.3835
0.2473
0.0466
0.3426
0.0002
0.0703
0.4402
0.0070
0.0086
0.0249
0.0667
0.5731
0.6643
0.0763
0.4683
0.3861
0.0152
0.0871
0.5286
0.1113
0.3955
0.5947
0.2029
, X8
, X 7
, X6
, X5
, X4
, X3
, X2
X1
0.0354
0.2525
0.8242
0.0760
0.3240
0.0055
0.0212
0.3800
0.0487
0.5485
0.2184
0.5459
0.1750
0.4399
0.0096
0.3562
0.0402
0.0456
0.0044
0.0324
0.0360
0.1035
0.9910
0.0336
0.0635
0.1726
0.1445
0.8043
0.2987
0.3585
0.0563
0.2785
675
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
Karena komponen prinsip yang terpenting adalah yang pertama maka komponen prinsip pertama
adalah
Y1 0.4043 X 1 0.6881 X 2 0.0070 X 3 0.5947 X 4 0.0354 X 5 0.0487 X 6 0.0402 X 7 0.0635 X 8 .
Dapat ditunjukkan bahwa Yi dan Y j saling bebas linear , i,j =1,..,8. yaitu bahwa Cov( Yi , Y j ) = 0.
Untuk selanjutnya korelasi antara Y1 dan X i , i =1,…,8 dapat ditunjukkan dengan mengikuti
formula (2) yaitu berturut-turut
e21 1
e
e31 1 = 0.0027
e
= 0.0419;
Y , X 41 1 = 0.0301;
Y , X 11 1 = 0.0442; Y , X
Y ,X
1
1
Y , X
1
1
s11
e51 1
5
s 55
2
= 0.2132; Y , X
1
6
s 22
e21 1
s66
1
3
= 0.3266. Y1 , X 7
e21 1
s 33
s77
1
4
s 44
= 0.9931; Y , X e21 1 = 0.8682.
1
8
s88
Karena nilai korelasi variabel X 7 ( properti ) dan X 8 ( perdagangan ) dekat dengan 1, maka
variabel X 7 dan X 8 sebagai variabel yang paling berpengaruh terhadap nilai saham.
Hasil PCA dengan standardisasi variabel
Hasil PCA dengan standardisasi variabel diharapkan memberikan kesimpulan yang sama tentang
variabel yang dianggap dominan. Dengan menggunakan persamaan (5c) data distandardisasi.
Diperoleh nilai eigen
T 1 2
3 4
5 6
7
8
6.0037 1.0036 0.5486 0.2895 0.1072 0.0222 0.0179 0.0072 .
T
e1 0.3793
0.3964 0.3482 0.3727 0.3854 0.0324 0.3664 .
Sehingga vektor eigen untuk nilai eigen terbesar adalah
Y1 0.3793Z 1 0.3964Z 2 0.3482Z 3 0.3727 Z 4 0.3937 Z 5 0.3854Z 6
Komponen prinsip dengan variabel standard untuk nilai eigen terbesar adalah
0.0324Z 7 0.3664Z 8
.
Kita dapat menyusun korelasi antara Y1 dengan Z i , i =1,...,8 menggunakan persamaan (5h)
diperoleh
Y1 ,Z1 -0.1548, Y1 ,Z 2 -0.1618, Y1 ,Z 3 -0.1421, Y1 ,Z 4 -0.1521, Y1 ,Z 5 -0.1607,
Y ,Z -0.1573 , Y ,Z -0.0132 dan Y ,Z -0.1496. Kita menyimpulkan bahwa semua
1
6
1
7
1
8
variabel mempunyai makna yang sama atau tidak ada yang dominan.
Dari hasil ini disimpulkan bahwa menggunakan standardisasi variabel tidak dapat menunjukkan
dominasi salah satu variabel. Hal ini juga ditunjukkan pada literatur (Johnson and Wichern, 2002) .
Pemilihan variabel dengan standarisasi dilakukan bila data mempunyai perbedaan yang sangat
signifikan ataupun dengan satuan yang berbeda. Hal ini belum diselidiki lebih lanjut.
KESIMPULAN DAN SARAN
Pada makalah ini telah ditunjukkan pemilihan variabel dominan dengan menggunakan Principal
Component Analysis untuk 8 variabel .Variabel tersebut adalah pertanian, industri dasar, aneka
industri, barang konsumsi, keuangan, pertambangan, properti, dan perdagangan. Seluruh variabel
diuji untuk mendapatkan variabel yang dominan. Diperoleh bahwa properti dan perdagangan adalah
676
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
variabel yang dominan yang ditunjukkan dengan variansi terbesar melalui Principal Component
Analysis.
Analisa dapat pula dilakukan dengan menstandarisasi variabel menggunakan persamaan (5c)
sehingga komponen prinsip merupakan kombinasi linear antar variabel yang telah distandarisasi
menurut Teorema 6. Diperoleh bahwa dominasi variabel tidak dapat dikenali.
DAFTAR PUSTAKA
[1] Johnson ,R.A., and Wichern, D.W. 2002. Applied Multivariate Statistical Analysis, 6th ed.
Prentice Hall, ISBN 0-13-187715-1.
[2] Lay, D. C. 2003. Linear Algebra and Ist Applications, Third Edition, Addison Wesley, pp.482491.
[3] Parhusip H. A., dan Siska A. 2009. Principal Component Analysis (PCA) untuk
Analisis Perlakukan Pemberian Pakan dan Mineral terhadap Produksi Susu Sapi,
Prosiding Seminar Nasioanal Matematika UNPAR, ISSN 1907-3909, Vol 4, hal.AA
42-51.
[3] Peressini, A.L., Sullivan, F.E.,Uhl, J.J.,1988. The Mathematics of Nonlinear Programming,
Springer-Verlag, New-York.
http //: bankindonesia/statistic/moneter/semi11
677
PROPERTY DAN PERDAGANGAN SEBAGAI
SEKTOR DOMINAN PADA DATA BURSA SAHAM
DENGAN PRINCIPAL COMPONENT ANALYSIS (PCA)
Hanna A Parhusip, Deva Widyananto1 ,dan Bernadeta Desinova Kr2
Center of Applied Mathematics (CAM), Program Studi Matematika
Fakultas Sains dan Matematika (FSM)
Universitas Kristen Satya Wacana (UKSW) (www.uksw.edu)
1
2
mahasiswa S1, matematika – FSM – UKSW
mahasiswa S1, matematika – FSM – UKSW
ABSTRAK
Pada makalah ini dibahas tentang analisa beberapa sektor saham yang ada di Indonesia. Data diambil dari
Bursa Efek Jakarta ( BEJ ) dan menggunakan data pada bulan Januari 2008 sampai dengan Januari 2010.
Analisa menggunakan PCA (Principal Component Analysis). Metode ini dilakukan dengan cara menyusun
matriks kovariansi dari data.Variabel mula-mula X ditransformasi menjadi variabel baru Y dengan P=XY dan
P adalah matriks yang vektor-vektor kolomnya adalah vektor eigen dari matriks kovariansi. Vektor eigen dari
nilai eigen terbesar disebut komponen prinsip dan merupakan bobot penyusun variabel baru sebagai
kombinasi linear dari variabel yang lama.
Data menunjukkan bahwa ada 8 variabel sebagai sektor – sektor yang memiliki nilai sahan cukup tinggi.
Variabel tersebut adalah pertanian, industri dasar, aneka industri, barang konsumsi, keuangan, pertambangan,
properti, dan perdagangan. Seluruh variabel diuji untuk mendapatkan variabel yang dominan. Diperoleh
bahwa properti dan perdagangan adalah variabel yang dominan yang ditunjukkan dengan variansi terbesar
melalui Principal Component Analysis. Jika variabel distandarisasi maka tidak dapat ditunjukkan variabel
yang dominan.
Kata Kunci : komponen prinsip, nilai eigen, vektor eigen.
PENDAHULUAN
Saham merupakan bagian terpenting didalam dunia bisnis dan cukup menjanjikan. Keuntungan
yang didapat dari menanamkan uang dalam bentuk uang cukup besar, begitu pula kerugian yang
dapat diterima. Oleh karena itu banyak orang berlomba – lomba untuk menanamkan sebagian
kekayaan yang dimiliki dalam bentuk saham. Saham sendiri terbagi kedalam beberapa sektor /
bidang seperti pertanian, industri, pertambangan, keuangan, konsumsi / bahan pangan, property dan
perdagangan. Penulis melakukan observasi data di website bursa efek untuk mengetahui variabel
yang dapat memberikan keuntungan cukup besar dan meminimalkan kerugian yang didapat.
Agar semua variabel yang ada pada data saham tersebut dapat diketahui mana yang berpengaruh
terhadap untung rugi yang didapat maka penulis mencari variabel – variabel yang dominan terhadap
saham tersebut. Semua variabel dominan yang mempengaruhi nilai saham tersebut dipilih
menggunakan metode Principal Component Analisys ( PCA ).
666
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
Pada makalah ini teori yang digunakan ditunjukkan pada bagian PCA sedangkan penjelasan metode
yang digunakan ditunjukkan pada Bab 3. Hasil analisa dijelaskan pada Bab 4 dan kesimpulan
dituliskan pada bagian akhir makalah ini.
PCA (PRINCIPAL COMPONENT ANALYSIS)
PCA telah digunakan oleh berbagai peneliti untuk memilih variabel yang dominan agar variabel
yang banyak dapat tereduksi. Sebagai salah satu contoh adalah mencari variabel dominan pada
berbagai jenis variabel pakan yang diberikan pada sapi untuk mengenali variabel yang dominan
yang berpengaruh terhadap berat sapi optimum untuk memproduksi susu sapi (Parhusip dan
Siska. 2009). Teori yang telah diulas pada literatur tersebut ditulis kembali pada makalah
ini. Akan tetapi pada makalah ini ditambahkan penyusunan komponen prinsip dengan PCA
untuk variabel yang telah distandarisasi.
Secara aljabar PCA merupakan suatu kombinasi linear khusus untuk p variabel random X1, . . . , Xp.
Secara geometri, kombinasi linear menyatakan pemilihan sistem koordinat baru yang diperoleh dari
merotasi sistem mula-mula X1, . . . , Xp sebagai sumbu-sumbu koordinat. Sumbu koordinat yang
baru sangat tergantung dari matriks kovariansi (atau matrik korelasi). Matriks kovariansi pada
makalah ini disimbolkan dan haruslah positif tegas (positive definite). Istilah ini dijelaskan pada
Definisi 1.
Definisi 1: (Peressini,1988)
Misalkan a ij sebuah matriks simetri nn maka matriks a ij positif (negatif) tegas
(definite positive (negative)) jika dan hanya jika semua nilai eigennya positif (negatif) . Sedangkan
mattriks yang semipositif (seminegatif) tegas jika dan hanya jika semua nilai eigennya taknegatif
(takpositif) .
Teorema 2. (Johnson , and Wichern, 2002)
Sebutlah matriks X = [X1, . . . , Xp] adalah matriks yang vektor-vektor kolomnya adalah vektor
random (dianggap berdistribusi normal) yang mempunyai matriks kovariansi (simetris dan
positif tegas (positive definite)) dengan nilai eigen 1 2 ... p 0 dan sebutlah vektor eigen
yang bersesuaian untuk setiap 1 2 ... p 0 adalah e1 ,..., e p yang saling ortogonal.
Komponen prinsip ke-i adalah
T
(1.a)
Yi ei X e1i X 1 e 21 X 2 ... e pi X p , i= 1,2,...,p .
Dengan pemilihan ini
Var (Yi ) eiT ei i , i =1,2,...,p ,
(1.b)
Cov( Yi , Yk )= eiT ek 0 , i k .
(1.c)
Perlunya e1 ,..., e p yang saling ortogonal adalah bahwa kita dapat menyusun kombinasi linear Yi
dengan basis { e1 ,..., e p }. Jika beberapa i ada yang sama maka pemilihan vektor eigen ada yang
sama. Sebenarnya dapat dipilih vektor eigen yang berbeda dengan menggunakan generalisasi vektor
eigen (generalized eigenvector) tetapi tidak dibahas pada makalah ini. Oleh karena itu Yi tidak
tunggal.
Bukti : (Johnson and Wichern, 2002, hal.358) .
667
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
Akibat 3.
Sebutlah matriks X = [X1, . . . , Xp] adalah matriks yang vektor-vektor kolomnya adalah vektor
random yang mempunyai matriks kovariansi dengan nilai eigen 1 2 ... p 0 dan
sebutlah vektor eigen yang bersesuaian untuk setiap 1 2 ... p 0 adalah e1 ,..., e p dan
11 22 ... pp Var ( X i ) 1 ... p Var (Yi )
komponen-komponen prinsip ditentukan oleh persamaan (1.a). Maka
p
p
i 1
i 1
ii menyatakan variansi populasi yang ke-ii.
(1.d)
Bukti :
Diketahui dari aljabar linear bahwa jumlahan elemen diagonal dari suatu matriks disebut sebagai
trace (tr) matriks tersebut (Lay,2003). Dalam hal ini berarti
11 ... pp tr ( ) .
T
Kita dapat menuliskan PDP dengan D adalah matriks diagonal yang elemen diagonal
adalah i dan P = [e1 e p ] adalah matriks yang vektor-vektor kolomnya merupakan vektor eigen
dan saling ortogonal sehingga PP T P T P I (matriks identitas). Dari sifat tr bahwa tr dari
perkalian matriks A dan B berlaku tr(AB) = tr(BA). Sehingga berlaku
tr () tr ( P ( DP T ))
tr ( DP T P ) tr ( DI ) tr ( D ) 1 ... p
Jadi
.
Var ( X i ) tr () tr ( D) Var (Yi ) .
p
p
i 1
i 1
Akibat 1 menyatakan bahwa total variansi populasi = 11 ... pp 1 ... p .
k
Akibat 4. Proporsi variansi komponen prinsip ke-i didefinisikan sebagai
1 2 ... p
, k =1,..., p.
Nilai eki menyatakan ukuran pentingnya variabel ke-k terhadap komponen prinsip ke-i. Secara
khusus, eki menyatakan korelasi antara komponen-komponen Yi dan variabel-variabel X k . Hal ini
ditunjukkan pada Teorema 5.
Teorema 5.
T
Jika Y1 e1T X, Y2 e2T X,..., Y p e p X adalah komponen prinsip yang diperoleh dari matriks
kovariansi maka
Y , X
i
eki i
k
kk
,
i,k =1,2,...,p
adalah koefisien korelasi antara komponen-komponen Yi dan variabel-variabel X k .
Bukti : (Johnson and Wichern, 2007, hal. 360) .
668
(2a)
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
Kita telah mempunyai informasi bahwa korelasi antara variabel mula-mula yang tidak memuat
dimensi sehingga variansi data bebas dari variansi yang memuat dimensi yaitu dengan koefisien
korelasi populasi ik yang didefinisikan sebagai
ik
ik
ii kk
.
(2b)
Koefisien korelasi ini mengukur hubungan linear antara variabel random X i dan X k . Matriks
korelasi merupakan matriks simetri p x p yaitu
1p
11
12
12 1 p
1
11 22
11 pp
11 11
1 2 p
= 12
2p
12
22
.
(2c)
11 22
22 22
22 pp
1p
11 pp
2p
22 pp
pp
pp pp
1 p
2 p
1
Komponen prinsip secara geometri memenuhi persamaan ellipsoida
c2
1
1
y12
2
1
y 22 ...
p
1
y 2p , c : konstan .
(3)
Karena 1 2 ... p 0 , persamaan (3) menyatakan sistem koordinat dengan sumbu-sumbu
y1 ,..., y p pada arah berturut-turut diberikan oleh e1 ,..., e p (yang telah saling ortonormal).
Untuk selanjutnya akan ditentukan variabel dominan yang mempengaruhi nilai saham di berbagai
sektor maka dapat digunakan PCA dengan menyusun matriks kovariansi terlebih dahulu dengan
mengasumsikan bahwa data disimpan dalam sebuah vektor random X dimana elemen baris
menyatakan N observasi X= [X1...Xp] dan banyaknya kolom menyatakan p variabel X1, . . . , Xp
pada matriks p x N. Rata-rata untuk vektor X didefinisikan sebagai
M
1
X 1 ... X p .
p
Akan dicari Xˆ k untuk k=1....p, dimana: Xˆ k X k M .
Sehingga kolom matriks N x p dapat ditulis sebagai:
B = [ Xˆ 1
Xˆ 2 ... Xˆ p ]
(4.a)
(4.b)
(4.c)
dimana B merupakan bentuk deviasi rata-rata untuk setiap X yang diperoleh dari persamaan (4.b).
Sedangkan matriks kovariansi matriks adalah p x p matriks S yang didefinisikan sebagai:
S
1
BB T
p 1
(4.d)
BB T merupakan matriks positive definite (nilai eigen matriks tersebut semua positif) sesuai dengan
Teorema 1.
Total variansi didefinisikan sebagai jumlahan semua variansi sebagaimana ditunjukkan pada
persamaan (1.d). Hal ini diperoleh dengan cara jumlahan dari elemen diagonal matriks S. Jumlahan
dari semua diagonal matriks S yang dikuadratkan merupakan trace dari matriks S ( tr(S) ) .
Nilai eigen dari S harus diurutkan dari besar ke kecil agar diketahui variabel apa yang paling
dominan yang mempengaruhi nilai saham.
669
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
Untuk selanjutnya perlu disusun matriks P = X Y dengan P adalah matriks yang terdiri dari vektorvektor kolom dari setiap vektor eigen yang diperoleh. Vektor eigen ini diperoleh dengan
menyelesaikan
S i I ei 0 ,
dengan n banyaknya sampel saham. Sedangkan nilai eigen perlu diperoleh terlebih dahulu
dengan menyelesaikan persamaan karakteristik yaitu det(S- I ) = 0 yang diperoleh dari
Se e .
(5b)
i = 1,...,p
PCA dengan standardisasi Variabel
Variabel random dapat distandarisasi dengan cara
Z1
X 1 1 ,
11
Z2
X 2 2
22
, ... , Z p
Dengan notasi matriks vektor persamaan (5c) ditulis sebagai
Z = (V1/2)-1 (X - )
1/2 -1
dengan (V ) merupakan matriks diagonal yaitu
1/2 -1
(V ) =
1
11
0 0
0
0
0
. 0
0 .
0
0 0
0
0
1
pp
(5a)
X
p
p
pp
.
(5c)
(5d)
.
(5e).
Dengan menggunakan persamaan (2c) dan (5e) dapat diperoleh
(5f)
= (V1/2)-1 (V1/2)-1 .
Dengan variabel random yang sudah distandarisasi kita dapat menyusun komponen prinsip
berdasarkan Teorema 6 .
Teorema 6.
Komponen prinsip ke-i dari variabel standard ZT = [Z1, Z2,...,Zp], dengan Cov(Z) = diberikan
oleh
(5g)
Yi eiT Z = eiT (V1/2)-1 (X - ) , i =1,2,..., p .
Selain itu
Var (Yi ) Var (Z i ) p dan Yi , Z k eki i ,
p
p
i 1
i 1
i,k = 1,2, ... , p.
(5h)
Pada Teorema ini nilai eigen dan vektor eigen diperoleh dari matriks korelasi (5f).
Agar PCA dapat diperkenalkan dengan jelas berikut ini diberikan contoh penggunaaannya dengan
menggunakan bantuan MATLAB.
Contoh : Misal data yang diperoleh saham dari sektor Pertanian, Industri Dasar, Aneka Industri
dan Barang Konsumsi ditunjukkan pada Tabel 1.
670
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
Tabel 1. Data pengukuran variabel untuk 4 sektor saham
Tahun
2008
2009
2010
Akhir Periode
Pertanian
Industri Dasar
Aneka Industri
Barang Konsumsi
2006
1218.45
147.1
284.12
392.46
2007
2754.76
238.05
477.35
436.04
September
1489.57
162.93
326.15
381.36
Oktober
738.17
112.18
199.97
321.92
November
803.89
114.45
215.82
320.9
Desember
918.77
134.99
214.94
326.84
Januari
969.43
126.39
246.57
337.85
Februari
1046.64
124.08
220.41
346.16
Maret
1094.59
134.66
287.9
352.8
April
1333.25
151.15
316.67
381.32
Mei
1576.52
182.05
362.72
433.73
Juni
1527
192.92
416.21
495.73
Juli
1659.55
222.8
504.6
591.2
Agustus
1797.12
229.12
538.05
559.18
September
1784.21
238.46
584.96
597.63
Oktober IV
1823.1
256.83
572.19
591.66
November I
1733.43
260.78
533.45
595.51
November II
1760.16
259.53
267.64
608.09
November III
1786.82
263.74
578.61
631.32
November IV
1745.19
252.88
261.22
625.73
Desember I
1838.58
260.48
271.65
661.59
Desember II
1831.67
264.47
587.64
651.07
Desember III
1785.5
268.77
598.88
654.62
Desember IV
1753.09
273.93
601.47
671.31
Januari I
1952.19
284.24
596.89
684.48
Januari II
1935.65
283.42
624.27
690.27
Januari III
1901.58
282.08
595.27
702.4
Januari IV
1850.31
280.11
626.53
699.78
671
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
Tahun
2008
2009
2010
Tabel 2. Data pengukuran variabel untuk 4 sektor saham (tak berdimensi)
Akhir
Periode
Pertanian
Industri Dasar
Aneka Industri
Barang Konsumsi
2006
0.4423
0.5175
0.4535
0.5587
2007
1.0000
0.8375
0.7619
0.6208
September
0.5407
0.5732
0.5206
0.5429
Oktober
0.268
0.3947
0.3192
0.4583
November
0.2918
0.4027
0.3445
0.4569
Desember
0.3335
0.4749
0.3431
0.4653
Januari
0.3519
0.4447
0.3935
0.481
Februari
0.3799
0.4365
0.3518
0.4928
Maret
0.3973
0.4738
0.4595
0.5023
April
0.0484
0.5318
0.5054
0.5429
Mei
0.5723
0.6405
0.5789
0.6175
Juni
0.5543
0.6787
0.6643
0.7058
Juli
0.6024
0.7838
0.8054
0.8417
Agustus
0.6524
0.8061
0.8588
0.7961
September
0.6477
0.8389
0.9337
0.8508
Oktober IV
0.6618
0.9036
0.9133
0.8423
November I
0.6292
0.9175
0.8514
0.8478
November II
0.639
0.9131
0.4272
0.8657
November III
0.6486
0.9279
0.9235
0.8988
November IV
0.6335
0.8897
0.4169
0.8908
Desember I
0.6674
0.9164
0.4336
0.9419
Desember II
0.6649
0.9304
0.9379
0.9269
Desember III
0.6482
0.9456
0.9559
0.932
Desember IV
0.6364
0.9637
0.96
0.9557
Januari I
0.7087
1.0000
0.9527
0.9745
Januari II
0.7027
0.9971
0.9964
0.9827
Januari III
0.6903
0.9924
0.9501
1.0000
Januari IV
0.6717
0.9855
1.0000
0.9963
Data pada Tabel 1 perlu dinyatakan dalam bentuk tak berdimensi. Hal ini dilakukan dengan cara
membagi data tiap baris dengan maksimum per baris yang ditunjukkan pada Tabel 2.
Matriks kovariansi dari Tabel 2 dapat dicari dengan menghitung rata-rata data tiap baris yang
disebut dalam vektor M dan dicari matriks deviasi B menggunakan bantuan MATLAB. Sehingga
matriks kovariansinya adalah
672
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
0.0251
S = 0.0292
0.0285
0.0229
0.0292 0.0285 0.0229
0.0471 0.0445 0.0420 .
0.0445 0.0644 0.0397
0.0420 0.0397 0.0398
Setelah matriks kovariansi(S) diperoleh, maka dapat dicari nilai eigennya. yaitu harus memenuhi
Sx x (persamaan 5b) dengan x [x1 x2 x3 x4 ]T bukan vektor nol (dan disebut sebagai
vektor eigen) yang harus dicari. Untuk itu berarti ( S I ) x 0 , agar x [ x1
bukan vektor nol maka disyaratkan det ( S I ) =0 (Lay,2003).
x2
x3
x 4 ]T
1 0 . 1526 , 2 0 . 0149 3 0 . 0085 , 4 0 . 004 dan diperoleh nilai
Dengan
menggunakan
vektor eigen
bantuan
MATLAB
maka
dapat
diperoleh
4
nilai
eigen
0.3117
0.2377
0.8533
0.3439
0.7341
0.4081
0
.
0627
, e
, 0.5390
, e
e1
0.0032 2 0.0175 3 0.8002 e4 0.5994 .
0.6032
0.5174
0.3695
0.4815
Dapat ditunjukkan bahwa e i , e j = 0 dan dengan i j dimana i , j 1, 2 , 3 , 4 . Hal ini berarti
masing – masing vektor saling tegak lurus dan mempunyai nilai 1, sehingga dapat digunakan
sebagai basis untuk Y i .Oleh karena itu komponen prinsip adalah
Y1 0.3117 X 1 0.7341 X 2 0.0032 X 3 0.6032 X 4
Y2 0.8533 X 1 0.0627 X 2 0.0175 X 3 0.5174 X 4
Y3 0.2377 X 1 0.4081 X 2 0.8002 X 3 0.3695 X 4
,
,
,
Y4 0.3439 X 1 0.5390 X 2 0.5994 X 3 0.4815 X 4 .
Untuk selanjutnya korelasi antara Y1 dan X i , i =1,…,4 dapat ditunjukkan dengan mengikuti
formula (2) yaitu berturut-turut
Y , X
1
1
Y ,X
1
3
e21 1
e11 1 =-0.0383;
=0.0267;
Y1 , X 2
s 22
s11
e31 1
s33
=0.3852; Y1 , X 4
e41 1
= 0.9425.
s 44
Karena nilai korelasi X 4 (barang konsumsi) dekat dengan 1 ( Y1 , X 4 = 0.9425), maka variabel X 4
mempengaruhi nilai sahan Indonesia periode Januari 2008 – Januari 2010.
METODE PENELITIAN
1. Pengumpulan Data : data yang digunakan adalah data saham Januari 2008 – 2010 yang
ditunjukkan pada Tabel 3. Data setiap vektor-vektor kolom dianggap sebagai variabel
random yang berdistribusi normal. Dapat pula dilakukan pengujian normalitas data.
2. Menyusun matriks kovariansi menggunakan persamaan (4a)-(4d).
673
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
3. Menghitung nilai eigen dan vektor eigen yang bersesuaian dengan nilai eigennya
menurut persamaan (5a)-(5b). Vektor eigen sebagai penyusun koefisien pada
komponen prinsip.
4. Menyatakan variabel prinsip sebagai kombinasi linear dari variabel mula-mula
menggunakan persamaan (1a).
5. Menentukan koefisisen korelasi antara komponen prinsip dan variabel mula mula
dengan persamaan (2).
Tahun
2008
2009
2010
Akhir
Periode
Tabel 3. Data Saham Januari 2008 – Januari 2010
Sumber : http //: bankindonesia/statistic/moneter/semi11
Industri
Aneka
Barang
Pertanian
Dasar
Industri Konsumsi Keuangan Pertambangan
Properti
Perdagangan
2006
1218.45
147.1
284.12
392.46
206.57
933.33
122.92
275.08
2007
2754.76
238.05
477.35
436.04
260.57
3270.09
251.82
392.24
September
1489.57
162.93
326.15
381.36
203.37
1833.24
142.42
261.33
Oktober
738.17
112.18
199.97
321.92
151.79
1095.87
101.35
158.76
November
803.89
114.45
215.82
320.9
150.9
897.51
105.63
137.78
Desember
918.77
134.99
214.94
326.84
176.33
877.68
103.49
148.33
Januari
969.43
126.39
246.57
337.85
161.24
922.16
96.03
147.6
Februari
1046.64
124.08
220.41
346.16
145.95
963.89
96.56
147.9
Maret
1094.59
134.66
287.9
352.8
172.71
1045.31
100.54
161.37
April
1333.25
151.15
316.67
381.32
215.73
1444.46
112.32
185.56
Mei
1576.52
182.05
362.72
433.73
227.65
1818.96
130.99
205.21
Juni
1527
192.92
416.21
495.73
243.66
1848.54
144.79
217.84
Juli
1659.55
222.8
504.6
591.2
272.79
2144.91
159398
250.01
Agustus
1797.12
229.12
538.05
559.18
280.46
2140.43
157.96
259.85
September
1784.21
238.46
584.96
597.63
300.7
2238.59
162.29
277.4
Oktober IV
1823.1
256.83
572.19
591.66
288.32
2231.36
159.22
272.33
November I
1733.43
260.78
533.45
595.51
293.81
2068.46
156.21
256.74
November II
1760.16
259.53
267.64
608.09
296.37
2129.23
152.96
256.38
November III
1786.82
263.74
578.61
631.32
298.2
2230.38
153.95
264.14
November IV
1745.19
252.88
261.22
625.73
293.48
2129.87
143.64
248.47
Desember I
1838.58
260.48
271.65
661.59
301.75
2248.63
147.95
255.4
Desember II
1831.67
264.47
587.64
651.07
300.32
2211.08
146.86
260.62
Desember III
1785.5
268.77
598.88
654.62
296.4
2152.68
144.28
267.77
Desember IV
1753.09
273.93
601.47
671.31
301.42
2203.48
146.8
275.76
Januari I
1952.19
284.24
596.89
684.48
306.24
2409.81
150.37
287.02
Januari II
1935.65
283.42
624.27
690.27
310.84
2375.03
154.26
306.99
Januari III
1901.58
282.08
595.27
702.4
311.05
2294.4
152.99
301.17
Januari IV
1850.31
280.11
626.53
699.78
311.66
2236.4
153.49
299.44
674
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
ANALISA DAN PEMBAHASAN
Dengan mengikuti Bab 2, berikut ini akan dianalisa data Tabel 3 untuk mencari variabel yang
dominan pada nilai saham tiap sektor. Langkah pertama yang dilakukan adalah menghitung rata
rata data tiap kolom, dan ditunjukkan dalam vektor x yaitu
x T 0.5757 0.7542 0.6790 0.7496 0.8114 0.5722 0.0366 0.6172
Dengan menggunakan persamaan (4.d) matriks kovariansi S dapat diperoleh dan ditunjukkan pada
Tabel 4.
Tabel 4. Matriks kovariansi (S)
S1
S2
S3
S4
S5
S5
S5
S5
0.0251
0.0292
0.0285
0.0229
0.0250
0.0287
0.0010
0.0227
0.0292
0.0471
0.0445
0.0420
0.0402
0.0354
0.0011
0.0268
0.0285
0.0445
0.0644
0.0397
0.0382
0.0346
0.0047
0.0280
0.0229
0.0420
0.0397
0.0398
0.0363
0.0286
0.0034
0.0213
0.0250
0.0402
0.0382
0.0363
0.0356
0.0303
0.0024
0.0232
0.0287
0.0354
0.0346
0.0286
0.0303
0.0346
0.0031
0.0256
0.0010
0.0011
0.0047
0.0034
0.0024
0.0031
0.0357
0.0008
0.0227
0.0268
0.0280
0.0213
0.0232
0.0256
0.0008
0.0238
Tampak bahwa matriks kovariansi S adalah matriks simetris. Kita dapat mencari nilai eigen
sebagaimana ditunjukkan pada Teori Ujinormalitas dan dengan menggunakan bantuan MATLAB
maka nilai eigen adalah
T 1 2
3 4
5
6
7
8
0.2312 0.0358 0.0191 0.0154 0.0029 0.0008 0.0006 0.0003 .
Sedangkan vektor eigen untuk tiap nilai eigen diperoleh berturut-turut ditunjukkan pada tiap kolom
pada Tabel 5 dan dapat ditunjukkan bahwa vektor eigen tersebut saling ortonormal.
Tabel 5. Nilai Vektor eigen untuk data Tabel 3.
u1
u2
u3
u4
u5
u6
u7
u8
0.4043
-0.6881
0.0070
0.5947
-0.0354
-0.0487
-0.0402
-0.0635
0.6699
0.3835
0.0086
-0.0871
-0.2525
-0.5485
0.0456
-0.1726
0.1841
-0.2473
0.0249
-0.3955
0.8242
-0.2184
0.0044
-0.1445
-0.1714
-0.0466
-0.0667
0.1113
0.0760
-0.5459
0.0324
0.8043
-0.2206
0.3426
-0.5731
0.5286
0.3240
-0.1750
0.0360
-0.2987
0.4298
-0.0002
-0.6643
-0.2029
0.0055
0.4399
0.1035
0.3585
-0.0566
-0.0703
0.0763
0.0152
-0.0212
-0.0096
0.9910
-0.0563
0.2965
0.4402
0.4683
0.3861
0.3800
0.3562
0.0336
0.2785
Menurut Bab 2, maka perlu didefinisikan variabel random yang disusun berdasarkan vektor-vektor
kolom dari matriks kovariansi S, yaitu
0.4043
0.6699
0.1841
0.1714
0.2206
0.4298
0.0566
0.2965
0.6881
0.3835
0.2473
0.0466
0.3426
0.0002
0.0703
0.4402
0.0070
0.0086
0.0249
0.0667
0.5731
0.6643
0.0763
0.4683
0.3861
0.0152
0.0871
0.5286
0.1113
0.3955
0.5947
0.2029
, X8
, X 7
, X6
, X5
, X4
, X3
, X2
X1
0.0354
0.2525
0.8242
0.0760
0.3240
0.0055
0.0212
0.3800
0.0487
0.5485
0.2184
0.5459
0.1750
0.4399
0.0096
0.3562
0.0402
0.0456
0.0044
0.0324
0.0360
0.1035
0.9910
0.0336
0.0635
0.1726
0.1445
0.8043
0.2987
0.3585
0.0563
0.2785
675
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
Karena komponen prinsip yang terpenting adalah yang pertama maka komponen prinsip pertama
adalah
Y1 0.4043 X 1 0.6881 X 2 0.0070 X 3 0.5947 X 4 0.0354 X 5 0.0487 X 6 0.0402 X 7 0.0635 X 8 .
Dapat ditunjukkan bahwa Yi dan Y j saling bebas linear , i,j =1,..,8. yaitu bahwa Cov( Yi , Y j ) = 0.
Untuk selanjutnya korelasi antara Y1 dan X i , i =1,…,8 dapat ditunjukkan dengan mengikuti
formula (2) yaitu berturut-turut
e21 1
e
e31 1 = 0.0027
e
= 0.0419;
Y , X 41 1 = 0.0301;
Y , X 11 1 = 0.0442; Y , X
Y ,X
1
1
Y , X
1
1
s11
e51 1
5
s 55
2
= 0.2132; Y , X
1
6
s 22
e21 1
s66
1
3
= 0.3266. Y1 , X 7
e21 1
s 33
s77
1
4
s 44
= 0.9931; Y , X e21 1 = 0.8682.
1
8
s88
Karena nilai korelasi variabel X 7 ( properti ) dan X 8 ( perdagangan ) dekat dengan 1, maka
variabel X 7 dan X 8 sebagai variabel yang paling berpengaruh terhadap nilai saham.
Hasil PCA dengan standardisasi variabel
Hasil PCA dengan standardisasi variabel diharapkan memberikan kesimpulan yang sama tentang
variabel yang dianggap dominan. Dengan menggunakan persamaan (5c) data distandardisasi.
Diperoleh nilai eigen
T 1 2
3 4
5 6
7
8
6.0037 1.0036 0.5486 0.2895 0.1072 0.0222 0.0179 0.0072 .
T
e1 0.3793
0.3964 0.3482 0.3727 0.3854 0.0324 0.3664 .
Sehingga vektor eigen untuk nilai eigen terbesar adalah
Y1 0.3793Z 1 0.3964Z 2 0.3482Z 3 0.3727 Z 4 0.3937 Z 5 0.3854Z 6
Komponen prinsip dengan variabel standard untuk nilai eigen terbesar adalah
0.0324Z 7 0.3664Z 8
.
Kita dapat menyusun korelasi antara Y1 dengan Z i , i =1,...,8 menggunakan persamaan (5h)
diperoleh
Y1 ,Z1 -0.1548, Y1 ,Z 2 -0.1618, Y1 ,Z 3 -0.1421, Y1 ,Z 4 -0.1521, Y1 ,Z 5 -0.1607,
Y ,Z -0.1573 , Y ,Z -0.0132 dan Y ,Z -0.1496. Kita menyimpulkan bahwa semua
1
6
1
7
1
8
variabel mempunyai makna yang sama atau tidak ada yang dominan.
Dari hasil ini disimpulkan bahwa menggunakan standardisasi variabel tidak dapat menunjukkan
dominasi salah satu variabel. Hal ini juga ditunjukkan pada literatur (Johnson and Wichern, 2002) .
Pemilihan variabel dengan standarisasi dilakukan bila data mempunyai perbedaan yang sangat
signifikan ataupun dengan satuan yang berbeda. Hal ini belum diselidiki lebih lanjut.
KESIMPULAN DAN SARAN
Pada makalah ini telah ditunjukkan pemilihan variabel dominan dengan menggunakan Principal
Component Analysis untuk 8 variabel .Variabel tersebut adalah pertanian, industri dasar, aneka
industri, barang konsumsi, keuangan, pertambangan, properti, dan perdagangan. Seluruh variabel
diuji untuk mendapatkan variabel yang dominan. Diperoleh bahwa properti dan perdagangan adalah
676
PROSIDING SEMINAR NASIONAL SAINS DAN PENDIDIKAN SAINS UKSW
variabel yang dominan yang ditunjukkan dengan variansi terbesar melalui Principal Component
Analysis.
Analisa dapat pula dilakukan dengan menstandarisasi variabel menggunakan persamaan (5c)
sehingga komponen prinsip merupakan kombinasi linear antar variabel yang telah distandarisasi
menurut Teorema 6. Diperoleh bahwa dominasi variabel tidak dapat dikenali.
DAFTAR PUSTAKA
[1] Johnson ,R.A., and Wichern, D.W. 2002. Applied Multivariate Statistical Analysis, 6th ed.
Prentice Hall, ISBN 0-13-187715-1.
[2] Lay, D. C. 2003. Linear Algebra and Ist Applications, Third Edition, Addison Wesley, pp.482491.
[3] Parhusip H. A., dan Siska A. 2009. Principal Component Analysis (PCA) untuk
Analisis Perlakukan Pemberian Pakan dan Mineral terhadap Produksi Susu Sapi,
Prosiding Seminar Nasioanal Matematika UNPAR, ISSN 1907-3909, Vol 4, hal.AA
42-51.
[3] Peressini, A.L., Sullivan, F.E.,Uhl, J.J.,1988. The Mathematics of Nonlinear Programming,
Springer-Verlag, New-York.
http //: bankindonesia/statistic/moneter/semi11
677