PROS Hanna A Parhusip Deva W Bernadeta Desinova Kr Property Dan Perdagangan Sebagai Sektor ppt
PROPERTY DAN PERDAGANGAN SEBAGAI
SEKTOR DOMINAN PADA DATA BURSA SAHAM
DENGAN Principal Component Analysis (PCA)
Oleh :
Hanna A Parhusip, Deva Widyananto
a a
a us p, e a dya a to1 da
dan Bernadeta Desinova Kr
e adeta es o a 2
Program Studi Statistika Matematika
Fakultas Sains dan Matematika (FSM)
Universitas Kristen Satya Wacana (UKSW) (www uksw edu)
Universitas Kristen Satya Wacana (UKSW) (www.uksw.edu)
1mahasiswa S1, matematika – FSM – UKSW
2mahasiswa S1, matematika – FSM – UKSW
Masalah
Data dengan variabel banyak dapat membingungkan
dalam formulasi masalah
pada suatu model matematika
Oleh karena itu diperlukan cara memilih variabel
yang dominan untuk mereduksi banyaknya variabel.
METODE : PCA (Principal Component Analysis)
Pada makalah ini dibahas tentang cara memilih sektor ‐
Pada
makalah ini dibahas tentang cara memilih sektor ‐
sektor saham domina yang ada di Indonesia. Data diambil
dari Bursa Efek Jakarta ( BEJ ) dan menggunakan data pada
b l
bulan Januari 2008 sampai dengan Januari 2010.
d
Principal Component Analysis
Secara aljabar PCA
j
merupakan suatu kombinasi linear
p
khusus untuk p variabel random X1, . . . , Xp. Secara
geometri, kombinasi linear menyatakan pemilihan
sistem koordinat baru yang diperoleh dari merotasi
sistem koordinat baru yang diperoleh dari merotasi
sistem mula‐mula X1, . . . , Xp sebagai sumbu‐sumbu
koordinat. Sumbu koordinat yang baru sangat
tergantung dari matriks kovariansi. (atau matrik
d
k k
(
k
korelasi). Matriks kovariansi pada makalah ini
disimbolkan dan haruslah positif tegas (positive
p
g (p
definite). Istilah ini dijelaskan pada Definisi 1.
Definisi 1: (Peressini,1988)
(Peressini 1988)
aij
Misalkan sebuah matriks simetri
Misalkan
sebuah
matriks simetri
a
positif tegas (definite
nn
maka matriks
positive) jika dan hanya jika semua nilai
positive) jika dan hanya jika semua nilai
eigennya positif . Untuk negatif tegas
didefinisikan secara analog
didefinisikan secara analog.
ij
Teorema 1.
(halaman 358, Johnson and Wichern, 2007)
Sebutlah matriks X
Sebutlah
matriks X = [X1, . . . , Xp]
Xp] adalah matriks
adalah matriks
yang vektor‐vektor kolomnya adalah vektor random
(dianggap berdistribusi normal) yang mempunyai matriks
kovariansi (simetris dan positif tegas (positive definite))
dengan nilai eigen
dan sebutlah
vektor
eigen yang bersesuaian untuk setiap
1 vektor eigen yang bersesuaian untuk setiap
2 ... p 0
1 2 ... p 0
adalah
yang saling ortogonal. Komponen
prinsip ke‐i
adalah
e1 ,,...,,e p
T
Yi ei X e1i X1 e21 X 2 ... e pi X p ,
i= 1,2,...,p
(1.a)
Dengan pemilihan ini
g p
T
Var (Yi ) ei ei i , ii =1,2,...,p
V
12
(1 b)
(1.b)
T
T
Cov Yi , Yk = e i e k 0, ei ek 0. (1.c)
Bukti : (halaman 358, Johnson and Wichern, 2002) .
METODE PENELITIAN
• Data : data saham Januari 2008 – 2010. Data setiap vektorvektor kolom dianggap sebagai variabel random yang
berdistribusi normal.
• Menyusun matriks kovariansi
• Menghitung
M
hit
nilai
il i eigen
i
d
dan vektor
kt eigen
i
V
Vektor
kt eigen
i
sebagai penyusun koefisien pada komponen prinsip.
• Menyatakan variabel prinsip sebagai kombinasi linear dari
variabel mula-mula
• Menentukan koefisisen korelasi antara komponen prinsip
dan variabel mula mula dengan persamaan
T
Yi ei X e1i X1 e21X 2 ... epi X p
4. ANALISA DAN
Tabel PEMBAHASAN
4. Matriks kovariansi (S)
4. Matriks
S1
S2
S3
S4
S5
S6
S7
S8
0.0251
0.0292
0.0285
0.0229
0.0250
0.0287
0.0010
0.0227
0.0292
0.0471
0.0445
0.0420
0.0402
0.0354
0.0011
0.0268
0 0285
0.0285
0 0445
0.0445
0 0644
0.0644
0 0397
0.0397
0 0382
0.0382
0 0346
0.0346
0 0047
0.0047
0 0280
0.0280
0.0229
0.0420
0.0397
0.0398
0.0363
0.0286
0.0034
0.0213
0.0250
0.0402
0.0382
0.0363
0.0356
0.0303
0.0024
0.0232
0.0287
0.0354
0.0346
0.0286
0.0303
0.0346
0.0031
0.0256
0.0010
0.0011
0.0047
0.0034
0.0024
0.0031
0.0357
0.0008
0.0227
0.0268
0.0280
0.0213
0.0232
0.0256
0.0008
0.0238
Tampak bahwa matriks kovariansi S adalah matriks
simetris. Kita dapat mencari nilai eigen sebagaimana
ditunjukkan pada Bab 2 dan dengan menggunakan
bantuan MATLAB maka nilai eigen
bantuan MATLAB
maka nilai eigen adalah
adalah
1 2
3 4
5
6
7
8
0.2312
0.0358 0.0191 0.0154 0.0029 0.0008 0.0006 0.0003
Sedangkan vektor eigen untuk tiap nilai eigen
diperoleh berturut‐turut ditunjukkan tiap kolom pada
p
j
p
p
Tabel 5 dan dapat ditunjukkan bahwa vektor eigen
tersebut saling ortonormal.
Tabel 5. Nilai
5. Nilai Vektor eigen untuk data Tabel
data Tabel 3
u1
u2
u3
0.4043
0.6699
0.1841
0.6881
‐0.6881
0.3835
‐0.2473
0.2473 ‐0.0466
0.0466
0.0070
0.0086
0.0249
0.5947
‐0.0871 ‐0.3955
u4
u5
‐0.1714 ‐0.2206
0.3426
u6
u7
u8
0.4298
‐0.0566
0.2965
‐0.0002
0.0002 ‐0.0703
0.0703
0.4402
‐0.0667 ‐0.5731 ‐0.6643
0.0763
0.4683
0.1113
0.5286
‐0.2029
0.0152
0.3861
0.0760
0.3240
0.0055
‐0.0212
0.3800
‐0.0487 ‐0.5485 ‐0.2184 ‐0.5459 ‐0.1750
0.4399
‐0.0096
0.3562
‐0.0402
0 0402
‐0.0354 ‐0.2525
0 0456
0.0456
0.8242
0 0044
0.0044
0 0324
0.0324
0 0360
0.0360
0 1035
0.1035
0 9910
0.9910
0 0336
0.0336
‐0.0635 ‐0.1726 ‐0.1445
0.8043
‐0.2987
0.3585
‐0.0563
0.2785
Oleh karena itu komponen
p
prinsip
p
p adalah
Y1 0 .4043 X 1 0 .6881 X 2 0 .0070 X 3 0 .5947 X 4 0 .0354 X 5 0 .0487 X 6 0 .0402 X 7 0 .0635 X 8
Y 2 0 .6699 X 1 0 .3835 X 2 0 .0086 X 3 0 .0871 X 4 0 .2525 X 5 0 .5485 X 6 0 .0456 X 7 0 .1726 X 8
Y 3 0 .1841 X 1 0 .2473 X 2 0 .0249 X 3 0 .3955 X 4 0 .8242 X 5 0 .2184 X 6 0 .0044 X 7 0 .1445 X 8
Y 4 0 .1714 X 1 0 .0466 X 2 0 .0667 X 3 0 .1113 X 4 0 .0760 X 5 0 .5459 X 6 0 .0324 X 7 0 .8043 X 8
Y5 0 .2206 X 1 0 .3426 X 2 0 .5731 X 3 0 .5286 X 4 0 .3240 X 5 0 .1750 X 6 0 .0360 X 7 0 .2987 X 8
Y 6 0 .4298 X 1 0 .0002 X 2 0 .6643 X 3 0 .2029 X 4 0 .0055 X 5 0 .4399 X 6 0 .1035 X 7 0 .3585 X 8
Y 7 0 .0566 X 1 0 .0703 X 2 0 .0763 X 3 0 .0152 X 4 0 .0212 X 5 0 .0096 X 6 0 .9910 X 7 0 .0563 X 8
Y8 0 .2965 X 1 0 .4402 X 2 0 .4683 X 3 0 .3861 X 4 0 .3800 X 5 0 .3562 X 6 0 .0336 X 7 0 .2785 X 8
Yi
Dapat ditunjukkan bahwa dan saling bebas linear ,
Yj
i,j=1,..,8. Oleh karena itu sebagaimana disebutkan pada Bab 2
diperoleh bahwa Cov(
diperoleh bahwa Cov( , ) = 0.
) = Y0i Yj
Untuk selanjutnya korelasi antara antara komponen prinsip
pertama dan variabel mula‐mula berturut‐turut adalah
t
d
i b l
l
l b t tt t d l h
Y , X
1
1
Y , X
1
4
Y , X
1
7
e11 1
= 0.0442;
s11
e41 1
s 44
e21 1
s 77
= 0.0301;
= 0.9931;
Y , X
1
2
e21 1
= 0.0419;
s 22
Y , X
1
5
Y , X
1
8
e51 1
s55
= 0.2132;
Y , X
1
3
Y , X
1
6
e31 1
s33
= 0.0027
e21 1
= 0.3266
s 66
e21 1
s88
= 0.8682
X8
X7
Karena nilai korelasi variabel ( properti ) dan
X8
X7
( perdagangan ) dekat dengan 1, maka variabel dan sebagai
variabel yang paling berpengaruh terhadap nilai saham
variabel yang paling berpengaruh terhadap nilai saham.
Kesimpulan dan Saran
Pada makalah ini ini telah ditunjukkan analisa
variabel dengan menggunakan Principal Component
Analysis untuk 8 variabel mengenai sektor – sektor yang
memiliki nilai sahan cukup tinggi Variabel tersebut
memiliki nilai sahan cukup tinggi. Variabel tersebut
adalah pertanian, industri dasar, aneka industri, barang
konsumsi, keuangan, pertambangan, properti, dan
perdagangan. Seluruh variabel diuji untuk mendapatkan
variabel yang dominan. Diperoleh bahwa properti dan
perdagangan adalah variabel yang dominan yang
adalah variabel yang dominan yang
ditunjukkan dengan variansi terbesar melalui Principal
Component Analysis.
SEKTOR DOMINAN PADA DATA BURSA SAHAM
DENGAN Principal Component Analysis (PCA)
Oleh :
Hanna A Parhusip, Deva Widyananto
a a
a us p, e a dya a to1 da
dan Bernadeta Desinova Kr
e adeta es o a 2
Program Studi Statistika Matematika
Fakultas Sains dan Matematika (FSM)
Universitas Kristen Satya Wacana (UKSW) (www uksw edu)
Universitas Kristen Satya Wacana (UKSW) (www.uksw.edu)
1mahasiswa S1, matematika – FSM – UKSW
2mahasiswa S1, matematika – FSM – UKSW
Masalah
Data dengan variabel banyak dapat membingungkan
dalam formulasi masalah
pada suatu model matematika
Oleh karena itu diperlukan cara memilih variabel
yang dominan untuk mereduksi banyaknya variabel.
METODE : PCA (Principal Component Analysis)
Pada makalah ini dibahas tentang cara memilih sektor ‐
Pada
makalah ini dibahas tentang cara memilih sektor ‐
sektor saham domina yang ada di Indonesia. Data diambil
dari Bursa Efek Jakarta ( BEJ ) dan menggunakan data pada
b l
bulan Januari 2008 sampai dengan Januari 2010.
d
Principal Component Analysis
Secara aljabar PCA
j
merupakan suatu kombinasi linear
p
khusus untuk p variabel random X1, . . . , Xp. Secara
geometri, kombinasi linear menyatakan pemilihan
sistem koordinat baru yang diperoleh dari merotasi
sistem koordinat baru yang diperoleh dari merotasi
sistem mula‐mula X1, . . . , Xp sebagai sumbu‐sumbu
koordinat. Sumbu koordinat yang baru sangat
tergantung dari matriks kovariansi. (atau matrik
d
k k
(
k
korelasi). Matriks kovariansi pada makalah ini
disimbolkan dan haruslah positif tegas (positive
p
g (p
definite). Istilah ini dijelaskan pada Definisi 1.
Definisi 1: (Peressini,1988)
(Peressini 1988)
aij
Misalkan sebuah matriks simetri
Misalkan
sebuah
matriks simetri
a
positif tegas (definite
nn
maka matriks
positive) jika dan hanya jika semua nilai
positive) jika dan hanya jika semua nilai
eigennya positif . Untuk negatif tegas
didefinisikan secara analog
didefinisikan secara analog.
ij
Teorema 1.
(halaman 358, Johnson and Wichern, 2007)
Sebutlah matriks X
Sebutlah
matriks X = [X1, . . . , Xp]
Xp] adalah matriks
adalah matriks
yang vektor‐vektor kolomnya adalah vektor random
(dianggap berdistribusi normal) yang mempunyai matriks
kovariansi (simetris dan positif tegas (positive definite))
dengan nilai eigen
dan sebutlah
vektor
eigen yang bersesuaian untuk setiap
1 vektor eigen yang bersesuaian untuk setiap
2 ... p 0
1 2 ... p 0
adalah
yang saling ortogonal. Komponen
prinsip ke‐i
adalah
e1 ,,...,,e p
T
Yi ei X e1i X1 e21 X 2 ... e pi X p ,
i= 1,2,...,p
(1.a)
Dengan pemilihan ini
g p
T
Var (Yi ) ei ei i , ii =1,2,...,p
V
12
(1 b)
(1.b)
T
T
Cov Yi , Yk = e i e k 0, ei ek 0. (1.c)
Bukti : (halaman 358, Johnson and Wichern, 2002) .
METODE PENELITIAN
• Data : data saham Januari 2008 – 2010. Data setiap vektorvektor kolom dianggap sebagai variabel random yang
berdistribusi normal.
• Menyusun matriks kovariansi
• Menghitung
M
hit
nilai
il i eigen
i
d
dan vektor
kt eigen
i
V
Vektor
kt eigen
i
sebagai penyusun koefisien pada komponen prinsip.
• Menyatakan variabel prinsip sebagai kombinasi linear dari
variabel mula-mula
• Menentukan koefisisen korelasi antara komponen prinsip
dan variabel mula mula dengan persamaan
T
Yi ei X e1i X1 e21X 2 ... epi X p
4. ANALISA DAN
Tabel PEMBAHASAN
4. Matriks kovariansi (S)
4. Matriks
S1
S2
S3
S4
S5
S6
S7
S8
0.0251
0.0292
0.0285
0.0229
0.0250
0.0287
0.0010
0.0227
0.0292
0.0471
0.0445
0.0420
0.0402
0.0354
0.0011
0.0268
0 0285
0.0285
0 0445
0.0445
0 0644
0.0644
0 0397
0.0397
0 0382
0.0382
0 0346
0.0346
0 0047
0.0047
0 0280
0.0280
0.0229
0.0420
0.0397
0.0398
0.0363
0.0286
0.0034
0.0213
0.0250
0.0402
0.0382
0.0363
0.0356
0.0303
0.0024
0.0232
0.0287
0.0354
0.0346
0.0286
0.0303
0.0346
0.0031
0.0256
0.0010
0.0011
0.0047
0.0034
0.0024
0.0031
0.0357
0.0008
0.0227
0.0268
0.0280
0.0213
0.0232
0.0256
0.0008
0.0238
Tampak bahwa matriks kovariansi S adalah matriks
simetris. Kita dapat mencari nilai eigen sebagaimana
ditunjukkan pada Bab 2 dan dengan menggunakan
bantuan MATLAB maka nilai eigen
bantuan MATLAB
maka nilai eigen adalah
adalah
1 2
3 4
5
6
7
8
0.2312
0.0358 0.0191 0.0154 0.0029 0.0008 0.0006 0.0003
Sedangkan vektor eigen untuk tiap nilai eigen
diperoleh berturut‐turut ditunjukkan tiap kolom pada
p
j
p
p
Tabel 5 dan dapat ditunjukkan bahwa vektor eigen
tersebut saling ortonormal.
Tabel 5. Nilai
5. Nilai Vektor eigen untuk data Tabel
data Tabel 3
u1
u2
u3
0.4043
0.6699
0.1841
0.6881
‐0.6881
0.3835
‐0.2473
0.2473 ‐0.0466
0.0466
0.0070
0.0086
0.0249
0.5947
‐0.0871 ‐0.3955
u4
u5
‐0.1714 ‐0.2206
0.3426
u6
u7
u8
0.4298
‐0.0566
0.2965
‐0.0002
0.0002 ‐0.0703
0.0703
0.4402
‐0.0667 ‐0.5731 ‐0.6643
0.0763
0.4683
0.1113
0.5286
‐0.2029
0.0152
0.3861
0.0760
0.3240
0.0055
‐0.0212
0.3800
‐0.0487 ‐0.5485 ‐0.2184 ‐0.5459 ‐0.1750
0.4399
‐0.0096
0.3562
‐0.0402
0 0402
‐0.0354 ‐0.2525
0 0456
0.0456
0.8242
0 0044
0.0044
0 0324
0.0324
0 0360
0.0360
0 1035
0.1035
0 9910
0.9910
0 0336
0.0336
‐0.0635 ‐0.1726 ‐0.1445
0.8043
‐0.2987
0.3585
‐0.0563
0.2785
Oleh karena itu komponen
p
prinsip
p
p adalah
Y1 0 .4043 X 1 0 .6881 X 2 0 .0070 X 3 0 .5947 X 4 0 .0354 X 5 0 .0487 X 6 0 .0402 X 7 0 .0635 X 8
Y 2 0 .6699 X 1 0 .3835 X 2 0 .0086 X 3 0 .0871 X 4 0 .2525 X 5 0 .5485 X 6 0 .0456 X 7 0 .1726 X 8
Y 3 0 .1841 X 1 0 .2473 X 2 0 .0249 X 3 0 .3955 X 4 0 .8242 X 5 0 .2184 X 6 0 .0044 X 7 0 .1445 X 8
Y 4 0 .1714 X 1 0 .0466 X 2 0 .0667 X 3 0 .1113 X 4 0 .0760 X 5 0 .5459 X 6 0 .0324 X 7 0 .8043 X 8
Y5 0 .2206 X 1 0 .3426 X 2 0 .5731 X 3 0 .5286 X 4 0 .3240 X 5 0 .1750 X 6 0 .0360 X 7 0 .2987 X 8
Y 6 0 .4298 X 1 0 .0002 X 2 0 .6643 X 3 0 .2029 X 4 0 .0055 X 5 0 .4399 X 6 0 .1035 X 7 0 .3585 X 8
Y 7 0 .0566 X 1 0 .0703 X 2 0 .0763 X 3 0 .0152 X 4 0 .0212 X 5 0 .0096 X 6 0 .9910 X 7 0 .0563 X 8
Y8 0 .2965 X 1 0 .4402 X 2 0 .4683 X 3 0 .3861 X 4 0 .3800 X 5 0 .3562 X 6 0 .0336 X 7 0 .2785 X 8
Yi
Dapat ditunjukkan bahwa dan saling bebas linear ,
Yj
i,j=1,..,8. Oleh karena itu sebagaimana disebutkan pada Bab 2
diperoleh bahwa Cov(
diperoleh bahwa Cov( , ) = 0.
) = Y0i Yj
Untuk selanjutnya korelasi antara antara komponen prinsip
pertama dan variabel mula‐mula berturut‐turut adalah
t
d
i b l
l
l b t tt t d l h
Y , X
1
1
Y , X
1
4
Y , X
1
7
e11 1
= 0.0442;
s11
e41 1
s 44
e21 1
s 77
= 0.0301;
= 0.9931;
Y , X
1
2
e21 1
= 0.0419;
s 22
Y , X
1
5
Y , X
1
8
e51 1
s55
= 0.2132;
Y , X
1
3
Y , X
1
6
e31 1
s33
= 0.0027
e21 1
= 0.3266
s 66
e21 1
s88
= 0.8682
X8
X7
Karena nilai korelasi variabel ( properti ) dan
X8
X7
( perdagangan ) dekat dengan 1, maka variabel dan sebagai
variabel yang paling berpengaruh terhadap nilai saham
variabel yang paling berpengaruh terhadap nilai saham.
Kesimpulan dan Saran
Pada makalah ini ini telah ditunjukkan analisa
variabel dengan menggunakan Principal Component
Analysis untuk 8 variabel mengenai sektor – sektor yang
memiliki nilai sahan cukup tinggi Variabel tersebut
memiliki nilai sahan cukup tinggi. Variabel tersebut
adalah pertanian, industri dasar, aneka industri, barang
konsumsi, keuangan, pertambangan, properti, dan
perdagangan. Seluruh variabel diuji untuk mendapatkan
variabel yang dominan. Diperoleh bahwa properti dan
perdagangan adalah variabel yang dominan yang
adalah variabel yang dominan yang
ditunjukkan dengan variansi terbesar melalui Principal
Component Analysis.