Analisis Korelasi dan Regresi tugas
Analisis Korelasi dan Regresi Linear
Hubungan Antar Peubah
• Dari setiap objek/individu/tempat/dll dapat
diukur/dicatat/diamati lebih dari satu buah
peubah.
• Nilai dari suatu peubah bersifat:
– saling bebas dengan peubah lain
– saling terkait dengan peubah lain
Hubungan antar Peubah
berat
badan
suhu
rata-rata
tinggi badan
ketinggian tempat
Koefisien Korelasi
• Diperlukan sebuah ukuran yang dapat mencirikan
keeratan hubungan antar dua peubah.
• Koefisien Korelasi ( ; baca: rho)
– nilainya: -1 1
– tanda menunjukkan arah hubungan
– besar/magnitude menunjukkan kekuatan hubungan
– koefisien korelasi data contoh dinotasikan r
Koefisien Korelasi (Pearson)
Jika ada dua peubah X dan Y, korelasi antara keduanya
adalah
rxy
S xy
Sx
S xy
SxS y
( x x )( y
(x x)
i
n 1
i
i
y)
n 1
2
dan S y
(y
i
y)
n 1
2
Koefisien Korelasi (+)
r = 0.70
r = 0.58
r = 0.95
Koefisien Korelasi (-)
r = -0.68
r = -0.58
r = -0.90
Ilustrasi
Tinggi Badan
165
159
166
173
179
164
163
154
170
158
Berat Badan
49
58
60
67
69
56
53
51
60
44
70
65
60
55
50
45
40
150
155
160
165
170
175
180
Ilustrasi
x
165
159
166
173
179
164
163
154
170
158
y
49
58
60
67
69
56
53
51
60
44
165.1
56.7
x-xbar
-0.1
-6.1
0.9
7.9
13.9
-1.1
-2.1
-11.1
4.9
-7.1
y-ybar
-7.7
1.3
3.3
10.3
12.3
-0.7
-3.7
-5.7
3.3
-12.7
jumlah
(x-xbar)2
0.01
37.21
0.81
62.41
193.21
1.21
4.41
123.21
24.01
50.41
(y-ybar)2
59.29
1.69
10.89
106.09
151.29
0.49
13.69
32.49
10.89
161.29
(x-xbar)(y-ybar)
0.77
-7.93
2.97
81.37
170.97
0.77
7.77
63.27
16.17
90.17
496.9
548.1
426.3
426.3
r
0.817
496.9 548.1
Regresi Linear: Pengantar
• Terdapat 2 peubah numerik : peubah yang satu
mempengaruhi peubah yang lain
• Peubah yang mempengaruhi X, peubah bebas
(independent), peubah penjelas (explanatory)
• Peubah yang dipengaruhi Y, peubah tak bebas
(dependent), peubah respon (response)
Pengantar
Misalnya ingin melihat hubungan antara
pengeluaran untuk iklan (ads expenditures, X)
dengan penerimaan melalui penjualan (sales
revenue, Y)
Bulan
X
Y
1
10
44
2
9
40
3
11
42
4
12
46
5
11
48
6
12
52
7
13
54
8
13
58
9
14
56
10
15
60
s a le s re v e n u e (m illio n s o f d o lla rs )
Pengantar
65
60
55
50
45
40
35
8
9
10
11
12
13
14
15
16
ads expenditures (m illions of dollars)
17
s a le s r e v e n u e ( m illio n s o f d o lla r s )
Pengantar
Ingin dibuat
model
Y=a+
bX
65
Model memuat
error, selisih
nilai sebenarnya
dengan dugaan
berdasar model
e
60
ˆ
Y
55
Y
50
45
40
35
8
9
10
11
12
13
14
15
16
17
ads expenditures (m illions of dollars)
ˆ
e Y - Y
Bagaimana mendapatkan a dan b?
Metode yang digunakan : OLS (ordinary least
squares/kuadrat terkecil), mencari a dan b
sehingga jumlah kuadrat error paling kecil
Cari penduga a dan b sehingga
n
n
e
i 1
minimum
2
i
i 1
Yi - aˆ - bˆX i
2
Bagaimana mendapatkan a dan b?
n
X
bˆ i 1
i
X Yi Y
n
X
i
X
2
i 1
aˆ Y bˆX
Rata-rata Y
Rata-rata X
Ilustrasi Perhitungan
X
Y
X-Xbar
Y-Ybar
(X-Xbar)(Y-Ybar)
(X-Xbar)2
10
44
-2
-6
12
4
9
40
-3
-10
30
9
11
42
-1
-8
8
1
12
46
0
-4
0
0
11
48
-1
-2
2
1
12
52
0
2
0
0
13
54
1
4
4
1
13
58
1
8
8
1
14
56
2
6
12
4
X 12
X
Y 50
X
X Y Y 106
X
2
30
b = 106 / 30 = 3.533
a = 50 – 3.533 (12) = 7.60
s a le s re v e n u e (m illio n s o f d o lla rs )
65
60
f(x) = 3.53x + 7.6
55
50
45
40
35
8
9
10
11
12
13
14
15
16
ads expenditures (m illions of dollars)
17
Interpretasi a dan b
Y = 7.6 + 3.53 X
Pendapatan = 7.6 + 3.53 Belanja Iklan
• a = intersep/intercept = besarnya nilai Y ketika X
sebesar 0
• b = gradient/slope = besarnya perubahan nilai Y ketika X
berubah satu satuan. Tanda koefisien b menunjukkan
arah hubungan X dan Y
Pada kasus ilustrasi
• a = 7.6 besarnya sales revenue jika tidak ada belanja
iklan adalah 7.6 juta dolar
• b = 3.533 jika belanja iklan dinaikkan 1 juta dolar
maka sales revenue naik 3.533 juta dolar
Uji Signifikasi Koefisien b
H0 : b = 0 (artinya X tidak mempengaruhi
Y)
H1 : b 0 (artinya X mempengaruhi
Y)
n
2
statistik uji
Yi Yˆi
i 1
ˆb
sbˆ
n
t
(n 2) X i X
s bˆ
2
i 1
Tolak H0 jika nilai |t| melebihi nilai t pada tabel
dengan derajat bebas (n-2) dengan tingkat
kesalahan /2
Uji signifikansi koefisien b
• Nilai sb = (65.47 / (8)(30)) = 0.52
• Nilai t = 3.53 / 0.52 = 6.79
• Nilai t pada tabel (db = 8, = 5%) = 2.306
• Kesimpulan : Tolak H0, data mendukung
kesimpulan adanya pengaruh ads expenditure
terhadap sales revenue.
Ukuran Kebaikan Model
• Menggunakan koefisien determinasi (R2, Rsquared)
• R-squared bernilai antara 0 s/d 1
• R-squared adalah persentase keragaman data
yang mampu diterangkan oleh model
• R-squared tinggi adalah indikasi model yang
baik
Ukuran Kebaikan Model
2
R
2
Y Y
2
ˆ
Y
iY
i
1
e
2
Y Y
2
i
• Model dalam ilustrasi bisa
ditunjukkan memiliki R-squared
0.85 atau 85%
Di SAS
PROC CORR DATA = nama;
VAR x y;
RUN;
PROC REG DATA = nama;
MODEL y = x;
RUN;
TERIMA KASIH
Hubungan Antar Peubah
• Dari setiap objek/individu/tempat/dll dapat
diukur/dicatat/diamati lebih dari satu buah
peubah.
• Nilai dari suatu peubah bersifat:
– saling bebas dengan peubah lain
– saling terkait dengan peubah lain
Hubungan antar Peubah
berat
badan
suhu
rata-rata
tinggi badan
ketinggian tempat
Koefisien Korelasi
• Diperlukan sebuah ukuran yang dapat mencirikan
keeratan hubungan antar dua peubah.
• Koefisien Korelasi ( ; baca: rho)
– nilainya: -1 1
– tanda menunjukkan arah hubungan
– besar/magnitude menunjukkan kekuatan hubungan
– koefisien korelasi data contoh dinotasikan r
Koefisien Korelasi (Pearson)
Jika ada dua peubah X dan Y, korelasi antara keduanya
adalah
rxy
S xy
Sx
S xy
SxS y
( x x )( y
(x x)
i
n 1
i
i
y)
n 1
2
dan S y
(y
i
y)
n 1
2
Koefisien Korelasi (+)
r = 0.70
r = 0.58
r = 0.95
Koefisien Korelasi (-)
r = -0.68
r = -0.58
r = -0.90
Ilustrasi
Tinggi Badan
165
159
166
173
179
164
163
154
170
158
Berat Badan
49
58
60
67
69
56
53
51
60
44
70
65
60
55
50
45
40
150
155
160
165
170
175
180
Ilustrasi
x
165
159
166
173
179
164
163
154
170
158
y
49
58
60
67
69
56
53
51
60
44
165.1
56.7
x-xbar
-0.1
-6.1
0.9
7.9
13.9
-1.1
-2.1
-11.1
4.9
-7.1
y-ybar
-7.7
1.3
3.3
10.3
12.3
-0.7
-3.7
-5.7
3.3
-12.7
jumlah
(x-xbar)2
0.01
37.21
0.81
62.41
193.21
1.21
4.41
123.21
24.01
50.41
(y-ybar)2
59.29
1.69
10.89
106.09
151.29
0.49
13.69
32.49
10.89
161.29
(x-xbar)(y-ybar)
0.77
-7.93
2.97
81.37
170.97
0.77
7.77
63.27
16.17
90.17
496.9
548.1
426.3
426.3
r
0.817
496.9 548.1
Regresi Linear: Pengantar
• Terdapat 2 peubah numerik : peubah yang satu
mempengaruhi peubah yang lain
• Peubah yang mempengaruhi X, peubah bebas
(independent), peubah penjelas (explanatory)
• Peubah yang dipengaruhi Y, peubah tak bebas
(dependent), peubah respon (response)
Pengantar
Misalnya ingin melihat hubungan antara
pengeluaran untuk iklan (ads expenditures, X)
dengan penerimaan melalui penjualan (sales
revenue, Y)
Bulan
X
Y
1
10
44
2
9
40
3
11
42
4
12
46
5
11
48
6
12
52
7
13
54
8
13
58
9
14
56
10
15
60
s a le s re v e n u e (m illio n s o f d o lla rs )
Pengantar
65
60
55
50
45
40
35
8
9
10
11
12
13
14
15
16
ads expenditures (m illions of dollars)
17
s a le s r e v e n u e ( m illio n s o f d o lla r s )
Pengantar
Ingin dibuat
model
Y=a+
bX
65
Model memuat
error, selisih
nilai sebenarnya
dengan dugaan
berdasar model
e
60
ˆ
Y
55
Y
50
45
40
35
8
9
10
11
12
13
14
15
16
17
ads expenditures (m illions of dollars)
ˆ
e Y - Y
Bagaimana mendapatkan a dan b?
Metode yang digunakan : OLS (ordinary least
squares/kuadrat terkecil), mencari a dan b
sehingga jumlah kuadrat error paling kecil
Cari penduga a dan b sehingga
n
n
e
i 1
minimum
2
i
i 1
Yi - aˆ - bˆX i
2
Bagaimana mendapatkan a dan b?
n
X
bˆ i 1
i
X Yi Y
n
X
i
X
2
i 1
aˆ Y bˆX
Rata-rata Y
Rata-rata X
Ilustrasi Perhitungan
X
Y
X-Xbar
Y-Ybar
(X-Xbar)(Y-Ybar)
(X-Xbar)2
10
44
-2
-6
12
4
9
40
-3
-10
30
9
11
42
-1
-8
8
1
12
46
0
-4
0
0
11
48
-1
-2
2
1
12
52
0
2
0
0
13
54
1
4
4
1
13
58
1
8
8
1
14
56
2
6
12
4
X 12
X
Y 50
X
X Y Y 106
X
2
30
b = 106 / 30 = 3.533
a = 50 – 3.533 (12) = 7.60
s a le s re v e n u e (m illio n s o f d o lla rs )
65
60
f(x) = 3.53x + 7.6
55
50
45
40
35
8
9
10
11
12
13
14
15
16
ads expenditures (m illions of dollars)
17
Interpretasi a dan b
Y = 7.6 + 3.53 X
Pendapatan = 7.6 + 3.53 Belanja Iklan
• a = intersep/intercept = besarnya nilai Y ketika X
sebesar 0
• b = gradient/slope = besarnya perubahan nilai Y ketika X
berubah satu satuan. Tanda koefisien b menunjukkan
arah hubungan X dan Y
Pada kasus ilustrasi
• a = 7.6 besarnya sales revenue jika tidak ada belanja
iklan adalah 7.6 juta dolar
• b = 3.533 jika belanja iklan dinaikkan 1 juta dolar
maka sales revenue naik 3.533 juta dolar
Uji Signifikasi Koefisien b
H0 : b = 0 (artinya X tidak mempengaruhi
Y)
H1 : b 0 (artinya X mempengaruhi
Y)
n
2
statistik uji
Yi Yˆi
i 1
ˆb
sbˆ
n
t
(n 2) X i X
s bˆ
2
i 1
Tolak H0 jika nilai |t| melebihi nilai t pada tabel
dengan derajat bebas (n-2) dengan tingkat
kesalahan /2
Uji signifikansi koefisien b
• Nilai sb = (65.47 / (8)(30)) = 0.52
• Nilai t = 3.53 / 0.52 = 6.79
• Nilai t pada tabel (db = 8, = 5%) = 2.306
• Kesimpulan : Tolak H0, data mendukung
kesimpulan adanya pengaruh ads expenditure
terhadap sales revenue.
Ukuran Kebaikan Model
• Menggunakan koefisien determinasi (R2, Rsquared)
• R-squared bernilai antara 0 s/d 1
• R-squared adalah persentase keragaman data
yang mampu diterangkan oleh model
• R-squared tinggi adalah indikasi model yang
baik
Ukuran Kebaikan Model
2
R
2
Y Y
2
ˆ
Y
iY
i
1
e
2
Y Y
2
i
• Model dalam ilustrasi bisa
ditunjukkan memiliki R-squared
0.85 atau 85%
Di SAS
PROC CORR DATA = nama;
VAR x y;
RUN;
PROC REG DATA = nama;
MODEL y = x;
RUN;
TERIMA KASIH