Statistika | Suhardi.Universitas Mulawarman.Kalimantan Timur.Indonesia
Regresi Linier Sederhana
dan Korelasi
Pengertian
• Regresi merupakan teknik statistika yang digunakan
untuk mempelajari hubungan fungsional dari satu atau
beberapa peubah bebas (peubah yang mempengaruhi)
terhadap satu peubah tak bebas (peubah yang dipengaruhi)
• Korelasi merupakan ukuran kekuatan hubungan dua
peubah (tidak harus memiliki hubungan sebab akibat)
2
Regresi
• Dari derajat (pangkat) tiap peubah bebas
• Linier (bila pangkatnya 1)
• Non-linier (bila pangkatnya bukan 1)
• Dari banyaknya peubah bebas (yang
mempengaruhi)
• Sederhana (bila hanya ada satu peubah bebas)
• Berganda (bila lebih dari satu peubah bebas)
3
Regresi Linier Sederhana
• Model
– Yi = 0 + 1Xi + i
Yi merupakan nilai pengamatan ke-i.
0 adalah parameter regresi (intersep)
1 adalah parameter regresi (slope)
i kesalahan ke-i.
– Asumsi :
• peubah X terukur tanpa kesalahan; X tidak memiliki
distribusi (bukan random variable)
• kesalahan menyebar normal dengan rata-rata nol dengan
simpangan baku .
4
Teladan Permasalahan
• Dari sebuah survai yang
dilakukan di kampung Maju
Makmur digunakan untuk
mengetahui hubungan
fungsional antara luas tanah
(hektar) dan harganya (Rp. 00
Juta). Bila data berpasangan
tentang luasan dan harga tanah
diperoleh, bagaimana hubungan
fungsionalnya ?
Luas
0,75
0,55
1,00
1,25
2,50
3,00
4,50
3,75
5,00
3,25
3,25
2,75
2,75
2,00
4,00
Harga
2,45
2,20
2,80
3,60
5,80
7,40
9,00
8,50
10,00
8,00
7,50
6,00
6,25
4,00
8,00
5
Diagram Pencar
(Scatter Plot)
Harga (Rp. juta)
12,00
10,00
8,00
6,00
4,00
2,00
0,00
0,00
1,00
2,00
3,00
4,00
5,00
6,00
Luas (Ha.)
6
Mana pendekatan yang baik ?
Garis lurus yang sedemikian rupa sehingga melewati seluruh
titik (data ) pada diagram pencar yang mendekati
Harga (Rp. juta)
12,00
10,00
8,00
6,00
4,00
2,00
0,00
0,00
1,00
2,00
3,00
4,00
5,00
6,00
Luas (Ha.)
7
Metode Jumlah Kuadrat Galat Terkecil
(Least Squares Method)
merupakan salah satu kriteria yang memenuhi, agar apabila kuadrat dari kesalahan itu
dijumlahkan akan se minimum mungkin.
12,00
10,00
8,00
Harga
Regresi
6,00
4,00
2,00
0,00
0,00
2,00
4,00
6,00
8
Persamaan Regresi
Yˆi ˆ0 ˆ1 X i
dimana
ˆ1
n n
xi yi
n
xi yi i 1 i 1
n
i 1
n
xi
n
2
i 1
x
i
n
i 1
2
ˆ0 y ˆ1 x
9
Teladan Hitungan
Luas X Harga Y
0,75
2,45
0,55
2,20
1,00
2,80
1,25
3,60
2,50
5,80
3,00
7,40
4,50
9,00
3,75
8,50
5,00
10,00
3,25
8,00
3,25
7,50
2,75
6,00
2,75
6,25
2,00
4,00
4,00
8,00
40,30
2,69
91,50
6,10
XY
1,8375
1,2100
2,8000
4,5000
14,5000
22,2000
40,5000
31,8750
50,0000
26,0000
24,3750
16,5000
17,1875
8,0000
32,0000
X2
0,5625
0,3025
1,0000
1,5625
6,2500
9,0000
20,2500
14,0625
25,0000
10,5625
10,5625
7,5625
7,5625
4,0000
16,0000
293,4850
134,2400
slope
intersep
Y2
6,0025
4,8400
7,8400
12,9600
33,6400
54,7600
81,0000
72,2500
100,0000
64,0000
56,2500
36,0000
39,0625
16,0000
64,0000
648,6050
1,835
1,169
10
Persamaan Regresi
serta penjelasannya
Yˆi 1,169 1,835 X i
Slope bernilai 1,835. Artinya : dua luasan tanah yang
berbeda seluas satu hektar, tanah yang lebih luas akan
memiliki perkiraan harga Rp. 1,835 juta lebih tinggi.
JANGAN diartikan sbb: bila luas tanah meningkat satu
hektar, maka harga tanah akan meningkat Rp. 1,835
juta.
11
Persamaan Regresi
serta penjelasannya
Yˆi 1,169 1,835 X i
Slope bernilai 1,169. Untuk teladan ini nilai intersep
tidak memiliki arti.
JANGAN diartikan sbb: bila luas tanah (x) = 0
hektar, maka harga tanah adalah Rp. 1,169 juta.
Pengartian seperti ini TIDAK benar. Kenapa ???
12
Persamaan Regresi
serta penjelasannya
Yx 3 1,169 1,835 (3) 6,675
Yx 2 1,169 1,835 (2) 4,840
Tanah yang luasnya 3 ha memiliki perkiraan
harga Rp. 1,835 juta lebih tinggi dari yang 2 ha
13
Menguji Koeffisien Regresi
H0 : 1 = 10 vs H1 : 1 ≠ 10
Statistik Uji
ˆ1 10
t hit
sˆ
1
dimana
yi2
1
sˆ
1
n 2
y
i
ˆ x y xi yi
n 1 i i
n
2
xi2 xi
n
2
1 JK (Y ) ˆ1 JHK ( XY )
n 2
JK ( X )
Kriteria Penolakan: Tolak hipotesis nol
jika thit < -t;n-2 atau thit > t;n-2
14
Menguji Koeffisien Regresi
Jika kita misalkan berikut ini adalah simpangan baku
galat, yang dinotasikan dengan
yi2
s
y
i
2
ˆ1 xi yi
n
n 2
x y
i
i
n
JK (Y ) ˆ1 JHK ( XY )
n 2
Maka simpangan baku bagi penduga slope 1 dapat
dituliskan sebagai berikut
1
sˆ s2
1
JK ( X )
n
xi
n
JK ( X ) xi2 i 1
n
i 1
2
15
Menguji Koeffisien Regresi
H0 : 0 = 10 vs H1 : 0 ≠ 00
Statistik Uji
ˆ0 00
t hit
sˆ
0
dimana
1
x2
sˆ s
0
n JK ( X )
2
Kriteria Penolakan: Tolak hipotesis nol
jika thit < -t;n-2 atau thit > t;n-2
16
Nilai Dugaan dan Simpangan
Bakunya
Apabila dilakukan sampling yang berulang
untuk nilai X = x tertentu dari salah satu nilai
x yang kita gunakan, maka nilai dugaan
modelnya adalah
yˆ x ˆo ˆ1 x
Dengan simpangan baku
2
1
(
x
x
)
2
s yˆ x s
n JK ( X )
17
Nilai Dugaan dan Simpangan
Bakunya
Apabila kasus baru didapat untuk nilai X = x
tilde yaitu x dari nilai yang ada diluar amatan
kita
yˆ x ˆo ˆ1 x%
Dengan simpangan baku
s yˆ ~x
2
~
1
(
x
x
)
2
s 1
n JK ( X )
18
Penduga Interval bagi
Koeffisien Regresi
Selang Kepercayaan 100(1-)% bagi 1 adalah
ˆ1 t
2
;n 2
sˆ 1 ˆ1 t
1
2
;n 2
sˆ
1
Selang Kepercayaan 100(1-)% bagi 0 adalah
ˆ0 t
2
;n 2
sˆ 0 ˆ0 t
0
2
;n 2
sˆ
0
19
Koeffisien Korelasi
• Mengukur keeratan hubungan dua peubah (tidak harus
memiliki hubungan sebab akibat). Dinotasikan dengan xy atau
singkatnya saja.
• Nilainya -1 xy +1
– Jika xy -1 kedua peubah berhubungan kuat tapi berlawanan
arah
– Jika xy +1 kedua peubah berhubungan kuat dan searah
– Jika xy 0 kedua peubah tidak memiliki hubungan
• Koeffisien korelasi contoh (bila tidak seluruh anggota populasi
diamati) dinotasikan dengan rxy atau r saja
• Tanda +/- dari koeffisien korelasi sama dengan tanda dari slope
20
Koeffisien Korelasi
rxy
n n
xi yi
n
xi yi i 1 i 1
n
i 1
2
2
n
n
xi n
yi
n
x 2 i 1 y 2 i 1
i
i
n
n
i 1
i 1
rxy
JHK ( XY )
JK ( X ) JK (Y )
47,66
0,983
(25,97)(90,46)
21
Penjelasan
arti koeffisien korelasi
47,66
rxy
0,983
(25,97)(90,46)
Dari data yang kita miliki terlihat bahwa terdapat
hubungan yang cukup kuat antara luas tanah dan
harganya. Karena tandanya +, maka semakin luas
tanah, semakin tinggi harganya
22
Menguji Koeffisien Korelasi
H0 : = 0 vs H1 : ≠ 0
Statistik uji
zhit
n 3 1 r 1 0
ln
2
1 r 1 0
Kriteria Penolakan Hipotesis Nol: Tolak Hipotesis
Nol jika zhit < z/2 atau zhit > z1-/2
23
Menguji Koeffisien Korelasi
H0 : = vs H1 : ≠
Statistik uji (n > 30)
z hit
r n 2
1 r2
Kriteria Penolakan Hipotesis Nol: Tolak Hipotesis
Nol jika zhit < z/2 atau zhit > z1-/2
24
Menguji Koeffisien Korelasi
H0 : = vs H1 : ≠
Statistik uji (n ≤ 30)
t hit
r n 2
1 r2
Kriteria Penolakan Hipotesis Nol: Tolak Hipotesis
Nol jika thit < -t/2;n-2 atau thit > t/2;n-2
25
Terimaksih
26
dan Korelasi
Pengertian
• Regresi merupakan teknik statistika yang digunakan
untuk mempelajari hubungan fungsional dari satu atau
beberapa peubah bebas (peubah yang mempengaruhi)
terhadap satu peubah tak bebas (peubah yang dipengaruhi)
• Korelasi merupakan ukuran kekuatan hubungan dua
peubah (tidak harus memiliki hubungan sebab akibat)
2
Regresi
• Dari derajat (pangkat) tiap peubah bebas
• Linier (bila pangkatnya 1)
• Non-linier (bila pangkatnya bukan 1)
• Dari banyaknya peubah bebas (yang
mempengaruhi)
• Sederhana (bila hanya ada satu peubah bebas)
• Berganda (bila lebih dari satu peubah bebas)
3
Regresi Linier Sederhana
• Model
– Yi = 0 + 1Xi + i
Yi merupakan nilai pengamatan ke-i.
0 adalah parameter regresi (intersep)
1 adalah parameter regresi (slope)
i kesalahan ke-i.
– Asumsi :
• peubah X terukur tanpa kesalahan; X tidak memiliki
distribusi (bukan random variable)
• kesalahan menyebar normal dengan rata-rata nol dengan
simpangan baku .
4
Teladan Permasalahan
• Dari sebuah survai yang
dilakukan di kampung Maju
Makmur digunakan untuk
mengetahui hubungan
fungsional antara luas tanah
(hektar) dan harganya (Rp. 00
Juta). Bila data berpasangan
tentang luasan dan harga tanah
diperoleh, bagaimana hubungan
fungsionalnya ?
Luas
0,75
0,55
1,00
1,25
2,50
3,00
4,50
3,75
5,00
3,25
3,25
2,75
2,75
2,00
4,00
Harga
2,45
2,20
2,80
3,60
5,80
7,40
9,00
8,50
10,00
8,00
7,50
6,00
6,25
4,00
8,00
5
Diagram Pencar
(Scatter Plot)
Harga (Rp. juta)
12,00
10,00
8,00
6,00
4,00
2,00
0,00
0,00
1,00
2,00
3,00
4,00
5,00
6,00
Luas (Ha.)
6
Mana pendekatan yang baik ?
Garis lurus yang sedemikian rupa sehingga melewati seluruh
titik (data ) pada diagram pencar yang mendekati
Harga (Rp. juta)
12,00
10,00
8,00
6,00
4,00
2,00
0,00
0,00
1,00
2,00
3,00
4,00
5,00
6,00
Luas (Ha.)
7
Metode Jumlah Kuadrat Galat Terkecil
(Least Squares Method)
merupakan salah satu kriteria yang memenuhi, agar apabila kuadrat dari kesalahan itu
dijumlahkan akan se minimum mungkin.
12,00
10,00
8,00
Harga
Regresi
6,00
4,00
2,00
0,00
0,00
2,00
4,00
6,00
8
Persamaan Regresi
Yˆi ˆ0 ˆ1 X i
dimana
ˆ1
n n
xi yi
n
xi yi i 1 i 1
n
i 1
n
xi
n
2
i 1
x
i
n
i 1
2
ˆ0 y ˆ1 x
9
Teladan Hitungan
Luas X Harga Y
0,75
2,45
0,55
2,20
1,00
2,80
1,25
3,60
2,50
5,80
3,00
7,40
4,50
9,00
3,75
8,50
5,00
10,00
3,25
8,00
3,25
7,50
2,75
6,00
2,75
6,25
2,00
4,00
4,00
8,00
40,30
2,69
91,50
6,10
XY
1,8375
1,2100
2,8000
4,5000
14,5000
22,2000
40,5000
31,8750
50,0000
26,0000
24,3750
16,5000
17,1875
8,0000
32,0000
X2
0,5625
0,3025
1,0000
1,5625
6,2500
9,0000
20,2500
14,0625
25,0000
10,5625
10,5625
7,5625
7,5625
4,0000
16,0000
293,4850
134,2400
slope
intersep
Y2
6,0025
4,8400
7,8400
12,9600
33,6400
54,7600
81,0000
72,2500
100,0000
64,0000
56,2500
36,0000
39,0625
16,0000
64,0000
648,6050
1,835
1,169
10
Persamaan Regresi
serta penjelasannya
Yˆi 1,169 1,835 X i
Slope bernilai 1,835. Artinya : dua luasan tanah yang
berbeda seluas satu hektar, tanah yang lebih luas akan
memiliki perkiraan harga Rp. 1,835 juta lebih tinggi.
JANGAN diartikan sbb: bila luas tanah meningkat satu
hektar, maka harga tanah akan meningkat Rp. 1,835
juta.
11
Persamaan Regresi
serta penjelasannya
Yˆi 1,169 1,835 X i
Slope bernilai 1,169. Untuk teladan ini nilai intersep
tidak memiliki arti.
JANGAN diartikan sbb: bila luas tanah (x) = 0
hektar, maka harga tanah adalah Rp. 1,169 juta.
Pengartian seperti ini TIDAK benar. Kenapa ???
12
Persamaan Regresi
serta penjelasannya
Yx 3 1,169 1,835 (3) 6,675
Yx 2 1,169 1,835 (2) 4,840
Tanah yang luasnya 3 ha memiliki perkiraan
harga Rp. 1,835 juta lebih tinggi dari yang 2 ha
13
Menguji Koeffisien Regresi
H0 : 1 = 10 vs H1 : 1 ≠ 10
Statistik Uji
ˆ1 10
t hit
sˆ
1
dimana
yi2
1
sˆ
1
n 2
y
i
ˆ x y xi yi
n 1 i i
n
2
xi2 xi
n
2
1 JK (Y ) ˆ1 JHK ( XY )
n 2
JK ( X )
Kriteria Penolakan: Tolak hipotesis nol
jika thit < -t;n-2 atau thit > t;n-2
14
Menguji Koeffisien Regresi
Jika kita misalkan berikut ini adalah simpangan baku
galat, yang dinotasikan dengan
yi2
s
y
i
2
ˆ1 xi yi
n
n 2
x y
i
i
n
JK (Y ) ˆ1 JHK ( XY )
n 2
Maka simpangan baku bagi penduga slope 1 dapat
dituliskan sebagai berikut
1
sˆ s2
1
JK ( X )
n
xi
n
JK ( X ) xi2 i 1
n
i 1
2
15
Menguji Koeffisien Regresi
H0 : 0 = 10 vs H1 : 0 ≠ 00
Statistik Uji
ˆ0 00
t hit
sˆ
0
dimana
1
x2
sˆ s
0
n JK ( X )
2
Kriteria Penolakan: Tolak hipotesis nol
jika thit < -t;n-2 atau thit > t;n-2
16
Nilai Dugaan dan Simpangan
Bakunya
Apabila dilakukan sampling yang berulang
untuk nilai X = x tertentu dari salah satu nilai
x yang kita gunakan, maka nilai dugaan
modelnya adalah
yˆ x ˆo ˆ1 x
Dengan simpangan baku
2
1
(
x
x
)
2
s yˆ x s
n JK ( X )
17
Nilai Dugaan dan Simpangan
Bakunya
Apabila kasus baru didapat untuk nilai X = x
tilde yaitu x dari nilai yang ada diluar amatan
kita
yˆ x ˆo ˆ1 x%
Dengan simpangan baku
s yˆ ~x
2
~
1
(
x
x
)
2
s 1
n JK ( X )
18
Penduga Interval bagi
Koeffisien Regresi
Selang Kepercayaan 100(1-)% bagi 1 adalah
ˆ1 t
2
;n 2
sˆ 1 ˆ1 t
1
2
;n 2
sˆ
1
Selang Kepercayaan 100(1-)% bagi 0 adalah
ˆ0 t
2
;n 2
sˆ 0 ˆ0 t
0
2
;n 2
sˆ
0
19
Koeffisien Korelasi
• Mengukur keeratan hubungan dua peubah (tidak harus
memiliki hubungan sebab akibat). Dinotasikan dengan xy atau
singkatnya saja.
• Nilainya -1 xy +1
– Jika xy -1 kedua peubah berhubungan kuat tapi berlawanan
arah
– Jika xy +1 kedua peubah berhubungan kuat dan searah
– Jika xy 0 kedua peubah tidak memiliki hubungan
• Koeffisien korelasi contoh (bila tidak seluruh anggota populasi
diamati) dinotasikan dengan rxy atau r saja
• Tanda +/- dari koeffisien korelasi sama dengan tanda dari slope
20
Koeffisien Korelasi
rxy
n n
xi yi
n
xi yi i 1 i 1
n
i 1
2
2
n
n
xi n
yi
n
x 2 i 1 y 2 i 1
i
i
n
n
i 1
i 1
rxy
JHK ( XY )
JK ( X ) JK (Y )
47,66
0,983
(25,97)(90,46)
21
Penjelasan
arti koeffisien korelasi
47,66
rxy
0,983
(25,97)(90,46)
Dari data yang kita miliki terlihat bahwa terdapat
hubungan yang cukup kuat antara luas tanah dan
harganya. Karena tandanya +, maka semakin luas
tanah, semakin tinggi harganya
22
Menguji Koeffisien Korelasi
H0 : = 0 vs H1 : ≠ 0
Statistik uji
zhit
n 3 1 r 1 0
ln
2
1 r 1 0
Kriteria Penolakan Hipotesis Nol: Tolak Hipotesis
Nol jika zhit < z/2 atau zhit > z1-/2
23
Menguji Koeffisien Korelasi
H0 : = vs H1 : ≠
Statistik uji (n > 30)
z hit
r n 2
1 r2
Kriteria Penolakan Hipotesis Nol: Tolak Hipotesis
Nol jika zhit < z/2 atau zhit > z1-/2
24
Menguji Koeffisien Korelasi
H0 : = vs H1 : ≠
Statistik uji (n ≤ 30)
t hit
r n 2
1 r2
Kriteria Penolakan Hipotesis Nol: Tolak Hipotesis
Nol jika thit < -t/2;n-2 atau thit > t/2;n-2
25
Terimaksih
26