Statistika | Suhardi.Universitas Mulawarman.Kalimantan Timur.Indonesia

Regresi Linier Sederhana
dan Korelasi

Pengertian
• Regresi merupakan teknik statistika yang digunakan
untuk mempelajari hubungan fungsional dari satu atau
beberapa peubah bebas (peubah yang mempengaruhi)
terhadap satu peubah tak bebas (peubah yang dipengaruhi)
• Korelasi merupakan ukuran kekuatan hubungan dua
peubah (tidak harus memiliki hubungan sebab akibat)

2

Regresi
• Dari derajat (pangkat) tiap peubah bebas
• Linier (bila pangkatnya 1)
• Non-linier (bila pangkatnya bukan 1)

• Dari banyaknya peubah bebas (yang
mempengaruhi)
• Sederhana (bila hanya ada satu peubah bebas)

• Berganda (bila lebih dari satu peubah bebas)

3

Regresi Linier Sederhana
• Model
– Yi = 0 + 1Xi + i
Yi merupakan nilai pengamatan ke-i.
0 adalah parameter regresi (intersep)
1 adalah parameter regresi (slope)
i kesalahan ke-i.

– Asumsi :
• peubah X terukur tanpa kesalahan; X tidak memiliki
distribusi (bukan random variable)
• kesalahan menyebar normal dengan rata-rata nol dengan
simpangan baku .
4

Teladan Permasalahan

• Dari sebuah survai yang
dilakukan di kampung Maju
Makmur digunakan untuk
mengetahui hubungan
fungsional antara luas tanah
(hektar) dan harganya (Rp. 00
Juta). Bila data berpasangan
tentang luasan dan harga tanah
diperoleh, bagaimana hubungan
fungsionalnya ?

Luas
0,75
0,55
1,00
1,25
2,50
3,00
4,50
3,75

5,00
3,25
3,25
2,75
2,75
2,00
4,00

Harga
2,45
2,20
2,80
3,60
5,80
7,40
9,00
8,50
10,00
8,00
7,50

6,00
6,25
4,00
8,00

5

Diagram Pencar
(Scatter Plot)

Harga (Rp. juta)

12,00
10,00
8,00
6,00
4,00
2,00
0,00
0,00


1,00

2,00

3,00

4,00

5,00

6,00

Luas (Ha.)
6

Mana pendekatan yang baik ?
Garis lurus yang sedemikian rupa sehingga melewati seluruh
titik (data ) pada diagram pencar  yang mendekati


Harga (Rp. juta)

12,00
10,00
8,00
6,00
4,00
2,00
0,00
0,00

1,00

2,00

3,00

4,00

5,00


6,00

Luas (Ha.)
7

Metode Jumlah Kuadrat Galat Terkecil
(Least Squares Method)
merupakan salah satu kriteria yang memenuhi, agar apabila kuadrat dari kesalahan itu
dijumlahkan akan se minimum mungkin.

12,00
10,00
8,00
Harga
Regresi

6,00
4,00
2,00

0,00
0,00

2,00

4,00

6,00
8

Persamaan Regresi

Yˆi ˆ0  ˆ1 X i
dimana
ˆ1 

 n  n 
  xi   yi 
n
xi yi   i 1  i 1 


n
i 1
n



  xi 
n
2
 i 1 
x


i
n
i 1

2


ˆ0  y  ˆ1 x
9

Teladan Hitungan
Luas X Harga Y
0,75
2,45
0,55
2,20
1,00
2,80
1,25
3,60
2,50
5,80
3,00
7,40
4,50
9,00
3,75

8,50
5,00
10,00
3,25
8,00
3,25
7,50
2,75
6,00
2,75
6,25
2,00
4,00
4,00
8,00
40,30
2,69

91,50
6,10

XY
1,8375
1,2100
2,8000
4,5000
14,5000
22,2000
40,5000
31,8750
50,0000
26,0000
24,3750
16,5000
17,1875
8,0000
32,0000

X2
0,5625
0,3025
1,0000
1,5625
6,2500
9,0000
20,2500
14,0625
25,0000
10,5625
10,5625
7,5625
7,5625
4,0000
16,0000

293,4850

134,2400
slope
intersep

Y2
6,0025
4,8400
7,8400
12,9600
33,6400
54,7600
81,0000
72,2500
100,0000
64,0000
56,2500
36,0000
39,0625
16,0000
64,0000
648,6050
1,835
1,169

10

Persamaan Regresi
serta penjelasannya

Yˆi 1,169  1,835 X i
Slope bernilai 1,835. Artinya : dua luasan tanah yang
berbeda seluas satu hektar, tanah yang lebih luas akan
memiliki perkiraan harga Rp. 1,835 juta lebih tinggi.
JANGAN diartikan sbb: bila luas tanah meningkat satu
hektar, maka harga tanah akan meningkat Rp. 1,835
juta.
11

Persamaan Regresi
serta penjelasannya

Yˆi 1,169  1,835 X i
Slope bernilai 1,169. Untuk teladan ini nilai intersep
tidak memiliki arti.
JANGAN diartikan sbb: bila luas tanah (x) = 0
hektar, maka harga tanah adalah Rp. 1,169 juta.
Pengartian seperti ini TIDAK benar. Kenapa ???

12

Persamaan Regresi
serta penjelasannya

Yx 3 1,169  1,835 (3) 6,675
Yx 2 1,169  1,835 (2) 4,840
Tanah yang luasnya 3 ha memiliki perkiraan
harga Rp. 1,835 juta lebih tinggi dari yang 2 ha
13

Menguji Koeffisien Regresi
H0 : 1 = 10 vs H1 : 1 ≠ 10
Statistik Uji

ˆ1  10
t hit 
sˆ
1

dimana

   yi2 
1  
sˆ 
1
n  2 



 y 
i


  ˆ  x y    xi   yi 
n  1   i i
n

2


  xi2    xi 

n 




2


 

1  JK (Y )  ˆ1 JHK ( XY ) 
  n  2 

JK ( X )






Kriteria Penolakan: Tolak hipotesis nol
jika thit < -t;n-2 atau thit > t;n-2
14

Menguji Koeffisien Regresi
Jika kita misalkan berikut ini adalah simpangan baku
galat, yang dinotasikan dengan

   yi2 

s   




 y 
i

2


  ˆ1   xi yi 

n 


n 2

 x  y 
i

i



n  
JK (Y )  ˆ1 JHK ( XY )


n 2




Maka simpangan baku bagi penduga slope 1 dapat
dituliskan sebagai berikut
 1 

sˆ  s2 
1
 JK ( X ) 

 n 
  xi 
n
JK ( X )  xi2   i 1 
n
i 1

2

15

Menguji Koeffisien Regresi
H0 : 0 = 10 vs H1 : 0 ≠ 00
Statistik Uji

ˆ0   00
t hit 
sˆ
0

dimana

1
x2 

sˆ  s  
0
 n JK ( X ) 
2


Kriteria Penolakan: Tolak hipotesis nol
jika thit < -t;n-2 atau thit > t;n-2
16

Nilai Dugaan dan Simpangan
Bakunya
Apabila dilakukan sampling yang berulang
untuk nilai X = x tertentu dari salah satu nilai
x yang kita gunakan, maka nilai dugaan
modelnya adalah

yˆ x  ˆo  ˆ1 x
Dengan simpangan baku
2


1
(
x

x
)
2

s yˆ x  s  
 n JK ( X ) 
17

Nilai Dugaan dan Simpangan
Bakunya
Apabila kasus baru didapat untuk nilai X = x
tilde yaitu x dari nilai yang ada diluar amatan
kita

yˆ x  ˆo  ˆ1 x%

Dengan simpangan baku
s yˆ ~x

2
~


1
(
x

x
)
2


 s 1  
 n JK ( X ) 

18

Penduga Interval bagi
Koeffisien Regresi
Selang Kepercayaan 100(1-)% bagi 1 adalah

ˆ1  t 
2

;n  2

sˆ  1  ˆ1  t 
1

2

;n  2

sˆ

1

Selang Kepercayaan 100(1-)% bagi 0 adalah

ˆ0  t 
2

;n  2

sˆ   0  ˆ0  t 
0

2

;n  2

sˆ

0

19

Koeffisien Korelasi
• Mengukur keeratan hubungan dua peubah (tidak harus
memiliki hubungan sebab akibat). Dinotasikan dengan xy atau
singkatnya  saja.
• Nilainya -1  xy  +1
– Jika xy  -1 kedua peubah berhubungan kuat tapi berlawanan
arah
– Jika xy  +1 kedua peubah berhubungan kuat dan searah
– Jika xy  0 kedua peubah tidak memiliki hubungan

• Koeffisien korelasi contoh (bila tidak seluruh anggota populasi
diamati) dinotasikan dengan rxy atau r saja
• Tanda +/- dari koeffisien korelasi sama dengan tanda dari slope
20

Koeffisien Korelasi
rxy 

 n  n 
  xi   yi 
n
xi yi   i 1  i 1 

n
i 1
2
2

 n  
 n  
  xi    n
  yi  
 n
 x 2   i 1    y 2   i 1  
i
i

 

n
n
i 1
i 1







rxy 



JHK ( XY )
JK ( X ) JK (Y )

47,66
0,983
(25,97)(90,46)

21

Penjelasan
arti koeffisien korelasi

47,66
rxy 
0,983
(25,97)(90,46)
Dari data yang kita miliki terlihat bahwa terdapat
hubungan yang cukup kuat antara luas tanah dan
harganya. Karena tandanya +, maka semakin luas
tanah, semakin tinggi harganya

22

Menguji Koeffisien Korelasi
H0 :  = 0 vs H1 :  ≠ 0
Statistik uji
zhit

n  3  1  r  1   0  
 

ln 

2
 1  r  1   0  

Kriteria Penolakan Hipotesis Nol: Tolak Hipotesis
Nol jika zhit < z/2 atau zhit > z1-/2
23

Menguji Koeffisien Korelasi
H0 :  =  vs H1 :  ≠ 
Statistik uji (n > 30)

z hit 

r n 2
1 r2

Kriteria Penolakan Hipotesis Nol: Tolak Hipotesis
Nol jika zhit < z/2 atau zhit > z1-/2
24

Menguji Koeffisien Korelasi
H0 :  =  vs H1 :  ≠ 
Statistik uji (n ≤ 30)

t hit 

r n 2
1 r2

Kriteria Penolakan Hipotesis Nol: Tolak Hipotesis
Nol jika thit < -t/2;n-2 atau thit > t/2;n-2
25

Terimaksih

26