Handout Statistika Lanjut 2011

!" # $!!

%
'

&
&
)&%

$ $ !!

&
& (&
&(&% * (*
%
$!

Universitas Negeri Yogyakarta
Fakultas Matematika dan Ilmu Pengetahuan Alam
Jurusan Pendidikan Matematika
Topik 1


: Analisis Korelasi

Analisis korelasi adalah analisis statistika yang membahas tentang derajat (kekuatan) hubungan antara
peubah-peubah.

Koefisien korelasi linear mengukur kekuatan hubungan linear antara peubah X dan Y. Koefisien
korelasi linear seringkali disebut juga dengan koefisien korelasi Pearson (ditemukan oleh Karl
Pearson pada tahun 1857-1936).
Rumus koefisien korelasi linear populasi
=







Rumus koefisien korelasi linear sampel
=


(a) Korelasi positif
antara X dan Y







(b) Korelasi positif yang kuat (c) Korelasi positif sempurna
antara X dan Y
antara X dan Y

1

(d) Korelasi negatif
antara X dan Y

(e) Korelasi negatif yang kuat

antara X dan Y

(g) Tidak ada korelasi
antara X dan Y

(f) Korelasi negatif sempurna
antara X dan Y

(h) Hubungan nonlinear antara X dan Y

Koefisien Determinasi bagi sampel (r2)

Nilai r2 menyatakan persentase keragaman Y yang dapat dijelaskan oleh hubungan linear
antara X dan Y.
Contoh 1:
Data berikut adalah tentang banyaknya keketidakhadiran dan nilai akhir dari tujuh mahasiswa
yang dipilih secara acak dari suatu kelas Statistika.
Mahasiswa
A B C D E F G
Banyaknya ketidakhadiran (X) 6 2 15 9 12 5 8

Nilai Akhir (Y)
82 86 43 74 58 90 78
a) Buatlah diagram pencar dari data tersebut.
b) Tentukan koefisien korelasi dan maknanya.
c) Tentukan koefisien determinasi dan maknanya.

2

Penyelesaian:
a) Diagram pencar bagi X dan Y, terlihat bahwa titik-titik data mengikuti arah garis lurus.

b) Koefisien korelasi r = -0,944 artinya ada korelasi negatif yang kuat antara banyaknya
ketidakhadiran dan nilai akhir, semakin banyak ketidakhadiran maka semakin menurun
nilai akhirnya
c) Koefisien determinasi r2 = 0,891, artinya sebesar 89,1% keragaman nilai akhir yang dapat
dijelaskan oleh hubungan linear antara banyaknya ketidakhadiran dan nilai akhir.
Pengujian Korelasi Populasi
Nilai koefisien korelasi antara -1 dan +1. Bila nilai r dekat +1 atau -1 maka ada hubungan linear
yang kuat. Bila nilai r dekat 0 maka hubungan linear itu lemah. Bila r samadengan 0 maka tidak
ada hubungan linear antara dua peubah tersebut.

Pengujian Hipotesis untuk signifikansi hubungan linear antara dua peubah.
1. Hipotesis
H0 : = 0 (Tidak ada korelasi antara X dan Y)
H1 : ≠ 0 (Ada korelasi signifikan antara X dan Y)
2. Taraf nyata: α
3. Statistik Uji:
=

4. Kriteria Keputusan
>
H0 ditolak jika

( ! )

3

Hipotesis Nol
H0 : = 0
H0 :
H0 :

H0 :
H0 :

=0
≥0
=0
≤0

Hipotesis Alternatif
H1 : ≠ 0
H1 :
H1 :

Statistik Uji

−2
= #
1−

0


Kriteria Keputusan
H0 ditolak jika
>

( ! )

H0 ditolak jika t < - tα(n-2)
H0 ditolak jika t > tα(n-2)

Latihan
Pada soal-soal berikut,
a. Tentukan mana yang sebagai peubah bebas dan peubah tak bebas
b. Buatlah diagram pencar
c. Tentukan koefisien korelasi dan maknanya
d. Tentukan koefisien determinasi dan maknanya
e. Apakah ada hubungan linear antara kedua peubah tersebut? Gunakan α = 0.05.
f. Apakah ada hubungan linear positif antara kedua peubah tersebut? Gunakan α = 0.05.
1. Seorang pendidik ingin mengetahui hubungan antara nilai skor tes dan nilai IPK dari
mahasiswa. Berikut data sampel.

Nilai skor tes 98 105 100 100 106 95 116 112
IPK
2,1 2,4 3,2 2,7 2,2 2,3 3,8 3,4
2. Seorang peneliti ingin mengetahui apakah ada hubungan antara umur dengan lamanya
seseorang melakukan olahraga per minggu. Berikut data sampelnya.
Umur
18 26 32 38 52 59
Lamanya olahraga (jam) 10 5 2 3 1,5 1
3. Seorang manajer perusahaan ingin mengetahui hubungan antara banyaknya iklan di
radio per minggu dan banyaknya penjualan (dalam jutaan rupiah) untuk suatu barang.
Berikut data sampelnya.
Banyaknya iklan di radio 2 5 8 8 10 12
Banyaknya penjualan
2 4 7 6 9 10
4. Empatbelas mahasiswa telah dipilih secara acak dan diperiksa tekanan darahnya.
Berikut data tekanan darah sistolik dan diastolik (dalam mmHg).
Sistolik
138 130 135 140 120 125 120 130 130 144 143 140 130 150
Diastolik 82 91 100 100 80 90 80 80 80 98 105 85 70 100


4

Universitas Negeri Yogyakarta
Fakultas Matematika dan Ilmu Pengetahuan Alam
Jurusan Pendidikan Matematika
Topik 2

: Analisis Regresi Linear Sederhana

Analisis regresi adalah analisis statistika yang memanfaatkan hubungan antara dua atau lebih
peubah kuantitatif sehingga salah satu peubah dapat diramalkan dari peubah lainnya.
Model Regresi Linear Sederhana
dengan
Yi adalah nilai peubah tak bebas dalam pengamatan ke-i
β0 dan β1 adalah parameter
Xi adalah konstanta yang diketahui, yaitu nilai peubah bebas dari pengamatan ke-i
εi adalah galat yang bersifat acak dengan rataan E[εi]=0 dan ragam Var [εi]=σ2; εi dan εj tidak
berkorelasi sehingga peragam/kovariansi σ {εi, εj} =0 untuk semua i,j ; i ≠ j
Model regresi linear sederhana:
Dikatakan “sederhana” karena hanya ada satu peubah bebas.

Dikatakan “linear dalam parameter” karena tidak ada parameter yang muncul sebagai suatu
eksponen atau dikalikan atau dibagi oleh parameter lain.
Dikatakan “linear dalam peubah bebas” karena peubah dalam model tersebut berpangkat
satu.
Model yang linear dalam parameter dan linear dalam peubah bebas juga dinamakan model
ordo-pertama.
Bila sudah diperoleh data sampel (Xi,Yi), selanjutnya hal yang penting adalah membuat diagram
pencar antara X dan Y untuk mengetahui pola dari data. Bila pola data menunjukkan linear maka
model regresi linear sederhana dapat digunakan. Perhatikan gambar berikut.

(a)

(b)

5

(c)

(d)


ei (sisaan ke-i) adalah beda antaraa nilai
nil amatan Yi dengan nilai dugaannya
Bagaimana mendapatkan b0 dan b1?
Penduga bagi β0 dan β1 dapat
pat diperoleh dengan metode kuadrat terkecil,
il, yyaitu dengan
meminimumkan jumlah kuadrat galat.
gala Misalkan model regresi linear sederhana
iid

(

)

dengan ε i ~ N 0, σ 2 maka
n

n

ε i2 =
i =1

(Yi − E (Yi ))2 =

i =1

n

.

(Yi − (β 0 + β1 X i ))2 = L

i =1

Selanjutnya diturunkan terhadap ma
masing-masing parameter.
n
∂L
= −2 (Yi − (β 0 + β1 X i )) = 0
∂β 0
i =1
n
∂L
= −2 (Yi − (β 0 + β1 X i ))X i = 0
∂β1
i =1

Penduga bagi β0 adalah b0 dan penduga
pen
bagi β1 adalah b1 yang diperoleh dengan
nm
menyelesaikan
kedua persamaan tersebut. Sehingga
ngga diperoleh

X iYi −
b1 =
X

2
i

(


Xi
n
2
Xi )
n

Yi
,

b0 =

1
(
n

X i ) = Y − b1 X .

Yi − b1

6

Makna dugaan koefisien regresi
Misalkan ingin mengetahui hubungan jarak tempuh kendaraan mobil dalam km (X) dengan tingkat
emisinya dalam ppm (Y).
Plot data ternyata menunjukkan ada hubungan linear antara X dan Y
Dicobakan model linear Yi = β0 + β1Xi + εi, diperoleh persamaan regresi Yˆi = 364 + 5,47 X i .
Apa makna b0 dan b1 pada konteks ini ?
Makna dari b1 yaitu rata-rata emisi meningkat 5,47 ppm untuk setiap kenaikan jarak tempuh
kendaraan mobil 1 km (atau kenaikan jarak tempuh kendaraan mobil 1 km akan meningkatkan ratarata emisi yang dihasilkan mobil sebesar 5,47 ppm).
Makna dari b0 yaitu untuk mobil dengan jarak tempuh kendaraan mobil 0 km (mobil baru) maka
rata-rata tingkat emisi yang dihasilkan sebesar 364 ppm.
b0 tidak selalu bermakna

SOAL LATIHAN
1. Berikut data sampel tentang nilai mutu rata-rata (NMR) mahasiswa pada akhir tahun
pertama (Y) dan nilai ujian masuk (X).
i
Xi
Yi

1
5,5
3,1

2
4,8
2,3

3
4,7
3,0

4
3,9
1,9

5
4,5
2,5

6
6,2
3,7

7
6,0
3,4

8
5,2
2,6

9
4,7
2,8

10
4,3
1,6

11
4,9
2,0

12
5,4
2,9

13
5,0
2,3

14
6,3
3,2

15
4,6
1,8

16
4,3
1,4

17
5,0
2,0

18
5,9
3,8

19
4,1
2,2

20
4,7
1,5

a) Buatlah diagram pencar X dan Y.
b) Tentukan persamaan regresi dugaannya beserta maknanya.
2. Data berikut merupakan hasil penelitian tentang hubungan antara nilai ulangan Matematika
(dalam skala nilai 10 sampai 100) dengan lama waktu belajar matematika (dalam jam selama
seminggu)
Nilai ulangan matematika
95 100 100 80 70 55 50 75 55 60 65 95
Lama
waktu
belajar 18 18 19 17 14 5 6 10 13 4 12 10
matematika
a) Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas Y.
b) Tentukan persamaan regresi dugaan dan berikan makna dugaan koefisien regresinya.
3. Suatu penelitian telah dilakukan untuk mengetahui hubungan antara pengeluaran untuk
iklan (X dalam jutaan rupiah) dengan penerimaan melalui penjualan (Y dalam jutaan rupiah)
pada perusahaan tertentu. Berikut ringkasan datanya :

n = 10,

X i = 120,

Yi = 500,

X iYi = 6106,

X i2 = 1470,

Yi 2 = 25440

a) Tentukan persamaan regresi dugaan! Berikan maknanya.
b) Bila pengeluaran untuk iklan sebesar 16 juta rupiah, berapakah penerimaan dari hasil
penjualan?

7

4. Tabel ini menunjukkan skor tes penalaran verbal (X) dan skor tes Inggris (Y), untuk setiap
sampel acak dari 8 anak yang mengikuti kedua tes tersebut:
Anak A
B
C
D
E
F
G
H
X
112 113 110 113 112 114 109 113
Y
69 65 75 70 70 75 68 76
a) Plot data dengan diagram pencar. Berikan penjelasan dari plot tersebut.
b) Tentukan persamaan regresi linear dugaan dan berikan maknanya

8

Universitas Negeri Yogyakarta
Fakultas Matematika dan Ilmu Pengetahuan Alam
Jurusan Pendidikan Matematika
Topik 3

: Asumsi-asumsi dalam Analisis Regresi Linear Sederhana

Model regresi linear sederhana bergalat normal
� = �0 + �1 � + ��
dengan
0 dan 1 adalah parameter
Xi adalah konstanta yang diketahui nilainya
i adalah galat yang menyebar N(0,2) dan bebas satu sama lain
Asumsi-asumsi dalam analisis regresi linear sederhana adalah
a. Galat memiliki ragam yang konstan
b. Galat menyebar normal
c. Galat bersifat saling bebas
Penyelidikan terpenuhi atau tidak asumsi-asumsi tersebut dengan menggunakan analisis sisaan.
Sisaan atau nilai dugaan galat didefinisikan sebagai
�� = � − �

Galat memiliki ragam yang konstan
Pendeteksian apakah galat memiliki ragam yang konstan atau tidak dengan menggunakan:
a. Plot sisaan (ei) dengan nilai dugaan ( � )
b. Plot sisaan (ei) dengan peubah bebas (Xi)
Kriterianya : Bila sisaan-sisaan tidak membentuk suatu pola tertentu maka galat memiliki ragam
yang konstan.
Perhatikan gambar berikut.

(a) Galat memiliki ragam konstan (tidak berpola)

(b) Galat tidak memiliki ragam konstan (berpola)

Galat menyebar normal
Pendeteksian apakah galat menyebar normal atau tidak dengan menggunakan plot peluang
normal. Plot peluang normal bagi sisaan yaitu plot ei versus hi.
Cara membuat plot peluang normal bagi sisaan:
1. Menghitung nilai sisaan, lalu diurutkan dari kecil ke besar, selanjutnya disebut sisaan terurut
2. Menghitung hi (nilai harapan di bawah asumsi kenormalan) dengan rumus
9

ℎ� = ��� �

��� = ��

�−0,375
�+0,25

� − 2 , �� =

2


− �0



− �1

� �

Kriterianya: bila titik-titik (sisaan-sisaan) mengikuti arah garis diagonal maka galat menyebar
normal.
Perhatikan contoh berikut:
Dari data sampel ini diperoleh Ŷ = 10 + 2X dengan KTG = 7,5. Selanjutnya akan dibuat plot peluang
normal bagi sisaan sebagai berikut.
Urutan
naik i

� − 0,375
� + 0,25

Xi

Yi

Ŷi

ei

1

30

73

70

3

1

2

20

50

50

0

2

-2

-2,74

3

60

128

130

-2

3

-2

-1,79

4

80

170

170

0

4

-2

-1,02

5

40

87

90

-3

5

-1

-0,33

6

50

108

110

-2

6

0

0,33

7

60

135

130

5

7

0

1,02

8

30

69

70

-1

8

2

1,79

9

70

148

150

-2

9

3

2,74

10

60

132

130

2

10

5

4,24

i

ei terurut �
-3

hi
-4,24

Gambar disamping menunjukkan
bahwa galat menyebar normal karena
titik-titik mengikuti arah garis
diagonal.

Galat saling bebas
a. Bila data tidak diamati secara bersamaan, melainkan dalam suatu urutan waktu maka
buatlah plot sisaan (ei) terhadap waktu. Tujuan adalah untuk melihat apakah ada korelasi
antara suku galat dengan suku galat berikutnya.
b. Bila data diamati bersamaan, untuk melihat keacakan galat percobaan dibuat plot antara
nilai dugaan galat (ei dengan nilai dugaan respons ( Ŷi )

10

Kriterianya : apabila titik-titik sisaan berfluktuasi secara acak di sekitar nol maka dapat dikatakan
bahwa galat saling bebas.
Perhatikan gambar berikut.

(a)
(b)
Gambar (a) Plot waktu versus sisaan menunjukkan bahwa titik-titik sisaan tidak berfluktuasi
secara acak disekitar nol maka galat tidak saling bebas.
Gambar (b) Plot nilai dugaan versus sisaan menunjukkan bahwa titik-titik sisaan berfluktuasi
secara acak disekitar nol maka galat saling bebas.

11

Universitas Negeri Yogyakarta
Fakultas Matematika dan Ilmu Pengetahuan Alam
Jurusan Pendidikan Matematika
Topik 4

: Inferensi dalam Analisis Regresi Linear Sederhana

Inferensi terhadap 1
a. Selang Kepercayaan bagi 1
b  1
Diketahui bahwa 1
~ tn 2  , sehingga
sb1



b 
P  t  ;n 2   1 1  t  ;n2    1  
2
2
sb1


→ � �1 −

dengan

2

2

(� −2)

�1 =

�1 ≤
��

2
� −

1





≤ �1 +

2

(� −2)

�1

=1−

2

Jadi selang kepercayaan 100(1-) bagi 1 adalah
�1 − (� −2) �1 ≤ 1 ≤ �1 + (� −2) �1
2

2

Misalkan diperoleh selang kepercayaan 95% bagi 1
1,89  1  2,11
Artinya diduga bahwa rata-rata Y naik sekitar antara 1,89 sampai 2,11 satuan untuk
setiap kenaikan satu satuan X.

b. Uji bagi  1
Uji bagi 1=0 lawan 10
Hipotesis
H0 : 1=0 (Tidak ada hubungan linear antara X dan Y)
H1 : 1 0 (Ada hubungan linear antara X dan Y)
Taraf nyata : 
Statistik Uji:
Sumber
db
JK
KT
Fhit
Keragaman
Regresi
1
JKR KTR F = KTR/KTG
Galat
n – 2 JKG KTG
Total
n – 1 JKT
Kriteria keputusan:
H0 ditolak jika Fhit > F(1, n – 2)
12

Perhatikan simpangan total berikut:
Y  Y  Yˆ  Y  Y  Yˆ
i

i

i

i

Jumlah kuadrat simpangan-simpangan tersebut :

 Y  Y    Yˆ  Y    Y  Yˆ 
2

2

i

2

i

i

JKT  JKR
JKT   Yi 2  nY 2



i

JKG

JKG   Yi 2  b0  Yi  b1  X iYi

 X i  Yi 
X iYi 
2



n
 Yi    

  Yi 2 
2
n 
 X


 X i2  n i
JKR  JKT  JKG
� = �12



Hipotesis
Nol
H0 : 1 = c



2

Hipotesis
Alternatif
H1 : 1  c

H0 : 1  c
H0 : 1 = c
H0 : 1  c
H0 : 1 = c

2

Statistik Uji
=

H1 : 1 > c
H1 : 1 < c

�1 −
�1

Kriteria keputusan
H0 ditolak jika |thit| >
H0 ditolak jika thit >
H0 ditolak jika thit < −

Inferensi terhadap 0
a. Selang Kepercayaan bagi 0
b  0
~ t n2  , sehingga
Diketahui bahwa 0
sb0 



b  0
P  t  ;n2   0
 t  ;n2    1  
2
sb0 

 2
→ � �0 −
dengan

2

2

(� −2)

�0 ≤

�0 = ��

0

≤ �0 +

(� −2)

2

1

+


2

2
� −





�0

2

Jadi selang kepercayaan 100(1-) bagi 0 adalah
�0 − (� −2) �0 ≤ 0 ≤ �0 + (� −2) �0
2

2

13

= 1−

2

� −2

� −2

� −2

Misalkan diperoleh selang kepercayaan 90% bagi 0
5,34  0  14,66
Artinya diduga bahwa rata-rata Y sekitar antara 5,34 sampai 14,66 satuan untuk X
sebesar 0.
Selang kepercayaan bagi 0 ini tidak selalu memberikan informasi yang bermanfaat.
b. Uji bagi  0
Uji bagi 0=0 lawan 00
Hipotesis
H0 : 0=0
H1 : 0 0
Taraf nyata : 
Statistik Uji:

=

�0

�0

Kriteria keputusan:
H0 ditolak jika |thit| >

2

� −2

Selang kepercayaan bagi � ��
ℎ − (� −2)
ℎ ≤� ℎ ≤
2

dengan
2





= ��

= �0 + �1



1
+





� −



+

2



(� −2)

2
2

Misalkan diperoleh selang kepercayaan 90% bagi � ℎ dengan Xh = 65
277,4 ≤ � ℎ ≤ 311,4
Maknanya dengan tingkat kepercayaan 90% maka rata-rata Y untuk X sebesar 65 adalah
277,4 sampai 311,4 satuan.
Selang prediksi bagi Yh(baru)
ℎ − (� −2)
2

dengan
2





= �� 1 +

= �0 + �1





1
+







� −

ℎ(�

)

2
2

14





+

2

(�−2)



Misalkan diperoleh selang prediksi 90% bagi
332,2 ≤

ℎ(�

ℎ(�

)
)

dengan Xh = 100 adalah
≤ 506,6

Maknanya dengan tingkat kepercayaan 90% dapat diprediksikan bahwa rata-rata Y untuk
proses berikutnya pada X sebesar 100 adalah 332,2 sampai 506,6 satuan.

SOAL LATIHAN
1. Data berikut merupakan hasil penelitian tentang hubungan antara nilai ulangan Matematika
(dalam skala nilai 10 sampai 100) dengan lama waktu belajar matematika (dalam jam selama
seminggu).
Nilai ulangan matematika
95 100 100 80 70 55 50 75 55 60 65 95
Lama waktu belajar matematika 18 18 19 17 14 5 6 10 13 4 12 10
a) Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas Y!
Anggap asumsi-asumsi dalam model regresi linear sederhana terpenuhi.
b) Tentukan selang kepercayaan 99% bagi 0 dan 1 beserta maknanya!
c) Ujilah apakah ada hubungan linear antara lama waktu belajar matematika dan nilai ulangan
matematika? Gunakan taraf nyata  = 0,01.
d) Ujilah apakah 1 = 5 lawan 1  5 ? Gunakan taraf nyata  = 0,01.
e) Ujilah apakah 0 = 0 atau tidak? Gunakan taraf nyata  = 0,01.
f) Tentukan selang prediksi 95% bagi Yh(baru) dengan Xh = 15
2. Suatu tes diberikan pada semua mahasiswa baru. Seseorang yang memperoleh nilai di bawah 35
tidak diizinkan mengikuti kuliah matematika yang biasa, tetapi harus mengikuti suatu kelas
khusus (remedial class). Berikut ringkasan data dari nilai tes dan nilai akhir bagi 20 mahasiswa
yang mengikuti kuliah matematika yang biasa:


= 1110;



= 1173;

= 67690;

� �

2


= 67100;

2


= 74725

a. Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas Y!
b. Tentukan persamaan regresi dugaan!
c. Bila 60 adalah nilai terendah agar lulus dari pelajaran matematika tersebut, berapakah batas
nilai tes terendah di masa mendatang untuk dapat diizinkan mengikuti kuliah tersebut?
Anggap asumsi-asumsi dalam model regresi linear sederhana terpenuhi.
d. Ujilah apakah ada hubungan linier antara nilai tes dan nilai akhir? Gunakan taraf nyata 0,05.
e. Tentukan selang kepercayaan 95% bagi 0 dan 1 beserta maknanya.
f.

Tentukan selang kepercayaan 95% bagi �



15

dengan Xh = 75 beserta maknanya.

3. Suatu percobaan dilakukan pada jenis mobil baru merk tertentu, untuk menentukan jarak yang
dibutuhkan untuk berhenti bila mobil tersebut direm pada berbagai kecepatan. Data yang
diperoleh sebagai berikut:
Kecepatan (kilometer per jam) 35 50 65 80 95 110
Jarak sampai berhenti (meter) 16 26 41 62 88 119
a. Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas Y!
b. Tentukan persamaan regresi dugaan dan berikan makna dugaan koefisien regresinya!
Anggap asumsi-asumsi dalam model regresi linear sederhana terpenuhi.
c. Tentukan selang kepercayaan 95% bagi 1 dan berikan maknanya!
d. Tentukan selang kepercayaan 95% bagi 0 dan berikan maknanya!
e. Ujilah apakah ada hubungan linear antara kecepatan dan jarak sampai berhenti? Gunakan
taraf nyata  = 0,05.
f. Ujilah apakah 1 positif? Gunakan taraf nyata  = 0,05.

Analisis Variansi
Uji F untuk Ketidakcocokkan Model Regresi Linear Sederhana
• Uji ini mengasumsikan bahwa pengamatan-pengamatan Y untuk suatu X tertentu bersifat bebas,
tersebar normal, memiliki ragam yang sama.
• Uji ini menghendaki adanya pengamatan berulang pada satu atau lebih nilai X.
Hipotesis
H0 : E{Y} = 0+ 1X
H1 : E{Y}  0+ 1X
Atau
H0 : Tidak ada ketidakcocokan model regresi linear sederhana dengan data
H1 : Ada ketidakcocokan model regresi linear sederhana dengan data
Atau
H0 : Model regresi linear sederhana cocok
H1 : Model regresi linear sederhana tidak cocok
Taraf nyata: 
Statistik Uji :

F

J KKM k  2
JKGM n  k 

Kriteria keputusan :
H0 ditolak jika Fhit > Fα(k-2,n-k)
k= menyatakan banyaknya x yang berbeda
n = banyaknya pengamatan

16

Perhatikan berikut ini:

 Y

ij

 Yˆij

   Y
2

ij

JKG 



2
 Y j    Y j  Yˆij

JKGM





2

JKKM

Contoh:
Lakukan uji kecocokan model regresi linear sederhana dengan taraf nyata 0,05 pada data sampel berikut.
i
1
2
3
4
5
6
7
8
9
10
11

Xi
125
100
200
75
150
175
75
175
125
200
100

Yi
160
112
124
28
152
156
42
124
150
104
136

Xi
75
100
125
150
175
200

Yi
28
42
112
136
160
150
152
156
124
124
104

35
124
155
152
140
114

Hipotesis
H0 : E{Y} = 0+ 1X
H1 : E{Y}  0+ 1X
Taraf nyata :  = 0,05
Statistik Uji : F = KTKM/KTGM
Kriteria keputusan:
n=11, k=6, db(KM)=k-2=6-2=4 ,db(GM)=n-k=11-6=5
F0,05(4,5)=5,19
H0 ditolak jika Fhit > 5,19
Hitungan:
JKG=170696-(50,722511288)-(0,48670 186200)=14742
JKGM=(28-35)2+(42-35)2+(112-124)2+(136-124)2+(160-155)2+(150-155)2+(152-152)2+(156-140)2+(124140)2+(124-114)2+(104-114)2=1148
JKKM=JKG-JKGM=14742-1148=13594
F=(13594/4)/(1148/5)=14,80
Kesimpulan : Karena Fhit=14,80>5,19 maka H0 ditolak
Jadi dengan taraf nyata 0,05 dapat disimpulkan bahwa model regresi linear sederhana tidak cocok
digunakan.
17

SOAL LATIHAN
Seorang kimiawan mempelajari hubungan konsentrasi suatu larutan (Y) dengan waktu (X). Berikut data
sampel yang diperoleh:
i

Xi

Yi

1

9

0,07

2

9

0,09

3

9

0,08

4

7

0,16

5

7

0,17

6

7

0,21

7

5

0,49

8

5

0,58

9

5

0,53

10

3

1,22

11

3

1,15

12

3

1,07

13

1

2,84

14

1

2,57

15

1

3,10

a. Tentukan persamaan regresi linear dugaan
b. Lakukan uji F untuk memeriksa apakah ada
ketidakcocokan model bila digunakan model regresi
linear sederhana, gunakan taraf nyata 0,05.
c. Buatlah diagram pencar antara X dan Y.

18

Universitas Negeri Yogyakarta
Fakultas Matematika dan Ilmu Pengetahuan Alam
Jurusan Pendidikan Matematika
Topik 5

: Pendekatan Matriks terhadap Analisis Regresi Linear Sederhana

Perhatikan kembali model regresi linear sederhana berikut
Yi = β0+β1Xi+εi
Bila diambil sebanyak n maka diperoleh

Y1 = β 0 + β1 X 1 + ε 1
Y2 = β 0 + β1 X 2 + ε 2
Yn = β 0 + β1 X n + ε n
Dalam notasi matriks dituliskan sebagai berikut

Y1
Y2

=

1 X1
1 X2

β0
+
β1

1 Xn

Yn

ε1
ε2

atau

Y=X
n×1

+

n×2 2×1

n×1

εn

Perhatikan bahwa Xβ
β adalah vektor nilai-nilai harapan bagi amatan-amatan Yi sebab E{Yi}= β0+β1Xi,
sehingga

E{Y} = X

n×2 2×1

n×1

Asumsi : ε adalah suatu vektor peubah acak normal yang bebas dengan E{εε } = 0 dan
Persamaan normal regresi linear sederhana :
+

=
+

=

Ditulis dalam notasi matriks

1

1

1

X1

X2

Xn

1

X1

1

X 2 b0
b1

1


=

Y1
=

1

1

1

X1

X2

Xn

Xn

Y2
Yn

= ′



19

=

X' X =

1

1

X1

X2

1 X1
1 X2

1
Xn

n

=

Xi
X i2

Xi

1 Xn
Y1
X' Y =

1

1

X1

X2

1
Y2
=
Xn

Yi
X i Yi

Yn

(X' X )

−1

1

=

X i2 − (

n

Xi )

2

X i2
− Xi



Xi
n

Uji terhadap β1
Untuk menguji apakah ada hubungan linear antara Y dengan X, dilakukan pengujian berikut :
Hipotesis :
H0 : β 1 = 0
H1 : β 1 ≠ 0
Taraf nyata : α
Statistik Uji :

=

!

Kriteria Keputusan :
H0 ditolak jika Fhit > Fα(1,n-2)

JKG = Y' Y − b' X' Y ,
1

1

1

1

JKT = Y' Y −

1
Y' JY , Y' Y =
n

J=

Selang Kepercayaan bagi βk

bk − tα / 2,(n − 2 ) s{bk } ≤ β k ≤ bk + tα / 2 ,(n − 2 ) s{bk }
s {b} = KTG (X' X )
2

−1

2
, s {b} =

s 2 {b0 } s{b0 , b1 }
s{b1 , b0 } s 2 {b1 }

20

Yi 2 , Y' JY = (

Yi )

2

SOAL LATIHAN
1. Suatu percobaan telah dilakukan untuk menentukan apakah berat seekor kambing (dalam
kilogram) dapat diprediksikan (setelah pada periode tertentu) berdasarkan jumlah makanan yang
dimakan (dalam kilogram). Berikut data yang telah dinyatakan dalam notasi matriks.

X' X =

10
379
825
, X' Y =
, Y' Y = [70083], Y' JY = [680625]
379 14533
31726

Anggap asumsi-asumsi dalam model regresi linear sederhana terpenuhi.
a) Tentukan persamaan regresi dugaan beserta maknanya.
b) Bila jumlah makanan seekor kambing sebesar 300 kg, berapakah prediksi berat kambing
tersebut?
c) Buatlah selang kepercayaan 99% bagi β1 dan berikan maknanya.
d) Tentukan koefisien korelasinya.
2.

Data berikut merupakan hasil penelitian tentang hubungan antara nilai ulangan Matematika
(dalam skala nilai 10 sampai 100) dengan lama waktu belajar matematika (dalam jam selama
seminggu).
Nilai ulangan matematika
95 100 100 80 70 55 50 75 55 60 65 95
Lama waktu belajar matematika 18 18 19 17 14 5 6 10 13 4 12 10
a) Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas Y!
Anggap asumsi-asumsi dalam model regresi linear sederhana terpenuhi.
b) Tentukan selang kepercayaan 99% bagi β0 dan β1 beserta maknanya!
c) Ujilah apakah ada hubungan linear antara lama waktu belajar matematika dan nilai ulangan
matematika? Gunakan taraf nyata α = 0,01.

21

Universitas Negeri Yogyakarta
Fakultas Matematika dan Ilmu Pengetahuan Alam
Jurusan Pendidikan Matematika
Topik 6

: Analisis Regresi Linear Ganda

Analisis regresi linear ganda adalah analisis statistika yang digunakan untuk mengetahui
hubungan linear antara satu peubah tak bebas Y dengan beberapa peubah bebas (X1, X2, …,
Xp-1).
Model regresi linear ganda
Yi  0  1 X i1   2 X i 2     p 1 X i , p 1   i
dengan :
0, 1, …, p-1 adalah parameter
Xi1, …, Xi,p-1 adalah konstanta yang diketahui nilainya
i saling bebas dan menyebar N(0,2)
i = 1, , …, n
Persamaan Normal
b0 n  b1  X i1  b2  X i 2    b p 1  X ip 1   Yi

b0  X i1  b1  X i21  b2  X i1 X i 2    b p 1  X i1 X ip 1   X i1Yi

b0  X i 2  b1  X i1 X i 2  b2  X i22    b p 1  X i 2 X ip 1   X i 2Yi


b0  X ip 1  b1  X i1 X ip 1  b2  X i 2 X ip 1    b p 1  X ip2 1   X ip 1Yi
Persamaan regresi dugaan
Yˆ  b  b X  b X    b
i

0

1

 1
X' X   X 11
 X 12

 1
X' Y   X 11
 X 12

i1

2

1



X 21
X 22

1
X 21
X 22

i2

p 1

X i , p 1

1 X 11
1 
1 X 21
 X n1  


 X n 2  
1 X n1

X 12 
 n
X 22  
  X i1
  
  X i 2
X n2  

Y 

1   1   Yi


Y
 X n1   2    X i1Yi 

 X n 2     X i 2Yi 

Yn  


b  X' X X' Y
1

22

X
X
X X
i1
2
i1

i2

X
X X
X



i1 i 2 
2

i2 
i2

i1

Memaknai Persamaan Regresi Dugaan
Misalkan : Ingin mengetahui apakah volume penjualan (Y, gros) berhubungan dengan jumlah
penduduk (X1, ribuan jiwa) dan pendapatan per kapita (X2, dolar).
Diperoleh persamaan regresi dugaannya ialah
Yˆ  3,453  0,496 X  0,00920 X
1

2

Persamaan ini menunjukkan bahwa rataan volume penjualan diharapkan akan naik 0,496
gros bila jumlah penduduk naik 1 ribu jiwa kalau pendapatan per kapita tetap, dan bahwa
rataan volume penjualan diharapkan akan naik 0,0092 gros bila pendapatan per kapita naik 1
dolar kalau jumlah penduduk tetap. Bila jumlah penduduk sebesar 0 jiwa dan pendapatan
per kapita 0 dollar maka rata-rata volume penjualan sebesar 3,453 gros (tidak bermakna).
Uji terhadap Hubungan Regresi
Untuk menguji apakah peubah tak bebas Y berhubungan dengan peubah-peubah bebas
(X1, X2,…,Xp-1), dilakukan pengujian berikut :
Hipotesis :
H0 : 1 = 2 = … = p-1=0
H1 : Tidak semua k (k=1, ,…,p-1)sama dengan nol
Taraf nyata : 
Statistik Uji :
=





�−1

� −�

Kriteria Keputusan :
H0 ditolak jika Fhit > F(p-1,n-p)
1
JKT  Y' Y    Y' JY , JKG  Y' Y  b' X' Y
n
Uji terhadap k
Hipotesis
Hipotesis
Statistik Uji
Nol
Alternatif
�� −
H0 : k = c
H1 : k  c
=
��
H0 : k  c
H1 : k > c

H0 : k = c
H0 : k  c
H0 : k = c

H1 : k < c

s 2 b  KTGX' X

1

23

Kriteria keputusan
H0 ditolak jika |thit| >
H0 ditolak jika thit >
H0 ditolak jika thit < −

2

� −�

� −�

� −�

 s 2 b0 
sb0 , b1   sb0 , b p 1 


sb1 , b0 
s 2 b1   sb1 , b p 1 
2

s b 








2
 sb p 1 , b0  sb p 1 , b1   s b p 1  

Selang kepercayaan bagi k
�� − (� −� ) �� ≤ � ≤ �� +
2

2

(� −� )

��

Makna Selang Kepercayaan bagi k
Misal diperoleh selang kepercayaan 95% bagi β1 adalah
0,01 ≤ 1 ≤ ,
Artinya dengan tingkat kepercayaan 95% diduga bahwa rata-rata Y naik sekitar antara 0,018
sampai 2,773 satuan untuk setiap kenaikan satu satuan X1 bila X2 tetap.
Selang Kepercayaan Serempak bagi k
Selang kepercayaan bersama Bonferroni dapat digunakan untuk menduga beberapa
koefisien regresi secara serempak. Jika g buah parameter akan diduga secara bersamaan
(asalkan g ≤ p , maka batas-batas kepercayaan serempak dengan tingkat kepercayaan 1-
adalah
bk  B sbk    k  bk  B sbk 
dengan
Bt
2g

n  p 

Makna Selang Kepercayaan Serempak
Misalkan : Ingin mengetahui apakah volume penjualan (Y, gros) berhubungan dengan jumlah
penduduk (X1, ribuan jiwa) dan pendapatan per kapita (X2, dolar). Diperoleh selang
kepercayaan serempak 90% sebagai berikut : (g=2)
0,4 ≤1≤0, 0 ; 0,00 1 ≤2≤0,011
Selang kepercayaan serempak ini mengindikasikan bahwa 1 dan 2 keduanya positif, hal ini
sesuai harapan teoritis bahwa volume penjualan memang harus naik jika jumlah penduduk
naik dan pendapatan per kapita naik, tentu saja asalkan peubah-peubah lain dipertahankan
konstan.

24

Koefisien Determinasi Ganda (R2)
 R2 = JKR/JKT = 1- (JKG/JKT)
 Koefisien ini mengukur proporsi pengurangan keragaman total di dalam Y akibat
digunakannya peubah-peubah bebas
X1,X2, …, Xp-1.
 Sifat koefisien determinasi ganda : 0  R2  1.
 R2 akan bernilai 0 bila semua bk = 0 (k=1,…,p-1). R2 akan bernilai 1 bila semua amatan Y
berada tepat pada permukaan respons dugaannya, Yi = Ŷi untuk semua i.
Koefisien determinasi ganda terkoreksi (��� )
 Penambahan lebih banyak peubah bebas ke dalam model selalu akan menaikkan nilai R2
tidak pernah menurunkannya, sebab JKG tidak pernah menjadi lebih besar bila peubah
bebasnya lebih banyak, sedangkan JKT tidak akan berubah bila data responsnya tetap
sama.
 Karena R2 sering bisa dibuat besar dengan cara menyertakan peubah bebas, maka ada
yang menyarankan agar ukuran ini dimodifikasi untuk mempertimbangkan banyaknya
peubah bebas di dalam model.
 Koefisien determinasi ganda terkoreksi
Ra2  1 

 n  1  JKG
JKG n  p 

 1  
JKT n  1
 n  p  JKT

Memaknai Koefisien Determinasi Ganda
Misalkan : Ingin mengetahui apakah volume penjualan (Y, gros) berhubungan dengan jumlah
penduduk (X1, ribuan jiwa) dan pendapatan per kapita (X2, dolar)
Diperoleh R2 = 0,9989, artinya bila kedua peubah saling bebas, jumlah penduduk dan
pendapatan per kapita ikut diperhitungkan maka keragaman volume penjualan dapat dikurangi
sebanyak 99,9%.
atau
sebesar 99,9% keragaman dari volume penjualan yang dapat dijelaskan oleh jumlah penduduk
dan pendapatan per kapita.
Koefisien Korelasi Ganda
Koefisien korelasi ganda R adalah akar kuadrat positif dari R2
R  R2

Uji F untuk Kecocokan Model Regresi Linear Ganda
• Uji ini mengasumsikan bahwa pengamatan-pengamatan Y untuk suatu X tertentu
bersifat bebas, tersebar normal, memiliki ragam yang sama.
• Uji ini menghendaki adanya pengamatan berulang pada satu atau lebih nilai X.
25

Hipotesis
H0 : E{Y} = 0+ 1X1+ 2X2 + …+ p-1Xp-1
H1 : E{Y}  0+ 1X1 + 2X2 + …+ p-1Xp-1
Atau
H0 : Tidak ada ketidakcocokan model regresi linear ganda dengan data
H1 : Ada ketidakcocokan model regresi linear ganda dengan data
Atau
H0 : Model regresi linear ganda cocok
H1 : Model regresi linear ganda tidak cocok
Taraf nyata: 
Statistik Uji:
JKKM k  p 
F
JKGM n  k 
Kriteria Keputusan
H0 ditolak jika Fhit > Fα(k-p,n-k)
Dengan

JKGM   Yij  Y j  , JKG  Y' Y  b' X' Y , JKKM  JKG  JKGM
2

Contoh
Perhatikan data tentang kesukaan merk berikut
i

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

Xi1

4

4

4

4

6

6

6

6

8

8

8

8

10

10

10

10

Xi2

2

4

2

4

2

4

2

4

2

4

2

4

2

4

2

4

Yi
64 73 61 76 72 80 71 83 83 89 86 93 88 95 94
Y : derajat kesukaan terhadap merk , X1 : kandungan uap air, X2 : kemanisan produk
k = 8, JKG = 94,3, Ŷ = 37,650 + 4,425 X1 + 4,375 X2
Ujilah ketidakcocokan model regresi linear ganda dengan taraf nyata 0,01.
Xi1

Xi2

Yij

4

2

64; 61

4

4

73; 76

6

2

72; 71

6

4

80; 83

8

2

Yj

26

100

8

4

10

2

10

4

Hipotesis
H0 : E{Y} = 0+ 1X1+ 2X2
H1 : E{Y}  0+ 1X1+2X2
Taraf nyata :  = 0,01
Statistik Uji:
JKKM k  p 
F
JKGM n  k 
Kriteria keputusan:
n=16, k=8, db(KM)=k-p=8-3=5 ,db(GM)=n-k=16-8=8, F0,05(5,8)= 3,69
H0 ditolak jika Fhit > 3,69
Hitungan:

SOAL LATIHAN
1. Suatu penelitian telah dilakukan untuk mengetahui hubungan antara persentase
kehadiran mahasiswa (X1) dan lama belajar dalam jam per minggu (X2) terhadap nilai
akhir ujian suatu mata kuliah (Y). Sebanyak 30 mahasiswa telah dipilih secara acak untuk
menjadi subyek penelitian.
Diketahui :

XX

1

 9,8866861  0,132528 0,640573 
  0,132528 0,0018375  0,010051
 0,640573  0,010051 0,079075 

 Y  2440,  Y  2016000,  X Y  224670,  X
 X X  9810,  X  251674,  X  409
2

i

i

i1

i2

i1 i

2
i1

Y  8880,

i2 i

2
i2

a) Tentukan persamaan regresi dugaan dan berikan maknanya.
b) Bila dianggap asumsi-asumsi dalam analisis regresi linear ganda terpenuhi, ujilah
apakah ada hubungan antara persentase kehadiran mahasiswa dan lama belajar
dalam jam per minggu terhadap nilai akhir ujian suatu mata kuliah. Gunakan  = 0,05.
c) Tentukan selang kepercayaan 95% bagi 1 dan maknanya.
d) Buatlah selang kepercayaan serempak 95% bagi 1 dan 2 beserta maknanya
e) Hitunglah koefisien determinasi ganda dan berikan maknanya.
27

f) Hitunglah koefisien korelasi ganda.
2. Seorang pegawai administrasi rumah sakit ingin mengetahui hubungan antara kepuasan
pelanggan (Y) dan umur pasien (X1, dalam tahun), tingkat keparahan penyakit (X2, dalam
indeks) dan tingkat kecemasan (X3, dalam indeks). Ia mengambil secara acak 23 pasien
dan mengumpulkan data tersebut. Berikut datanya:
i
Xi1
Xi2
Xi3
Yi

1
50
51
2,3
48
i
Xi1
Xi2
Xi3
Yi

2
36
46
2,3
57

13
38
55
2,2
47

3
40
48
2,2
66

14
34
51
2,3
51

4
41
44
1,8
70

15
53
54
2,2
57

5
28
43
1,8
89

16
36
49
2,0
66

6
49
54
2,9
36

17
33
56
2,5
79

7
42
50
2,2
46

18
29
46
1,9
88

8
45
48
2,4
54

19
33
49
2,1
60

9
52
62
2,9
26

20
55
51
2,4
49

10
29
50
2,1
77

21
29
52
2,3
77

11
29
48
2,4
89

22
44
58
2,9
52

12
43
53
2,4
67

23
43
50
2,3
60

Anggap asumsi-asumsi dalam model regresi linear ganda terpenuhi.
a. Tentukan fungsi regresi dugaan
b. Ujilah hubungan regresi, gunakan taraf nyata 0,01.
c. Tentukan selang kepercayaan serempak bagi 1, 2 dan 3 dengan tingkat
kepercayaan 90%. Interpretasikan hasilnya.
d. Hitung koefisien korelasi ganda dan berikan maknanya.
3. Seorang peneliti ingin mengevaluasi hubungan antara gaji tahuan peneliti matematika
golongan menengah dan senior (Y, dalam ribuan dolar) dan indeks kualitas publikasi (X1),
jumlah tahun pengalaman (X2) dan indeks kesuksesan dalam memperoleh hibah (X3).
Berikut data sampel 24 peneliti matematika golongan menengah dan senior.
i
Xi1
Xi2
Xi3
Yi

1
3,5
9
6,1
33,2

2
5,3
20
6,4
40,3

3
5,1
18
7,4
38,7

4
5,8
33
6,7
46,8

5
4,2
31
7,5
41,4

6
6,0
13
5,9
37,5

7
6,8
25
6,0
39,0

8
5,5
30
4,0
40,7

9
3,1
5
5,8
30,1

10
7,2
47
8,3
52,9

11
4,5
25
5,0
38,2

12
4,9
11
6,4
31,8

i
Xi1
Xi2
Xi3
Yi

13
8,0
23
7,6
43,3

14
6,5
35
7,0
44,1

15
6,6
39
5,0
42,8

16
3,7
21
4,4
33,6

17
6,2
7
5,5
34,2

18
7,0
40
7,0
48,0

19
4,0
35
6,0
38,0

20
4,5
23
3,5
35,9

21
5,9
33
4,9
40,4

22
5,6
27
4,3
36,8

23
4,8
34
8,0
45,2

24
3,9
15
5,0
35,1

28

Anggap asumsi-asumsi dalam model regresi linear ganda terpenuhi.
a. Tentukan fungsi regresi dugaan
b. Ujilah hubungan regresi, gunakan taraf nyata 0,05.
c. Ujilah apakah masing-masing k signifikan. Gunakan taraf nyata 0,05.
d. Tentukan selang kepercayaan serempak bagi 1, 2 dan 3 dengan tingkat
kepercayaan 95%. Interpretasikan hasilnya.
e. Hitung koefisien korelasi determinasi dan berikan maknanya.
f. Buatlah selang kepercayaan 95% bagi masing-masing k.

29

Universitas Negeri Yogyakarta
Fakultas Matematika dan Ilmu Pengetahuan Alam
Jurusan Pendidikan Matematika
Topik 7

: Asumsi-asumsi dalam Analisis Regresi Linear Ganda

Asumsi-asumsi dalam analisis regresi linear ganda adalah
a. Linearitas
b. Tidak terjadi multikolinearitas
c. Tidak terjadi heteroskedastisitas
d. Normalitas
e. Tidak ada autokorelasi
Linearitas
Model regresi linear ganda diasumsikan linear dalam parameter regresi. Asumsi linearitas dalam
regresi ganda lebih sulit dipenuhi berkaitan dimensi data yang semakin tinggi.
Asumsi ini dapat dideteksi dengan plot pencar sisaan dibakukan dengan masing-masing peubah
bebas.
Kriteria: asumsi ini terpenuhi bila pada plot ini menunjukkan titik-titik berpencar secara acak, bila
berpola maka mengindikasikan terjadinya pelanggaran asumsi. Jika asumsi linearitas tidak terpenuhi
maka lakukan transformasi pada Y dan atau peubah bebas tertentu.

Gambar 1. Plot sisaan dibakukan dengan masing-masing peubah bebas
Pada Gambar 1, pada masing-masing plot menunjukkan bahwa titik-titik berpencar secara acak
sehingga asumsi linearitas dalam parameter regresi terpenuhi.

Multikolinearitas
 Multikolinearitas atau kekolinearan ganda adalah terjadinya korelasi antar peubah bebas.
 Model regresi yang baik seharusnya tidak terjadi korelasi antar peubah bebas.
 Metode yang banyak digunakan untuk mendeteksi adanya multikolinearitas adalah faktor inflasi
ragam (variance inflation factor/VIF) dengan rumus

VIFk  (1  Rk2 ) 1 , k  1,2,..., p  1


Rk2 adalah koefisien determinasi ganda bila Xk diregresikan terhadap p-2 peubah lainnya di dalam
model.
30



Kriteria terjadinya multikolinearitas adalah VIF > 10 atau nilai TOLERANCE < 0,1
(TOLERANCE = 1/VIF)

Heteroskedastisitas
 Ragam galat diasumsikan konstan dari satu pengamatan ke pengamatan lain, hal ini disebut
homoskedastisitas.
 Jika ragam galat berbeda disebut heteroskedastisitas.
 Model regresi yang baik adalah tidak terjadi heteroskedastisitas.
 Untuk mendeteksi heteroskedastisitas adalah dengan membuat plot nilai dugaan yang
dibakukan (standardized predicted value) dengan sisaan yang dibakukan (studentized residual).
 Jika ada pola tertentu (bergelombang, melebar kemudian menyempit) maka terjadi
heteroskedastisitas.
 Jika tidak ada pola jelas, maka tidak terjadi heteroskedastisitas.

Gambar 2. Plot nilai dugaan dibakukan dengan sisaan dibakukan
Pada Gambar 2, plot menunjukkan bahwa titik-titik berpencar secara acak (tidak berpola) yang
mengindikasikan homoskedastisitas. (Galat memiliki ragam yang sama).

Normalitas







Galat diasumsikan berdistribusi Normal  i ~ N 0,  2 .





Model regresi yang baik adalah distribusi data normal atau mendekati normal.
Untuk mendeteksi normalitas digunakan normal p-p plot.
Jika titik-titik (sisaan) menyebar di sekitar garis diagonal dan mengikuti arah garis diagonal, maka
model regresi memenuhi asumsi normalitas.
Jika titik-titik (sisaan) menyebar jauh dari garis diagonal dan atau tidak mengikuti arah garis
diagonal, maka model regresi tidak memenuhi asumsi normalitas.



31

Gambar 3. Plot P-P Normal
Pada Gambar 3 terlihat bahwa titik-titik dekat dengan garis diagonal sehingga galat memiliki
distribusi normal.
Autokorelasi
 Bila dalam model regresi linear ganda ada korelasi antara galat pada periode t dengan galat pada
periode t-1, maka dinamakan ada masalah autokorelasi.
 Model regresi yang baik adalah model regresi yang bebas dari autokorelasi.
 Autokorelasi sering ditemukan pada regresi yang datanya adalah time series atau berdasarkan
waktu berkala seperti bulanan, tahunan.
 Deteksi autokorelasi dengan menggunakan besaran Durbin -Watson (D-W)
n

d

 (e  e
i 2

i 1

i

)2

n

e
i 1

2
i

Hipotesis
Hipotesis Alternatif
Nol
H0 :  = 0
H1 :  > 0
(Tidak ada
(Ada autokorelasi
autokorelasi) positif)

Taraf
Kriteria Keputusan
Nyata
Jika d > dU maka terima H0 (tidak ada autokorelasi)

Jika d < dL maka tolak H0 (ada autokorelasi positif)
Jika dL ≤ d ≤ dU , maka uji tidak meyakinkan

H1 :  < 0

(Ada autokorelasi
negatif)
H1 :  ≠ 0
2
(Ada autokorelasi)

Jika 4-d > dU maka terima H0 (tidak ada autokorelasi)
Jika 4-d < dL maka tolak H0 (ada autokorelasi negatif)
Jika dL ≤ 4-D ≤ dU , maka uji tidak meyakinkan
Jika d < dL atau 4-d < dL maka tolak H0 (ada
autokorelasi)
Jika d > dU dan 4-d > dU maka terima H0 (tidak ada
autokorelasi )
Selain itu, maka uji dikatakan tidak meyakinkan

32

SOAL LATIHAN
Sebuah studi untuk mengetahui hubungan lama bekerja dan kepuasan kerja dengan pendapatan.
Berikut data sampel dari sembilan pekerja.
Pendapatan per tahun
(ribuan dolar)
47
42
54
48
56
59
53
62
66

Lama bekerja

Indeks kepuasan kerja

8
4
12
9
16
14
10
15
22

5,6
6,3
6,8
6,7
7,0
7,7
7,0
8,0
7,8

Selidiki pemenuhan asumsi-asumsi dalam model regresi linear ganda.
Berikut output SPSS.

33

34

Universitas Negeri Yogyakarta
Fakultas Matematika dan Ilmu Pengetahuan Alam
Jurusan Pendidikan Matematika
Topik 8

: Jumlah Kuadrat Ekstra

Kegunaan Jumlah Kuadrat Ekstra:
a. Mengukur pengurangan JKG akibat dimasukkannya 1 atau lebih peubah bebas ke dalam
model regresi, jika diketahui peubah-peubah lain telah ada di dalam model
b. Mengukur kenaikan JKR akibat dimasukkannya 1 atau beberapa peubah bebas ke dalam
model regresi
c. Untuk menguji apakah peubah Xk dapat dibuang dari model regresi ganda
d. Untuk menguji apakah beberapa peubah bebas dapat dibuang dari model regresi ganda
Definisi
Jumlah kuadrat esktra � 2 1 mengukur pengaruh marjinal akibat penambahan X2 dalam
model regresi yang sudah ada X1.
� 2 1 = � 1 , 2 − � 1 atau
� 2 1 = � 1 − � 1, 2
Perluasan




3

1,

2

3

1,

2




=
=

Contoh 1
Perhatikan tabel berikut

1,

2,

1,

2

− �
− � 1,
3

Yˆ  1,496  0,8572 X 1
JK

Regresi

JKR(X1)=352,27

1

352,27

Galat

JKG(X1)=143,12

18

7,95

Total

495,39

19

db

KT

Regresi

2,

3

atau

Sumber variasi

JK

db

KT

Regresi

JKR(X2)=381,97

1

381,97

Galat

JKG(X2)=113,42

18

6,30

Total

495,39

19

Yˆ  117,08  4,334 X 1  2,857 X 2  2,186 X 3

Yˆ  19,174  0,2224 X 1  0,6594 X 2
JK

2

Yˆ  23,634  0,8565 X 2

Sumber
variasi

Sumber
variasi

1,

db

MS

Sumber
variasi

JK

JKR(X1,X2)=385,44

2

192,72

Regresi

Galat

JKG(X1,X2)=109,95

17

6,47

Total

495,39

19

35

db

KT

JKR(X1,X2,X3)=396,98

3

132,33

Galat

JKG(X1,X2,X3)=98,41

16

6,15

Total

495,39

19

Jumlah kuadrat galat bila X1 dan X2 ada dalam model,

dibandingkan bila dalam model hanya ada X1, � 1 = 143,12.

1,

2

= 109,95 lebih kecil

Jumlah kuadrat ekstra untuk pengaruh marjinal akibat penambahan X2 dalam model regresi
yang sudah ada X1.
� 2 1 = � 1 − � 1 , 2 = 143,12 − 109,95 = 33,17
atau
� 2 1 = � 1 , 2 − � 1 = 385,44 − 352,27 = 33,17

Jumlah kuadrat ekstra untuk pengaruh marjinal akibat penambahan X3 dalam model regresi
yang sudah ada X1 dan X2.
� 3 1 , 2 = � 1 , 2 − � 1 , 2 , 3 = 109,95 − 98,41 = 11,54
atau
� 3 1 , 2 = � 1 , 2 , 3 − � 1 , 2 = 396,98 − 385,44 = 11,54
Dekomposisi JKR menjadi Jumlah Kuadrat Ekstra
Dalam regresi ganda dapat diperoleh beberapa dekomposisi JKR menjadi Jumlah Kuadrat Ekstra.
Misal untuk dua peubah bebas.
�= � 1 + � 1

Lalu substitusi � 1 dengan
� 2
�= � 1 +

→ � = � 1, 2 +

2

1

1

+

1,

2

+




1,

1,

2

sehingga

2

Tabel 1. Contoh Tabel ANOVA dengan Dekomposisi JKR untuk Tiga Peubah X
Sumber Variasi
JK
db
KT
Regresi
JKR(X1, X2, X3)
3
KTR(X1, X2, X3)
X1
JKR(X1)
1
KTR(X1)
X2|X1
JKR(X2|X1)
1
KTR(X2|X1)
X3|X1,X2
JKR(X3|X1,X2)
1
KTR(X3|X1,X2)
Galat
JKG(X1, X2, X3)
n-4
KTG(X1, X2, X3)
Total
JKT
n-1

Uji masing-masing �� = �
Bentuk � � dapat dikeluarkan dari model regresi ganda, dengan hipotesis alternatif sebagai
berikut
Hipotesis Nol
H0 : � = 0

Hipotesis Alternatif
H1 : � ≠ 0

Statistik Uji
��
=
��

36

Kriteria keputusan
H0 ditolak jika
>

2

(� −� )

Hipotesis :
H0 : k= 0
H1 : k 0
Taraf nyata : 
Statistik Uji :
JKR X k X 1 ,, X k 1 , X k 1 ,, X p 1  JKG X 1 ,, X p 1 
F
:
n p
1


KTRX k X 1 ,, X k 1 , X k 1 ,, X p 1 
KTG

Kriteria Keputusan :
H0 ditolak jika Fhit > F(1,n-p)
Uji Apakah Semua k = 0
Hipotesis :
H0 : 1 = 2 = … = p-1 = 0
H1 : Tidak semua k (k=1, …, p-1) sama dengan nol
Taraf nyata : 
Statistik Uji :
JKR X 1 ,, X p 1  JKG X 1 ,, X p 1  KTR

F
:
p 1
n p
KTG
Kriteria Keputusan :
H0 ditolak jika Fhit > F(p-1,n-p)
Uji Apakah Beberapa k = 0
Hipotesis :
H0 : q= q+1 = …= p-1= 0
H1 : Tidak semua k di dalam H0 sama dengan nol
Taraf nyata : 
Statistik Uji :
F




JKR X q ,, X p 1 X 1 ,, X q 1



pq

 : JKG X ,, X 

KTR X q ,, X p 1 X 1 ,, X q 1

1



n p

KTG

Kriteria Keputusan :
H0 ditolak jika Fhit > F(p-q,n-p)

37

p 1

Misalkan model regresi orde pertama dengan tiga peubah bebas
� = 0 + 1 �1 + 2 �2 + 3 �3 + ��

Uji apakah 3 = 0.
Hipotesis Nol
Hipotesis
Alternatif
H0 : 3 = 0
H1 : 3 ≠ 0

Statistik Uji

=



Kriteria keputusan


1,

3

1,

2,

3

2

1
�−4

H0 ditolak jika
> (1,� −4)

Contoh 2
Dari contoh 1. Apakah X3 dapat dikeluarkan dari model regresi? Gunakan taraf nyata
Hipotesis
H0 : 3 = 0
H1 : 3 ≠ 0
Taraf nyata: = 0,01

Statistik Uji:

=





3

1, 2

1, 2, 3

= 0.01.

1

� −4

Kriteria keputusan: F0,01(1,20-4) = F0,01(1,16) = 8,53
H0 ditolak jika ℎ� > 8,53
Hitungan:
11,54 1

= 98,41

16

= 1,88

Kesimpulan:
Karena Fhit = 1,88 < 8,53 maka H0 diterima. ( 3 = 0)
Jadi pada taraf nyata 0,01 dapat disimpulkan bahwa X3 dapat dikeluarkan dari model regresi.
Misalkan model regresi orde pertama dengan tiga peubah bebas
(Model Lengkap)
� = 0 + 1 �1 + 2 �2 + 3 �3 + ��
Apakah 2 and 3 dapat dikeluarkan dari model regresi.
Null Hypothesis
H0 :

2

=

3

=0

Alternative
Hypothesis
H1 : Tidak semua
sama
2 dan
3
dengan nol

Statistik Uji

=





1,

2,

3

2,

3

1

2
�−4

Kriteria
Keputusan
H0 ditolak jika
> (2,� −4)

Contoh 3
Dari contoh 1. Apakah X2 dan X3 dapat dikeluarkan dari model regresi? Gunakan taraf nyata
= 0,01.

38

Hipotesis
H0 : 2 = 3 = 0
H1 : Tidak semua
Taraf nyata: = 0,01
Statistik Uji:

=





2 dan
2, 3

1

1, 2, 3

3

sama dengan nol

2
� −4

Kriteria keputusan: F0,01(1,20-4) = F0,01(2,16) = 6,23
H0 ditolak jika ℎ� > 3,63
Hitungan:
=

44,71/2
98,41 16

= 3,63

Hitungan:
Karena Fhit = 3,63 < 6,23 maka H0 diterima. ( 2 = 3 = 0)
Jadi pada taraf nyata 0,01 dapat disimpulkan bahwa X2 dan X3 dapat dikeluarkan dari model
regresi.
Koefisien Determinasi Parsial
• Untuk mengukur sumbangan marjinal satu peubah bebas X, bila semua peubah bebas
lain telah ada di dalam model.
• Model regresi ganda ordo-pertama dengan 2 peubah bebas
Yi  0  1 X i1   2 X i 2   i
Maka koefisien determinasi parsial antara Y dan X1 bila dalam model sudah ada X2
adalah
JKR X 1 X 2 
rY21.2 
JKG  X 2 
Ukuran ini mengukur proporsi penurunan keragaman Y yang diakibatkan oleh
dimasukkannya X1 dalam model yang sebelumnya sudah ada X2.
Misalkan diperoleh rY22.1 

JKR X 2 X 1 
JKG  X 1 



33,17
 0,232 , artinya jika X2 dimasukkan ke dalam
143,12

model regresi yang di dalamnya sudah ada X1 maka JKG akan berkurang 23,2%.
Berikut beberapa rumus koefisien determinasi parsial
JKR X 1 X 2  2
JKR X 1 X 2 , X 3  2
JKR X 2 X 1 , X 3  2
JKR X 3 X 1 , X 2 
, rY 1.23 
, rY 2.13 
, rY 3.12 
rY21.2 
JKG  X 2 
JKG  X 2 , X 3 
JKG  X 1 , X 3 
JKG  X 1 , X 2 
rY24.123 

JKR X 4 X 1 , X 2 , X 3 
JKG  X 1 , X 2 , X 3 

39

Koefisien Korelasi Parsial
a. Koefisien korelasi parsial merupakan akar kuadrat koefisien determinasi parsial.
b. Koefisien ini mempunyai tanda yang sama dengan koefisien regresi padanannya di dalam
fungsi regresi dugaannya.
Contoh 4
Dari contoh 1. Tentukan koefisien korelasi parsial X2 bila X1 sudah ada dalam model regresi?
Yˆ  19,174  0,2224 X  0,6594 X
1

2|1

=

� 22|1

Koefisien

=

2|1

2

0,232 = 0,482

ini bernilai positif karena b2 = 0,6594 bernilai positif.

40

Universitas Negeri Yogyakarta
Fakultas Matematika dan Ilmu Pengetahuan Alam
Jurusan Pendidikan Matematika
Topik 9

: Seleksi Model

Langkah-langkah dalam membangun model
1. Pilih satu set peubah bebas
2. Sesuaikan model regresi dengan nilai VIF
3. Jika nilai VIF > 5 maka eliminasi peubah bebas yang memiliki nilai VIF tertinggi, jika
semua nilai VIF  5 maka lanjut ke langkah 5
4. Sesuaikan model regresi dengan nilai VIF untuk model yang baru (tanpa peubah yang
telah dihapus)
5. Lakukan best-subsets regression dengan peubah bebas yang tersisa
6. Daftar seluruh model yang mempunyai Cp  (p+1), dengan p adalah banyaknya peubah
bebas dalam model
7. Pada langkah 6, pilih model terbaik dengan menggunakan kriteria Cp, R2adj, s
8. Lanjutkan analisis yang lengkap dengan analisis sisaan
9. Perbaiki model bila ada indikasi pelanggaran asumsi
10. Gunakan model terbaik yang telah diperoleh bisa untuk prediksi dan inferensi
Best-Subset Regression
Kriteria dalam memilih model terbaik pada best-subset regression:
1. Cp, pilih nilai Cp  p+1 (Cp mengukur ketepatan model)
2. S, pilih nilai simpangan baku yang terkecil ( � = ���)
3. R2adj, pilih nilai R2adj mendekati 1 (100%)
4. Prinsip parsimony, model dengan peubah bebas yang lebih sedikit adalah lebih baik
daripada lebih banyak peubah