LAPORAN ANALISIS REGRESI TUGAS UJIAN AKH

LAPORAN
ANALISIS REGRESI
TUGAS UJIAN AKHIR SEMESTER
(PEMILIHAN MODEL REGRESI TERBAIK dan UJI ASUMSI KLASIK)

Dosen Pengampu:
Naomi Nessyana Debataraja, M.Si

LAILI IZZATI
NIM H1091141041

JURUSAN MATEMATIKA
PROGRAM STUDI STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS TANJUNGPURA
PONTIANAK
2016

BAB I
PENDAHULUAN
1.1 Latar Belakang

Statistik merupakan data, informasi, atau hasil penerapan algoritma statistika pada
suatu data. Statistik juga dapat digunakan untuk menguji suatu hipotesis dengan kebenaran
secara ilmiah yang sering disebut dengan statistik inferensial. Statistik parametrik
merupakan salah satu macam statistik, yang salah satu fungsinya untuk menghitung korelasi
atau pengaruh suatu variabel terhadap variabel lainnya yang tercakup dalam regresi linear
berganda. Tujuannya adalah agar bisa menjalankan bisnis dengan efektif dan efisien. Dan
salah satu dari ilmu statistik yang mendukung hal tersebut adalah statistik parametrik pada
regresi linear berganda .
Dalam kehidupan sehari-hari, sering kali kita temui bahwa nilai suatu variabel (Y)
dipengaruhi oleh nilai variabel lain (X), atau berkaitan dengan nilai variabel lain. Bentuk
hubungan antar kedua variabel tersebut adalah persoalan yang akan kita bahas dalam
analisis regresi dan korelasi. Sebagai contoh, kita mungkin tertarik untuk meneliti hubungan
antara pola konsumsi seseorang dalam suatu komunitas tertentu (Y) dengan penghasilannya
per bulan (X). Dalam setiap kasus di atas, variabel Y merupakan variabel dependen atau
variabel respons yang nilai-nilainya tergantung pada nilai-nilai variabel X, yang disebut
sebagai variabel independen atau variabel bebas. Analisis regresi digunakan untuk
membangun suatu model matematis untuk menjelaskan bentuk hubungan antar kedua
variabel tersebut (jika hubungan tersebut ada). Terkait permasalahan yang melatarbelakangi
permasalahan tersebut penulis ingin melakukan sebuah pengkajian pada sebuah kasus
terhadap faktor yang mempengaruhi Berat Badan terhadap komposisi tubuh. Dari

permasalahan tersebut kemudian akan dilakukan pemilihan model regresi terbaik dan uji
asumsi klasik.
1.2 Rumusan Masalah
Bagaimana penerapan Analisis Regresi Berganda terhadap Pemilihan Model Regresi
terbaik dan Uji Asumsi Klasik pada sebuah kasus pengaruh hubungan berat badan pada
seseorang melalui monitoring evaluasi komposisi tubuh terhadap beberapa variabel dengan
menggunakan acuan monitoring pada sebuah Independent Distributor Agent HERBALIFE
Nutrition.
1.3 Tujuan Penulisan
Adapun penulisan ini bertujuan untuk menganalisis penerapan Analisis Regresi
Berganda terhadap Pemilihan Model Regresi terbaik dan Uji Asumsi Klasik pada sebuah
kasus pengaruh hubungan berat badan pada seseorang melalui monitoring evaluasi
komposisi tubuh terhadap beberapa variabel, serta sebagai tugas pada Ujian Akhir Semester
pada mata kuliah Analisis Regresi.

BAB II
PEMBAHASAN
2.1 Regresi Berganda
Dalam hal ini analisis regresi berganda merupakan teknik statistik yang dapat digunakan
untuk menganalisis hubungan antara 1 variabel terikat (variabel dependen/variable kriterian = Y)

dengan beberapa variabel bebas/independen/prediktor (X1, X2, X3, ...Xn).
Penyimpangan yang sering terjadi pada analisis regresi linear berganda adalah eror yang
tidak berdistribusi normal dan adanya gejala heterokedastisitas. Estimasi yang peneliti
ciptakan melalui model regresi linier berganda (multiple regression) yang akan
memberikan hubungan antar beberapa variabel lainnya. Tetapi hasil regresi tidak secara
otomatis dapat memberikan hubungan yang signifikan. Model regresi linier berganda
(multiple regression) dapat disebut sebagai model yang baik jika model tersebut memenuhi
Kriteria BLUE (Best Linear Unbiased Estimator). BLUE dapat dicapai bila memenuhi
Asumsi Klasik. Peneliti harus mengetahui sifat - sifat estimator dan menunjukkan beberapa
asumsi dasar di dalam dataset. Sebuah model disebut sebagai model yang baik jika
memenuhi beberapa asumsi yang disebut dengan asumsi klasik (classical assumptions).
Dengan demikian ada beberapa uji yang harus dilakukan sebelum pengujian hipotesis
dalam model regresi yaitu :
1. Uji Normalitas
2. Uji Aotokorelasi
3. Uji Multikolinearitas
4. Uji Heteroskedastisitas
2.2 Analisis Regresi Berganda
TUGAS
1. Carilah data yang terdiri dari 1 variabel tidak bebas ( Y ) dan minimal 4 variabel bebas (X 1,

X2, X3, X4. Dengan banyaknya data minimal 30 ( Data Kuantitatif )
2. Lakukanlah pemilihan model terbaik.
3. Lakukan uji asumsi klasik pada data tersebut (uji normalitas eror, uji autokorelasi, uji
heterokedastisitas, dan uji multikolinearitas)
KASUS
Ingin diprediksi mengenai pengaruh hubungan yang terjadi pada berat badan seseorang
melalui monitoring evaluasi komposisi tubuh terhadap beberapa variabel dengan
menggunakan acuan monitoring pada sebuah Independent Distributor Agent HERBALIFE
Nutrition. Berdasarkan hasil survei terhadap 30 responden, terkait beberapa variabel yang
memenuhi diantaranya:
1. Y adalah Berat Badan
2. X1 adalah Kadar Lemak yang mana merupakan faktor yang dapat mempengaruhi berat
badan serta fungsi kerja sistem pada tubuh melalui penumpukan lemak yang terjadi
dalam tubuh seseorang (dalam %)
3. X2 adalah Kadar Air (dalam %)

4. X3 adalah Massa Otot yang dapat mempengaruhi berat badan pada seseorang dengan
tetap memperhatikan kadar lemak secara rendah,tinggi, maupun normal (dalam
kilogram)
5. X4 adalah Tinggi Badan seseorang yang dalam hal ini diukur menggunakan (cm)

DATA
Berikut merupakan hasil data Berat Badan seseorang yang dilakukan terhadap 30 responden:
Tabel.1. Berat Badan Terhadap Monitoring Komposisi tubuh
Y
BERAT
BADAN (kg)
63.50

X1
KADAR
LEMAK (%)
38.90

X2
KADAR
AIR (%)
45.40

X3
MASSA OTOT

(kg)
30.40

X4
TINGGI BADAN
(cm)
148

62.60

39.00

44.50

35.90

150

63.70


22.50

58.90

19.50

167

57.50

35.60

37.70

35.00

148

49.90


28.00

61.30

19.50

158

61.30

43.50

44.00

18.40

148

45.60


30.00

61.60

17.50

158

57.00

40.90

43.25

25.50

140

49.80


20.10

60.70

39.10

155

73.60

23.50

56.00

53.40

165

81.30


43.60

45.45

43.00

160

65.70

20.10

62.10

51.00

167

35.30

16.40

61.20

28.00

148

60.60

39.60

44.50

34.00

150

61.40

38.00

44.20

35.00

151

51.80

28.40

53.90

36.00

159

35.40

20.40

62.10

28.60

151

40.00

29.00

62.00

32.00

155

70.00

28.40

50.90

52.10

171

81.30
78.50
76.90
71.00
70.50
75.30
69.90
73.40
71.50
73.40
70.60

30.80
26.40
25.30
22.00
25.20
20.30
19.10
30.40
22.50
26.20
22.10

55.70
60.00
57.20
59.80
59.20
58.30
54.80
58.20
59.70
58.20
59.50

58.60
57.00
34.50
31.20
20.50
20.10
22.50
23.10
55.40
55.40
55.40

170
169
168
165
159
165
158
159
160
163
169

Dengan
data yang
ada, kita
dapat

mengestimasi fungsi berat badan terhadap evaluasi monitoring adalah:
Ŷi = a + b1 X1 + b2 X2 + b3 X3 + b4 X4 + error

Berdasarkan data yang telah kita peroleh tersebut langkah selanjutnya yang akan dilakukan
terhadap beberapa analisis regresi pada SPSS ialah seperti berikut :
1. Statistik Deskriptif

Berdasarkan data yang telah diperoleh sebelumnya , diperoleh statistik deskriptif-nya yakni
sebagai berikut :
Descriptive Statistics
N

Minimum

Maximum

Mean

Std. Deviation

Berat Badan (kg)

30

35.30

81.30

63.2767

12.92623

Kadar Lemak (%)

30

16.40

43.60

28.5400

7.92302

Kadar Air (%)

30

37.70

62.10

54.6767

7.33134

Massa Otot (kg)

30

17.50

58.60

35.5867

13.47692

Tinggi Badan (cm)

30

140

171

158.47

8.224

Valid N (listwise)

30

Tabel.1.1. Descriptive Statistics
2. Persamaan Regresi Linear
Coefficientsa
Model

Unstandardized Coefficients

Standardized

t

Sig.

Coefficients
B
(Constant)

-122.377

44.294

.165

.352

-.979

Kadar Lemak (%)
1

Std. Error

Kadar Air (%)
Massa Otot (kg)
Tinggi Badan (cm)

Beta
-2.763

.011

.101

.469

.643

.401

-.555

-2.441

.022

.023

.135

.024

.173

.864

1.474

.263

.938

5.607

.000

a. Dependent Variable: Berat Badan (kg)

Tabel.2.1. Menentukan Persamaan Regresi
Selanjutnya dari keempat variabel yang telah dilakukan pada SPSS tersebut, maka diperoleh
persamaan regresi : Y = -122,337 + 0,165X1 – 0,979X2 +0,023X3 + 1.474X4
3. Pemilihan Model Terbaik
Dalam studi kasus yang dilakukan, maka pemilihan model terbaik yang digunakan adalah
dengan menggunakan model Backward Elimination, sehingga diperoleh hasil outputnya
sebagai berikut :

Variables Entered/Removeda
Model

Variables Entered

Variables Removed

Method

Tinggi Badan (cm), Massa
1

Otot (kg), Kadar Lemak
(%), Kadar Air (%)

. Enter

b

Backward (criterion:
2

. Massa Otot (kg)

Probability of F-to-remove
>= .100).
Backward (criterion:

3

. Kadar Lemak (%)

Probability of F-to-remove
>= .100).

a. Dependent Variable: Berat Badan (kg)
b. All requested variables entered.

Tabel.3.1 Pemilihan Model Regresi Terbaik
Dari tabel diatas, diketahui variabel yang mempengaruhi yaitu variabel X2 dan X4
dimana X2 merupakan Kadar Air dan X4 merupakan Tinggi Badan .
Model Summary
Model

R

R Square

Adjusted R Square

Std. Error of the
Estimate

1
2
3

.809

a

.655

.600

8.18035

.809

b

.654

.614

8.02631

c

.651

.626

7.90947

.807

a. Predictors: (Constant), Tinggi Badan (cm), Massa Otot (kg), Kadar Lemak (%), Kadar Air (%)
b. Predictors: (Constant), Tinggi Badan (cm), Kadar Lemak (%), Kadar Air (%)
c. Predictors: (Constant), Tinggi Badan (cm), Kadar Air (%)

Tabel.3.2 Pengaruh Nilai R
Berdasarkan tabel tersebut dapat ditunjukkan beberapa hal yakni :

a. Angka R sebesar 0,807 menunjukan bahwa hubungan antara berat badan dengan
variable Kadar Air dan berat badan.
b. Angka R square sebesar 0,651 atau sebesar 65,1% menunjukkan bahwa hubungan
antara Berat Badan dengan variable Kadar Air dan Berat Badan seseorang tidak
begitu kuat. Karena masih banyak factor atau sebesar 34,9% dipengaruhi oleh factorfaktor diluar itu.

ANOVAa
Model

1

2

3

Sum of Squares

df

Mean Square

Regression

3172.582

4

793.146

Residual

1672.951

25

66.918

Total

4845.534

29

Regression

3170.570

3

1056.857

Residual

1674.964

26

64.422

Total

4845.534

29

Regression

3156.420

2

1578.210

Residual

1689.114

27

62.560

Total

4845.534

29

F

Sig.

11.852

.000b

16.405

.000c

25.227

.000d

a. Dependent Variable: Berat Badan (kg)
b. Predictors: (Constant), Tinggi Badan (cm), Massa Otot (kg), Kadar Lemak (%), Kadar Air (%)
c. Predictors: (Constant), Tinggi Badan (cm), Kadar Lemak (%), Kadar Air (%)
d. Predictors: (Constant), Tinggi Badan (cm), Kadar Air (%)

Tabel.3.3 Hasil Output pada Regresi Residual Total

Dengan uji F tersebut ternyata diperoleh nilai F-hitungnya ialah sebesar 25,227
dengan signifikansi uji sebesar 0,000. Karena signifikansi uji nilainya lebih kecil dari
0,05 maka terdapat hubungan antara Berat Badan dengan variable Komposisi Jumlah
Persentase Kadar Air dan Tinggi Badan pada berat badan seseorang.
Coefficientsa
Model

Unstandardized Coefficients

Standardized

t

Sig.

Coefficients
B
(Constant)

-122.377

44.294

.165

.352

-.979

Beta
-2.763

.011

.101

.469

.643

.401

-.555

-2.441

.022

.023

.135

.024

.173

.864

1.474

.263

.938

5.607

.000

-124.510

41.752

-2.982

.006

.162

.345

.099

.469

.643

Kadar Air (%)

-.995

.384

-.564

-2.593

.015

Tinggi Badan (cm)

1.499

.217

.954

6.917

.000

-110.538

28.806

-3.837

.001

-1.134

.238

-.643

-4.761

.000

1.488

.212

.947

7.009

.000

Kadar Lemak (%)
1

Std. Error

Kadar Air (%)
Massa Otot (kg)
Tinggi Badan (cm)
(Constant)
Kadar Lemak (%)

2

(Constant)
3

Kadar Air (%)
Tinggi Badan (cm)

a. Dependent Variable: Berat Badan (kg)

Berdasarkan tabel diatas, maka diperoleh persamaan regresi :
Y^ = -110,538 -1,134X2+ 1.488X4 + e
UJI ASUMSI KLASIK
a. Uji Normalitas Eror
One-Sample Kolmogorov-Smirnov Test
Unstandardized Residual
N
Normal Parametersa,b

30
Mean
Std. Deviation

0E-7
7.63186062

Most Extreme Differences

Absolute

.089

Positive

.070

Negative

-.089

Kolmogorov-Smirnov Z

.486

Asymp. Sig. (2-tailed)

.972

a. Test distribution is Normal.
b. Calculated from data.

Berdasarkan tabel diatas, diperoleh nilai signifikansi uji sebesar 0,972 > 0,05 yang berarti
dapat dikategorikan data tersebut berdistribusi secara normal.
b. Autokorelasi
Model Summaryb
Model

R

R Square

Adjusted R Square

Std. Error of the

Durbin-Watson

Estimate
.807a

1

.651

.626

7.90947

.912

a. Predictors: (Constant), Tinggi Badan (cm), Kadar Air (%)
b. Dependent Variable: Berat Badan (kg)

Karena nilai durbin-Watson diperoleh sebesar 0,912 maka dapat dikatakan data tersebut
tidak terjadi Autokorelasi

c. Multikolinearitas
Coefficientsa
Model

Unstandardized Coefficients

Standardized

t

Sig.

Coefficients
B
(Constant)
1

Kadar Air (%)
Tinggi Badan
(cm)

Std. Error

-110.538

28.806

-1.134

.238

1.488

.212

a. Dependent Variable: Berat Badan (kg)

Collinearity
Statistics

Beta

Tolerance

VIF

-3.837

.001

-.643

-4.761

.000

.707

1.414

.947

7.009

.000

.707

1.414

Berdasarkan tabel diatas dapat dilihat pada kolom VIF, dari semua variable tidak terdapat
nilai yang lebih besar dari 10. Sehingga dapat dikatakan pada kasus tersebut tidak terjadi
masalah multikolinearitas.
d. Heterokedastisitas
Coefficientsa
Model

Unstandardized Coefficients

Standardized

t

Sig.

Coefficients
B
(Constant)
1

Kadar Air (%)
Tinggi Badan (cm)

Std. Error
3.555

15.616

.078

.129

-.010

.115

Beta
.228

.822

.137

.602

.552

-.019

-.083

.934

a. Dependent Variable: ABRESID

Berdasarkan tabel diatas pada nilai signifikansi uji semua variable diatas 0,05. Sehingga
dapat disimpulkan bahwa data tersebut tidak terjadi heterokedastisitas.

INTERPRETASI DATA
Berikut merupakan hasil interpretasi berdasarkan hasil ouput yang diperoleh.
Dari persamaan regresi linear berganda dengan model terbaik maka diperoleh nilai estimasi
seperti berikut :
Y^

= -110,538 -1,134X2+ 1.488X4 + e

Dengan persamaan tersebut berarti dapat kita artikan bahwa:
Berat Badan = -110,538 -1,134 (Kadar Air) +1,488 (Tinggi Badan) + e
-

Nilai a= -110,538
Tanpa adanya kadar air (X2) dan Tinggi Badan (X4), maka besarnya output (Y) adalah
-110.538 satuan.

-

Nilai b1= -1,134
Hubungan antara nilai kadar air (X2) dengan hasil output (Y) jika tinggi badan (X4) konstan
adalah negatif, atau setiap kenaikan kadar air sebesar satu satuan, maka output akan
mengalami penurunan sebesar – 1,134 satuan.
Koefisien regresi pada Kadar Air bernilai negative artinya ketika berat badan seseorang
masih dalam kategori persentase yang normal maka berat badan seseorang juga akan
mengalami penurunan. Saat kita sedang mengelola berat badan sebaiknya diikuti dengan minum

air putih yang banyak (bukan air berkalori). Nah ini juga salah satu cara untuk menahan diri untuk
tidak ngemil di luar jam makan. Pertambahan 1% Kadar Air seseorang maka akan mengurangi

1,134 berat badannya.
-

Nilai b2= +1,488
Hubungan antara Tinggi badan (X4) dengan hasil output (Y) apabila Kadar air (X2) konstan
adalah positif , atau setiap kenaikan tinggi badan satu satuan,maka output akan mengalami
peningkatan sebesar 1,488 untuk setiap kenaikan 1 cm tinggi badan..Berdasarkan hasil
pengujian hipotesis, baik uji T maupun uji F diketahui bahwa Variabel banyaknya tinggi
badan seseorang berpengaruh terhadap variabel berat badan seseorang dan pengaruhnya
bersifat positif. KarenaKoefisien regresi pada tinggi badan bernilai positive yang artinya jika
semakin Tinggi Badan seseorang maka berat badan juga semakin tinggi.