Materi Ekonometrika untuk S1

Ekonometrika
Program Studi Statistika, semester Ganjil 2012/2013

Dr. Rahma Fitriani, S.Si., M.Sc

Pengujian Asumsi­asumsi di dalam Regresi 
Linier






Galat menyebar normal
Multikolinearity
Heteroskedasticity
Autocorrelation
Misspecification:





Peubah bebas yang kurang tepat
Measurement errors
Bentuk fungsional yang salah

Asumsi kenormalan


Pelanggaran, dengan kemungkinan
penyebab:
1.
2.
3.
4.



Sebaran peubah eksogen atau endogennya tidak
normal
Pelanggaran asumsi linieritas

Sebaran galat menjulur karena adanya pencilan
Ukuran sampel yang terlalu kecil

Efek pelanggaran:





Pencilan berpengaruh besar terhadap penduga
parameter (bias)
Hasil pengujian tidak sah
Selang kepercayaan terlalu lebar atau terlalu sempit

Asumsi Kenormalan


Bagaimana mendeteksinya?









Normal probability plot
Histogram dari sisaan
Chi square goodness test of fit
Anderson Darling normality test
Jarque Berra normality test

Jika dilanggar, bagaimana memperbaikinya?



Transformasi non linier pada penyebab 1 atau 2
Pada penyebab 3, pencilan harus dievaluasi penyebabnya








Murni kesalahan: pencilan dapat dibuang
Apa adanya: pencilan memberikan informasi tambahan pada hasil
analisis

Perbesar ukuran sampel untuk penyebab 4

Transformasi: sesuaikan dengan permasalahan teori ekonomi
yang ingin dianalisis


Ukuran sampel yang diperbesar dapat memperbaikinya

Multikolinieritas




Terdapat hubungan linier di antara peubah eksogen
Multikolinieritas sempurna:


Satu peubah eksogen adalah fungsi linier dari peubah
eksogen yang lain

Y 1   2 X 2   3 X 3  u
X 3 1   2 X 2

Multikolinieritas


Efek dari multikolinieritas:
Y 1   2 X 2   3 X 3  u

X 3 1   2 X 2

Y 1   2 X 2   3 1   2 X 2   u

Y  1   31     2   3 2  X 2  u
Y v1v2 X 2  u


Sampel dipakai untuk menduga koefisien v1
dan v2

Multikolinieritas


Untuk memperoleh penduga β1 dan β2 : solusi dari
persamaan berikut:

vˆ1ˆ1  ˆ31
vˆ ˆ  ˆ 
2







2

3 2

2 persamaan untuk 3 peubah
Tidak ada solusi unik bagi penduga parameter
populasi

Efek dari struktur matriks akibat satu kolom
yang merupakan fungsi linier dari kolom yang
lain:
X' X
Matriks singular



Karena determinan matriks singular = 0


X ' X 0


Tidak dapat diperoleh inverse dari X’X pada:
1
ˆ2  X ' X  X ' Y

Karena:



 X' X 

1

1

adj  X ' X 
X' X


Koefisien regresi menjadi ‘indeterminate’

Multikolinieritas tak sempurna


Terjadi jika terdapat hubungan linier yang tidak
sempurna antar peubah eksogen

X3 X 2  v


Dengan v sebagai galat acak yang tidak
sama dengan nol



Kasus ini sering terjadi pada kasus terapan
Bagaimana mengidentifikasi seberapa
serius derajat multikolinieritas yang terjadi.




Efek dari Multikolinieritas tak sempurna




Penduga OLS tetap dapat diduga
Penduga OLS tetap bersifat BLUE
Penduga OLS tetap efisien (ragam dari penduga
paling kecil dari semua penduga yang mungkin)



Akan tetapi pada nilai yang cukup besar
Relatif lebih besar jika tidak ada multikolinieritas

var ˆ    X ' X 
X' X  0


 X' X 

1

1

1

adj X ' X   
X' X

Efek dari Multikolinieritas tak sempurna


Ragam dan peragam dari penduga OLS relatif
besar



Selang kepercayaan menjadi lebih besar




Statistik uji t dari satu atau beberapa koefisien
menjadi tidak nyata




Lebih banyak menerima hipotesis nol (koefisien tidak
nyata)

Walaupun R2 secara keseluruhan besar

Tanda bagi penduga koefisien berkebalikan
dengan teori a priorinya

Struktur Ragam Peragam dengan adanya 
Multikolinieritas


Pada multiple regression:



1
var βˆ  2  X' X 



Dengan 2 peubah eksogen:

 

 var ˆ1
2
ˆ
var β  cov ˆ1 , ˆ2
 cov ˆ1 , ˆ3












cov ˆ1 , ˆ2
var ˆ



 
2

cov ˆ2 , ˆ3










cov ˆ1 , ˆ3 

ˆ
ˆ
cov  2 ,  3 
var ˆ3 

 

 

var ˆ2  2

xki  X ki  X k


x x 


 x  x 
2

2
23

r

 x  x    x
2
2i

2
3i

x



x



2 i 3i

2

2

 x22i 1  r232 

2 i 3i

2
2i

2
x
 3i

2
3i

 

var ˆ3  2

2
x
 2i

 x  x    x
2
2i

2

 x32i 1  r232 

2
3i

2 i 3i

2





cov ˆ2 , ˆ3 


 r23 2

1  r   x  x
2
23

2
2i

2
3i

Struktur Korelasi dinamakan dengan Variance Inflation
Factor (VIF)

1
VIF 
1  r232 

2

var ˆ2 
VIF
2
  x2 i 

 




2

var ˆ3 
VIF
2
 x3i 

 

Semakin besar multikolinieritas maka semakin
besar VIF
Semakin besar VIF semakin besar ragam penduga
OLS





Untuk regresi lebih dari 2 peubah definisi dari VIF:
1
VIF 
2
1  R 2j 
Rj :

Koefisien determinasi dari auxiliary
regression
Auxiliary regression: regresi dengan Xj sebagai
peubah endogen, dan X selainnya sebagai
peubah eksogen

Nilai VIF berdasarkan Koefisien Determinasi 
dari Auxiliary Regression
R 2j

VIF

0

1

0.5

2

0.8

5

0.9

10

0.95

20

0.975

40

0.99

100

0.995

200

0.999

1000




VIF yang naik seiring dengan
kenaikan koefisien determinasi
VIF yang lebih dari 10: bukti
cukup untuk multikolinieritas

Pendeteksian Multikolinieritas


Dari koefisien korelasi sederhana





Efektif untuk regresi dengan 2 peubah eksogen
Dari VIF, multikolinieritas serius jika r ≥ 0.9

Dari koefisien determinasi auxiliary regression





Efektif untuk regresi dengan 3 peubah eksogen
atau lebih
Peubah eksogen pada auxiliary regression :
peubah yang mempunyai masalah
multikolinieritas
Hasil dari auxiliary regression:



Standar error yang kecil
Statistik uji t yang nyata bagi masing-masing koefisien

Contoh:



Model regresi dengan 2 peubah eksogen,
Dua peubah eksogen tsb mempunyai korelasi tinggi:


Dari matrix korelasi berikut:
 




X2

X3

Y

X2

1

X3

0.999995

1

Y

0.857369

0.857438

Kedua X berkorelasi positif dengan Y
Antar X berkorelasi positif

1

Output dari pendugaan Model Regresi 
dengan Kedua Peubah
Model 1: OLS, using observations 1-25
Dependent variable: Y
coefficient
std. error
t-ratio
p-value
------------------------------------------------------const
35.8677
19.3872
1.850
0.0778 *
X2
-6.32650
33.7510
-0.1874
0.8530
X3
1.78976
8.43832
0.2121
0.8340
Mean dependent var
Sum squared resid
R-squared
F(2, 22)
Log-likelihood
Schwarz criterion

169.3680
39658.40
0.735622
30.60702
-127.5882
264.8331

S.D. dependent var
S.E. of regression
Adjusted R-squared
P-value(F)
Akaike criterion
Hannan-Quinn

79.05857
42.45768
0.711587
4.41e-07
261.1765
262.1907

Output model regresi dengan memakai X2 
saja
Model 2: OLS, using observations 1-25
Dependent variable: Y
coefficient
std. error
t-ratio
p-value
-------------------------------------------------------const
36.7186
18.5695
1.977
0.0601
*
X2
0.832012
0.104149
7.989
4.39e-08 ***
Mean dependent var
Sum squared resid
R-squared
F(1, 23)
Log-likelihood
Schwarz criterion

169.3680
39739.49
0.735081
63.81897
-127.6138
261.6653

S.D. dependent var
S.E. of regression
Adjusted R-squared
P-value(F)
Akaike criterion
Hannan-Quinn

79.05857
41.56686
0.723563
4.39e-08
259.2276
259.9037

Output model regresi dengan peubah X3 
saja
Model 3: OLS, using observations 1-25
Dependent variable: Y
coefficient
std. error
t-ratio
p-value
-------------------------------------------------------const
36.6097
18.5764
1.971
0.0609
*
X3
0.208034
0.0260332
7.991
4.37e-08 ***
Mean dependent var
Sum squared resid
R-squared
F(1, 23)
Log-likelihood
Schwarz criterion

169.3680
39721.74
0.735199
63.85778
-127.6082
261.6541

S.D. dependent var
S.E. of regression
Adjusted R-squared
P-value(F)
Akaike criterion
Hannan-Quinn

79.05857
41.55758
0.723686
4.37e-08
259.2164
259.8925

Output dari auxiliary regression


Regresi X2 terhadap X3

Model 4: OLS, using observations 1-25
Dependent variable: X2
coefficient
std. error
t-ratio
p-value
----------------------------------------------------------const
-0.117288
0.117251
-1.000
0.3276
X3
0.250016
0.000164318
1522
4.83e-059 ***
Mean dependent var
Sum squared resid
R-squared
F(1, 23)
Log-likelihood
Schwarz criterion

159.4320
1.582488
0.999990
2315090
-0.974992
8.387736

S.D. dependent var
S.E. of regression
Adjusted R-squared
P-value(F)
Akaike criterion
Hannan-Quinn

81.46795
0.262305
0.999990
4.83e-59
5.949985
6.626113

Bagaimana mengatasinya?


Do nothing



Rule of Thumb Procedure






A priori information
Combining cross sectional and time series data
Dropping a variable(s) and specification bias
Transformation of variables
Additional or new data

Do Nothing




Multikolinieritas adalah masalah akibat
ketidaksempurnaan data
Untuk data ekonomi: tidak dapat dikontrol dan
tidak ada pilihan
Penduga secara keseluruhan tetap dapat
dipakai walaupun penduga secara individu
relatif kurang efisien dan tidak signifikan

A priori information


Informasi dari penelitian sebelumnya mengenai
hubungan fungsional antar parameter peubah yang
berkorelasi

Y 1   2 X 2   3 X 3  u


Dengan X2 yang berkorelasi tinggi dengan X3
Misal:



X2: pendapatan, X3: Kekayaan, Y: konsumsi



Diketahui dari penelitian sebelumnya bahwa
perubahan kekayaan terhadap perubahan konsumsi
adalah 1/10 perubahan pendapatan terhadap
perubahan konsumsi



 3 0.1 2

Y 1   2 X 2   3 X 3  u

 3 0.1 2

Y 1   2 X 2  0.1 2 X 3  u
Y 1   2 X  u




X  X 2  0.1X 3 *

Lakukan transformasi terhadap kedua peubah eksogen
dengan hubungan sesuai (*)
Lakukan pendugaan menggunakan peubah yang sudah
ditransformasi

Menggabungkan data cross section dan 
time series






Misalkan:
Y : jumlah penjualan mobil
P : rata-rata harga mobil
I : pendapatan
Pada data time series, P dan I cenderung berkorelasi

ln Yt 1   2 ln Pt   3 ln I t  ut




β2: adalah elastisitas harga terhadap jumlah
penjualan mobil
β3: adalah elastisitas pendapatan terhadap
jumlah penjualan mobil



Jika terdapat data cross section (pada satu waktu)
yang dapat dipakai untuk menduga koefisien
elastisitas pedapatan β3




Dengan asumsi bahwa pada satu waktu harga tidak
terlalu bervariasi

Gunakan penduga bagi β3 untuk melakukan
transformasi terhadap Y

ln Yt 1   2 ln Pt  ˆ3 ln I t  ut
ln Yt  ˆ3 ln I t 1   2 ln Pt  ut
Yt* 1   2 ln Pt  ut

Dropping a variable(s) and specification 
bias



Membuang salah satu dari peubah yang
berkorelasi
Masalah:






Jika semua peubah secara ekonomi harus ada di dalam
model: specification bias
Jika pendapatan dan kekayaan memang harus ada di
dalam model konsumsi

Tujuan perbaikan multikolinieritas dapat
memunculkan masalah baru: specification bias
Tetap gunakan dua-duanya

Transformation of variables


Contoh pada data time series pada



X2: pendapatan, X3: Kekayaan, Y: konsumsi



Dengan X2 yang berkorelasi tinggi dengan X3 seiring
dengan waktu
Pada waktu t berlaku:



Yt 1   2 X 2 t   3 X 3t  ut


Model yang sama dapat berlaku pada waktu t-1

Yt  1 1   2 X 2,t  1   3 X 3,t  1  ut  1



Untuk meminimumkan multikolinieritas, dilakukan
pembedaan dari model di waktu t dan waktu t-1


First difference form

Yt  Yt  1  2  X 2 t  X 2 t  1    3  X 3t  X 3t  1    ut  ut  1 
Yt  2 X 2 t   3X 3t  vt


Regresi dilakukan pada masing-masing peubah
yang sudah dibedakan


Korelasi di antara peubah beda (∆X2 dan ∆ X3) tidak
sebesar korelasi dari peubah aslinya

Additional or new data



Jika multikolinieritas terjadi akibat
pengambilan sampel
Penambahan ukuran sampel dapat
mengurangi efek dari multikolinieritas
Ragam lebih kecil/lebih
2
 efisien

   x 1  r 


var ˆ2 

Sampel bertambah akan
memperbesar nilai
komponen ini

2
2i

2
23

Komponen ini diasumsikan
tetap