Materi Ekonometrika untuk S1
Ekonometrika
Program Studi Statistika, semester Ganjil 2012/2013
Dr. Rahma Fitriani, S.Si., M.Sc
Pengujian Asumsiasumsi di dalam Regresi
Linier
Galat menyebar normal
Multikolinearity
Heteroskedasticity
Autocorrelation
Misspecification:
Peubah bebas yang kurang tepat
Measurement errors
Bentuk fungsional yang salah
Asumsi kenormalan
Pelanggaran, dengan kemungkinan
penyebab:
1.
2.
3.
4.
Sebaran peubah eksogen atau endogennya tidak
normal
Pelanggaran asumsi linieritas
Sebaran galat menjulur karena adanya pencilan
Ukuran sampel yang terlalu kecil
Efek pelanggaran:
Pencilan berpengaruh besar terhadap penduga
parameter (bias)
Hasil pengujian tidak sah
Selang kepercayaan terlalu lebar atau terlalu sempit
Asumsi Kenormalan
Bagaimana mendeteksinya?
Normal probability plot
Histogram dari sisaan
Chi square goodness test of fit
Anderson Darling normality test
Jarque Berra normality test
Jika dilanggar, bagaimana memperbaikinya?
Transformasi non linier pada penyebab 1 atau 2
Pada penyebab 3, pencilan harus dievaluasi penyebabnya
Murni kesalahan: pencilan dapat dibuang
Apa adanya: pencilan memberikan informasi tambahan pada hasil
analisis
Perbesar ukuran sampel untuk penyebab 4
Transformasi: sesuaikan dengan permasalahan teori ekonomi
yang ingin dianalisis
Ukuran sampel yang diperbesar dapat memperbaikinya
Multikolinieritas
Terdapat hubungan linier di antara peubah eksogen
Multikolinieritas sempurna:
Satu peubah eksogen adalah fungsi linier dari peubah
eksogen yang lain
Y 1 2 X 2 3 X 3 u
X 3 1 2 X 2
Multikolinieritas
Efek dari multikolinieritas:
Y 1 2 X 2 3 X 3 u
X 3 1 2 X 2
Y 1 2 X 2 3 1 2 X 2 u
Y 1 31 2 3 2 X 2 u
Y v1v2 X 2 u
Sampel dipakai untuk menduga koefisien v1
dan v2
Multikolinieritas
Untuk memperoleh penduga β1 dan β2 : solusi dari
persamaan berikut:
vˆ1ˆ1 ˆ31
vˆ ˆ ˆ
2
2
3 2
2 persamaan untuk 3 peubah
Tidak ada solusi unik bagi penduga parameter
populasi
Efek dari struktur matriks akibat satu kolom
yang merupakan fungsi linier dari kolom yang
lain:
X' X
Matriks singular
Karena determinan matriks singular = 0
X ' X 0
Tidak dapat diperoleh inverse dari X’X pada:
1
ˆ2 X ' X X ' Y
Karena:
X' X
1
1
adj X ' X
X' X
Koefisien regresi menjadi ‘indeterminate’
Multikolinieritas tak sempurna
Terjadi jika terdapat hubungan linier yang tidak
sempurna antar peubah eksogen
X3 X 2 v
Dengan v sebagai galat acak yang tidak
sama dengan nol
Kasus ini sering terjadi pada kasus terapan
Bagaimana mengidentifikasi seberapa
serius derajat multikolinieritas yang terjadi.
Efek dari Multikolinieritas tak sempurna
Penduga OLS tetap dapat diduga
Penduga OLS tetap bersifat BLUE
Penduga OLS tetap efisien (ragam dari penduga
paling kecil dari semua penduga yang mungkin)
Akan tetapi pada nilai yang cukup besar
Relatif lebih besar jika tidak ada multikolinieritas
var ˆ X ' X
X' X 0
X' X
1
1
1
adj X ' X
X' X
Efek dari Multikolinieritas tak sempurna
Ragam dan peragam dari penduga OLS relatif
besar
Selang kepercayaan menjadi lebih besar
Statistik uji t dari satu atau beberapa koefisien
menjadi tidak nyata
Lebih banyak menerima hipotesis nol (koefisien tidak
nyata)
Walaupun R2 secara keseluruhan besar
Tanda bagi penduga koefisien berkebalikan
dengan teori a priorinya
Struktur Ragam Peragam dengan adanya
Multikolinieritas
Pada multiple regression:
1
var βˆ 2 X' X
Dengan 2 peubah eksogen:
var ˆ1
2
ˆ
var β cov ˆ1 , ˆ2
cov ˆ1 , ˆ3
cov ˆ1 , ˆ2
var ˆ
2
cov ˆ2 , ˆ3
cov ˆ1 , ˆ3
ˆ
ˆ
cov 2 , 3
var ˆ3
var ˆ2 2
xki X ki X k
x x
x x
2
2
23
r
x x x
2
2i
2
3i
x
x
2 i 3i
2
2
x22i 1 r232
2 i 3i
2
2i
2
x
3i
2
3i
var ˆ3 2
2
x
2i
x x x
2
2i
2
x32i 1 r232
2
3i
2 i 3i
2
cov ˆ2 , ˆ3
r23 2
1 r x x
2
23
2
2i
2
3i
Struktur Korelasi dinamakan dengan Variance Inflation
Factor (VIF)
1
VIF
1 r232
2
var ˆ2
VIF
2
x2 i
2
var ˆ3
VIF
2
x3i
Semakin besar multikolinieritas maka semakin
besar VIF
Semakin besar VIF semakin besar ragam penduga
OLS
Untuk regresi lebih dari 2 peubah definisi dari VIF:
1
VIF
2
1 R 2j
Rj :
Koefisien determinasi dari auxiliary
regression
Auxiliary regression: regresi dengan Xj sebagai
peubah endogen, dan X selainnya sebagai
peubah eksogen
Nilai VIF berdasarkan Koefisien Determinasi
dari Auxiliary Regression
R 2j
VIF
0
1
0.5
2
0.8
5
0.9
10
0.95
20
0.975
40
0.99
100
0.995
200
0.999
1000
VIF yang naik seiring dengan
kenaikan koefisien determinasi
VIF yang lebih dari 10: bukti
cukup untuk multikolinieritas
Pendeteksian Multikolinieritas
Dari koefisien korelasi sederhana
Efektif untuk regresi dengan 2 peubah eksogen
Dari VIF, multikolinieritas serius jika r ≥ 0.9
Dari koefisien determinasi auxiliary regression
Efektif untuk regresi dengan 3 peubah eksogen
atau lebih
Peubah eksogen pada auxiliary regression :
peubah yang mempunyai masalah
multikolinieritas
Hasil dari auxiliary regression:
Standar error yang kecil
Statistik uji t yang nyata bagi masing-masing koefisien
Contoh:
Model regresi dengan 2 peubah eksogen,
Dua peubah eksogen tsb mempunyai korelasi tinggi:
Dari matrix korelasi berikut:
X2
X3
Y
X2
1
X3
0.999995
1
Y
0.857369
0.857438
Kedua X berkorelasi positif dengan Y
Antar X berkorelasi positif
1
Output dari pendugaan Model Regresi
dengan Kedua Peubah
Model 1: OLS, using observations 1-25
Dependent variable: Y
coefficient
std. error
t-ratio
p-value
------------------------------------------------------const
35.8677
19.3872
1.850
0.0778 *
X2
-6.32650
33.7510
-0.1874
0.8530
X3
1.78976
8.43832
0.2121
0.8340
Mean dependent var
Sum squared resid
R-squared
F(2, 22)
Log-likelihood
Schwarz criterion
169.3680
39658.40
0.735622
30.60702
-127.5882
264.8331
S.D. dependent var
S.E. of regression
Adjusted R-squared
P-value(F)
Akaike criterion
Hannan-Quinn
79.05857
42.45768
0.711587
4.41e-07
261.1765
262.1907
Output model regresi dengan memakai X2
saja
Model 2: OLS, using observations 1-25
Dependent variable: Y
coefficient
std. error
t-ratio
p-value
-------------------------------------------------------const
36.7186
18.5695
1.977
0.0601
*
X2
0.832012
0.104149
7.989
4.39e-08 ***
Mean dependent var
Sum squared resid
R-squared
F(1, 23)
Log-likelihood
Schwarz criterion
169.3680
39739.49
0.735081
63.81897
-127.6138
261.6653
S.D. dependent var
S.E. of regression
Adjusted R-squared
P-value(F)
Akaike criterion
Hannan-Quinn
79.05857
41.56686
0.723563
4.39e-08
259.2276
259.9037
Output model regresi dengan peubah X3
saja
Model 3: OLS, using observations 1-25
Dependent variable: Y
coefficient
std. error
t-ratio
p-value
-------------------------------------------------------const
36.6097
18.5764
1.971
0.0609
*
X3
0.208034
0.0260332
7.991
4.37e-08 ***
Mean dependent var
Sum squared resid
R-squared
F(1, 23)
Log-likelihood
Schwarz criterion
169.3680
39721.74
0.735199
63.85778
-127.6082
261.6541
S.D. dependent var
S.E. of regression
Adjusted R-squared
P-value(F)
Akaike criterion
Hannan-Quinn
79.05857
41.55758
0.723686
4.37e-08
259.2164
259.8925
Output dari auxiliary regression
Regresi X2 terhadap X3
Model 4: OLS, using observations 1-25
Dependent variable: X2
coefficient
std. error
t-ratio
p-value
----------------------------------------------------------const
-0.117288
0.117251
-1.000
0.3276
X3
0.250016
0.000164318
1522
4.83e-059 ***
Mean dependent var
Sum squared resid
R-squared
F(1, 23)
Log-likelihood
Schwarz criterion
159.4320
1.582488
0.999990
2315090
-0.974992
8.387736
S.D. dependent var
S.E. of regression
Adjusted R-squared
P-value(F)
Akaike criterion
Hannan-Quinn
81.46795
0.262305
0.999990
4.83e-59
5.949985
6.626113
Bagaimana mengatasinya?
Do nothing
Rule of Thumb Procedure
A priori information
Combining cross sectional and time series data
Dropping a variable(s) and specification bias
Transformation of variables
Additional or new data
Do Nothing
Multikolinieritas adalah masalah akibat
ketidaksempurnaan data
Untuk data ekonomi: tidak dapat dikontrol dan
tidak ada pilihan
Penduga secara keseluruhan tetap dapat
dipakai walaupun penduga secara individu
relatif kurang efisien dan tidak signifikan
A priori information
Informasi dari penelitian sebelumnya mengenai
hubungan fungsional antar parameter peubah yang
berkorelasi
Y 1 2 X 2 3 X 3 u
Dengan X2 yang berkorelasi tinggi dengan X3
Misal:
X2: pendapatan, X3: Kekayaan, Y: konsumsi
Diketahui dari penelitian sebelumnya bahwa
perubahan kekayaan terhadap perubahan konsumsi
adalah 1/10 perubahan pendapatan terhadap
perubahan konsumsi
3 0.1 2
Y 1 2 X 2 3 X 3 u
3 0.1 2
Y 1 2 X 2 0.1 2 X 3 u
Y 1 2 X u
X X 2 0.1X 3 *
Lakukan transformasi terhadap kedua peubah eksogen
dengan hubungan sesuai (*)
Lakukan pendugaan menggunakan peubah yang sudah
ditransformasi
Menggabungkan data cross section dan
time series
Misalkan:
Y : jumlah penjualan mobil
P : rata-rata harga mobil
I : pendapatan
Pada data time series, P dan I cenderung berkorelasi
ln Yt 1 2 ln Pt 3 ln I t ut
β2: adalah elastisitas harga terhadap jumlah
penjualan mobil
β3: adalah elastisitas pendapatan terhadap
jumlah penjualan mobil
Jika terdapat data cross section (pada satu waktu)
yang dapat dipakai untuk menduga koefisien
elastisitas pedapatan β3
Dengan asumsi bahwa pada satu waktu harga tidak
terlalu bervariasi
Gunakan penduga bagi β3 untuk melakukan
transformasi terhadap Y
ln Yt 1 2 ln Pt ˆ3 ln I t ut
ln Yt ˆ3 ln I t 1 2 ln Pt ut
Yt* 1 2 ln Pt ut
Dropping a variable(s) and specification
bias
Membuang salah satu dari peubah yang
berkorelasi
Masalah:
Jika semua peubah secara ekonomi harus ada di dalam
model: specification bias
Jika pendapatan dan kekayaan memang harus ada di
dalam model konsumsi
Tujuan perbaikan multikolinieritas dapat
memunculkan masalah baru: specification bias
Tetap gunakan dua-duanya
Transformation of variables
Contoh pada data time series pada
X2: pendapatan, X3: Kekayaan, Y: konsumsi
Dengan X2 yang berkorelasi tinggi dengan X3 seiring
dengan waktu
Pada waktu t berlaku:
Yt 1 2 X 2 t 3 X 3t ut
Model yang sama dapat berlaku pada waktu t-1
Yt 1 1 2 X 2,t 1 3 X 3,t 1 ut 1
Untuk meminimumkan multikolinieritas, dilakukan
pembedaan dari model di waktu t dan waktu t-1
First difference form
Yt Yt 1 2 X 2 t X 2 t 1 3 X 3t X 3t 1 ut ut 1
Yt 2 X 2 t 3X 3t vt
Regresi dilakukan pada masing-masing peubah
yang sudah dibedakan
Korelasi di antara peubah beda (∆X2 dan ∆ X3) tidak
sebesar korelasi dari peubah aslinya
Additional or new data
Jika multikolinieritas terjadi akibat
pengambilan sampel
Penambahan ukuran sampel dapat
mengurangi efek dari multikolinieritas
Ragam lebih kecil/lebih
2
efisien
x 1 r
var ˆ2
Sampel bertambah akan
memperbesar nilai
komponen ini
2
2i
2
23
Komponen ini diasumsikan
tetap
Program Studi Statistika, semester Ganjil 2012/2013
Dr. Rahma Fitriani, S.Si., M.Sc
Pengujian Asumsiasumsi di dalam Regresi
Linier
Galat menyebar normal
Multikolinearity
Heteroskedasticity
Autocorrelation
Misspecification:
Peubah bebas yang kurang tepat
Measurement errors
Bentuk fungsional yang salah
Asumsi kenormalan
Pelanggaran, dengan kemungkinan
penyebab:
1.
2.
3.
4.
Sebaran peubah eksogen atau endogennya tidak
normal
Pelanggaran asumsi linieritas
Sebaran galat menjulur karena adanya pencilan
Ukuran sampel yang terlalu kecil
Efek pelanggaran:
Pencilan berpengaruh besar terhadap penduga
parameter (bias)
Hasil pengujian tidak sah
Selang kepercayaan terlalu lebar atau terlalu sempit
Asumsi Kenormalan
Bagaimana mendeteksinya?
Normal probability plot
Histogram dari sisaan
Chi square goodness test of fit
Anderson Darling normality test
Jarque Berra normality test
Jika dilanggar, bagaimana memperbaikinya?
Transformasi non linier pada penyebab 1 atau 2
Pada penyebab 3, pencilan harus dievaluasi penyebabnya
Murni kesalahan: pencilan dapat dibuang
Apa adanya: pencilan memberikan informasi tambahan pada hasil
analisis
Perbesar ukuran sampel untuk penyebab 4
Transformasi: sesuaikan dengan permasalahan teori ekonomi
yang ingin dianalisis
Ukuran sampel yang diperbesar dapat memperbaikinya
Multikolinieritas
Terdapat hubungan linier di antara peubah eksogen
Multikolinieritas sempurna:
Satu peubah eksogen adalah fungsi linier dari peubah
eksogen yang lain
Y 1 2 X 2 3 X 3 u
X 3 1 2 X 2
Multikolinieritas
Efek dari multikolinieritas:
Y 1 2 X 2 3 X 3 u
X 3 1 2 X 2
Y 1 2 X 2 3 1 2 X 2 u
Y 1 31 2 3 2 X 2 u
Y v1v2 X 2 u
Sampel dipakai untuk menduga koefisien v1
dan v2
Multikolinieritas
Untuk memperoleh penduga β1 dan β2 : solusi dari
persamaan berikut:
vˆ1ˆ1 ˆ31
vˆ ˆ ˆ
2
2
3 2
2 persamaan untuk 3 peubah
Tidak ada solusi unik bagi penduga parameter
populasi
Efek dari struktur matriks akibat satu kolom
yang merupakan fungsi linier dari kolom yang
lain:
X' X
Matriks singular
Karena determinan matriks singular = 0
X ' X 0
Tidak dapat diperoleh inverse dari X’X pada:
1
ˆ2 X ' X X ' Y
Karena:
X' X
1
1
adj X ' X
X' X
Koefisien regresi menjadi ‘indeterminate’
Multikolinieritas tak sempurna
Terjadi jika terdapat hubungan linier yang tidak
sempurna antar peubah eksogen
X3 X 2 v
Dengan v sebagai galat acak yang tidak
sama dengan nol
Kasus ini sering terjadi pada kasus terapan
Bagaimana mengidentifikasi seberapa
serius derajat multikolinieritas yang terjadi.
Efek dari Multikolinieritas tak sempurna
Penduga OLS tetap dapat diduga
Penduga OLS tetap bersifat BLUE
Penduga OLS tetap efisien (ragam dari penduga
paling kecil dari semua penduga yang mungkin)
Akan tetapi pada nilai yang cukup besar
Relatif lebih besar jika tidak ada multikolinieritas
var ˆ X ' X
X' X 0
X' X
1
1
1
adj X ' X
X' X
Efek dari Multikolinieritas tak sempurna
Ragam dan peragam dari penduga OLS relatif
besar
Selang kepercayaan menjadi lebih besar
Statistik uji t dari satu atau beberapa koefisien
menjadi tidak nyata
Lebih banyak menerima hipotesis nol (koefisien tidak
nyata)
Walaupun R2 secara keseluruhan besar
Tanda bagi penduga koefisien berkebalikan
dengan teori a priorinya
Struktur Ragam Peragam dengan adanya
Multikolinieritas
Pada multiple regression:
1
var βˆ 2 X' X
Dengan 2 peubah eksogen:
var ˆ1
2
ˆ
var β cov ˆ1 , ˆ2
cov ˆ1 , ˆ3
cov ˆ1 , ˆ2
var ˆ
2
cov ˆ2 , ˆ3
cov ˆ1 , ˆ3
ˆ
ˆ
cov 2 , 3
var ˆ3
var ˆ2 2
xki X ki X k
x x
x x
2
2
23
r
x x x
2
2i
2
3i
x
x
2 i 3i
2
2
x22i 1 r232
2 i 3i
2
2i
2
x
3i
2
3i
var ˆ3 2
2
x
2i
x x x
2
2i
2
x32i 1 r232
2
3i
2 i 3i
2
cov ˆ2 , ˆ3
r23 2
1 r x x
2
23
2
2i
2
3i
Struktur Korelasi dinamakan dengan Variance Inflation
Factor (VIF)
1
VIF
1 r232
2
var ˆ2
VIF
2
x2 i
2
var ˆ3
VIF
2
x3i
Semakin besar multikolinieritas maka semakin
besar VIF
Semakin besar VIF semakin besar ragam penduga
OLS
Untuk regresi lebih dari 2 peubah definisi dari VIF:
1
VIF
2
1 R 2j
Rj :
Koefisien determinasi dari auxiliary
regression
Auxiliary regression: regresi dengan Xj sebagai
peubah endogen, dan X selainnya sebagai
peubah eksogen
Nilai VIF berdasarkan Koefisien Determinasi
dari Auxiliary Regression
R 2j
VIF
0
1
0.5
2
0.8
5
0.9
10
0.95
20
0.975
40
0.99
100
0.995
200
0.999
1000
VIF yang naik seiring dengan
kenaikan koefisien determinasi
VIF yang lebih dari 10: bukti
cukup untuk multikolinieritas
Pendeteksian Multikolinieritas
Dari koefisien korelasi sederhana
Efektif untuk regresi dengan 2 peubah eksogen
Dari VIF, multikolinieritas serius jika r ≥ 0.9
Dari koefisien determinasi auxiliary regression
Efektif untuk regresi dengan 3 peubah eksogen
atau lebih
Peubah eksogen pada auxiliary regression :
peubah yang mempunyai masalah
multikolinieritas
Hasil dari auxiliary regression:
Standar error yang kecil
Statistik uji t yang nyata bagi masing-masing koefisien
Contoh:
Model regresi dengan 2 peubah eksogen,
Dua peubah eksogen tsb mempunyai korelasi tinggi:
Dari matrix korelasi berikut:
X2
X3
Y
X2
1
X3
0.999995
1
Y
0.857369
0.857438
Kedua X berkorelasi positif dengan Y
Antar X berkorelasi positif
1
Output dari pendugaan Model Regresi
dengan Kedua Peubah
Model 1: OLS, using observations 1-25
Dependent variable: Y
coefficient
std. error
t-ratio
p-value
------------------------------------------------------const
35.8677
19.3872
1.850
0.0778 *
X2
-6.32650
33.7510
-0.1874
0.8530
X3
1.78976
8.43832
0.2121
0.8340
Mean dependent var
Sum squared resid
R-squared
F(2, 22)
Log-likelihood
Schwarz criterion
169.3680
39658.40
0.735622
30.60702
-127.5882
264.8331
S.D. dependent var
S.E. of regression
Adjusted R-squared
P-value(F)
Akaike criterion
Hannan-Quinn
79.05857
42.45768
0.711587
4.41e-07
261.1765
262.1907
Output model regresi dengan memakai X2
saja
Model 2: OLS, using observations 1-25
Dependent variable: Y
coefficient
std. error
t-ratio
p-value
-------------------------------------------------------const
36.7186
18.5695
1.977
0.0601
*
X2
0.832012
0.104149
7.989
4.39e-08 ***
Mean dependent var
Sum squared resid
R-squared
F(1, 23)
Log-likelihood
Schwarz criterion
169.3680
39739.49
0.735081
63.81897
-127.6138
261.6653
S.D. dependent var
S.E. of regression
Adjusted R-squared
P-value(F)
Akaike criterion
Hannan-Quinn
79.05857
41.56686
0.723563
4.39e-08
259.2276
259.9037
Output model regresi dengan peubah X3
saja
Model 3: OLS, using observations 1-25
Dependent variable: Y
coefficient
std. error
t-ratio
p-value
-------------------------------------------------------const
36.6097
18.5764
1.971
0.0609
*
X3
0.208034
0.0260332
7.991
4.37e-08 ***
Mean dependent var
Sum squared resid
R-squared
F(1, 23)
Log-likelihood
Schwarz criterion
169.3680
39721.74
0.735199
63.85778
-127.6082
261.6541
S.D. dependent var
S.E. of regression
Adjusted R-squared
P-value(F)
Akaike criterion
Hannan-Quinn
79.05857
41.55758
0.723686
4.37e-08
259.2164
259.8925
Output dari auxiliary regression
Regresi X2 terhadap X3
Model 4: OLS, using observations 1-25
Dependent variable: X2
coefficient
std. error
t-ratio
p-value
----------------------------------------------------------const
-0.117288
0.117251
-1.000
0.3276
X3
0.250016
0.000164318
1522
4.83e-059 ***
Mean dependent var
Sum squared resid
R-squared
F(1, 23)
Log-likelihood
Schwarz criterion
159.4320
1.582488
0.999990
2315090
-0.974992
8.387736
S.D. dependent var
S.E. of regression
Adjusted R-squared
P-value(F)
Akaike criterion
Hannan-Quinn
81.46795
0.262305
0.999990
4.83e-59
5.949985
6.626113
Bagaimana mengatasinya?
Do nothing
Rule of Thumb Procedure
A priori information
Combining cross sectional and time series data
Dropping a variable(s) and specification bias
Transformation of variables
Additional or new data
Do Nothing
Multikolinieritas adalah masalah akibat
ketidaksempurnaan data
Untuk data ekonomi: tidak dapat dikontrol dan
tidak ada pilihan
Penduga secara keseluruhan tetap dapat
dipakai walaupun penduga secara individu
relatif kurang efisien dan tidak signifikan
A priori information
Informasi dari penelitian sebelumnya mengenai
hubungan fungsional antar parameter peubah yang
berkorelasi
Y 1 2 X 2 3 X 3 u
Dengan X2 yang berkorelasi tinggi dengan X3
Misal:
X2: pendapatan, X3: Kekayaan, Y: konsumsi
Diketahui dari penelitian sebelumnya bahwa
perubahan kekayaan terhadap perubahan konsumsi
adalah 1/10 perubahan pendapatan terhadap
perubahan konsumsi
3 0.1 2
Y 1 2 X 2 3 X 3 u
3 0.1 2
Y 1 2 X 2 0.1 2 X 3 u
Y 1 2 X u
X X 2 0.1X 3 *
Lakukan transformasi terhadap kedua peubah eksogen
dengan hubungan sesuai (*)
Lakukan pendugaan menggunakan peubah yang sudah
ditransformasi
Menggabungkan data cross section dan
time series
Misalkan:
Y : jumlah penjualan mobil
P : rata-rata harga mobil
I : pendapatan
Pada data time series, P dan I cenderung berkorelasi
ln Yt 1 2 ln Pt 3 ln I t ut
β2: adalah elastisitas harga terhadap jumlah
penjualan mobil
β3: adalah elastisitas pendapatan terhadap
jumlah penjualan mobil
Jika terdapat data cross section (pada satu waktu)
yang dapat dipakai untuk menduga koefisien
elastisitas pedapatan β3
Dengan asumsi bahwa pada satu waktu harga tidak
terlalu bervariasi
Gunakan penduga bagi β3 untuk melakukan
transformasi terhadap Y
ln Yt 1 2 ln Pt ˆ3 ln I t ut
ln Yt ˆ3 ln I t 1 2 ln Pt ut
Yt* 1 2 ln Pt ut
Dropping a variable(s) and specification
bias
Membuang salah satu dari peubah yang
berkorelasi
Masalah:
Jika semua peubah secara ekonomi harus ada di dalam
model: specification bias
Jika pendapatan dan kekayaan memang harus ada di
dalam model konsumsi
Tujuan perbaikan multikolinieritas dapat
memunculkan masalah baru: specification bias
Tetap gunakan dua-duanya
Transformation of variables
Contoh pada data time series pada
X2: pendapatan, X3: Kekayaan, Y: konsumsi
Dengan X2 yang berkorelasi tinggi dengan X3 seiring
dengan waktu
Pada waktu t berlaku:
Yt 1 2 X 2 t 3 X 3t ut
Model yang sama dapat berlaku pada waktu t-1
Yt 1 1 2 X 2,t 1 3 X 3,t 1 ut 1
Untuk meminimumkan multikolinieritas, dilakukan
pembedaan dari model di waktu t dan waktu t-1
First difference form
Yt Yt 1 2 X 2 t X 2 t 1 3 X 3t X 3t 1 ut ut 1
Yt 2 X 2 t 3X 3t vt
Regresi dilakukan pada masing-masing peubah
yang sudah dibedakan
Korelasi di antara peubah beda (∆X2 dan ∆ X3) tidak
sebesar korelasi dari peubah aslinya
Additional or new data
Jika multikolinieritas terjadi akibat
pengambilan sampel
Penambahan ukuran sampel dapat
mengurangi efek dari multikolinieritas
Ragam lebih kecil/lebih
2
efisien
x 1 r
var ˆ2
Sampel bertambah akan
memperbesar nilai
komponen ini
2
2i
2
23
Komponen ini diasumsikan
tetap