Pelatihan Komputasi dengan Stata

Pelatihan Komputasi dengan Stata
Modul B - Analisis Regresi (OLS)
Benedict J. Yappy1

Jazman Ihsanuddin

Departemen Ilmu Ekonomi
Universitas Indonesia
1

1

yappy.benedict@gmail.com – penyusun.‡

Pendahuluan

Dokumen ini adalah bahan yang digunakan dalam pelatihan “Modul B - Analisis
Regresi (OLS) ”. Modul ini mencakup deskripsi ringkas fungsi yang akan digunakan
dalam software, perintah yang digunakan, serta contoh hasil yang diperoleh (bilamana perlu). Dalam paragraf uraian, perintah/command Stata dapat dikenali
dengan format ini, dengan ringkasan perintah baru ditulis di sebelah kanan dan
bagian perintah yang diubah sesuai penggunaan dicetak miring. Contoh output

Stata dapat dikenali seperti startscreen Stata berikut:

Bagi pengguna, perintah help berguna untuk melihat bagaimana suatu command digunakan, dan opsi perintah apa saja yang tersedia, terutama bila fungsi
yang ingin digunakan sudah diketahui. Caranya adalah mengetik help command
(yep, it includes help help!). Informasi lebih lengkap terkait perintah yang
diperkenalkan dalam modul dapat diakses dengan perintah ini.
Modul ini mencakup seluruh silabus pelatihan yang hendak disampaikan. Dengan kata lain, pembaca dapat menguasai materi yang disampaikan dalam pelatihan dengan membaca dan mereplikasi langkah yang ada dalam modul ini. Pembaca
dipersilahkan mengakses materi di http://benconomy.wordpress.com/tutoring,
tanpa mengubah isinya.


Powered by LATEX 2ε with XƎLATEX using TEXstudio and Stata.

1

help

Daftar Isi

Daftar Isi

1 Pendahuluan

1

2 Review
2.1 Metode OLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Asumsi OLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Pengujian Hipotesis . . . . . . . . . . . . . . . . . . . . . . . . . . .

3
3
5
6

3 Regresi OLS dengan Stata

7

4 Penanganan Pelanggaran Asumsi
4.1 Heteroskedasitas . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4.2 Autokorelasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Multikolinearitas . . . . . . . . . . . . . . . . . . . . . . . . . . . .

8
8
9
10

5 Instrumental Variables

11

6 Specification Test

12

7 Setelah estimasi…
7.1 Perintah predict . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Perintah estimates . . . . . . . . . . . . . . . . . . . . . . . . . .


13
13
13

benconomy.wordpress.com

2

2 Review

2

Review

2.1 Metode OLS
Metode regresi OLS (Ordinary Least Squares) adalah salah satu pendekatan untuk
melakukan estimasi parameter yang menentukan nilai variabel independen. OLS
termasuk keluarga estimasi “method of moments”, di mana salah satu ‘momen’ dari
sampel digunakan untuk mengestimasi parameter populasi. Metode regresi dimulai
dari mengspesifikasikan fungsi regresi populasi;


dengan asumsi

yi = β0 + β1 xi + εi

(1)

E(ε) = E (y − β0 − β1 x) = 0

(2)

dan asumsi yang mengikutinya;
Cov(x, ε) = E(xε) = E [x (y − β0 − β1 x)] = 0

(3)

Dalam pendekatan method of moments, kita menggunakan nilai (rata-rata)
sampel untuk mengestimasi nilai populasi, sehingga persamaan (2) dan (3) menjadi:
n−1


n


(yi − β0 − β1 xi ) = 0

(4)

[xi (yi − β0 − β1 xi )] = 0

(5)

i=1

dan
n−1

n

i=1



Dengan menggunakan sifat operator
dan memindahkan ruas, persamaan (4)
dapat ditulis ulang menjadi:
βˆ0 = y¯ − βˆ1 x¯
(6)
Dengan memindahkan (6) ke persamaan (5) dan menghilangkan n−1 yang tidak
mempengaruhi hasilnya, kita dapat memperoleh:
n

−1

n [
)]
(
(
)

xi yi − y¯ − βˆ1 x¯ + β1 xi = 0


(7)

i=1

Atur ulang persamaan tersebut, kita memperoleh:
n

i=1

benconomy.wordpress.com

xi (y − y¯) = βˆ1

n


xi (xi − x¯)

i=1


3

2 Review
Dengan menyusun ulang* ;

βˆ1 =

n


i=1
n


n


xi (yi − y¯)
=
xi (xi − x¯)


i=1

(xi − x¯) (yi − y¯)

i=1

n


=
(xi − x¯)

2

Cov(x, y)
Var(x)

(8)


i=1

Dalam kasus multivariabel, maka lebih dari satu variabel independen masuk
dalam persamaan (1):
yi = β0 + β1 x1i + β2 x2i + · · · + βj xji + εi
Persamaan di atas dapat ditulis dalam bentuk matriks:
  
  
ε1
β0 (1) β1 x11 β2 x12 . . . βj x1j
y1
 y2  β0 (1) β1 x21 β2 x22 . . . βj x2j   ε2 
  
  
+ . 
 ..  =  ..
.
..
..
.
..
.. 
  .. 
.  .
.
.
εn
β0 (1) β1 xn1 β2 xn2 . . . βj xnj
yn
y = Xβ + ε

(9)

Vektor parameter β yang diestimasi adalah vektor yang akan meminimumkan
jumlah kuadrat error ε′ ε. Berikut vektor vektor parameter sampel b yang meminimumkan error kuadrat sampel e′ e:
Min e′ e = (y − Xb)′ (y − Xb)
= y′ y − b′ X′ y − y′ Xb + b′ X′ Xb
= y′ y − 2y′ Xb + b′ X′ Xb

(10)

Keadaan yang meminimumkan error† adalah:
∂e′ e
= −2X′ y + 2X′ Xb = 0
∂b
2X′ y = 2X′ Xb
b = (X′ X) (X′ y)
−1

(11)

*

Penurunan yang diuraikan di sini mengikuti method of moments.
Penurunan yang diuraikan di sini mengikuti metode Least Squares, yang identik dengan
estimator method of moments (dan juga maximum likelihood)


benconomy.wordpress.com

4

2 Review

2.2 Asumsi OLS
Dalam regresi, parameter estimasi perlu memenuhi kriteria yang sering disingkat
BLUE, yaitu Best (parameter estimasi meminimumkan varians (kuadrat) error),
Linear (persamaan yang diestimasi bersifat linear), Unbiased (parameter estimasi
tidak bias) dan Estimator (parameter adalah estimator yang baik untuk parameter
populasi). Estimator yang tidak bias dan konsisten berarti parameter sesuai dengan
parameter populasi dan semakin dekat dengan parameter populasi ketika sampel
ditambah (plim βˆ = β)
Berikut rangkuman definisi yang lebih formal dari asumsi OLS:
OLS 1 Parameter bersifat linear. yi = β0 + β1 x1 + · · · + βj xj
Dengan kata lain, parameter model populasi tidak dapat bersifat
bersifat non-linear, seperti xβ1 1 atau β1 x1 β2 x2 .
OLS 2 Random Sampling
Data yang diambil adalah sampel yang diambil secara random dari
populasi yang hendak dipelajari.
OLS 3 Corr(x1 , x2 , . . . , xj ) ̸= ±1
Tidak adanya multikolinearitas sempurna antara variabel independen.
OLS 4 Variasi dalam sampel.
Nilai sampel tidak konstan (hanya satu nilai) untuk satu variabel.
Asumsi ini adalah implikasi asumsi sebelumnya.
OLS 5 E(ε|x) = 0 (zero conditional mean)
Nilai error yang diekspektasikan bernilai 0 untuk semua nilai x.
Implikasinya adalah (1) korelasi x dan ε adalah 0 dan (2) E(y|x) =
yˆ. Asumsi ini adalah dasar pendekatan moment of method yang
digunakan dalam persamaan (2) dan (3).
OLS 6 Corr(εi , εj ) = 0
Tidak ada korelasi antar error dalam seluruh sampel.
OLS 7 Var(εi ) = σ 2
Varians error tidak berubah/konstan untuk semua nilai xj .
benconomy.wordpress.com

5

2 Review
Data/model yang tidak memenuhi asumsi tersebut akan mengakibatkan parameter yang diestimasi tidak memenuhi kriteria BLUE. Karena itu, dibutuhkan
(1) teknik deteksi pelanggaran asumsi tersebut untuk mengetahui adanya estimasi
yang tidak konsisten dan (2) teknik estimasi yang mampu mengkoreksi pelanggaran yang terjadi untuk menghasilkan estimasi yang tetap konsisten dan efisien.
Teknik-teknik lain yang menggunakan metode least square ada untuk mengatasi
adanya pelanggaran asumsi OLS tersebut.

2.3 Pengujian Hipotesis
Sebagai bagian dari teknik statistik, ekonometrika tidak lepas dari pengujian hipotesis. Pengujian statistik selalu menyajikan dua hipotesis yang bersifat eksklusif dan
lengkap:
H0 : a
H1 : ∼ a
Pada umumnya, peneliti “ingin” menolak H0 . Perhitungan yang dilakukan akan
menghasilkanw suatu ukuran tes (test statistic), seperti nilai z atau t. Statistik ini
digunakan untuk melihat apakah peneliti akan menolak H0 (menerima H1 ) atau
gagal menolak (menerima) H0 . Dalam pengujian statistik yang melibatkan proses
inference, selalu terdapat dua kemungkinan kesalahan:
Type 1 error Menolak H0 ketika H0 benar (disebut juga false positive).
Contohnya: (1) Mendiagnosa orang sehat mengalami infeksi; (2) Membuang
produk yang sebenarnya memenuhi standar kualitas.
Type 2 error Menerima H0 ketika H0 tidak benar (disebut juga false negative).
Contohnya: (1) Mendiagnosa orang sakit tidak mengalami infeksi; (2) Menerima/meluluskan produk yang sebenarnya tidak memenuhi standar kualitas.
Nilai berbagai statistik pengujian dapat digunakan untuk menghitung p-value,
yang dapat dikatakan mengukur kemungkinan terjadinya Type 1 error. Dalam
ekonometrika, pengujian yang sering dilakukan adalah melihat apakah suatu model/
variabel independen signifikan menjelaskan variabel dependen. Jadi, dalam pengujian signifikansi, p-value mengukur peluang menyatakan bahwa model/variabel
independen tersebut tidak signifikan ketika model/variabel independen tersebut
signifikan. p-value dapat langsung dibandingkan dengan confidence interval (yang
seyogianya telah ditetapkan secara a-priori) untuk memutuskan apakah suatu
model/variabel independen signifikan (H1 ) atau tidak signifikan (H0 ).

benconomy.wordpress.com

6

3 Regresi OLS dengan Stata

3

Regresi OLS dengan Stata

Dapat dikatakan seperti “Swiss Army Knife” pemodelan, regresi OLS digunakan
secara paling luas dan menjadi alat paling mendasar dalam berbagai aplikasi pemodelan ekonomi. Sintaks perintah regresi OLS di Stata adalah sebagai berikut:
regress depvarname indepvarlist
Perhatikan bahwa variabel yang pertama disebut adalah (satu) variabel independen (y), sedangkan variabel-variabel yang disebut berikutnya adalah variabelvariabel independent (x1 , x2 , . . . , xj ) dalam model persamaan yang hendak diestimasi. Berikut adalah contoh perintah dan output regresi dalam Stata dan panduan
interpretasinya.

A – Bagian ini adalah global test untuk signifikansi model (apakah variasi dalam
model dapat menjelaskan variasi dalam variabel dependen - joint test). Dua
statistik yang dilaporkan adalah statistik F dan p-value-nya.
B – Bagian ini melaporkan goodness of fit dari model, yaitu berapa “persen”
variasi dalam variabel dependen dapat dijelaskan oleh model, yaitu R2 dan
2
2
Radj
. Radj
mengkoreksi bias positif pada R2 akibat penambahan variabel
independen.
C – Konstanta (β0 ). Stata dapat mencegah adanya konstanta, dengan cara menambahkan opsi noconstant (tidak dianjurkan karena akan membuat estimator
menjadi tidak konsisten).
D – Koefisien parameter estimasi βj untuk masing-masing variabel independen
xj . Bagian ini dapat diinterpretasikan: “Bertambahnya 1 unit weight menyebabkan kenaikan 5.774712 dalam price”.
benconomy.wordpress.com

7

regress

4 Penanganan Pelanggaran Asumsi
E – Standar error parameter estimasi sd(βj ).
F – Statistik t untuk masing-masing variabel independen. Statistik t dihitung
dari βj /sd(βj ).
G – p-value untuk menguji signifikansi masing-masing variabel.
H – Range masing-masing parameter estimasi dalam rentang confidence interval.
Level yang dilaporkan dapat diatur dengan menambahkan opsi level()

4

Penanganan Pelanggaran Asumsi

4.1 Heteroskedasitas
Heteroskedasitas adalah keadaan ketika varians error berubah seiring perubahan
nilai variabel independen xj . Heteroskedasitas umumnya tidak menyebabkan indikator menjadi bias, namun menyebabkan kesalahan dalam perhitungan standar
error, yang menurunkan efisiensi model.

Deteksi Terdapat dua metode statistik untuk mendeteksi heteroskedasitas setelah suatu model regresi diestimasi:

Breuch-Pagan Tes ini melakukan regresi OLS dengan ε2 sebagai variabel dependen dan fitted values model sebagai variabel independen. Untuk menggunakan seluruh variabel independen dari model utama sebagai variabel independen, tambahkan opsi rhs. Metode ini mampu mendeteksi heteroskedasitas yang bersifat linear. Perintah untuk melakukan BP-test adalah estat
hettest. Hasil yang dilaporkan adalah LM test-statistic yang mengikuti distribusi χ2 dan p-valuenya.
White Tes ini melakukan regresi OLS dengan varepsilon2 sebagai variabel dependen dan seluruh variabel independen, kuadrat dan hasil perkaliannya dari
model utama sebagai variabel independen. Dengan demikian, metode ini
mampu mendeteksi heteroskedasitas dalam bentuk yang lebih kompleks. Perintah untuk melakukan White test adalah estat imtest, white. Hasil
yang dilaporkan termasuk LM test-statistic yang mengikuti distribusi χ2 dan
p-valuenya.
Metode grafis untuk mendeteksi heteroskedasitas adalah dengan melakukan plot
error (variabel y) dan salah satu variabel independen (variabel x), yang dapat
dilakukan dengan perintah rvpplot varname.

benconomy.wordpress.com

8

hettest

imtest

rvpplot

4 Penanganan Pelanggaran Asumsi

Koreksi Terdapat dua metode statistik untuk menangani heteroskedasitas.
weight Penggunaan weights (timbangan) untuk “menormalkan” efek variabel yang
“menyebabkan” heteroskedasitas. Contohnya, varians error adalah linear dari
suatu variabel (Var(ε) = σ 2 = αx2 ), sehingga perlu timbangan 1/x22 menghilangkan korelasi antara x2 dengan ε. Untuk menggunakan koreksi ini, tambahkan [aweight=varlist] di akhir command, sebelum tanda koma. Perintah untuk contoh sebulumnya:
gen invdepvar2sq=1/depvar2ˆ2
regress indepvar depvar1 depvar2 [aweight=invdepvar2sq]

aweight

robust Tambahkan opsi robust setelah perintah estimasi untuk menggunakan
standard error yang mampu menangani adanya heteroskedasitas (heteroskedascity robust). Contoh:
regress indepvar depvar1 depvar2, robust

robust

Kedua metode tersebut dapat dikombinasikan. Bila variabel yang menyebabkan
heteroskedasitas tersebut diketahui, variabel tersebut dapat ditransformasikan bila
dimungkinkan oleh teori yang mendasari spesifikasi model.

4.2 Autokorelasi
Autokorelasi adalah adanya hubungan antara error satu observasi dengan error
observasi lainnya. Autokorelasi umumnya lebih umum terjadi pada data time series, di mana terjadi antara error suatu periode (εt ) dengan error periode lainnya
(εt−1 , εt2 , . . .). Autokorelasi dapat menyebabkan parameter estimasi menjadi bias,
sehingga harus ditangani.

Deteksi Untuk mendeteksi adanya autokorelasi secara grafis, Stata menyediakan dua perintah:
corrgram varname
ac varname
Tambahkan opsi lags(#) untuk menampilkan autokorelasi sebanyak # lag.
Terdapat dua metode statistik untuk mendeteksi adanya autokorelasi.

corrgram
ac

Durbin-Watson Pengujian Durbin-Watson hanya dapat mendeteksi autokorelasi
dengan lag 1 error (εt−1 ). Statistik Durbin Watson berada di antara 0-4.
Nilai dekat 0 mengindikasikan autokorelasi positif, sedangkan nilai dekat
4 mengindikasikan autokorelasi negatif. Dengan demikian, nilai dekat 2
mengindikasikan tidak adanya autokorelasi. Perintah untuk menampilkan
statistik Durbin-Watson di Stata adalah estat dwatson. Pengembangan uji
Durbin menghasilkan estat durbinalt yang memungkinkan uji hipotesis.
benconomy.wordpress.com

9

dwatson
durbinalt

4 Penanganan Pelanggaran Asumsi
Tambahkan opsi lags(numlist) untuk menspesifikasikan lag autokorelasi
yang diuji.
Breuch-Godfrey Tes Breuch-Godfrey dilakukan dengan melakukan regresi error
terhadap error lag periode yang dispesifikasikan. Perintah untuk BG test di
Stata adalah sebagai berikut:
estat bgodfrey, lags(numlist)
di mana numlist adalah lag-lag yang ingin diuji (dapat lebih dari satu).
Pengujian sebanyak lebih dari 1 lag periode dilakukan secara terpisah.

bgodfrey

Koreksi Koreksi untuk masalah autokorelasi sebaiknya dilakukan mengubah

spesifikasi model, atau menggunakan metode time series (bukan hanya OLS),
seperti penambahan lag variabel dependen ke dalam model (model AR). Walau
demikian, terdapat dua metode OLS yang mampu menangani autokorelasi. Pertama, menggunakan transformasi Cochrane-Orkutt dengan perintah sebagai berikut:
prais depvar indepvarlist, corc
Perintah ini memiliki berbagai opsi dan pendekatan lain untuk menangani autokorelasi yang dapat dieksplorasi lebih lanjut. Kedua, menggunakan standar error
Newey-West yang robust terhadap autokorelasi (dan heteroskedasitas) dengan perintah sebagai berikut:
newey depvar indepvarlist, lag(#)
Perintah ini memungkinkan penanganan lags dengan order yang lebih tinggi. Lags
maksimum yang digunakan dalam model dapat dispesifikasikan menggunakan opsi
lags(#)

prais

newey

4.3 Multikolinearitas
Multikolinearitas adalah adanya kombinasi linear korelasi antara variabel-variabel
independen, yang menyebabkan adanya korelasi. Kolinearitas antara dua variabel
independen dapat dilihat secara grafis dengan menggunakan perintah
graph matrix varlist.
Dalam Stata, statistik untuk mendeteksi multikolinearitas dapat ditampilkan
dengan perintah estat vif. Nilai Mean VIF yang lebih dari 10 dapat dikatakan
mengindikasikan adanya kolinearitas. Namun, tidak terdapat batasan yang definitif
mengenai statistik ini untuk menguji hipotesis secara statistik.
Secara matematis, tidak mungkin melakukan estimasi OLS bila terdapat satu
variabel independen yang adalah gabungan dari satu atau lebih variabel independen
lain. Dalam sebagian besar kasus, multikolinearitas umumnya tidak menyebabkan
masalah estimasi. Bahkan, sulit untuk menemukan variabel-variabel independen
yang tidak berkorelasi (terutama untuk data time series). Multikolinearitas mulai menjadi masalah bila terdapat variabel yang ‘benar-benar’ bergerak bersama
benconomy.wordpress.com

10

vif

5 Instrumental Variables
(korelasi >90%). Hal ini dapat menyebabkan variabel-variabel yang mengalami
kolinearitas secara bersama-sama tidak signifikan, sedangkan sebenarnya berpengaruh terhadap variabel dependen (signifikan secara joint test). Kolinearitas akan
hilang dengan mengeluarkan variabel yang ber-kolinear dari model. Namun, hal
tersebut dapat menyebabkan omitted variabel bias yang serius. Tidak terdapat
metode yang definitif untuk menangani multikolinearitas, sehingga menjadi kebijakan peneliti untuk memutuskan variabel yang tetap dimasukkan dalam model
bilamana terjadi multikolinearitas.

5

Instrumental Variables

Penggunakan Instrumental Variables (berikutnya disebut IV) dalam regresi adalah
salah satu teknik untuk menangani pelanggaran asumsi adanya korelasi antara
satu atau lebih variabel independen dengan error term ε. Dimulai dari spesifikasi
persamaan utama;
yi = β0 + β1 x1i + · · · + βj xji + βk xki + · · · + βm xmi + εi
di mana variabel-variabel βk xki + · · · + βm xmi berkorelasi dengan error;
Corr ((xk , . . . , xm ) , εi ) ̸= 0
Pelanggaran ini akan menyebabkan estimator yang bias dan tidak konsisten. Pengujian dapat dilakukan dengan cara regresi dengan menggunakan error dari model
utama sebagai variabel dependen.
Untuk mengatasi masalah bias yang ditimbulkan, diperlukan adanya variabel
z1 , z2 , . . . , zv yang berkorelasi dengan variabel yang bermasalah dan tidak berkorelasi dengan error untuk dijadikan IV untuk variabel yang bermasalah tersebut.
Dengan demikian, variabel independen dalam model tidak lagi berkorelasi dengan
error, sehingga dapat dihasilkan parameter yang konsisten.
Perintah untuk menerapkan regresi dengan IV adalah:
ivregress method depvar indepvarlist (indepvarlist2 = ivvarlist)
method adalah cara melakukan estimasi dengan IV. 3 metode yang dapat dipilih
adalah 2SLS, liml dan gmm.
depvar adalah variabel independen yang diestimasi.
indepvarlist adalah variabel-variabel independen yang tidak mengalami masalah
korelasi dengan error.
indepvarlist2 adalah variabel-variabel independen yang mengalami masalah korelasi dengan error, sehingga dicarikan variabel instrumen.
ivvarlist adalah variabel-variabel yang dijadikan Instrumental Variable.
benconomy.wordpress.com

11

ivregress

6 Specification Test

6

Specification Test

Pengujian spesifikasi adalah salah satu topik paling penting dalam pemodelan, di
mana spesifikasi persamaan regresi diuji untuk mendapatkan fungsi regresi populasi
yang sedekat mungkin dengan fungsi “asli”. Teori yang dipelajari melalui pemodelan sering memberi usul mengenai bentuk persamaan model secara a priori, yang
tidak selalu didukung dengan temuan parameter estimasi. Hal ini membuat pengujian spesifikasi menjadi penting: Data dapat mengusulkan temuan yang berbeda
dengan teori, atau memperlihatkan bahwa teori tersebut benar atau tidak. Mendapat “informasi” yang tepat dari data adalah tujuan dari pengujian spesifikasi:
Apakah suatu variabel signifikan dalam model, bagaimana seharusnya suatu variabel dispesifikasikan dalam model (linear, logaritma, dlsb.), dan apakah perlu ditambahkan variabel independen lainnya ke dalam model.
Dua hal perlu diperhatikan dalam pengujian spesifikasi. Pertama, adanya variabel yang redundant atau tidak signifikan tidak akan parameter estimasi menjadi
bias, namun akan mengurangi degrees of freedom dan efisiensi model. Kedua,
adanya variabel yang signifikan namun tidak dimasukkan dalam suatu model akan
membuat parameter menjadi bias. Bias memiliki pengaruh yang lebih merusak
dibandingkan inefisiensi. Hal ini menunjukkan pentingnya pengujian spesifikasi
ynag dilakukan secara benar.
Metode formal uji spesifikasi cukup luas, termasuk pengujian manual seperti
dalam metode Mizon dan Richard (1986)‡ atau Davidson MacKinnon “J Test”
(1981)§ untuk non-nested model dan metode Ramsey Regression Error Specification
Test (RESET)¶ . Stata memiliki command untuk melakukan pengujian Ramsey
RESET, dengan perintah sebagai berikut:
estat ovtest
ovtest adalah singkatan untuk ommited variable test. Perintah ini dapat dilakukan setelah estimasi OLS. Bila kita ingin menggunakan polinomial dari variabel independen (bukan hanya fitted values variabel dependen), tambahkan opsi
rhs.


Masukkan berbagai bentuk spesifikasi fungsional dari variabel yang sama ke dalam model, dan
uji menggunakan Wald test apakah koefisien untuk masing-masing kelompok spesifikasi apakah
koefisionnya sama dengan 0.
§
Untuk mempelajari bentuk fungsional spesifikasi A dan B, lakukan estimasi untuk kedua
persamaan tersebut, dan diambil error masing-masing persamaan. Ambil persamaan dari satu
model (misal model A) dan masukkan ke model satunya (Model B) sebagai variabel independen.
Lakukan regresi model satunya tersebut dengan error. Bila koefision error model A dalam model
B tersebut tidak signifikan, model A telah dispesifikasikan dengan benar. Prosedur yang sama
dilakukan untuk model B.

Mengambil polinomial dari fitted values dan memasukkannya ke dalam model utama. Bila
polinomial model utama signifikan, maka model tersebut mengandung omitted variables.

benconomy.wordpress.com

12

ovtest

7 Setelah estimasi…

7

Setelah estimasi…

7.1 Perintah predict
Perintah predict berguna untuk membuat prediksi dari estimasi yang telah dilakukan, baik prediksi fitted values, residual, dan lainnya. Berikut sintaks perintah
tersebut.
predict varname, options
Hasil perintah tersebut dimasukkan dalam variabel baru (varname) yang dispesifikasikan. Nilai yang dapat diprediksi dispesifikasikan dalam options:

predict

xb Analogis dengan Xβ, yaitu prediksi linear/fitted values dari model.
residuals Error εi hasil regresi.
rstd Nilai standardized dari error.
stdp Standar error nilai fitted values.
stdf Standar error nilai forecast (nilai baru).
stdr Standar error nilai error.

7.2 Perintah estimates
Perintah estimates berguna untuk menyimpan, mengelola dan mengakses hasil
estimasi yang telah dilakukan sebelumnya. Dengan adanya fitur ini, kita tidak perlu
menyimpan log-file Stata (.smcl) hanya untuk menyimpan hasil estimasi (lihat opsi
save). Di samping itu, perintah ini juga menyimpan lebih banyak detail yang tidak
ditampilkan dalam tabel laporan estimasi. Berikut adalah beberapa penggunaan
perintah tersebut.
estimates store modelname — menyimpan hasil regresi ke dalam memori
(hilang bila Stata dimatikan) dengan nama modelname. Untuk mengakses/mengaktifkan kembali hasil estimasi yang telah di-store, gunakan perintah
estimates restore modelname.
estimates save filename — menyimpan hasil regresi dengan nama filename
ke hard-disk. Untuk mengakses kembali hasil estimasi ynag telah di-save,
gunakan perintah estimates use filename.
estimates replay modelnamelist — menampilkan kembali laporan/tabel estimasi untuk hasil model-model dalam memori. Untuk menampilkan kembali
perintah regresi yang dilakukan dalam suatu model yang disimpan, gunakan
perintah estimates describe modelname (hanya satu model).
benconomy.wordpress.com

13

estimates

7 Setelah estimasi…
estimates table modelnamelist, options — menampilkan satu atau lebih
hasil estimasi dalam suatu tabel secara vertikal, yang (terutama) berguna
untuk memilih model. Opsi yang dapat digunakan adalah:
• Menampilkan beberapa statistik sekaligus untuk satu model, atau menggunakan ‘bintang’ (*) untuk menandai variabel yang signifikan. Bila
kita ingin menampilkan beberapa statistik sekaligus, tambahkan statistik yang diinginkan secara langsung: b (koefisien estimasi), se (standard
error koefisien estimasi), t (statistik t terkait) dan p (p-value). Bila kita
ingin menggunakan ‘bintang’ tambahkan opsi star(#1 #2 #3), di mana
#1 adalah angka untuk mendapat 1 bintang, #2 adalah angka untuk
mendapat 2 bintang, dan seterusnya.
• Menampilkan statistik goodness of fit model. Statistik yang dapat ditampilkan dimasukkan dalam stat(list), di mana list dapat berupa r2
(R2 ), r2_a (adjusted R2 ) ll (likelihood ratio), N (jumlah sampel), df_r
(degress of freedom model), AIC dan BIC.
Untuk menunjukkan bagaimana menggunakan estimates digunakan, beberapa
baris perintah berikut ini dapat menampilkan contohnya.
sysuse auto, clear
regress pr mp re tr
estimates store model1
regress pr mp re
estimates store model2
estimates table model1 model2, b se p stats(r2 r2_a df_r)
estimates table model1 model2, star(0.05 0.01 0.001)
estimates describe model1
estimates describe model2
estimates replay model1 model2
Alternatif perintah estimates table yang memiliki kemampuan menampilkan
beberapa statistik sekaligus dan bintang secara bersamaan, kontrol hasil tampilan
lebih baik serta ekspor hasil ke program lain (seperti LATEX) adalah paket estout.
Gunakan perintah ssc install estout, replace untuk meng-install paket ini
ke dalam Stata (dibutuhkan koneksi internet untuk download paket).

benconomy.wordpress.com

14