16
= , ,
di mana berarti jumlah untuk semua nilai Y.
Harapan Bersyarat
= = =
2. Tentukan apakah model berikut liniir dalam parameter, atau dalam
peubah, atau kedua-duanya. Yang mana dari model-model ini adalah model regresi liniir ?
a =
+
1 1
+ b
= +
1 1
+ c
= +
1 1
+ d
= −
1 1
+ e
=
0 1 1
+ f
= +
1 1
+ g
= + 0.75
−
− 1 −2
+
BAB 2 MODEL REGRESI DUA PEUBAH
2.1
Metode Kuadrat Terkecil Biasa OLS-Ordinary Least Square
17
PRF : =
+
1
+ dengan Asumsi-asumsi :
Asumsi 1
= 0 11
Perhatikan Gambar berikut, tiap populasi Y yang berhubungan dengan suatu X tertentu didistribusikan di sekitar nilai rerata dengan
beberapa nilai Y di atas nilai rerata dan beberapa di bawahnya. Jarak-jarak ini dari rerata adalah
, dimana nilai rerata hitung dari deviasi simpangan ini harus sama dengan nol.
Artinya dapat bernilai negatif atau positif, sehingga jumlah totalnya sama
dengan 0.
Rerata
X
1
X
2
X
3
X
4
Y
∶ = +
1
Gambar Distribusi bersyarat u
i
18
Asumsi 2
, = − − =
− 0 − 0 =
= ,
= 0 ≠
12
di mana i dan j dua pengamatan yang berbeda dan di mana cov berarti kova rians.
Ini artinya, gangguan tidak berkorelasi.
Asumsi ini dikenal sebagai tidak adanya korelasi berurutan, atau taka da autokorelasi
. Artinya, untuk X
i
tertentu, simpangan tiap dua Y yang manapun dari niali reratanya tidak menunjukkan pola positif , di mana u positif diikuti u lain
yang positif, atau u negatifdiikuti u lain yang negatif, atau u positif diikuti u yang negatif. Pola sistematis ini menunjukkan adanya autokorelasi.
Jika taka da pola yang sistematis, maka korelasi nol.
19
Asumsi 3
= −
2
= − 0
2
=
2
= �
2
13
Artinya, varians untuk tiap X
i
adalah konstan tetap sebesar �
2
. Menyatakan
asumsi
homoskedasitisitas
, atau
sama penyebaran
skedasticity.
Korelasi nol
u
u
20
Perhatikan Gambar berikut :
Sebaliknya, dari Gambar berikut, varians bersysrat populasi Y meningkat
dengan menungkatnya
X. Situasi
ini disebut
heteroskedastisitas,
atau penyebaran yang tak merata, atau varians yang tak sama, dengan symbol ditulis :
= �
2
14 tanda indeks i menunjukkan varians populasi Y tidak lagi konstan.
atan p
ro b
ab il
itas u
i
Y
X
1
X
2
X
3
∶ = +
1
Y
21
Dalam Gambar akhir, varians meningkat bersama dengan meningkatnya penda patan.
Artinya keluarga yang lebih kaya secara rerata mengkonsumsi lebih banyak dari pada keluarga yang lebih miskin, tapi variabilitas belanja konsumsi
keluarga yang lebih kaya juga lebih besar.
Asumsi 4
, = − − =
− 0 − =
− = 0.
− = 0 15
Gangguan u dan peubah yang menjelaskan X tidak berkorelasi. Diasumsikan bahwa X dan u semua peubah yang diabaikan mempunyai pe
ngaruh yang terpisah dan bersifat penjumlahanatas Y. Jadi kalau X dan u berkorelasi secara positif, X meningkat pada saat u
mening kat.
22
bagai model regresi klasik, standar, atau liniir umum. Model ini klasik dikem bangkan GAUSS tahun 1821.
Tabel Asumsi model regresi liniir klasik Asumsi
no Terhadap u
Terhadap Y
1 = 0
= +
1
2 , = 0
≠ , = 0
≠ 3
= �
2
= �
2
Prinsip OLS
PRF tidak dapat diamati secara langsung. PRF ditaksir dari SRF. SRF :
= +
1
+ 8
= + 9
= −
−
1
16
Jika ada N pasang observasi atas Y dan X tertentu, ingin ditetapkan SRF sedemikian sehingga sedekat mungkin dengan nilai Y yang sebenarnya.
Pilih SRF sedemikian sehingga jumlah residual sisa = −
sekecil mungkin. Perhatikan Gambar di bawah.
Misalkan,
1
,
2
,
3
,
4
10, −2, +2, −10
0. Ide nya lebih baik menggunakan kriteria kuadrat terkecil, di mana SRF dapat
ditetapkan sedemikian sehingga
23
= −
−
1 2
17
sekecil mungkin, di mana
2
adalah residual kuadrat.
e
1
e
2
e
3
e
4
X
1
X
2
X
3
X
4
SRF
= +
1
Y
24
�
2
�
= −2 −
−
1
�
2
�
1
= −2
− −
1
Syarat optimum, kedua persamaan tadi disamakan dengan nol. −2 −
−
1
= 0 −
−
1
= 0 −
−
1
= 0 =
+
1
18
−2 − −
1
= 0 −
−
1 2
= 0 −
−
1 2
= 0 =
+
1 2
19
Menyelesaikan persamaan 18 dan 19 secara simultan, diperoleh :
1
=
−
2
−
2
25
1
=
2
Dengan mengurangkan tiap nilai X dan Y dengan reratanya, diperoleh :
1
=
− − −
2
Dengan mengingat
− = , − = ,
maka
1
=
2
20
Dan
=
2
−
2
−
2
= −
1
21
Penaksir yang diperoleh disebut sebagai penaksir kuadrat terkecil ka rena diperoleh dari prinsip kuadrat terkecil.
2.2
Koefisien Determinasi r
2
: Suatu Ukuran “Kebaikan Suai” “Goodness of Fit”
Sebaik mana garis regresi sampel mencocokkan data ?
Jika semua pengamatan terletak pada garis regresi, maka diperoleh kecocokan yang “sempurna”.
26
= + 9
atau dalam bentuk simpangan
= +
22
Mengkuadratkan persamaan 22 dan menjumlahkan untuk semua
sampel, diperoleh
2
=
2
+
2
+ 2
2
=
2
+
2
+ 0
2
=
2
+
2 2
=
1 2
2
+
2
23
Di sini = 0, diperoleh dengan cara berikut.
=
1
Dikali dan dijumlahkan seluruhnya diperoleh : =
1
=
1
−
1
=
1
−
1 2
=
1
−
1 2
2
27
karena
1
=
2
,
maka baris akhir menjadi
=
1 2
2
−
1 2
2
= 0
Berbagai jumlah kuadrat pada persamaan 23 dapat digambarkan sbb. :
2
= −
2
= total variasi nilai Y sebenarnya di sekitar reratanya, disebut jumlah kuadrat total total sum of squares, TSS.
2
= −
2
= −
2
=
1 2
2
=variasi nilai Y yang ditaksir di sekitar reratanya
= , yang disebut secara benar sebagai jumlah kuadrat akibat regresi karena peubah yang menjelaskan,
atau dijelaskan oleh regesi, atau jumlah kuadrat yang dijelaskan explained sum of squares, ESS .
2
=residual atau variasi yang tak terjelaskan unexplain ed
dari nilai Y di sekitar garis regresi, atau jumlah kuadrat residual residual sum of squares, RSS
. Atau
= +
Total variasi dalam nilai Y yang diamati di sekitar nilai rerata nya dapat dipisahkan ke dalam 2 bagian, sebagian oleh garis regresi dan bagian lain
oleh kekuatan random karena tak semua pengamatan Y yang sebenarnya terletak pada garis yang dicocokkan.
1 = +
=
−
2
−
2
+
2
−
2
24
28
Didefinisikan
2
=
−
2
−
2
=
25
Besaran
2
disebut koefisien determinasi sampel, digunsksn untuk mengukur kebeikan-suaigooness of fit garis regresi,
Secara verbal,
2
mengukurproporsi bagian atau prosentase total variasi dalam Y yang dijelaskan oleh model regresi.
Sifat
2
:
1.
2
besaran non negatif 2.
Batasnya 0 ≤
2
≤ 1.
2
= 1 berarti suatu kecocokan sempurna, sedangkan
2
= 0 berarti tak ada hubungan antara peubah tak bebas dengan peubah yang menje
laskan. Di sini
2
dapat pula dihitung demikian :
2
= =
2 2
=
1 2
2 2
=
1 2
2 2
26
Jika pembilang dan penyebut dibagi dengan N atau − 1 untuk sampel
kecil diperoleh :
29
1 2
2
di mana
2 2
adalah varians sampel Y dan X. sebuah besaran yang berhubungan erat tapi berbeda konsep adalah
koefisien korelasi , yang merupakan ukuran tingkat hubungan antara dua pe
ubah. Besaran nya dihitung dengan rumus :
= ±
2
28 atau dari definisi nya
=
2 2
=
−
2
−
2 2
−
2
29
yang dikenal sebagai koefisien korelasi sampel.
Sifatr :
1. r dapat positif atau negatif, tandanya tergantung tanda pembilang
persamaan 29, yang mengukur kovariasi kedua peubah. 2.
−1 ≤ ≤ +1 3.
, yaitu koefisien korelasi antara X dan Y sama dengan koefisien korelasi antara Y dan X .
4. tergantung pada titik asal origin dan skala; yaitu jika didefinisi
kan
∗
= + dan
∗
= + , di mana 0,
0, konstan, maka r antara X dan Y adalah sama dengan r antara
peubah asli X dan Y. 5.
X dan Y bebas secara statistic, koefisien korelasi nya nol; tapi jika
= 0, ini tak berarti kedua peubah bebas, jadi korelasi 0 tak berarti kebebasan.
30
saja, r tadi tak mempunyai arti untuk menggambarkan hubungan nonliniir.
7. r adalah hubungan liniir antara dua peubah, tapi tak perlu
adanya hubungan causalitas. 8.
= dalam regresi majemuk berganda nilainya diragukan.
Contoh :
Diberikan data sampel seperti Tabel berikut. Asumsikan bahwa Y berhubungan liniir dengan X . Data mentah diperlukan untuk mendapatkan
taksiran koefisien regresi, kesalahan standar, dsb.
Data hipotesis belanja konsumsi mingguan keluarga Y dan pendapatan mingguan keluarga X
Y X
70 80
65 100
90 120
95 140
110 160
115 180
120 200
140 220
155 240
150 260
Berdasarkan data mentah diperoleh :
31
1
= 0,5091
1
= 0,0013
1
= 0,0357 �
2
= 42,1591
2
= 0,9621 = 0,9809
= 8.
di mana
1
=
�2 2
1
=
� 2
=
2 2
�
2
=
2 2
�
≡ ;
�
2
≡ atau
homoskedastik Asumsi 3. Nilai
�
2
dihitung dengan rumus �
2
=
2 −2
di mana �
2
adalah penaksir OLS dari �
2
yang sebenarnya tak diketahui dan di mana
− 2 dikenal sebagai derajat kebebasannumber of degree of freedom, df,
2
adalah jumlah kudrat residual residual sum of squares RSS.
Istilah derajat kebebasan berarti jumlah total pengamatan dalam sam pel = N dikurangi banyaknya kendali liniir bebas
atau pembatasan restriksiyang diletakkan atas pengamatan .
Untuk menghitung RSS residusl sum of squares terlebih dulu ditentukan
1
, jadi ada − 2 pengamatan bebas . Untuk regresi tiga peubah
mempunyai − 3df pengamatan bebas, untuk model k peubah akan
dipilih − pengamatan bebas. Jadi df = banyaknya parameter yang
ditaksir.
Rumus �
2
diturunkan sbb.:
32
Diketahui =
+
1
+ Maka
= +
1
+
___________________ _ =
1
+ −
Juga diketahui
= −
1
_________________ _
=
1
+ −
−
1
=
1
−
1
+ −
2
=
1
−
1
+ −
2
2
=
1
−
1
+ −
2
2
=
1
−
1
2
2
+
−
2
− 2
1
−
1
− =
1
−
1
2
−
2
+
−
2
− 2
1
−
1
−
−
=
+
1
−
1
2
− 2
1
−
1
Diketahui bahwa : =
− =
1
−
1
Dengan mengambila ekspektasinys diperoleh
33
1
Di sini dihitung sbb.:
Jika sebuah sampel random
1
,
2
, … , ditarik dari sebuah
populasi normal dengan rerata �
2
, maka varians sampel
2
=
1 −1
−
2
atau
− 1
2
�
2
= −
2
�
2
~ �
−1 2
di sini Chi-kuadrat mempunyai df =N – 1, karena
telah digantikan oleh
diketahui
.
Karena rerata �
2
adalah jumlah derajat kebebasannya df sendiri, maka
�
−1 2
=
−
2
�
2
= − 1
Jadi = − 1
= − 1
�
2
Dan
1
−
1
2
=
�
2
Jadi
2
= −
1
−
1
2
2
= − 1
�
2
−
�
2
=
− 2
�
2 2
= − 2
�
2
34
�
2
=
2
−2
Maka
�
2
=
2
−2
=
1 −2
2
=
1 −2
− 2
�
2
= �
2
Yang menunjukkan
�
2
adalah penaksir tak bias dari
�
2
yang sebenarnya.
Untuk mencari
2
digunakan rumus
2
=
2
−
1 2
2
.
Oleh karenanya garis regresi yang ditaksir adalah = 24,4545 + 0,5091 .
Arti dari garis regresi :
1
= 0,5091, mengukur kemringn garis regresi. Dari data mentah, jangkauan sampel antara 80 dan 260 per minggu pada
saat X meningkat, katakana dengan 1, kenaikan rerata tingkat belanja konsumen mingguan yang ditaksir kira-kira 51 sen.
Nilai = 24,4545 , yang merupakan titik potong garis regresi
dengan sumbu Y intersep, menunjukkan rerata tingkat belanja konsumen mingguan ketika pendapatan mingguan adalah nol pengangguran.
Nilai
2
= 0,9621 berarti bahwa 96 dari variasi dalam belanja konsumsi mingguan dijelaskan oleh pendapatan.
35
konsumsi dan pendapatan, berhubungan secara positif dengan tingkat yang tinggi
Tabel Anatomi model regresi klasik dua-peubah Yang
diasumsikan Yang
diamati Gak dapat
diamati Yang dapat
dinyatakan Yang
harus dihitung
1
yang sebenarnya
ada
1
yang sebe narnya
Beberapa kriteria pe
naksiran, mi salnya kua
drat terkecil
1
u
i
sebenarnya ada
sifat u
i
: i
= 0 ii
2
= �
2
iii , =
= 0 ≠
u
i
sebenarnya
2
Residual e
i
= residual = 0
�
2
= siran
�
2
Populasi Y untuk X terten
tu di mana =
+
1
+ Y dan X da
lam suatu sampel ter
tentu Y yang
taka da dalam
sampel
Soal
1. Buktikan kesamaan asumsi
2. Diberikan regresi sampel
36
= 0, dapatkan penaksir dan
1
dan tunjukkan kedanya identic dengan penaksir kuadrat terkecil. Metode untuk mendapatkan penaksir
ini disebut prinsip analogi. 3.
Misalkan secara berurut menyatakan kemiringan
gradient regresi Y atas X dan X atas Y. Tunjukkan bahwa =
2
di mana r adalah koefisien korelasi antara X dan Y. 4.
Koefisien korelasi tingkatan peringkat dari SPEARMAN didefinisikan sbb.:
= 1 −
6
2 2
−1
di mana d =perbedaan tingkatan peringkat yang diberikan pada indivi du atau fenomena yang sama dan N = banyaknya individu atau
fenomena yang diberi tingkatan diranking. Peroleh
.
Petunjuk: berikan peringkat nilai X dan Y dari 1 sampai N. Perhatikan bahwa jumlah peringkat X dan Y masing-masing NN+1 2 dan kar
enanya reratanay adalah N+12.
5. Hitung peringkat Spearman dari
Mahasiswa A
B C
D E
F Peringkat:
Tengah Semester
1 3
7 10
9 5
Peringkat : Atas
3 2
8 7
9 6
G H
I J
4 8
2 6
5 10
1 4
6. Tingkat ke luar dari pekerjaan dan pengangguran di sector Industri
sbb.
Tahun Tingkat ke luar dari Tingkat pengangguran
37
2003 1,3
6,2 2004
1,2 7,8
2005 1,4
5,8 2006
1,4 5,7
2007 1,5
5,0 2008
1,9 4,0
2009 2,6
3,2 2010
2,3 3,6
2011 2,5
3,3 2012
2,7 3,3
2013 2,1
5,6 2014
1,8 6,8
2015 2,2
5,6
Asumsikan tingkat ke luar pekerjan Y berhubungan secara liniir dengan tingkat pengangguran X dalam bentuk
= +
1
+ .
Taksirlah ,
1
, .
Hitung
2
dan r.
7. Tabel berikut menyajikan tingkat perubahan per tahun indeks
harga saham IHSG dan indeks harga konsumen IHK di beberapa Negara pasca PD II sampai 1969
Tingkat perubahan, per tahun Negara
Harga saham,Y Harga saham,X
1.Australia 5,0
4,3 2.Austria
11,1 4,6
3.Belgia 3,2
2,4 4.Kanada
7,9 2,4
5.Chili 25,5
26,4
38
7.Finlandia 11,1
5,5 8.Perancis
9,9 4,7
9.Jerman 13,3
2,2 10.India
1,5 4,0
11.Irlandia 6,4
4,0 12.Israel
8,9 8,4
13.Italia 8,1
3,3 14.Jepang
13,5 4,7
15.Meksiko 4,7
5,2 16.Belanda
7,5 3,6
17.Selandia Baru 4,7
3,6 18.Swedia
8,0 4,0
19.Britania Raya 7,5
3,9 20.AS
9,0 2,1
a Taksirlah parameter regresi liniir tingkat perubahan harga sa
ham terhadap tingkat perubahan harga konsumen dan dapat kan
2
nya. b
Apakah saham biasa merupakan pelindung hedge terhadap inflasi? Apakah saham biasa tadi merupakan pelindung yang
sempurna?
8. Jika dalam model
ln =
+
1
+ dan
= +
1
+ Y menyatakan belanja konsumsi dan X menyatakan pendapatan, tunjuk
kan bahwa elastisitas belanja konsumsi berkenaan dengan pendapatan ditunjukkan oleh
1
=
1
dan
1
=
1
, di mana E
1
dan E
2
ada lah elastisitas. Bagaimana Anda akan menginterpretasikan elastisitas
ini? Petunjuk : Definisi elastisitas antara Y dan X adalah
.
39
menghubungkan belanja konsumen untuk sebuah barang Y dengan total pendapatannya X. Perhatikan model berikut :
= +
1
+ =
+
1
1 + ln
= ln +
1
ln +
ln = ln
+
1
ln 1 +
= +
1
ln +
Yang mana di antara model tadi yang Anda pilih untuk kurva belanja Engel?
Petunjuk : Interpretasikan berbagai koefisien arah gradien; dapatkan bentuk yang menggambarkan elastisitas belanja yang berkenaan dengan
pendapatan, dst.
BAB 3 ASUMSI KENORMALAN :