BAB 3
PEMBAHASAN DAN HASIL
3.1 Regresi Berganda
Untuk memperkirakanmeramalkan nilai dari variabel Y, akan lebih baik apabila ikut memperhitungkan variabel-variabel lain yang ikut mempengaruhi Y. dengan demikian
ada hubungan antara satu variabel tidak bebas dependent variable Y dengan beberapa variabel lain yang bebas independent variable X
1
, X
2
, …, X
k
. hubungan antara sebuah variabel tak bebas dependent variable dengan dua buah atau lebih variabel bebas
independent variable dalam bentuk regresi disebut dengan regresi linear berganda.
Untuk meramalkan Y, apabila semua nilai variabel bebas diketahui, maka dapat digunakan persamaan regresi linear berganda. Hubungan antara Y dan X
1
, X
2
, …, X
k
yang sebenarnya adalah :
i ki
k i
i i
X X
X Y
...
2 2
1 1
Anggapan yang diambil dalam model ini ialah bahwa X
1
, X
2
, …, X
n
tidak mempunyai distribusi sedangkan
i
berdistribusi N0,σ
2
Apabila dinyatakan dalam bentuk persamaan matriks berikut.
XB
Y
Dengan Y, B, ε = vektor
X = matriks
Universitas Sumatera Utara
Dimana Y =
n Y
Y Y
Y
i
k i
n i
. .
. .
.
. .
. .
.
. .
. .
.
2 1
1 2
1
X =
11 11
11 11
11 11
11 11
11 11
11 11
. .
. 1
. .
. .
. .
. .
. .
. .
1 .
. .
. .
. .
. 1
. .
. 1
X X
X X
X X
X X
X X
X X
Koefisien harus diestimasi berdasarkan data hasil penelitian sampel acak. Prosedur estimasi tergantung pada asumsi mengenai variabel X dan kesalahan pengganggu
ε. Beberapa asumsi yang penting adalah sebagai berikut:
1. Nilai harapan setiap kesalahan pengganggu sama dengan nol
i
E
,
untuk semua i.
. .
. .
. .
. .
. .
. .
2
1
n i
Y E
E E
Vektor nol
2. Kesalahan pengganggu yang satu
i
tidak berkorelasi bebas terhadap kesalahan pengganggu lainnya
j
, akan tetapi memiliki variasi yang sama.
2 2
, ,
i j
i
E j
i E
untuk semua i.
Universitas Sumatera Utara
Apabila dinyatakan dalam bentuk matriks, maka asumsi tersebut menjadi sebagai berikut:
T
E
I
E E
E E
E E
E E
E E
E E
n n
n n
i i
i n
n
2
2 2
2
2 2
1 2
1 2
2 2
1 2
1 2
1 2
1
. .
. .
. .
…PP3.6
T
= transpos dari vector kolom ε, atau dengan kata lain, ε
T
merupakan vektor baris
T
. ...
... ...
2 1
n i
I = matriks identitas, karena setiap kesalahan pengganggu mempunyai variansi yang sama.
3. X
1i,
X
2i,
...,X
ki
merupakan bilangan real, tanpa mengandung kesalahan. Dengan perkataan lain, natriks merupakan himpunan angka-angka konstan fixed numbers.
4. Matriks mempunyai rank k n ada k kolom dari matriks X yang bebas linear.
Jumlah observasi n harus lebih banyak dari jumlah variabel, atau lebih banyak dari koefisien regresi linear yang akan diestimasi.
k k
X X
Y
ˆ ...
ˆ ˆ
ˆ ˆ
2 2
1
Universitas Sumatera Utara
apabila
k
ˆ ,...
ˆ ,
ˆ ,
ˆ
2 1
sudah dihitung sebagai penduga parameter
k
ˆ ,...
ˆ ,
ˆ
2 1
, berdasarkan data dari sampel, maka
Yˆ dapat digunakan untuk meramalkan Y, setelah
k
X X
X ,...
,
2 1
diketahui nilainya.
3.1.1 Metode Kuadrat Terkecil Dengan Matriks
Misalkan
ˆ
sebagai penduga merupakan vektor kolom dengan k baris sebagai
berikut:
ˆ ˆ
ˆ .
. .
ˆ ˆ
ˆ
2 1
X Y
e e
X Y
k
Universitas Sumatera Utara
k x
Y n
i
e n
i
X X
X X
X X
X X
X X
X X
Y Y
Y Y
e e
e e
ˆ .
. .
. .
. .
ˆ ˆ
1 .
. .
. .
. .
. .
. .
. 1
. .
. .
. .
. .
. .
. .
1 1
. .
. .
. .
. .
. .
. .
1
11 11
11 11
11 11
11 11
11 11
11 11
2 1
2 1
ki k
i i
i i
X X
X Y
e
ˆ ...
ˆ ˆ
ˆ
2 2
1 1
ki k
i i
i i
X X
X Y
e
ˆ ...
ˆ ˆ
ˆ
2 2
1 1
2
…..3.3 Estimasi vektor dengan menggunakan metode kuadrat terkecil, ialah vektor
ˆ sedemikian rupa sehingga jumlah kuadrat kesalahan pengganggu,
2 i
T
e e
e
minimum. Caranya ialah dengan melakukan penurunan parsial
2 1
e
terhadap setiap komponen vektor komponen vektor
ˆ dan menyamakan dengan 0.
1 ˆ
... ˆ
ˆ ˆ
2 ˆ
2 2
1 1
2
ki k
i i
i i
X X
X Y
e
ˆ ...
ˆ ˆ
ˆ 2
ˆ
1 2
2 1
1 1
2
i ki
k i
i i
i
X X
X X
Y e
Universitas Sumatera Utara
ˆ ...
ˆ ˆ
ˆ 2
ˆ
2 2
2 1
1 2
2
i ki
k i
i i
i
X X
X X
Y e
ˆ ...
ˆ ˆ
ˆ 2
ˆ
2 2
1 1
2
ki ki
k i
i i
k i
X X
X X
Y e
Persamaan diatas, setelah disederhanakan menjadi
ˆ ...
ˆ ˆ
2 2
1
ki k
i i
X X
X n
i
Y ˆ
... ˆ
ˆ ˆ
1 2
1 2
1 2
1 1
ki i
k i
i i
i
X X
X X
X X
i i
Y X
1
ˆ ...
ˆ ˆ
ˆ
2 2
2 2
2 1
2 1
2
ki i
k i
i i
i
X X
X X
X X
i i
Y X
2
ˆ ...
ˆ ˆ
ˆ
2 2
2 1
1
ki k
ki i
ki i
ki
X X
X X
X X
i ki
Y X
Persamaan diatas disebut persamaan normal. Jika dinyatakan dalam bentuk matriks persamaan normal di atas akan menjadi
Y X
X X
T T
ˆ
.
dengan demikian diperoleh
Y X
X X
T T
. ˆ
1
…3.4.
3.1.2. Analisis Varians dalam Regresi Linear Berganda
Pada umumnya hubungan antara k variabel yaitu antara Y dengan X
1
, X
2
, …X
k
, k varibel bebas untuk sampel dengan sampel dengan n observasi, dinyatakan dengan:
, ...
ˆ
2 2
1 1
i ki
k ji
j i
i i
X X
X X
i = 1, 2,…, n j = 1, 2,…,k
Apabila variabel X dan Y diukur dari titik asal,maka dapat diringkaskan hal-hal sebagai berikut:
Universitas Sumatera Utara
X
diestimasi dengan
ˆ
X Y
X X
X
T T
1
ˆ
Var
1 2
ˆ
X
X
T
Apabila variabel X dan Y masing-masing diukur dari rata-rata, kemudian dinyatakan dengan huruf latin kecil
X X
x
j j
dan
Y Y
y
i i
maka hubungan tersebut menjadi
i ki
k i
i i
x x
x y
ˆ
... ˆ
ˆ
2 2
1 1
Dinyatakan dalam bentuk matriks akan diperoleh hubungan berikut.
e X
Y yang dapat diestimasi dengan
e X
ˆ
Persamaan 3.5
Y
j kn
jn n
n ki
ji i
i k
j k
j
i
X X
X X
X X
X X
X X
X X
X X
X X
X
yn y
y y
1 1
2 1
2 1
2 2
22 12
1 1
21 11
2 1
, ,
ˆ
n i
n n
i k
j
e e
e e
e
2 1
1 1
1 2
1 2
1
, ,
,
ˆ ˆ
ˆ ˆ
Universitas Sumatera Utara
Misalkan ˆ = b. semua rumus yang berhubungan dengan variabel yang dinyatakan dalam
bentuk simpangan huruf kecil, mempunyai bentuk yang sama apabila dinyatakan dalam bentuk persamaan matriks, kecuali
2 ...
12 2
. r
R
k y
yang bentuknya akan berubah dari
2 2
2
1 1
i T
i T
T
Y n
Y Y
Y n
Y X
b R
menjadi
Y Y
Y X
b R
T T
T
2
Sesuai dengan uraian pada regresi linear sederhana untuk hubungan antara dua variabel maka:
2
R Y
Y Y
X b
T T
T
1
2
R Y
Y e
e
T T
2 2
2
1
i T
T T
T T
T T
y Y
Y R
Y Y
R Y
Y e
e Y
X b
Y Y
2 i
T
e e
e
2 i
T
y Y
Y
adalah
untuk mengukur variasi Y
2
R Y
Y X
b
T T
T
adalah variasi Y yang berasal dari regresi 1
2
R e
e
T T
adalah
variasi Y yang berasal dari kesalahan pengganggu, disebut residu
Jadi variasi Y berasal dari dua sumber, yaitu dari regresi linear berganda tergantung pada variabel bebas
k
X X
X ,...,
,
2 1
dan dari residu.
Pemecahan variasi Y menjadi dua sumber merupakan dasar Analisis Variansi yang dapat disajikan dalam bentuk tabel Analisis Variansi ANOVA sebagai berikut:
Tabel 2.9
Sumber Variansi
Jumlah Kuadrat
Derajat Kebebasan
Rata-rata Kuadrat F
Hitung
Universitas Sumatera Utara
3.2. Pendekatan Regresi Berganda pada Analisis Varians Klasifikasi Dua Arah