Perbandingan Antara Estimasi M dengan Type Welsch dengan Least Trimmed Square untuk Mengatasi Adanya Data Pencilan

BAB 2

LANDASAN TEORI

2.1 Pengertian Regresi Linier
Pengertian regresi secara umum adalah sebuah alat statistik yang memberikan
penjelasan tentang pola hubungan (model) antara dua variabel atau lebih.Dalam
analisis regresi dikenal 2 jenis variabel yaitu:
1. Variabel Respon disebut juga variabel dependen yaitu variabel yang
keberadaannya dipengaruhi oleh variabel lainnya dan dinotasikan dengan
variabel X .
2. Variabel Prediktor disebut juga dengan variabel independen yaitu variabel
yang bebas (tidak dipengaruhi oleh variabel lainnya) dan dinotasikan
dengan Y.

Untuk mempelajari hubugan – hubungan antara variabel bebas terdiri dari dua
bentuk, yaitu:
1. Analisis regresi sederhana (simple analysis regresi)
2. Analisis regresi berganda (Multiple analysis regresi).

Analisis regresi sederhana merupakan hubungan antara dua variabel yaitu

variabel bebas (variable independen) dan variabel tak bebas (variabel dependen).
Sedangkan analisis regresi berganda merupakan hubungan antara 3 variabel atau
lebih, yaitu sekurang kurangnya dua variabel bebas dengan satu variabel tak
bebas.

Tujuan utama regresi adalah untuk membuat perkiraan nilai suatu variabel
(variabel dependen) jika nilai variabel yang lain yang berhubungan dengannya
(variabel lainnya) sudah ditentukan.

Universitas Sumatera Utara

Yˆ = β

0

+ β x + β x + ... + β x + ε
11
2 2
n n


Universitas Sumatera Utara

Universitas Sumatera Utara

2.4. Regresi Robust dengan Metode Least Trimmed Square

Metode Least Square adalah sebagai salah satu metode penaksiran parameter
model regresi robust terhadap kehadiran outlier yang mampu menciptakan model
regresi yang lebih baik untuk data yang mempunyai outlier

Least Trimmed Squares(LTS) merupakan suatu metode pendugaan
parameter regresi robust untuk meminimumkan jumlah kuadrat h residual (fungsi
objektif).
βˆ   r(2i ,n )
h

i 1

Dengan h  [n / 2]  [( p  1) / 2]
Keterangan :

r(i2) :Kuadrat residual yang diurutkan dari terkecil ke terbesar
r(12)  r(22 )  r(23)  ...  r(2i ) ...  r(2h ) ...  r(2n )

n: Banyaknya parameter
p:Parameter regresi

Tahapan algoritma Least Trimmed Square adalah
1. Menghitung estimasi parameter b0
2.Menentukan n residual ri 2  ( yˆ i  X i bo ) 2 yang bersesuain dengan (bo )
kemudian
menghitung sejumlah h0  (n  p  1) / 2 pengamatan dengan nilai e(i2 ) terkecil.

r
h0

3. Menghitung

i 1

2

(i )

4. Melakukan estimasi parameter bnew dari h0 pengamatan.
5.Menentukan n kuadrat residual ri 2  ( yˆ  X i bnew ) 2 yang bersesuain dengan (bnew)

Universitas Sumatera Utara

e(i2 )

r
hnew
i 1

2
(i )

yˆ i ,o

ε i , 0  y i  yˆ i , 0


Universitas Sumatera Utara

3.Menentukan σˆ 0 dan pembobot awal

w i,0 

*
i,0

ψ (ε


i
i,0

)

)

.Dengan ε i*, 0 


ε i ,0
.Nilai
σˆ 0

1 n
1[Yi  Yˆi ]
MAR
n
σˆ 0 diperoleh dengan menggunakan rumus σˆ 0 

untuk
0,6745
0,6745
masing-masing iterasi t.
4.Berdasarkan tabel diatas diperoleh ψ (ε

*
i,0


)  (ε

*
i,0

) exp( (ε

*
i,0

/ c) 2 ) .

Dengan nilai c sebesar 2,3849
5.Mencari estimasi pada masing-masing iterasi dengan weighted least square
yaitu β = (XTWt-1X)-1XTWt-1Y.
Dengan W=Matriks diagonal berukuran nxn, dengan wi sebagai

elemen

X=Matriks dengan elemen X1,X2,X3

XT=Matriks transpose dari X
6.Tahap (3) dan (4) diulang sampai diperoleh estimasi parameter model yang
konvergen, artinya selisih hasil iterasi t dengan t-1 bernilai 0.
7. Perhitungan dilakukan menggunakan komputer.

2.6. Koefisien Determinasi
R2 adalah suatu indikator yang menggambarkan berapa banyak variasi yang
dijelaskan dalam model.Berdasrkan nilai R2 dapat diketahui tingkat signifikansi
atau kesesuaian hubungan antara variabel bebas dengan variabel tak bebas dalam
model regresi yang dihasilkan.
Nilai dari R2 dapat dicari dengan menggunakan rumus

R 

b1  x1 y  b2  x 2 y  b3  x 3 y

2

2


x y  
1

x

2

y
 X Y
XY
1

1

y   X 2Y 

n

 X Y
2


n

Universitas Sumatera Utara

x

3

y

y   X 3Y 
2



Y

2




 X Y
3

n

( Y ) 2
n

Semakin besar nilai R2, semakin dekat antara estimasi garis regresi dengan data
sampelnya.

Universitas Sumatera Utara