dapat didekati secara linear. Dalam proses mendekati hubungan antara antara variabel dengan vektor , terdapat noise yang dilambangkan dengan , yaitu
nilai galat pendekatan linear antara variabel dengan vektor . Sehingga model persamaaan menjadi:
, , … ,
Dimana, merupakan inner product antara vektor
dan . Pada umumnya persamaan sebanyak n ini disatukan dalam bentuk
vektor,seperti:
Dimana ,
, …
… ,
Nilai konstanta dapat diselesaikan dengan persamaan:
2.6 Ketepatan Pendugaan Model Regresi Linear
Ketepatan atau keakuratan sebuah model regresi dapat dilihat dari koefisien determinasi R
2
dan Root Mean Square Error RMSE. R
2
menunjukkan proporsi jumlah kuadrat total yang dapat dijelaskan oleh sumber keragaman peubah bebas,
sedangkan RMSE menunjukkan seberapa besar simpangan nilai dugaan terhadap nilai aktualnya. Kita juga dapat menunjukkan bahwa R
2
adalah kuadrat dari korelasi antara nilai vektor observasi the vector of observations y dengan nilai
vektor penduganya the vector of fitted values ŷ Douglas dan Elizabeth 1992
dalam Normakristagaluh 2004. Menurut Walpole 1982 R
2
dan RMSE dirumuskan sebagai berikut:
∑ ∑
∑
= =
=
− −
⎥ ⎦
⎤ ⎢
⎣ ⎡
− −
=
n i
i n
i i
n i
i i
y y
y y
y y
y y
R
1 2
1 2
2 1
2
ˆ ˆ
ˆ ˆ
dimana: y
i
= nilai-nilai aktual, ŷ
i
= nilai-nilai prediksi.
RMSE =
dimana: X Nila
semakin b
2.7 K-fo
K-fo Inti valida
bagian. D data uji da
dimana se data latih
tolak ukur
Gamba
Keu variasi cro
n F
X
n t
t
∑
=
−
1
X
t
= nilai akt ai R
2
berada baik jika R
2
old Cross V
old cross va asi tipe ini a
Dari k himpu an k-1 dija
etiap k himp Refaeilzad
r yang pasti
ar 2 Ilustrasi validatio
untungan me oss validatio
F
t 2
tual pada w a pada selan
mendekati
Validation
lidation me
adalah memb unan bagian
adikan data punan bagian
deh P., Tang untuk nilai
i pembagian on
k=6.
enggunakan on
seperti R waktu ke-t, F
ng 0 sampai 1 dan RMS
erupakan sal bagi data se
n tersebut di latih. Prose
n yang ada g L., Liu H.
k.
n kelompok
n k-fold cros Repeated ran
F
t
= nilai dug 1. Kecocok
SE mendeka
lah satu var ecara acak k
ipilih satu h es ini dilaku
menjadi da ., 2008. Na
k data latih d
ss validation ndom sub-s
gaan pada w kkan model
ati 0.
riasi dari cro ke dalam k h
himpunan ba ukan berulan
ata uji dan s amun, secar
dan uji pada
n dibanding
sampling va waktu ke-t
dikatakan
oss validatio himpunan
agian menja ng sebanyak
sisanya men ra teori tidak
a k-cross
gkan dengan lidation
ada 11
on .
adi k k,
njadi k ada
n alah