= Faktor gangguan yang tidak dapat dijelaskan oleh model yang disebut dengan error, yang diasumsikan sebagai variabel
random dengan mean nol, variansi .
2.5 Regresi Spline
Regresi spline merupakan pendekatan regresi tersegmen dimana model regresi terbentuk dengan terlebih dahulu membagi nilai-nilai peubah prediktor kedalam
beberapa segmen dan model regresi yang berbeda dibentuk pada setiap segmen. Sifat tersegmen pada regresi spline memungkinkan model menyesuaikan diri
secara efektif terhadap karakteristik lokal dari data. Penggunaan spline difokuskan kepada adanya perilaku atau pola data, yang berbeda antara daerah tertentu
dengan daerah yang lain Friedman, 1991.
Nilai variabel prediktor yang menjadi batas antara segmen-segmen dinamakan knot. Knot merupakan nilai variabel prediktor ketika slope suatu garis
regresi mengalami perubahan nilai. Setiap garis regresi mendefinisikan satu segmen sehingga knot dapat didefinisikan sebagai akhir dari satu segmen
sekaligus merupakan awal dari segmen yang lain. Bentuk model regresi spline berorde m adalah seperti pada persamaan 2 berikut
Eubank, 1988. , 2.2
Untuk i = 1, 2, 3, …, n; j = 1, 2, 3, …, p dan k = 1, 2, 3, …,
Universitas Sumatera Utara
dengan fungsi truncated adalah :
,
,
=
Parameter model yang akan diestimasi, dan
= Intersep = Slope pada variabel
dengan orde ke-r = Slope pada variabel
truncated knot ke-k pada spline berorde m = Variabel prediktor ke-j
= Knot ke-k pada variabel j
= 1, 2, …, p dan k = 1, 2, …, = Banyaknya knot dalam variabel prediktor ke-j
Jika j = 1, maka dari persamaan 2.2 diperoleh bentuk umum model regresi spline berorde m untuk satu variabel prediktor, yaitu seperti pada persamaan 2.3
berikut Eubank 1988
.
2.3
2.6 Suatu Fungsi Basis Basis Function
Satu fungsi basis adalah selang antar knot yang berurutan. Fungsi basis adalah kumpulan dari fungsi yang digunakan untuk mewakili informasi untuk menjelaskan
hubungan antara variabel respon dan variabel prediktor. Fungsi basis ini bisa saja
Universitas Sumatera Utara
terdiri dari satu atau lebih variabel. Pada umumnya fungsi basis yang dipilih berbentuk polinomial dengan derivatif yang kontinu pada setiap knot.
Fungsi basis dapat digambarkan sebagai fungsi truncated seperti berikut :
Dimana t
k
adalah letak titik knot, dan x adalah variabel prediktor. Sedangkan l adalah derajat spline. Pada data yang bersifat kategorik, knotnya terletak pada
nilai kategorinya tersebut. Fungsi basisnya dapat dinyatakan sebagai berikut : BF =
2.7 Recursive Partitioning RP