mengidentifikasi fungsi linier dan aditif, Friedman mengusulkan untuk tidak menghapus fungsi basis awal atau induk parent selama pemilihan subregion
berlangsung. Jadi pada iterasi berikutnya parent dan pilahan subregion dapat dipilah lebih lanjut, sehingga diperoleh subregion yang saling tumpah tindih.
Dengan modifikasi ini, recursive partitioning dapat menghasilkan model linier dengan pemilihan berulang pada peubah prediktor yang berbeda. Disamping itu
dihasilkan pula model yang lebih fleksibel. Untuk mengatasi adanya diskontinu pada titik knot yang disebabkan perkalian fungsi peubah tunggal H
[η], Friedman mengusulkan untuk mengganti H
[η] dengan regresi linier splines berordo satu dengan sisi kiri - dan sisi kanan + Friedman, 1991.
2.8.1 Metode MARS
Fungsi basis dalam MARS dapat dinyatakan dengan
, 2.5
dengan
m
jumlah pilahan himpunan bagian ke-m dari domain D, knot dari
peubah prediktor dan
nilainya +1 jika knotnya terletak dikanan subregion dan -1 jika terletak dikiri subregion.
Setelah modifikasi Friedman , model MARS menjadi :
, 2.6
dengan : = konstanta regresi dari fungsi basis
= koefisien dari fungsi basis ke-m, m
= 1,…,M
Universitas Sumatera Utara
M = maksimum fungsi basis nonconstant fungsi basis,
km = derajat interaksi,
S
km
= ,
x
vk,m
= variabel prediktor ke-v, pilahan ke-k dan subregion ke –m
t
km
= nilai knots dari variabel prediktor x
vk,m
.
Model MARS juga dapat ditulis dalam bentuk sebagai berikut :
2.7 dengan :
= konstanta regresi dari fungsi basis
= koefisien dari fungsi basis ke-m, m
= 1,…,M B
m
= fungsi basis basis function ke-m, m = 1,…,M.
2.8.2 Algoritma MARS
Pembentukan model MARS Multivariate Adaptive Regression Spline diawali menentukan knot dan fungsi basis setiap variabel prediktor dengan cara mem-plot
setiap variabel prediktor dengan variabel respon. Jumlah knot yang optimum akan menghasilkan model MARS yang baik sehingga kemudian dilakukan tahap maju
forward dan tahap mundur backward algoritma recursive partitioning yang dimodifikasi, dimana jumlah knot yang optimum disesuaikan dengan perilaku
data. Gambaran secara umum algoritma MARS adalah sebagai berikut Friedman, 1991:
1. Forward stepwise
Universitas Sumatera Utara
Pada tahap ini dimungkinkan untuk memasukkan fungsi basis baru ke dalam model. Maksimal fungsi basis yang akan masuk di dalam model ditentukan
oleh peneliti. Berikut adalah langkah yang dilakukan dalam forward stepwise :
a. Misalkan B
= 1 sebagai fungsi basis awal. b.
Tentukan pasangan fungsi basis dan
yang merupakan kombinasi prediktor x
i
dan knot sehingga model
memiliki jumlah kuadrat sisaan minimum. ,
dan .
Misalkan B
m
adalah salah satu fungsi basis yang sudah ada didalam model sebelumnya. Jika m fungsi basis telah dimasukkan, tentukan perkalian dari B
m
dengan atau
sehingga jika B
m
dan B
m
ditambahkan ke dalam model maka akan dihasilkan model dengan jumlah kuadrat sisaan terkecil.
c. Ulangi langkah c sehingga banyaknya fungsi basis dalam model lebih atau
sama dengan maksimum banyaknya fungsi basis yang telah ditetapkan.
2. Backward stepwise Prosedur forward seperti yang dijelaskan sebelumnya akan menghasilkan model
dengan fungsi basis dengan jumlah yang sangat banyak. Dalam prakteknya, biasanya maksimum banyaknya fungsi basis yang akan digunakan dalam model
dibatasi. Demikian juga dengan derajat interaksi, yang seringkali hanya dibatasi hanya sampai derajat tiga. Dengan pembatasan tersebut, prosedur forward
tersebut tetap memberikan model dengan fungsi basis yang sangat banyak. Terkait dengan model yang kompleks ini, harus dilakukan penghapusan beberapa fungsi
Universitas Sumatera Utara
basis, sehingga dapat dihasilkan model yang lebih sederhana. Prosedur backward dilakukan untuk tujuan ini.
Prosedur backward dilakukan dengan tahap-tahap berikut: a.
Mulai dari model yang diperoleh pada tahap prosedur forward yang memiliki m fungsi basis.
b. Hapus salah satu fungsi basis tidak konstan yang memiliki kontribusi
terkecil. Berdasarkan kriteria kuadrat terkecil, fungsi basis yang memiliki kontribusi terkecil adalah fungsi basis yang jika dihilangkan
dari model sebelumnya akan menyebabkan terjadinya penurunan jumlah kuadrat sisaan terkecil.
c. Ulangi langkah b, sampai model hanya mengandung fungsi basis
konstan.
Prosedur backward ini menghasilkan sekuens model yang tersarang, f
m
m =1,2,…. Model terbaik ditentukan berdasarkan kriteria Generalized Cross
Validation GCV yang diperkenalkan oleh Wahba pada tahun 1979. Fungsi GCV didefinisikan sebagai berikut :
2.8 dengan :
M = jumlahfungsi basis
= variabel prediktor = variabel respon
N = banyaknya pengamatan
Universitas Sumatera Utara
Trace +1
2.8.3 Uji Signifikansi Basis Fungsi Model MARS