Metode MARS Algoritma MARS

mengidentifikasi fungsi linier dan aditif, Friedman mengusulkan untuk tidak menghapus fungsi basis awal atau induk parent selama pemilihan subregion berlangsung. Jadi pada iterasi berikutnya parent dan pilahan subregion dapat dipilah lebih lanjut, sehingga diperoleh subregion yang saling tumpah tindih. Dengan modifikasi ini, recursive partitioning dapat menghasilkan model linier dengan pemilihan berulang pada peubah prediktor yang berbeda. Disamping itu dihasilkan pula model yang lebih fleksibel. Untuk mengatasi adanya diskontinu pada titik knot yang disebabkan perkalian fungsi peubah tunggal H [η], Friedman mengusulkan untuk mengganti H [η] dengan regresi linier splines berordo satu dengan sisi kiri - dan sisi kanan + Friedman, 1991.

2.8.1 Metode MARS

Fungsi basis dalam MARS dapat dinyatakan dengan , 2.5 dengan m jumlah pilahan himpunan bagian ke-m dari domain D, knot dari peubah prediktor dan nilainya +1 jika knotnya terletak dikanan subregion dan -1 jika terletak dikiri subregion. Setelah modifikasi Friedman , model MARS menjadi : , 2.6 dengan : = konstanta regresi dari fungsi basis = koefisien dari fungsi basis ke-m, m = 1,…,M Universitas Sumatera Utara M = maksimum fungsi basis nonconstant fungsi basis, km = derajat interaksi, S km = , x vk,m = variabel prediktor ke-v, pilahan ke-k dan subregion ke –m t km = nilai knots dari variabel prediktor x vk,m . Model MARS juga dapat ditulis dalam bentuk sebagai berikut : 2.7 dengan : = konstanta regresi dari fungsi basis = koefisien dari fungsi basis ke-m, m = 1,…,M B m = fungsi basis basis function ke-m, m = 1,…,M.

2.8.2 Algoritma MARS

Pembentukan model MARS Multivariate Adaptive Regression Spline diawali menentukan knot dan fungsi basis setiap variabel prediktor dengan cara mem-plot setiap variabel prediktor dengan variabel respon. Jumlah knot yang optimum akan menghasilkan model MARS yang baik sehingga kemudian dilakukan tahap maju forward dan tahap mundur backward algoritma recursive partitioning yang dimodifikasi, dimana jumlah knot yang optimum disesuaikan dengan perilaku data. Gambaran secara umum algoritma MARS adalah sebagai berikut Friedman, 1991: 1. Forward stepwise Universitas Sumatera Utara Pada tahap ini dimungkinkan untuk memasukkan fungsi basis baru ke dalam model. Maksimal fungsi basis yang akan masuk di dalam model ditentukan oleh peneliti. Berikut adalah langkah yang dilakukan dalam forward stepwise : a. Misalkan B = 1 sebagai fungsi basis awal. b. Tentukan pasangan fungsi basis dan yang merupakan kombinasi prediktor x i dan knot sehingga model memiliki jumlah kuadrat sisaan minimum. , dan . Misalkan B m adalah salah satu fungsi basis yang sudah ada didalam model sebelumnya. Jika m fungsi basis telah dimasukkan, tentukan perkalian dari B m dengan atau sehingga jika B m dan B m ditambahkan ke dalam model maka akan dihasilkan model dengan jumlah kuadrat sisaan terkecil. c. Ulangi langkah c sehingga banyaknya fungsi basis dalam model lebih atau sama dengan maksimum banyaknya fungsi basis yang telah ditetapkan. 2. Backward stepwise Prosedur forward seperti yang dijelaskan sebelumnya akan menghasilkan model dengan fungsi basis dengan jumlah yang sangat banyak. Dalam prakteknya, biasanya maksimum banyaknya fungsi basis yang akan digunakan dalam model dibatasi. Demikian juga dengan derajat interaksi, yang seringkali hanya dibatasi hanya sampai derajat tiga. Dengan pembatasan tersebut, prosedur forward tersebut tetap memberikan model dengan fungsi basis yang sangat banyak. Terkait dengan model yang kompleks ini, harus dilakukan penghapusan beberapa fungsi Universitas Sumatera Utara basis, sehingga dapat dihasilkan model yang lebih sederhana. Prosedur backward dilakukan untuk tujuan ini. Prosedur backward dilakukan dengan tahap-tahap berikut: a. Mulai dari model yang diperoleh pada tahap prosedur forward yang memiliki m fungsi basis. b. Hapus salah satu fungsi basis tidak konstan yang memiliki kontribusi terkecil. Berdasarkan kriteria kuadrat terkecil, fungsi basis yang memiliki kontribusi terkecil adalah fungsi basis yang jika dihilangkan dari model sebelumnya akan menyebabkan terjadinya penurunan jumlah kuadrat sisaan terkecil. c. Ulangi langkah b, sampai model hanya mengandung fungsi basis konstan. Prosedur backward ini menghasilkan sekuens model yang tersarang, f m m =1,2,…. Model terbaik ditentukan berdasarkan kriteria Generalized Cross Validation GCV yang diperkenalkan oleh Wahba pada tahun 1979. Fungsi GCV didefinisikan sebagai berikut : 2.8 dengan : M = jumlahfungsi basis = variabel prediktor = variabel respon N = banyaknya pengamatan Universitas Sumatera Utara Trace +1

2.8.3 Uji Signifikansi Basis Fungsi Model MARS