Pemilihan Jumlah Knot Optimal Ukuran Ketepatan Estimator

KNM XVI - 3-6 Juli 2012 – UNPAD, Jatinangor                                                                1 1 1 2 1 2 1 2 2 2 2 1 2 1 1 1 1 2 1 1 1 2 1 1 1 1 K p p p p K n p n p n n n p K p p p K p p n x x x x x x x x x x x x x x x x m x m x m                      sehingga  X X m  Estimator penalized spline dari X m dapat dituliskan sebagai ˆ ˆ X X m  Nilai  ˆ diperoleh dengan menggunakan Estimator Penalized Spline yaitu meminimumkan fungsi Penalized Least Square PLS:       K k k p n i i i x m y 1 2 2   4 dengan  adalah suatu parameter pemulus, K adalah jumlah knot, dan p adalah orde polinomial. Dengan meminimumkan fungsi PLS pada persamaan 4, sehingga diperoleh  ˆ , yaitu:   Y X D X X T T 1 ˆ      Bentuk estimasi dari fungsi ˆ X m menurut Wand dan Jones [9], secara matriks dituliskan sebagai :   Y X D X X X X m T T 1 ˆ    

2.3 Pemilihan Parameter Pemulus

 Optimal Parameter  merupakan pengontrol keseimbangan antara kecocokan terhadap data goodness of fit dan kemulusan kurva penalty. Jika  besar maka estimasi fungsi yang diperoleh akan semakin mulus, namun kemampuan untuk memetakan data tidak terlalu baik. Sebaliknya, jika  kecil maka estimasi fungsi yang diperoleh akan semakin kasar, Fahrmeir dan Tuhtz [3]. Oleh karena itu, dalam memilih nilai  diharapkan nilainya optimal agar diperoleh estimasi fungsi yang mulus dan pemetaan data yang baik. Suatu kriteria untuk  akan dibatasi pada kelas estimator linier, yaitu: Y H m    dengan   T T X D n X X X H 1      dimana untuk setiap  ada matriks pemulus H    berukuran n × n dengan H    simetri dan semidefinit positif. Identik dengan penentuan bandwith h optimal dalam estimator Kernel, untuk mendapatkan  optimal digunakan metode Generalized Cross Validation GCV, Eubank [2] yang didefinisikan sebagai berikut: 2 1 ] [    H I tr n MSE GCV    dengan      n i i i x m y n MSE 1 2 1  

2.4 Pemilihan Jumlah Knot Optimal

Jumlah knot   K merupakan banyaknya titik knot atau banyaknya titik dimana terjadi perubahan perilaku fungsi pada interval yang berbeda. Dengan knot ke-k adalah kuantil ke-j dari nilai tunggal variabel prediktor   n i i x 1  , dimana   1   K k j yang dibulatkan pada bilangan bulat terdekat. Sehingga dalam penalized spline, penentuan jumlah knot sangat berpengaruh untuk menentukan titik knot dalam fungsi tersebut. Algoritma yang dapat digunakan untuk memilih jumlah knot K optimal adalah algoritma Full-Search, Ruppert [8]. Dalam algoritma Full-Search, jumlah knot yang dihitung 584 ISBN: 978-602-19590-2-2 diurut dari 1  K sampai dengan 1    p n K uniq , dimana uniq n adalah banyaknya nilai tunggal dari variabel prediktor   n i i x 1  , sehingga jumlah knot K kurang dari jumlah pengamatan.

2.5 Ukuran Ketepatan Estimator

Untuk menentukan kebaikan suatu estimator dapat dilihat dari tingkat kesalahannya. Semakin kecil tingkat kesalahannya semakin baik estimasinya. Menurut Aydin [1], kriteria untuk menentukan estimator terbaik dalam model regresi nonparametrik, antara lain: a. Mean Square Error MSE, MSE =         n i i i n i i y y n e n 1 2 1 2 ˆ 1 1 b. Root Mean Square Error RMSE, RMSE = MSE c. Mean Absolute Deviation MAD, MAD = n y y n e n t i i n t t       1 1 ˆ Data yang digunakan dalam penelitian ini adalah data sekunder, hasil penelitian yang dilakukan oleh Schmidt, Mattern, dan Schuler pada tahun 1981 yaitu data simulasi tabrakan sepeda motor pada suatu Post Mortem Human Test Object PTMO, Hardle [4] untuk melihat kurva hubungan antara percepatan setelah tabrakan dengan waktu setelah terjadinya tabrakan dengan estimator Kernel Gaussian. Variabel dalam penelitian ini adalah variabel prediktor X yaitu waktu dalam milidetik setelah simulasi tabrakan, dan variabel respon Y yaitu percepatan g = 9,81 ms 2 setelah tabrakan yang disimulasikan. Model regresi nonparametrik dalam penelitian ini, diestimasi menggunakan estimator kernel dengan fungsi kernel Triangle dan kernel Gaussian, serta estimator penalized spline . Adapun langkah-langkah yang dilakukan adalah sebagai berikut: i Mengestimasi kurva regresi nonparametrik dengan estimator kernel Triangle . ii Mengestimasi kurva regresi nonparametrik dengan estimator kernel Gaussian. iii Mengestimasi model regresi nonparametrik dengan estimator penalized spline . iv Membandingkan hasil estimasi antara estimator kernel dan estimator spline berdasarkan kriteria MSE, RMSE, dan MAD, serta membandingkan plot estimasi kurva regresi bersama-sama dengan plot data.

3. Hasil