ISBN: 978-602-19590-2-2
PERBANDINGAN ESTIMATOR KERNEL DAN ESTIMATOR SPLINE DALAM MODEL REGRESI
NONPARAMETRIK
I KOMANG GDE SUKARSA
1
, I GUSTI AYU MADE SRINADI
2
, NI LUH AYU PUSPA LESTARI
3
1
Jurusan Matematika Universitas Udayana, sukarsakomangyahoo.com
2
Jurusan Matematika Universitas Udayana, srinadiigustiayumadeyahoo.co.id
3
Alumni Jurusan Matematika Universitas Udayana, ayu.p.lestari3975yahoo.com
Abstrak
Analisis regresi nonparametrik merupakan metode pendugaan kurva regresi yang digunakan jika tidak ada informasi sebelumnya tentang bentuk kurva regresi atau tidak
terikat pada asumsi bentuk fungsi tertentu. Estimasi fungsi regresi nonparametrik dilakukan berdasarkan data pengamatan dengan menggunakan teknik pemulusan
smoothing
. Penelitian ini bertujuan untuk membandingkan estimator kernel dan estimator
spline
pada data sekunder, yaitu data
motorcycle
. Hasil penelitian ini menunjukkan bahwa estimator kernel lebih baik dibandingkan estimator
spline
dalam mengestimasi kurva regresi nonparametrik. Dalam estimator kernel, estimasi dilakukan
pada setiap titik data sehingga menghasilkan kurva yang lebih mulus, sedangkan spline merupakan potongan-potongan polinomial yang digabungkan bersama pada setiap titik
knot.
Kata Kunci
: Regresi Nonparametrik,
Smoothing
, Estimator Kernel, Estimator Spline, titik knot
1. Pendahuluan
Misalkan X adalah variabel prediktor dan Y adalah variabel respon untuk n pengamatan berpasangan
n i
i i
y x
1
,
, maka hubungan linear antara variabel prediktor dan variabel respon tersebut dapat dinyatakan sebagai berikut:
i i
i
x m
y
,
i
=1,2,...,n 1
dengan
i
adalah sisaan yang diasumsikan independen dengan mean nol dan variansi
2
, serta
i
x m
adalah fungsi regresi atau kurva regresi, Eubank [2]. Ada dua pendekatan yang digunakan untuk mengestimasi fungsi regresi, yaitu
pendekatan parametrik dan pendekatan nonparametrik. Dalam pendekatan parametrik, bentuk hubungan antara variabel respon dengan variabel prediktor diketahui atau
diperkirakan dari bentuk kurva regresi, misalnya diasumsikan membentuk pola linear, kuadratik, eksponensial, dan polinomial. Pada regresi parametrik yaitu model regresi
linear, juga harus memenuhi asumsi yang ketat diantaranya sisaan berdistribusi normal dan memiliki variansi yang konstan. Transformasi sering dilakukan untuk mengatasi pe-
581
KNM XVI - 3-6 Juli 2012
– UNPAD, Jatinangor
nyimpangan asumsi dalam model regresi linear sehingga diperoleh model regresi yang sesuai. Bentuk atau fungsi dipilih melalui teknik
trial
dan
error
sehingga penggunaan transformasi yang tepat akan membawa pada metode pendugaan yang relatif mudah,
tetapi kesalahan penggunaan transformasi bisa juga membawa pada metode pendugaan dengan model yang lebih rumit, Neter et al [7]. Pendekatan kedua adalah pendekatan
nonparametrik. Estimasi fungsi regresi nonparametrik dilakukan berdasarkan data pengamatan dengan menggunakan teknik pemulusan
smoothing
. Terdapat beberapa teknik
smoothing
dalam model regresi nonparametrik antara lain histogram, estimator kernel, deret orthogonal, estimator
spline
, k-NN, deret fourier, dan wavelet, Eubank [2]. Macam-macam fungsi kernel meliputi kernel
Uniform
,
Triangle
,
Epanechnikov
,
Gaussian
, kuartik, dan cosines, Hardle [4]. Dalam regresi kernel pemilihan parameter pemulus
bandwidth
jauh lebih penting dibandingkan dengan memilih fungsi kernel. Fungsi kernel yang umum digunakan adalah kernel Gaussian dan kernel Epanechnicov,
Hastie dan Tibshirani [5]. Kernel
Triangle
sering digunakan karena lebih mudah dan cepat dalam perhitungan, Mathsoft [6]. Sedang salah satu bentuk estimator
spline
yang sering digunakan adalah
Penalized Spline
, Ruppert [8]. Tujuan yang ingin dicapai dalam penelitian ini adalah membandingkan estimator
kernel dan estimator
spline
dalam mengestimasi model regresi nonparametrik pada data sekunder berdasarkan kriteria MSE, RMSE, dan MAD.
2. Tinjauan Pustaka