Aplikasi Spline Truncated dalam Regresi Nonparametrik

BAB 1
PENDAHULUAN

1.1 Latar Belakang

Dalam Statistika, analisis regresi digunakan untuk melihat pengaruh variabel
bebas terhadap variabel terikat. Sebelum melakukan analisis lebih lanjut harus
dilihat terlebih dahulu pola hubungan variabel tersebut. Hal ini dapat dilakukan
melalui

dua

pendekatan

yaitu

pendekatan

parametrik

dan


pendekatan

nonparametrik. Pendekatan parametrik atau biasa disebut dengan regresi
parametrik digunakan apabila diasumsikan bahwa bentuk model sudah ditentukan
atau pola data sudah diketahui bentuknya. Namun pada kenyataannya tidak semua
data diketahui pola hubungannya secara jelas atau bentuk model belum ditentukan.
Apabila teknik pendekatan parametrik tetap digunakan sebagai model pola data,
maka akan diperoleh hasil yang menyesatkan, sehingga pendekatan alternatif yang
digunakan adalah pendekatan nonparametrik atau biasa disebut regresi
nonparametrik. Regresi nonparametrik merupakan pendekatan regresi yang sesuai
untuk pola data yang tidak diketahui bentuknya, atau bisa dikatakan tidak terdapat
informasi apapun tentang bentuk dari fungsi regresi. Pendekatan nonparametrik
juga lebih fleksibel, hal ini dikarenakan tidak dibatasi oleh asumsi-asumsi seperti
halnya pada pendekatan parametrik.

Pada umumnya statistik nonparametrik sering digunakan pada uji-uji
hipotesis dan penggunaannya pada analisis regresi juga tidak dibahas secara
khusus, padahal banyak teknik estimasi yang bisa digunakan untuk mengestimasi
parameter-parameter model regresinya. Maka dalam hal ini dirasa perlu untuk

mempelajari penggunaan teknik estimasi dalam menentukan model regresi
nonparametrik. Salah satu teknik estimasi dalam regresi nonparametrik adalah
estimator spline. Spline adalah salah satu jenis piecewise polinomial, yaitu
polinomial yang memiliki sifat tersegmen. Kelebihan sifat tersegmen ini

memberikan fleksibilitas lebih dari polinomial biasa, sehingga memungkinkan
untuk menyesuaikan diri secara lebih efektif terhadap karakteristik lokal suatu
fungsi atau data. Spline juga mempunyai keunggulan dalam mengatasi pola data
yang cenderung naik/turun secara tajam, serta kurva yang dihasilkan relatif mulus.
Spline truncated adalah basis fungsi dalam spline yang merupakan model
polinomial yang tersegmen atau terbagi pada suatu titik fokus yang disebut knot.
Untuk memperoleh regresi spline yang optimal maka perlu dipilih lokasi knot
yang optimal pula. Masalah yang dihadapi dalam estimasi kurva adalah dalam
memilih parameter λ (pemulus) yang pada hakekatnya memilih lokasi titik-titik
knot juga.
Untuk nilai λ yang sangat besar akan menghasilkan bentuk kurva regresi
yang sangat halus. Sebaliknya untuk nilai λ yang kecil akan memberikan bentuk
kurva regresi yang sangat kasar, akibatnya pemilihan parameter penghalus
optimal merupakan hal yang sangat penting dalam regresi nonparametrik. Tujuan
dari pendekatan regresi nonparametrik, yakni ingin mendapatkan kurva mulus

yang mempunyai λ optimal menggunakan data amatan sebanyak n, maka
diperlukan ukuran kinerja atas estimator yang dapat diterima secara universal.
Ada banyak metode untuk menentukan parameter pemulus, beberapa di antaranya
adalah MSE (Mean Square Error) dan GCV (Generalized Cross Validation). Titik
knot optimal diperoleh dari nilai MSE dan GCV yang paling minimum. MSE
merupakan metode pemulus optimal yang paling sederhana, meskipun begitu
penggunaan MSE sangat jarang digunakan secara khusus untuk memilih titik knot
yang optimal, sedangkan GCV merupakan modifikasi dari CV (Cross Validation)
dan merupakan metode yang paling banyak dipakai dan disukai karena
kelebihannya yaitu memiliki sifat optimal asimtotik (Wahba, 1990, dalam
Oktaviana dan Budiantara, 2011).

Pada penelitian ini akan dibahas tentang penggunaan estimasi spline
truncated dalam menentukan model terbaik regresi nonparametrik dengan
penyelesaian optimal dan pemilihan parameter penghalus dengan menggunakan
metode MSE dan metode GCV.

1.2 Rumusan Masalah

Sesuai dengan latar belakang masalah yang telah diuraikan maka yang menjadi

pokok permasalahan dalam penelitian ini adalah bagaimana cara penggunaan
estimator spline dengan basis truncated dalam menentukan model regresi dengan
menggunakan MSE dan GCV sebagai metode pemulus optimal dalam menentukan
model regresi terbaik dan melihat metode mana yang menghasilkan nilai yang
paling minimum, serta penerapannya pada data.

1.3 Batasan Masalah

Dalam menentukan estimator spline digunakan basis fungsi truncated, dan untuk
menentukan nilai parameter-parameternya digunakan metode kuadrat terkecil
dengan pendekatan matriks, sedangkan metode yang dipakai untuk menentukan
parameter penghalus adalah metode MSE dan GCV. Adapun data yang digunakan
adalah data sekunder yang diperoleh dari Laboratorium Terpadu Departemen
Fisika Universitas Sumatera Utara, yakni pengaruh lama waktu (menit) yang
diberikan sebagai variabel bebas terhadap perubahan tegangan output sensor
polimer (mv) sebagai variabel terikat dan hanya akan mencari model regresi
spline linier terbaik dengan satu titik knot, dan dua titik knot menggunakan
metode MSE dan GCV. Untuk mengetahui apakah parameter penghalus memiliki
pengaruh terhadap model yang didapat atau tidak, digunakan uji hipotesis yaitu uji
simultan dan uji normalitas Kolmogorov-Smirnov.


1.4 Tujuan Penelititan

Sesuai dengan rumusan masalah yang dikemukakan sebelumnya, tujuan dari
penelitian ini adalah untuk mengkaji bentuk estimator spline dengan basis
truncated dalam menentukan model regresi dengan menggunakan MSE dan GCV
sebagai metode pemulus optimal dalam menentukan model regresi terbaik, dan

menentukan metode terbaik dalam menghasilkan nilai yang paling minimum,
serta penerapannya pada data.

1.5 Manfaat Penelitian

Penelitian ini dilakukan untuk menambah pengetahuan serta memperkaya literatur
mengenai analisis regresi nonparametrik sehingga dapat menjadi referensi untuk
penelitian

selanjutnya,

baik


dalam

penentuan estimator model

nonparametrik ataupun penerapannya pada data rill.

regresi