ESTIMATOR CAMPURAN KERNEL DAN SPLINE TRUNCATED LINIER MULTIVARIABEL DALAM REGRESI NONPARAMETRIK (Studi Kasus : Model Rata-Rata Lama Sekolah di Provinsi Jawa Tengah) - ITS Repository

  TESIS - SS14 2501 SS14 2501 ESTIMATOR CAMPURAN KERNEL DAN SPLINE TRUNCATED LINIER MULTIVARIABEL DALAM REGRESI NONPARAMETRIK

(Studi Kasus : Model Rata-Rata Lama Sekolah di Provinsi Jawa

Tengah) ALI AKBAR SANJAYA ILHAM PURNOMO NRP. 1314201701 DOSEN PEMBIMBING : Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Bambang Widjanarko Otok, M.Si.

  PROGRAM MAGISTER JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

  INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2016

  TESIS - SS14 2501 SS14 2501 MIXED ESTIMATOR OF KERNEL AND

MULTIVARIABEL LINIER SPLINE TRUNCATED IN

NONPARAMETRIC REGRESSION

(Case Study : Mean Years of Scholling Model in Central Java

Province) ALI AKBAR SANJAYA ILHAM PURNOMO NRP. 1314201701

  SUPERVISOR Prof. Dr. Drs. I Nyoman Budiantara, M.Si. Dr. Bambang Widjanarko Otok, M.Si.

  MASTER PROGRAM DEPARTMENT OF STATISTICS FACULTY OF MATHEMATICS AND NATURAL SCIENCE

  INSTITUTE OF TECHNOLOGY SEPULUH NOPEMBER SURABAYA 2016

DAFTAR ISI

  Halaman ABSTRAK i

  ABSTRACT iii

  KATA PENGANTAR v

  DAFTAR ISI vii

  DAFTAR TABEL ix

  DAFTAR GAMBAR x

  BAB 1. PENDAHULUAN

  1

  1.1 Latar Belakang

  1

  1.2 Perumusan Masalah

  8

  1.3 Tujuan Penelitian

  8

  1.4 Manfaat Penelitian

  8

  1.5 Batasan Permasalahan

  9 BAB 2. TINJAUAN PUSTAKA

  11

  2.1 Pemodelan Regresi Parametrik dan Nonparametrik

  11

  2.2 Regresi Nonparametrik Spline Truncated

  12

  2.3 Regresi Nonparametrik Kernel

  13

  2.4. Estimator Campuran Spline dan Kernel

  15

  2.5 Teorema Dasar Terkait dengan Aljabar Matriks

  19

  2.6 Tinjauan Non Statistika

  19 BAB 3. METODE PENELITIAN

  23

  3.1

  23

  3.1 Sumber Data

  3.2

  23

  3.2 Variabel Penelitian

  3.3

  23

  3.3 Definisi Operasional Variabel Penelitian

  3.4

  26

  3.4 Tahapan Penelitian

  BAB 4. HASIL DAN PEMBAHASAN

  31

  4.1 Bentuk Model Regresi Campuran Kernel dan Spline Truncated

  31 Multivariabel

  4.2 Estimasi Kurva Regresi Campuran Kernel dan Spline

  33 Truncated Linier Multivariabel

vii Halaman

  39

  4.3 Aplikasi pada Model Rata-rata Lama Sekolah di Provinsi Jawa Tengah

  4.3.1 Analisis Dekriptif

  40

  4.3.2 Model Regresi Campuran Kernel dan Spline

  44 Truncated Linier Multivariabel

  4.3.2.1 Pemilihan Titik Knot dan Bandwidth

  44 Optimal dengan Satu Titik Knot

  4.3.2.2 Pemilihan Titik Knot dan Bandwitdth

  45 Optimal dengan Dua Titik Knot

  4.3.2.3 Pemilihan Titik Knot dan Bandwitdth

  47 Optimal dengan Tiga Titik Knot

  4.3.3 Penaksiran Parameter Model Regresi Campuran

  49 Kernel dan Spline Truncated Linier Multivariabel

  BAB 5 KESIMPULAN DAN SARAN

  53

  5.1 Kesimpulan

  53

  5.2 Saran

  55 DAFTAR PUSTAKA

  57 LAMPIRAN

  63 BIOGRAFI PENULIS

  87

  

viii

  

ix

DAFTAR TABEL

  Tabel Judul Halaman

Tabel 3.1. Konversi Tahun Pendidikan Tertinggi yang ditamatkan

  24 Tabel 4.1 Statistik Deskriptif Variabel Respon dan Variabel Prediktor

  40 Tabel 4.2 Nilai GCV dengan Satu Titik Knot

  45 Tabel 4.3 Nilai GCV dengan Dua Titik Knot

  46 Tabel 4.4 Nilai GCV dengan Tiga Titik Knot 47-48

Tabel 4.5 Perbandingan Nilai GCV Minimum

  49 Tabel 4.6 Estimasi Parameter

  50

  

DAFTAR GAMBAR

  Gambar Judul Halaman

Gambar 2.1 Spline truncated dengan tiga titik knots

  13 Gambar 2.2 Visualisasi fungsi kernel dengan berbagai besaran

  15

  bandwidth (Guidoum, 2015; data dari Olver et al.,

  2010)

Gambar 3.1 Langkah-langkah Tahapan Analisis untuk Tujuan

  29 Pertama

Gambar 3.2 Langkah-langkah Tahapan Analisis untuk Tujuan

  30 Kedua

Gambar 4.1 Scatter Plot antara Rata-rata Lama Sekolah (Y)

  41 dengan Rata-rata Pengeluaran perkapita (X ). 1 Gambar 4.2 Scatter Plot antara Rata-rata Lama Sekolah (Y)

  41 dengan Pesentase Pengeluaran Pemerintah Daerah (APBD) di Bidang Pendidikan (X 2 ).

Gambar 4.3 Scatter Plot antara Rata-rata Lama Sekolah (Y)

  42 dengan Rasio Jumlah Murid dengan jumlah Sekolah tingkat SLTA (X 3 ).

Gambar 4.4 Scatter Plot antara Rata-rata Lama Sekolah (Y)

  42 dengan Rasio Jumlah Murid dengan jumlah Guru tingkat SLTA (X 4 ).

Gambar 4.5 Scatter Plot antara Rata-rata Lama Sekolah (Y)

  43 dengan Rata-rata Anggota Rumah Tangga (t).

DAFTAR LAMPIRAN

  Tabel Judul Halaman Data Regresi Campuran Kernel dan Spline Truncated Linier Lampiran 1.

  63 Multivariabel Lampiran 2 Program Regresi Campuran Kernel dan Spline Truncated

  65 Linier Multivariabel 1 Titik Knot Menggunakan Software R Lampiran 3 Program Regresi Campuran Kernel dan Spline Truncated

  69 Linier Multivariabel 2 Titik Knot Menggunakan Software R Lampiran 4 Program Regresi Campuran Kernel dan Spline Truncated

  74 Linier Multivariabel 3 Titik Knot Menggunakan Software R Output Hasil Program Regresi Campuran Kernel dan Spline

  Lampiran 5

  79 Truncated Linier Multivariabel 1 Titik Knot Menggunakan

  Software R

  Lampiran 6 Output Hasil Program Regresi Campuran Kernel dan Spline

  81 Truncated Linier Multivariabel 2 Titik Knot Menggunakan Software R Output Hasil Program Regresi Campuran Kernel dan Spline

  Lampiran 7

  83 Truncated Linier Multivariabel 3 Titik Knot Menggunakan

  Software R

xi

KATA PENGANTAR

  Alhamdulillah, puji syukur penulis panjatkan ke kehadirat Allah SWT, atas segala limpahan rahmat dan kemurahan-Nya penulis dapat menyelesaikan tesis dengan judul “Estimator Campuran Kernel dan Spline Truncated Linier

  

Multivariabel Dalam Regresi Nonparametrik (Studi Kasus : Model Rata-rata

Lama Sekolah di Provinsi Jawa Tengah)

  ”. Penyelesaian Tesis ini tak lepas dari peranan, dukungan dan motivasi berbagai pihak. Oleh karena itu pada kesempatan ini penulis ingin menyampaikan terima kasih yang sedalam-dalamnya secara khusus kepada istriku yang sholehah : Dewi Yanti, beserta tiga cahaya dan penyejuk hati kami: Adam Surya Permana, Adinda Alya Putri dan Dimas Muhammad Ilham, terima kasih atas kasih sayang, doa, perhatian dan semangat yang selalu mencerahkan hati penulis. Ibunda di Solo dan kedua mertua di Buntok yang sangat saya cintai dan hormati. Terima kasih atas segala cinta, pendidikan, doa dan motivasi yang tiada henti. Selanjutnya penulis ingin menyampaikan rasa terimakasih kepada :

  1. Bapak Prof. Drs. Nur Iriawan, M.Ikom., Ph.D selaku dosen wali selama penulis menempuh pendidikan pasca sarjana di ITS.

  2. Bapak Prof. Dr. Drs. I Nyoman Budiantara, M.Si dan Bapak Dr. Bambang Widjanarko Otok, M.Si. selaku dosen pembimbing atas motivasi dan kesabarannya dalam mengarahkan penulis dalam menyelesaikan tesis ini.

  3. Ibu Dr. Vita Ratnasari, M.Si., Bapak Dr. Sutikno, M.Si dan Ibu Dr. Erni Tri Astuti, M.Math selaku dosen penguji yang telah memberikan banyak saran dan masukan terhadap tesis ini.

  4. Bapak Dr. Suhartono, M.Sc, selaku ketua Jurusan Statistika FMIPA ITS, atas segala kemudahan urusan akademis dan fasilitas yang menunjang di Jurusan Statistika ini.

  5. Segenap Staf Pengajar dan Pegawai di Jurusan Statistika dan Matematika FMIPA ITS, spesial thanks buat Pak Irul atas pelayanannya yang tulus dan ramah.

  6. Bapak Kepala Badan Pusat Statistik (BPS) RI beserta seluruh jajarannya, atas kesempatan yang diberikan kepada penulis untuk melanjutkan pendidikan.

  14. Rekan – rekan seperjuangan Tesis Regresi Nonparametrik, Rory, Rismal dan Sulis , atas ketulusan, motivasi dan kesiapan membantu penulis.

  Semoga tesis ini dapat bermanfaat dan dapat menambah wawasan keilmuan. Penulis menyadari bahwa tesis ini masih jauh dari sempurna. Saran dan kritik yang membangun dari semua pihak, sangat penulis harapkan untuk perbaikan.

  17. Semua pihak yang telah membantu selama penulis menyelesaikan studi, yang tidak dapat penulis sampaikan satu persatu.

  16. Rekan-rekan Angkatan 9, atas dukungan selama Seminar proposal dan Seminar hasil.

  , atas bantuan dan diskusinya selama penyusunan tesis ini.

  1

  15. Dik Irwan dan adik-adik S

  13. Mas Fatih, selamat atas kelahiran putri pertamanya menjelang sidang tesis.

  7. Bapak Kepala BPS Provinsi Kalimantan Tengah, atas ijin dan kesempatan yang diberikan kepada penulis untuk melanjutkan studi.

  12. Bu bendahara Afni, Maul, Anita juga Vivin.

  Share tugasnya jangan malam banget, sudah ngantuk nich..

  11. Penghuni Mabes Cewek, Eunike, Widi, Santi, Yanti, Yani, Dian n Mpih.

  10. Penghuni Classic, Mas Muryanto, Mas arip and Daeng Zablin.

  9. Penghuni MABES, Mas Duto, Mas Henry, Uda Rory and Mas Aan, atas kekeluargaan yang dijalin selama kita di Surabaya.

  8. Rekan-rekan senasib seperjuangan (Postgraduate BPS angkatan ke-8), atas kekompakan, kerjasama dan kenangan suka duka selama menyelesaikan studi. Masuk bareng, keluar bareng.

  Surabaya, Januari 2016 Penulis

  

ESTIMATOR CAMPURAN KERNEL DAN SPLINE

TRUNCATED LINIER MULTIVARIABEL DALAM REGRESI

NONPARAMETRIK

  (Studi Kasus : Model Rata-Rata Lama Sekolah di Provinsi Jawa Tengah) Nama Mahasiswa : Ali Akbar Sanjaya Ilham Purnomo NRP : 1314201701 Pembimbing 1 : Prof. Dr. Drs. I Nyoman Budiantara, M.Si Pembimbing 2 : Dr. Bambang Widjanarko Otok, M.Si

  ABSTRAK Hubungan variabel respon dengan beberapa variabel prediktor pada regresi nonparametrik tidak selalu menggunakan satu jenis pendekatan seperti spline, kernel, atau deret fourier. Dalam model regresi memungkinkan variabel respon mengikuti kurva regresi nonparametrik yang berbeda antara satu variabel prediktor dengan variabel prediktor lainnya. Pada data berpasangan (x ,..x ,t ,y )

  1i pi i i

  yang hubungan antar variabel prediktor x ,..x , t , dan variabel respon y

  1i pi i i

  mengikuti model regresi nonparametrik additif: q

         

y x ,..., , x t f x g t   , i = 1,2,…,n

i i qi i i pi i i

   1   p 1 Komponen prediktor x ,..x dihampiri dengan fungsi Spline truncated linier

  1i qi,

  sedangkan komponen prediktor t dihampiri dengan fungsi kernel. Tujuan

  i

  penelitian ini adalah mencari bentuk estimator campuran kernel dan spline

truncated linier multivariabel untuk mengestimasi kurva regresi nonparametrik.

Penurunan estimator model dengan menggunakan metode Ordinary Least Square

  (OLS). Hasil estimator yang diperoleh adalah : q fA   y p pi ( ) x  , 

   p 1 g ˆ  y   ,   t D   q

  ˆ f g

   x   ˆ

  ˆ( , ) t x   t

i i p   pi i

p 1 Estimator campuran kernel dan regresi spline truncated linier

  multivariabel bergantung pada titik-titik knot dan bandwidth. Estimator campuran kernel dan regresi spline multivariabel terbaik diperoleh dari titik-titik knot dan parameter bandwidth yang optimal. Estimator Campuran Kernel dan regresi Spline truncated multivariabel diaplikasikan pada data Rata-Rata Lama Sekolah

  2

  di Propinsi Jawa Tengah dengan dua titik knot optimal menghasilkan nilai R sebesar 0,909313.

  Kata kunci:

  Regresi Nonparametrik, Estimator campuran, Spline, Kernel, Rata- Rata Lama sekolah

  

i

  

ii

“Halaman ini sengaja dikosongkan”

  

MIXED ESTIMATOR OF KERNEL AND

MULTIVARIABLE LINEAR SPLINE TRUNCATED

IN NONPARAMETRIC REGRESSION

  (Case Study : Mean Years of Schooling Model In Central Java Province) By : Ali Akbar Sanjaya Ilham Purnomo Student Identity Number : 1314201701 Supervisor : Prof. Dr. Drs. I Nyoman Budiantara, M.Si Co Supervisor : Dr. Bambang Widjanarko Otok, M.Si

  ABSTRACT

  The relationship of respond variable with some predictor variables is not always using only single approach such as spline, kernel or Fourier series. In the regression model allows the response variable to follow different nonparametric regression curve between the predictor variables and other predictor variables. Data given in pairs ( x , .. x , t , y ) the relationship

  1i qi i i between the predictor variables x 1i , .. x qi , t i , and the response variable y i follow additive nonparametric regression model : q

      

yx ,..., , x tf x g t  , i = 1,2,…,n

i 1 i qi ii   pi i i  

   p 1 Predictor component , x .. x , approached using Spline Functions linear 1i qi predictor component while t approached by the kernel function . This i research was conducted with the purpose of seeking estimator truncated form of linear spline and kernel to estimate the nonparametric regression curve. Estimator models obtained using Ordinary Least Square method ( OLS ) . The Estimator regression curves are : q

  

A y

f   

  ( ) x  ,   p pi p 1 g y

  ˆ    ,   t D   q ˆ x f g

   tx  ˆ t

  ˆ( , )  

i i p   pi i

p 1 Mixed Estimator Kernel and multivariable Linier Spline Truncated rely heavily on points knots and bandwidth. Mixed Estimator Kernel and multivariable Linier Spline Truncated is the finest in determining optimal point’s knots and bandwidth. Mixed Estimator Kernel and multivariable Linier Spline Truncated application in Mean Years of Schooling Model

  Central Java Province have R-Square 0,909313. Key words : Nonparametric regression, Spline, Mixed Estimator, Kernel,

  Mean Years of Scholling

  

iii

  

iv

“Halaman ini sengaja dikosongkan”

BAB 1 PENDAHULUAN

1.1 Latar Belakang

  Dalam beberapa masalah terdapat dua atau lebih variabel yang hubungannya tidak dapat dipisahkan, maka hal tersebut biasanya akan diselidiki sifat hubungannya. Analisis Regresi adalah sebuah teknik statistik untuk membuat model dan menyelidiki hubungan antara dua variabel atau lebih. Misalnya Y adalah variabel respon dan X adalah variabel prediktor, untuk n buah pengamatan, secara umum antara y dengan x dihubungkan dengan model regresi berikut :

  i i y i = f (x i ) + ε i , i = 1, ..., n (1.1)

  dimana ε adalah error random dan f (x ) merupakan suatu fungsi

  i i f yang tidak

  diketahui dan disebut kurva regresi. Jika kurva regresi diketahui bentuknya, maka disebut sebagai regresi parametrik dan apabila model yang diasumsikan ini benar, maka pendekatan regresi parametrik sangat efisien, tetapi jika tidak, menyebabkan interpretasi data yang menyesatkan (Hardle,1990). Apabila tidak ada informasi apapun tentang bentuk kurva f(x i ), maka pendekatan yang digunakan adalah regresi nonparametrik. Dalam regresi parametrik terdapat asumsi yang sangat kaku dan kuat, yaitu bentuk kurva regresi diketahui, misalnya linear, kuadratik, kubik, polinomial derajat-p, eksponen, dan lain-lain. Untuk memodelkan data menggunakan regresi parametrik linear, kuadrat, kubik atau yang lain, umumnya dimulai dengan membuat scatter plot (Budiantara, 2006). Apabila scatter plot ini terdapat kecenderungan data mengikuti pola linear maka digunakan model regresi (parametrik) linear, sebaliknya jika scatter plot data terdapat kecenderungan pola kuadratik maka digunakan model regresi (parametrik) kuadratik, dan seterusnya. Disamping memperhatikan pola kecenderungan data melalui scatter plot, dalam regresi parametrik harus memiliki informasi masa lalu yang detail tentang pola data agar diperoleh pemodelan yang baik (Wahba, 1990; Eubank, 1999; Kayri & Zirhhoglu, 2009; Budiantara, 2009). Pendekatan regresi parametrik memiliki sifat yang sangat baik dari pandangan Statistika inferensi (Budiantara, 2009), seperti sederhana, mudah interpretasinya, parsimoni, estimatornya tidak bias, tergolong estimator linear, efisien, konsisten, BLUE (Best Linear Unbiased Estimator), yang sangat jarang dimiliki oleh pendekatan regresi lain seperti regresi nonparametrik dan regresi semiparametrik. Kelebihan yang dimiliki oleh regresi parametrik inilah yang menyebabkan model regresi parametrik sangat populer dan sangat disukai oleh berbagai kalangan, baik dari golongan Statistika teoritis maupun golongan Statistika aplikasi (Becher, dkk., 2009; Huang & Liu, 2006).

  Pendekatan regresi parametrik untuk tujuan pemodelan dan prediksi tidak tepat pada suatu variabel respon dan variabel prediktor yang bentuk pola hubungannya tidak jelas (tidak mengikuti pola tertentu), dan seolah-olah tidak beraturan (Budiantara, 2009). Model Statistika diharapkan sedapat mungkin menggunakan model yang parsimoni (sederhana), tetapi dalam keadaan dimana terdapat kondisi yang mengharuskan pemodelan menggunakan model yang lebih kompleks, maka model parsimoni tidak selayaknya dipaksakan, karena hasil yang diperoleh akan sangat bias dan memiliki error yang sangat besar (Budiantara, 2009). Berbeda dengan regresi parametrik yang cenderung ada unsur pemaksaan dari peneliti dan peneliti ikut menentukan bentuk estimasi dari kurva regresi, dalam regresi nonparametrik tidak terjadi pemaksaan bentuk kurva regresi tersebut. Pendekatan regresi nonparametrik membiarkan data sendiri yang akan mencari bentuk estimasi dari kurva regresinya, tanpa harus dipengaruhi oleh faktor subyektifitas peneliti (Eubank, 1988; Budiantara, 2001). Ini berarti pendekatan model regresi nonparametrik sangat fleksibel dan obyektif.

  Ada banyak jenis estimator dalam model regresi nonparametrik, seperti kernel, spline, polinomial lokal, wavelet dan deret fourier. Beberapa penelitian mengenai estimator kernel telah dilakukan oleh banyak peneliti seperti oleh Nadaraya (1964), Watson (1964), Hadijati, (2004), Yao (2007), Okumura dan Naito (2006), Budiantara dan Mulianah, (2007) serta Kayri dan Zirhlioglu (2009), Du, Parmeter dan Racine (2012), Aljuhani dan Al Turk (2014). Penelitian mengenai estimator spline telah dilakukan oleh peneliti lain seperti Craven dan Wahba (1979), Wahba (1990), Eubank (1999), Otok (2006), Budiantara, Lestari dan Islamiyati (2010), Budiantara, Ratna, Zain dan Wibowo (2012), serta Darmawi dan Otok (2014). Penelitian tentang estimator polinomial lokal dilakukan oleh Welsh dan Yee (2006), Su dan Ullah (2008), He dan Huang

  (2009), Martins-Filho dan Yao (2009) serta Qingguo (2010). Penelitian mengenai estimator wavelet antara lain dilakukan oleh Antoniadis, Bigot dan Sapatinas (2001), Amato dan De Canditiis (2001), Rakotomamonjy, Mary dan Canu (2005) serta Taylor (2009). Penelitian untuk estimator deret fourier dilakukan oleh peneliti antara lain Faber, Douglas, Susan dan Stuart (2004), Tripena dan Budiantara (2007), Galtchouk dan Pergamenshchikov (2009) serta Ratnasari, Budiantara, Zain, Ratna dan Mariati (2015)

  Kernel merupakan estimator yang pada awalnya banyak digunakan dalam regresi nonparametrik. Kelompok peneliti pertama yang meneliti kernel diawali oleh Nadaraya (1964) dan Watson (1964). Kemudian diikuti penelitian lain dalam perkembangan regresi kernel, seperti Okumura dan Naito (2006) yang meneliti Metode smoothing kernel untuk regresi multinomial. Yao (2007) yang dalam penelitiannya telah menurunkan distribusi asimtotik dari distribusi kernel dengan menggunakan rata-rata terbobot untuk data longitudinal. Ada juga penelitian tentang estimator kernel untk melihat hubungan antara tingkat ketergantungan internet dengan lama-nya penggunaan internet setiap hari di sekolah menengah oleh Kayri dan Zirhlioglu (2009). Peneliti lain, Aljuhani dan Al Turk (2014) yang melakukan penelitian modifikasi estimasi regresi kernel adaptif Nadaraya-Watson.

  Spline pertama kali diperkenalkan oleh Whitaker pada tahun 1923 sebagai pendekatan pola data. Spline yang didasarkan pada suatu persoalan optimasi dikembangkan oleh Reinsc pada tahun 1967 (Wahba, 1990). Pendekatan spline mempunyai suatu basis fungsi, yang biasa digunakan adalah spline

  

truncated dan B-Spline. Spline truncated merupakan fungsi dimana terdapat

perubahan pola perilaku kurva yang berbeda pada interval-interval yang berbeda.

  Kelebihan spline truncated adalah dapat menggambarkan perubahan pola perilaku dari fungsi pada sub interval tertentu. Kelebihan Spline (Eubank, 1988; Budiantara, 2009; Wu dan Zhang, 2006) adalah Spline memiliki interpretasi Statistik dan interpretasi visual yang sangat khusus dan sangat baik. Model Spline diperoleh dari optimasi Penalized Least Square (PLS). Spline memiliki fleksibelitas yang tinggi. Spline mampu menangani data/fungsi yang mulus (smooth). Spline memiliki kemampuan yang sangat baik untuk menangani data yang perilakunya berubah-ubah pada sub-sub interval tertentu. Spline mempunyai kemampuan yang sangat baik untuk digeneralisasikan pada pemodelan Statistika yang kompleks dan rumit. Kelebihan lain dari spline truncated pada penelitian Otok (2006) menunjukkan kurva spline truncated lebih baik dari Multivariate

  

Adaptive Regression Spline (MARS) pada fungsi yang melibatkan satu variabel

  prediktor. Budiantara dkk (2012) Memodelkan Persentase Penduduk Miskin di Indonesia dengan menggunakan Pendekatan Regresi Nonparametrik Spline. Darmawi dan Otok (2014) dalam penelitiannya menyimpulkan nilai MSE pada kurva Spline truncated lebih kecil dibanding dengan regresi linier pada semua fungsi, hal ini berarti bahwa kurva spline truncated lebih baik dibanding dengan regresi linier.

  Estimator lain dalam regesi nonparametrik yang juga digunakan adalah polinomial lokal. Beberapa penelitian tentang polinomial lokal dilakukan oleh Welsh dan Yee (2006) yang menurukan sifat bias dan varians asimtotik dari estimator polinomial lokal tersebut dalam regresi nonparametrik dengan variabel respon lebih dari satu. Penelitian dilakukan di New Zealand dengan menggunakan variabel respon tekanan darah systolic dan diastolic untuk mengukur tingkat kegemukan buruh dan body mass index (BMI) sebagai variabel prediktor.

  Pendekatan lain adalah wavelet yang juga sering digunakan dalam regresi nonparametrik. Penelitian antara lain dilakukan oleh Antoniadis dkk (2001) yang mengkaji metode wavelet untuk memodelkan observasi dari suatu signal terkontaminasi gangguan yang berdistribusi Gauss dan bersifat aditif. Peneliti lain Rakotomamonjy (2005) yang menunjukkan evektivitas model kernel wavelet pada metode yang mengkonstruksi pada suatu ruang Hilbert untuk regresi nonparametrik ketika titik-titi sampelnya tidak sama lebar.

  Model regresi nonparametrik lain adalah deret fourier. Peneliti yang menggunakan deret fourier antara lain Oirrak (2001) yang menyatakan bahwa deret foureir memberikan estimasi secara menyeluruh dalam ruang dimensi dua dan bergerak perlahan. Kemudian, Amato, Antoniadis dan Feis (2002) menunjukan bahwa estimator deret fourier memberikan optimasi terbaik antara ketepatan dan biaya komputasi dalam model regresi nonparametrik aditif. Ratnasari, dkk (2015) dalam penelitian yang diaplikasikan dalam Data Kemiskinan di Papua menyimpulkan spline truncated lebih baik daripada deret fourier dalam model regresi nonparametrik multivariabel.

  Diantara model-model regresi nonparametrik di atas, spline truncated merupakan salah satu model yang mempunyai model interpretasi statistik dan interpretasi visual sangat khusus dan sangat baik (Budiantara dkk, 2012). Estimator spline truncated memiliki fleksibilitas yang tinggi (Eubank, 1988). Spline truncated juga memiliki kemampuan yang sangata baik menangani data yang perilakunya berubah-ubah pada sub-sub nterval tertentu (Eubank, 1988; Budiantara dkk, 2012). Estimator Kernel juga memiliki beberapa kelebihan, diantaranya estimator kernel memiliki kemampuan yang baik untuk memodelkan data yang tidak mempunyai pola tertentu (Hardle, 1990). Estimator Kernel juga memiliki kecepatan kekonvergenan yang relatif lebih cepat dibandingkan dengan kurva regresi nonparamerik yang lain seperti Polinomial Lokal, Deret Fourier maupun Spline (Hardle, 1990).

  Model-model pendekatan regresi nonparametrik yang dikembangkan oleh penelitian sebelumnya, pada dasarnya terdapat dua asumsi yang yang sangat berat dan mendasar pada modelnya, yaitu pola dari masing-masing prediktor dalam model regresi nonparametrik multivariabel prediktor dianggap mempunyai pola yang sama dan peneliti memaksakan menggunakan satu bentuk estimator model untuk setiap variabel prediktor. Dua asumsi yang digunakan dalam model regresi nonparametrik ini pada dasarnya hanya ada secara teoritis. Pada penelitian sebenarnya sering dijumpai kasus-kasus dimana terjadi pola data yang berbeda dari masing-masing variabel prediktor. Selain itu dengan hanya menggunakan satu bentuk estimator dalam mengestimasi kurva regresi nonparametrik multivariabel, berakibat estimator yang diperoleh tidak akan sesuai dengan pola data. Akibatnya, estimasi model regresi yang diperoleh tidak tepat dan cenderung mempunyai error yang besar (Budiantara, Ratnasari, Ratna dan Zain, 2015). Berdasarkan hasil-hasil penelitian diatas, Budiantara dkk. (2015) menyarankan penggunaan estimasi model kurva regresi yang sesuai dengan pola data. Dalam penelitian ini merujuk pada pengunaan model estimator campuran kernel dan regresi spline truncated linier multivariabel dalam regresi nonparametrik. Peneliti lain yang melakukan penelitian estimasi model kurva regresi yang sesuai dengan pola data juga dilakukan oleh Sudiarsa, Budiantara, Suhartono dan Purnami (2015) yang melakukan penelitian mengenai Estimator Gabungan Deret Fourier dan Truncated Spline dalam Regresi Nonparametrik Multivariabel. Dalam penelitia itu, estimator diperoleh melalui optimasi Penalized Least Square (PLS).

  Pembangunan manusia merupakan perwujudan tujuan jangka panjang dari suatu masyarakat, dan meletakan pembangunan di sekeliling manusia, bukan manusia di sekeliling pembangunan. Penyertaan konsep pembangunan manusia dalam kebijakan pembangunan tidak berarti meninggalkan berbagai strategi pembangunan terdahulu, antara lain mempercepat pertumbuhan ekonomi, mengurangi kemiskinan dan mencegah perusakan lingkungan. Perbedaannya adalah bahwa dari sudut pandang pembangunan manusia, semua tujuan tersebut diatas diletakan dalam kerangka untuk memperluas pilihan-pilihan bagi manusia.

  

Human Development Report (HDR) global telah mengembangkan dan

  menyempurnakan pengukuran statistik dari pembangunan manusia yaitu berupa Indeks Pembangunan Manusia (IPM). Indikator tersebut melihat tiga masalah pokok yang menjadi ukuran yaitu kesehatan melalui angka harapan hidup, pendidikan serta pendapatan melalui paritas daya beli. United Nations

  

Development Programme (UNDP), pada Tahun 2014 melaporkan peringkat

  Indeks Pembangunan Manusia (IPM) Indonesia berada di posisi 108 dari 187 negara yang laporkan (UNDP Report, 2014). Peringkat Indonesia secara regional masih lebih baik dari Filipina yang berada di peringkat 117 dimana keduanya masuk kelompok Medium Human Development tetapi masih di bawah empat negara ASEAN lainnya. Dimana Singapura di posisi tertinggi di peringkat 9, Brunei Darussalam berada di peringkat 30 yang menempatkan kedua Negara tersebut termasuk kelompok Very High Human Development, kemudian Malaysia berada di peringkat 62, Thailand berada di peringkat 89 termasuk kelompok High Human Development.

  Menurut publikasi BPS tahun 2013, Untuk tingkat nasional, IPM tertinggi dicapai DKI Jakarta dengan nilai 78,59 dan terendah Propinsi Papuan dengan nilai 66,25. Di Pulau Jawa setelah DKI Jakarta ditempati oleh DI Yogyakarta dengan nilai 77,37, lalu Propinsi Jawa Tengah sebesar 74,05, kemudian Propinsi Jawa Barat dengan nilai 73,58, Propinsi Jawa Timur dengan nilai 73,54 dan Terakhir Propinsi Banten dengan nilai 71,90.

  Rata-rata lama sekolah penduduk usia 15 tahun keatas merupakan salah satu variabel yang digunakan pada penghitungan IPM selain angka harapan hidup, pengeluaran perkapita dan angka melek huruf. Menurut publikasi BPS pada tahun 2013, Provinsi Jawa Tengah memiliki nilai rata-rata lama sekolah penduduk usia 15 tahun keatas yang terendah dibandingkan provinsi lain di Pulau Jawa. Tertinggi ditempati DKI Jakarta dengan rata-rata lama sekolah sebesar 11 tahun, diikuti D.I Yogyakarta sebesar 9,33 tahun, Banten 8,61 tahun, Jawa Barat 8,11 tahun, Jawa Timur 7,53 tahun dan terakhir Jawa Tengah sebesar 7,43 tahun. Perlu kerja keras pemerintah Propinsi Jawa Tengah untuk mengejar ketertinggalannya dari propinsi lain apalagi untuk memenuhi standar rata-rata lama sekolah yang disarankan UNDP sebesar 15 tahun.

  Penelitian mengenai lama pendidikan penah sering dilakukan diberbagai Negara. Penelitian di Republik Rakyat Tiongkok pernah dilakukan Connely dan Zhang (2002) mengenai penentuan kelanjutan sekolah penduduk umur 10 hingga 18 tahun. Penelitian tersebut menyimpulkan lokasi tempat tinggal dan jenis kelamin sangat mempengaruhi dalam pendaftaran dan kelulusan sekolah. Perempuan pedesaan cenderung kurang beruntung dalam kelanjutan sekolahnya. Pendidikan orang tua, jumlah saudara (jumlah anggota kelurga), Produk Domestik Regional Bruto (PDRB) dan biaya sekolah juga sangat berpengaruh dalam kelanjutan pendidikan penduduk. Huisman, Rani dan Smits (2010) dalam penelitiannya di 26 negara bagian India mengungkapkan bahwa faktor sosial rumah tangga sangat berpengaruh dalam mengenyam pendidikan. Katersediaan fasilitas sekolah dan guru juga sangat memegang peran penting. Anak-anak perempuan terutama di pedesaan lebih tertinggal dalam partisipasi pendidikan.

  Penelitian capaian rata-rata lama sekolah di dalam negeri pernah dilakukan Solikhah (2009) mengenai Analisis Rata-rata Lama sekolah di Pulau Kalimantan dengan menggunakan metode Spatial Conditional Autoregrresion. Dimana dalam penelitian iti, faktor-faktor yang mempengaruhi rata-rata lama sekolah bila variabel lain dianggap konstan adalah persentase penduduk muda, rasio murid dan guru SLTA, rasio murid dan guru SLTP, rasio jenis kelamin, persentase desa/kelurahan yang memiliki SLTP, persentase desa/kelurahan yang memiliki SLTA, persentase penduduk perkotaan, persentase kecamatan yang memiliki perguruan tinggi, kontribusi sektor non pertanian dalam PDRB dan rata- rata pendapatan perkapita 1 bulan.

  1.2 Perumusan Masalah

  Dengan memperhatikan latar belakang yang telah diuraikan diatas, permasalahan yang dapat dirumuskan adalah :

  1. Bagaimana bentuk Estimator Campuran Kernel dan Spline Truncated Linier Multivariabel dalam regresi nonparametrik aditif ?

  2. Bagaimana model Rata-Rata Lama Sekolah di Provinsi Jawa Tengah menggunakan Estimator Campuran Kernel dan Spline Truncated Linier Multivariabel dalam regresi nonparametrik aditif.

  1.3 Tujuan Penelitian

  1. Mendapatkan bentuk Estimator Campuran Kernel dan Spline Truncated Linier Multivariabel dalam regresi nonparametrik aditif.

  2. Memodelkan Rata-Rata Lama Sekolah penduduk di Provinsi Jawa Tengah menggunakan Estimator Campuran Kernel dan Spline Truncated Linier Multivariabel dalam regresi nonparametrik aditif.

  1.4 Manfaat Penelitian

  Manfaat yang ingin dicapai dari penelitian ini adalah :

  1. Mengembangkan wawasan keilmuan dan pengetahuan tentang regresi nonparametrik spline truncated.

  2. Mengembangkan wawasan keilmuan dan pengetahuan tentang regresi nonparametrik kernel.

  3. Mengembangkan wawasan keilmuan dan pengetahuan tentang Estimator Campuran Kernel dan Spline Truncated Linier Multivariabel dalam regresi nonparametrik aditif.

  4. Model Rata-Rata Lama Sekolah penduduk di Provinsi Jawa Tengah menggunakan Estimator Campuran Kernel dan Spline Truncated Linier

  Multivariabel dalam regresi nonparametrik aditif dapat digunakan untuk memprediksi target rata-rata lama sekolah akibat dari perubahan pada masing- masing variabel prediktor yang mempengaruhi.

1.5 Batasan Masalah Penelitian

  Batasan permasalahan pada penelitian ini untuk pembentukan model Estimator Campuran Kernel dan Spline Truncated Linier Multivariabel dalam regresi nonparametrik yang bersifat additif. Satu variabel prediktor mengikuti fungsi kernel dan variabel prediktor lainnya mengikuti kurva spline. Penggunaan titik knot optimal diasumsikan sama untuk setiap variabel prediktor yang didekati dengan kurva regresi spline dibatasi sampai maksimal tiga titik knot. Untuk mendapatkan estimator kurva regresi menggunakan optimasi Ordinary Least

  

Square (OLS). Data yang digunakan adalah data sekunder hasil publikasi BPS

  Pusat dan BPS Propinsi Jawa Tengah serta data dari Direktorat Jenderal Perimbangan Keuangan (DJPK) Kementrian Keuangan Republik Indonesia Tahun 2014.

  

“Halaman ini sengaja dikosongkan”

BAB 2 TINJAUAN PUSTAKA

2.1 Pemodelan Regresi Parametrik dan Nonparametrik

  Pemodelan regresi parametrik digunakan apabila kurva regresi data membentuk pola tertentu, seperti linier, kuadratik ataupun kubik. Model regresi parametrik dalam penggunaanya memerlukan informasi dari masa lalu atau sumber informasi lain yang tersedia yang dapat menggambarkan secara detail tentang data tersebut. Model regresi parametrik juga mempunyai asumsi yaitu bentuk kurva regresi harus diketahui (Eubank, 1999). Metode untuk mengestimasi parameter adalah metode Least Square dan Maximum Likelihood (Wahba, 1990). Pada umumnya, variabel respon y dapat dihubungkan dengan k variabel-variabel prediktor. Model tersebut dalam bentuk (Montgomery & Hines, 1972)

         y   xxx  , i 1,2,..., n (2.1) i 1 1 i 2 2 i k ki i x x , ,..., x

  dimana y i merupakan variabel respon, sebagai variabel prediktor, 1 2 k i merupakan error random independen berdistribusi normal dengan mean nol dan 2 varians  parameter    , , ,...,  tidak diketahui. 1 2 k Secara umum bentuk regresi parametrik multivariabel dengan k variabel prediktor pada persamaan (2.1) dapat ditulis dalam bentuk matriks sebagai :

  y X  

    , dimana

  (2.2)  

  

  yx x x     

1

  1 11 12 1 k 1

       

   

  y 2 1 x x x 21 22 2 k 1 2

       

y

X     

  dan

  

       

       

   

  y

n n n nk k n

1 x x x 1 2

       

  Pada umumnya, y adalah sebuah vektor (n x 1) dari observasi-observasi,

  X

  adalah sebuah matriks (n x (k+1)) dari variabel-variabel bebas, adalah

  

  sebuah vektor ((k+1)x1) dari koefisien-koefisien regresi dan adalah sebuah

  

  vektor (nx1) dari error random. Parameter diestimasi dengan metode kuadrat T terkecil yang meminimumkan T T   dimana :      

  y X y X

  ( ) ( )

  T

  Dengan menurunkan parsial   terhadap  dan menyamakan dengan nol, maka diperoleh estimator : T 1 T

    X X X y ˆ ( ) (2.3)

2.2 Regresi Nonparametrik Spline Truncated

  Pendekatan regresi nonparametrik yang banyak digunakan adalah spline

  

truncated. Spline truncated merupakan potongan-potongan polinomial yang

  memiliki sifat tersegmen dan kontinu. Salah satu kelebihan spline truncated adalah model ini cenderung mencari sendiri estimasi data kemanapun pola data tersebut bergerak. Kelebihan ini terjadi karena dalam spline truncated terdapat titik-titik knot, yaitu titik perpaduan bersama yang menunjukkan terjadinya perubahan pola perilaku data (Eubank, 1999; Budiantara, 2009). Secara umum,

     fungsi spline truncated dengan derajad m dan titik-titik knot , ,..., adalah 1 2 r suatu fungsi yang dapat ditulis dalam bentuk sebagai berikut :

  y i = f(x i ) + ε i , i= 1, 2, …., n. (2.4) m r m j

         

  x x , i = 1, 2,…., n. (2.5) j i ji ji

      1 j j

  dengan, m

    m   , xxi r

    i rx

      i r   , x i r 

  Error random ε diasumsikan berdistribusi normal independen dengan mean nol 2 i

   .

  dan variansi Sebagai salah satu ilustrasi sederhana diberikan Spline linier

    

  x   1 2 3 truncated dengan tiga knots pada  diberikan oleh : 1 1 1

         f x ( )  x  ( x  )  ( x  )  ( x  ) 3 1 1 1    2

2

3 3 f x ( ) 3 Fungsi Spline disajikan (Budiantara, 2011) dalam bentuk (di gambar 2.1):

   

    x , x 1 1 1

      

      x ( x ) , x

   1 1 1 1 2 f x 3   ( ) 1 1

        

  xx   x    x 1 1 ( ) ( ) , 1 2 2 2 31 1 1

         

  xx   x   xx1 1 ( ) ( ) ( ) , 1 2 2

3

3 3

Gambar 2.1 Simulasi Spline truncated dengan tiga titik knots

  Dalam regresi nonparametrik dengan pendekatan spline truncated, hal penting yang berperan dalam mendapatkan estimator spline truncated adalah pemilihan titik knot yang optimal. Salah satu metode yang sering digunakan dalam memilih titik knot optimal adalah Generalized Cross Validation (GCV). Jika dibandingkan dengan metode lain, misalnya Cross Validation (CV) dan metode Unbiased Risk (UBR) ataupun Generalized Maximum Likelihood (GML), GCV secara teoritis memiliki sifat optimal asymtotik. Metode GCV juga memiliki 2 kelebihan tidak memerlukan pengetahuan terhadap variansi populasi

   serta metode GCV invarians terhadap transformasi. Metode GCV merupakan pengembangan dari CV (Wahba, 1990). Fungsi GCV untuk pemilihan titik knot optimal dapat ditunjukkan dalam persamaan berikut:

  MSE   , ,..., 

 

1 2 r

   GCV   , ,..., 

    (2.6) 1 2 r 1 2

  

n trace I A   , ,..., 

   

1

2 r    

  dengan 1 n 2

  ˆ MSE     n yf x

   , ,...,    (2.7) 1 2 r i ii 1  

2.3 Regresi Nonparametrik Kernel

  Estimator kernel mempunyai kelebihan yaitu fleksibel, bentuk matematisnya mudah dan dapat mencapai tingkat kekonvergenan yang relative cepat. Kurva regresi g t ( ) yang dihampiri fungsi kernel, estimasi kurva regresi i dapat disajikan dalam bentuk : n   n   K t t    1  i1  

    g t ˆ n y n W t y (2.8)    ii   i n

    i   1 i 1   1n K t t j

    

    j 1  

  dimana : 

  

  K t t   

  1  

  t t i i