ESTIMASI MODEL REGRESI SEMIPARAMETRIK BIRESPON MULTIPREDIKTOR BERDASARKAN ESTIMATOR PENALIZED SPLINE SKRIPSI

ESTIMASI MODEL REGRESI SEMIPARAMETRIK BIRESPON MULTIPREDIKTOR BERDASARKAN ESTIMATOR PENALIZED SPLINE SKRIPSI

  ii

ESTIMASI MODEL REGRESI SEMIPARAMETRIK BIRESPON MULTIPREDIKTOR BERDASARKAN ESTIMATOR PENALIZED SPLINE SKRIPSI

  iii

PEDOMAN PENGGUNAAN SKRIPSI

  Skripsi ini tidak dipublikasikan, namun tersedia di perpustakaan dalam lingkungan Universitas Airlangga, diperkenankan untuk dipakai sebagai referensi kepustakaan, tetapi pengutipan harus seizin penyusun dan harus menyebutkan sumbernya sesuai kebiasaan ilmiah. Dokumen skripsi ini merupakan hak milik Universitas Airlangga. iv

KATA PENGANTAR

  Alhamdulillahirabbil ’alamin puji syukur penulis panjatkan kepada Allah SWT yang telah melimpahkan rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan skripsi dengan judul ”Estimasi Model Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline

  ”. Penulis menyadari bahwa skripsi ini tidak terlepas dari bantuan berbagai pihak, oleh karena itu sepantasnya penulis mengucapkan terima kasih kepada:

  1. Kedua orang tua tersayang: Ibu Sumarni dan Bapak Subekan, serta keluarga besar penulis yang mendoakan dan telah memberikan semangat, kepercayaan, dan dukungan baik secara materiil maupun moril.

  2. Dr. Nur Chamidah, M.Si. dan Dr. Ardi Kurniawan, M.Si. selaku dosen pembimbing yang telah memberikan penjelasan, pengarahan, bimbingan, masukan, saran, dan motivasi kepada penulis untuk terus belajar.

  3. Drs. Suliyanto, M.Si. selaku dosen wali selama menjadi mahasiswa yang telah selalu memberikan nasehat, arahan, dukungan, saran, dan motivasi kepada penulis untuk menyelesaikan studi dengan baik serta seluruh dosen statistika yang telah memberikan ilmu pengetahuan selama perkuliahan.

4. Serta pihak yang telah berjasa dalam membantu penulis menyelesaikan skripsi ini, namun tidak dapat disebutkan satu per satu oleh penulis.

  Penulis menyadari skripsi ini jauh dari sempurna, baik dari segi penyusunan, bahasa atau penulisan. Oleh karena itu penulis mengharapkan kritik dan saran yang bersifat membangun guna menyempurnakan skripsi ini. Penulis berharap semoga skripsi ini dapat bermanfaat bagi perkembangan ilmu pengetahuan di masa yang akan datang.

  Surabaya, 25 Januari 2017 Penulis, Dodik Andrianto vi Dodik Andrianto, 2017. Estimasi Model Regresi Semiparametrik Birespon

  Multiprediktor Berdasarkan Estimator Penalized Spline. Skripsi dibawah

  bimbingan Dr. Nur Chamidah, M.Si. dan Dr. Ardi Kurniawan, M.Si., Program Studi S-1 Statistika, Departemen Matematika, Fakultas Sains dan Teknologi, Universitas Airlangga, Surabaya.

  ABSTRAK

  Metode dalam ilmu statistika yang menganalisis pola hubungan secara fungsional antara variabel respon dan variabel prediktor dengan komponen parametrik dan nonparametrik didalamnya yaitu analisis regresi semiparametrik. Estimator dalam regresi noparametrik yang belum banyak dikembangkan salah satunya adalah estimator penalized spline, estimator tersebut dapat digunakan terhadap data yang mengalami peningkatan tajam dengan membebankan penalty pada komponen potongan polinomial (piece wise polinomial) yang memiliki sifat tersegmen yang kontinu. Persoalan dalam kehidupan sehari-hari sering kali memerlukan pemodelan yang melibatkan dua variabel respon dan diantara keduanya terdapat korelasi yang kuat dengan melibatkan lebih dari satu variabel prediktor. Sehingga secara teori menarik untuk megembangkan pengestimasian berdasarkan estimator penalized spline pada model regresi semiparametrik birespon multiprediktor. Tujuan dari penelitian ini adalah mendapatkan bentuk model regresi semiparametrik birespon multiprediktor dengan menggunakan estimator penalized spline dalam mengestimasi kurva regresi nonparametriknya serta mengembangkan pula algoritma dan pemrogramannya untuk implementasi pada data. Data yang digunakan pada pengimplementasian adalah data pasien di RSU Haji Surabaya dengan tekanan darah sistolik dan diastolik sebagai variabel respon, LDL sebagai variabel prediktor komponen parametrik, serta variabel prediktor komponen nonparametriknya adalah berat badan, usia, dan HDL. Hasil estimasi data tekanan darah menggunakan software OSS-R diperoleh nilai MSE dan R-square untuk pemodelan yaitu masing-masing sebesar 136,5604 dan 91,23%.

  Kata Kunci : Regresi, Semiparametrik, Birespon, Multiprediktor, Penalized Spline , Tekanan Darah

  vii Dodik Andrianto, 2017. Estimation of Bi-response Multipredictor Semiparametric Regression Model Based on Penalized Spline Estimator. This skripsi is under supervised by Dr. Nur Chamidah, M.Si. and Dr. Ardi Kurniawan, M.Si., S-1 Statistics Courses, Mathematics Department, Faculty of Science and Technology, Universitas Airlangga, Surabaya.

  ABSTRACT The methods in statistical science that analyzes the pattern of a functional relationship between the response and the predictor variables with parametric and nonparametric components therein are semiparametric regression analysis. Estimator in nonparametric regression who have developed one of which is the Penalized spline estimator, the estimator can use the data it has increased sharply by imposing a penalty on the component pieces of polynomial (piece wise polynomial) which has the property of segmented continuous. Problems in everyday life often require modeling involving two response variables and between them there is a strong correlation with the involvement of more than one predictor variable. So in theory needs to be developed Penalized spline estimator estimating base on semiparametric regression model bi-response multipredictor. The purpose of this research is to form semiparametric regression model bi- response multipredictor using Penalized spline estimator to estimate the nonparametric regression curve and also develop algorithms and programming to the implementation of the data. Data used in the implementation is data in RSU Haji Surabaya patients with systolic and diastolic blood pressure as the response variable, LDL as a predictor variable component of parametric and nonparametric predictor variable component is the weight, age, and HDL. The estimation results of the blood pressure data using OSS software-R obtained by MSE and R-square for modeling are 136.5604 respectively and 91.23%.

  Keywords : Regression, Bi-response, Multipredictor, Semiparametric, Penalized Spline, Blood Pressure viii

  DAFTAR ISI Halaman LEMBAR JUDUL .............................................................................................. i

  LEMBAR PERNYATAAN ................................................................................ ii LEMBAR PENGESAHAN ................................................................................ iii LEMBAR PEDOMAN PENGGUNAAN SKRIPSI .......................................... iv SURAT PERNYATAAN TENTANG ORISIALITAS ...................................... v KATA PENGANTAR ....................................................................................... vi ABSTRAK .......................................................................................................... vii ABSTRACT ........................................................................................................ viii DAFTAR ISI ....................................................................................................... ix DAFTAR TABEL ............................................................................................... xii DAFTAR GAMBAR .......................................................................................... xiii DAFTAR LAMPIRAN ....................................................................................... xiv

  BAB I PENDAHULUAN ................................................................................... 1

  1.1 Latar Belakang .................................................................................. 1

  1.2 Rumusan Masalah ............................................................................. 5

  1.3 Tujuan ............................................................................................... 5

  1.4 Manfaat ............................................................................................. 5

  1.5 Batasan Masalah ................................................................................ 6

  BAB II TINJAUAN PUSTAKA ........................................................................ 7

  2.1 Aljabar Matrik ................................................................................... 7

  2.2 Pendekatan Regresi ........................................................................... 12

  2.2.1 Regresi Parametrik ................................................................... 12

  2.2.2 Regresi Nonparametrik ............................................................ 12

  2.2.3 Regresi Semiparametrik ........................................................... 13

  2.3 Regresi Birespon ............................................................................... 13

  2.4 Regresi Multiprediktor ...................................................................... 14

  2.5 Estimator Penalized Spline pada Regresi Nonparametrik................. 14

  2.6 Kuantil ............................................................................................... 18 ix

  2.7 Pemilihan Titik Knot Optimal ........................................................... 19

  2.8 Pemilihan Jumlah Titik Knot Optimal .............................................. 19

  2.9 Model Semiparametrik Berdasarkan Estimator Penalized Spline dengan Satu Variabel Respon ........................................................ 20

  2.10 Model Semiparametrik Birespon Berdasarkan Estimator Penalized Spline dengan Satu Variabel Prediktor.......................... 21

  2.11 Kasus Homoskedastisitas dan Heteroskedastisitas ......................... 22

  2.12 Estimasi Parameter Weighted Least Square (WLS) ........................ 23

  2.13 Uji Glesjer ....................................................................................... 23

  2.14 Uji Korelasi Pearson ....................................................................... 24

  2.15 Open Source Software R (OSS-R) .................................................. 25

  2.16 Tekanan Darah ................................................................................ 28

  BAB III METODE PENELITIAN ..................................................................... 29

  3.1 Mengestimasi Model Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline ............. 29

  3.2 Membuat Algoritma dan Program Untuk Mengestimasi Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline yang Diterapkan Pada Data Riil atau Data Bangkitan ......................................................................................... 31

  3.2.1 Algoritma dan Program untuk Mengestimasi Model Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline ................................................... 31

  3.2.2 Penerapan Model Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline pada Data Riil ....................................................................... 36

  BAB IV HASIL DAN PEMBAHASAN ............................................................ 37

  4.1 Estimasi Model Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline ...................................... 37

  4.2 Algoritma dan Program Untuk Mengestimasi Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator x

  xi Penalized Spline yang Diterapkan Pada Data Riil atau Data Bangkitan ......................................................................................... 47

  4.2.1 Algoritma dan Program untuk Mengestimasi Model Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline ................................................... 47

  4.2.2 Penerapan Model Regresi Semiparametrik Birespon Multiprediktor Berdasarkan Estimator Penalized Spline pada Data Riil ....................................................................... 54

  BAB V KESIMPULAN DAN SARAN ............................................................. 71

  5.1 Kesimpulan ....................................................................................... 71

  5.2 Saran .................................................................................................. 72 DAFTAR PUSTAKA ......................................................................................... 73 LAMPIRAN

  DAFTAR TABEL Nomor Judul Tabel Halaman 3.1 Variabel-variabel Penelitian ........................................................

  36

  

4.1 Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik

Knot, dan Nilai Lambda Optimal, serta GCV Minimum Prediktor Ke-1 .............................................................................

  57

  

4.2 Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik

Knot, dan Nilai Lambda Optimal, serta GCV Minimum Prediktor Ke-2 .............................................................................

  59

  

4.3 Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik

Knot, dan Nilai Lambda Optimal, serta GCV Minimum Prediktor Ke-3 .............................................................................

  60

  

4.4 Hasil Kombinasi Orde Polinomial, Jumlah Knot, Titik

Knot, serta Nilai Lambda Optimal Setiap ...................................

  61 xii

  DAFTAR GAMBAR Nomor Judul Gambar Halaman 3.1 Diagram Alir Algoritma dan Program ........................................

  35

  

4.1 Scatterplot antara Tekanan Darah Sistolik dan Diastolik

dengan Berat Badan ....................................................................

  55

  

4.2 Scatterplot antara Tekanan Darah Sistolik dan Diastolik

dengan Usia .................................................................................

  56

  

4.3 Scatterplot antara Tekanan Darah Sistolik dan Diastolik

dengan HDL ................................................................................

  56

  

4.4 Plot Observasi dan Estimasi pada Tekanan Darah

Sistolik Data Insample ................................................................

  68

  

4.5 Plot Observasi dan Estimasi pada Tekanan Darah

Diastolik Data Insample ..............................................................

  68

  

4.6 Plot Observasi dan Estimasi pada Tekanan Darah

Sistolik Data Outsample .............................................................

  69

  

4.7 Plot Observasi dan Estimasi pada Tekanan Darah

Diastolik Data Outsample ...........................................................

  70 xiii

DAFTAR LAMPIRAN

  Nomor Judul

  1 Data Insample Tekanan Darah Pasien dan Variabel Prediktor RSU Haji Surabaya

  2 Data Outsample Tekanan Darah Pasien dan Variabel Prediktor RSU Haji Surabaya

  3 Program Uji Korelasi Pearson

  4 Program Identifikasi Kombiasi Orde Respon, Jumlah Knot, Titik

Knot, dan Lambda Optimal Setiap Prediktor

  5 Program Estimasi Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline (Tanpa Pembobot)

  6 Program Uji Glesjer dan Penentuan Matrik Pembobot

  7 Program Estimasi Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline (dengan Pembobot)

  8 Program Estimasi Outsample Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline

  9 Output Uji Korelasi Pearson

  10 Output Indentifikasi Kombiasi Orde Respon, Jumlah Knot, Titik

Knot, dan Lambda Optimal Prediktor Ke-1

  11 Output Indentifikasi Kombiasi Orde Respon, Jumlah Knot, Titik

Knot, dan Lambda Optimal Prediktor Ke-2

  12 Output Indentifikasi Kombiasi Orde Respon, Jumlah Knot, Titik

Knot, dan Lambda Optimal Prediktor Ke-3

  13 Output Estimasi Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline (Tanpa Pembobot)

  14 Output Uji Glesjer dan Penentuan Matrik Pembobot

  15 Output Estimasi Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline (dengan Pembobot) xiv

  16 Output Estimasi Outsample Model Regresi Semiparametrik Birespon Berdasarkan Estimator Penalized Spline xv

BAB I PENDAHULUAN

1.1 Latar Belakang

  Analisis regresi merupakan suatu metode dalam ilmu statistika yang menganalisis pola hubungan secara fungsional antara variabel respon dan variabel prediktor melalui estimasi kurva. Terdapat tiga macam pendekatan dalam mengestimasi fungsi regresi, yaitu pendekatan parametrik, nonparametrik, dan semiparametrik. Pendekatan parametrik digunakan apabila sudah mengasumsikan bentuk tertentu dari pola hubungan antara variabel respon dan variabel prediktor serta terdapat informasi, pengetahuan maupun teori masa lalu tentang karakteristik data yang diteliti, sedangkan pendekatan nonparametrik digunakan karena tidak adanya informasi sebelumnya tentang hubungan antara variabel respon dan variabel prediktor (Ricky, 2014) dan data diharapkan mencari sendiri bentuk estimasinya sehingga dapat dikatakan regresi nonparametrik memiliki fleksibilitas yang lebih besar terhadap data yang diteliti. Dalam beberapa kasus di kehidupan nyata sering diketahui pola kurva antara variabel respon dengan beberapa variabel prediktor karena terdapat informasi sebelumnya tentang hubungan antara keduanya, namun tidak dengan variabel prediktor yang lainnya yang belum diketahui pola hubungannya. Solusi untuk mengetahui model fungsi tersebut adalah dengan mengestimasi fungsi regresi menggunakan pendekatan regresi semiparametrik. Pendekatan regresi semiparametrik digunakan jika pola hubungan antara sekumpulan variabel prediktor terhadap variabel respon ada pola yang diketahui dan ada pula yang pola hubungannya tidak diketahui (Budiantara, 2012).

  Masalah estimasi pada regresi semiparametrik muncul karena adanya komponen nonparametrik berupa fungsi yang tidak diketahui bentuknya. Oleh karena itu, hampiran terhadap bentuk fungsi tersebut dapat dilakukan dengan lebih dari satu bentuk fungsi. Beberapa diantaranya adalah spline, kernel, fourier,

  wavelet , dan polinomial lokal. Secara aplikasi, hampiran-hampiran ini memiliki

  1 kelebihan yang berbeda (Wibowo, dkk., 2013). Pendekatan regresi nonparametrik yang cukup populer adalah adalah spline (Andriani, et al., 2015), karena memberikan fleksibilitas yang lebih baik terhadap karakteristik suatu fungsi atau data dengan mulus (smooth) (Ricky, 2014). Keuntugan lain yang dimiliki oleh

  spline adalah mampu menjelaskan perubahan pola perilaku fungsi dalam sub-

  interval tertentu dan dapat digunakan untuk mengatasi atau mengurangi pola data yang mengalami peningkatan tajam dengan bantuan titik knot. Griggs (2013) meyatakan bahwa penalized spline lebih cocok digunakan terhadap data yang mengalami peningkatan tajam karena penalized spline membebankan penalty pada komponen potongan polinomial (piece wise polinomial) yang memiliki sifat tersegmen yang kontinu sehingga lebih cocok digunakan untuk lebih mengoptimalkan. Penalized spline adalah salah satu bentuk estimator spline yang diperoleh dengan meminimumkan Penalized Least Square (PLS). Untuk itu ada beberapa hal yang perlu dipertimbangkan, yaitu titik dan jumlah knot, fungsi dasar spline, serta derajat bebas dan matrik penalty (Montoya, et al., 2014).

  Beberapa penelitian terkait regresi berdasarkan estimator penalized spline antara lain adalah Andriani, et al. (2015) dan Pütz (2016), kedua penelitian tersebut menggunakan pendekatan nonparametrik dalam mengestimasi model, namun pada kehidupan nyata sering kali ditemukan kasus dengan adanya pola hubungan yang diketahui antara sekumpulan variabel prediktor terhadap variabel respon dan ada pula pola yang tidak dapat diketahui sehingga diperlukan pengembangan penelitian yaitu dengan pendekatan regresi semiparametrik. Penelitian terkait model regresi semiparametrik berdasarkan estimator penalized

  spline salah satunya adalah Salam (2013), yang mengestimasi model regresi

  semiparametrik berdasarkan estimator penalized spline dengan menggunakan metode likelihood maximum penalized, namun hanya menggunakan satu variabel respon.

  Persoalan dalam kehidupan sehari-hari sering dijumpai pemodelan regresi dengan multirespon salah satu contohnya pengukuran tekanan darah yaitu sistolik dan diastolik. Salah satu analisis regresi yang dapat digunakan untuk memodelkan kasus tersebut adalah model regresi birespon. Penelitian mengenai model regresi multirespon berdasarkan estimator spline truncated telah banyak dilakukan, antara lain adalah Oktaviana (2011), Setyawan (2011), Juliandari (2014) dan Wulandari (2014), namun penelitian yang menyangkut estimator penalized spline dengan respon lebih dari satu belum banyak dikembangkan. Tujuan pemodelan regresi multirespon adalah untuk mendapatkan model yang lebih baik dari pemodelan respon tunggal, dengan model regresi yang tidak hanya mempertimbangkan pengaruh prediktor terhadap respon, akan tetapi juga hubungan antar respon (Fernandes, 2014). Penelitian dengan menggunakan regresi birespon berdasarkan estimator penalized spline antara lain adalah Yolandika (2011) yaitu dengan menggunakan pendekatan noparametrik, namun seperti halnya permasalahan pada regresi dengan respon tunggal maka diperlukan pengembangan penelitian yaitu dengan pendekatan regresi semiparametrik. Selain itu, terdapat penelitian dari Chamidah dan Eridani (2015) mengenai regresi semiparametrik birespon berdasarkan estimator penalized spline, penelitian tersebut menggunakan satu variabel prediktor pada komponen parametrik dan satu variabel prediktor pula pada komponen nonparametrik sedangkan pada sebagian besar kasus dalam kehidupan nyata variabel respon tidak hanya dipengaruhi oleh satu variabel prediktor saja, jika hanya menggunakan satu variabel saja maka kemungkinan variabel prediktor tersebut belum dapat mewakili faktor yang mempengaruhi variabel respon yang diteliti.

  Skripsi ini membahas mengenai pengembangan pengestimasian berdasarkan estimator penalized spline dalam model regresi semiparametrik birespon multiprediktor karena dari berbagai penelitian yang sudah dilakukan saat ini, belum dapat menjawab persoalan atas kasus data yang memerlukan variabel respon lebih dari satu dan beberapa variabel prediktor pada komponen parametrik dan nonparametrik dalam mengestimasi model regresi. Selain itu utuk implementasi pada data maka dikembangkan pula algoritma dan pemrogramannya. Penerapan dari algoritma penelitian akan lebih mudah apabila menggunakan bantuan software statistika dibanding secara manual karena penerapan secara manual akan membutuhkan waktu yang lama. Software statistika yang digunakan dalam penelitian adalah Open Source Software R (OSS- R).

  Teori yang dibahas mengenai estimasi model regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized spline diterapkan pada data tekanan darah dengan variabel respon pertama yaitu tekanan darah sistolik dan variabel respon kedua yaitu tekanan darah diastolik. Tekanan darah sangatlah penting karena merupakan kekuatan pendorong bagi darah agar dapat beredar ke seluruh tubuh untuk memberikan darah segar yang mengandung oksigen dan nutrisi ke organ-organ tubuh. Tekanan darah bervariasi untuk berbagai alasan, seperti usia, berat badan, kandungan lemak darah, dan lain sebagainya. Faktor resiko tekanan darah yang tinggi diantaranya adalah hipertensi, stroke, dan jantung koroner. Penyakit-penyakit tersebut termasuk dalam penyakit tidak menular yang saat ini sangat mengkhawatirkan dan telah menjadi masalah utama dalam kesehatan masyarakat yang ada di Indonesia maupun di beberapa negara yang ada di dunia. Sehingga perlu adanya pengawasan yang lebih dalam dunia kesehatan terhadap tingkat tekanan darah. Penelitian yang membahas mengenai tekanan darah sistolik dan diastolik salah satunya adalah Mersi dan Andrianto (2016) menganalisis pengaruh LDL terhadap tekanan darah dengan pendekatan regresi nonparametrik berdasarkan estimator penalized spline, namun penelitian yang dilakukan masih menggunakan analisis unirespon yaitu dengan memodelkan masing-masing tekanan darah sistolik dan diastolik terhadap LDL dan hanya melibatkan satu variabel prediktor kompoen nonparametrik. Persoalan tersebut melibatkan dua variabel respon dan diantara keduanya terdapat korelasi yang kuat sehingga untuk selanjutya membutuhkan pemodelan dengan analisis regresi semiparameterik birespon multiprediktor.

  Berdasarkan uraian yang telah dijelaskan, penulis tertarik untuk membahas secara lebih lanjut mengenai model regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized spline dengan membuat algoritma dan program dalam OSS-R serta menerapkan hasilnya pada data riil yaitu data tekanan darah sistolik dan tekanan darah diastolik.

  1.2 Rumusan Masalah

  Berdasarkan latar belakang, maka pemasalahan yang dibahas dalam skripsi ini adalah :

  1. Bagaimana mengestimasi model regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized spline?

  2. Bagaimana membuat algoritma dan program untuk mengestimasi regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized

  spline menggunakan software OSS-R yang diterapkan pada data riil atau

  data bangkitan?

  1.3 Tujuan Penelitian

  Berdasarkan rumusan masalah, maka tujuan penelitian dalam skripsi ini adalah :

1. Mengestimasi model regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized spline.

  2. Membuat algoritma dan program untuk mengestimasi regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized

  spline menggunakan software OSS-R yang diterapkan pada data riil atau data bangkitan.

1.4 Manfaat Penelitian

  Berdasarkan latar belakang, maka manfaat penelitian dalam skripsi ini adalah :

  1. Menambah wawasan dan pengetahuan tentang estimasi model regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized

  spline .

  2. Mengetahui algoritma dan program untuk mengestimasi regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized

  spline menggunakan software OSS-R dan penerapan pada data riil atau data bangkitan.

1.5 Batasan Masalah

  Estimasi model regresi semiparametrik birespon multiprediktor berdasarkan estimator penalized spline dalam penulisan skripsi ini dibatasi pada pemilihan parameter penghalus dengan menggunakan metode Generalized Cross Validation (GCV).

BAB II TINJAUAN PUSTAKA Pada bab ini akan dibahas mengenai beberapa tinjauan pustaka yang akan

  digunakan untuk pembahasan pada bab-bab berikutnya. Pada BAB I sebelumnya telah diuraikan tentang tujuan dari penulisan skripsi ini. Berdasarkan tujuan tersebut maka akan dibahas mengenai matrik, regresi semiparametrik, regresi birespon, regresi multiprediktor, estimator penalized spline, kuantil, pemilihan titik knot optimal, pemilihan jumlah titik knot optimal, model semiparametrik berdasarkan estimator penalized spline dengan satu variabel respon, model semiparametrik birespon berdasarkan estimator penalized spline dengan satu variabel prediktor, kasus heteroskedastisitas dan homoskedastisitas, estimasi parameter Weighted Least Square (WLS), uji glesjer, uji korelasi pearson, OSS- R.

2.1 Aljabar Matrik

  Matrik adalah susunan bilangan atau variabel dalam bentuk persegi panjang atau persegi. Bilangan-bilangan dalam susunan tersebut dinamakan entri matrik. Ukuran matrik dijelaskan dengan menyatakan banyaknya baris dan banyaknya kolom yang terdapat dalam matrik tersebut, sehingga suatu matrik dengan baris dan kolom dikatakan sebagai matrik dengan ukuran (ordo) m x

  m n

  Bentuk umum matrik yang berukuran m x n adalah sebagai berikut: n.

  a a a

    11 12  1 n  

  a a a

21

22  2 n

   

  A mn =

       

   

  a a a

m

1 m 1  mn

    Tiap-tiap bilangan a yang berada didalam matrik A disebut elemen. ij Indeks i dan j masing-masing menyatakan baris dan kolom tempat beradanya

  7 sebuah elemen dari matrik A. Beberapa operasi pada matrik adalah sebagai berikut: a.

  Matrik Partisi Partisi matrik A menjadi empat submatrik (persegi atau persegi panjang) sebagai berikut:

  A A11 12 

  A =  

  A A 21 22  

  Apabila dua matrik A dan B adalah conformal untuk perkalian, dan jika A dan B dipartisi sehingga submatrik conformal, maka perkalian AB dapat dinyatakan sebagai berikut:

  A A B B    11 12 11 12 AB =   

  A A B B 21 22 21 22   

  • A B A B A B A B
  • 11 11 12 21 11 12 12 22  =   A B A B A B A B 21 11 22 21 21 12 + + 22 22  

      Apabila B diganti oleh vektor b yang dipartisi menjadi dua himpunan dari elemen-elemen, jika A dipartisi menjadi dua himpunan dari kolom-kolom, maka menjadi

      b  

      Ab A A A b A b = = 1

    • +

       

      ( 1 2 ) 1 1 2 2

      b 2   b.

      Perkalian Jika A adalah matrik berordo m x n dan B adalah matrik berordo n x p. Hasil n perkalian AB adalah matrik C berukuran m x p dengan c = A B . Perkalian ij ik kj

      ∑ k 1 =

      dua buah matrik dapat terjadi jika dan hanya jika banyaknya kolom dari matrik A sama dengan banyaknya baris dari matrik B. Perkalian yang melibatkan vektor mengikuti aturan yang sama untuk matrik. Misalkan A adalah matrik berordo

      mxn ,vektor b berdimensi px1, vektor c berdimensi px1. Kemudian Ab adalah T

      vektor kolom berdimensi nx1, b c adalah jumlah perkalian berukuran (1 x 1),

      T T bc adalah matrik berukuran pxp. karena b c adalah jumlah perkalian berukuran T

      (1 x 1), maka sama dengan c b , yaitu: T +

      b c = b c b c + + ... b c 1 1 2 2 p p T + c b = c b c b + + ... c b T T 1 1 2 2 p p b c = c b

      Jika j adalah vektor berdimensi nx1 yang semua elemennya 1, maka ∑ a

       j 1 j   Ta j 2 j  

      j A = ∑ a , ∑ a ,..., ∑ a i i 1 i i 2 i ip ( )

        

         

      ∑ a j nj   c.

      Transpose

      A = a

      Jika matrik , maka transpose dari A didefinisikan sebagai ij T T

      ( ) A = a = a ij ji . Notasi ini menunjukkan bahwa elemen pada baris ke-i dan

      ( ) ( ) T

      kolom ke-j dari matrik A merupakan baris j dan kolom i dari matrik A . Jika T T

      A =

      matrik A berordo mxn. Jika A adalah sembarang matrik, maka A . Salah T T T

      ( )

      satu sifat transpose yang digunakan adalah AB = B A dengan syarat matrik

      ( ) A dan B masing-masing merupakan matrik yang memenuhi sifat perkalian. Jika A

      

    A A

     

    11 12

      adalah matrik partisi A , maka transpose matrik partisi

      =  

    A A

    21 22 T T

     

    TA A11 12

      , jika B adalah vektor partisi b = b b , maka transpose

      A ( ) 1 2

      =   T T A A 21 22

        T Tb1 vektor partisi b . =   T b 2

        d.

      Invers Misalkan A adalah matrik berukuran nxn (A adalah matrik persegi). Sebuah matrik B berukuran nxn sedemikian hingga BA = I disebut invers kiri dari A dan sebuah matrik B berukuran nxn sedemikian hingga AB = I disebut invers kanan dari A dengan I merupakan matrik identitas. Jika AB = BA = I maka matrik B disebut invers kanan dan invers kiri dari matrik A dan matrik A dikatakan invertibel. Jika matrik A dan B masing-masing merupakan matrik yang invertibel 1

      − 1 1 − −

      dan AB terdefinisi maka AB = B A . Jika A adalah matrik simetri dan

      ( ) A A

        11 12 1

      nonsingular dan dipartisi menjadi A dan jika B = AA A A , 22 21 11 12

      =   A A 21 22 1

    1

     

      − −

      sedemikian hingga, maka A dan B ada, sehingga invers dari A adalah : 11

      − 1 − 1 − 1 −

    1 −

    1 − 1  

    • A A A B A AA A B

      − 1 11 11 12 21 11 11 12 A =  

      − 1 − 1 − 1B A A B 21 11  

      e.

      Trace

      A = a

      Trace berukuran nxn adalah fungsi skalar yang didefinisikan sebagai ij

      ( ) n

      jumlah dari elemen-elemen diagonal dari A, yaitu tr(A) = a ii

      ∑ i = 1 f.

      Turunan Fungsi Vektor dan Matrik Misalkan fungsi dari variabel-variabel x x , ,..., x dengan

      u = f x ( ) T 1 2 p x = x x , ,..., x , dan misalkan p

      (

      1 2 )

      ∂ u    

      ∂ x 1    ∂ u

      ∂ u   ∂ x 2

      =  

      ∂ x  

        

      u

      ∂    

      x

      ∂ p  

      Misalkan T T

           

      Matrik Kovariansi Variansi 2 2 2 1 2

      , ,..., p σ σ σ dari 1 2

      , ,..., p

      y y y dan kovariansi ij

      σ untuk semua i j ≠ merupakan elemen-elemen dari matrik kovariansi yang dinotasikan dengan

      Σ

      yaitu

      ( ) 11 12

    1

    21 22

    2

    1 2 ...

      ... cov ... p p p p pp

      σ σ σ σ σ σ σ σ σ

      ∑ = = 

      ∂     ∂   a Ax

    a x

    a Ax a Ax a x Ax x x

    a x

    a Ax

            

      y

          Baris ke-i dari

      Σ mengandung variansi i y dan kovariansi i y dengan tiap variabel y

      yang lain. Supaya konsisten dengan notasi ij σ digunakan 2

      , ii i σ σ

      = 1, 2,...,

      i p =

      untuk varians. Varians terdapat pada diagonal

      Σ, dan kovariansi berada diselain diagonal tersebut.

      g.

        ∂ ∂ ∂

     

     

     

     

      u = = a x x a

      u = x Ax

      , dengan

      ( ) 1 2

      , ,..., T p

      a a a a = adalah vektor konstanta,

      maka

      ( ) ( ) T T u

      ∂ ∂ ∂

      = = = ∂ ∂ ∂

      a x x a a x x x

      . Jika T

      , dengan A adalah matrik simetri dari suatu konstanta, 1 2 3

      ∂     = = = =

     

      

    x

    x

    x

         

      =      

      x dan 11 12 13 21 22 23 31 32 33 a a a a a a a a a

         

      =      

      A maka ( ) ( )

      ( ) ( ) 1 1 2 2 3 3

      2

      

    T

    2 T T T

    T

    T

    T x u x x

        ∂   ∂  

     

      ∂ ∂

      (Rencher and Schaalje, 2008)

    2.2 Pendekatan Regresi

    2.2.1 Regresi Parametrik

      Regresi parametrik digunakan untuk mengetahui pola hubungan antara variabel respon dengan variabel prediktor yang diasumsikan telah diketahui bentuk fungsinya. Salah satu bentuk regresi parametrik dapat dinyatakan sebagai model regresi linier berganda yang secara umum dapat dituliskan dalam notasi matrik sebagai berikut :

      X i i i (2.1) β ε y

    • y =

      X

      dengan merupakan vektor dari variabel respon yang berukuran nx1, merupakan matriks dari variabel prediktor yang diasumsikan tetap berukuran nxp, merupakan vektor parameter yang berukuran px1, dan ε adalah residual acak,

      β 2 IIDN

      dengan ε ~ (0, σ . ) (Ruppert, et al., 2003)

    2.2.2 Regresi Nonparametrik

      Regresi nonparametrik merupakan salah satu pendekatan dalam analisis regresi yang digunakan apabila kurva regresinya tidak diasumsikan memiliki bentuk tertentu. Dalam regresi nonparametrik, kurva regresi hanya diasumsikan halus (smooth), sehingga pendekatan regresi nonparametrik memiliki fleksibilitas yang tinggi karena data diharapkan mencari sendiri bentuk estimasi kurva regresi tanpa dipengaruhi oleh faktor subyektivitas peneliti.

      Jika diberikan pasangan data t y , dengan i 1, 2,..., n dan pola hubungan

      =

    ( i i )

      antara variabel response dengan variabel prediktor tidak diketahui bentuknya, maka dapat digunakan pendekatan regresi nonparametrik. Secara umum, model regresi nonparametrik adalah

      (2.2)

      y f t i i i = + ε , i = 1, 2,..., n ( )

      dengan y merupakan variabel response, f t adalah persamaan kurva regresi i

      i ( )

      yang tidak diasumsikan mengikuti bentuk tertentu dengan

      t sebagai variabel i prediktor , sedangkan ε adalah error berdistribusi normal independen dengan i

      2 mean 0 dan variansi σ (Eubank, 1999). Terdapat beberapa teknik untuk

      mengestimasi kurva regresi dalam regresi nonparametrik, diantaranya yaitu regresi spline, kernel, deret fourir dan lain-lain.

    2.2.3 Pendekatan Regresi Semiparametrik

      Pendekatan regresi tidak hanya parametrik dan nonparametrik, terdapat pula golongan statistikawan, yang memandang kurva regresi dapat diklasifikasikan kedalam dua komponen, yaitu komponen parametrik (bentuk fungsinya diketahui) dan komponen nonparametrik (bentuk fungsinya tidak diketahui). Pandangan ini memberikan pendekatan regresi semiparametrik, (Budiantara, 2012).

      Analisis regresi semiparametrik merupakan gabungan dari regresi parametrik dan regresi nonparametrik, sehingga estimasi model semiparametrik ekuivalen dengan estimasi parameter-parameter pada komponen parametrik dan estimasi kurva pada komponen nonparametrik. Misalkan terdapat data

      y x t

      berpasangan y , , x t , dan hubungan antara , , dan diasumsikan

      ( i i i ) i i i

      mengikuti model regresi semiparametrik sebagai berikut :

      Y X f t = β ( ) ε dengan i = + + 1, 2,..., n i i i i (2.3)

      Y i

      X

      dengan adalah variabel respon pada pengamatan ke − , adalah komponen i i parametrik, f t adalah fungsi regresi nonparametrik dan ε adalah residual

      ( ) i 2

      acak, dengan

      IIDN

      ε ~ (0, σ . ) (Ruppert, et al., 2003)