PERBANDINGAN MODEL REGRESI NONPARAMETRIK SPLINE MULTIVARIABEL DENGAN MENGGUNAKAN METODE GCV DAN UBR DALAM PEMILIHAN TITIK KNOT OPTIMAL (Studi Kasus Data Angka Kematian Maternal di Jawa Timur) - ITS Repository

  TESIS – SS14 2501 TESIS – SS14 2501 TESIS – SS14 2501 COMPARISON OF MULTIVARIABLE SPLINE COMPARISON OF MULTIVARIABLE SPLINE COMPARISON OF MULTIVARIABLE SPLINE

NONPARAMETRIC REGRESSION MODEL USING NONPARAMETRIC REGRESSION MODEL USING NONPARAMETRIC REGRESSION MODEL USING

GENERALIZED CROSS VALIDATION (GCV) AND GENERALIZED CROSS VALIDATION (GCV) AND GENERALIZED CROSS VALIDATION (GCV) AND

UNBIASSED RISK (UBR) IN SELECTING THE UNBIASSED RISK (UBR) IN SELECTING THE UNBIASSED RISK (UBR) IN SELECTING THE OPTIMAL KNOT POINTS OPTIMAL KNOT POINTS OPTIMAL KNOT POINTS

  

(Case Study : Data of Maternal Mortality Rate in East Java) (Case Study : Data of Maternal Mortality Rate in East Java) (Case Study : Data of Maternal Mortality Rate in East Java)

Sulistya Umie Ruhmana Sari Sulistya Umie Ruhmana Sari Sulistya Umie Ruhmana Sari NRP. 1314 201 030 NRP. 1314 201 030 NRP. 1314 201 030 SUPERVISOR : SUPERVISOR : SUPERVISOR : Prof. Dr. Drs. I Nyoman Budiantara, M.Si Prof. Dr. Drs. I Nyoman Budiantara, M.Si Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Wahyu Wibowo, M.Si Dr. Wahyu Wibowo, M.Si Dr. Wahyu Wibowo, M.Si PROGRAM OF MAGISTER PROGRAM OF MAGISTER PROGRAM OF MAGISTER DEPARTMENT OF STATISTICS DEPARTMENT OF STATISTICS DEPARTMENT OF STATISTICS FACULTY OF MATHEMATICS AND NATURAL SCIENCES FACULTY OF MATHEMATICS AND NATURAL SCIENCES FACULTY OF MATHEMATICS AND NATURAL SCIENCES

INSTITUT TEKNOLOGI SEPULUH NOPEMBER

INSTITUT TEKNOLOGI SEPULUH NOPEMBER

  TESIS – SS14 2501 TESIS – SS14 2501 TESIS – SS14 2501 PERBANDINGAN MODEL REGRESI PERBANDINGAN MODEL REGRESI PERBANDINGAN MODEL REGRESI NONPARAMETRIK SPLINE MULTIVARIABEL NONPARAMETRIK SPLINE MULTIVARIABEL NONPARAMETRIK SPLINE MULTIVARIABEL

DENGAN MENGGUNAKAN METODE GENERALIZED DENGAN MENGGUNAKAN METODE GENERALIZED DENGAN MENGGUNAKAN METODE GENERALIZED

CROSS VALIDATION CROSS VALIDATION CROSS VALIDATION

  (GCV) DAN UNBIASSED RISK (GCV) DAN UNBIASSED RISK (GCV) DAN UNBIASSED RISK (UBR) DALAM PEMILIHAN TITIK KNOT OPTIMAL (UBR) DALAM PEMILIHAN TITIK KNOT OPTIMAL (UBR) DALAM PEMILIHAN TITIK KNOT OPTIMAL (Studi Kasus Data Angka Kematian Maternal di Jawa Timur) (Studi Kasus Data Angka Kematian Maternal di Jawa Timur) (Studi Kasus Data Angka Kematian Maternal di Jawa Timur) Sulistya Umie Ruhmana Sari Sulistya Umie Ruhmana Sari Sulistya Umie Ruhmana Sari NRP. 1314 201 030 NRP. 1314 201 030 NRP. 1314 201 030 DOSEN PEMBIMBING : DOSEN PEMBIMBING : DOSEN PEMBIMBING : Prof. Dr. Drs. I Nyoman Budiantara, M.Si Prof. Dr. Drs. I Nyoman Budiantara, M.Si Prof. Dr. Drs. I Nyoman Budiantara, M.Si Dr. Wahyu Wibowo, M.Si Dr. Wahyu Wibowo, M.Si Dr. Wahyu Wibowo, M.Si PROGRAM MAGISTER PROGRAM MAGISTER PROGRAM MAGISTER JURUSAN STATISTIKA JURUSAN STATISTIKA JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT TEKNOLOGI SEPULUH NOPEMBER

INSTITUT TEKNOLOGI SEPULUH NOPEMBER

  DAFTAR ISI

  Halaman

  ABSTRAK .................................................................................................................... i ABSTRACT .................................................................................................................. iii KATA PENGANTAR .................................................................................................. v

  ................................................................................................................. vii

  DAFTAR ISI DAFTAR TABEL ......................................................................................................... ix DAFTAR GAMBAR .................................................................................................... xi

  ................................................................................................. xiii

  DAFTAR LAMPIRAN

  BAB I PENDAHULUAN .............................................................................................. 1

  1.1 Latar Belakang .............................................................................................. 1

  1.2 Rumusan Permasalahan ................................................................................. 6

  1.3 Tujuan Penelitian .......................................................................................... 6

  1.4 Manfaat Penelitian ........................................................................................ 6

  1.5 Batasan Penelitian ........................................................................................ 7

  BAB II TINJAUAN PUSTAKA ................................................................................... 9

  2.1 Analisis Regresi ........................................................................................... 9

  2.2 Analisis Regresi Linier ................................................................................. 9

  2.3 Analisis Regresi Linier Berganda ................................................................. 10

  2.4 Analisis Regresi Polinomial.......................................................................... 10

  2.5 Regresi Nonparametrik Spline ...................................................................... 10

  2.6 Pemilihan Titik Knot Optimal ...................................................................... 12

  2.6.1 Metode GCV ....................................................................................... 13

  2.6.2 Metode UBR ....................................................................................... 14

  2.8 Kriteria Pemilihan Model Terbaik ................................................................ 14

  2.9 Pemeriksaan Asumsi Residual dalam Model Regresi .................................... 15

  2.9.1 Asumsi Residual Identik ...................................................................... 16

  2.9.2 Asumsi Residual Independen ............................................................... 16

  2.9.3 Asumsi Normalitas Residual ................................................................ 17

  2.10 Uji Parameter Model ................................................................................... 18

  2.10.1 Uji Serentak ...................................................................................... 18

  2.10.2 Uji Individu ....................................................................................... 19

  2.11 Angka Kematian Maternal .......................................................................... 19

  

BAB III METODOLOGI PENELITIAN .................................................................... 23

  3.1 Kajian Teoritis ............................................................................................. 23

  3.2 Aplikasi Data ............................................................................................... 25

  3.2.1 Kerangka Konsep ............................................................................... 25

  3.2.2 Variabel Penelitian ............................................................................. 26

  3.2.3 Langkah Analisis................................................................................ 28

  

BAB IV HASIL DAN PEMBAHASAN ....................................................................... 31

  4.1 Estimator Spline dalam Regresi Nonparametrik ........................................... 31

  4.2 Metode GCV dalam Regresi Nonparamertik Spline ..................................... 33

  4.3 Metode UBR dalam Regresi Nonparamertik Spline ..................................... 35

  4.4 Statistika Deskriptif ..................................................................................... 36

  4.5 Pemodelan Angka Kematian Maternal Menggunakan Metode GCV ............ 38

  4.6 Pemodelan Angka Kematian Maternal Menggunakan Metode UBR ............. 47

  4.7 Perbandingan Metode GCV dan UBR .......................................................... 55

  

BAB V KESIMPULAN DAN SARAN ........................................................................ 57

  5.1 Kesimpulan ............................................................................................................. 57

  5.2 Saran ....................................................................................................................... 58

  

DAFTAR PUSTAKA ................................................................................................... 59

  ................................................................................................................. 63

  LAMPIRAN

  ................................................................................................... 64

  BIODATA PENULIS

  DAFTAR TABEL

  Halaman

Tabel 2.1 ANOVA model regresi ................................................................................. 19Tabel 3.1 Variabel penelitian ....................................................................................... 27Tabel 4.1 Statistika deskriptif ....................................................................................... 36

  Nilai GCV dengan 1 titik knot ...................................................................... 38

  Tabel 4.2

Tabel 4.3 Nilai GCV dengan 2 titik knot ........................ 39Tabel 4.4 Nilai GCV dengan 3 titik knot ...................................................................... 41

  Nilai GCV dengan kombinasi titik knot ........................................................ 42

  Tabel 4.5

Tabel 4.6 Ringkasan hasil pemilihan titik knot dengan metode GCV ............................ 43Tabel 4.7 Estimasi koefisien parameter ........................................................................ 43

  ANOVA uji glejser ....................................................................................... 44

  Tabel 4.8

  Uji normalitas ............................................................................................... 45

  Tabel 4.9

Tabel 4.10 Hasil estimasi parameter model regresi dengan metode GCV ..................... 46Tabel 4.11 Pengujian parameter model regresi secara parsial ....................................... 47

  Nilai UBR dengan 1 titik knot .................................................................... 48

  Tabel 4.12

Tabel 4.13 Nilai UBR dengan 2 titik knot .................................................................... 48Tabel 4.14 Nilai UBR dengan 3 titik knot .................................................................... 50

  Nilai UBR dengan kombinasi titik knot ...................................................... 51

  Tabel 4.15

Tabel 4.16 Ringkasan hasil pemilihan titik knot dengan metode UBR .......................... 52Tabel 4.17 Estimasi koefisien parameter ...................................................................... 52

  ANOVA uji glejser ..................................................................................... 53

  Tabel 4.18

  Uji normalitas ............................................................................................. 54

  Tabel 4.19

Tabel 4.20 Perbandingan metode GCV dan UBR ......................................................... 55

  

(halaman ini sengaja dikosongkan)

  DAFTAR GAMBAR

  Halaman

Gambar 3.1 Diagram Faktor ysng Mempengaruhi AKM ...................................................... 26Gambar 4.1 Scatter plot AKM dan Faktor-Faktor yang Mempengaruhi ................................ 37Gambar 4.2 Uji Normalitas AKM ........................................................................................ 37 Gambar 4.3

  ACF plot residual pemodelan regresi dengan metode GCV ............................... 44

Gambar 4.4 ACF plot residual pemodelan regresi dengan metode UBR ............................... 53

  

(halaman ini sengaja dikosongkan)

  xiii DAFTAR LAMPIRAN

  Halaman

  

Lampiran 1. Data angka kematian maternal dan variabel yang diduga berpengaruh ............. 63

Lampiran 2. Program untuk mencari nilai GCV dan UBR dengan satu titik knot ................. 64

Lampiran 3. Program untuk mencari nilai GCV dan UBR dengan dua knot......................... 66

Lampiran 4.

  Program untuk mencari nilai GCV dan UBR dengan tiga titik knot ................. 69

  Lampiran 5. Program untuk mencari nilai GCV dan UBR dengan kombinasi titik

  knot ................................................................................................................ 74 Lampiran 6. Program untuk estimasi parameter .................................................................... 79

  

Lampiran 7. Program untuk uji asumsi residual .................................................................... 82

Lampiran 8. Program untuk uji asumsi residual .................................................................... 83

  

xiv

(halaman ini sengaja dikosongkan)

KATA PENGANTAR

  Alhamdulillah, puji syukur tak terhingga dipanjatkan kehadirat Allah SWT karena berkat limpahan rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan tesis yang berjudul : Perbandingan Model Regresi Nonparametrik Spline Multivariabel Menggunakan Generalized Cross Validation (GCV) dan Unbiassed Risk (UBR) dalam Pemilihan Titik Knot Optimal. Studi kasus : Angka Kematian Maternal di Jawa Timur 2013.Tesis ini disusun sebagai salah satu syarat untuk menyelesaikan studi pada Program Studi Statistika, Program Pascasarjana, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Teknologi Sepuluh Nopember (ITS) Surabaya.

  Selesainya laporan Tesis ini tak lepas dari peranan berbagai pihak. Oleh karena itu pada kesempatan ini penulis mengucapkan terimakasih yang sedalamnya kepada :

  1. Bapak I Nyoman Budiantara dan Bapak Wahyu Wibowo selaku dosen pembimbing yang telah bersedia meluangkan waktu di tengah kesibukannya untuk membimbing penulis.

  2. Ibu Santi Wulan Purnami dan Ibu Vita Ratnasari selaku penguji yang telah memberikan kritik, saran serta masukan demi kesempurnaan tesis ini.

  3. Bapak Dr. Suhartono, M.Sc selaku ketua Jurusan Statistika ITS dan Staff, karyawan TU, RBS Jurusan Statistika ITS

  4. Bapak Dr.rer. pol.HeriKuswanto, M.Si selaku kaprodi pasca sarjana Jurusan Statistika ITS 5. Bapak dan Ibu dosen pengajar Jurusan Statistika ITS, terimakasih ilmu yang telah diberikan

  6. Kedua orang tua yang sangat saya cintai dan hormati, Bapak Seto Wardoyo dan Ibu Ummu Kultum, terimakasih atas segala doa yang tidak pernah berhenti dan dukungan baik moral maupun meteril yang tiada henti. Semoga selalu bisa membahagiakan Abi dan Umi.

  7. Mbak Murni dan Mbak Dyah, terimakasih dukungan dan motivasi yang diberikan, semoga keberkahan dan kesuksesan senantiasa menyertai kita.

  8. Meriska, Lela, Renny, Surya, Muktar, terimakasih telah menjadi keluarga yang baik selama di Surabaya dan semua rekan-rekan pascasarjana Statistika lainnya, terimakasih telah menjadi keluarga baru selama di Surabaya Besar harapan penulis agar Tesis ini bermanfaat dan dapat menambah wawasan keilmuan. Penulis menyadari sepenuhnya bahwa Tesis ini belum sempurna, oleh karena itu saran dan kritik yang membangun sangat penulis harapkan.

  Surabaya, Januari 2016 Penulis

  

PERBANDINGAN MODEL REGRESI NONPARAMETRIK SPLINE

MULTIVARIABEL DENGAN MENGGUNAKAN METODE GCV DAN UBR

DALAM PEMILIHAN TITIK KNOT OPTIMAL

  (Studi Kasus Data Angka Kematian Maternal di Jawa Timur) Nama Mahasiswa : Sulistya Umie Ruhmana Sari NRP : 1314201030 Pembimbing 1 : Prof. Dr. Drs. I Nyoman Budiantara, M.Si Pembimbing 2 : Dr. Wahyu Wibowo, M.Si

  ABSTRAK Pada regresi nonparametrik spline menentukan titik knot optimal menjadi hal yang sangat penting. Model regresi spline terbaik dihasilkan dari pemilihan titik knot yang paling optimal. Terdapat beberapa metode yang dapat digunakan untuk memilih titik knot optimal, antara lain Generalized Cross Validation (GCV), Unbiassed Risk (UBR) dan Generalized Maximum Likelihood (GML). Penelitian ini akan membahas tentang perbandingan model regresi spline nonparametrik multivariabel dengan menggunakan metode GCV dan UBR sebagai metode pemilihan titik knot optimal.

  2 Kriteria pemilihan model terbaik adalah berdasarkan nilai MSE dan nilai R . adj

  Selanjutnya akan dilakukan pemodelan menggunakan data Angka Kematian Maternal di Jawa Timur dengan menggunakan regresi nonparametrik spline. Pada hasil penelitian didapatkan dengan menggunakan metode GCV, titik knot optimum adalah menggunakan kombinasi titik knot 2-3-2-2-1 yang menghasilkan nilai MSE 0,002059

  2

  dan nilai R sebesar 92,4%. Selanjutnya pada uji parameter didapatkan nilai bahwa

  adj semua variabel berpengaruh signifikan dengan semua asumsi residual terpenuhi.

  Sementara, dengan menggunakan metode UBR didapatkan hasil yang berbeda. Titik knot optimum adalah menggunakan satu titik knot yang menghasilkan nilai MSE

  2

  sebesar 0,01315 dan nilai R sebesar 52,15%. Pada uji parameter didapat bahwa

  adj

  semua variabel tidak berpengaruh signifikan serta asumsi normalitas residual yang tidak terpenuhi. Hal ini membuktikan bahwa pemodelan regresi nonparametrik dengan menggunakan metode GCV lebih baik untuk data berdistribusi normal seperti angka kematian maternal dibandingkan menggunakan metode UBR dalam pemilihan titik knot.

  : Spline, GCV, UBR dan Angka Kematian Maternal.

  Kata kunci

i

  

ii

(halaman ini sengaja dikosongkan)

  

COMPARISON OF MULTIVARIABLE NONPARAMETRIK SPLINE

REGRESSION MODEL USING GCV AND UBR METHODS IN SELECTION

THE OPTIMAL KNOT POINT

  (Case Study : Maternal Mortality Rate in East Java) Name : Sulistya Umie Ruhmana Sari NRP : 1314 201 030 Supervisor 1 : Prof. Dr. Drs. I Nyoman Budiantara, M.Si Supervisor 2 : Dr. Wahyu Wibowo, M.Si

  ABSTRACT In the nonparametric regression spline, determine the optimal point knot becomes very important. Best spline regression model resulting from the selection of the most optimal point knots. There are several methods that can be used to select the optimal knots points, among others Generalized Cross Validation (GCV), Unbiassed Risk (UBR) and Generalized Maximum Likelihood (GML). This research will discuss about the comparison of spline nonparametric regression multivariable models using the GCV and UBR as the method for selecting the optimal knots point. Criteria for selection of the best model is based on the MSE. Next will be using the data modeling Maternal Mortality in East Java using nonparametric regression spline. In the research results obtained by using the method of GCV, knots optimum point is to use a

  2

  combination of 2-3-2-2-1 knots point that generates the MSE 0.0009965 and R is

  adj

  92,4%. Furthermore, the test parameter values obtained that all variables have a significant effect with all the residual assumptions are met. While, by using UBR obtained different results. Knots optimum point is to use a single point of knots that

  2

  generate value MSE of 0.008486 and R sebesar 52,15%. In the test parameters

  

adj

  obtained that all variables not significant and residual normality assumptions were not met. This proves that the nonparametric regression modeling using GCV method is better for maternal mortality data comparison method in the selection of UBR point knots.

  Keywords : Spline, GCV, UBR and Maternal Mortality

  

(halaman ini sengaja dikosongkan)

BAB I PENDAHULUAN

1.1 Latar Belakang

  Analisis regresi adalah suatu metode statistika yang dilakukan untuk mengetahui pola hubungan antara satu atau lebih variabel. Bentuk pola hubungan antara variabel prediktor dengan variabel respon dapat diidentifikasi berdasarkan informasi masa lalu atau dengan menggunakan scatter plot (Hardle, 1990). Selain itu analisis regresi bertujuan untuk melakukan sebuah prediksi (Budiantara, 2009). Namun dalam konsep regresi, prediksi hanya boleh dilakukan dalam rentang data dari variabel-variabel yang digunakan untuk membentuk model regresi tersebut. Analisis regresi dapat diterapkan pada data yang mempunyai korelasi antar variabel, oleh karena itu sebelum melakukan analisis regresi, sebaiknya menyelidiki apakah variabel-variabel yang digunakan mempunyai korelasi atau tidak. Tujuan utama dalam melakukan analisis regresi adalah untuk mencari bentuk estimasi kurva regresi.

  Terdapat 3 pendekatan dalam melakukan estimasi kurva regesi yaitu pendekatan parametrik, nonparametrik dan pendekatan semiparametrik. Pendekatan parametrik digunakan ketika bentuk kurva regresi diketahui polanya, baik berupa linier, kuadratik, kubik, polinomial derajat p, eksponen, dll. Selain itu, pada pendekatan parametrik juga harus mempunyai informasi masa lalu terhadap karakteristik data yang digunakan agar mendapatkan model regresi yang baik. Dalam model regresi parametrik, estimasi kurva regresi akan ekuivalen dengan estimasi terhadap parameter-parameter dalam model (Budiantara, 2009). Sebaliknya, pendekatan nonparametrik digunakan jika bentuk kurva regresi tidak diketahui polanya dan bisa juga digunakan ketika tidak adaatau keterbatasan informasi masa lalu terhadap karakteristik data yang digunakan. Beberapa tahun terakhir, pendekatan regresi nonparametrik menjadi alat yang sangat bermanfaat bagi para statistikawan yang digunakan untuk analisis, prediksi dan peramalan, (Memmedli dan Nizamitdinov, 2012). Dalam pendekatan nonparametrik, kurva regresi hanya diasumsikan smooth (mulus) dalam arti termuat di dalam suatu fungsi tertentu. Kelebihan ketika menggunakan pendekatan nonparametrik yaitu

  

1 mempunyai fleksibilitas yang tinggi, artinya data diharapkan dapat mencari sendiri bentuk estimasinya, tanpa adanya pengaruh dari subjektivitas si peneliti.Terdapat beberapa metode yang telah banyak digunakan untuk memodelkan regresi dengan menggunakan pendekatan nonparametrik yaitu antara lain: Kernel (Hardle,1990), Spline (Wahba, 1990; Budiantara,2009), K-Nearest

  

Neighbor (Hardle,1990), Histogram (Green dan Silverman, 1994), Estimator

  Deret Fourier (Eubank,1988), MARS, Deret Orthogonal, Wavelets, Neural Network. Dari berbagai metode yang banyak digunakan, spline adalah salah satu metode yang mempunyai banyak kelebihan.

  Spline adalah salah satu bentuk estimator yang juga seringkali digunakan dalam regresi nonparametrik karena mempunyai banyak kelebihan. Spline sebagai pendekatan pola data dikenalkan oleh Whittaker pada tahun 1923. Selanjutnya, Spline dipopulerkan oleh Schoenberg pada tahun 1942. Sedangkan spline yang didasarkan pada suatu persoalan optimasi dikembangkan oleh Reinsch pada tahun 1967 (Wahba, 1990). Pendekatan spline mempunyai suatu basis fungsi. Basis fungsi yang biasa digunakan antara lain spline truncated dan B-spline. Spline merupakan fungsi dimana terdapat perubahan pola perilaku kurva yang

  Truncated

  berbeda pada interval-interval yang berlainan. Berbagai macam kelebihan jika menggunakan spline antara lain: mempunyai intepretasi visual yang baik, bersifat fleksibel, serta mampu menangani karakter fungsi yang bersifat mulus (Eubank, 1988; Budiantara, 2007). Selain itu, spline dapat mengatasi pola data dan dapat menggambarkan perubahan perilaku data yang berubah-ubah pada sub-sub interval tertentu. Spline juga mempunyai keunggulan dalam mengatasi pola data yang menunjukkan naik/turun yang tajam dengan bantuan titik-titik knot serta kurva yang dihasilkan relatif mulus (Eubank, 1988). Spline diperoleh berdasarkan optimasi yang merupakan perluasan dari optimasi optimasi yang digunakan pada regresi parametrik. Berbagai pendekatan regresi nonparametrik yang lain, tidak memiliki tata cara optimasi seperti yang ada pada spline. Dalam pendekatan spline, terdapat optimasi Penalized Least Square (PLS) yang merupakan hasil dari gerenalisasi metode Least Square (LS) yang ada pada regresi parametrik. Selain itu, terdapat pula optimasi Penalized Likelihood (PL) yang juga merupakan hasil dari generalisasi metode Maksimum Likelihood (ML) serta optimasi Penalized

  2 Log Likelihood (PLL) yang merupakan hasil generalisasi metode Log Likelihood (LL) pada regresi parametrik.

  Spline merupakan potongan-potongan polinomial yang memiliki sifat tersegmen dan kontinu. Salah satu kelebihan spline seperti yang telah dijelaskan adalah bersifat fleksibel, artinya model ini cenderung mencari sendiri estimasi data kemanapun pola data tersebut bergerak. Hal tersebut terjadi karena dalam spline terdapat adanya titik-titik knot. Titik knot adalah titik perpaduan bersama yang menunjukkan terjadinya perubahan pola perilaku data (Eubank, 1988; Budiantara,2009). Dengan titik knot ini, spline dapat memberikan fleksibilitas yang lebih baik dari pada polinomial, sehingga memungkinkan untuk menyesuaikan diri secara efektif terhadap karakteristik lokal dari suatu fungsi atau data. Dalam proses estimasi, apabila estimator spline diperoleh berdasarkan optimasi Penalized Least Square (PLS), maka persoalan utama dalam estimator ini adalah pemilihan parameter penghalus yang optimal. Sementara, apabila estimator spline yang dipilih dengan optimasi Least Square (LS), maka persoalan utama dalam estimator ini adalah pemilihan titik-titik kot yang optimal. Semakin optimal titik knot yang digunakan dalam membuat model regresi maka akan semakin besar pula kebaikan model regresi yang didapatkan.

  Ada tiga kriteria yang harus diperhatikan dalam membentuk model regresi Spline, antara lain: menentukan orde untuk model, banyaknya knot, dan lokasi penempatan knot, (Montoya, et all, 2014). Orde untuk model dapat ditentukan berdasarkan pola yang terjadi pada data, sementara banyaknya knot dan lokasi knot ditentukan berdasarkan perubahan pola data yang terjadi pada sub-sub interval tertentu. Terdapat beberapa metode untuk memilih titik knot yang optimal dalam regresi nonparametrik Spline antara lain metode Cross Validation (CV) yang diberikan oleh Craven dan Wahba (1979), Unbiassed Risk (UBR) yang diberikan oleh Wang (1997), Generalized Cross Validation (GCV) yang diberikan oleh Wahba (1990), dan Generalized Maximum Likelihood (GML) oleh Wahba (1990). Dalam penelitian ini akan membandingkan hasil pemilihan titik knot optimal dengan metode GCV dan metode UBR.

  GCV dan UBR adalah metode pemilihan titik knot optimal yang mempunyai banyak kelebihan. Adapun kelebihan yang dimiliki metode GCV antara lain adalah sederhana dan efisien dalam perhitungan, optimal secara asimtotik,

  3 invarian terhadap transformasi dan tidak memerlukan informasi terhadap σ². Pemilihan titik knot dengan metode GCV akan lebih baik jika digunakan pada data yang Gaussian (berdistribusi normal), sementara pemilihan titik knot dengan metode UBR akan lebih baik jika digunakan pada data non-Gaussian atau tidak berdistribusi normal, (Wahba, 1990; Wang, 1998). Berdasarkan pernyataan tersebut, peneliti tertarik untuk membandingkan apakah model regresi nonparametrik spline multivariabel menggunakan metode GCV akan lebih baik jika dibandingkan dengan model regresi nonparametrik spline multivariabel menggunakan metode UBR pada data Angka Kematian Maternal di Provinsi Jawa Timur tahun 2013 yang mempunyai distribusi normal.

  Kematian Maternal menurut batasan dari The Tenth Revision of The International Classification of Diseases (ICD-10) adalah kematian wanita yang terjadi pada saat kehamilan atau dalam waktu 42 hari setelah kehamilan, tidak tergantung dari lama dan lokasi kehamilan, disebabkan oleh apapun yang berhubungan dengan kehamilan, atau yang diperberat oleh kehamilan tersebut, atau penanganannya, akan tetapi bukan kematiaan yang disebabkan oleh kecelakaan atau kebetulan (Safrudin dan Hamidah, 2009). Kematian maternal secara langsung atau tidak langsung sangat berpengaruh terhadap kualitas tumbuh kembang bayi pada masa perinatal, bahkan sampai masa balita dan usia sekolah (Kusumawati, 2012).

  (MDGs) atau Tujuan Pembangunan

  Millenium Development Goals

  Milenium adalah Deklarasi Milenium hasil kesepakatan kepala negara dan perwakilan dari 189 negara Perserikatan Bangsa-bangsa yang dimulai September tahun 2000, berupa delapan butir tujuan untuk dicapai pada tahun 2015. Targetnya adalah tercapai kesejahteraan rakyat dan pembangunan masyarakat pada 2015. Dari delapan butir tujuan MDGs, tujuan kelima adalah meningkatkan kesehatan ibu, dengan target menurunkan angka kematian ibu sebesar tiga perempatnya antara 1990

  • – 2015, serta yang menjadi indikator untuk monitoring yaitu angka kematian ibu, proporsi pertolongan persalinan oleh tenaga kesehatan terlatih, dan angka pemakaian kontrasepsi. Target AKI di Indonesia pada tahun 2015 adalah 102 kematian per 100.000 kelahiran hidup. Sementara itu berdasarkan Survei Demografi dan Kesehatan Indonesia (SDKI) tahun 2012, Angka Kematian Ibu (AKI) (yang berkaitan dengan kehamilan, persalinan, dan

  4 nifas) sebesar 359 per 100.000 kelahiran hidup. Angka ini masih cukup jauh dari target yang harus dicapai pada tahun 2015.Penyebab utama kematian ibu diklasifikasikan sebagai langsung dan tidak langsung, dimana penyebab langsung berhubungan dengan komplikasi obstetrik selama masa kehamilan, persalinan dan masa nifas (post-partum). Mayoritas penyebab kematian ibu adalah penyebab langsung. Sementara, penyebab tidak langsung diakibatkan oleh penyakit yang telah diderita ibu, atau penyakit yang timbul selama kehamilan dan tidak ada kaitannya dengan penyebab langsung obstetrik, tapi penyakit tersebut diperberat oleh efek fisiologik kehamilan.

  Saat ini Indonesia masih menghadapi permasalahan tingginya angka kematian maternal. Menurut Survei Demografi Kesehatan Indonesia, Indonesia memiliki angka kematian maternal tertinggi di ASEAN pada tahun 2002-2003 sebesar 307 per 100000 kelahiran. Angka kematian maternal di Indonesia tahun 2007 adalah 228 per 100000 kelahiran pada tahun 2007 dan turun menjadi 220 per 100000 kelahiran pada tahun 2010. Hal tersebut menyebabkan Indonesia menduduki peringkat 51 tertinggi angka kematian maternal di dunia menurut CIA World pada tahun 2010. Akan tetapi, angka kematian maternal meningkat lagi

  Factbook

  pada tahun 2011 menjadi 228 per 100000 kelahiran, yang membuat angka kematian di Indonesia tertinggi di Asia Tenggara. Sesuai target nasional menurut MDGs (Millennium Development Goals) yaitu menurunkan angka kematian maternal sebesar ¾ dari angka kematian maternal pada tahun 1990, yaitu 450 per 100000 menjadi 102 per 100000 kelahiran pada tahun 2015. Slamet Riyadi Yuwono, Direktur Jenderal Bina Gizi dan Kesehatan Ibu Anak, mengatakan bahwa pemerintah mungkin dapat mengurangi angka kematian maternal menjadi 162 per 100000 kelahiran hidup, akan tetapi itu jauh lebih tinggi dari target MDGs. 5 Provinsi dengan angka kematian maternal tertinggi di Indonesia pada tahun 2011 adalah Jawa Barat, Jawa Tengah, Jawa Timur, Sumatera Utara, dan NTT.

  Berbagai penelitian telah dilakukan terkait dengan Kematian Maternal diantaranya adalah Probohapsari (2007) yang melakukan analisis faktor sosial ekonomi terhadap angka kematian maternal di Jawa Timur pada tahun 2001-2004 menggunakan analisis regresi linier berganda, Chamidah (2008) menganalisis jumlah kematian maternal dengan menggunakan regresi binomial negatif. Selain

  5 itu penelitian tentang kematian maternal juga dilakukan oleh Darnah (2009) dengan menggunakan model regresi poisson. Novita (2011) memodelkan pengaruh kematian maternal menggunakan Geographically Weighted Poisson

  . Pertiwi (2012) memodelkan pengaruh kematian maternal

  Regression

  menggunakan Spatial Durbin Model. Berdasarkan penjelasan diatas, masih belum terdapat penelitian yang mengkaji perbandingan metode GCV dan UBR dalam pemilihan titik knot optimum pada regresi nonparametrik spline truncated multivariabel (studi kasus kematian maternal di Provinsi Jawa Timur sebagai provinsi dengan kontribusi cukup tinggi dalam kematian maternal di Jawa Timur).

  1.2 Rumusan Permasalahan

  Permasalahan dalam penelitian ini adalah : 1.

  Bagaimana kajian metode GCV untuk memilih titik knot optimal dalam model regresi nonparametrik spline?

  2. Bagaimana kajian metode UBR untuk memilih titik knot optimal dalam model regresi nonparametrik spline?

  3. Bagaimana perbandingan metode GCV dan UBR dalam aplikasinya dengan menggunakan data angka kematian maternal provinsi Jawa Timur tahun 2013?

  1.3 Tujuan Penelitian 1.

  Mengkaji metode GCV untuk memilih titik knot optimal dalam model regresi nonparametrik spline.

  2. Mengkaji metode UBR untuk memilih titik knot optimal dalam model regresi nonparametrik spline.

  3. Membandingkan metode GCV dan UBR dalam aplikasinya dengan menggunakan data angka kematian maternal provinsi Jawa Timur tahun 2013.

1.4 Manfaat Penelitian 1.

  Hasil penelitian ini diharapkan dapat memberikan wacana baru yaitu aplikasi nonparametrik di bidang sosial kesehatan.

  2. Hasil penelitian ini dapat menjadi masukan kepada pihak pemerintah khususnya Pemerintah Daerah Provinsi Jawa Timur dalam menangani

  

6

  

7

  kematian maternal agar tujuan kelima MDGs yaitu improve maternal health dapat tercapai.

1.5 Batasan Penelitian 1.

  Model regresi nonparametrik yang digunakan adalah Spline Truncated.

  2. Data yang digunakan adalah data sekunder pada tahun 2013.

  3. Metode estimasi yang digunakan dalam penelitian ini adalah Least Square.

  4. Pemilihan titik knot pada Spline Truncated digunakan sebanyak 1,2, dan 3 titik knot.

  

8

(halaman ini sengaja dikosongkan)

BAB II TINJAUAN PUSTAKA Pada bagian ini akan dibahas mengenai beberapa landasan teori untuk terkait

  untuk menyelesaikan permasalahan pada rumusan masalah penelitian mengenai angka kematian maternal di Jawa Timur meliputi analisis regresi, regresi nonparametrik, metode GCV, metode UBR, uji parameter, uji asumsi residual, serta definisi kematian maternal dan faktor-faktor yang mempengaruhinya.

  2.1 Analisis Regresi

  Analisis regresi adalah salah satu metode statistika yang berfungsi untuk mengetahui pola hubungan antara variabel respon dengan variabel prediktor. Terdapat dua jenis variabel yang saling berkorelasi dalam analisis regresi yaitu variabel independen yang biasa disimbolkan dengan dan variabel dependen yang biasa disimbolkan dengan

  . Tujuan utama analisis regresi adalah mencari bentuk estimasi untuk kurva regresi. Apabila dalam analisis regresi bentuk kurva regresi diketahui maka didekati dengan model regresi parametrik (Budiantara,2005). Sedangkan bila pola kurva regresi tidak diketahui maka digunakan regresi nonparametrik. Jika terdapat komponen parametrik dan komponen nonparametrik maka digunakan regresi semiparametrik.

  2.2 Analisis Regresi Linier

  Analisis regresi linier adalah analisis yang digunakan untuk memodelkan hubungan antara variabel respon dan variabel prediktor dengan pola data berbentuk garis yang linier. Apabila hanya terdapat satu variabel respon dan satu variabel prediktor maka disebut sebagai regresi linier sederhana, sedangkan apabila terdapat satu variabel respon dan lebih dari satu variabel prediktor maka disebut sebagai regresi linier berganda.

  Jika x adalah variabel prediktor, y adalah variabel respon dan terdapat hubungan fungsional antara variabel tersebut, maka fungsinya dapat dijabarkan sebagai berikut.

  (2.1) ( ) dimanay adalah suatu fungsi dari variabel prediktor dengan adalah error yang diasumsikan bersifat identik, independen dan berdistribusi normal (0,σ²).

  2.3 Analisis Regresi Linier Berganda

  Pendekatan regresi parametrik spline digunakan jika bentuk dari kurva regresi antara variabel respon dengan variabel prediktor diketahui polanya. Adapun persamaan untuk regresi parametrik secara umum adalah sebagai berikut.

  (2.2) Jika persamaan (2.3) ditulis dalam bentuk matrik adalah sebagai berikut. (2.3)

  ̃ ̃ ̃ dimana : ̃ : yang merupakan vektor berukuran nx1

  X: matrik berukuran nx(p+1) yang berisikan satu kolom angka 1dan p kolom data prediktor ̃ : vektor error random berukuran nx1

  Metode OLS (Ordinary Least Square) dapat juga digunakan untuk memperoleh estimasi parameter pada regresi parametrik dengan meminimumkan jumlah kuadrat eror. Estimasi untuk parameter dalam matrik diberikan oleh :

  (2.4) ̂ ( ) ̃

  2.4 Analisis Regresi Polinomial

  Regresi Polinomial merupakan suatu model regresi linier yang bersifat additif yang dibentuk dengan menjumlahkan masing-masing variabel prediktor yang dipangkatkan meningkat sampai derajat ke-p. (Drapper dan Smith, 1992). Secara umum, model regresi polinomial adalah sebagai berikut.

  (2.5)

  2.5 Regresi Nonparametrik Spline

  Pendekatan regresi nonparametrik spline digunakan jika kurva regresi antara variabel respon dengan variabel prediktor tidak membentuk suatu pola atau tidak ada informasi masa lalu yang lengkap mengenai pola data. Dalam banyak hal, pengamatan-pengamatan yang akan dikaji tidak selalu memenuhi asumsi-asumsi yang mendasari uji parametrik sehingga kerap kali dibutuhkan teknik-teknik inferensial dengan validitas yang tidak bergantung pada asumsi-asumsi yang kaku. Dalam hal ini, teknik-teknik dalam regresi nonparametrik memenuhi kebutuhan. Regresi nonparametrik memiliki fleksibilitas yang tinggi, karena data diharapkan mencari sendiri bentuk estimasi kurva regresinya tanpa dipengaruhi oleh faktor subyektifitas peneliti (Eubank, 1988).

  Secara umum, model regresi nonparametrik dapat disajikan sebagai berikut.

  (2.6) ( ) , dengan adalah variabel respon,dan

  ) adalah kurva rergresi yang tidak diketahui ( bentuknya, dan adalah error yang diasumsikan berdistribusi N(0, ).

  Spline merupakan model polynomial yang tersegmen. Polinomial tersegmen memegang peranan penting dalam teori dan aplikasi statistika. Regresi spline memiliki titik knot yang merupakan titik perpaduan yang menunjukkan perubahan perilaku kurva pada selang yang berbeda (Hardle, 1990). Secara umum fungsi spline dapat dinyatakan sebagai berikut. (

  ) berorde dengan titik knot m J j m

  f xxxk , (2.7)

   

    i j i m j i j

     

j j

 

  1

  dengan merupakan parameter-parameter model dan merupakan orde spline (Budiantara, 2001). Persamaan (2.7) bila disubstitusikan pada persamaan (2.6) diperoleh persamaan regresi nonparametrik spline sebagai berikut.

  (2.8) ∑ ∑ ( ) dengan fungsi truncated diberikan oleh :

  ) (2.9)

  ( ) ( Metode least square adalah metode yang digunakan untuk memperoleh estimasi parameter  yaitu dengan meminimumkan jumlah kuadrat error. Apabila diasumsikan error  berdistribusi normal independen dengan rata rata nol dan variansi i

  2

  adalah y pada model regresi juga model normal dengan rata-rata  , maka i

  ) dan (

  2

  variansi adalah  . Meminimunkan jumlah kuadrat error berdasarkan metode least square adalah sebagai berikut.

  • 2 i n T T T T T T T i
  • 2

  2

  (2.14)

  X X

  X T T Y  

  (2.15)

    1 T = X X

  X T Y

  

  (2.16) dimana :

             

  1

  1

  1

  1

  1

  2

     

  2

  1

  2

  1

  1

  1

  1 X= m m m J m m m J m m m n n n n J x k x k x x x x x k x k x x x k x k

       

     

       

         

   

  (2.17)

  Pada regresi nonparametrik spline menentukan titik knot optimal menjadi hal yang sangat penting. Model regresi spline terbaik dihasilkan dari pemilihan titik knot yang paling optimal. Titik knot disebut juga parameter penghalus. Estimator spline sangat tergantung pada parameter penghalus, sehingga pemilihan parameter penghalus (smoothing parameter) merupakan hal yang penting dalam mencari estimator spline yang paling sesuai.Wahba, G. dan Wang, Y. dalam Diana, et all (2012) memperlihatkan bahwa jika nilai parameter penghalus kecil maka akan memberikan estimator spline yang sangat kasar. Sebaliknya, jika nilai parameter

  X X T T Y    

  2

   

  (2.13)

  2

  2

  1 i n i i iy g x

  

   

  

  (2.10)

   

  2

  2

  1 i n m m m j i j i m j i j i j j y x x k

    

      

  

 

     

 

   

 

 

 

    

  Selanjutnya, persamaan diatas diturunkan terhadap vektor  T dan disamakan dengan nol, maka :

   

     

  X X = T T T T T T T T Y Y Y     

  X +

     

  X X X (2.12)