ESTIMASI MODEL REGRESI NONPARAMETRIK MULTIVARIAT BERDASARKAN ESTIMATOR POLINOMIAL LOKAL ORDE DUA SKRIPSI

ESTIMASI MODEL REGRESI NONPARAMETRIK MULTIVARIAT BERDASARKAN ESTIMATOR POLINOMIAL LOKAL ORDE DUA SKRIPSI

  ESTIMASI MODEL REGRESI NONPARAMETRIK MULTIVARIAT BERDASARKAN ESTIMATOR POLINOMIAL LOKAL ORDE DUA SKRIPSI Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Sains Bidang Matematika Pada Fakultas Sains dan Teknologi Universitas Airlangga Disetujui Oleh : Pembimbing I, Pembimbing II, Drs. Suliyanto, M.Si Drs. Eko Tjahjono, M.Si NIP. 19650907 199102 1 001 NIP . 19600706 198601 1 001

  ii

  LEMBAR PENGESAHAN NASKAH SKRIPSI Judul : Estimasi Model Regresi Nonparametrik Multivariat Berdasarkan Estimator Polinomial Lokal Orde Dua Penyusun : Dyah Widiantini NIM : 080810540 Tanggal Ujian : 18 Juni 2012 Disetujui oleh : Pembimbing I, Pembimbing II, Drs. Suliyanto, M.Si Drs. Eko Tjahjono, M.Si NIP. 19650907 199102 1 001 NIP . 19600706 198601 1 001 Mengetahui : Ketua Program Studi S-1 Matematika Departemen Matematika Fakultas Sains dan Teknologi Universitas Airlangga Dr. Miswanto, M.Si NIP. 19680204 199303 1 002

  iii

PEDOMAN PENGGUNAAN SKRIPSI

  Skripsi ini tidak dipublikasikan, namun tersedia di perpustakaan dalam lingkungan Universitas Airlangga, diperkenankan untuk dipakai sebagai referensi kepustakaan, tetapi pengutipan harus seizin penyusun dan harus menyebutkan sumbernya sesuai kebiasaan ilmiah. Dokumen skripsi ini merupakan hak milik Universitas Airlangga. iv

KATA PENGANTAR

  Alhamdulillah, segala puji hanya untuk Allah Tuhan semesta alam, atas segala berkat, rahmat, taufik, serta hidayah-Nya yang tak terkira besarnya, sehingga penulis dapat menyelesaikan skripsi dengan judul ”Estimasi Model Regresi Nonparametrik Multivariat Berdasarkan Estimator Polinomial Lokal Orde Dua”.

  Dalam penyusunannya, penulis memperoleh banyak bantuan dari berbagai pihak, karena itu penulis mengucapkan terima kasih yang sebesar-besarnya kepada :

  1. Allah SWT, yang telah banyak memberikan rahmat dan hidayah-Nya kepada penulis.

  2. Kedua orang tua dan adik-adik penulis, yang telah memberikan dukungan, kasih, dan kepercayaan yang begitu besar.

  3. Dr. Miswanto M.Si selaku Ketua Program Studi Matematika Fakultas Sains dan Teknologi yang telah banyak membantu dengan arahan-arahannya.

  4. Dra. Utami Dyah P, M.Si selaku dosen wali selama menjadi mahasiswa Fakultas Sains dan Teknologi Universitas Airlangga, yang telah banyak memberikan arahan dan saran demi kesuksesan penulis.

  5. Drs. Suliyanto, M.Si selaku dosen pembimbing I yang telah memberikan banyak arahan, masukan, perhatian, semangat, rasa sabar yang begitu besar dan pengetahuan yang tidak ternilai harganya.

  6. Drs. Eko Tjahjono, M.Si. selaku dosen pembimbing II yang telah memberikan banyak arahan, masukan, waktu, tenaga dan pikiran yang sangat bemanfaat.

  7. Toha Saifudin, S.Si, M.Si selaku dosen penguji I dan Dr. Fatmawati, M.Si selaku dosen penguji II yang telah banyak memberikan saran dan masukan agar penulisan skripsi ini dapat lebih baik lagi.

  8. Seluruh dosen Matematika Universitas Airlangga, terima kasih untuk segala ilmu yang diberikan.

  9. Keluarga besar UPTD Ponsos Kalijudan, khususnya kepada Ibu Hj. Rosalia Endang Setyawati selaku kepala asrama, terima kasih atas doa, bimbingan, dan nasehatnya selama ini. Juga teman-teman asrama putra dan putri angkatan 2008, 2009, dan 2011, khususnya teman sekamarku, Titi, Widya, dan Silvi. Aku akan selalu merindukan kebersamaan dengan kalian selama 4 tahun terakhir ini.

  Semoga suatu saat nanti kita bisa reuni bersama...!!!

  10. Abang, yang telah setia menemani dan banyak memberikan motivasi serta saran yang membangun, sehingga penulis bisa belajar banyak hal darinya.

  11. Anggota GP++ : Ragil, Rika, Dilpi, Mita, Lina, Dinda, Lia, Tika, Vita, Michelle, terima kasih atas kebersamaan dan kekompakannya selama ini. Semoga persahabatan kita tetap langgeng sampai tua nanti. I love u all.. Skripsi Berdasarkan Estimator Polinomial Lokal Orde Dua Estimasi Model Regresi Nonparametrik Multivariat v Widiantini, Dyah

  12. Teman-teman Matematika 2008, juga untuk kakak-kakak 2007 dan adik-adik di 2009, terima kasih untuk segala bantuannya.

  13. Serta pihak-pihak lain yang tidak dapat disebutkan satu persatu, terima kasih atas segala bantuan dalam penyelesaian skripsi ini.

  Penulis menyadari bahwa masih terdapat banyak kekurangan dalam penulisan skripsi ini. Oleh karena itu, kritik dan saran yang membangun terus penulis harapkan agar skripsi ini dapat lebih baik lagi.

  Surabaya, Juli 2012 Penyusun

  Dyah Widiantini Skripsi Berdasarkan Estimator Polinomial Lokal Orde Dua Estimasi Model Regresi Nonparametrik Multivariat vi Widiantini, Dyah Dyah Widiantini, 2012. Estimasi Model Regresi Nonparametrik Multivariat Berdasarkan Estimator Polinomial Lokal Orde Dua. Skripsi ini dibawah bimbingan Drs. Suliyanto, M.Si dan Drs. Eko Tjahjono, M.Si., Departemen Matematika, Fakultas Sains dan Teknologi, Universitas Airlangga, Surabaya

  ABSTRAK

  Tujuan penulisan skripsi ini membahas estimasi model regresi nonparametrik multivariat menggunakan estimator polinomial lokal orde dua. Estimasi model regresi nonparametrik multivariat diperoleh dalam bentuk eksplisit yang merupakan fungsi dari bandwidth dan fixed point arbitrary , sehingga estimasinya dilakukan dengan memilih bandwidth optimal yang meminimumkan Generalized Cross Validation (GCV). Setelah estimasi model regresi nonparametrik multivariat diperoleh, selanjutnya dibahas estimasi selang kepercayaan untuk rata-rata estimasi model regresi nonparametrik multivariat. Data yang digunakan dalam penerapan model regresi nonparametrik multivariat adalah data berat badan balita pada di Rumah Sakit Haji Surabaya pada tahun 2006 sebanyak 30 pengamatan dengan variabel respon adalah berat badan balita dalam satuan kilogram dan kedua variabel prediktornya adalah tinggi badan balita dalam satuan meter dan lingkar kepala balita dalam satuan meter. Hasil penerapan model regresi nonparametrik multivariat pada data berat badan balita dengan selang kepercayaan diperoleh estimasi bagi rata-rata berat badan balita pada pengamatan ke-1 adalah , pada pengamatan ke-2 sebesar , sampai pada pengamatan ke-30 yaitu sebesar dengan nilai

  bandwidth optimal untuk variabel prediktor sebesar dan variabel prediktor

  sebesar . Untuk kesesuaian hasil estimasi model regresi nonparametrik multivariat diperoleh nilai dan eror random

  Kata Kunci : Regresi nonparametrik multivariat, Estimator polinomial lokal orde dua, Generalized cross validation,

  Dyah Widiantini, 2012. The Estimation of Multivariate Nonparametric Regression Model based on Second Order Local Polynomial Estimator. This Skripsi is under adviced by Drs. Suliyanto, M.Si and Drs. Eko Tjahjono, M.Si., Mathematics Department, Faculty of Sains and Technology, Airlangga University, Surabaya

  ABSTRACT

  The purpose of this Skripsi is to estimate multivariate nonparametric regression model based on second order local polynomial estimator. Estimation of multivariate nonparametric regression model is obtained in explicit form from function bandwidth and fixed point arbitrary , so that estimation can be done with choose optimal bandwidth which minimized Generalized Cross Validation (GCV). Furtehermore, we explain the confidence level for mean of estimation of multivariate nonparametric regression model.

  In this case, we used data of baby’s weight in 2006 at Rumah Sakit Haji Surabaya. There are thirty observations where the response variable is weight of baby in kilogram and predictor variables are baby’s height in meter and head circumference of baby in meter. The results of multivariate nonparametric regression model in data of baby’s weight with confidence level 95% for mean of estimation baby’s weight on first observation is , on second observation is , then on thirty observation is with an optimal bandwidth value for is and is . For compatibility of the result multivariate nonparametric regression is obtained and error random

  .

  Key Words : Multivariate nonparametric regression, Second order local polynomial estimator, Generalized cross validation,

  viii

  DAFTAR ISI

  Halaman LEMBAR JUDUL ........................................................................................... i LEMBAR PERNYATAAN ............................................................................ ii LEMBAR PENGESAHAN ............................................................................ iii LEMBAR PEDOMAN PENGGUNAAN SKRIPSI ........................................iv KATA PENGANTAR ..................................................................................... v ABSTRAK ................................................................................................... vii ABSTRACT ................................................................................................ viii DAFTAR ISI ..................................................................................................ix DAFTAR GAMBAR ......................................................................................xi DAFTAR LAMPIRAN ................................................................................. xii

  BAB I PENDAHULUAN ............................................................................... 1

  1.1 Latar Belakang Masalah .................................................................. 1

  1.2 Rumusan Masalah ........................................................................... 2

  1.3 Tujuan ............................................................................................. 3

  1.4 Manfaat ........................................................................................... 3

  1.5 Batasan Masalah .............................................................................. 4

  BAB II TINJAUAN PUSTAKA ..................................................................... 5

  2.1 Aljabar Matrik ................................................................................. 5

  2.1.1 Matriks ................................................................................ 5

  2.1.2 Nilai Eigen dan Vektor Eigen ............................................... 6

  2.1.3 Matriks Definit Positif.......................................................... 6

  2.1.4 Matriks Kalkulus.................................................................. 8

  2.2 Bandwidth (h) .................................................................................. 9

  2.3 Fungsi Kernel Univariat .................................................................. 9

  2.4 Fungsi Kernel Multivariat .............................................................. 10

  2.5 Pemilihan Bandwidth Optimal ....................................................... 11

  2.6 Deret Taylor Multivariat ................................................................ 12

  2.7 Model Regresi Nonparametrik Multivariat ..................................... 12 ix

  2.8 Estimator Polinomial Lokal Orde Dua ........................................... 12

  2.9 Distribusi Normal .......................................................................... 13

  2.10 Software S-PLUS 2000 .................................................................. 18

  2.11 Software Minitab ........................................................................... 21

  2.12 Pertumbuhan Balita ....................................................................... 21

  BAB III METODE PENELITIAN ................................................................ 22 BAB IV HASIL DAN PEMBAHASAN ....................................................... 26

  4.1 Estimasi Titik pada Model Regresi Nonparametrik Multivariat ..... 26

  4.2 Selang Kepercayaan Estimator Model Regresi Nonparametrik Multivariat .................................................................................... 34

  4.3 Penerapan pada Data ..................................................................... 38

  4.3.1 Data ................................................................................... 38

  4.3.2 Analisis Data ..................................................................... 38

  BAB V KESIMPULAN DAN SARAN ......................................................... 42

  5.1 Kesimpulan ................................................................................... 42

  5.2 Saran ............................................................................................. 43 DAFTAR PUSTAKA....................................................................................... 44 LAMPIRAN x

  xi

  DAFTAR GAMBAR Nomor Judul Halaman

  4.1 Plot data awal tinggi badan balita terhadap berat badan balita 39

  29

  4.2 Plot data awal lingkar kepala balita terhadap berat badan balita 39

  4.3 Plot selang kepercayaan bagi rata-rata berat badan balita

  40

  DAFTAR LAMPIRAN Nomor Judul

  1 Data berat badan balita di Rumah Sakit Haji Surabaya Tahun 2006

  2 Program estimasi model regresi nonparametrik multivariat

  3 Output program estimasi model regresi nonparametrik multivariat a Bandwidth optimal untuk variabel respon berat badan balita dengan variabel prediktor tinggi badan balita dan variabel prediktor lingkar kepala balita b Estimasi untuk variabel respon berat badan balita dengan variabel prediktor tinggi badan balita dan variabel prediktor lingkar kepala balita pada tiap pengamatan c Uji normalitas pada eror xii

BAB I PENDAHULUAN

1.1 Latar Belakang Masalah

  Analisis regresi digunakan untuk menelaah hubungan antara dua variabel atau lebih, terutama untuk menelusuri pola hubungan yang modelnya belum diketahui dengan sempurna, atau untuk mengetahui pengaruh dari beberapa variabel prediktor terhadap variabel respon dalam suatu fenomena yang kompleks.

  Dalam analisis regresi terdapat dua macam pendekatan, yaitu pendekatan parametrik dan pendekatan nonparametrik. Pendekatan parametrik digunakan ketika sudah ada asumsi terhadap bentuk fungsi regresi berdasarkan teori atau pengalaman masa lalu. Sedangkan pendekatan nonparametrik tidak terikat oleh asumsi bentuk fungsi regresi tertentu. Dalam kasus nyata hubungan antara variabel respon dengan variabel prediktor seringkali tidak diketahui bentuk fungsi regresinya. Oleh karena itu pendekatan regresi nonparametrik banyak sekali digunakan. Estimasi regresi nonparametrik dilakukan berdasarkan data pengamatan dengan teknik smoothing tertentu. Ada beberapa teknik smoothing yang digunakan dalam regresi nonparametrik yang memuat satu variabel prediktor, diantaranya adalah Histogram, Estimator Kernel, Estimator Spline, Estimator Penalized Spline, Estimator K-NN, Estimator Deret Fourier, Estimator Wavelet dan Deret Orthogonal (Eubank, 1988).

  Model regresi nonparametrik yang memuat lebih dari satu variabel prediktor dinamakan model regresi nonparametrik multivariat dan dapat dinyatakan sebagai

  1 adalah variabel respon pada , dengan pengamatan ke , adalah fungsi regresi multivariat pada pengamatan ke yang diasumsikan kontinu dan tidak diketahui bentuknya dan eror random .

  Estimator polinomial lokal merupakan estimator yang didasarkan pada prinsip meminimumkan jumlah kuadrat eror dengan pembobot fungsi kernel, sedangkan ukuran bobot ditentukan oleh parameter yang disebut bandwidth. Polinomial lokal merupakan suatu pendekatan yang fleksibel dan efisien dalam metode statistik (Zhang and Chan, 2010). Estimator polinomial lokal orde satu dikenal sebagai estimator lokal linier, sedangkan estimator polinomial lokal dapat digunakan untuk lebih dari satu orde, sesuai yang diinginkan. Orde inilah yang akan menjadi derajat polinomial lokal yang sesuai bagi fungsi regresinya (Fan and Gijbelis, 1996).

  Berdasarkan uraian tersebut dalam skripsi ini dibahas estimasi model regresi nonparametrik multivariat menggunakan estimator polinomial lokal orde dua, yang bersumber dari buku “Nonparametric and Semiparametric Models”, dan ditambah aplikasinya pada data berat balita pada Rumah Sakit Haji Surabaya pada tahun 2006 menggunakan software S-PLUS 2000.

1.2 Rumusan Masalah

  1. Bagaimana mengestimasi model regresi nonparametrik multivariat berdasarkan estimator polinomial lokal orde dua ?

  2. Bagaimana menerapkan model regresi nonparametrik multivariat berdasarkan estimator polinomial lokal orde dua pada data berat badan balita pada Rumah Sakit Haji Surabaya pada tahun 2006 dengan menggunakan program dalam software Minitab dan S-PLUS 2000 ?

  1.3 Tujuan

  1. Mengestimasi model regresi nonparametrik multivariat berdasarkan estimator polinomial lokal orde dua.

  2. Menerapkan model regresi nonparametrik multivariat berdasarkan estimator polinomial lokal orde dua terhadap data berat badan balita pada Rumah Sakit Haji Surabaya pada tahun 2006 dengan menggunakan program dalam software Minitab dan S-PLUS 2000.

  1.4 Manfaat

  1. Menambah wawasan mengenai model regresi nonparametrik multivariat berdasarkan estimator polinomial lokal orde dua.

  2. Mengetahui aplikasi model regresi nonparametrik multivariat pada data riil, khususnya penerapan model regresi nonparametrik multivariat berdasarkan estimator polinomial lokal orde dua pada data berat badan balita pada Rumah Sakit Haji Surabaya pada tahun 2006 .

1.5 Batasan Masalah

  Mengacu pada rumusan masalah di atas, maka ruang lingkup dalam penulisan skripsi ini dibatasi pada penggunaan model regresi nonparametrik multivariat berdasarkan kriteria GCV dalam pemilihan bandwidth optimal.

BAB II TINJAUAN PUSTAKA

2.1 Aljabar Matriks

2.1.1 Matriks

  Matriks adalah susunan bilangan real dalam bentuk persegi panjang yang mempunyai baris dan kolom dan dinotasikan :

  Definisi 2.1 Trace Trace dari matriks persegi berukuran didefinisikan sebagai jumlah dari

  elemen-elemen diagonal utama yang dinotasikan sebagai berikut

  Definisi 2.2 Matriks Diagonal

  Matriks diagonal adalah matriks persegi yang elemen selain diagonal utama bernilai nol yang dinotasikan dalam bentuk :

  (Rupert, 2003)

  Beberapa sifat matriks adalah sebagai berikut :

  1. Jika adalah transpose dari matriks , maka

  2. Jika adalah invers dari matriks , maka 5 adalah matriks nonsingular, dan

3. Jika adalah matriks nonsingular, maka

  (Myers and Milton, 1991)

  2.1.2 Nilai Eigen dan Vektor Eigen Definisi 2.3

  Diberikan matriks berukuran dan sebuah vektor tak nol berukuran . Nilai eigen dari adalah bilangan real sedemikian sehingga .

  Vektor yang memenuhi persamaan ini disebut vektor eigen yang bersesuaian dengan .

  (Myers and Milton , 1991) Nilai-nilai eigen dari matriks diperoleh dengan menyelesaikan persamaan .

  2.1.3 Matriks Definit Positif Definisi 2.4

  adalah vektor Misalkan matrik berukuran dan berdimensi dari variabel real, maka disebut bentuk kuadratik dalam dan disebut matrik dari bentuk kuadratik.

  (Myers and Milton , 1991)

  Definisi 2.5

  Bentuk kuadratik dikatakan definit positif jika untuk semua . Matrik disebut definit positif jika bentuk kuadratik yang bersesuaian dengan matrik adalah definit positif.

  (Myers and Milton , 1991)

  Teorema 2.1

  Matriks simetri adalah definit positif jika dan hanya jika semua nilai eigen dari matriks bernilai positif.

  (Rencher, 2000)

  Bukti :

  Dengan menggunakan definisi 2.3 untuk setiap nilai eigen dari yang . Dengan bersesuaian dengan vektor eigen memenuhi persamaan diperoleh : mengalikan ruas kiri dan ruas kanan dengan atau

  Menurut definisi 2.5 , karena definit positif maka bentuk kuadratik definit positif, sehingga Untuk setiap maka Akibatnya nilai eigen dari yang bersesuaian dengan vektor eigen Misalkan . maka diperoleh maka diperoleh persamaan Untuk setiap

  Oleh karena dan maka . Menurut definit positif . Akibatnya menurut definisi 2.5 maka bentuk kuadratik definisi 2.5 matriks definit positif.

2.1.4 Matriks Kalkulus Definisi 2.6

  Misalkan adalah vektor, adalah skalar, dan fungsi dari vektor . Maka turunan dari adalah : dan turunan terhadap adalah : Turunan kedua dari terhadap adalah : Misalkan terdapat vektor dan matriks simetris , maka :

  (Lewis and Syrmos, 1995)

  2.2 Bandwidth Bandwidth atau parameter penghalus yang biasanya dinotasikan dengan ,

  merupakan pengontrol keseimbangan antara kemulusan fungsi dan kesesuaian fungsi terhadap data. Jika besar maka estimasi fungsi yang diperoleh akan semakin mulus, sedangkan jika kecil maka estimasi fungsi yang diperoleh akan semakin kasar atau fungsi-fungsi menjadi semakin fluktuatif. Oleh karena itu dalam memilih nilai optimal sangat penting agar estimator yang diperoleh juga optimal.

  (Eubank, 1988)

  2.3 Fungsi Kernel Univariat

  Sebuah fungsi dikatakan sebagai fungsi kernel jika memenuhi sifat : (i) untuk semua (ii)

  , simetri disekitar (iii) (iv) (v) Beberapa jenis fungsi kernel univariat adalah :

  a. Kernel Uniform :

  b. Kernel Segitiga :

c. Kernel Epairichnikov :

  d. Kernel Kuadrat :

e. Kernel Triweight :

  f. Kernel Cosinus :

  g. Kernel Gaussian :

  Secara umum fungsi kernel dengan parameter penghalus atau bandwidth

  (h) dinotasikan sebagai berikut :

  (2.1)

  (Hardle, 1990)

2.4 Fungsi Kernel Multivariat

  Misalkan menyatakan banyaknya pengamatan untuk setiap variabel random maka pengamatan ke-i dari setiap d variabel random dinyatakan dalam vektor

  : (2.2)

  Fungsi kernel untuk nilai bandwidth yang berbeda dapat dinotasikan sebagai berikut : (2.3) dengan , maka berakibat

  .

  Fungsi kernel multivariat dapat diperoleh dengan menggunakan persamaan (2.3), dengan variabel saling independen, maka :

  (2.4) Persamaan (2.4) di atas merupakan fungsi kernel multivariat.

  (Hardle et.al, 2004)

2.5 Pemilihan Bandwidth Optimal Suatu kriteria untuk bandwidth akan dibatasi pada kelas estimator linier.

  Ini berarti untuk setiap ada matriks berukuran sehingga: (2.5)

  Salah satu metode untuk mendapatkan optimal adalah dengan menggunakan metode Generalized Cross Validation (GCV) yang dirumuskan sebagai berikut : (2.6) . dengan Nilai optimal diperoleh dari h yang meminimumkan nilai GCV.

  (Eubank, 1988)

  2.6 Deret Taylor Multivariat

  Misalkan adalah ruang vektor berdimensi . Jika dan , dan fungsi mendekati titik , maka : (2.7)

   (Casper, 1965)

  2.7 Model Regresi Nonparametrik Multivariat

  Model regresi nonparametrik multivariat dinotasikan sebagai berikut : (2.8) dengan adalah variabel respon, adalah fungsi regresi nonparametrik multivariat kontinu yang tidak diketahui bentuknya dengan dan eror random .

  (Zhang and Chan, 2010)

  2.8 Estimator Polinomial Lokal Orde Dua

  Suatu fungsi dikatakan memiliki lokal pada suatu titik dalam jika fungsi tersebut memiliki minimum lokal, yaitu jika terdapat persekitaran dari sedemikian hingga untuk semua persekitaran dari , dan juga sedemikian hingga maksimum lokal, yaitu jika terdapat persekitaran dari untuk semua persekitaran dari . Dalam model regresi nonparametrik multivariat (2.8), fungsi akan diestimasi dengan estimator polinomial lokal orde dua. Fungsi dapat dihampiri dengan deret Taylor multivariat orde dua di sekitar sebagai berikut:

  (2.9) Substitusikan (2.9) ke (2.8) maka diperoleh model regresi nonparametrik multivariat pada pengamatan ke sebagai berikut : Persamaan (2.10) dapat dinyatakan dalam notasi matriks sebagai berikut : Estimator polinomial lokal orde dua adalah nilai yang meminimumkan fungsi :

  (2.10) dengan adalah fungsi kernel multivariat.

  (Hardle et.al, 2004)

2.9 Distribusi Normal

  jika Variabel random berdistribusi normal dengan mean dan varians

  probability density function (pdf) nya berbentuk :

  , untuk (2.13) dan ditulis . Misalkan variabel random atau , maka diperoleh fungsi Jacobian . Akibatnya variabel random mempunyai pdf sebagai berikut : Ini menunjukkan bahwa variabel random berdistribusi normal baku dan ditulis .

  (Hogg, et. al., 2004) Teorema 2.2

Moment Generating Function (mgf) dari variabel random adalah

Bukti :

  ■

  Teorema 2.3

  , maka Jika variabel random berdistribusi normal dengan mean dan varians mgf dari adalah

  Bukti :

  Misalkan , maka sehingga mgf dari adalah (dari teorema 2.2)

  Teorema 2.4

  Jika variabel random independen ; maka variabel random

  Bukti :

  adalah Menurut teorema 2.3 diperoleh mgf dari adalah : Sehingga mgf dari Akibatnya variabel random

  Teorema 2.5 (Teorema Limit Pusat)

  Jika sampel random dari distribusi normal dengan mean dan , maka variabel random varian akan berdistribusi normal baku dengan mean dan varian .

  Bukti :

  Diasumsikan mgf ada untuk , sehingga fungsi juga ada untuk . Fungsi merupakan mgf dari , hal itu menunjukkan bahwa

  . Dengan menggunakan rumus dan Taylor untuk di sekitar terdapat sebuah bilangan antara dan sedemikian sehingga adalah Selanjutnya dihitung mgf dari

  , Substitusikan dengan , sehingga diperoleh : dengan nilai antara dan dan . Akibatnya diperoleh Karena kontinu pada dan untuk , maka sehingga untuk semua bernilai real. Menurut (2.14) membuktikan bahwa variabel random mempunyai limit distribusi normal baku. ■

  (Hogg, et. al., 2004)

2.10 Software S-PLUS 2000

  S-PLUS adalah suatu paket program yang memungkinkan membuat program sendiri walaupun di dalamnya sudah tersedia banyak program internal yang siap digunakan. Kelebihan dari paket program ini adalah baik program internal maupun program yang pernah dibuat dapat digunakan sebagai sub program dari program yang akan dibuat. Beberapa perintah internal yang digunakan dalam S-PLUS adalah sebagai berikut : a. function( ) merupakan perintah untuk menunjukkan fungsi yang akan digunakan dalam program. Bentuknya : function(...)

  b. length( ) merupakan perintah untuk menunjukkan banyaknya data.

  Bentuknya : length(...)

  c. rep(a,b) merupakan perintah untuk membentuk sebuah vektor yang anggotanya a sebanyak b. Bentuknya : rep (...,...)

  d. matrix(a,b,c) merupakan perintah untuk membentuk sebuah matriks yang anggotanya a dengan jumlah baris sebanyak b dan jumlah kolom sebanyak c. Bentuknya : matrix(...,...,...)

  e. cat( ) merupakan perintah untuk menuliskan argumentasi dalam bentuk karakter dan kemudian mencetak hasil atau file yang telah ditetapkan. Bentuknya : cat(“....”)

  f. for( ) merupakan perintah untuk mengulang satu blok pernyataan berulang kali sesuai dengan kondisi yang telah ditentukan. Bentuknya : for(kondisi){pernyataan}

  g. sum( ) merupakan perintah untuk menjumlahkan semua bilangan anggota dari suatu vektor. Bentuknya : sum( ... )

  h. if-else merupakan perintah untuk menjalankan pernyataan pertama jika kondisi benar dan pernyataan kedua akan dieksekusi jika kondisi bernilai salah. Bentuknya : if(kondisi)

  { pernyataan pertama }

  else pernyataan kedua i. while merupakan perintah untuk mengulang satu blok pernyataan terus menerus selama kondisi ungkapan logika pada while berlaku benar. Bentuknya : while(logika) { pernyataan

  } j. rbind perintah untuk menggabungkan beberapa vektor baris ke dalam satu bentuk matriks. Bentuknya adalah: rbind(….) k. cbind perintah untuk menggabungkan beberapa vektor kolom ke dalam satu bentuk matriks. Bentuknya adalah : cbind(…..) l. repeat merupakan perintah untuk mengulangi eksekusi pernyataan secara terus menerus, sehingga diperlukan pernyataan lain untuk menghentikan perulangan eksekusi.

  Bentuknya : repeat { pernyataan pertama if(pernyataan kedua) break }

  (Everiit, 1994)

  2.11 Software Minitab

  Minitab merupakan salah satu software dalam ilmu statistik yang banyak digunakan. Minitab pertama kali ditemukan pada tahun 1972, yang pada saat itu masih bernama sistem “Omnitab”. Minitab adalah software yang mudah dipelajari dan memuat banyak aplikasi dalam statistik. Selain itu, software ini juga dapat digunakan pada berbagai macam tipe komputer, seperti komputer mikro, komputer mini, dan sebagainya.

  Beberapa command pada Minitab antara lain NAME, TINTERVAL, TTEST, TWOT, ONEWAY, STOP, dan NOTE.

  (Berenson et.al, 1988)

  2.12 Pertumbuhan Balita

  Di masyarakat, cara pengukuran status gizi yang paling sering digunakan adalah antropometri gizi. Dewasa ini dalam program gizi masyarakat, penentuan status gizi balita pun menggunakan metode antropometri sebagai cara untuk menilai status gizi. Pengukuran antropometri ada dua tipe yaitu pertumbuhan dan ukuran komposisi tubuh. Penilaian pertumbuhan merupakan komponen esensial dalam surveilan kesehatan anak karena hampir setiap masalah yang berkaitan dengan fisiologi, interpersonal, dan domain sosial dapat memberikan efek yang buruk pada pertumbuhan anak.

  Antropometri sebagai indikator status gizi dapat dilakukan dengan mengukur beberapa parameter. Parameter adalah ukuran tunggal dari tubuh manusia, antara lain umur, berat badan, tinggi badan, lingkar kepala, lingkar lengan, lingkar dada, dan tebal lemak bawah kulit.

  Ukuran komposisi tubuh balita yang paling sering diukur di posyandu adalah berat badan. Ada beberapa faktor yang mempengaruhi berat badan balita, antara lain umur, tinggi badan, dan lingkar kepala. Pertumbuhan balita dikatakan baik jika berat badannya seimbang dengan umur, tinggi badan, dan lingkar kepalanya.

  (Hidayah, 2007)

BAB III METODE PENELITIAN Metode penelitian yang terkait dengan tujuan penulisan ini adalah sebagai

  berikut :

  1. Mengestimasi model regresi nonparametrik multivariat berdasarkan estimator polinomial lokal orde dua melalui langkah-langkah berikut :

  Langkah 1.

  Mengasumsikan sebagai fungsi respon sebanyak pengamatan dan sebagai variabel prediktor dengan sebanyak , memenuhi model regresi nonparametrik multivariat adalah fungsi regresi

  , dengan multivariat yang tidak diketahui bentuknya.

  Langkah 2.

  Melakukan hampiran terhadap fungsi menggunakan pendekatan polinomial lokal orde dua di sekitar , yaitu sebagai berikut : dengan

  23

  Langkah 3.

  Menyatakan elemen-elemen dari vektor sebagai berikut : dengan,

  Langkah 4.

  Meminimumkan fungsi terhadap vektor parameter : dengan

  Langkah 5.

  Mendapatkan estimator bagi vektor parameter .

  Langkah 6.

  Mendapatkan estimasi model regresi nonparametrik multivariat, yaitu Langkah 7.

  Mengestimasi vektor dari eror random , yaitu :

  24

  Langkah 8.

  , yaitu : Memperoleh estimasi bagi Kemudian menghitung nilai , sehingga estimasi bagi adalah

  Langkah 9.

  Menentukan distribusi dari variabel random sesuai dengan yang tertera pada persamaan (2.20) :

  Langkah 10.

  . Menentukan nilai Langkah 11.

  Mendapatkan selang kepercayaan bagi model regresi nonparametrik multivariat pada pengamatan ke- , yaitu :

  2. Menerapkan model regresi nonparametrik multivariat berdasarkan estimator polinomial lokal orde dua terhadap data berat badan balita pada Rumah Sakit Haji Surabaya pada tahun 2006 dengan langkah-langkah berikut :

  25

  Langkah 1.

  Menginputkan data berat badan balita pada Rumah Sakit Haji Surabaya pada tahun 2006 yang memenuhi asumsi model regresi nonparametrik multivariat dengan berat badan balita sebagai variabel respon, tinggi badan balita sebagai variabel prediktor pertama dan lingkar kepala balita sebagai variabel prediktor kedua.

  Langkah 2.

  Membuat scatterplot antara variabel respon dengan setiap variabel prediktor.

  Langkah 3.

  Membuat program dalam software S-PLUS 2000.

  Langkah 4.

  Mengestimasi model regresi nonparametrik multivariat pada data berat badan balita pada Rumah Sakit Haji Surabaya pada tahun 2006.

BAB IV HASIL DAN PEMBAHASAN

4.1 Estimasi Titik pada Model Regresi Nonparametrik Multivariat

  dengan Diasumsikan data pengamatan berpasangan adalah variabel respon ke i dan adalah variabel prediktor multivariat ke-i memenuhi model regresi nonparametrik multivariat :

  (4.1) adalah fungsi regresi nonparametrik multivariat yang tidak dengan identik independen normal dengan diketahui bentuknya dan diasumsikan eror . mean 0 dan varians

  Model regresi (4.1) dapat ditulis dalam notasi matriks sebagai berikut : (4.2) dengan

  , dan vektor eror random .

  Vektor pada persamaan (4.2) tidak diketahui bentuknya akan diestimasi dengan estimator polinomial lokal orde dua sebagai berikut : (4.3) dengan

  27 Elemen-elemen dari vektor pada (4.3) dapat dijelaskan sebagai berikut :

  28 Sedangkan elemen-elemen dari vektor pada persamaan (4.3) dapat dijelaskan sebagai berikut :

  29 Sehingga dari (4.3) diperoleh bentuk :

  (4.4) Dari persamaan (4.4) diperoleh elemen ke- dari vektor adalah :

  (4.5) dengan Jika persamaan (4.5) disubstitusikan ke dalam persamaan (4.1) maka diperoleh :

  30 (4.6)

  Persamaan (4.6) dapat dinyatakan dalam bentuk sistem persamaan sebagai berikut : (4.7)

  Sistem persamaan (4.7) dapat dinyatakan dalam notasi matriks sebagai berikut : (4.8) dengan

  31 , adalah vektor berukuran , adalah matriks berukuran , dengan

  , adalah vektor berukuran , dan vektor berukuran .

  Estimasi model regresi nonparametrik multivariat pada persamaan (4.8) dengan menggunakan estimator polinomial lokal orde dua dengan pembobot fungsi kernel diperoleh dengan meminimumkan fungsi :

  (4.9) dengan merupakan fungsi kernel multivariat berdimensi-d dengan

  bandwidth yang dinyatakan sebagai berikut :

  (4.10)

  32 Jika dinyatakan dalam notasi matriks, persamaan (4.9) akan menjadi sebagai berikut :

  (4.11) dengan Persamaan (4.11) jika dijabarkan sebagai berikut :

  (4.12) Langkah untuk mendapatkan fungsi pada (4.12) mencapai minimum adalah

  . Berdasarkan Teorema 2.2, maka diperoleh : Karena

  , maka : Dari persamaan (4.13) diperoleh :

  33 Untuk menjamin bahwa fungsi pada persamaan (4.11) mencapai minimum, definit positif. Dari sini, maka diperoleh : maka matriks Matriks merupakan matriks blok diagonal, dimana diagonal-diagonalnya

  . Untuk membuktikan apakah bernilai sama, yaitu matriks merupakan matriks definit positif, maka cukup ditunjukkan bahwa merupakan definit positif.

  Misalkan adalah sebarang vektor tak nol berukuran . Selanjutnya akan . Perhatikan bahwa ditunjukkan bahwa

  (sifat asosiatif) dengan adalah vektor tak nol berukuran . merupakan matriks diagonal yang elemen-elemennya adalah

  , dengan . Berdasarkan sifat fungsi kernel, telah diketahui

  34 bahwa nilai positif, dari sini diperoleh bahwa matriks adalah adalah bentuk kuadratik, dan , definit positif. Karena definit maka diperoleh . Maka, matriks positif.

  Setelah memperoleh pada persamaan (4.14), maka substitusikan ke dalam persamaan (4.8). Maka diperoleh estimasi model regresi nonparametrik multivariat berdasarkan estimator polinomial lokal orde dua adalah :

  (4.15) dengan Sehingga, estimator polinomial lokal orde dua untuk pengamatan ke-i adalah :

  (4.16) dengan adalah baris ke- dari matriks .

4.2 Selang Kepercayaan Estimator Model Regresi Nonparametrik Multivariat

  pada persamaan (4.16) merupakan estimasi model regresi Fungsi nonparametrik multivariat pada pengamatan ke- berdasarkan estimator polinomial lokal orde dua. Selanjutnya akan ditentukan selang kepercayaan bagi estimator model regresi nonparametrik multivariat pada pengamatan ke- yang

  . dilambangkan dengan

  35 akan diestimasi dengan terlebih dahulu vektor dari eror

  Fungsi random pada persamaan (4.8) diestimasi oleh : (4.17) adalah :

  Diperoleh estimasi bagi (4.18)

  Selanjutnya akan dihitung nilai varians dari , berdasarkan teorema 2.3 diperoleh : (4.19)

  Estimasi bagi pada persamaan (4.19) adalah : (4.20) ). Dari persamaan (4.2) diketahui bahwa vektor random

  Maka, , sehingga kombinasi linier dari persamaan (4.16) diperoleh Akibatnya variabel

  • – random . Selang kepercayaan ) 100% bagi adalah sebagai berikut :

  (4.21)

  36 Untuk mengestimasi model regresi nonparametrik multivariat berdasarkan estimator polinomial lokal orde dua pada persamaan (4.16) dan menentukan selang kepercayaan pada persamaan (4.21), maka algoritma yang digunakan adalah sebagai berikut :

  Langkah 1.

  Menginputkan variabel respon Y dan variabel prediktor X dari persamaan (4.8).

  Langkah 2.

  Menentukan fungsi Kernel yang akan digunakan yaitu fungsi Kernel Gaussian.

  Langkah 3.

  Menentukan nilai bandwidth (h) awal yang berbeda untuk masing-masing variabel prediktor.

  Langkah 4.

  Menghitung nilai yaitu Langkah 5. pada persamaan (4.16). Menghitung Langkah 6.

  Menghitung Langkah 7.

  Menghitung GCV pada persamaan (2.6).

  Langkah 8.

  Mendapatkan nilai bandwidth (h) optimal untuk masing-masing variabel prediktor yaitu .

  37

  Langkah 9.

  Mendapatkan estimasi model regresi nonparametrik multivariat berdasarkan . estimator polinomial lokal dengan menentukan nilai Langkah 10.

  Mendapatkan estimasi pada persamaan (4.17).

  Langkah 11.

  pada persamaan (4.18). Menghitung estimasi bagi Langkah 12.

  Menghitung pada persamaan (4.19).

  Langkah 13.

  Mendapatkan estimasi bagi yaitu pada persamaan (4.20).

  Langkah 14.

  Menghitung nilai statistik uji Langkah 15.

  Mendapatkan selang kepercayaan ) 100% bagi pada persamaan (4.21).

  38

4.3 Penerapan pada Data

  4.3.1 Data

  Data yang digunakan untuk penerapan model regresi nonparametrik multivariat berdasarkan estimator polinomial lokal orde dua ini adalah data sekunder yang diambil dari RSU Haji Surabaya pada tahun 2006 sebanyak 30 pengamatan, yang diambil dari Hidayah (2007) (lihat lampiran 1). Data tersebut merupakan data tentang berat badan balita berdasarkan tinggi badan balita dan lingkar kepala balita. Variabel respon pada data adalah berat badan balita (dalam satuan kilogram), sedangkan sebagai variabel prediktor pertama adalah tinggi badan balita (dalam satuan meter), dan variabel prediktor kedua adalah lingkar kepala balita (dalam satuan meter).

  Untuk mendapatkan estimator model regresi nonparametrik multivariat yang menunjukkan seberapa besar pengaruh tinggi badan balita dan lingkar kepala balita terhadap berat badan balita, langkah yang dilakukan adalah menentukan model hubungan antara variabel respon dengan variabel prediktor secara serentak dengan menggunakan pendekatan estimator polinomial lokal orde dua.

  4.3.2 Analisis Data

  Gambaran awal tentang data dapat dilakukan dengan membuat scatterplot antara berat badan balita dengan tinggi badan balita dan berat badan balita dengan lingkar kepala balita, dengan menggunakan software Minitab, sebagai berikut:

  39

Gambar 4.1 Plot data awal tinggi badan balita terhadap berat badan balitaGambar 4.2 Plot data awal lingkar kepala balita terhadap berat badan balita

  Nilai bandwidth (h) optimal untuk tiap prediktor pada masing-masing pengamatan ditentukan oleh kriteria GCV dengan menggunakan program pada

  software S-Plus 2000 (lihat Lampiran 2). Nilai bandwidth (h) optimal pada untuk

  variabel prediktor tinggi badan balita sebesar dan untuk variabel prediktor

  40 lingkar kepala balita sebesar , diperoleh nilai minimum GCV sebesar (lihat Lampiran 3a).

  Nilai bandwidth (h) optimal akan digunakan untuk mencari nilai pada tiap pengamatan. Dengan menggunakan program pada software S-Plus 2000 (pada Lampiran 2), diperoleh nilai estimasi model regresi nonparametrik multivariat pada setiap pengamatan (lihat Lampiran 3b) dengan Mean Square

  Error (MSE) sebesar .

  Selanjutnya, dilakukan uji normalitas pada eror dengan menggunakan uji

  One sample Kolmogorov-Smirnov pada software S-PLUS 2000. Berdasarkan uji

  tersebut, diperoleh nilai p-value sebesar 0.5 (lihat lampiran 3c). Dengan nilai sebesar 5%, maka dapat disimpulkan bahwa eror berdistribusi normal dengan mean sebesar dan varian sebesar .

  Plot selang kepercayaan 95% bagi rata-rata berat badan balita akan digambarkan melalui software Minitab 14 sebagai berikut :

Gambar 4.3 Plot selang kepercayaan bagi rata-rata berat badan balita

  41 Berdasarkan Lampiran 3b, diperoleh hasil estimasi selang kepercayaan 95% bagi rata-rata berat badan balita pada pengamatan ke-1 adalah

  , pada pengamatan ke-2 sebesar , sampai pada pengamatan ke-30 yaitu sebesar .

BAB V KESIMPULAN DAN SARAN

5.1 Kesimpulan

  Dari pembahasan pada bab sebelumnya, maka dapat diambil beberapa kesimpulan sebagai berikut :