METODE BOOTSTRAP DAN APLIKASINYA

METODE BOOTSTRAP DAN APLIKASINYA

  Skripsi Diajukan untuk Memenuhi Salah Satu Syarat

  Memperoleh Gelar Sarjana Program Studi Matematika Oleh:

  Amelia Enrika NIM: 083114001

PROGRAM STUDI MATEMATIKA, JURUSAN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2011

METODE BOOTSTRAP DAN APLIKASINYA

  Skripsi Diajukan untuk Memenuhi Salah Satu Syarat

  Memperoleh Gelar Sarjana Program Studi Matematika Oleh:

  Amelia Enrika NIM: 083114001

PROGRAM STUDI MATEMATIKA, JURUSAN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2011

BOOTSTRAP METHOD AND ITS APPLICATIONS

  Thesis Presented as Partial Fulfillment of the Requirements to Obtain the Sarjana Sains Degree in Mathematics

  By: Amelia Enrika

  Student Number: 083114001

MATHEMATICS STUDY PROGRAM, DEPARTMENT OF MATHEMATICS FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY YOGYAKARTA 2011

  Skripsi ini dipersembahkan untuk, A llah B apa, P utra dan R oh K udus,

  To reach a port, we must sail Sail, not tie at anchor Sail, not drift.

  • Franklin Roosevelt-

  K edua orang tua tercinta, B eng L ay dan N anie, Saudari terkasih, Seniyawati dan N ovia P aulien,

  A ga H utama T irta dan T ante L ina tersayang,

  

ABSTRAK

  Tulisan ini membahas tentang metode bootstrap yang prinsipnya adalah memperlakukan sampel acak asli sebagai populasi, kemudian melakukan resampel sebanyak kali sebanyak mungkin, sehingga diharapkan distribusi dari sampel bootstrap tersebut mendekati normal. Dengan demikian, distribusi sampling bootstrap tersebut dapat digunakan untuk memberikan penjelasan tentang distribusi sampling, serta distribusi populasi.

  Aplikasi metode bootstrap dalam statistika yang dibahas adalah pada pendugaan parameter populasi rata-rata, galat standar dan koefisien regresi linear berganda, serta pendugaan selang kepercayaan untuk rata-rata populasi dan koefisien regresi linear berganda. Pada pendugaan parameter rata-rata populasi dan galat standar digunakan metode bootstrap biasa, sedangkan untuk pendugaan selang kepercayaannya digunakan metode persentil bootstrap. Persentil bootstrap membentuk selang kepercayaan (

  1 − )% dengan cara mengambil data persentil ke (

  2 ⁄ )100 dan (1 − ( 2 ⁄ ))100 sebagai batas bawah dan atas selang, dari buah replikasi bootstrap. Pada regresi linear berganda, metode bootstrap dibedakan menjadi dua, yaitu resampling pasangan terurut observasi dan resampling galat dari model regresi linear berganda. Selang kepercayaan koefisien regresi dipadukan antara kedua metode tersebut dengan metode persentil bootstrap.

  Pendugaan parameter populasi dengan bootstrap dianggap cukup mendekati parameter penduga asli dan distribusinya mendekati normal seiring membesarnya nilai dan selang kepercayaan yang dibentuk dengan persentil bootstrap selalu menghasilkan selang yang lebih sempit dibandingkan dengan selang kepercayaan secara teoritis dengan tingkat signifikansi yang sama.

  Kata kunci: metode bootstrap, resampling, rata-rata bootstrap, galat standar

  

bootstrap, persentil bootstrap, regresi bootstrap, parameter populasi, koefisien

regresi, resampling observasi, resampling galat

  

ABSTRACT

  This thesis discusses bootstrap method which treats original random sample as a population. The original random sample was resampled times as many as we can, so that the bootstrap sampling distribution approximates the normal distribution. Thus, the bootstrap distribution could be used to explain the sampling distribution and the population distribution.

  Bootstrap method is applied in estimation of population mean, standard error, and multiple linear regression coefficients. In the estimation of mean and standard error of population, we use ordinary bootstrap method, while percentile bootstrap is used to estimate the confidence interval. Percentile bootstrap

  1 constructs a ( ⁄ )100 and

  − )100% confidence interval by taking the ( 2 (1

  − ( 2 ⁄ ))100 percentile data of bootstrap replications as a lower limit and upper limit respectively. In multiple linear regression, there are two bootstrap methods, those are pair observation resampling and error/residual resampling. Confidence interval of regression coefficient is built by combining those two methods and percentile bootstrap.

  The use of bootstrap method to estimate the population parameter is considered close to ordinary estimator and its distribution is approximate normal distribution as the increasing the value of

  . At the same level of significance, the percentile bootstrap confidence interval always narrower than theoretical confidence interval. Key word: bootstrap method, resampling, bootstrap mean, bootstrap standard

  

error, percentile bootstrap, bootstrap regression, parameter of population,

regression coefficient, paired observation resampling, error/residual resampling

KATA PENGANTAR

  Puji dan syukur penulis haturkan kepada Tuhan Yesus Kristus atas berkat dan rahmat-Nya sehingga penulis dapat menyelesaikan skripsi ini. Penulis dapat menyusun skripsi ini bukan hanya atas kemampuan dan usaha penulis semata, tetapi juga berkat bantuan dan dukungan berbagai pihak, oleh karena itu penulis ingin mengucapkan terima kasih kepada:

  1. Bapak Ir. Ig. Aris Dwiatmoko, M.Sc. selaku dosen pembimbing yang telah dengan sabar memberikan pengarahan dan bimbingan selama proses penyusunan skripsi ini.

  2. Ibu Lusia Krismiyati Budiasih, S.Si., M.Si. selaku Ketua Program Studi Matematika yang telah memberikan banyak nasehat dan bimbingan selama penyusunan skripsi, serta Ibu Ch. Enny Murwaningtyas, S.Si., M.Si. yang telah memberikan banyak bimbingan dalam hal akademik dan perkuliahan.

  3. Seluruh bapak dan ibu dosen yang telah memberikan banyak ilmu pengetahuan kepada penulis.

  4. Perpustakaan Universitas Sanata Dharma dan staf sekretariat yang telah memberikan fasilitas dan kemudahan pembelajaran, serta administrasi bagi penulis selama masa perkuliahan.

  5. Keluarga tersayang, yaitu kedua orang tua, beserta kedua saudari penulis: Seniyawati dan Novia Paulien yang banyak direpotkan, tetapi terus memberikan semangat, dukungan, dan doa kepada penulis.

  6. Aga Hutama Tirta yang tidak kunjung bosan dan lelah mendukung, menyemangati, menasehati dan mendengarkan keluh kesah penulis selama proses penyusunan skripsi ini.

  7. Teman-teman penulis: Shelli Moniaga dan Agustina Viktrisia Lily Hertati yang selalu membantu, serta menyertai penulis dengan doa dan semangat.

  Tak lupa terima kasih kepada Irene Saskia atas jempolnya yang setia menemani saya selama 3 bulan terakhir.

  8. Teman-teman angkatan 2008 dan 2007 dari Program Studi Matematika yang telah memberikan banyak pengalaman berharga, baik suka maupun duka, dalam pembelajaran maupun kehidupan sehari-hari.

  9. Semua pihak yang telah membantu penulis, tetapi tidak dapat disebutkan satu persatu.

  Hal yang juga disadari oleh penulis adalah masih banyaknya kekurangan yang terdapat dalam tulisan ini, namun diharapkan agar hasil tulisan ini tetap dapat memberikan manfaat bagi kemajuan ilmu pengetahuan, khususnya dalam bidang matematika serta bagi pembaca tulisan ini. Kritik dan saran yang membangun sangat penulis harapkan bagi kesempurnaan skripsi ini.

  Yogyakarta, Desember 2011 Penulis

DAFTAR ISI

  Halaman HALAMAN JUDUL ………………………………………………………… i HALAMAN JUDUL DALAM BAHASA INGGRIS ……………………… ii HALAMAN PERSETUJUAN PEMBIMBING …………………………….. iii HALAMAN PENGESAHAN ………………………………………………... iv HALAMAN PERSEMBAHAN ……………………………………………… v HALAMAN PERNYATAAN KEASLIAN KARYA ……………………….. vi HALAMAN ABSTRAK …………………………………………………….. vii HALAMAN ABSTRACT ……………………………………………………. viii LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA

  ILMIAH UNTUK KEPENTINGAN AKADEMIS ………………………….. ix KATA PENGANTAR ………………………………………………………... x DAFTAR ISI …………………………………………………………………. xii DAFTAR GAMBAR ………………………………………………………… xv DAFTAR TABEL ……………………………………………………………. xvi DAFTAR PROGRAM ……………………………………………………….. xix

  BAB I PENDAHULUAN A. Latar Belakang Masalah ………………………………………………. 1 B. Perumusan Masalah …………………………………………………... 7 C. Pembatasan Masalah …………………………………………………. 7 D. Tujuan Penulisan ……………………………………………………... 8 E. Manfaat Penulisan ……………………………………………………. 8

  F. Metode Penulisan …………………………………………………….. 8

  G. Sistematika Penulisan ………………………………………………… 9

  BAB II LANDASAN TEORI A. Teori Sampling

  1. Sampling ………………………………………………………… 11

  2. Bilangan Random ……………………………………………….. 14

  3. Pembangkit Bilangan Random ………………………………….. 15

  4. Distribusi Sampling ……………………………………………… 16

  B. Estimasi

  1. Estimasi Titik ……………………………………………………. 26

  2. Estimasi Interval …………………………………………………. 26

  C. Regresi Linear Berganda

  1. Model Regresi Linear Berganda ………………………………… 28

  2. Metode Kuadrat Terkecil ……………………………………….. 30

  3. Sifat-Sifat Penduga Kuadrat Terkecil …………………………… 32

  4. Selang Kepercayaan Untuk Parameter Regresi …………………. 34

  BAB III METODE BOOTSTRAP A. Prinsip Dasar Dan Algoritma Metode Bootstrap ……………………. 35 B. Aplikasi Pendekatan Galat Standar Dari Mean Dengan Metode Bootstrap ……………………………………………………. 46 BAB IV APLIKASI METODE BOOTSTRAP A. Metode Persentil Bootstrap

  1. Dasar Pembentukan Selang Parameter Populasi Dengan

  Metode Persentil Bootstrap ……………………………………… 54

  2. Pembentukan Selang Kepercayaan Dengan Metode Persentil Bootstrap ………………………………………………. 57

  B. Regresi Linear Bootstrap

  1. Metode Bootstrap Untuk Pendugaan Parameter Dalam Regresi Linear Berganda ………………………………………… 64

  a. Algoritma Metode Bootstrap Untuk Meresampling Observasi …………………………………….. 65

  b. Algoritma Metode Bootstrap Untuk Meresampling Galat …………………………………………. 72

  2. Pembentukan Selang Kepercayaan Bootstrap Untuk Parameter Regresi ………………………………………… 79

  BAB V PENUTUP A. Kesimpulan …………………………………………………………… 87 B. Saran ………………………………………………………………….. 88 DAFTAR PUSTAKA ……………………………………………………….. 89 LAMPIRAN …………………………………………………………………. 91

  

DAFTAR GAMBAR

  Halaman

GAMBAR 1.1. ................................................................................................... 4GAMBAR 2.1. ................................................................................................... 25GAMBAR 2.2. ................................................................................................... 25GAMBAR 3.1. ................................................................................................... 35GAMBAR 3.2. ................................................................................................... 41GAMBAR 3.3. ................................................................................................... 42GAMBAR 3.4. ................................................................................................... 42GAMBAR 3.5. ................................................................................................... 44GAMBAR 3.6. ................................................................................................... 45GAMBAR 3.7. ................................................................................................... 115GAMBAR 3.8. ................................................................................................... 52GAMBAR 4.1. ................................................................................................... 116GAMBAR 4.2. ................................................................................................... 66GAMBAR 4.3. ................................................................................................... 66GAMBAR 4.4. ................................................................................................... 117GAMBAR 4.5. ................................................................................................... 118GAMBAR 4.6. ................................................................................................... 75GAMBAR 4.7. ................................................................................................... 119

  

DAFTAR TABEL

  Halaman

TABEL 3.1. …………………………………………………………………… 91TABEL 3.2. …………………………………………………………………... 91TABEL 3.3. …………………………………………………………………… 91TABEL 3.4. …………………………………………………………………… 92TABEL 3.5. …………………………………………………………………… 92TABEL 3.6. …………………………………………………………………… 93TABEL 4.1. …………………………………………………………………… 94TABEL 4.2. …………………………………………………………………… 94TABEL 4.3. …………………………………………………………………… 95TABEL 4.4. …………………………………………………………………… 95TABEL 4.5. …………………………………………………………………… 96TABEL 4.6. …………………………………………………………………… 97TABEL 4.7. …………………………………………………………………… 98TABEL 4.8. …………………………………………………………………… 99TABEL 4.9. …………………………………………………………………… 100TABEL 4.10. …………………………………………………………………. 101TABEL 4.11. ………………………………………………………………….. 102TABEL 4.12. …………………………………………………………………. 102TABEL 4.14. …………………………………………………………………. 103TABEL 4.15. …………………………………………………………………. 103TABEL 4.16. …………………………………………………………………. 103TABEL 4.17. …………………………………………………………………. 104TABEL 4.18. …………………………………………………………………. 104TABEL 4.19. …………………………………………………………………. 104TABEL 4.20. …………………………………………………………………. 105TABEL 4.21. …………………………………………………………………. 105TABEL 4.22. …………………………………………………………………. 106TABEL 4.23. …………………………………………………………………. 106TABEL 4.24. …………………………………………………………………. 106TABEL 4.25. …………………………………………………………………. 107TABEL 4.26. …………………………………………………………………. 107TABEL 4.27. …………………………………………………………………. 107TABEL 4.28. …………………………………………………………………. 108TABEL 4.29. …………………………………………………………………. 108TABEL 4.30. …………………………………………………………………. 108TABEL 4.31. …………………………………………………………………. 109TABEL 4.32. …………………………………………………………………. 109TABEL 4.33. …………………………………………………………………. 109TABEL 4.35. …………………………………………………………………. 110TABEL 4.36. …………………………………………………………………. 111TABEL 4.37. …………………………………………………………………. 113

DAFTAR PROGRAM

  Halaman PROGRAM 3.1. ……………………………………………………………… 121 PROGRAM 4.1. ……………………………………………………………… 123 PROGRAM 4.2. ……………………………………………………………… 124 PROGRAM 4.3. ……………………………………………………………… 127 PROGRAM 4.4. ……………………………………………………………… 130 PROGRAM 4.5. ……………………………………………………………… 132

BAB I PENDAHULUAN A. Latar Belakang Masalah Sampling, yang berarti pengambilan sampel sering digunakan oleh para

  statistikawan atau ilmuwan untuk mempermudah penelitian mereka, karena ketidakmungkinan peneliti untuk mengobservasi objek-objek populasi secara menyeluruh. Keterbatasan biaya, waktu, tenaga peneliti dan juga kesulitan pe- ngumpulan data populasi adalah alasan-alasan dilakukannya sampling. Ba- nyak metode sampling yang telah diciptakan oleh para peneliti, sebagai contoh Metode Sampel Acak Sederhana, Metode Stratifikasi, Metode Cluster, dan se- bagainya. Dari metode sampling ini, muncul pengembangannya, yaitu resam- pling. Selama beberapa dekade terakhir, telah dilakukan pengembangan me- tode resampling, Metode Jackknife, Metode Cross-validation dan Metode Bootstrap merupakan teknik resampling yang sering digunakan para peneliti dalam menganalisis data.

  Dalam kondisi praktis dan statistikal, bentuk distribusi sampling jarang diketahui secara pasti. Pendekatan parametrik tradisional lebih menekankan pendugaan distribusi sampling dibandingkan pembuatan inferensi terhadap pa- rameter populasi dari sebuah sampel. Cara yang digunakan adalah dengan mengasumsikan bentuk distribusi sampling dari parameter penduga yang dike- tahui sifat-sifat probabilitasnya (contohnya distribusi normal atau eksponen- sial). Dalam pendekatan parametrik tradisional, parameter dari distribusi perhitungan secara analitik menggunakan rumus yang rumit. Namun sering kali ditemukan kendala berkaitan dengan distribusi sampling. Biasanya ken- dala tersebut berupa kesulitan mendekati distribusi sampling secara analitik, baik karena perhitungan yang terlalu sulit atau rumus yang rumit. Selain itu, pendekatan secara analitik menggunakan asumsi-asumsi tertentu seperti ben- tuk distribusi, apakah data tersebut normal atau tidak, ataupun bergantung pa- da Teorema Limit Pusat. Pada kenyataannya secara praktis, terkadang para peneliti tidak bisa bergantung pada asumsi-asumsi tersebut. Kesulitan untuk mendekati distribusi sampling secara analitik tersebut menyebabkan data tidak bisa diolah secara analitik. Akibatnya, parameter populasi pun sulit untuk di- dekati secara analitik. Maka dari itu, banyak dilakukan riset untuk mengolah data secara langsung dengan komputer untuk menanggulangi masalah- masalah tersebut.

  Perkembangan teknologi komputer yang sangat signifikan dalam bebe- rapa dekade terakhir ini memberikan pengaruh yang besar dalam bidang statis- tika. Analisis data menjadi lebih mudah dilakukan dengan adanya otomatisasi penggambaran grafik dan perhitungan data. Studi statistikal yang melibatkan himpunan data yang besar dan kompleks sekarang ini mampu dianalisa de- ngan lebih mudah, sehingga juga berpengaruh pada efisiensi biaya penelitian.

  Penelitian dapat dilakukan lebih cepat dan lebih sedikit biaya dibandingkan dulu karena banyak muncul metode yang menerapkan komputasi yang sebe- lumnya tidak terpikirkan untuk pendugaan parameter populasi, pembentukan selang kepercayaan, dan uji signifikansi.

  Pada tahun 1979, Bradley Efron mengembangkan metode Bootstrap un- tuk pertama kalinya. Metode resampling yang berbasis komputer ini, bukan metode resampling yang pertama kali muncul. Menurut Kvam dan Vidakovic (2007), sebelum Metode Bootstrap, ada metode permutasi Fisher, Pitman, dan metode Jackknife, tetapi metode Bootstrap adalah metode resampling yang paling populer yang digunakan para peneliti pada saat ini. Metode ini sangat popular di kalangan para peneliti karena metode ini langsung mengolah data, menggunakan komputer sebagai pengolah datanya. Lagipula, para peneliti ti- dak membutuhkan hitungan teoritis untuk mencapai parameter populasi tu- juannya. Bootstrap baru-baru dikembangkan karena sangat bergantung pada kecanggihan teknologi komputer untuk melakukan perhitungannya. Dengan menyimulasikan langsung data-data yang ada, bootstrap menghindarkan kita dari pembuatan model dan asumsi-asumsi yang tak dibutuhkan tentang para- meter. Secara imajinatif, metode ini seolah-olah menarik diri sendiri dengan tali sepatu sendiri (dengan mengambil sampel dari sampel itu sendiri) diban- ding menggantungkan diri pada bantuan luar (dari asumsi-asumsi parametrik). Dari sisi tersebut, metode bootstrap terlihat seperti sebuah prosedur nonpara- metrik. Kenyataannya, bootstrap merupakan teknik resampling yang meli- batkan bentuk parametrik dan nonparametrik, tetapi pada esensinya, merupa- kan prosedur yang lebih bersifat empiris.

  Efron menganalogikan istilah bootstrap dengan cerita rakyat Inggris, ya- itu cerita Petualangan Baron von Munchausen. Dikisahkan sang Baron mele- paskan diri dari rawa dengan menarik dirinya sendiri dengan menggunakan ta- li sepatunya sendiri. Keadaan di mana sang Baron menggunakan tali sepa- tunya sendiri untuk menyelamatkan dirinya, inilah yang dianalogikan Efron dalam metode Bootstrap.

Gambar 1.1. Pada versi awal cerita, dikatakan bahwa Sang Baron menggunakan rambutnya sendiri untuk menyelamatkan dirinya sendiri.

  Tetapi lama-kelamaan ceritanya berubah menjadi Sang Baron menye- lamatkan dirinya dengan bootstrap. Peneliti menggunakan sampel dari sampel itu sendiri untuk mengetahui parameter populasi. Efron ingin mendeskripsikan metode ini dengan istilah bootstrap untuk membantu kita memahami karakteristik dari suatu estimator tanpa bantuan dari model probabilitas tambahan atau asumsi-asumsi parame- trik. Ketika memperkenalkan versi bootstrap, Efron termotivasi oleh dua ma- salah yang paling penting dalam statistika terapan, yaitu penentuan penduga untuk suatu parameter tujuan dan evaluasi dari keakuratan dari penduga terse- but melalui galat standar dari penduga dan penentuan selang kepercayaan un- tuk parameter tujuan tersebut. Sampel asli yang pertama kali diambil dipan- dang sebagai suatu populasi karena sampel asli sebanyak buah itu dianggap mewakili karakteristik-karakteristik dari populasi (karena pengambilannya di- lakukan secara acak). Karena perlakuan itu, metode bootstrap tidak memerlu- kan asumsi kuat terhadap distribusi sampling dari statistik penduga untuk mendekati distribusi samplingnya. Jadi begitu pula dengan resampel atau sampel bootstrap yang diambil dengan pengembalian juga dianggap merepre- sentasikan populasi sama halnya seperti bila kita mengambil banyak sampel dari populasi. Banyak dilakukan simulasi dari data-data sampel yang telah tersedia sangatlah menguntungkan peneliti atau statistikawan. Hal itu meng- hindarkan kita dari pembuatan asumsi-asumsi yang tidak dibutuhkan tentang parameter dan model. Bila dibandingkan dengan pendekatan parametrik tradi- sional, metode bootstrap memuat lebih banyak repetisi dari komputasi data sampel untuk mendekati bentuk distribusi sampling suatu statistik bila diban- ding asumsi distribusional yang kuat ataupun formula analitik. Kelebihan yang lain dari metode ini adalah dapat diterapkan seberapapun sulitnya ke- mungkinan pencapaian nilai penduga parameter populasi. Para peneliti ba- nyak menggunakan metode ini untuk diterapkan dalam berbagai bidang, con- tohnya di bidang psikologi, geologi, ekonometrika, biologi, teknik, kimia dan akunting. Bootstrap sering digunakan pada bidang-bidang tersebut karena se- ring kali para peneliti hanya memiliki data sampel yang sangat sedikit.

  Metode ini sering digunakan ketika distribusi sampling dari statistik ti- dak dapat diasumsikan berdistribusi normal (seperti mengestimasi koefisien regresi dengan Ordinary Least Square), atau ketika distribusi sampling tidak memiliki solusi analitik atau tidak tahu bagaimana cara mendekatinya secara analitik. Selain itu, bila ukuran populasinya cukup besar sehingga sulit untuk menentukan kerangka sampel, lebih baik dilakukan resampling dengan me- tode ini.

  Dalam statistika, kita mengenal penduga parameter populasi berupa se- lang kepercayaan. Selang kepercayaan suatu parameter

  θ dibentuk dengan

  menentukan suatu selang nilai yang dengan peluang besar memuat parameter yang diduga (parameter populasi) dan erornya harus minimum. Bentuk selang kepercayaan ada tiga, yaitu:

  , , �∞, � �, � � ∞�, � � � � dengan adalah batas atas selang dan adalah batas bawah selang. Dalam

  � � tulisan ini, akan diulas bagaimana membentuk selang kepercayaan tersebut de- ngan metode Bootstrap. Pembentukan selang kepercayaan yang akan diulas adalah pembentukan selang kepercayaan dengan metode Persentil Bootstrap.

  Metode Persentil Bootstrap menghasilkan selang kepercayaan yang lebih pen- dek, variansi yang lebih kecil, dan tingkat kepercayaan yang lebih tinggi jika dibandingkan dengan metode lain yang selama ini digunakan.

  Metode Bootstrap juga dapat diterapkan pada regresi linear untuk mere- sampling sampelnya dalam upaya mendekati koefisien-koefisien model regre- si linear. Prinsip resampling bootstrap dalam regresi linear dibedakan berda- sarkan asumsi tetap atau acaknya variabel independen dari sampel asli.

  B. Perumusan Masalah

  Permasalahan yang akan dibahas dalam tulisan ini akan dirumuskan se- bagai berikut:

  1. Apakah yang dimaksud dengan metode Bootstrap dan bagaimana landasan teoritiknya?

  2. Bagaimana penerapan metode Bootstrap pada pendugaan selang parameter populasi dan parameter regresi linear berganda?

  3. Bagaimana algoritma dan pemrograman MATLAB untuk pendugaan se- lang parameter populasi dengan menggunakan metode Bootstrap?

  4. Bagaimana algoritma dan pemrograman MATLAB untuk pendugaan pa- rameter regresi dengan menggunakan metode Bootstrap?

  C. Pembatasan Masalah

  Penulis akan membatasi beberapa hal untuk uraian masalah yang akan dibahas, yaitu:

  1. Distribusi normal dan Student-t tidak dibahas dalam tulisan ini.

  2. Pembentukan selang parameter populasi dengan prinsip Bootstrap dibatasi hanya menggunakan metode Persentil Bootstrap.

  3. Aplikasi metode bootstrap hanya dibatasi pada pendugaan parameter rata- rata populasi, parameter koefisien regresi berganda, selang kepercayaan rata-rata populasi, dan selang kepercayaan koefisien regresi berganda.

  D. Tujuan Penulisan

  Tulisan ini disusun dengan tujuan agar dapat lebih memahami salah satu teknik resampling yang sering digunakan dalam statistika, yaitu Metode Boot- strap. Terlebih lagi, akan dipelajari prinsip Bootstrap dalam metode Persentil Bootstrap untuk membangun selang kepercayaan parameter populasi. Selain itu, prinsip bootstrap dalam regresi linear berganda juga dipelajari dalam tuli- san ini. Sebagai tambahan, kitapun akan mempelajari bagaimana penerapan prinsip-prinsip tersebut dalam pemrograman MATLAB. Tulisan ini juga di- susun sebagai pemenuhan tugas akhir dalam Program Studi Matematika Un- iversitas Sanata Dharma.

  E. Manfaat Penulisan

  Dengan memperlajari topik ini kita dapat mempelajari kegunaan- kegunaan metode Bootstrap dalam membangun selang penduga parameter po- pulasi dengan memanfaatkan data-data yang ada. Kita juga dapat mempelajari prinsip bootstrap dalam pengambilan sampel dalam regresi linear berganda.

  Terlebih dari itu, kita juga dapat menerapkan metode tersebut dalam algoritma dan pemrograman MATLAB sehingga proses komputasi lebih efektif dan efi- sien.

  F. Metode Penulisan

  Penulis menggunakan metode studi kepustakaan, yaitu dengan mempela- jari literatur yang berkaitan dengan topik metode Bootstrap dan teknik sam- pling guna mencari perannya dalam membangun selang penduga parameter populasi dan penduga parameter regresi linear berganda.

G. Sistematika Penulisan

  BAB I. PENDAHULUAN A. Latar Belakang Masalah B. Perumusan Masalah C. Pembatasan Masalah D. Tujuan Penulisan E. Manfaat Penulisan F. Metode Penulisan G. Sistematika Penulisan BAB II. LANDASAN TEORI A. Teori Sampling B. Estimasi C. Regresi Linear Berganda BAB III. METODE BOOTSTRAP A. Prinsip Dasar Dan Algoritma Metode Bootstrap B. Aplikasi Pendekatan Galat standar Dari Mean Dengan Metode Boot- strap

  BAB IV. APLIKASI METODE BOOTSTRAP A. Metode Persentil Bootstrap B. Regresi Bootstrap BAB V. PENUTUP A. Kesimpulan B. Saran DAFTAR PUSTAKA LAMPIRAN

BAB II LANDASAN TEORI A. Teori Sampling 1. Sampling Dalam statistika, selalu ditemui istilah populasi atau semesta. Istilah

  ini mengacu pada sekumpulan dari individu-individu atau atributnya, yang dapat dispesifikasikan secara numerik. Contohnya, populasi dari berat ba- dan, harga beras, dan sebagainya. Populasi yang memiliki elemen yang terhingga jumlahnya disebut sebagai populasi terhingga. Contohnya ada- lah populasi dari berat badan 48 siswa di suatu kelas. Istilah yang juga sering dijumpai adalah sampel. Sampel merupakan bagian yang terpilih dari suatu populasi dan proses pemilihan bagian terpilih tersebut disebut sebagai sampling.

  Sampling atau penarikan sampel, bertujuan untuk memperoleh in- formasi (sebanyak mungkin) yang mendukung pengamatan variabel ter- tentu guna mendapatkan keterangan tentang suatu populasi. Secara khu- sus, sampling dilakukan untuk mengestimasi parameter tertentu dari suatu populasi. Pemilihan sampel harus dilakukan secara acak (sampling acak) agar semua elemen populasi memiliki peluang yang sama untuk terpilih.

  Bilangan random (yang akan dibahas dalam subbab berikutnya) digunakan dalam proses sampling acak.

  Definisi 2.1.

  Diberikan dan yang mewakili banyaknya elemen dari ukuran populasi dan ukuran sampel secara berturut-turut. Bila samplingnya diperoleh den- gan suatu cara sedemikian sehingga setiap dari

  � � buah sampel memiliki probabilitas yang sama untuk terpilih, sampling tersebut dikatakan acak dan hasilnya dikatakan sampel acak.

  Dengan sampling sederhana, kita bermaksud melakukan sampling acak secara bersamaan. Cara ini merupakan cara untuk memilih buah sampel acak dari sampel yang berbeda anggota populasi, sehingga memiliki peluang yang sama untuk dipilih. Dengan begitu, setiap sampel memiliki probabilitas yang independen dan konstan. Tiap sampel diambil satu-persatu setelah sebelumnya dinomori dari 1 sampai

  . Kemudian, bi- langan-bilangan random bernilai di antara 1 sampai dibangkitkan dan digunakan untuk memilih secara acak.

  Terdapat dua macam cara penarikan sampel berdasarkan pengemba- lian sampel, yaitu sampling tanpa pengembalian dan sampling dengan pe-

  ngembalian . Menurut buku Encyclopedia of Statistical Sciences (2006),

  “Sampling is said to be with or without replacement according as to

  whether or not the same member of the population may be selected more than once .”, kemungkinan suatu anggota dari populasi dapat dipilih lebih

  dari sekali itulah yang menentukan cara sampling ini.

  Bila sebuah sampel yang diambil pada pengambilan pertama tidak dikembalikan sebelum pengambilan sampel yang kedua, dan begitu sete- rusnya, maka cara ini disebut dengan sampling tanpa pengembalian. Sam- pling dengan metode ini tidak termasuk dalam sampling sederhana karena probabilitas terpilihnya sampel tidak konstan. Pada sampling tanpa pen- gembalian, pengambilan pertama pada sebuah himpunan sampel berukur- an memiliki probabilitas sebesar ⁄ . Pengambilan kedua memiliki

  ( probabilitas sebesar karena anggota sampel dan populasi − 1) ( − 1) ⁄ masing-masing berkurang 1 anggota dengan tidak dilakukannya pengem- balian sampel. Begitu pula untuk pengambilan ketiga dan seterusnya.

  Maka dari itu, untuk sampling tanpa pengembalian, probabilitas semua buah sampel dapat dipilih dalam kali pengambilan adalah:

  ( (

  1

  1 − 1) − 2) ! ( − )!

  = = ( ( (

  ⋅ − 1) ⋅ − 2) ⋅⋅⋅ − + 1) !

  Pada sampling dengan pengembalian, sampel yang sebelumnya telah diambil, dikembalikan terlebih dulu sebelum mengambil sampel berikut- nya. Jadi, sampel ke-i dapat muncul 0,1,2, … , kali dalam himpunan sampelnya. Karena adanya pengembalian, seluruh unit sampel memiliki peluang yang sama untuk dipilih, berapa kalipun sampel tersebut sudah terpilih sebelumnya. Jadi, pada sampling dengan pengembalian, probabili- tas masing-masing

  ⁄ . buah sampel untuk terpilih adalah 1

  Alasan dilakukannya sampling yaitu, adalah suatu hal yang mustahil bila seorang peneliti mengamati seluruh anggota dari populasi. Kalaupun waktu dan sumber daya manusia yang tidak sedikit. Suatu populasi, mi- salnya darah dalam tubuh manusia, tidak mungkin diobservasi seluruhnya karena pengamatan seperti itu bersifat destruktif bagi populasi. Sering kali pula populasi dianggap terlalu dinamis, dapat berubah-ubah sewaktu- waktu, contohnya populasi penduduk suatu daerah. Sebenarnya peng- amatan secara keseluruhan anggota populasi mungkin saja dilakukan dan akan menghasilkan keterangan tentang populasi yang lebih tepat dan aku- rat dibandingkan dengan mengamati sampel. Meskipun begitu, kita perlu menjaga keseimbangan antara ketepatan hasil dengan banyaknya sumber daya yang harus dikorbankan dengan mengamati populasi secara menyelu- ruh. Karena itulah, para peneliti lebih memilih untuk mengamati sampel, dengan syarat galat pengamatan diminimalisir daripada mengorbankan ba- nyak sumber daya untuk penelitian populasi. Keterangan tentang populasi dengan galat yang minimal dianggap cukup memuaskan bagi peneliti.

2. Bilangan Random

  Sebelum teknologi komputer dan simulasi matematis berkembang seperti sekarang ini, bilangan random biasanya didapat dari tabel bilangan random yang disusun oleh L. H. C. Tippet. Tabel tersebut terdiri dari 10.400 buah bilangan empat digit. Bilangan random ini sangat diperlukan untuk metode statistika yang bersifat probabilistik, seperti metode sam- pling Monte Carlo. Dewasa ini, bilangan random sudah dapat dibang- kitkan dengan menggunakan komputer, sehingga simulasi matematis dapat dilakukan dengan mudah.

  Sifat bilangan random yang acak diterapkan untuk membangkitkan nilai dari variabel-variabel random untuk sembarang distribusi. Bilangan random dibangkitkan dengan menggunakan algoritma numerik. Algoritma numerik tersebut membuat barisan bilangan yang bersifat deterministik.

  Bila dilihat tanpa mengetahui algoritmanya, bilangan-bilangan tersebut terlihat acak. Sifat acak yang sebenarnya didapatkan dari algoritma inilah yang menyebabkan sifat semu dari bilangan random tersebut. Maka dari itu, bilangan random sering kali disebut sebagai bilangan pseudorandom.

3. Pembangkit Bilangan Random

  Cara yang paling sederhana untuk membangkitkan bilangan random yaitu dengan menggunakan Linear Congruential Generators.

  Langkah pertama dimulai dengan nilai awal , lalu secara rekursif menghitung nilai-nilai selanjutnya , ≥ 1, dengan rumus:

  • −1

  = modulo

  di mana ( adalah himpunan bilangan bulat positif) dan , ∈ ℤ ℤ dapat dibagi oleh

  −1

  . Se- dan sisanya diambil sebagai nilai dari

  tiap , nilainya bisa bernilai 0, 1, … , ⁄ lah yang

  − 1 dan nilai dari disebut sebagai bilangan random. Bilangan ini diambil sebagai pendekat- (0,1). an dari sebuah variabel random seragam Sebagai contoh, bila diambil = 1, = 13, = 0, = 31, dan akan didapatkan deret sebagai berikut: