PERBANDINGAN METODE LEAST TRIMMED SQUARES DAN PENAKSIR M DALAM MENGATASI PERMASALAHAN DATA PENCILAN SKRIPSI SRI WULANDARI 080803006

  

PERBANDINGAN METODE LEAST TRIMMED SQUARES

DAN PENAKSIR M DALAM MENGATASI

PERMASALAHAN DATA PENCILAN

SKRIPSI

SRI WULANDARI

080803006

  

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SUMATERA UTARA

MEDAN

2012

  

PERBANDINGAN METODE LEAST TRIMMED SQUARES

DAN PENAKSIR M DALAM MENGATASI

PERMASALAHAN DATA PENCILAN

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana

Sains

  

SRI WULANDARI

080803006

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SUMATERA UTARA

MEDAN

  

2012

  

PERSETUJUAN

  Judul : PERBANDINGAN METODE LEAST TRIMMED DAN PENAKSIR M DALAM

  SQUARES

  MENGATASI PERMASALAHAN DATA PENCILAN Kategori : SKRIPSI Nama : SRI WULANDARI Nomor Induk Mahasiswa : 080803006 Program Studi : SARJANA (S1) MATEMATIKA Departemen : MATEMATIKA Fakultas : MATEMATIKA DAN ILMU PENGETAHUAN

  ALAM (FMIPA) UNIVERSITAS SUMATERA UTARA

  Diluluskan di Medan, November 2012

  Komisi Pembimbing : Pembimbing 2 Pembimbing 1 Drs. Open Darnius, M.Sc Dr. Sutarman, M.Sc NIP. 19641014 199103 1 004 NIP. 19631026 199103 1 001 Diketahui/Disetujui oleh Departemen Matematika FMIPA USU Ketua, Prof. Dr. Tulus, M.Si NIP. 196209011988031 002

  

PERNYATAAN

  PERBANDINGAN METODE LEAST TRIMMED SQUARES DAN PENAKSIR M DALAM MENGATASI PERMASALAHAN DATA PENCILAN SKRIPSI Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya Medan, November 2012 SRI WULANDARI 080803006

  

PENGHARGAAN

  Puji dan syukur kehadirat Allah SWT yang telah senantiasa memberikan rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan penyusunan skripsi yang berjudul

  

Perbandingan Metode Least Trimmed Squares dan Penaksir M dalam Mengatasi

Permasalahan Data Pencilan ini dengan baik dan lancar.

  Penulisan skripsi ini dapat terselesaikan berkat bantuan banyak pihak. Oleh karena itu, dalam kesempatan ini penulis ingin mengucapkan terima kasih sebanyak- banyaknya kepada: 1.

  Bapak Dr. Sutarman, M.Sc dan Bapak Drs. Open Darnius, M.Sc selaku Dosen Pembimbing yang selalu memotivasi dan membimbing penulis dalam menyelesaikan skripsi ini.

  2. Bapak Drs. Faigiziduhu Bu’ulolo, M.Si dan Bapak Drs. Suwarno Ariswoyo, M.Si selaku Dosen Penguji yang telah memberikan kritik dan saran yang membangun terhadap skripsi ini.

  3. Bapak Prof. Dr.Tulus.Vordipl.Math.,M.Si.,Ph.D dan Ibu Dra. Mardiningsih, M.Si sebagai Ketua dan Sekretaris Departemen Matematika FMIPA USU.

  4. Dr. Sutarman, M.Sc sebagai Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara.

  5. Yang teristimewa kepada kedua orangtua tercinta yaitu Bapak Sutrisno dan Ibu Katiyem dan adik tersayang Fatkhu Rozi serta keluarga dekat tersayang yang senantiasa memberikan do’a dan motivasi bagi penulis sehingga penulis selalu bersemangat.

  6. Para sahabat dan teman-teman yaitu CICILANWIFI (Aci, Uci, Wika dan Fika), Alvi, Ugi, Ikbal, Niar, Fitri, Zuli, Anum, Silvi, dan teman-teman lainnya yang tidak dapat penulis sebutkan satu per satu, serta Kak Siti Hardianti dan Kak Rolina yang selalu memberikan semangat dan bantuan kepada penulis.

  Penulis berharap semoga Allah SWT membalas kebaikan dari semua pihak yang telah banyak membantu dan memotivasi penulis dalam menyelesaikan skripsi ini. Penulis menyadari bahwa penulisan skripsi ini masih memiliki kekurangan dan ketidaksempurnaan. Untuk itu, kritik dan saran yang membangun dari berbagai pihak sangat diharapkan. Penulis berharap semoga skripsi ini dapat bermanfaat dan akhir kata penulis ucapkan terima kasih.

  Medan, November 2012 Penulis SRI WULANDARI 080803006

  

ABSTRAK

  Analisis regresi digunakan untuk mengetahui hubungan antara variabel. Salah satu metode penaksir parameter dalam model analisis regresi yaitu metode kuadrat terkecil (OLS). Jika terdapat pencilan, metode OLS tidak lagi efisien sehingga metode yang cocok untuk permasalahan pencilan yaitu metode regresi robust. Pencilan adalah data yang tidak mengikuti sebagian besar pola dan terletak jauh dari pusat data, dapat dideteksi dengan metode grafik dan menentukan nilai Leverage, DfFITS dan

Cook’s Distance . Least trimmed squares (LTS) yaitu metode penaksiran parameter regresi

  robust yang menggunakan konsep pengepasan OLS untuk meminimumkan jumlah kuadrat sisa. Penaksir M yaitu metode dalam mengatasi pencilan dan dapat menggunakan fungsi Huber dalam mengestimasi parameter regresi. Tujuan penelitian ini yaitu membandingkan dua metode regresi robust yakni penaksir LTS dan penaksir M dengan metode OLS dalam mengatasi permasalahan data pencilan. Hasil penelitian yang diperoleh yaitu penaksir LTS merupakan metode paling baik karena mampu mengatasi pencilan dan menghasilkan estimasi koefisien regresi yang baik serta rata- rata kuadrat sisa paling kecil. Penaksir M juga menghasilkan estimasi yang baik dan rata-rata kuadrat sisa lebih kecil daripada metode OLS.

  

Kata kunci : pencilan, metode kuadrat terkecil, regresi robust, penaksir least trimmed

squares, dan penaksir M

  

The Comparing of Method Least Trimmed Squares Estimator and M Estimator

in Overcoming The Problems of Outlier Data

ABSTRACT

  Regression analysis is used to determine the relationship between variables. One of methods for estimating the parameters in model analysis is ordinary least square (OLS). If there are outliers, OLS is not efficient again so the suitable method for problems of outliers is robust regression method. Outlier is data that inconsistent with the pattern and located away from the data center, can be detected with graphical method and determine the leverage value, DfFITS and Cook’s Distance. Least trimmed squares (LTS) is an estimating method of robust regression that using a fitting concept of OLS to minimize the sum square error. M estimator is a method to overcome the outliers and can use Huber function in estimating the regression parameter. The purpose of this study is comparing two methods of robust regression, those are LTS and M estimator with ordinary least squares method in overcoming the problems of outlier. The conclutions of it are LTS is the best method because it can overcome the outliers and give a good estimation in coeficient of regression, and so produce the smallest mean square error. Then, M estimator also gives a good estimation and produce smaller mean square error than OLS.

  

Keywords : outliers,ordinary least square, robust regression, least trimmed squares

estimator, and M estimator.

  Halaman Persetujuan ii

  Pernyataan iii

  Penghargaan iv

  Abstrak vi

  Abstract vii

  Daftar Isi viii

  Daftar Tabel x

  Daftar Gambar xii

  Daftar Lampiran xiii

  Bab 1 Pendahuluan 1

  1.1

  1 Latar Belakang

  1.2

  2 Rumusan Masalah

  1.3

  3 Tujuan Penelitian

  1.4

  3 Batasan Masalah

  1.5

  3 Manfaat Penelitian

  1.6

  3 Metodologi Penelitian

  1.7

  4 Tinjauan Pustaka

  Bab 2 Landasan teori

  6

  2.1 Pengertian dan Dampak Pencilan

  6

  2.1.1 Pengertian Pencilan 6

  2.1.2 Dampak Pencilan

  7

  2.2 Pendeteksian Pencilan

  7

  2.3 Metode Kuadrat Terkecil

  9

  2.3 Penaksir Kuadrat Terkecil 10

  2.4 Rata-rata Kuadrat Sisa 13

  2.5 Regresi Robust 14

  2.5.1 Pengertian Regresi Robust 15

  2.6 Metode Penaksir Least Trimmed Squares (LTS) 15

  2.7 Metode Penaksir M ` 16

  Bab 3 Pembahasan Data Asimulasi 19

  3.1 Data

  19

  3.2 Pendeteksian Outlier

  23

  3.3 Metode Kuadrat Terkecil

  29

  3.3.1 Rata-rata Kuadrat Sisa untuk Metode OLS

  34

  3.4 Metode Regresi Robust dengan Penaksir Least Trimmed Squares 39

  3.4.1 Rata-rata Kuadrat Sisa untuk Penaksir LTS 45

  3.5 Metode Regresi Robust dengan Penaksir M

  49

  3.5.1 Rata-rata Kuadrat Sisa untuk Penaksir M

  52 Bab 4 Kesimpulan dan Saran

  58

  4.1 Kesimpulan

  58

  4.2 Saran

  58 Daftar Pustaka

  60 Lampiran

  

DAFTAR TABEL

  Halaman

Tabel 2.1 Fungsi Obyektif, Fungsi Influence, dan Fungsi Pembobot untuk

  Kuadrat Terkecil, Huber, dan Tukey Bisquare

  18 Tabel 3.1 Data Bangkitan Awal

  20 Tabel 3.2 Data Bangkitan Kedua

  21 Tabel 3.3 Data Bangkitan Ketiga

  22 Tabel 3.4 Data Bangkitan Kombinasi Data 2 dan Data 3

  23 Tabel 3.5 Pendeteksian Pencilan untuk Data 1 dan Data 2

  27 Tabel 3.6 Pendeteksian Pencilan untuk Data 3 dan Data 4

  28 Tabel 3.7 Perkalian Variabel Bebas dan Variabel Terikat untuk Data 1 30

Tabel 3.8 Perkalian Variabel Bebas dan Variabel Terikat untuk Data 2

  31 Tabel 3.9 Perkalian Variabel Bebas dan Variabel Terikat untuk Data 3

  32 Tabel 3.10 Perkalian Variabel Bebas dan Variabel Terikat untuk Data 4 33

Tabel 3.11 Nilai Sisaan dan Sisaan Kuadrat, Jumlah Kuadrat Regresi, dan Jumlah Kuadrat Total untuk Data 1 dengan Metode OLS 35Tabel 3.12 Nilai Sisaan dan Sisaan Kuadrat, Jumlah Kuadrat Regresi, dan Jumlah Kuadrat Total untuk Data 2 dengan Metode OLS 36Tabel 3.13 Nilai Sisaan dan Sisaan Kuadrat, Jumlah Kuadrat Regresi, dan Jumlah Kuadrat Total untuk Data 3 dengan Metode OLS 37Tabel 3.14 Nilai Sisaan dan Sisaan Kuadrat, Jumlah Kuadrat Regresi, dan Jumlah Kuadrat Total untuk Data 4 dengan Metode OLS 38Tabel 3.15 Nilai Sisaan Kuadrat Terurut

  40 Tabel 3.16 Perkalian Variabel untuk Data 1 dengan Penaksir LTS

  41 Tabel 3.17 Perkalian Variabel untuk Data 2 dengan Penaksir LTS

  42 Tabel 3.18 Perkalian Variabel untuk Data 3 dengan Penaksir LTS

  43 Tabel 3.19 Perkalian Variabel untuk Data 4 dengan Penaksir LTS

  44 Tabel 3.20 Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total Data 1 dengan Nilai Sisaan yang Terurut Menggunakan Metode LTS 45

Tabel 3.21 Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total Data 2 dengan Nilai Sisaan yang Terurut Menggunakan Metode LTS 46Tabel 3.22 Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total Data 3 dengan Nilai Sisaan yang Terurut Menggunakan Metode LTS 47Tabel 3.23 Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total Data 4 dengan Nilai Sisaan yang Terurut Menggunakan Metode LTS 48Tabel 3.24 Hasil Perhitungan Koefisien Regresi Iterasi ke-1

  50 Tabel 3.25 Hasil Perhitungan Koefisien Regresi Iterasi ke-2

  51 Tabel 3.26 Nilai Koefisien Regresi Penaksir M

  52 Tabel 3.27 Nilai Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total untuk Data 1 Menggunakan Penaksir M

  53 Tabel 3.28 Nilai Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total untuk Data 2 Menggunakan Penaksir M

  54 Tabel 3.29 Nilai Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total untuk Data 3 Menggunakan Penaksir M

  55

Tabel 3.30 Nilai Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total untuk

  Data 4 Menggunakan Penaksir M

  56 Tabel 3.31 Hasil Estimasi Koefisien Regresi dan Rata-rata Kuadrat Sisa 57

  

DAFTAR GAMBAR

  Halaman

Gambar 2.1 Skema Identifikasi Data Pencilan dengan IQR atau Box Plot

  8 Gambar 2.2 Kriteria Pengambilan Keputusan Adanya Pencilan atau Tidak

  9 Gambar 3.1 Scatterplot Data Bangkitan Awal

  24 Gambar 3.2 Scatterplot Data Bangkitan Kedua

  24 Gambar 3.3 Data Bangkitan Ketiga

  25 Gambar 3.4 Data Bangkitan Kombinasi Data 2 dan Data 3

  25