PERBANDINGAN METODE LEAST TRIMMED SQUARES DAN PENAKSIR M DALAM MENGATASI PERMASALAHAN DATA PENCILAN SKRIPSI SRI WULANDARI 080803006
PERBANDINGAN METODE LEAST TRIMMED SQUARES
DAN PENAKSIR M DALAM MENGATASI
PERMASALAHAN DATA PENCILAN
SKRIPSI
SRI WULANDARI
080803006
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2012
PERBANDINGAN METODE LEAST TRIMMED SQUARES
DAN PENAKSIR M DALAM MENGATASI
PERMASALAHAN DATA PENCILAN
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana
Sains
SRI WULANDARI
080803006
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2012
PERSETUJUAN
Judul : PERBANDINGAN METODE LEAST TRIMMED DAN PENAKSIR M DALAM
SQUARES
MENGATASI PERMASALAHAN DATA PENCILAN Kategori : SKRIPSI Nama : SRI WULANDARI Nomor Induk Mahasiswa : 080803006 Program Studi : SARJANA (S1) MATEMATIKA Departemen : MATEMATIKA Fakultas : MATEMATIKA DAN ILMU PENGETAHUAN
ALAM (FMIPA) UNIVERSITAS SUMATERA UTARA
Diluluskan di Medan, November 2012
Komisi Pembimbing : Pembimbing 2 Pembimbing 1 Drs. Open Darnius, M.Sc Dr. Sutarman, M.Sc NIP. 19641014 199103 1 004 NIP. 19631026 199103 1 001 Diketahui/Disetujui oleh Departemen Matematika FMIPA USU Ketua, Prof. Dr. Tulus, M.Si NIP. 196209011988031 002
PERNYATAAN
PERBANDINGAN METODE LEAST TRIMMED SQUARES DAN PENAKSIR M DALAM MENGATASI PERMASALAHAN DATA PENCILAN SKRIPSI Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya Medan, November 2012 SRI WULANDARI 080803006
PENGHARGAAN
Puji dan syukur kehadirat Allah SWT yang telah senantiasa memberikan rahmat dan hidayah-Nya sehingga penulis dapat menyelesaikan penyusunan skripsi yang berjudul
Perbandingan Metode Least Trimmed Squares dan Penaksir M dalam Mengatasi
Permasalahan Data Pencilan ini dengan baik dan lancar.Penulisan skripsi ini dapat terselesaikan berkat bantuan banyak pihak. Oleh karena itu, dalam kesempatan ini penulis ingin mengucapkan terima kasih sebanyak- banyaknya kepada: 1.
Bapak Dr. Sutarman, M.Sc dan Bapak Drs. Open Darnius, M.Sc selaku Dosen Pembimbing yang selalu memotivasi dan membimbing penulis dalam menyelesaikan skripsi ini.
2. Bapak Drs. Faigiziduhu Bu’ulolo, M.Si dan Bapak Drs. Suwarno Ariswoyo, M.Si selaku Dosen Penguji yang telah memberikan kritik dan saran yang membangun terhadap skripsi ini.
3. Bapak Prof. Dr.Tulus.Vordipl.Math.,M.Si.,Ph.D dan Ibu Dra. Mardiningsih, M.Si sebagai Ketua dan Sekretaris Departemen Matematika FMIPA USU.
4. Dr. Sutarman, M.Sc sebagai Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara.
5. Yang teristimewa kepada kedua orangtua tercinta yaitu Bapak Sutrisno dan Ibu Katiyem dan adik tersayang Fatkhu Rozi serta keluarga dekat tersayang yang senantiasa memberikan do’a dan motivasi bagi penulis sehingga penulis selalu bersemangat.
6. Para sahabat dan teman-teman yaitu CICILANWIFI (Aci, Uci, Wika dan Fika), Alvi, Ugi, Ikbal, Niar, Fitri, Zuli, Anum, Silvi, dan teman-teman lainnya yang tidak dapat penulis sebutkan satu per satu, serta Kak Siti Hardianti dan Kak Rolina yang selalu memberikan semangat dan bantuan kepada penulis.
Penulis berharap semoga Allah SWT membalas kebaikan dari semua pihak yang telah banyak membantu dan memotivasi penulis dalam menyelesaikan skripsi ini. Penulis menyadari bahwa penulisan skripsi ini masih memiliki kekurangan dan ketidaksempurnaan. Untuk itu, kritik dan saran yang membangun dari berbagai pihak sangat diharapkan. Penulis berharap semoga skripsi ini dapat bermanfaat dan akhir kata penulis ucapkan terima kasih.
Medan, November 2012 Penulis SRI WULANDARI 080803006
ABSTRAK
Analisis regresi digunakan untuk mengetahui hubungan antara variabel. Salah satu metode penaksir parameter dalam model analisis regresi yaitu metode kuadrat terkecil (OLS). Jika terdapat pencilan, metode OLS tidak lagi efisien sehingga metode yang cocok untuk permasalahan pencilan yaitu metode regresi robust. Pencilan adalah data yang tidak mengikuti sebagian besar pola dan terletak jauh dari pusat data, dapat dideteksi dengan metode grafik dan menentukan nilai Leverage, DfFITS dan
Cook’s Distance . Least trimmed squares (LTS) yaitu metode penaksiran parameter regresi
robust yang menggunakan konsep pengepasan OLS untuk meminimumkan jumlah kuadrat sisa. Penaksir M yaitu metode dalam mengatasi pencilan dan dapat menggunakan fungsi Huber dalam mengestimasi parameter regresi. Tujuan penelitian ini yaitu membandingkan dua metode regresi robust yakni penaksir LTS dan penaksir M dengan metode OLS dalam mengatasi permasalahan data pencilan. Hasil penelitian yang diperoleh yaitu penaksir LTS merupakan metode paling baik karena mampu mengatasi pencilan dan menghasilkan estimasi koefisien regresi yang baik serta rata- rata kuadrat sisa paling kecil. Penaksir M juga menghasilkan estimasi yang baik dan rata-rata kuadrat sisa lebih kecil daripada metode OLS.
Kata kunci : pencilan, metode kuadrat terkecil, regresi robust, penaksir least trimmed
squares, dan penaksir M
The Comparing of Method Least Trimmed Squares Estimator and M Estimator
in Overcoming The Problems of Outlier Data
ABSTRACT
Regression analysis is used to determine the relationship between variables. One of methods for estimating the parameters in model analysis is ordinary least square (OLS). If there are outliers, OLS is not efficient again so the suitable method for problems of outliers is robust regression method. Outlier is data that inconsistent with the pattern and located away from the data center, can be detected with graphical method and determine the leverage value, DfFITS and Cook’s Distance. Least trimmed squares (LTS) is an estimating method of robust regression that using a fitting concept of OLS to minimize the sum square error. M estimator is a method to overcome the outliers and can use Huber function in estimating the regression parameter. The purpose of this study is comparing two methods of robust regression, those are LTS and M estimator with ordinary least squares method in overcoming the problems of outlier. The conclutions of it are LTS is the best method because it can overcome the outliers and give a good estimation in coeficient of regression, and so produce the smallest mean square error. Then, M estimator also gives a good estimation and produce smaller mean square error than OLS.
Keywords : outliers,ordinary least square, robust regression, least trimmed squares
estimator, and M estimator.Halaman Persetujuan ii
Pernyataan iii
Penghargaan iv
Abstrak vi
Abstract vii
Daftar Isi viii
Daftar Tabel x
Daftar Gambar xii
Daftar Lampiran xiii
Bab 1 Pendahuluan 1
1.1
1 Latar Belakang
1.2
2 Rumusan Masalah
1.3
3 Tujuan Penelitian
1.4
3 Batasan Masalah
1.5
3 Manfaat Penelitian
1.6
3 Metodologi Penelitian
1.7
4 Tinjauan Pustaka
Bab 2 Landasan teori
6
2.1 Pengertian dan Dampak Pencilan
6
2.1.1 Pengertian Pencilan 6
2.1.2 Dampak Pencilan
7
2.2 Pendeteksian Pencilan
7
2.3 Metode Kuadrat Terkecil
9
2.3 Penaksir Kuadrat Terkecil 10
2.4 Rata-rata Kuadrat Sisa 13
2.5 Regresi Robust 14
2.5.1 Pengertian Regresi Robust 15
2.6 Metode Penaksir Least Trimmed Squares (LTS) 15
2.7 Metode Penaksir M ` 16
Bab 3 Pembahasan Data Asimulasi 19
3.1 Data
19
3.2 Pendeteksian Outlier
23
3.3 Metode Kuadrat Terkecil
29
3.3.1 Rata-rata Kuadrat Sisa untuk Metode OLS
34
3.4 Metode Regresi Robust dengan Penaksir Least Trimmed Squares 39
3.4.1 Rata-rata Kuadrat Sisa untuk Penaksir LTS 45
3.5 Metode Regresi Robust dengan Penaksir M
49
3.5.1 Rata-rata Kuadrat Sisa untuk Penaksir M
52 Bab 4 Kesimpulan dan Saran
58
4.1 Kesimpulan
58
4.2 Saran
58 Daftar Pustaka
60 Lampiran
DAFTAR TABEL
Halaman
Tabel 2.1 Fungsi Obyektif, Fungsi Influence, dan Fungsi Pembobot untukKuadrat Terkecil, Huber, dan Tukey Bisquare
18 Tabel 3.1 Data Bangkitan Awal
20 Tabel 3.2 Data Bangkitan Kedua
21 Tabel 3.3 Data Bangkitan Ketiga
22 Tabel 3.4 Data Bangkitan Kombinasi Data 2 dan Data 3
23 Tabel 3.5 Pendeteksian Pencilan untuk Data 1 dan Data 2
27 Tabel 3.6 Pendeteksian Pencilan untuk Data 3 dan Data 4
28 Tabel 3.7 Perkalian Variabel Bebas dan Variabel Terikat untuk Data 1 30
Tabel 3.8 Perkalian Variabel Bebas dan Variabel Terikat untuk Data 231 Tabel 3.9 Perkalian Variabel Bebas dan Variabel Terikat untuk Data 3
32 Tabel 3.10 Perkalian Variabel Bebas dan Variabel Terikat untuk Data 4 33
Tabel 3.11 Nilai Sisaan dan Sisaan Kuadrat, Jumlah Kuadrat Regresi, dan Jumlah Kuadrat Total untuk Data 1 dengan Metode OLS 35Tabel 3.12 Nilai Sisaan dan Sisaan Kuadrat, Jumlah Kuadrat Regresi, dan Jumlah Kuadrat Total untuk Data 2 dengan Metode OLS 36Tabel 3.13 Nilai Sisaan dan Sisaan Kuadrat, Jumlah Kuadrat Regresi, dan Jumlah Kuadrat Total untuk Data 3 dengan Metode OLS 37Tabel 3.14 Nilai Sisaan dan Sisaan Kuadrat, Jumlah Kuadrat Regresi, dan Jumlah Kuadrat Total untuk Data 4 dengan Metode OLS 38Tabel 3.15 Nilai Sisaan Kuadrat Terurut40 Tabel 3.16 Perkalian Variabel untuk Data 1 dengan Penaksir LTS
41 Tabel 3.17 Perkalian Variabel untuk Data 2 dengan Penaksir LTS
42 Tabel 3.18 Perkalian Variabel untuk Data 3 dengan Penaksir LTS
43 Tabel 3.19 Perkalian Variabel untuk Data 4 dengan Penaksir LTS
44 Tabel 3.20 Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total Data 1 dengan Nilai Sisaan yang Terurut Menggunakan Metode LTS 45
Tabel 3.21 Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total Data 2 dengan Nilai Sisaan yang Terurut Menggunakan Metode LTS 46Tabel 3.22 Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total Data 3 dengan Nilai Sisaan yang Terurut Menggunakan Metode LTS 47Tabel 3.23 Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total Data 4 dengan Nilai Sisaan yang Terurut Menggunakan Metode LTS 48Tabel 3.24 Hasil Perhitungan Koefisien Regresi Iterasi ke-150 Tabel 3.25 Hasil Perhitungan Koefisien Regresi Iterasi ke-2
51 Tabel 3.26 Nilai Koefisien Regresi Penaksir M
52 Tabel 3.27 Nilai Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total untuk Data 1 Menggunakan Penaksir M
53 Tabel 3.28 Nilai Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total untuk Data 2 Menggunakan Penaksir M
54 Tabel 3.29 Nilai Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total untuk Data 3 Menggunakan Penaksir M
55
Tabel 3.30 Nilai Jumlah Kuadrat Regresi dan Jumlah Kuadrat Total untukData 4 Menggunakan Penaksir M
56 Tabel 3.31 Hasil Estimasi Koefisien Regresi dan Rata-rata Kuadrat Sisa 57
DAFTAR GAMBAR
Halaman
Gambar 2.1 Skema Identifikasi Data Pencilan dengan IQR atau Box Plot8 Gambar 2.2 Kriteria Pengambilan Keputusan Adanya Pencilan atau Tidak
9 Gambar 3.1 Scatterplot Data Bangkitan Awal
24 Gambar 3.2 Scatterplot Data Bangkitan Kedua
24 Gambar 3.3 Data Bangkitan Ketiga
25 Gambar 3.4 Data Bangkitan Kombinasi Data 2 dan Data 3
25