Perbandingan Antara Estimasi M dengan Type Welsch dengan Least Trimmed Square untuk Mengatasi Adanya Data Pencilan
Universitas Sumatera Utara
Universitas Sumatera Utara
ii
PERSETUJUAN
Judul
Kategori
Nama
Nomor Induk Mahasiswa
Program Studi
Departemen
Fakultas
:PERBANDINGAN ANTARA ESTIMASI M DENGAN
TYPE WELSCH DENGAN LEAST TRIMMED SQUARE
DALAM REGRESI ROBUST UNTUK MENGATASI
ADANYA DATA PENCILAN
: SKRIPSI
: SABAM DAONI SINAMBELA
: 090803053
: SARJANA (S1) MATEMATIKA
: MATEMATIKA
: MATEMATIKA DAN ILMU PENGETAHUAN
ALAM (FMIPA) UNIVERSITAS SUMATERA
UTARA
Diluluskan di
Medan,
Komisi Pembimbing
Pembimbing 2
:
Drs.Henry Rani Sitepu M.Si.
NIP.19530303 198303 1 002
Pembimbing 1
Drs.Suwarno Ariswoyo M.Si.
NIP. 19500312 198003 1 001
Diketahui/Disetujui oleh
Departemen Matematika FMIPA USU
Ketua,
Prof. Dr. Tulus, M.Si
NIP. 196209011988031 002
Universitas Sumatera Utara
PERNYATAAN
PERBANBINGAN ANTARA ESTIMASI M TYPE WELSCH DENGAN
LEAST TRIMMED SQUARE DALAM REGRESI ROBUST UNTUK
MENGATASI ADANYA DATA PENCILAN
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa
kutipan dan ringkasan yang masing-masing disebutkan sumbernya
Medan,
SABAM DAONI SINAMBELA
090803053
Universitas Sumatera Utara
PENGHARGAAN
Puji dan syukur kepada Tuhan Yang Maha Esa yang telah senantiasa memberikan
berkatNya sehingga penulis dapat menyelesaikan penyusunan skripsi yang
berjudul Perbandingan antara estimasi M dengan Type Welsch dengan Least
Trimmed Square untuk mengatasi adanya data pencilan ini dengan baik dan
lancar.
Penulisan skripsi ini dapat terselesaikan berkat bantuan banyak pihak.
Oleh karena itu, dalam kesempatan ini penulis ingin mengucapkan terima kasih
sebanyak-banyaknya kepada:
1. Bapak Drs. Suwarno Ariswoyo, M.Si dan Bapak Drs. Henry Rani Sitepu,
M.Si selaku Dosen Pembimbing yang selalu memotivasi dan membimbing
penulis dalam menyelesaikan skripsi ini.
2. Bapak Drs. Open Darnius, M.Sc dan Bapak Drs. Gim Tarigan, M.Si selaku
Dosen Penguji yang telah memberikan kritik dan saran yang membangun
terhadap skripsi ini.
3. Bapak Prof. Dr.Tulus.Vordipl.Math.,M.Si.,Ph.D dan Ibu Dra.
Mardiningsih, M.Si sebagai Ketua dan Sekretaris Departemen Matematika
FMIPA USU.
4. Dr. Sutarman, M.Sc sebagai Dekan Fakultas Matematika dan Ilmu
Pengetahuan Alam Universitas Sumatera Utara.
5. Yang teristimewa kepada nenek dan ibu tercinta yaitu L.Simanungkalit
dan Ibu P.Pasaribu serta keluarga dekat tersayang yang senantiasa
memberikan doa dan motivasi bagi penulis sehingga penulis selalu
bersemangat.
6. PEMDA Tapanuli Utara dan Inang Boru Tobing yang senantiasa
memberikan motivasi kepada saya dan juga dana yang telah diberikan
7. Para sahabat dan teman-teman saya yaitu Andos Niky Sembiring,Bernat
Silaban,Hariady Turnip, Ridores Regar, dan teman-teman lainnya yang
tidak dapat penulis sebutkan satu per satu, serta Kak Rolina yang selalu
memberikan semangat dan bantuan kepada penulis.
Universitas Sumatera Utara
8. Teman-teman di Ulun Jundy Camp yang telah memberikan motivasi
kepada saya dalam menyelesaikan skripsi saya.
Penulis berharap semoga Tuhan Yang Maha Esa membalas kebaikan dari semua
pihak yang telah banyak membantu dan memotivasi penulis dalam menyelesaikan
skripsi ini. Penulis menyadari bahwa penulisan skripsi ini masih memiliki
kekurangan dan ketidaksempurnaan. Untuk itu, kritik dan saran yang membangun
dari berbagai pihak sangat diharapkan. Penulis berharap semoga skripsi ini dapat
bermanfaat dan akhir kata penulis ucapkan terima kasih.
Medan,
Penulis
SABAM DAONI SINAMBELA
090803053
Universitas Sumatera Utara
ABSTRAK
Analisis regresi digunakan untuk mengetahui hubungan antara variabel bebas dan
variabel terikat. Salah satu metode penaksir parameter dalam model analisis
regresi yaitu metode kuadrat terkecil (OLS). Jika terdapat pencilan, metode OLS
tidak lagi efisien sehingga metode yang cocok untuk permasalahan pencilan yaitu
metode regresi robust. Pencilan adalah data yang tidak mengikuti sebagian besar
pola dan terletak jauh dari pusat data, dapat dideteksi dengan metode boxplot
(Interquartil Range)dan menentukan nilai Leverage, DfFITS dan Cook’s Distance.
Least trimmed squares (LTS) yaitu metode penaksiran parameter regresi robust
yang menggunakan konsep pemangkasan OLS untuk meminimumkan jumlah
kuadrat residual. Penaksir M yaitu metode dalam mengatasi pencilan dan dapat
menggunakan fungsi Welsch dalam mengestimasi parameter regresi. Tujuan
penelitian ini yaitu membandingkan dua metode regresi robust yakni penaksir
LTS dan penaksir M Type Welsch dalam mengatasi permasalahan data pencilan.
Hasil penelitian yang diperoleh yaitu penaksir LTS merupakan metode paling baik
karena mampu mengatasi pencilan dan diperoleh bahwa least trimmed squares
memiliki nilai R2 yang paling tinggi dari penaksir M type Welsch, dengan kata
lain penaksir least trimmes square lebih bagus dari penaksir M type Welsch
Kata kunci : pencilan, metode kuadrat terkecil, regresi robust, penaksir least
trimmed squares, dan penaksir M type Welsch,interquartil range,boxplot
Universitas Sumatera Utara
The Studi Comparing of M Estimator Welsch Type with Least Trimmed
Squares Estimator in Robust Regresion to Overcome the Outlier data
ABSTRACT
Regression analysis is used to determine the relationship between variables. One
of methods for estimating the parameters in model analysis is ordinary least
square (OLS). If there are outliers, OLS is not efficient again so the suitable
method for problems of outliers is robust regression method. Outlier is data that
inconsistent with the pattern and located away from the data center, can be
detected with interquatil and determine the leverage value, DfFITS and Cook’s
Distance. Least trimmed squares (LTS) is an estimating method of robust
regression that using a fitting concept of OLS to minimize the sum square error.
M estimator is a method to overcome the outliers and can use Welsch Type in
estimating the regression parameter. The purpose of this study is comparing two
methods of robust regression, those are LTS and M estimator Welsch Type to
overcome the problems of outlier. The conclutions of it are LTS is the best
method because it can overcome the outliers and give that least trimmed squared
have highest R2 from M estimation with Welsch type, with another hand least
trimmed square better from M estimation with Welsch type
Keywords : outliers,ordinary least square, robust regression, least trimmed
squares estimator, and M estimator.welsch type, interquartil range, boxplot.
Universitas Sumatera Utara
DAFTAR ISI
Halaman
Persetujuan
ii
Pernyataan
iii
Penghargaan
iv
Abstrak
vi
Abstract
vii
Daftar Isi
viii
Daftar Tabel
x
Daftar Gambar
xi
Daftar Lampiran
xiii
Bab 1 Pendahuluan
1
1.1 Latar Belakang
1
1.2 Rumusan Masalah
2
1.3 Tujuan Penelitian
3
1.4 Batasan Masalah
3
1.5 Kontribusi Penelitian
3
1.6 Tinjauan Pustaka
3
Bab 2 Landasan teori
7
2.1 Pengertian Regresi Linier
7
2.2 Pendeteksian Pencilan
8
2.3 Metode Kuadrat Terkecil
10
2.4 Regresi Robust dengan Metode Least Trimmed Square
11
2.5 Estimasi M Dengan fungsi objektif, fungsi pengaruh dan
fungsi pembobot Welsch
2.6 Koefisien Determinasi
12
13
Universitas Sumatera Utara
Bab 3 Pembahasan
15
3.1 Data
15
3.2 Pendeteksian Outlier
16
3.3 Metode Least Trimmed Square
20
3.3.1 Interpretasi dari persamaan dengan Least Trimmed
Square
26
3.4 Fungsi obyektif,fungsi pengaruh dan pembobot Welsch
26
3.4.1 Interpretasi dari persamaan dengan estimasi M type
Welsch
Bab 4 Kesimpulan dan Saran
40
42
4.1 Kesimpulan
42
4.2 Saran
42
Daftar Pustaka
44
Universitas Sumatera Utara
DAFTAR TABEL
Tabel 2.1 Type Regresi Robust dengan penduga
12
Tabel 3.1 Salinity Data
15
Tabel 3.2 Data Lagged Salinity
16
Tabel 3.3 Data Trend
17
Tabel 3.4 Data Discharge
17
Tabel 3.5 Data Salinity
18
Tabel 3.6 Tabel IQR
19
Tabel 3.7 Data pencilan
19
Tabel 3.8 Nilai Residual
20
Tabel 3.9 Kuadrat Residual
21
Tabel 3.10 Kuadrat Residual setelah diurutkan
22
Tabel 3.11 Data setelah diurutkan dari kuadrat terkecil
22
Tabel 3.12 Perkalian bnew pada iterasi 1
Tabel 3.13 Kuadrat Residual yang diurutkan dari yang terkecil
23
24
Tabel 3.14 Data berdasarkan Kuadrat Residual dari yang terkecil
25
Tabel 3.15 Estimasi parameter bnew
Tabel 3.16 NilaiResidual
Tabel 3.17 Pembobot awal
Tabel 3.18 Nilai Residual Iterasi 2
Tabel 3.19 Nilai pembobot Iterasi 2
Tabel 3.20 Nilai Residual iterasi 3
Tabel 3.21 Nilai pembobot iterasi 3
Tabel 3.22 Nilai Residual Iterasi 4
Tabel 3.23 Nilai pembobot iterasi 4
Tabel 3.24 Nilai β 0 , β 1 , β 2 , β 3 dengan iterasi
25
27
29
31
33
34
35
36
39
39
Universitas Sumatera Utara
DAFTAR GAMBAR
Halaman
Gambar 2.1 Skema Identifikasi Data Pencilan dengan IQR
Gambar 2.2 Kriteria Pengambilan Keputusan Adanya Pencilan
9
10
Universitas Sumatera Utara
Universitas Sumatera Utara
ii
PERSETUJUAN
Judul
Kategori
Nama
Nomor Induk Mahasiswa
Program Studi
Departemen
Fakultas
:PERBANDINGAN ANTARA ESTIMASI M DENGAN
TYPE WELSCH DENGAN LEAST TRIMMED SQUARE
DALAM REGRESI ROBUST UNTUK MENGATASI
ADANYA DATA PENCILAN
: SKRIPSI
: SABAM DAONI SINAMBELA
: 090803053
: SARJANA (S1) MATEMATIKA
: MATEMATIKA
: MATEMATIKA DAN ILMU PENGETAHUAN
ALAM (FMIPA) UNIVERSITAS SUMATERA
UTARA
Diluluskan di
Medan,
Komisi Pembimbing
Pembimbing 2
:
Drs.Henry Rani Sitepu M.Si.
NIP.19530303 198303 1 002
Pembimbing 1
Drs.Suwarno Ariswoyo M.Si.
NIP. 19500312 198003 1 001
Diketahui/Disetujui oleh
Departemen Matematika FMIPA USU
Ketua,
Prof. Dr. Tulus, M.Si
NIP. 196209011988031 002
Universitas Sumatera Utara
PERNYATAAN
PERBANBINGAN ANTARA ESTIMASI M TYPE WELSCH DENGAN
LEAST TRIMMED SQUARE DALAM REGRESI ROBUST UNTUK
MENGATASI ADANYA DATA PENCILAN
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa
kutipan dan ringkasan yang masing-masing disebutkan sumbernya
Medan,
SABAM DAONI SINAMBELA
090803053
Universitas Sumatera Utara
PENGHARGAAN
Puji dan syukur kepada Tuhan Yang Maha Esa yang telah senantiasa memberikan
berkatNya sehingga penulis dapat menyelesaikan penyusunan skripsi yang
berjudul Perbandingan antara estimasi M dengan Type Welsch dengan Least
Trimmed Square untuk mengatasi adanya data pencilan ini dengan baik dan
lancar.
Penulisan skripsi ini dapat terselesaikan berkat bantuan banyak pihak.
Oleh karena itu, dalam kesempatan ini penulis ingin mengucapkan terima kasih
sebanyak-banyaknya kepada:
1. Bapak Drs. Suwarno Ariswoyo, M.Si dan Bapak Drs. Henry Rani Sitepu,
M.Si selaku Dosen Pembimbing yang selalu memotivasi dan membimbing
penulis dalam menyelesaikan skripsi ini.
2. Bapak Drs. Open Darnius, M.Sc dan Bapak Drs. Gim Tarigan, M.Si selaku
Dosen Penguji yang telah memberikan kritik dan saran yang membangun
terhadap skripsi ini.
3. Bapak Prof. Dr.Tulus.Vordipl.Math.,M.Si.,Ph.D dan Ibu Dra.
Mardiningsih, M.Si sebagai Ketua dan Sekretaris Departemen Matematika
FMIPA USU.
4. Dr. Sutarman, M.Sc sebagai Dekan Fakultas Matematika dan Ilmu
Pengetahuan Alam Universitas Sumatera Utara.
5. Yang teristimewa kepada nenek dan ibu tercinta yaitu L.Simanungkalit
dan Ibu P.Pasaribu serta keluarga dekat tersayang yang senantiasa
memberikan doa dan motivasi bagi penulis sehingga penulis selalu
bersemangat.
6. PEMDA Tapanuli Utara dan Inang Boru Tobing yang senantiasa
memberikan motivasi kepada saya dan juga dana yang telah diberikan
7. Para sahabat dan teman-teman saya yaitu Andos Niky Sembiring,Bernat
Silaban,Hariady Turnip, Ridores Regar, dan teman-teman lainnya yang
tidak dapat penulis sebutkan satu per satu, serta Kak Rolina yang selalu
memberikan semangat dan bantuan kepada penulis.
Universitas Sumatera Utara
8. Teman-teman di Ulun Jundy Camp yang telah memberikan motivasi
kepada saya dalam menyelesaikan skripsi saya.
Penulis berharap semoga Tuhan Yang Maha Esa membalas kebaikan dari semua
pihak yang telah banyak membantu dan memotivasi penulis dalam menyelesaikan
skripsi ini. Penulis menyadari bahwa penulisan skripsi ini masih memiliki
kekurangan dan ketidaksempurnaan. Untuk itu, kritik dan saran yang membangun
dari berbagai pihak sangat diharapkan. Penulis berharap semoga skripsi ini dapat
bermanfaat dan akhir kata penulis ucapkan terima kasih.
Medan,
Penulis
SABAM DAONI SINAMBELA
090803053
Universitas Sumatera Utara
ABSTRAK
Analisis regresi digunakan untuk mengetahui hubungan antara variabel bebas dan
variabel terikat. Salah satu metode penaksir parameter dalam model analisis
regresi yaitu metode kuadrat terkecil (OLS). Jika terdapat pencilan, metode OLS
tidak lagi efisien sehingga metode yang cocok untuk permasalahan pencilan yaitu
metode regresi robust. Pencilan adalah data yang tidak mengikuti sebagian besar
pola dan terletak jauh dari pusat data, dapat dideteksi dengan metode boxplot
(Interquartil Range)dan menentukan nilai Leverage, DfFITS dan Cook’s Distance.
Least trimmed squares (LTS) yaitu metode penaksiran parameter regresi robust
yang menggunakan konsep pemangkasan OLS untuk meminimumkan jumlah
kuadrat residual. Penaksir M yaitu metode dalam mengatasi pencilan dan dapat
menggunakan fungsi Welsch dalam mengestimasi parameter regresi. Tujuan
penelitian ini yaitu membandingkan dua metode regresi robust yakni penaksir
LTS dan penaksir M Type Welsch dalam mengatasi permasalahan data pencilan.
Hasil penelitian yang diperoleh yaitu penaksir LTS merupakan metode paling baik
karena mampu mengatasi pencilan dan diperoleh bahwa least trimmed squares
memiliki nilai R2 yang paling tinggi dari penaksir M type Welsch, dengan kata
lain penaksir least trimmes square lebih bagus dari penaksir M type Welsch
Kata kunci : pencilan, metode kuadrat terkecil, regresi robust, penaksir least
trimmed squares, dan penaksir M type Welsch,interquartil range,boxplot
Universitas Sumatera Utara
The Studi Comparing of M Estimator Welsch Type with Least Trimmed
Squares Estimator in Robust Regresion to Overcome the Outlier data
ABSTRACT
Regression analysis is used to determine the relationship between variables. One
of methods for estimating the parameters in model analysis is ordinary least
square (OLS). If there are outliers, OLS is not efficient again so the suitable
method for problems of outliers is robust regression method. Outlier is data that
inconsistent with the pattern and located away from the data center, can be
detected with interquatil and determine the leverage value, DfFITS and Cook’s
Distance. Least trimmed squares (LTS) is an estimating method of robust
regression that using a fitting concept of OLS to minimize the sum square error.
M estimator is a method to overcome the outliers and can use Welsch Type in
estimating the regression parameter. The purpose of this study is comparing two
methods of robust regression, those are LTS and M estimator Welsch Type to
overcome the problems of outlier. The conclutions of it are LTS is the best
method because it can overcome the outliers and give that least trimmed squared
have highest R2 from M estimation with Welsch type, with another hand least
trimmed square better from M estimation with Welsch type
Keywords : outliers,ordinary least square, robust regression, least trimmed
squares estimator, and M estimator.welsch type, interquartil range, boxplot.
Universitas Sumatera Utara
DAFTAR ISI
Halaman
Persetujuan
ii
Pernyataan
iii
Penghargaan
iv
Abstrak
vi
Abstract
vii
Daftar Isi
viii
Daftar Tabel
x
Daftar Gambar
xi
Daftar Lampiran
xiii
Bab 1 Pendahuluan
1
1.1 Latar Belakang
1
1.2 Rumusan Masalah
2
1.3 Tujuan Penelitian
3
1.4 Batasan Masalah
3
1.5 Kontribusi Penelitian
3
1.6 Tinjauan Pustaka
3
Bab 2 Landasan teori
7
2.1 Pengertian Regresi Linier
7
2.2 Pendeteksian Pencilan
8
2.3 Metode Kuadrat Terkecil
10
2.4 Regresi Robust dengan Metode Least Trimmed Square
11
2.5 Estimasi M Dengan fungsi objektif, fungsi pengaruh dan
fungsi pembobot Welsch
2.6 Koefisien Determinasi
12
13
Universitas Sumatera Utara
Bab 3 Pembahasan
15
3.1 Data
15
3.2 Pendeteksian Outlier
16
3.3 Metode Least Trimmed Square
20
3.3.1 Interpretasi dari persamaan dengan Least Trimmed
Square
26
3.4 Fungsi obyektif,fungsi pengaruh dan pembobot Welsch
26
3.4.1 Interpretasi dari persamaan dengan estimasi M type
Welsch
Bab 4 Kesimpulan dan Saran
40
42
4.1 Kesimpulan
42
4.2 Saran
42
Daftar Pustaka
44
Universitas Sumatera Utara
DAFTAR TABEL
Tabel 2.1 Type Regresi Robust dengan penduga
12
Tabel 3.1 Salinity Data
15
Tabel 3.2 Data Lagged Salinity
16
Tabel 3.3 Data Trend
17
Tabel 3.4 Data Discharge
17
Tabel 3.5 Data Salinity
18
Tabel 3.6 Tabel IQR
19
Tabel 3.7 Data pencilan
19
Tabel 3.8 Nilai Residual
20
Tabel 3.9 Kuadrat Residual
21
Tabel 3.10 Kuadrat Residual setelah diurutkan
22
Tabel 3.11 Data setelah diurutkan dari kuadrat terkecil
22
Tabel 3.12 Perkalian bnew pada iterasi 1
Tabel 3.13 Kuadrat Residual yang diurutkan dari yang terkecil
23
24
Tabel 3.14 Data berdasarkan Kuadrat Residual dari yang terkecil
25
Tabel 3.15 Estimasi parameter bnew
Tabel 3.16 NilaiResidual
Tabel 3.17 Pembobot awal
Tabel 3.18 Nilai Residual Iterasi 2
Tabel 3.19 Nilai pembobot Iterasi 2
Tabel 3.20 Nilai Residual iterasi 3
Tabel 3.21 Nilai pembobot iterasi 3
Tabel 3.22 Nilai Residual Iterasi 4
Tabel 3.23 Nilai pembobot iterasi 4
Tabel 3.24 Nilai β 0 , β 1 , β 2 , β 3 dengan iterasi
25
27
29
31
33
34
35
36
39
39
Universitas Sumatera Utara
DAFTAR GAMBAR
Halaman
Gambar 2.1 Skema Identifikasi Data Pencilan dengan IQR
Gambar 2.2 Kriteria Pengambilan Keputusan Adanya Pencilan
9
10
Universitas Sumatera Utara