Metode Regresi Least Trimmed Squares pada Data yang Mengandung Pencilan Nama

viii

METODE REGRESI LEAST TRIMMED SQUARES
PADA DATA YANG MENGANDUNG PENCILAN

ANNI FITHRIYATUL MAS’UDAH

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2012

ix

RINGKASAN
ANNI FITHRIYATUL MAS’UDAH. Metode Regresi Least Trimmed Squares pada Data yang
Mengandung Pencilan. Dibimbing oleh ANANG KURNIA dan DIAN KUSUMANINGRUM.
Regresi merupakan metode statistika yang digunakan untuk menduga pola hubungan antara
dua atau lebih peubah. Metode pendugaan parameter yang umum digunakan dalam analisis regresi
linier adalah metode kuadrat terkecil atau Ordinary Least Squares (OLS), namun metode ini tidak

baik digunakan apabila data pada peubah respon mengandung pencilan. Adanya pencilan akan
mengakibatkan pendugaan parameter yang dihasilkan bersifat bias dan interpretasi kesimpulan
tidak valid. Pada kasus terdapatnya pencilan, alternatif metode yang dapat digunakan adalah
regresi kekar. Pada penelitian ini metode yang digunakan adalah Least Trimmed Squares (LTS)
dengan dua kriteria pemangkasan yang berbeda (LTS dan LTS1). LTS melalukan pemangkasan
berdasarkan teori Rousseeuw dan Van Driessen, sedangkan LTS1 merupakan aplikasi
pemangkasan yang dilakukan pada mutlak sisaan baku lebih dari dua. Untuk mengetahui tingkat
kekekaran metode LTS dan LTS1 dibandingkan dengan OLS dilakukan kajian simulasi dan
penerapan data riil. Simulasi dilakukan untuk ukuran contoh yang berbeda (15, 30, 100, dan 200)
dan tingkat persentase pencilan yang berbeda (0%, 5%, 10%, 15%, dan 20) dengan ulangan
sebanyak 1000 kali pada masing-masing kombinasi ukuran contoh dan persentase pencilan,
sedangkan data riil memiliki ukuran contoh 35 dan pencilan delapan persen. Hasil yang didapatkan
dari simulasi dan data riil metode LTS lebih baik dibandingkan metode OLS dan LTS 1 dalam
menduga parameter regresi. LTS memiliki nilai bias relatif, bias relatif mutlak, KTG relatif, dan
KTG yang relatif konstan dan kekar untuk berbagai kondisi pencilan dan ukuran contoh.
Kata kunci : Regresi, pencilan, metode kekar.

x

METODE REGRESI LEAST TRIMMED SQUARES

PADA DATA YANG MENGANDUNG PENCILAN

ANNI FITHRIYATUL MAS’UDAH

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika pada
Departemen Statistika

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2012

xi

Judul Skripsi
Nama
NIM


: Metode Regresi Least Trimmed Squares pada Data yang Mengandung Pencilan
: Anni Fithriyatul Mas’udah
: G14080044

Menyetujui,
Pembimbing I

Pembimbing II

Dr. Anang Kurnia
NIP. 19730824 199702 1 001

Dian Kusumaningrum, M.Si

Mengetahui,
Ketua Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor


Dr. Ir. Hari Wijayanto M.Si.
NIP. 19650421 199002 1 001

Tanggal Lulus :

xii

PRAKATA
Puji syukur kehadirat Allah SWT atas berkat, rahmat dan hidayah-Nya serta sholawat serta
salam semoga tetap terlimpahkan pada Rosululloh SAW, sehingga penulis dapat menyelesaikan
skripsi dengan judul “METODE REGRESI LEAST TRIMMED SQUARES PADA DATA
YANG MENGANDUNG PENCILAN”.
Penulis telah dibantu oleh banyak pihak dalam penyusunan skripsi ini, oleh karena itu penulis
ingin menyampaikan terimakasih kepada :
1.

Bapak Dr. Anang Kurnia dan Ibu Dian Kusumaningrum, M.Si selaku dosen pembimbing atas
bimbingan dan arahan selama penyusunan karya ilmiah.

2.


Ibu Dr. Ir. Indahwati, M.Si selaku dosen penguji luar yang telah memberikan masukan dan
arahan kepada penulis.

3.

Seluruh Dosen Departemen Statistika yang telah memberikan ilmu dan wawasan selama
penulis menuntut ilmu di Departemen Statistika serta seluruh staf Departemen Statistika yang
telah banyak membantu penulis.

4.

Kedua orang tuaku Bapak Drs. H. Moch Djahid, M.A, Ibu Hj.Siti Munawaroh, S.PdI serta
mas Noor Faiz Hidayatulloh dan mbak Riza Hanif Farida yang telah memberikan do’a, kasih
sayang, semangat dan dukungan you are my life and my inspiration.

5.

Muhtadin Amri thanks for support and everything, always wish all the best for us.


6.

Sartika Lestari, Rizki Fadhilah, dan Mia Amelia yang telah memberikan dukungan selama
penulis menyelesaikan karya ilmiah ini.

7.

Anita Pratiwi dan Nuril Anwar selaku teman satu bimbingan yang telah berjuang bersama
dalam menyelesaikan karya ilmiah ini.

8.

Teman-teman statistika 45 atas bantuan, dukungan dan kebersamaan yang diberikan.

9.

Teman-teman kost SQ (Fitra, Orin, Ia, Nia, Hana, Lina, Fida, Upe, K’Dayu, K’Septi, Hana
dongse, Mita dan Nurul) terimakasih atas semangat dan dukungannya.

10. Teman-teman omda Manggolo Putro atas kebersamaan dan semangat yang diberikan.

11. Seluruh pihak yang telah membantu dalam penulisan skripsi.
Akhirnya penulis berharap semoga skripsi ini dapat memberikan kotribusi yang nyata bagi para
pembaca dan ilmu pengetahuan.

Bogor, September 2012

Anni Fithriyatul Mas’udah

xiii

RIWAYAT HIDUP
Penulis dilahirkan di Ponorogo pada tanggal 15 April 1990 sebagai anak bungsu dari pasangan
Drs. H. Moch Djahid, M.A. dan Hj. St. Munawaroh, S.PdI. Jenjang perguruan tinggi penulis
dimulai pada tahun 2008 dengan diterimanya penulis di Institut Pertanian Bogor melalui jalur
Undangan Seleksi Masuk IPB (USMI) dan memilih Mayor Statistika di Departemen Statistika,
Fakultas Matematika dan Ilmu Pengetahuan Alam pada tahun 2009. Sebelum masuk perguruan
tinggi, penulis telah berhasil menyelesaikan pendidikan di SMAN 1 Ponorogo, SMPN 1 Jetis, dan
SDN 1 Wonoketro. Selama mengikuti perkuliahan, penulis aktif dalam Himpunan Keprofesian
Gamma Sigma Beta sebagai staf Beta Club 2009, staf Department of Human Resource and
Development pada periode 2011. Penulis juga pernah menjadi asisten praktikum Metode Statistika

2010. Pada tahun 2012 penulis mengikuti kegiatan praktik lapang di Badan Karantina Ikan
Pengendalian Mutu dan Keamanan Hasil Perikanan, Kementrian Kelautan dan Perikanan Republik
Indonesia.

xiv

DAFTAR ISI
Halaman
DAFTAR TABEL……………………………………………………………………….....

viii

DAFTAR GAMBAR……………………………………………………………………....

viii

DAFTAR LAMPIRAN………………………………………………………………….....

viii


PENDAHULUAN……………………………………………………………………….....
Latar Belakang……………………………………………………………………....
Tujuan ……………………………………………………………………………....

1
1
1

TINJAUAN PUSTAKA…………………………………………………………………....
Regresi Linier Sederhana……………………………………………………….......
Pencilan…………………………………………………………………………......
Regresi Kekar…………………………………………………………………….....
Least Trimmed Square...........………………………………………………………..........
Model Based Simulation.............................................................................................

1
1
1
1
2

2

BAHAN DAN METODE………………………………………………………………......
Bahan……………………………………………………………………………......
Metode……………………………………………………………………………....

2
2
3

HASIL DAN PEMBAHASAN………………………………………………………….....
Kajian Simulasi………………………………………………………………..........
Penerapan Pada Data Riil.........................................……………………………......

3
3
5

KESIMPULAN ………………………………………………………………………….....


6

DAFTAR PUSTAKA……………………………………………………………………....

6

LAMPIRAN……………………………………………………………………………......

7

xv
viii

DAFTAR TABEL
1. Tabel data evaluasi pendugaan

dan

Halaman
…………….......................................................... 5

DAFTAR GAMBAR
Halaman
1. Karakteristik pendugaan nilai pada berbagai proporsi pencilan untuk n=100................. 4
2. Karakteristik pendugaan nilai pada berbagai proporsi pencilan untuk n=100................. 5
3. Diagram pencar antara ketinggian bukit dengan waktu yang diperlukan untuk
pendakian............................................................................................................................... 5

DAFTAR LAMPIRAN
1.
2.
3.
4.
5.
6.
7.

Halaman
Bagan prosedur simulasi....................................................................................................... 8
9
Tabel evaluasi pendugaan nilai pada berbagai proporsi pencilan..............................
10
Tabel evaluasi pendugaan nilai pada berbagai proporsi pencilan..............................
11
Grafik evaluasi pendugaan nilai pada berbagai proporsi pencilan...........................
13
Grafik evaluasi pendugaan nilai pada berbagai proporsi pencilan...........................
Output pada penerapan data riil............................................................................................. 15
Data kriteria pendugaan dan untuk keseluruhan data.................................................... 17

1

PENDAHULUAN

TINJAUAN PUSTAKA

Latar Belakang
Regresi merupakan suatu metode
statistika yang digunakan untuk menduga pola
hubungan antara dua peubah atau lebih. Pada
keadaan riil tidak menutup kemungkinan
bahwa peubah yang digunakan memiliki nilai
dengan pola yang berbeda dibandingkan
dengan pola umum lainnya. Keadaan tersebut
didefinisikan sebagai pencilan (Aunuddin
1989).
Menurut
Ryan
(1997)
pencilan
merupakan salah satu penyebab tidak
terpenuhinya salah satu asumsi regresi linier
dengan metode Ordinary Least Square (OLS)
yaitu homoskedastisitas. Pada OLS semua data
akan mendapatkan bobot yang sama. Namun
keberadaan pencilan akan mengakibatkan
pengamatan mengandung informasi yang lebih
dibandingkan yang lain, sehingga pengamatan
tersebut seharusnya mendapatkan bobot yang
lebih kecil dibandingkan pengamatan yang
lain.
Pencilan dapat teridentifikasi dengan
melihat besarnya sisaan yang dibakukan antara
peubah tak bebas dengan dugaannya. Apabila
nilai mutlak sisaan tersebut lebih dari dua
maka disebut pencilan. Keberadaan pencilan
mengakibatkan parameter yang dihasilkan
bersifat bias dan interpretasi kesimpulan tidak
valid sehingga dapat menimbulkan kesalahan
dalam
pengambilan
keputusan
dan
kesimpulan. Masalah tersebut dapat diatasi
dengan menggunakan alternatif pendugaan
yang bersifat kekar. Salah satu metodenya
adalah Least Trimmed Square (LTS) (Drapper
& Smith 1992).
LTS dan LTS1 merupakan suatu penduga
untuk menghasilkan dugaan yang kekar
terhadap pencilan dengan karakteristik
pemangkasan yang berbeda, sehingga relatif
tidak terpengaruh oleh perubahan karena
adanya pencilan yang terjadi. Untuk
mengetahui kekekaran metode LTS, LTS1, dan
OLS tersebut maka perlu dilakukan simulasi
terhadap data yang mengandung pencilan.
Selain menggunakan simulasi penelitian ini
juga menggunakan analisis terhadap data riil.

Regresi Linier Sederhana
Menurut Ryan (1997) regresi linier
sederhana adalah regresi yang memiliki satu
peubah bebas dan memiliki parameter model
yang linier. Model regresinya adalah :

Tujuan
Tujuan penelitian ini adalah untuk
mengevaluasi kekekaran metode Least
Trimmed Squares dalam menduga parameter
regresi pada berbagai proporsi pencilan dan
berbagai ukuran contoh.

atau
dengan :
dan
: parameter regresi
: sisaan
: peubah respon
: peubah bebas.
Pada dasarnya rancangan ini menggunakan
metode OLS yang digunakan untuk menduga
dan
dengan cara meminimumkan
jumlah
kuadrat
sisaan
(
):

.
Pada analisis regresi linier sederhana untuk
mendapatkan penduga parameter yang baik
maka sisaan harus memenuhi asumsi GaussMarkov, yaitu :
1.
(nilai harapan/rataan
sisaan sama dengan nol)
2.
(ragam sisaan homogen
untuk setiap nilai x)
3.
( dan saling
bebas).
Selain itu sisaan juga merupakan peubah acak
yang menyebar normal dengan rataan nol dan
ragam .
Pencilan
Pencilan merupakan nilai ekstrim dari
suatu pengamatan. Salah satu cara yang dapat
digunakan untuk mengidentifikasi pencilan
adalah dengan melihat sisaan yang dibakukan
yaitu :

dengan :
i
: pengamatan ke-i
: sisaan yang dibakukan ke-i
: sisaan ke-i
KTG
: ragam sisaan.
Suatu amatan dikatakan pencilan apabila nilai
mutlak sisaan yang telah dibakukan lebih dari
dua (Draper & Smith 1992). Keberadaan data
pencilan akan mengganggu dalam proses
analisis data sehingga perlu dilakukan
penanganan. Salah satu cara yang digunakan
untuk menangani pencilan adalah dengan
metode LTS.

2

Regresi Kekar Least Trimmed Squares
Regresi kekar diperkenalkan oleh Andrews
pada tahun 1972. Regresi kekar merupakan
metode regresi yang digunakan ketika
distribusi dari sisaan tidak normal dan atau
adanya beberapa pencilan yang berpengaruh
pada model (Ryan 1997). Metode kekar
merupakan metode yang dapat menghasilkan
model yang relatif tidak terpengaruh oleh
adanya pencilan. Menurut Rousseeuw dan
Leroy
(1987)
dengan
menggunakan
pendekatan regresi kekar maka adanya
pencilan tidak akan mempengaruhi pendugaan
parameter.
Metode LTS merupakan salah satu model
regresi kekar dengan adanya pencilan.
Metode ini akan memangkas (memberi bobot
nol) pada sisaan yang terbesar pada saat
meminimumkan jumlah kuadrat sisaan.
Metode ini menduga koefisien regresi dengan
meminimumkan jumlah h kuadrat sisaan
(fungsi objektif) :

dengan
dimana :
: Kuadrat sisaan yang diurutkan dari
kecil ke terbesar
n
: banyaknya pengamatan
p
: banyaknya parameter regresi
h
: subset data dengan yang diambil.
Penentuan
subhimpunan
h
terbaik
dilakukan dengan menggunakan algoritma
FAST-Minimum Covariance Determinant
(MCD) (Rousseeuw & Van Driessen 1999).
Adapun algoritma tersebut sebagai berikut :
a. Ambil sejumlah h pengamatan dari subset
data
yang berbeda. Dari n
pengamatan
akan
dihasilkan
himpunan baru. Nilai h yang optimal
memenuhi (n + p + 1)/2.
b. Definisikan himpunan pertama sebagai
H1. Berdasarkan himpunan H1 hitung
vektor rata-rata dan matrik ragam
peragam
. Selanjutnya hitung
det(S1).
c. Definisikan
himpunan
kedua
H2.
Berdasarkan himpunan H2 hitung vektor
rata-rata dan matrik ragam peragam
. Selanjutnya hitung det(S2).
d. Bandingkan det(S2) dengan det(S1). Bila
det(S2) ≠ det(S1) simpan yang mempunyai
nilai terkecil, ulangi langkah untuk
himpunan Hnew. Berdasarkan himpunan
Hnew hitung vektor rata-rata dan matrik
ragam peragam
, selanjutnya

e.

f.

g.

hitung det(Snew) berikutnya sampai
dipenuhi kondisi det(Sm+1) = det(Sm).
Tetapkan anggota himpunan Hm sebagai
himpunan dengan determinan matrik
ragam peragam terkecil.
Berdasarkan Hm data selanjutnya diberi
bobot.

Meregresikan Hm pengamatan
mendapatkan bobot satu.

yang

Selain LTS yang dikembangkan oleh
Rousseeuw dan Van Drisen dengan
pemangkasan pada h akan dilakukan
pendugaan parameter LTS1. Pemangkasan
LTS1 dilakukan pada nilai mutlak r i (sisaan
yang dibakukan) lebih dari dua.
Model Based Simulation
Model Based Simulation merupakan suatu
metode simulasi yang dilakukan dengan
menentukan model terlebih dahulu. Model
ditetapkan dengan parameter tetap pada setiap
ulangan.
Pada
setiap ulangan
akan
menghasilkan populasi yang berbeda dengan
parameter yang tetap (Stinstra 2006).
BAHAN DAN METODE
Bahan
Data yang digunakan adalah data hasil
simulasi dengan parameter regresi ( dan )
yang telah ditentukan. Data simulasi yang
dibangkitkan terdiri dari satu peubah bebas
dan sisaan yang kemudian digunakan untuk
mencari peubah responnya. Peubah bebas
dibangkitkan dari sebaran normal dengan nilai
harapan
dan ragam
sebanyak 1000.
Sisaan yang dibangkitkan terdiri dari dua
bagian yaitu sisaan untuk pencilan dan bukan
pencilan. Kedua sisaan dibangkitkan dari
sebaran normal dengan proporsi 200 untuk
data pencilan dan 800 untuk data bukan
pencilan. Simulasi dilakukan menggunakan
software R dengan paket robustbase.
Selain simulasi dilakukan evaluasi
pendugaan parameter regresi pada data riil
yang diperoleh dari Chatterjee & Hadi (2006)
halaman 112 tentang data hubungan jarak
ketinggian bukit dengan waktu yang
diperlukan untuk pendakian.

3

dan KTG terkecil, dengan rumus sebagai
berikut :

Metode
Simulasi
Prosedur simulasi yang dilakukan adalah
menggunakan Model Based Simulation dengan
algoritma sebagai berikut (bagan dapat dilihat
di Lampiran 1):
1. Tetapkan
dan ( =10 dan =2).
2.
3.

4.
5.

6.
7.

Bangkitkan
1000 dengan
Bangkitkan
untuk :

sebanyak
=5 dan
=1.
yang bersesuaian dengan

Tentukan nilai
.
Dari data bangkitan yang diperoleh,
diambil contoh acak berukuran n=15, 30,
100, dan 200 dengan masing-masing
proporsi pencilan 0%, 5%, 10%, 15%,
dan 20%.
Eksplorasi data untuk melihat banyaknya
pencilan dengan diagram pencar.
Meregresikan semua gugus data dengan
menggunakan OLS, LTS, dan LTS1
Adapun langkah LTS seperti pada
Tinjauan Pustaka, sedangkan LTS1 dapat
diperoleh dari algoritma dibawah ini :
a. Mengitung penduga parameter bawal
dengan OLS.
b. Menghitung n residual (
yang
bersesuaian dengan bawal.
*
c. Menentukan t residual (
untuk

d.
e.

Hitung
.
Menghitung pendugaan bnew dari
pengamatan
yang
bersesuaian
dengan
.
f. Menghitung t residual
yang
bersesuaian dengan bnew .
.
g. Hitung
2
8. Simpan nilai bo, b1, R , JKG dan KTG dari
tiap gugus data.
9. Ulangi langkah 1-8 sebanyak 1000 kali.
10. Menentukan bias relatif, bias relatif
mutlak, KTG relatif, dan KTG dari
kombinasi n dan proporsi pencilan yang
berbeda.
11. Menentukan metode yang menghasilkan
dugaan paling baik berdasarkan nilai bias
relatif, bias relatif mutlak, KTG relatif,

Bias relatif =

x 100%

Bias relatif mutlak =
KTG relatif =

x 100%
x 100%

KTG =
Keterangan :
: dugaan parameter
: Parameter
: banyaknya ulangan.
Penerapan Pada Data Riil
Tahapan yang dilakukan dalam penelitian
untuk contoh aplikasi adalah :
1. Eksplorasi data.
2. Menduga parameter menggunakan
OLS.
3. Menduga
parameter
dengan
menggunakan LTS dan LTS1.
HASIL DAN PEMBAHASAN
Kajian Simulasi
Pencilan yang digunakan dalam simulasi
ini ditentukan sebesar 0%, 5%, 10%, 15%, dan
20%. Metode pendugaan parameter regresi
yang digunakan adalah OLS, LTS, dan LTS1
yang masing-masing mempunyai kriteria
tersendiri untuk menghasilkan pendugaan
yang kekar terhadap pencilan. Evaluasi
penentuan metode yang terbaik adalah
menggunakan bias relatif, bias relatif mutlak,
KTG relatif, dan KTG.
Pendugaan Parameter
Berdasarkan nilai bias relatif, bias relatif
mutlak, KTG relatif, dan KTG pada ukuran
contoh 15 dan proporsi pencilan 0% OLS
merupakan penduga yang terbaik karena
memiliki nilai paling rendah dibandingkan
penduga lainnya. Ketika persentase pencilan
lebih dari 0% sampai 5% terlihat bahwa
pendugaan parameter dengan menggunakan
metode LTS1 memiliki nilai yang paling
mendekati nol, artinya pada ukuran contoh dan
persentase pencilan tersebut metode LTS1
merupakan penduga terbaik karena nilai
dugaannya hampir sama dengan nilai
parameternya. Hal ini dapat dilihat pada
Lampiran 4.

50
0
0%
-50

5%

10% 15% 20%

persentase pencilan
OLS
LTS
LTS1
(i)

1.0

100
50
0
0%

5% 10% 15% 20%
persentase pencilan
OLS
LTS
LTS1
(ii)

0%

5% 10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

100
KTG b0

KTG relatif b0

abs bias relatif b0

bias relatif b0

4

0.5

50
0

0.0
0%

5% 10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

(iv)

(iii)
Gambar 1 Karakteristik pendugaan nilai

pada berbagai proporsi pencilan untuk n=100

Apabila persentase pencilan lebih besar
dari 5% metode LTS memiliki nilai bias
relatif, bias relatif mutlak, KTG relatif, dan
KTG yang stabil yaitu selalu mendekati nilai
nol atau konsisten pada nilai nol, artinya nilai
biasnya kecil atau nilai dugaannya mendekati
nilai parameternya. Pada ukuran data 30, jika
dilihat dari nilai bias relatif, bias relatif
mutlak, KTG relatif, dan KTG, LTS dan LTS1
memiliki nilai yang hampir sama pada
persentase pencilan 0% sampai 15%.
Sedangkan untuk persentase pencilan lebih
dari 15% grafik LTS1 cenderung naik. Namun
untuk metode LTS lebih konstan pada nilai
mendekati nol (Lampiran 4).
Berdasarkan nilai bias relatif, bias relatif
mutlak, KTG relatif, dan KTG pada ukuran
data 100 dengan banyaknya pencilan 0%,
sampai 15% nilainya hampir sama dengan
ukuran contoh 30 yaitu metode LTS dan LTS1
memiliki nilai hampir sama, hal ini dapat
dilihat pada garisnya yang saling berhimpit
(Lampiran 4). Pada ukuran data ini metode
LTS tetap menunjukkan kestabilannya dengan
garis yang lurus pada daerah yang mendekati
nol. Tidak jauh berbeda dengan ukuran contoh
100,
pada ukuran contoh 200 dengan
persentase pencilan 0%, 5%, 10%, dan 15%
metode LTS memiliki nilai bias relatif, bias
relatif mutlak, KTG relatif, dan KTG terkecil
yaitu hampir sama dengan metode LTS1.
Sedangkan pada persentase pencilan lebih dari
15% metode LTS lebih baik dibandingkan
OLS dan LTS1. Hal tersebut ditunjukkan oleh

garis merah yang selalu berada pada selalu
konstan pada nilai nol (Lampiran 4).
Apabila dilihat secara keseluruhan untuk
penduga parameter
, LTS memiliki nilai
bias yang relatif stabil dibandingkan dengan
LTS1, sehingga metode LTS lebih kekar
terhadap pencilan. Hal tersebut tidak terjadi
pada ukuran data yang relatif rendah (15)
cenderung memiliki pola yang berbeda
dibandingkan ukuran contoh yang lainnya
yaitu cenderung lebih tidak stabil.
Penduga Parameter
Pada pendugaan parameter
dengan
ukuran contoh 15 dan persentase pencilan 0%
sampai 5% dihasilkan nilai bias relatif, bias
relatif mutlak, KTG relatif, dan KTG dari
masing-masing persentase pencilan relatif
sama untuk LTS dan LTS1. Namun, jika
persentase pencilan lebih dari 5% maka nilai
evaluasi tersebut menunjukkan perbedaan,
yaitu angka terendah dihasilkan oleh metode
LTS.
Berbeda dengan jumlah pengamatan 15,
pada ukuran contoh 30 nilai bias relatif dan
bias relatif mutlak untuk persentase pencilan
0% sampai 10% LTS1 memiliki nilai yang
lebih rendah dibandingkan LTS dan OLS. Hal
ini menunjukkan bahwa pada kombinasi
ukuran contoh dan persentase pencilan
tersebut metode LTS1 merupakan metode
terbaik.
Hal
tersebut
terlihat
pada

5

100
abs bias relatif b1

bias relatif b1

5

0
0%

10%

15%

20%

persentase pencilan
OLS
LTS
LTS1
(i)

1.0

0
0%

5% 10% 15% 20%
persentase pencilan
OLS
LTS
LTS1
(ii)

4
KTG b1

KTG relatif b1

-5

5%

50

0.5
0.0

2
0

0%

5% 10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

0%

5% 10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

(iii)
Gambar 2 Karakteristik pendugaan nilai

(iv)
pada berbagai proporsi pencilan untuk n=100

grafik Lampiran 5, namun pada persentase
pencilan lebih besar dari 15% nilai bias LTS1
naik di atas nilai LTS sehingga LTS
merupakan metode yang terbaik.
Pada grafik ukuran contoh 100 pada
Lampiran 5 nilai bias relatif mutlak, KTG
relatif, dan KTG metode LTS1 cenderung
berada dibawah LTS pada persentase pencilan
0% sampai 10%. Namun, pada persentase
pencilan lebih dari 10% metode LTS1
cenderung naik dan berada di atas LTS.
Sedangkan metode LTS lebih konsisten pada
nilai yang mendekati nol, artinya nilai biasnya
kecil atau nilai dugaannya mendekati nilai
parameternya, sehingga pada kombinasi
ukuran contoh dan pencilan tersebut metode
LTS merupakan metode yang terbaik. Pada
Lampiran 5 menunjukkan bahwa nilai bias
relatif LTS cenderung memiliki nilai lebih
besar dari LTS1 untuk ukuran data 200.
Namun, untuk bias relatif mutlak, KTG relatif,
dan KTG konstan hampir sama dengan LTS1.
Apabila dilihat secara keseluruhan untuk
penduga parameter
, LTS memiliki nilai
bias yang relatif stabil dibandingkan dengan
LTS1, sehingga metode LTS lebih kekar
terhadap pencilan. Pada pendugaan parameter
untuk ukuran contoh yang relatif rendah
(15) cenderung memiliki pola yang tidak
stabil, artinya LTS merupakan pendugaan
parameter regresi yang baik pada ukuran data
yang relatif besar.
Sesuai dengan teori LTS, pada pendugaan
parameter
dan
untuk perubahan
persentase pencilan terutama pada ukuran
contoh lebih besar dari 30 bias akan
menghasilkan pola yang relatif sama. Semakin

besar
persentase
pencilan,
apabila
menggunakan metode OLS maka bias yang
dihasilkan akan semakin besar. Pada ukuran
contoh 200 dan persentase pencilan lebih besar
dari 5% maka bias relatif mutlak dari dan
yang dihasilkan masing-masing lebih besar
dari 10%. Apabila ukuran contoh kurang dari
200 maka nilai bias relatif mutlak akan
semakin besar. Hal tersebut dapat dilihat pada
Lampiran 2 dan Lampiran 3. Dengan demikian
metode OLS tidak efektif untuk menduga
parameter dengan data yang mengandung
pencilan.
Penerapan Pada Data Riil
Data yang digunakan dalam contoh
penerapan data riil ini adalah waktu yang
dibutuhkan dalam pendakian (y) dengan
ketinggian dari suatu bukit (x) pada 35 bukit
dan pencilan sebesar delapan persen. Peubah
pendukung yang digunakan ini diasumsikan
mempunyai hubungan. Tahap pertama yang
dilakukan adalah melakukan eksplorasi antara
peubah bebas dan peubah responnya.
Pada eksplorasi data menggunakan
diagram pencar dapat dilihat bahwa garis OLS
dan LTS1 berada di sebelah kiri LTS. Hal ini
dikarenakan keberadaan pencilan pada OLS
dan LTS1 yang berada di sebelah kiri menarik
garis OLS dan LTS1 tersebut ke kiri. LTS
berbeda dengan OLS dan LTS1, garisnya
cenderung berada di sebelah kanan karena
tidak terpengaruh adanya pencilan-pencilan
yang ada di sebelah kiri. Eksplorasi tersebut
dapat menggambarkan kekekaran metode LTS
dibandingkan OLS dan LTS1.

6

KESIMPULAN

14000

12000

10000

8000

6000

4000

2000

0
0

5

10

15
X-Data

20

25

30

Gambar 3 Diagram pencar antara ketinggian
bukit
dengan
waktu
yang
diperlukan untuk pendakian.
Pada Tabel 1 dapat dilihat bahwa nilai
koefisien regresi yang didapatkan dari 3
metode (OLS, LTS, dan LTS1) nilainya
menunjukkan perbedaan yang tidak terlalu
besar. Apabila dilihat dari nilai simpangan
baku untuk penduga ,
, JKG, KTG, dan
nilai R2(adj) menunjukkan perbedaan yang
besar. LTS memiliki nilai simpangan baku
untuk penduga ,
, JKG, dan KTG yang
lebih kecil dibandingkan dengan OLS dan
LTS1. Disisi lain LTS juga memiliki nilai R2
(adj) yang paling mendekati satu, hal ini
menunjukkan bahwa dengan menggunakan
model dengan metode LTS akan dapat
menerangkan keragaman data sebesar 99.4%.
Berdasarkan kelima kriteria nilai tersebut
metode LTS merupakan metode yang baik
digunakan jika data tersebut mengandung
pencilan.
Tabel 1 Data Evaluasi Pendugaan dan .
kriteria
OLS
LTS*
LTS1*
b0
-290.40
-300.13
-348.70
b1
499.83
427.23
474.64
Sb0
345.38
68.81
181.30
Sb1
37.17
7.57
19.83
JKG
4.7x107
5.7x105
1.1x107
KTG
1.4x106
3.4x104
3.7x104
2
R (adj)
84.1%
99.4%
94.8%
*Dihitung berdasarkan pada data yang
digunakan untuk penentuan dan
Berdasarkan data kriteria pendugaan
dan
aplikasi yang didapatkan sejalan
dengan hasil simulasi yang telah dilakukan.
LTS merupakan metode yang lebih kekar
dalam menduga kasus regresi untuk data yang
mengandung pencilan.

Metode LTS lebih baik dibandingkan
metode OLS dan LTS1 dalam menduga
parameter regresi pada data yang mengandung
pencilan. Kajian simulasi menunjukkan bahwa
nilai bias relatif, bias relatif mutlak, KTG
relatif, dan KTG metode LTS menghasilkan
nilai yang lebih konstan untuk kombinasi
pencilan dan ukuran contoh yang besar. Pada
aplikasi
data
yang
digunakan
juga
menunjukkan hasil yang sama dengan
simulasi. Namun, metode ini masih memiliki
kelemahan jika digunakan untuk ukuran data
yang kecil.
DAFTAR PUSTAKA
Aunuddin. 1989. Statistika: Rancangan dan
Analisis Data. Bogor: IPB Press.
Chatterjee S & Hadi AS. 2006. Analysis
Regression by Example Four Edition.
Canada
:
A
Wiley-Interscience
Publication.
Draper, NR. & Smith.H. 1992. Analisis
Regresi Terapan Edisi ke 2. Sumantri B,
penerjemah. Jakarta: Gramedia Pustaka
Utama: Terjemahan dari : Applied
Regression Analysis.
Hines & Montgomery. 1992. Introduction to
Linear Regression Analysis. New York :
Willey.
Ryan T. 1997. Modern Regression Methods.
New York : A Wiley-Interscience
Publication.
Rousseeuw,PJ & Leroy. AM. 1987. Robust
Regression and Outlier Detection.
Belgium : John Wiley &Sons.
Rousseeuw,PJ & Van Driessen .1999. A fast
algorithm for the minimum covariance
determinant estimator. Technometrics
1999; 41: 212–223.
Stinstra E. 2006. The Model Meta-Model
Approach for Simulation-Based Design
Optimization. [Desertasi]. Nederlands,
Tilburg University.

6

LAMPIRAN

8

Lampran 1 Bagan prosedur simulasi
Tetapkan

dan

Data Populasi
Dibangkitkan dari
bersesuaian

sebanyak 1000

dan

dengan

yang
dengan

Tentukan nilai Yi

Ukuran contoh acak
n=15

Ukuran contoh acak
n=30

Ukuran contoh acak
n=100

Ukuran contoh acak
n=200

Proporsi pencilan
0%

Proporsi pencilan
0%

Proporsi pencilan
0%

Proporsi pencilan
0%

Proporsi pencilan
5%

Proporsi pencilan
5%

Proporsi pencilan
5%

Proporsi pencilan
5%

Proporsi pencilan
10%

Proporsi pencilan
10%

Proporsi pencilan
10%

Proporsi pencilan
10%

Proporsi pencilan
15%

Proporsi pencilan
15%

Proporsi pencilan
15%

Proporsi pencilan
15%

Proporsi pencilan
20%

Proporsi pencilan
20%

Proporsi pencilan
20%

Proporsi pencilan
20%

Meregresikan semua gugus data dengan menggunakan OLS,LTS, dan LTS1

Ulangi langkah-langkah di atas untuk setiap ukururan contoh n dan masing-masing proporsi pencilan
dan Simpan nilai bo, b1, R2 , JKG, dan KTG dari tiap gugus data

Menentukan bias relatif, bias relatif mutlak, KTG relatif dan KTG dari tiap kombinasi ukuran data dan pencilan

Menentukan metode yang menghasilkan dugaan paling baik

9

Lampiran 2 Tabel evaluasi pendugaan nilai

n
15

30

100

200

p

pada berbagai proporsi pencilan

BIAS RELATIF (%)

BIAS RELATIF MUTLAK (%)

KTG RELATIF

KTG

0

OLS
0.00

LTS
0.00

LTS1
0.00

OLS
0.11

LTS
0.22

LTS1
0.12

OLS
0.02

LTS
0.09

LTS1
0.02

OLS
2.10

LTS
8.94

LTS1
2.31

5

0.26

0.02

0.00

0.57

0.21

0.12

0.52

0.08

0.02

51.86

7.76

2.16

10

0.49

0.00

0.17

0.78

0.21

0.35

0.99

0.08

0.45

98.96

7.75

44.64

15

0.50

0.01

0.15

0.76

0.21

0.34

0.94

0.08

0.43

94.39

7.86

42.88

20

0.65

0.01

0.62

0.91

0.20

1.05

1.38

0.07

1.75

138.19

7.39

174.62

0

0.00

0.01

0.00

0.08

0.17

0.09

0.01

0.05

0.01

1.06

4.73

1.26

5

0.14

0.00

0.00

0.40

0.17

0.08

0.25

0.05

0.01

24.58

5.10

1.01

10

0.23

0.01

0.01

0.49

0.16

0.09

0.37

0.04

0.02

36.54

4.22

1.70

15

0.30

0.00

0.05

0.57

0.16

0.19

0.50

0.04

0.13

49.58

4.48

12.61

20

0.48

0.00

0.40

0.68

0.16

0.90

0.73

0.04

1.14

72.77

4.26

114.48

0

0.00

0.00

0.00

0.04

0.11

0.04

0.00

0.02

0.00

0.26

1.87

0.31

5

0.10

0.00

0.00

0.20

0.11

0.04

0.06

0.02

0.00

6.34

1.90

0.28

10

0.19

0.00

0.00

0.28

0.11

0.04

0.13

0.02

0.00

12.65

1.80

0.33

15

0.31

0.00

0.01

0.38

0.10

0.11

0.23

0.02

0.03

22.79

1.71

3.46

20

0.37

0.00

0.21

0.45

0.10

0.60

0.30

0.02

0.52

30.11

1.60

51.90

0

0.00

0.00

0.00

0.03

0.08

0.03

0.00

0.01

0.00

0.13

1.10

0.16

5

0.10

0.00

0.00

0.15

0.08

0.03

0.03

0.01

0.00

3.48

0.97

0.14

10

0.20

0.00

0.00

0.24

0.08

0.03

0.09

0.01

0.00

8.60

1.10

0.14

15

0.30

0.00

0.00

0.33

0.08

0.06

0.16

0.01

0.01

15.61

0.97

0.86

0.24

0.42

0.08

0.49

0.24

0.01

0.34

24.12

0.89

33.90

20
0.40
0.00
Keterangan : n = banyaknya data contoh
p = persentase pencilan

9

10

Lampiran 3 Tabel evaluasi pendugaan nilai

n
15

30

100

200

pada berbagai proporsi pencilan

BIAS RELATIF (%)

p

BIAS RELATIF MUTLAK (%)

KTG RELATIF

KTG

OLS

LTS

LTS1

OLS

LTS

LTS1

OLS

LTS

LTS1

OLS

LTS

LTS1

0

0.00

0.01

0.00

0.11

0.22

0.12

0.02

0.09

0.02

0.08

0.34

0.09

5

-0.12

-0.02

0.00

0.55

0.21

0.12

0.46

0.07

0.02

1.86

0.30

0.08

10

-0.23

0.00

-0.15

0.71

0.21

0.34

0.80

0.08

0.40

3.21

0.31

1.58

15

-0.23

-0.01

-0.13

0.68

0.21

0.32

0.75

0.08

0.39

3.01

0.31

1.56

20

-0.24

0.00

-0.26

0.80

0.20

0.97

1.02

0.07

1.44

4.10

0.29

5.75

0

0.00

-0.01

0.00

0.08

0.16

0.09

0.01

0.04

0.01

0.04

0.18

0.05

5

-0.01

0.00

0.00

0.38

0.17

0.08

0.23

0.05

0.01

0.90

0.20

0.04

10

-0.03

-0.01

-0.01

0.45

0.16

0.08

0.31

0.04

0.02

1.25

0.16

0.06

15

-0.03

-0.01

-0.04

0.52

0.16

0.18

0.41

0.04

0.12

1.63

0.17

0.47

20

-0.08

0.00

-0.10

0.58

0.16

0.84

0.51

0.04

1.00

2.04

0.16

4.00

0

0.00

0.00

0.00

0.04

0.11

0.04

0.00

0.02

0.00

0.01

0.07

0.01

5

0.00

0.00

0.00

0.19

0.11

0.04

0.05

0.02

0.00

0.22

0.07

0.01

10

0.01

0.00

0.00

0.24

0.10

0.04

0.09

0.02

0.00

0.36

0.07

0.01

15

-0.01

0.00

0.00

0.29

0.10

0.11

0.13

0.02

0.03

0.54

0.07

0.14

20

0.03

0.00

0.04

0.33

0.10

0.59

0.17

0.02

0.48

0.67

0.06

1.91

0

0.00

0.00

0.00

0.03

0.08

0.03

0.00

0.01

0.00

0.01

0.04

0.01

5

0.00

0.00

0.00

0.13

0.08

0.03

0.03

0.01

0.00

0.10

0.04

0.01

10

0.00

0.00

0.00

0.17

0.08

0.03

0.05

0.01

0.00

0.18

0.04

0.01

15

0.00

0.00

0.00

0.21

0.08

0.06

0.07

0.01

0.01

0.27

0.04

0.03

0.00

0.23

0.07

0.44

0.08

0.01

0.28

0.34

0.03

1.13

20
0.00
0.00
Keterangan : n = banyaknya data contoh
p = persentase pencilan

9

11

Lampiran 4 Grafik evaluasi pendugaan nilai
a. n=15

bias relatif b0

60

abs bias relatif b0

150

80

100

40
20
0
-20

pada berbagai proporsi pencilan

0%

5%

10% 15% 20%

50
0
0%

persentase pencilan

OLS

LTS

LTS1

10%

15%

20%

(ii)

2.0

200

1.5

150

KTG b0

KTG relatif b0

(i)

1.0
0.5

100
50
0

0.0

0%

5%
10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

0%

5% 10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

(iv)

(iii)

bias relatif b0

60
40
20
0
-20

0%

5%

10%

15%

20%

abs bias relatif b0

n=30
100

50

0
0%

persentase pencilan
OLS

LTS

LTS1

(i)

5%
10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

(ii)

150
KTG b0

1.5
KTG relatif b0

b.

5%

persentase pencilan
OLS
LTS
LTS1

1.0
0.5
0.0

100
50
0

0%

5%
10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

(iii)

0%

5%
10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

(iv)

12

n=100

bias relatif b0

40
20
0
0%

5%

-20

10%

15%

20%

80

abs bias relatif b0

c.

60
40
20
0
0%

persentase pencilan
OLS
LTS
LTS1

(ii)
60

0.6
KTG b0

KTG relatif b0

(i)

0.4
0.2

40
20

0.0

0
0%

5%

10%

15%

persentase pencilan
OLS
LTS

20%

0%

5%
10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

LTS1

(iii)

(iv)

bias relatif b0

60

40
20
0
-20

0%

5%

10%

15%

20%

abs bias relatif b0

n=200
60
40
20
0
0%

persentase pencilan
OLS

LTS

LTS1

(i)
0.4

40

0.3

30

0.2
0.1
0.0

5%
10%
15%
20%
persentase pencilan
OLS
LTS
LTS1

(ii)

KTG b0

KTG relatif b0

d.

5%
10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

20
10
0

0%

5% 10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

(iii)

0%

5%
10%
15%
20%
persentase pencilan
OLS
LTS
LTS1

(iv)

13

Lampiran 5 Grafik evaluasi pendugaan nilai
n=15

bias relatif b1

10
0
0%

5%

10%

15%

20%

-10
-20

abs bias relatif b1

a.

pada berbagai proporsi pencilan

150
100
50

0
0%

-30

persentase pencilan
OLS
LTS

LTS1

5%
10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

(ii)

2.0

8

1.5

6

KTG b0

KTG relatif b1le

(i)

1.0

0.5

4

2

0.0

0
0%

5%
10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

0%

5%
10%
15%
20%
persentase pencilan
OLS
LTS
LTS1

(iii)

n=30

bias relatif b1

5
0
0%

5%

10%

15%

20%

-5

-10

abs bias relatif b1

b.

(iv)

100
50
0
0%

-15

persentase pencilan
OLS
LTS

10%

persentase pencilan
OLS
LTS

LTS1

(i)

15%

20%

LTS1

(ii)
6
KTG b1

1.5

KTG relatif b1

5%

1.0
0.5

4
2
0

0.0
0%

5%
10%
15%
20%
persentase pencilan
OLS
LTS
LTS1

(iii)

0%

5%
10%
15% 20%
persentase pencilan
OLS
LTS
LTS1

(iv)

14

c.

n=100
100

4
2
0

0%

5%

-2

10%

15%

20%

persentase pencilan
OLS

LTS

abs bias relatif b1

bias relatif b1

6

50

0
0%

5% 10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

LTS1

(i)

(ii)
3
KTG b1

KTG relatif b1

0.6
0.4
0.2

2
1

0.0

0
0%

5%
10%
15%
20%
persentase pencilan
OLS
LTS
LTS1

0%

5%
10%
15%
20%
persentase pencilan
OLS
LTS
LTS1

(iii)

bias relatif b1

0.5
0.0
0%

5%

10%

15%

20%

-0.5
-1.0

abs bias relatif b1

n=200
60
40
20
0
0%

5%
10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

persentase pencilan
OLS
LTS
LTS1

(i)

(ii)

0.3

1.5
KTG b1

KTG relatif b1

d.

(iv)

0.2
0.1
0.0

1.0
0.5

0.0
0%

5%
10% 15% 20%
persentase pencilan
OLS
LTS
LTS1

(iii)

0%

5%
10%
15% 20%
persentase pencilan
OLS
LTS
LTS1

(iv)

15

Lampiran 6 Output pada penerapan data riil
OLS
Prediktor

Koefisien

Intersep
Jarak

-290.4
499.8

t

Nilai p

-0.84
13.45

0.406
0.000

Model : waktu = - 290 + 500 jarak
Sumber
Keragaman
Regresi
Sisaan
Total

db

JK

1
33
34

KT

259186603
47310045
306496649

F

259186603
1433638

180.79

Nilai p
0.000

Plot sisaan untuk y
Normal Probability Plot

Versus Fits

99
4000
Residual

Percent

90
50

2000
0

10
-2000

1
-2000

0

2000
Residual

4000

0

5000
10000
Fitted Value

Histogram

15000

Versus Order

20

4000

15
Residual

Frequency

a.

10

2000
0

5
0

-2000
-2000 -1000

0

1000

2000

Residual

3000

4000

5000

1

5

10
15
20
25
Observation Order

30

35

R2
(adj)
84.1%

16

LTS
Prediktor

Koefisien

t

Nilai p

Intersep
jarak

-300.14
427.23

-4.36
56.39

0.000
0.000

Model : waktu = - 300 + 427 jarak
Sumber
Keragaman
Regresi

db

Sisaan
Total

JK

KT

F

1

108429751

108429751

17
18

579627
109009378

34096

Nilai p

3180.16

0.000

Plot sisaan untuk y
Versus Fits

99

400

90

200
Residual

Percent

Normal Probability Plot

50

0
-200

10
1
-500

-400
-250

0
Residual

250

500

0

2500

Histogram

5000
7500
Fitted Value

10000

Versus Order
400

4,8
200

3,6

Residual

Frequency

b.

2,4

-200

1,2
0,0

0

-400
-300 -200 -100

0
100
Residual

200

300

400

2

4

6
8
10 12 14
Observation Order

16

18

R2
(adj)
99.4%

17

c.

LTS1
Prediktor

Koefisien

Intersep
jarak

-348.7
474.6

t

Nilai p

-1.92
23.93

0.064
0.000

Model : waktu = - 349 + 475 jarak
Sumber
Keragaman
Regresi

db

Sisaan
Total

JK

KT

F

1

212837427

212837427

17
18

11526471
224363898

371822

Nilai p

572.42

0.000

Plot sisaan untuk y
Normal Probability Plot

Versus Fits

99

2000

Residual

Percent

90
50
10

1000
0
-1000

1
-1000

0
1000
Residual

2000

0

3000

Histogram

7,5

1000

Residual

2000

5,0
2,5

0
-1000

0,0

0
0
50 100
-1
-

-5

00

0

0
50

00
10

0
15

0

20

1

00

5

10
15
20
25
Observation Order

Residual

Lampiran 7 Data Kriteria Pendugaan
kriteria
b0
b1
Sb0
Sb1
JKG
KTG
R2(adj)

12000

Versus Order

10,0

Frequency

6000
9000
Fitted Value

OLS
-290.40
499.83
345.38
37.17
4.7x107
1433638
84%

LTS
-300.13
427.23
620.18
66.75
15.2x107
4622769
50%

dan

untuk Keseluruhan data

LTS1
-348.70
474.64
477.65
51.41
9.0x107
2742161
70%

30

R2
(adj)
99.4%