58 Dari gambar 4.4 di atas garis LTS melewati keabanyakan titik data dan
mengabaikan pengaruh dari titik ke-18. Persamaan 4.2 jika dibandingkan dengan persamaan 4.1 maka, pada persamaan 4.2
atau intercept-nya adalah 181,6062, sedangkan pada persamaan 4.1 nilainya adalah 632,301. Sangat besar
sekali, karena pada persamaan 4.1 sangat dipengaruhi oleh outlier, sedangkan pada 4.2 tidak terpengaruh. Untuk persamaan 4.2 nilai koefisien,
1
ˆ , adalah 8,9183, sedangkan pada persamaan 4.1 adalah 5,018. Dengan metode LTS nilai
koefisien R-square adalah 90,37 lebih besar dari R-square dengan menggunakan metode LS. Dan nilai estimasi skala residual dari LTS adalah
354,2, nilai yang sangat kecil jika dibandingkan dengan estimasi skala yang dihasilka oleh metode LS. Tidak seperti metode LS yang harus memenuhi
beberapa asumsi, metode LTS tidak perlu memenuhi asumsi seperti asumsi pada metode LS. metode LTS memilik breakdown point yang tinggi, yaitu 50, artinya
persamaan 4.2 tetap akan memberikan kecocokan data yang tepat walupun data outliernya hampir setengahnya dari keseluruhan data.
c. Metode MM-Estimasi
Metode yang selanjutnya adalah MM-estimasi dengan menggunakan S- estimasi sebagai initial estimasinya. Persamaan yang dihasilkan dengan metode
ini adalah: ˆ 126.8782 8.4298
y x
4.3 Persamaan 4.3 digambarkan sebagai berikut:
59
200 400
600 800
1000 1200
1400 x
2000 4000
6000
y
Dari gambar 4.5 di atas garis MM-estimasi melewati garis ke-18 dan tetap memberikan kecocokan terhadap data yang lainnya. Persamaan 4.3 mempunyai
konstanta, , adalah 126,8782 lebih kecil dari dua metode sebelumnya, dan nilai
koefisien,
1
ˆ , adalah 8,4298 yang juga lebih kecil dari metode LTS. Dengan metode MM-estimasi niali koefisien R
2
adalah 71,7 , nilai yang lebih kecil dari kedua metode sebelumnya. Metode MM-estimasi dengan S-estimasi sebagi
estimasi awal mempunyai breakdown point yang tinggi yaitu 50 sama seperti metode LTS dan dengan keefisiensian terhadap distribusi normal sekitar 85.
Gambaran perbandingan yang lengkap diberikan oleh tabel 4.4 berikut ini:
Table 4.4 perbandingan nilai-nilai intercept, koefisien, skala estimasi, dan R
2
dari metode LS, LTS dan MM-estimasi.
No Metode Regresi Intercept Koefisien Estimasi Skala Residual
R
2
1. LS
632,301 5,018
795,1 81,15
2. LTS
181,6062 8,9183
354,2 90,37
3. MM-estimasi
126,8782 8,4298
395 71,7
Gambar 4.5 garis MM-estimasi untuk Data Dana Pensiunan
60
4.2 Aplikasi Pada Regresi Berganda
Data yang digunakan adalah data yang diperoleh dari [7] yang terdiri dari empat variabel independen yaitu: blood clotting pembekuan darahx
1
, prognostic index x
2
, enzyme function test x
3
, liver function test x
4
, dan variabl dependennya adalah survival time. Data berjumlah 54 buah. Pada tabel 4.5 adalah
4 data pertama dan sebagiannya dilampirkan.
Tabel 4.5 Data Survival Time
no x
1
x
2
x
3
x
4
y 1
6.7 62 81 2.59 200
2
5.1 59 66 1.7 101
3
7.4 57 83 2.16 204
4
6.5 73 41 2.01 101
4.2.1 Pemeriksaan Outlier
Sebelum menganalisis menggunkan regresi akan diperiksa terlebih dahulu apakah dalam data tersebut terdapat oulier pada arah-y atau arah-x atau ada pada
keduanya.
a. Pemeriksaan
Leverage
Data yang lebih besar dari nilai centroid mean variabel independen dan nilai h
ii
yang melebihi nilai cutoff
2 1
k n
digolongkan sebagai outlier. Nilai-
nilai centroid dari keempat variabel independen adalah 5.783333, 63.42593, 77.2037, 2.744259. dan nial cutoff-nya adalah 0,1852. Data yang termasuk outlier
pada data survival time tabel 4.5 adalah data ke-16, 28, 32, 38, dan 43 dengan nilai h
ii
masing-masing adalah 0,189087, 0,264561, 0,219006, 0,31775, 0,260665
61 yang semuanya lebih besar dari nilai cutoff, 0,1852. Untuk pemeriksaan data
ditabelkan pada 4.6, data yang lainnya terlampir.
b. Pemeriksaan Discrepancy