3 diagnosa model pemeriksaan sisaan

  

Analisis Regresi 1

Pokok Bahasan :

  

Diagnosa Model Melalui Pemeriksaan

Sisaan dan I dentifikasi Pengamatan

Berpengaruh

  Sisaan Sisaan adalah menyimpangnya nilai amatan y i terhadap dugaan nilai harapannya

  ) ) ) E [Y | x ] → E [Y | x ] = y = + b b x i i i 1 i

  ) e y y

  = − Sisaan untuk suatu amatan ke-i: i i i

  Bisa digunakan untuk ˆ yy e

  ( ) i i i memeriksa kebenaran

  = = r

  Sisaan baku i ε i menyebar N(0,1) s s y y

  − ˆ

  ( ) i i

  σ

  1 Kurang tepat sebab x x

  • 2

  − ( ) i

e

i

n

  2 ragam (e ) = s (1-h ) r = , h = i ii

i ii

n

  2

  sh ( 1 ) ii xx

  ( ) k

  ∑ Contoh: menghitung sisaan Berikut adalah 1 set (25 pengamatan) data berpasangan x1 dan y yang didapat dari sebuah percobaan. Dari data ini ingin diketahui model matematika hubungan antara x1 dan Y.

  i

  1

  2

  3

  4

  5

  6

  7

  8

  9

  10

  11

  12

  13 Y

  10.98

  11.13

  12.51

  8.4

  9.27

  8.73

  6.36

  8.5

  7.82

  9.14

  8.24

  12.19

  11.88 X1

  20

  20

  23

  20

  21

  22

  11

  23

  21

  20

  20

  21

  21 i

  14

  15

  16

  17

  18

  19

  20

  21

  22

  23

  24

  25 Y

  9.57

  10.94

  9.58

  10

  8.11

  6.83

  8.88

  7.7

  8.47

  8.86

  10.4

  11.08 X1

  19

  23

  20

  22

  22

  11

  23

  20

  21

  20

  20

  22 Contoh: menghitung sisaan (lanjutan)

  Scatterplot of Y vs X1 13 Dari tebaran x1 terhadap Y digunakan 12 persamaan garis regresi linier sederhana 11 ordo satu :

  1 Dengan Minitab didapatkan dugaan 8

  Y x = + + β β ε Y 10 9

  ˆ 7 persamaannya : = 3.56 + 0.290 X1 Y 6 10 12 14 16 X1 18 20 22 24 Untuk setiap amatan dihitung nilai dugaannya, kemudian hitung sisaannya

  Contoh: menghitung sisaan (lanjutan)

  

Y duga = 3.56 + 0.290 X1 sisaan ke i = amatan ke-i – dugaan pd titik x ke-i

i

  1

  2

  3

  4

  5

  

6

  7

  8

  9

  10

  11

  12

  13 y

  10.98

  11.13

  12.51

  8.40

  9.27

  8.73

  6.36

  8.50

  7.82

  9.14

  8.24

  12.19

  11.88 y_duga

  9.35

  9.35

  10.22

  9.35

  9.64

  9.93

  6.75

  10.22

  9.64

  9.35

  9.35

  9.64

  9.64 sisaan

  1.63

  1.78 2.29 -0.95 -0.37 -1.20 -0.39 -1.72 -1.82 -0.21 -1.11

  2.55

  2.24 i

  14

  15

  16

  17

  18

  19

  20

  21

  22

  23

  24

  25 y

  9.57

  10.94

  9.58

  10.09

  8.11

  6.83

  8.88

  7.68

  8.47

  8.86

  10.36

  11.08 y_duga

  9.06

  10.22

  9.35

  9.93

  9.93

  6.75

  10.22

  9.35

  9.64

  9.35

  9.35

  9.93 sisaan

  0.51

  0.72

  0.23 0.16 -1.82 0.08 -1.34 -1.67 -1.17 -0.49

  1.01

  1.15 I nformasi-informasi yang Didapat Melalui Sisaan „

  Bisa melihat pola sebaran peubah acak Y „

  Melalui sisaan, kita dapat mengetahui apakah asumsi-asumsi yang disyaratkan pada pendugaan dengan MKT dipenuhi atau tidak

  „ Melalui sisaan, kita juga dapat menguji parameter regresi, sehingga kita perlu mengetahui sebaran sisaan

  „ Melalui sisaan, kita juga bisa melihat apakah model yang kita pilih pas atau tidak

  „ Melalui sisaan, kita juga bisa melihat apakah sebuah pengamatan merupakan pencilan atau bukan

  „ Melalui sisaan, kita juga bisa melihat apakah sebuah pengamatan merupakan pengamatan berpengaruh atau bukan

  Pemeriksaan Pola Sebaran Peubah Respon Y

  • Y =
  • x β

  β ε

  1 MODEL REGRESI Acaknya Y disebabkan E [ Y | x ] i karena acaknya eror

  Acak Acak Fix ε

  Bentuk sebaran Y = bentuk sebaran eror Memeriksa bentuk sebaran Y = memeriksa bentuk sebaran eror

  Plot Sisaan untuk: Pemeriksaan Bentuk Sebaran S is a a n Fr e k u e n s i

  3 2 - 2 1 - 1 - 3 4 3 2 1 N o r m a l H i s t o g r a m S i s a a n

  Tebaran sisaan dan histogram di samping untuk melihat : BENTUK SEBARAN SI SAAN, simetri atau tidak

  HASI L DI AGNOSA : Sebaran sisaan agak menjulur ke kanan

  Plot Sisaan untuk: Pemeriksaan Sebaran Normal Sisaan P e lu a n g n o rm a l

  • 2 1 -1 -3 -4
  • 99 95 90 80 70 60 50 40 30 20 10 5 1 Normal - 95% CI Probability Plot of Sisaan

      5

      4

      3

      2

      Plot sisaan terhadap peluang Normal untuk : Mencocokkan apakah sebaran sisaan merupakan sebaran Normal atau tidak. Ya jika pola tebaran membentuk garis lurus Hasil Diagnosa : bisa dianggap lurus Æ menyebar Normal

      Plot Sisaan untuk: Melihat Ketidakpasan Model Plot SI SAAN vs Y duga

      Plot sisaan vs y_ duga „

      Plot sisaan terhadap

      40 y_duga masih berpola

      30 (kuadratik)

      20 „

      Sisaan masih

      10 n a mengandung a is s komponen kuadratik

    • 10
    • 20

      „ Model belum pas Æ

    • 30

      model harus ditambah

    • 40

      dg komponen kuadratik 50 100 150 200 y_duga

    • Sisaan di sekitar nilai nol / tidak
    • Lebar pita sisaan sama atau tidak
    • 1
    • 2

      1

      untuk semua nilai dugaan Æ kehomogenan ragam

      Æ nilai harapan

      ε Kondisi Gauss-Markov Pada tebaran sisaan terhadap nilai dugaan Y dapat dilihat :

      E E ε ε σ ε

      ⇒ =

    j i

    i

      

    2

    i ⇒ ≠ = ⇒ =

      2

      1

      ] penuhi tidak ter E[ 2. ] terpenuhi [ .

      Plot Sisaan vs y_duga , terpenuhi j i ] [ 3.

      2

      3

    • Tebaran berpola atau tidak
    Pola Tebaran Sisaan ˆ terhadap

      7.0

      7.5

      8.0

      8.5

      9.0

      9.5

      10.0

      10.5

      Plot Sisaan untuk : Pemeriksaan Asumsi MKT y_duga s is a a n

      Æ ketidakpasan model Æ sisaan bebas atau tidak Plot SI SAAN vs Y duga

      Y i

      Pola tebaran sisaan memenuhi asumsi MKT: berpusat di NOL, lebar pita sama, tidak berpola Pola tebaran sisaan yang tidak memenuhi asumsi MKT:

      Ragam tidak homogen (perlu analisis kua- drat terkecil terboboti; atau transformasi thdp Y) Penyimpangan terhadap persamaan regresi bersifat sistematis; atau karena tdk disertakannya kedalam model

      β Model tidak pas (perlu suku-suku lain dalam model atau transformasi thdp Y) Transformasi untuk : Menghomogenkan Ragam Transformasi terhadap peubah respon Y

      2 b

      Anggap : σ = a μ Setelah respon Y ditransformasi, lakukan analisis regresi seperti biasa,

      1 jika b = 4 ⇒ Y* = sisaan harus diperiksa lagi, jika masih

      Y belum memenuhi asumsi, model

      1 diubah, kemungkinan ada suku b = 3 ⇒ Y* = Y nonlinier yg belum masuk model, atau lakukan pendugaan dg MKT b = 2 ⇒ Y* = ln Y terboboti. b = 1 ⇒ Y* = Y

      Contoh Transformasi untuk Menghomogenkan Ragam Fitted Value R e s id u a l

    • 0,5
    • 1,0
    • 1,5
    • 5
    • 10

      25

      20

      15

      10

      5

      10

      5

      Residuals Versus the Fitted Values (response is Y)

      Fitted Value

    R

    e

    s

    id

    u

    a

    l

      5,0 4,5 4,0 3,5 3,0 2,5 1,0 0,5 0,0

      Residuals Versus the Fitted Values (response is akar Y)

      Plot Sisaan vs Y duga “data asli” Plot Sisaan vs “data transformasi Y*= “

      Y Yˆ Plot Sisaan untuk: Pemeriksaan Kebebasan Sisaan Scatterplot of RESI 1 vs urutan Plot sisaan terhadap urutan

      2 untuk : Memeriksa apakah sisaan

      1 bebas satu dengan lainnya atau tidak. Bebas jika tdk

      I1 S E . membentuk pola

      R

    • 1

      Hasil Diagnosa : Tebaran tidak membentuk

    • 2

      pola

      2

      4

      6

      8

      10

      12 urutan

      Æ Sisaan saling bebas

      „ Pola tebaran sisaan yang menginformasikan bahwa pengaruh waktu belum diperhitungkan

      Ragam tidak homogen (perlu analisis kuadrat terkecil terboboti) Suatu suku linier dalam waktu harus ditambahkan ke dalam model Suku linier dan kuadratik dalam waktu perlu ditambahkan ke dalam model

      Pengaruh waktu jangka panjang tidak mempengaruhi data.

      Pola Tebaran Sisaan terhadap Urutan Waktu

      Plot Sisaan untuk: Pemeriksaan Pengaruh Waktu Scatterplot of RESI 1 vs urutan Plot sisaan terhadap urutan

      2 waktu yg jaraknya sama.

      Perhatikan :

      1 Æ lebar pita sama/ tidak

      I1 Æ berpola/ tidak

      S E R

    • 1

      Hasil Diagnosa : Lebar pita sama Æ • homogen

    • Tebaran tidak membentuk pola
      • 2

      Æ tidak perlu ditambahkan penga-

      2

      4

      6

      8

      10

      12 urutan ruh waktu ke dalam model Sisaan Terstandardkan (Sisaan Terbakukan) Bisa digunakan untuk yy ˆ e

      ( ) i i i r

      

    SI SAAN TERBAKUKAN : = = memeriksa kebenaran

    ε i s s menyebar N(0,1) y − ˆ y

      

    ( )

    i i

      σ Sisaan akan memiliki Pd sebaran Normal Baku peluang nilai r i ragam yg relatif besar terletak antara -1,96 s.d 1,96 adalah jika x di sekitar 95% . Æ | r | > 2 patut dicurigai i x i

      2

      1 xx

    • 2

      ( )

      i e i ragam(e )= s , kurang tepat n i r = , h = i ii

      2

      2 Æ ragam(e ) = s (1- h ) i ii s ( 1 − h ) xx

      ( ) ii k

      ∑ e = sisaan amatan ke-i i n = banyaknya pengamatan

      2 s = dugaan bagi ragam Y Æ KT i sisaan

    • 1

      h = unsur diagonal ke-i matriks H = X(X’X) X’ ii Sisaan Terstandarkan (Sisaan Baku) (lanjutan)

      

    Plot Sisaan e vs Dugaan Y Plot Sisaan Baku r vs Dugaan Y

    i i

      Residuals Versus the Fitted Values Scatterplot of SRES1 vs FI TS1 (response is ln(y)) 1,0

      1 0,5 l

      1 a S

      0,0 u

      E

    • 1

      id R s S e R

    • 2
    • 3
    • 4 1,0 1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 1,0 1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8

      Fitted Value FITS1 Pola tebaran plot sisaan e dan r tidak berbeda. i i

      Æ pemeriksaan sisaan thdp pola tebaran, keduanya dapat digunakan

      Nilai PRESS

    PRESS = Prediction Sum of Squares, adalah prosedur

    yang merupakan kombinasi dari: semua kemung-

    kinan regresi, analisis sisaan, dan teknik validasi.

    Digunakan untuk mengukur validitas model.

      : nilai respon pada x=x i

      = R 2 pred adalah statistik la- innya yg berhub dg PRESS. Model valid jika R

      ⎝ ⎛

    n i ii i h

    e

      = ⎟⎟ ⎠ ⎞ ⎜⎜

      1 ∑

      1

      2

      ˆ

      − ,

      (data lengkap) : nilai ramalan y pd x=x i yg diramal melalui dugaan persamaan regresi dari data tanpa amatan ke-i Model valid jika memiliki PRESS yg kecil i i y

      − − = y y i PRED y i

      ( ) ( )

      1 R ∑

      2 PRESS

      2

      y y ( )

      −i i i

      ∑ ∑ = − =

      e ˆ PRESS

      2 ,

      2 i,-i

      2 pred besar. Nilai PRESS (lanjutan)

    PROSEDUR PRESS

      

    Mis. k adalah banyaknya peubah dalam suatu persamaan regresi,

    n adalah banyaknya amatan Langkah-langkahnya: 1. Sisihkan amatan ke-1, amatan ke-1 tidak digunakan, data tinggal n-1.

      

    2. Dugalah semua ”kemungkinan model regresi” thdp n-1 data tersebut. (jika

    k=1Æ banyaknya ”kemungkinan model” hanya 1)

      3. Ramal y dengan model yang didapat pd no.2. (lakukan untuk semua

      1 kemungkinan model Æ hanya 1 jika k=1)

      ˆ y y

      − k

      1

      1

      4. Hitung perbedaan y yg disisihkan tadi dengan hasil no.3. Æ

      1 5. Ulangi langkah 1-4 dengan menyisihkan amatan ke-2, ke-3,...., ke-n.

      Didapat y y ˆ y y ˆ y y ˆ

      − , − , ..., − k k n nk

      2

      2

      3

      3

      2 n

      ˆ PRESS = yy

      ( ) i ik

      6. Untuk setiap model regresi yang mungkin hitung : ∑ i =

      1

      7. Pilih model yang relatif memiliki nilai PRESS terkecil, dan melibatkan peubah penjelas sedikit.

      Nilai PRESS (lanjutan)

      9 Y tnp 4 = 3,04 + 0,500 X tnp 4 7,54 -0,43 0,18490 7,81

      5 Y tnp 11 = 2,88 + 0,511 X tnp11 5,435 0,295 0,08703

      7 Y tnp 10 = 3,03 + 0,498 X tnp10 6,516 -0,096 0,00921 5,73

      12 Y tnp 9 = 2,84 + 0,528 X tnp 9 9,176 -1,026 1,05267 6,42

      4 Y tnp 8 = 2,72 + 0,526 X tnp 8 4,824 0,566 0,32035 8,15

      6 Y tnp 7 = 2,97 + 0,502 X tnp 7 5,982 0,098 0,00960 5,39

      14 Y tnp 6 = 2,46 + 0,577 X tnp 6 10,538 -1,698 2,88320 6,08

      11 Y tnp 5 = 2,95 + 0,514 X tnp 5 8,604 -0,794 0,63043 8,84

      13 Y tnp 3 = 4,01 + 0,345 X tnp 3 8,495 4,245 18,02003 7,11

      Y

      8 Y tnp 2 = 3,05 + 0,497 X tnp 2 7,026 -0,256 0,06553 12,74

      10 Y tnp 1 = 3,01 + 0,505 X tnp 1 8,06 -0,6 0,36 6,77

      kuadrat 7,46

      e i,-i

      i,-i

      e

      X Dugaan Garis Regresi dg Data tanpa amatan ke-i ramalan Yi tnp amatan ke-i

      Total = PRESS = 23,6229

    Contoh Proses PRESS, untuk n= 11 dan k= 1

      Nilai PRESS (lanjutan)

      Output Minitab untuk data contoh tsb

    • Hasil PRESS melalui proses = hasil Minitab

      The regression equation is

    • Y = 3,00 + 0,500 X

      Untuk k=1 hanya ada 1 model

    • Amatan ke-3 memberikan

      Predictor Coef SE Coef T P

      simpangan ramalan terbesar

      Constant 3,002 1,124 2,67 0,026

      Amatan ke-3 dapat dipandang •

      X 0,4997 0,1179 4,24 0,002

      sebagai amatan berpengaruh

      S = 1,23631 R-Sq = 66,6% R-Sq(adj) = 62,9%

    • Dugaan parameter regresi

      tanpa amatan ke-3 sangat PRESS = 23,6210 R- Sq( pred) = 42,70% berbeda dg lainnyaÆ dugaan

      Analysis of Variance

      yg ini relatif yg benar/baik

      Source DF SS MS F P Regression 1 27,470 27,470 17,97 0,002 Residual Error 9 13,756 1,528 Total 10 41,226 Keluarkan amatan ke-3 dari analisis.

      2 Cek nilai PRESS-nya. Cek nilai R nya The regression equation is Y tnp 3 = 4,01 + 0,345 X tnp 3 Predictor Coef SE Coef T P Constant 4,00619 0,00221 1811,78 0,000 X tnp 3 0,345334 0,000237 1454,74 0,000 S = 0,00308655 R-Sq = 100,0

      PRESS = 0,000174853 R-Sq(pred) = 100,00%

      Analysis of Variance Source DF SS MS F P Regression 1 20,161 20,161 2116264,34 0,000 Residual Error 15 0,000 0,000 Total 16 20,161

      Output Minitab data lengkap Output Minitab data tanpa amatan ke-3

      The regression equation is Y = 3,00 + 0,500 X Predictor Coef SE Coef T P Constant 3,002 1,124 2,67 0,026 X 0,4997 0,1179 4,24 0,002 S = 1,23631 R-Sq = 66,6%

      PRESS = 23,6210 R-Sq(pred) = 42,70%

      Analysis of Variance Source DF SS MS F P Regression 1 27,470 27,470 17,97 0,002 Residual Error 9 13,756 1,528 Total 10 41,226

      Nilai PRESS (lanjutan)

      

    Menyisihkan amatan ke-3 mempengaruhi dugaan parameter, menurunkan nilai PRESS

    Dari sisi model, “persamaan tanpa amatan ke-3” yg terbaik. R-Sq(pred)=100,00% Æ model sangat valid Æ PELUANG salah memprediksi = 0

      X Y 15,0 12,5 10,0 7,5 5,0

       3 15,0 12,5 10,0 7,5 5,0

      Dugaan garis regresi tanpa amatan ke-3 PRESS = 0,000174853 R-Sq(pred) = 100,0%

      (lanjutan) Dugaan garis regresi dg data lengkap PRESS = 23,6210 R-Sq(pred) = 42,70%

      5 Fitted Line Plot Y tnp 3 = 4,006 + 0,3453 X tnp 3 Nilai PRESS

      6

      7

      8

      9

      4 Fitted Line Plot Y = 3,002 + 0,4997 X X tnp 3 Y t n p

      13

      5

      6

      7

      8

      9

      10

      11

      12

      Semakin kecil nilai PRESS-nya Æ model semakin valid Æ semakin baik untuk memprediksi. Setiap 1 model regresi thdp 1 set data memiliki 1 nilai PRESS

      Pencilan “Pencilan adalah pengamatan yang nilai mutlak sisaan- nya jauh lebih besar daripada sisaan-sisaan lainnya”

      „ Bisa jadi terletak pada tiga atau empat simpangan

    baku atau lebih jauh lagi dari rata-rata sisaannya.

      „ Keberadaan pencilan harus diperiksa dengan seksama, apakah pencilan itu merupakan kesalahan dalam pencatatan amatan atau pencilan tersebut muncul dari kombinasi keadaan yang tidak biasa yang mungkin saja sangat penting dan perlu diselidiki lebih jauh.

      Pencilan (lanjutan)

      Plot antara Sisaan e vs dugaan Y Plot antara Sisaan r vs dugaan Y i i i i 3 Scatterplot of Sisaan baku-2 vs dugaan-Y2 Scatterplot of sisaan2 vs dugaan-Y2 3 a -2 a k u b n a

      2 1 is a a n 2 s 1 2 S is -1

    • -1

      5 6 7 dugaan- Y2 8 9 10 5 6 7 dugaan- Y2 8 9 10 Dugaan persamaan regresi Y = 3.00 + 0.500 X dgn R-Sq = 66.6% • Pola tebaran sisaan thdp e dan r sama • i i

      Ada sisaan yang nilainya sangat besar Æ potensi sebagai pencilan •

      Pencilan (lanjutan)

      Y X r i i i

      MENDETEKSI PENCI LAN 7.46 10 -0.46018 e

    i

      6.77 8 -0.19633

    • Hitung nilai

      r = i

      12.74 13 2.99999 s

    1 h

      

    ( ) ii

      7.11 9 -0.33085

      2 7.81 11 -0.59695

    xx

      

    ( )

      1 dengan h = n ii n

    • i

      8.84 14 -1.13497

      2 xx

      ( ) k

      ∑

      6.08 6 0.07042 i =

      1

      5.39 4 0.3807

    • 8.15 12 -0.75518

      Jika nilai | ri| > 2, amatan tsb 6.42 7 -0.06974 dapat dikatakan sebagai

      5.73 5 0.21188 pencilan

      (lanjutan) Pencilan

    DATA LENGKAP DATA TANPA PENCI LAN

      12 13 Scatterplot of Y-3 vs X-3 12 13 Scatterplot of Y tnp pclan vs X tnp pclan -3 Y 10

      11 9 p la c n n p 10 11 9 6 7 8 Y t 6 7 8 5 5,0 7,5 10,0 12,5 15,0 5,0 7,5 10,0 12,5 15,0 X- 3

      5 X t np pclan Y = 3.00 + 0.500 X Y = 4.01 + 0.345 X

      Predictor Coef SE Coef T P Predictor Coef SE Coef P Constant 3.002 1.124 2.67 0.026 Constant 4.00565 0.00292 0.000 X 0.4997 0.1179 4.24 0.002 X 0.345390 0.000321 0.000 S = 1.23631

      S = 0.00308168

      R-Sq = 66.6% R-Sq = 100.0%

      (lanjutan) Pencilan

      

    Plot sisaan baku (r ) vs dugaan Y

    i

      Data Lengkap Data Tanpa Pencilan 3 Scatterplot of sisaan2 vs dugaan-Y2 Scatterplot of s baku tnp pcl vs dugaan tnppcl 1.5 2.0 s 2 a a is n 1 2 l a c k p u t n p

      1.0 0.0 0.5 -1 s b -0.5 -1.0 5 6 7 dugaan- Y2 8 9 10 -1.5 5 6 dugaan t nppcl 7 8 9 Tebaran berpola, karena (1) ada Tebaran tidak berpola, menyebar di se- pencilan, atau (2) model tidak pas kitar nilai nol, lebar pita relatif sama Mengeluarkan data pencilan dari analisis:

    • mampu memperbaiki pola tebaran sisaan yang tadinya berpola (garis lurus) • harus dilakukan dengan kehati-hatian yang tinggi.

      Amatan Berpengaruh :

    AMATAN BERPENGARUH

      berkaitan dengan besarnya perubahan yang terjadi pada dugaan parameter regresi jika pengamatan tersebut disisihkan

      X1

      1

      1 1 1,2 1,2 1,2 1,3 1,3 1,3 1,4 1,4 1,4 1,5 1,5 1,5 1,6 1,6 1,6 4,0 Y1 2,11 1,39 0,78 2,02 2,46 3,67 2,56 1,74 1,88 5,15 2,41 2,00 3,56 3,09 0,78 4,29 3,33 3,10 15,00 16 Scatterplot of Y1 vs X1 12 14 Unusual Observations 10 Obs X1 Y1 Fit SE Fit Residual St Resid Y 1 8

      10 1,40 5,147 2,895 0,244 2,252 2,19 R 6 15 1,50 0,776 3,345 0,243 -2,569 -2,50 R 2 4

      19 4,00 15,000 14,576 1,009 0,424 1,34 X R denotes an observation with a large standardized residual. 1,0 1,5 2,0 2,5 3,0 3,5 4,0 X1 X denotes an observation whose X value gives it large influence.

      Amatan Berpengaruh (lanjutan)

    OUTPUT MINITAB

      The regression equation is

      Hasil analisis regresi dari Y1 = - 3,39 + 4,49 X1 data tersebut menunjukkan

      S = 1,05749 R-Sq = 88,8% R-Sq(adj) = 88,1% bahwa ada 3 amatan yg

      aneh, yaitu amatan ke

      Analysis of Variance

      10,15, dan 19. Amatan 10

      Source DF SS MS F P

      dan 15 berpotensi sebagai

      Regression 1 150,10 150,10 134,22 0,000 Residual Error 17 19,01 1,12

      pencilan. Amatan 19

      Total 18 169,11

      berpotensi sebagai amatan berpengaruh

      Unusual Observations Obs X1 Y1 Fit SE Fit Residual St Resid 10 1,40 5,147 2,895 0,244 2,252 2,19 R

      15 1,50 0,776 3,345 0,243 -2,569 -2,50 R

      Bandingkan dg data tanpa

      19 4,00 15,000 14,576 1,009 0,424 1,34 X

      amatan 19. Apakah perubahan dugaan para-

      R denotes an observation with a large standardized residual.

      meter regresi cukup nyata? X denotes an observation whose X value gives it large influence. The regression equation is

      Y1 = - 1,26 + 2,88 X1

      S = 1,03065 R-Sq = 25,4% R-Sq(adj) = 20,8% Analysis of Variance Source DF SS MS F P Regression 1 5,797 5,797 5,46 0,033 Residual Error 16 16,996 1,062 Total 17 22,793 Unusual Observations Obs X1 Y1 Fit SE Fit Resid St Resid 10 1,40 5,147 2,764 0,256 2,383 2,39 R

      15 1,50 0,776 3,052 0,318 -2,276 -2,32 R The regression equation is

      Y1 = - 3,39 + 4,49 X1

      S = 1,05749 R-Sq = 88,8% R-Sq(adj) = 88,1% Analysis of Variance Source DF SS MS F P Regression 1 150,10 150,10 134,22 0,000 Residual Error 17 19,01 1,12 Total 18 169,11 Unusual Observations Obs X1 Y1 Fit SE Fit Resid St Resid 10 1,40 5,147 2,895 0,244 2,252 2,19 R

      15 1,50 0,776 3,345 0,243 -2,569 -2,50 R 19 4,00 15,000 14,576 1,009 0,424 1,34 X

      

    Analisis Regresi thdp Data Lengkap An Regresi thdp Data Tanpa Amatan 19

    Penyisihan “pengamatan berpengaruh” mengubah secara berarti dugaan persamaan regresi

      Amatan Berpengaruh (lanjutan)

      Amatan Berpengaruh (lanjutan)

      

    Dugaan Garis Regresi Data Lengkap Dugaan Grs Regresi Data Tnp Amatan 19

    Fitted Line Plot 16 14 Y1 = - 3,394 + 4,493 X1 16 14 Y1 tnp amatan 19 = - 1,265 + 2,878 X1 tnp amatan 19 Fitted Line Plot 1 Y 10

      12 8 a ta n 1 9 m a 12 10 8 4 6 2 Y p 1 t n 4 6 1,0 1,5 2,0 2,5 3,0 3,5 4,0 X1

      2 1,0 1,5 2,0 2,5 3,0 3,5 4,0 X1 t np amat an 19 Penyisihan AMATAN BERPENGARUH menyebabkan perubahan dugaan kemiringan garis. BERBAHAYA, apabila pemanfaatan hasil analisis regresi bertumpu pada

      Æ pemaknaan parameter

      Amatan Berpengaruh (lanjutan)

      Statistik Uji untuk Mendeteksi Amatan Berpengaruh Pengaruh titik data ke-i diukur dengan jarak :

      2

      

    2

    ⎧ ⎫ ⎧ ⎫

      1 e h i ii

      D =

      1 i ⎨ ⎬ ⎨ ⎬

      2 1 − h p

      1 sh

      ( ) ii ii ⎩ ⎭

      ⎩ ⎭ Keterangan:

      2 s = dugaan bagi ragam Y = KT i sisaan

    • 1

      h = unsur diagonal ke-i matriks H = X(X’X) X’ ii

      Nilai D dibandingkan dengan F . Dengan n = banyaknya i (p,n-p; 1- α) pengamatan dan p = banyaknya parameter D > F . menandakan bahwa amatan ke-i berpengaruh. i (p,n-p;1- α)

      Amatan Berpengaruh (lanjutan)

      X (i) Y (i) e (i) r (i) D (i) 1 2,11 1,01 1,00 0,30 1 1,39 0,30 0,29 0,09 1 0,78 -0,32 -0,32 -0,09

      1,2 2,02 0,02 0,02 0,01 1,2 2,46 0,46 0,45 0,11 1,2 3,67 1,68 1,64 0,45 1,3 2,56 0,11 0,11 0,03 1,3 1,74 -0,71 -0,69 -0,17 1,3 1,88 -0,56 -0,55 -0,13 1,4 5,15 2,25

      2,19 0,59 1,4 2,41 -0,49 -0,47 -0,11

      1,4 2,00 -0,90 -0,87 -0,21 1,5 3,56 0,21 0,21 0,05 1,5 3,09 -0,26 -0,25 -0,06 1,5 0,78 -2,57

    • -2,50
    • 0,72 1,6 4,29 0,50 0,49 0,11 1,6 3,33 -0,47 -0,45 -0,11 1,6 3,10 -0,70 -0,68 -0,16 4 15,00 0,42 1,34

      4,40 Dugaan persamaan regresi DATA LENGKAP : Y1 = - 3,39 + 4,49 X1 Banyaknya parameter = 2 Æ p = 2 Banyaknya pengamatan = 19 Æ n = 19 Pengamatan ke -19 memiliki nilai D

      19 = 4,40 Dengan

      α = 5% Nilai tabel F (p,n-p; 1- α)

      = F (2,17; 0,95)

      = 3,59 D

      19 > F

      (2,17; 0,95) Dengan α = 5%, amatan ke 19 (terakhir) merupakan amatan berpengaruh.

      CONTOH PENGGUNAAN D i

      

    Amatan Berpengaruh

    (lanjutan)