Relationship vs Causal Relationship

  

Metode Statistika

Pertemuan XIV

Analisis Korelasi dan Regresi

  Analisis Hubungan Jenis/tipe hubungan Ukuran Keterkaitan

  Pemodelan Keterkaitan Skala pengukuran variabel

  

Relationship vs Causal

Relationship

  Tidak semua hubungan (relationship) berupa hubungan sebab-akibat 

  

Penentuan suatu hubungan bersifat

sebab-akibat memerlukan well-argued position dari bidang ilmu terkait

  Alat Analisis Keterkaitan 

  Ditentukan oleh:

  1. Skala pengukuran data/variabel

  2. Jenis hubungan antar variabel Relationship Numerik Kategorik Numerik Korelasi Pearson, Spearman Tabel Ringkasan

  Kategorik Tabel Ringkasan Spearman (ordinal), Chi Square Causal relationship

  X Numerik Kategorik Y

Numerik Regresi Linier ANOVA

Kategorik Regresi Logistik Regresi Logistik

  Regresi 

  

Melihat pengaruh variabel independen

terhadap variabel dependen

  Hubungan linear dan non linear

  Sederhana atau berganda

  Linear : linear dalam parameter Sederhana : hanya satu peubah penjelas Berganda : lebih dari satu peubah penjelas

  Tipe Persamaan Linear y = b x + c Logarithmic y = a ln x + b Polynomial y= a + bx + cx

  

2

  3 + ex

  4 + fx

  5 Power y = a x b Exponential y = a e bx

Contoh Model Regresi

  • + dx
Regresi Secara umum analisis regresi bertujuan untuk:

  1. Menduga/meramal dependent variable contoh: Menduga bobot badan, dengan variabel lain yang mudah diukur. Variabel penjelas apa saja yang digunakan, model apa yang digunakan, dan seberapa besar kontribusi masing-masing variabel penjelas menjadi tidak penting untuk tujuan ini. Yang penting adalah mendapatkan perkiraan bobot badan yang mendekati nilai sesungguhnya berdasar variabel penjelas.

  2. Pemilihan variabel contoh: Mencari faktor-faktor yang mempengaruhi pendapatan per kapita. Untuk tujuan ini berapa

pendapatan per kapita tidak menjadi tumpuan perhatian,

yang penting variabel apa saja yang dominan

  3. Spesifikasi model

contoh: Menentukan bentuk hubungan antara harga ban

mobil dengan harga karet mentah. Apakah harga karet

mentah mempengaruhi harga ban mobil secara linear, kuadratik, eksponensial, atau bentuk yang lain. Dalam hal ini pemahaman teori tentang masalah yang dikaji sangat membantu.

  4. Pendugaan parameter contoh: Membandingkan seberapa besar sumbangan

masing-masing faktor input dalam menentukan produksi hasil pertanian. Dalam hal ini yang terpenting adalah untuk menentukan besarnya koefisien regresi dari masing-masing independent variabel. Simple Linear Regression

  Peubah penjelas satu

  > satu Multiple Linear Regression

  Hubungan parameter linear

  non linear

  Regresi non linear Regresi Linear

ANALISIS REGRESI

  • Fungsional (deterministik)  Y=f(X) ; misalnya: Y=10X

  Hubungan Antar Peubah:

  • Statistik (stokastik)  amatan tidak jatuh pas pada kurva
  • Mis: IQ vs Prestasi, Berat vs Tinggi, Dosis Pupuk vs Produksi

  Model regresi linear sederhana:

  • Y

  X ; i 1 , 2 ,..., n        i

  1 i i Regresi

  Makna  &  ?

  1 Regresi

Pendugaan terhadap koefisien regresi:

  •  b penduga bagi  dan b penduga bagi 

  

1

  1 ( x )( y )

    xy

    n b

  

  1

  ( x )

2 Metode

  2  x

   Kuadrat Terkecil

   n b y b x

   

1 Bagaimana Pengujian terhadap model regresi ??

  parsial (per koefisien)  uji-t

  • bersama  uji-F (Anova)
  • Bagaimana menilai kesesuaian model ??
Metoda Kuadrat Terkecil 

  Pendugaan parameter pada regresi didapat dengan meminimumkan jumlah kuadrat galat.

  

dijelaskan dan yang tidak

dapat dijelaskan

    Minimumkan Q

   

  ()/() Contoh Data

Percobaan dalam bidang lingkungan Jarak Emisi

  31 553 Apakah semakin tua mobil semakin 38 590 besar juga emisi HC yang dihasilkan? 48 608 Diambil contoh 10 mobil secara 52 682 acak, kemudian dicatat jarak tempuh 63 752 yang sudah dijalani mobil (dalam 67 725 ribu kilometer) dan diukur Emisi 75 834 HC-nya (dalam ppm) 84 752

  89 845 99 960 Plot antara Emisi Hc (ppm) dg Jarak Tempuh Mobil (ribu kilometer) 950 850 i is

  750 Em

  650 550

  30

  40

  50

  

60

  70

  80 90 100 Jarak

  

Pendugaan Koefisien

Regresi

Emisi (Y) Jarak (X) Y 2 X 2 XY 553

  31 305809 961 17143 590 38 348100 1444 22420 608 48 369664 2304 29184 682 52 465124 2704 35464 752 63 565504 3969 47376 725 67 525625 4489 48575 834 75 695556 5625 62550 752 84 565504 7056 63168 845 89 714025 7921 75205 960 99 921600 9801 95040 Total 7301 646 5476511 46274 496125

  10 10

  

Pendugaan koefisien

regresi

n

  X Y

  X Y i i i i  10 ( 496125 ) ( 646 )( 7301 244804

   ˆ   

  5 , 389

       1 2 2 2 n X ( X )

  10 ( 46274 ) ( 646 ) 45424 i i  

    ˆ ˆ

  X 730 , 1 ( 5 , 389 )(

64 ,

6 ) 381 , 9506  Y       1 Emisi = 382 + 5.39 Jarak

  Diskusi (1) 

  Berapa emisi HC yang dihasilkan jika jarak tempuh sekitar 70 ribu km? 

  Berapa emisi HC yang dihasilkan jika jarak tempuh sekitar 110 ribu km? apakah hasil dugaan ini valid? Kenapa? Contoh output regresi

  Regression Analysis (Emisi Hc vs Jarak Tempuh Mobil) The regression equation is Emisi = 382 + 5.39 Jarak Predictor Coef StDev T P Constant 381.95 42.40 9.01 0.000 Jarak 5.3893 0.6233 8.65 0.000 S = 42.01 R-Sq = 90.3% R-Sq(adj) = 89.1% Analysis of Variance Source DF SS MS F P Regression 1 131932 131932 74.76 0.000 Error 8 14118 1765 Total 9 146051 Unusual Observations

Obs Jarak Emisi Fit StDev Fit Residual St Resid

8 84.0 752.0 834.7 18.0 -82.7 -2.18R Bagaimana Pengujian terhadap model regresi ??

  • parsial (per koefsien)  uji-t
  • bersama  uji-F (Anova)

  

Bagaimana menilai kesesuaian model ??

R

  2  Koef. Determinasi

  (% keragaman Y yang mampu dijelaskan oleh X)

  Uji Hipotesis H :  =0 vs H :  0

  1

  1

  1 ANOVA (Analysis of Variance)  Uji F

  n n n

  2

  2

  2

  ˆ ˆ ( y y ) ( y y ) ( y y )

      

  i i i i    i 1 i 1 i

  1    JK total = JK regresi + JK error Keragaman total = keragaman yang dapat dijelaskan oleh model + keragaman yang tidak dapat dijelaskan oleh model

  Anova

  Sumber db JK KT F Regresi

1 JKR KTR KTR/KTE

  Uji Hipotesis H : 

  ) (

    n y y s x x s S

     

  1 1  

  1

  2

  2

  2 ) ˆ (

  1

  Uji Parsial Statistik uji:

  >0

  1

  : 

  1

  ≤0 vs H

  S b T i i i b b

    Var(

   Var(

   Var(

  Fitted Line Plot Emisi = 382.0 + 5.389 Jarak 1100

  Regression 95% CI 95% PI

  1000 S 42.0096 R-Sq 90.3%

  900 R-Sq(adj) 89.1%

  800 i is Em

  700 600 500 400

  30

  40

  50

  60

  70

  80 90 100 Jarak

  

Diskusi (2)

  Berapa emisi HC yang dihasilkan jika jarak tempuh sekitar 70 ribu km? 

  

Tentukan selang kepercayaan 95% bagi

emisi HC jika waktu tempuhnya sekitar 70 ribu km?  prediction interval

  

Tentukan selang kepercayaan 95% bagi

rata-rata emisi HC jika waktu tempuhnya

sekitar 70 ribu km?  confidence interval

   Lebih lebar mana selang interval antara prediction interval dengan confidence interval? Kenapa?

  Diskusi (3) 

  Tentukan formula untuk prediction interval dan confidence interval! Keterbatasan Korelasi

dan Regresi Linear

  Korelasi dan Regresi Linear hanya menggambarkan hubungan yang linear 

  Korelasi dan metode kuadrat terkecil pada regresi linear tidak resisten terhadap pencilan

   Prediksi di luar selang nilai X tidak diperkenankan karena kurang akurat

   Hubungan antara dua variabel bisa dipengaruhi oleh variabel lain di luar model

  ‘All models are wrong, but some are useful’ (G. E. P. Box)

  Korelasi

  Korelasi

  r = 1 r = 0

  Koefisien Korelasi  tidak menggambarkan hubungan sebab akibat

   nilainya berkisar antara -1 dan 1

   tanda (+) / (-)  arah hubungan

  (+) searah;

  • – (-) beralawanan arah
  • – 

  Pearson’s Coef of Correlation  linear relationship 

  

Spearman’n Coef of Correlation (rank

PARAMETRIK NON PARAMETRIK

   

LINEAR RELATIONSHIP TREND RELATIONSHIP

   RANK CORRELATION

SPEARMAN PEARSON CORRELATION CORRELATION

  Pearson correlation Spearman correlation S xy r

   xy

  S S x y

  ( x x )( y y )   i i

   S

   xy n

  1 

  2

  2 ( x x ) ( y y )   i i

    S dan S

    x y

  R = peringkat dari X

  n 1 n

  1  

  S = peringkat dari Y = rataan peringkat X = rataan peringkat Y Korelasi !!!

  Contoh Data

Percobaan dalam bidang lingkungan Jarak Emisi

  31 553 Apakah semakin tua mobil semakin 38 590 besar juga emisi HC yang dihasilkan? 48 608 Diambil contoh 10 mobil secara 52 682 acak, kemudian dicatat jarak tempuh 63 752 yang sudah dijalani mobil (dalam 67 725 ribu kilometer) dan diukur Emisi 75 834 HC-nya (dalam ppm) 84 752

  89 845 99 960 Plot antara Emisi Hc (ppm) dg Jarak Tempuh Mobil (ribu kilometer) 950 850 i is

  750 Em

  650 550

  30

  40

  50

  

60

  70

  80 90 100 Jarak Pendugaan Koefisien Korelasi Pearson Emisi (Y) Jarak (X) Y 2 X 2 XY 553

  31 305809 961 17143 590 38 348100 1444 22420 608 48 369664 2304 29184 682 52 465124 2704 35464 752 63 565504 3969 47376 725 67 525625 4489 48575 834 75 695556 5625 62550 752 84 565504 7056 63168 845 89 714025 7921 75205 960 99 921600 9801 95040 Total 7301 646 5476511 46274 496125

  

Pendugaan

koefisien korelasi Pearson

n

  X Y

  X Yi i i i

     r

   YX

  2

  2

  2

  2 [ n Y ( Y ) ][ n X ( X ) ]   i i i i

     

10 ( 496125 ) ( 646 )( 7301 244804

  , 9504   

  2

  2 757569 ,

  7 [ 10 ( 5746511 ) ( 7301 ) ][ 10 ( 46274 ) ( 646 ) ]   Pengujian Korelasi 

  Ho : tidak ada Korelasi ( = 0) 

  H1 : Ada korelasi ( = 0) 

  Statistik uji :

  Hipotesis nol lebih general (Ho :  =p) db = n-2

  ) ) 1 ( ln(

  1 ) ( r r z

    ) ( ) ( 

   p z r z z

  2

  1

  2 r n r t

    

KORELASI SPEARMAN

  63 725

  Korelasi Pearson 0.693

  63 500 600 700 800 900 1000 1100 10 20 30 40 50 60 70 80 Ja 90 100 Emisi ra k

  89 1010

  84 845

  75 752

  67 834

  

  Misalkan pengamatan ke-10 menjadi jarak yang ditempuh = 63, namun buangan gas emisi-nya sebesar 1010

  48 682

  38 608

  31 590

  553

  Jarak (X)

  Emisi (Y)

  52 752

  (Y) (X) R S R2 S2 RS 553

  9

  35 834

  75

  8

  8

  64

  64

  64 752

  84

  6

  9

  36

  81

  54 845

  89

  10 81 100

  25

  90 1010

  63

  10 5 100

  25

  50 Total 7351 610

  54 54 372 374 353

  614 ) ) 54 ( 353 ( 54 )(

  10 ] ) ( ][ ) ( [

  2

  2

  2

  2   

          i i i i i i i i

  YX S S n R R n

  49

  7

  31

  9

  1

  1

  1

  1

  1 590

  38

  2

  2

  4

  4

  4 608

  48

  3

  3

  9

  5

  9 682

  52

  4

  4

  16

  16

  16 752

  63

  6

  5

  36

  25

  30 725

  67

  S R S R n r

Dokumen yang terkait

PESAN SOSIAL DALAM FILM (Sebuah Analisis Isi pada Film Me vs High Heels Karya Pingkan Utari)

0 45 2

Hubungan antara Faktor Pendukung Customer Relationship Management dengan Loyalitas Pasien di Instalasi Rawat Jalan Rumah Sakit Paru Jember (Correlation between Supporting Factors of Customer Relationship Management with Customer Loyalty in Outpatient Inst

0 20 8

Hubungan antara Faktor Pribadi dan Faktor Lingkungan dengan Tindakan Kesehatan Reproduksi Remaja (Studi di SMA Negeri 4 Jember) (The Relationship between Individual and Circumstances Factors with Reproductive Health Action of Adolescent )

0 15 8

Hubungan Sumber Informasi Dengan Perilaku Seksual Berisiko Remaja Di Kecamatan Sumbersari Kabupaten Jember (The Relationship Between Source of Information With Risk Sexual Behavior On Adolescent In District Sumbersari In Jember Regency)

0 34 8

Hubungan Tingkat Kecemasan Dengan Frekuensi Kekambuhan Keluhan Sesak Napas Pada Pasien Asma Bronkial Di SMF Paru RSD DR. Soebandi Jember (The Relationship of Anxiety Levels with Frequency of Dispneu Exacerbation in Asthma Bronchial's Patients at SMF Pulmo

1 24 9

Hubungan Tingkat Kecemasan pada Pasien Multigravida dalam Persalinan Normal dengan Lama Persalinan di RSD dr.Soebandi Kabupaten Jember (The Relationship between Anxiety Level in Multigravida on Facing Normal Delivery and Length of Delivery at dr.Soebandi

2 46 4

The Relationship between Students’ Motivation and Their English Learning Achievement (A Correlational Study at the Second Grade of SMAN 3 TANGSEL)

4 42 71

Customer Relationship Management (CRM) Di PT. Azizi Audhinia Wisata Tour Dan Travel

2 26 63

Sistem Pemasaran Dan Pemesanan Barang Dengan Metode Customer Relationship Management Berbasis Web Pada PT.Yoshindo Indoensia Technology Jakarta

11 68 215

HUBUNGAN DUKUNGAN KELUARGA DENGAN Quality of Life (QOL) PADA KEJADIAN STROKE Relationship Of Family Support With Quality of Life (QOL) Stroke Occurrence

0 1 7