Lecture 9 Analisis data statistik new

  Analisa Data Statistik

Referensi

   Agoes Soehianie, Ph.D

  Daftar Isi

 Inferensi Statistik

Hipotesa Statistik : Konsep Umum

  Hipotesa statistik adalah sebuah klaim/pernyataan atau conjecture tentang populasi.

  Contoh masalah yg akan dijawab dengan hipotesa statistik: Apakah merokok menaikkan resiko kanker?

  • Apakah tipe darah ada hubungannya dengan berat badan?
  • Berapa persen pemilih yg akan memilih calon A sebagai
  • presiden?

Situasi Yang Mungking Dalam Test Hipotesa Statistik

  H0 benar H0 salah H0 Tidak ditolak Keputusan Benar Error Tipe II (

  β) H0 Ditolak Error Tipe I ( Keputusan Benar

  α)

Daerah Kritis dan Nilai Kritis

  Daerah kritis adalah luas ekor di kurva normal, yang menyatakan probabilitas untuk mendapatkan nilai rata-rata sampel lebih besar atau lebih kecil dari nilai kritis tertentu, walaupun nilai rata-rata populasinya sebesar X=X . Luas daerah kritis ini mencerminkan probabilitas untuk menolak H0 walaupun sebenarnya H0 benar.

Test 1 Ekor dan 2 Ekor

  Jika Hipotesa Alternatif berupa ketidaksamaan disebut test 1 ekor: H0 : X = X H1 : X > X

  Atau H0 : X = X H1 : X < X

Prosedur Testing Hipotesis Dengan Error Tipe I

  ditentukan dulu ( α Fixed) 1.

  Tuliskan H0 dan H1 2. Pilih tingkat signifikan yaitu

  α (biasanya 5% atau 10%) 3. Pilih test statistik yg sesuai dan nilai kritis yg membatasi daerah kritis sesuai dengan tingkat signifikan yg dipilih

  4. Hitung statistik yg bersesuaian dengan (3) di atas berdasarkan sampel data.

  5. Ambil keputusan : H0 ditolak jika hasil hitung test statistik masuk

  di daerah kritis, kalau tidak H0 tidak bisa ditolak (atau terima H1) 6. Buat kesimpulan

  

Test STatistik Berkenaan dengan Rata-Rata 1 Populasi

(Variansi Populasi diketahui)

  Situasi : ingin diketahui rata-rata sebuah populasi. Variansi populasi (

  σ) diketahui . Dari sampel yg diambil berukuran n diketahui rata- rata sampelnya x .

  s

  Test

  • – 1 ekor

  1. Tuliskan H0 dan H1

  H0 : μ = μ H1 : μ ≠ μ

  2. Pilih tingkat signifikan : α (misal 5%)

  3. Test statistik bagi rata-rata adalah nilai Z dari rata-rata, karena =

  α=5% maka nilai kritis yg bersesuaian dari tabel adalah Z

  0.025

Contoh

  Sebuah pabrik senar pancing mengklaim produk barunya memiliki kekuatan rata-rata 8kg dan standard deviasi 0.5kg. Sampel random 50 buah senar baru tsb menghasilkan rata-rata kekuatan 7.8kg. Periksalah hipotesa

  μ=8kg tsb dengan alternative μ≠8kg dengan tingkat signifikan 1%.

Solusi

  1. H0: μ=8 dan H1: μ≠8 2.

  α = 0.01

  3. Daerah kritis Z = 2.575

  0.005

  Tolak H0 jika Z < -2.575 atau Z > 2.575, dengan

  x   Z   / n

  4. Hitung statistik:

  x   8  7 .

  8

Soal: test 1 ekor

  Sampel random 100 catatan kematian di USA tahun lalu menyatakan umur rata-rata penduduknya 71.8 tahun. Misalkan diketahui standard deviasi populasi adalah 8.9 tahun, apakah hasil ini mendukung dugaan bahwa umur rata-rata penduduk USA lebih dari 70 tahun? Pergunakan tingkat signifikan 5%.

  

Test STatistik Berkenaan dengan Rata-Rata 1 Populasi

(Variansi Populasi Tidak diketahui)

  Situasi : ingin diketahui rata-rata sebuah populasi. Variansi populasi (

  σ) TIDAK diketahui tetapi populasi dianggap normal. Dari sampel yg diambil berukuran n diketahui rata-rata sampelnya x . Maka

  s

  statistik yg bersesuaian adalah student-t statistik:

  x   tS n

  /

Contoh

  Hasil studi tentang konsumsi listrik berbagai peralatan rumah tangga mengklaim bahwa vacuum cleaner rata-rata mengkonsumsi 46 KwH/tahun. Sampel random 12 rumah tangga yg memiliki vacuum cleaner menghasilkan rata-rata 42 KwH/tahun dengan standard deviasi sampel 11.9 KwH. Apakah hasil ini menyarankan bahwa sebenarnya vacuum cleaner mengkonsumsi listrik rata- rata di bawah 46 KwH /tahun? Pergunakanlah tingkat signifikan 5% dan asumsikan populasimnya terdistribusi normal.

Solusi

  1. H0: μ=46 dan H1: μ < 46 2.

  α = 0.05

  3. Daerah kritis (1 ekor, student-t) n= 12, derajat kebebasan v=n-1=11 t =-1.796 (ekor kiri)

  4. Hitung statistik:

  

Test STatistik Berkenaan dengan Rata-Rata 2 Populasi

(Variansi Populasi diketahui)

  Situasi : berdasarkan 2 set sampel dengan rata-rata x dan x yg

  berasal dari dua populasi, ingin diketahui perbedaan rata-rata dari dua buah populasi asal sampel diambil. Jika variansi populasi ( σ

  1

  dan ) diketahui, maka variabel statistik: σ

  2

( x x ) (   )

  

  1

  2

  1

  2 Z

  2

  2

 

  1

  2  n n

  1

  2

Contoh

  Pabrik benang mengklaim bahwa rata-rata kekuatan benang tipe A paling tidak 12 kg lebih besar dibandingkan benang tipe B. Untuk memeriksa klaim tersebut diambil sampel 50 buah dari tiap-tiap tipe benang. Ternyata sampel benang A memiliki rata-rata kekuatan 86.7 kg, standard deviasi populasi dari benang tipe A diketahui 6.26 kg. Sedangkan rata-rata kekuatan sampel benang B adalah 77.8 kg, dan dari data-data sebelumnya diketahui standard deviasi kekuatan benang B adalah 5.61. Periksalah klaim pabrik tsb pada tingkat signifikan 5%.

Solusi

  Diketahui: Benang A Benang B nA = 50 nB=50 x = 86.7 x = 77.8

  sA sB

  = 6.26 = 5.61 σ

  σ

  A B

  α=5% Klaim : x -x > 12

  SA sB 1.

  Hipotesa

Solusi

  3. Daerah kritis Test statistik untuk kasus ini adalah Z, :

  ( xx )  (    ) 1 2 1 2 Z2 2   1 2

   n n 1 2 dengan nilai kritis Z = 1.65.

  Hitung statistik

  

Test STatistik Berkenaan dengan Rata-Rata 2 Populasi

(Variansi Populasi TIDAK diketahui TAPI SAMA)

  Situasi : berdasarkan 2 set sampel yg memiliki rata-rata sampel xSA dan xSB serta standard deviasi sampel SA dan S yang berasal

  B

  dari dua populasi normal, ingin diketahui perbedaan rata-rata dari dua buah populasi asal sampel diambil. Variansi populasi ( dan σ

  1

  ) TIDAK diketahui tapi dapat dianggap SAMA, maka variabel σ

  2

  statistik:

  1

  2

  1

  2 t

  ( x x ) ( )     

  

  1

  1 SP n n

  1

  

1

  2

  2

Contoh

  Kecepatan penipisan lapisan pelindung produksi dari sebuah pabrik ditest secara statistik. Pabrik tsb ingin mengetahui perbedaan kecepatan penipisan lapisan pelindung yg terbuat dari bahan A dan dari bahan B. 12 sampel dari bahan A dicek, dan didapati rata-rata penipisan 85 unit dan standard deviasi 4. Sedangkan 10 buah sampel dari bahan B memiliki rata-rata 81 dengan sampel standard deviasi 5. Dapatkah disimpulkan bahwa rata-rata penipisan bahan A lebih besar dari 2 unit dibandingkan penipisan bahan B? Asumsikan populasi keduanya normal, dan variansi kedua populasi sama. Pergunakan tingkat signigikan 5%

Solusi

  Diketahui: Sampel A Sampel B n = 12 n = 10

  A B

  x = 85 x = 81

  sA SB

  S = 4 S = 5.

  A B σ tidak diketahui, tapi dianggap sama. Populasi normal.

  α= 5%

Solusi

  1. Hipotesa H0:

  μA – μB ≤ 2

  H1:

  μA – μB > 2

  2. Tingkat signifikan α = 5%

  3. Daerah kritis Test statistik yg dipakai adalah student t, dengan derajat kebebasan v=n +n

  • – 2 = 12+10-2 = 20, dengan t adalah

  A B 2 2 ( xx )  (    ) 1 2 1 2 2 ( n  1 ) S  ( n  1 ) S

Solusi

  4. Hitung statistik: 2 2 2 2

  n S n S 2 (  1 1 )  (  1 2 1 * * ) ( 2 12  1 ) 4  ( 10  1 )

  5 S P    4 . 478 n n 1   2

  2

12 

10 

  2 ( xx )  (    ) ( 1 2 1 2 85  81 )  (

2 )

t    hitung 1 .

  04

  1

  1

  1

  

1

SP 4 . 478  n n 1 1

  12

  

10

  5. Keputusan: Karena t < 1.725, maka H0 tak dapat ditolak,

  hitung

  

Test Statistik Berkenaan dengan Rata-Rata 2 Populasi

(Variansi Populasi TIDAK diketahui TAPI BEDA)

  Situasi : berdasarkan 2 set sampel yg memiliki rata-rata sampel x

  SA

  dan x serta standard deviasi sampel S dan S yang berasal

  SB A B

  dari dua populasi normal, ingin diketahui perbedaan rata-rata dari dua buah populasi asal sampel diambil. Variansi populasi ( dan σ

  1

  ) TIDAK diketahui tapi dapat dianggap BEDA, maka variabel σ

  2

  statistik:

  1

  2

  1

  2 t

  ( x x ) ( )     

  

  2

  1

  2  n n

  1

  2

  dengan derajat kebebasan v:

Contoh

  Berikut ini adalah data lama waktu pemutaran film yg diproduksi oleh dua buah rumah produksi: Rumah Produksi LAMA WAKTU (menit) A 102 80 98 109 92

  B 81 165 97 134 92 87 114

  Hipotesanya adalah rata-rata lama waktu film produksi B lebih lama 10 menit dibandingkan rumah produksi A, dengan alternatif hipotesanya

Solusi

  Perhitungan rata-rata dan variansi N

  XA

  XB 2 2 dA=XA-Xsa dB=XB-Xsb dA dB x j

   102

  81 jx

  5.8 -29 33.64 841 N

  80 165 N

  • 16.2 55 262.4 3025
  • 2 ( xx ) j

      

      98

      97 2 j 1.8 -13 3.24 169

       S N

      1 109 134 12.8 24 163.8 576

      92

      92

    Solusi 913 3

      120 2 . 2 2 2 2 2 1  

         

         

      S S

      Variabel t : Derajat kebebasan v: 306 .

      7 / 913 3 . 5 / 120 2 .

      ) ) 10 ( 2 . ( 96 110 ) ( ) ( 2 2

          

           B B A A A B A B n S n S x x t

       

    Solusi

      1. Hipotesa

      μ μ ≥ 10

    • – H0:

      B A

      H1: <10 μ – μ

      B A

      2. Tingkat signifikan α = 0.1

      3. Daerah kritis Test statistik yg dipakai adalah variabel t:

      x x (  )  (    ) 1

    2

    1 2

    Solusi

      4. Perhitungan statistik:

      ( xx )  (    ) ( 110  B A B A 96 . 2 )  ( 10 ) t hitung    . 306 2 2

    120 .

    2 / 5  913 . 3 /

      7 S S A Bn n A B

      5. Keputusan: Karena t > -1.397 maka H0 tak bisa ditolak atau lama waktu film

      hitung

      A memang lebih dari 10 menit dari pada film B

      Test Statistik Berkenaan dengan Pengamatan

    Pasangan Data

      Situasi : Pengamatan pasangan data, dengan d , d dst adalah

      1

      2

      selisih dari data-data hasil pengamatan yang diambil dari populasi normal. Ingin diketahui apakah rata-rata selisihnya sama dengan nilai tertentu. Dari sampel-sampel diketahui rata-rata dan standard deviasi selisih sampel sebagai D dan S . Variabel

      D

      statistik yg diperiksa adalah:

      d  

      

    D

    t

       S / n

      D

      dimana adalah rata-rata populasi yang memiliki distribusi μ

      D