Materi 1: Pengantar dan Statistika Deskriptif

  Pengant ar & St at ist ika Deskript if

MA 2081 Statistika Dasar

  28 Agustus 2012 Utriweni Mukhaiyar

  28 Agustus 2012

  • • Berikut adalah data produksi pan as bum i di

  41.49

  4. Sign ifikan si rata-rata produksi pan as bum i di area pen geboran tersebut.

  4 Sign ifikan si rata-rata produksi pan as bum i di area pen geboran S TATIS TIKA D ES KRIP TIF

  3. Lokasi pen geboran den gan n ilai produksi yan g ekstrim .

  2. Pen yebaran n ilai produksi pan as bum i di area S TATIS TIKA y p p wilayah pen geboran tersebut.

  In form asi apa yan g in gin diperoleh dari data in i ? 1. Rata-rata produksi pan as bum i di 25 lokasi tersebut.

  14.37 

  77.96

  41.60

  32.35

  70.00

  14.32

  83.00

  47.70

  27.79

  Ilust rasi Ilust rasi

  43.04 45.75 111.27

  42.13

  87.46

  27.14 87 46 42 13 43 04 45 75 111 27

  64.52

  54.12

  24.00

  60.00

  85.64

  89.54

  60.00

  44.24

  77.71

  25 titik pen geboran (ton / jam ): 25 titik pen geboran (ton / jam ):

  IN FEREN S I

  Statistik dan Statistika Statistik dan Statistika : nilai-nilai ukuran data yang mudah dimengerti. Statistik Contoh : o statistik (mis. rata-rata) nilai elevasi pasang surut air laut di o selat Makassar (m), statistik (mis. variansi) hasil pengukuran tinggi gelombang o ( (cm) menggunakan AWLR (Automatic Water Level Recorder) ) gg (

  ) Statisitik (mis. range) antara nilai tinggi pasang maksimum dan surut minimum (m)

  : ilmu yang berkaitan dengan cara pengumpulan, il b k it d l

  Statistika St ti tik pengolahan, analisis dan pernarikan kesimpulan atas data.

  Jenis-j enis Statistika j

  1. Statistika deskriptif: metode yang berkaitan dengan pengumpulan dan penyajian data.

  2. Statistika inferensi: metode yang berkaitan k f d b k dengan analisis sampel untuk penarikan kesimpulan tentang karakteristik populasi. kesimpulan tentang karakteristik populasi Populasi dan Sampel Populasi Sampel Sampel setiap obyek populasi memiliki p y p p m m kemungkinan/kesempatan yang

  Sampel Acak sama untuk terpilih hasil pengukuran atau pengamatan

  Data Cont oh Populasi dan Sampel p p

  • • Akan dilakukan pen gam atan ten tan g rata-rata

    produksi m in yak bum i di In don esia produksi m in yak bum i di In don esia.

  Populasi S l h t it ik

  Kendala: - sangat banyak, - m enghabiskan Seluruh t it ik di wilayah

  I ndonesia ? wakt u, - m enghabiskan biaya

  Kaidah Pengambilan Sampel (Teknik Keterwakilan sam pel atas populasi ??

  Sampel ? p ( Sampling)

p p

p

  Cont oh: set iap propinsi diam bil beberapa t it ik pengam at an Jenis-j enis Observasi OBSERVASI / DATA KUALITATIF

  KUANTITATIF

Nom in al Ordin al/ Ran k Diskrit Kon tin u

Tidak m en gen al urutan dan operasi aritm atika Men gen al urutan dan operasi aritm atika

  Berhubun gan den gan ‘proses m en ghitun g’, dan pen gam atan atas Didasarkan pada suatu selang/interval sehingga meliputi aritm atika aritm atika him pun an terhitun g. sem ua bilan gan riil

  J en is ben can a yan g terjadi di suatu daerah (b ji l J en jan g pen didikan

  (SD, SMP, SMA,...), tin gkatan daerah Ban yakn ya gem pa yan g terjadi di suatu daerah dalam 1 hari, ban yakn ya In ten sitas gem pa yan g terjadi setiap hari di

(ban jir, lon gsor, t il h ti k t

gem pa, dll), jen is batuan , dll g (Kelurahan , Kecam atan

  Kab./ Kota, Provin si, , y y hari hujan dalam satu bulan di suatu daerah, dll suatu wilayah, tin gkat curah hujan harian di suatu daerah, dll St at ist ika Deskript if St at ist ika Deskript if Metode Tujuan : Metode pengolahan dan penyajian suatu gugus data

  

Tujuan :

memberikan

informasi yang

berguna.

  Informasi berupa : bentuk distribusi data Mean , m edian , Ukuran m odus, kuartil, @ UM Pem usatan desil, persentil, dll Ukuran Varian si, sim pan gan

  Pen yebaran baku, ran ge, PARAMETER (Variabilitas) jan gkauan kuartil, dll DISTRIBUSI

  Kem en cen gan Skewn ess Kelan cipan Kelan cipan Kurtosis Kurtosis Karakteristik

  Mean = Sim etris Distribusi

  Median Mean > Kesim etrisan Skew Positif Median

  Mean < Skew Negatif BENTUK

  Median DISTRIBUSI Pun cak 1 m odus 1 m odus tun ggal t l Pun cak

  (Modal) Karakteristik Distribusi mean , median, modus ,

  1. PARAMETER Ukuran kuartil atas, kuartil

  DISTRIBUSI DISTRIBUSI Pem usatan Pem usatan bawah, dll bawah dll Ran ge, sim pan gan baku,

  Ukuran varian si , jan gkauan

  Pen yebaran y an tar kuartil, dll

  Kem encengan skewn ess

  Kelancipan kurtosis

  2. BENTUK Sim etris m ean = m edian DISTRIBUSI

  Menceng/ skew Menceng/ skew m ean > m edian

  Positif Berpun cak Berpun cak Men cen g/ skew m ean < m edian

  J am ak Tunggal gg gg Negatif g g CONTOH 1 CONTOH 1 Data rata-rata curah hujan bulan an yan g diam ati

dari Stasiun Padaheran g pada tahun 20 0 1 (n = 12)

  278.59 279.78 355.29 241.34 115.9 176.9

  55.32

  29.08 43.82 313.68 508.49 267.82 x

  1 x

  2 x

  12 x

  7 x

  10 Data yan g diurutkan :

29.08 43.82 55.32 115.9 176.9 241.34 267.82 278.59 279.78 313.68 355.29 508.49

x

  (1) x

  (2) x

  (12)

  X (7) x

  (10) m inim um m aksim um Ukuran Pemusat an & Penyebaran Dat a U ku ra n p e m u s a ta n d a ta

  • statistik yan g m em berikan in form asi dim an a data statistik yan g m em berikan in form asi dim an a data terkum pul den gan ukuran / jum lah terten tu. Con toh : Mean (rataan) , kuartil bawah, kuartil ten gah (m edian ), kuartil atas, m odus, persen til, ... ten gah (m edian ) k artil atas m od s persen til

  U ku ra n p e n ye b a ra n d a ta

  • statistik yan g m em berikan in form asi bagaim an a y g

  g data m en yebar di sekitar pusat data.

  Con toh : ran ge (jan gkauan data), IQR (jan gkauan

antar kuartil), antar kuartil) varian si varian si , stan dar deviasi (sim pan gan stan dar deviasi (sim pan gan baku) , ... Ukuran Pemusat an Dat a Ukuran Pemusat an Dat a

1. Mean (rata-rata) ( )

  1

n

i x x n

  

  

1 i

n

  

  Contoh :

  1

  2

  12 ...

  12     x x x x

  278.59 279.78 ... 267.82 222.17 12   

   

  

29.08 43.82 55.32 115.9 176.9 241.34 267.82 278.59 279.78 313.68 355.29 508.49

50 % data (awal 50 % data ( awal)) 50 % data (akhir 50 % data ( akhir))

  X X (6.5)

  2. Median Nilai tengah yang membagi dua kelompok data Nil i t h b i d k l k d t sama banyak.

med = x = x + 0.5 (x - x )= 254.58

  (6.5) (6) (7) (6)

  3 M d Nilai yang paling sering muncul. modus tidak ada

  3. Modus

4. Kuartil

  2 ) :

  2 (6 5) 12 1 254.58

       q x x

  2 2( 1)

  1

  4

  2 n n q x x

               

    Kuartil tengah (q

  2 (6.5) 12 1

                q x x x x x

  2 254.58

         q x x

  3 3( 1) n q x

      

   Kuartil atas (q

  3 ) :

  15

  3

  4    

  4    

  25 % 25 % 25 % 25 % 25 % 25 % 25 % 25 % 29.08 43.82 55.32 115.9 176.9 241.34 267.82 278.59 279.78 313.68 355.29 508.49 q d q

   Kuartil bawah (q

        

  1 ) : q

  1 q

  2 = med q

  3

  1

  1

  4 n

q x

        

   

  70.47

  1 12 1

  1

  3

  4

  3

  3

  4

  4

  1

  4     

5. Persentil

  50 = med p

  75

  29.08 43.82 55.32 115.9 176.9 241.34 267.82 278.59 279.78 313.68 355.29 508.49 p

  25 p

  • Persentil ke-i :

  ( 1) i n x

  

  

  • Persentil ke-50 :

  1 x x

       

  ( 1) 100 i n

        median

  50( 1)

  1 100

  2 n n x x

               

  50( 1)

  • Persentil ke-25 dan Persentil ke-75?

  Ukuran Penyebaran Dat a y Data : x D , x , x , ..., x n

  1

  2

  3 Rataan : x

  Ukuran penyebaran data yang Ukuran penyebaran data yang melihat bagaimana SETIAP (keseluruhan) observasi terpisah dari pusat data. dari pusat data n

  Tidak memberikan informasi apa- p x x ( (  ) ) i i

    i

  1 apa, karena : n n

  Jumlah Kuadrat (JK) x x x nx nx nx

  (  )      i i

      n ii

  1

  1

  2 x x

  (  ) i

  • – data

  1 ( )

  2 k k l

  3. Simpangan Baku (standard deviation) s = √s

  XX 20663.8 143.75   s

  3 Si B k ( d d d i i ) JK

  ?    

  2 20663.8  s

    

         

                  

  1 n i n n i i i i i x s x x x n n n

  1

  1

  Ukuran Penyebaran Dat a y

  1

  1

  2

  2

  2

  1

  2. Variansi R = 508.49 – 29.08 = 479.41

  min

    R = data max

  2 n

  1. Jangkauan data (Range)

  4. Jangkauan antar kuartil

  Data Pencilan Data Pencilan Data yang nilainya berbeda jauh dari kelompok data yang lain.

  Bagaimana mendeteksi data pencilan ?? 234.74

  1. Hitung dq dq = BBP = 70.47–(1.5)(234.74 ) = -281.65 ( )( )

  2 Hitung BBP = q

  2. Hitung BBP qk dq k .dq

  1

  1 Pilih nilai k = 3/2 (optional) BAP = 305.21 + (1,5)(234.74) = 657.32 BAP = 305 21 + (1 5)(234 74) = 657 32

  3 Hitung BAP = q + k dq + k.dq

  3. Hitung BAP = q

  3

  

4. Pencilan bawah < BBP tidak ada pencilan bawah

  5. Pencilan atas > BAP tidak ada pencilan atas

  SARI NUMERIK Coun t (ban yak data, n)

  12 Sum (jum lah data) 2666.0 1 Average (rata-rata) 222.17 m ean < m edian m ean < m edian

  Median (kuartil ten gah) 254.58

  • Mode (m odus) Min im um

  29.0 8 Maxim um 50 8 .49 Ran ge

  479.41 Men cen g

  Stan dard Deviation 143.75 kiri/ n egatif ??? kiri/ n egatif ???

  Varian ce 20 663.8 Skewn ess

  0 .30 3* Kurtosis

  • 0 .18 1* 25th Percen tile (persen til-25) 70 .465 50 th Percen tile (persen til-50 ) 254.58 75th Percen tile (persen til-75) 30 5.20 5 In terquartile Ran ge (dk) 234.74
Penyaj ian Dat a y j

  1. Tabel Distribusi Frekuen si

  2. Pie Chart D Pl

  3. Dot Plot

  4. H istogram

  5 Diagram Batang – Daun (stem - leaf)

  5. Diagram Batang – Daun (stem - leaf)

  6. Diagram Kotak – Titik (box plot) 7. dll…

  Penyajian data dalam bentuk grafik dapat dilakukan secara Skala penggambaran harus diperhatikan dalam penyajian data dalam bentuk grafik.

  Penyajian data dalam bentuk grafik dapat dilakukan secara manual maupun menggunakan software-software statistik seperti

  • Data banyaknya pelanggan yang datang ke sebuah k d h d b l l y y p gg y g g

    mini market di 15 hari tertentu pada bulan Juli 2011.

  6

  7

  8 8 1-95 8 8

  2

  73

  6 66-8 0

  1

  58

  8 6 51-65

  5

  T b l Di t ib i F k i Tabel Dist ribusi Frekuensi

  4

  43

  1 36-50

  1

  28

  21-35

  ( f) Fre ku e n s i Ku m u la tif Ke la s

  26 37 39 46 49 59 69 76 83 83 83 87 87 95 95 Ke la s In te rva l Titik Te n ga h Ke la s Fre ku e n s i

  15 PRINSIP DASAR Bagaim ana bent uk hist ogram nya? PELUANG Pie Chart 9% 10 %

  23% 58 % 

  Pie chart merupakan grafik yang berbentuk lingkaran yang mana setiap potongannya mewakili proporsi atau persentase ti t kili i t t suatu komponen dari sebuah kelompok data (100%).

   Pemakaian pie chart hanya cocok ketika menyatakan data y y dalam bentuk proporsi dari satu kelompok data.

  Dot Plot 3.5 3 s s i n fr e k ue

  2.5 1.5 2 0.5

  1

  20 40 nilai 60 80 100 Cara m en ggam barkan data dalam ben tuk titik, • • Cara m en ggam barkan data dalam ben tuk titik

den gan m em perhatikan fre ku e n s i dari data yan g bersan gkutan g Titik ditum puk diatas n ilai data yan g digam barkan . • Histogram g Histogram adalah gambar berdasarkan distribusi g g

  • frekuensi

    Setiap frekuensi dipresentasikan oleh suatu segi empat

  • >(rectangle). (rectangle)

    Daerah setiap rectangle sebanding dengan frekuensinya.

  26 Diagram Batang-Daun (Stem-Leaf) g g ( f ) 26 37 39 46 49 59 69 76 83 83 83 87 87 95 95

  atau batang, mirip dengan grup data pada histogram, sedangkan g p g g p p g g

  • Stem atau daun, mirip dengan frekuensi.

  leaf

  atau batang adalah digit pertama yang terpenting yang ada

  • dalam bilangan yang membentuk harga data, sedangkan digit di g y g g g g belakangnya akan merupakan leaf atau daun.

  Stem Diagram Kot ak-Tit ik g (Box-Plot ) 100

  95 m ax m ax

  95

  90 85 q

  3

  80

  76 q

  2

  70 m ean

  60

  50

  47.5 q

  1

  40

  30

  26 m in

  20

10 Box Plot digunakan untuk menyelidiki distribusi tanpa

  • menggunakan grup data seperti pada histogram dan k d d h d diagram batang daun. Box Plot terdiri dari: data Box Plot terdiri dari: data , q , q , q , q (median), q (median), q , dan , dan
  • min min

  1

  1

  2

  2

  3 data yang disusun secara terurut dengan membentuk max

  3 Pencilan pada Box Plot Pencilan pada Box Plot

  • pen cilan atas BAP (pagar atas)

  upper w hisker q

  2 q

  3 m ean m aksim um low er w hisker q

  1 m in im um low er w hisker

  pen cilan bawah BBP (pagar bawah) Kelemahan dan Keunggulan Kelemahan dan Keunggulan KELEMAH AN KEUNGGULAN Cepat C

  Tidak efektif un tuk ukuran DOT PLOT data yan g besar Nilai data asli dapat diperkirakan

  H istogram peluan g dapat m em beri Lam a gam baran ten tan g distribusi populasi gam baran ten tan g distribusi populasi H ISTOGRAM Ban yak perhitun gan Tidak m en un tut ketelitian dalam Nilai data tidak n am pak m en catat setiap n ilai data Cepat p Tidak m em erlukan perhitun gan BATANG- Men un tut ketelitian Nilai data asli dapat dilihat DAUN m en catat daun Mem udahkan perhitun gan berbagai p g g param eter

  Mem butuhkan perhitun gan Box plot dapat m em beri gam baran yan g pan jan g ten tan g ben tuk distribusi populasi BOX PLOT BOX PLOT T di i d Terdiri dari param eter- i t Efektif un tuk m em ban din gkan ben tuk Ef ktif t k b di k b t k param eter dari data yan g distribusi beberapa kelom pok data Bent uk Dist ribusi Ideal Normal Normal m ean = m edian

  Mem iliki bent uk dist ribusi yang sim et ris, yait u : Skewness = 0 K t Kurt osis = 3, ( dalam soft ware t ert ent u kurt osis norm al = 0 i 3 ( d l ft t t t k t i l Latihan 1 L ih

1 Suatu jen is polim er digun akan dalam sistem evakuasi •

  pesawat terban g. Pen tin g diperhatikan bahwa polim er tersebut harus m am pu m elawan proses pen uaan . Diam bil dua puluh sam pel polim er yan g kem udian dibagi atas dua percobaan . Percobaan pertam a (batch 1) yan g m elibatkan b b (b h ) lib k 10 sam pel diken akan proses percepatan pen uaan den gan tem peratur tin ggi selam a 10 hari. Sedan gkan 10 sam pel lain n ya lain n ya (batch (batch 2) 2) tidak tidak diken akan diken akan proses proses apa-apa. apa apa Kekuatan daya ren tan g (dalam psi) sam pel-sam pel tersebut diukur dan dicatat sebagai berikut.

  Ba tch 1 h 2 2 7 2 2 2 2 18 2 17 2 2 5 2 18 2 16 2 2 9 2 2 8 2 2 1 Batch 2 219 214 215 211 20 9 218 20 3 20 4 20 1 20 5 Q Q: Apakah percobaan proses penuaan m em berikan p p p p dam pak pada kekuat an daya rent ang polim er? Contoh 2 Contoh 2 Apa yang dapat kita lakukan untuk m en jawab p y g p

  • j b pertan yaan tersebut???
    • Keluarkan sari n um erik yan g m un gkin Keluarkan sari n um erik an g m un gkin

  Ukuran pem usatan data : MEAN, MEDIAN, KUARTIL BAWAH - ATAS ATAS Ukuran pen yebaran data : RANGE, J ANGKAUAN KUARTIL,

  VARIANSI,SIMPANGAN BAKU Apakah diperlukan ??? Lain -lain : SKEWNESS dan KURTOSIS

  • Plot data

  Pilih plot yan g in form atif un tuk m en jawab pertan yaan tersebut Misal: BOXPLOT

  Batch.1 Batch.II Mean 222,10 20 9,90 @ UM

  , 9,9 Varian si 23,6556 42,10 0 0

  Sim p.Baku 4,8 6 6,49 Min . 216 20 1

SARI NUMERIK

  Max. 229 219 Q1 218 20 4,25

  Median 221,5 210 Q3 226,5 214,75

  226.5 229 230 230 216 221.5 218 6 5 215 220 225 214.75 219 215 220 225 Batch 1 20 0 20 5 210 20 1 20 4.25 210 20 0 20 5 210 195 Batch 2 195

  • Berikut adalah data produksi pan as bum i di

  

43.04

45.75 111.27

  3. Buat box plot.

  2. Hitung variansi dengan 2 cara, bandingkan.

  14.37 Q: 1. Keluarkan sari numerik data di atas.

  77.96

  

41.60

  32.35

  70.00

  14.32

70 00 32 35 41 60 77 96 14 37

  83.00

  

47.70

  41.49

  27.79

  42.13

  TUGAS 1 TUGAS 1

  87.46

  27.14

  64.52

  

54.12

  24.00

  60.00

  85.64

  89.54

  

60.00

  44.24

  77.71

  25 titik pen geboran (ton / jam ): 25 titik pen geboran (ton / jam ):

  4. Ceritakan hasil olahan data Anda. 4 Ceritakan hasil olahan data Anda Transf ormasi Dat a (pengayaan) (p g y )

  • Tran sform asi dilakukan un tuk m en dapatkan ben tuk distribusi yan g lebih sim etris.
  • Tran sform asi Tan gga Tukey
    • -1/x

  2 -1/x √x log (x) x x

  2 x

  3

  10 x dat a awal un tuk ben tuk distribusi : skewn ess n egatif un tuk ben tuk distribusi : skewn ess positif

  Data contoh kasus : skewness = 0 5 (menceng kiri) Merenggangkan data‐data yang berharga kecil dan merapatkan data‐data yang berharga besar

  Merapatkan data‐data yang berharga kecil dan merenggangkan data‐data yang berharga besar Data contoh kasus : skewness = -0,5 (menceng kiri), maka transformasi yang mungkin adalah x

  2 , x

  3 , dan 10 x .

2 Lebih mendekati simetris (skew = 0)

  39

  2116

  46 676

  26

  6 6889 5776 6889 6 6

  83

  76

  83

  skew = -0,18

  95 6889 7569 1521 9025

  87

  Transformasi Data (pengayaan) Cont oh Kasus Cont oh Kasus x y = x

  83

  k 0 18

  83 2401 4761 9025 6889

  95

  69

  49

  Lebih mendekati simetris (skew 0) dibanding sebelum transformasi (skew = -0,5)

  59 7569 1369 3481

  37

  87

  • Ketika data ditransformasi, maka satuan dari data juga akan berubah
TUGAS A

  • Tujuan  umum :  j Mencari,  mengumpulkan, mengolah, menganalisis dan  menarik  kesimpulan atas data Anda sendiri. Tujuan khusus : menerapkan Statistika Deskriptif terhadap
  • Tujuan  khusus : menerapkan Statistika Deskriptif terhadap  data  sendiri.
  • Tipe  Tugas : diskusi dalam kelompok, 1 kelompok   3 orang.

  Sumber data: buku teks, TA, data praktikum, koran, majalah,  internet,  dll (sebaiknya disesuaikan dengan permasalahan yang  mungkin dihadapi di prodi masing

  ‐masing) Tipe Tugas : diskusi dalam kelompok, kelompok 3 orang. mungkin  dihadapi di prodi masing masing).

  Ceritakan tentang data tersebut (histori data).

  Tugas  A diketik (Mic.Word atau Mic.Excel) dengan nama file: “Statdas.I.12‐ g (

  ) g

  [email protected]

13.A.Kelompok  <nomor kelompok>” dikirim ke 

  Cont oh Tugas A g by Aulia R. M. Fikri (10107096)

  S ta tis tika D e s krip tif D a ta Te m p e ra tu r O-rin g p a d a Ke ce la ka a n Pe s a w a t U la n g-a lik Ch a lle n ge r Ke ce la ka a n Pe s a w a t U la n g a lik Ch a lle n ge r Suat u O- ring m erupakan suat u gasket m ekanik yang berbent uk t orus, t erbuat dari elast om er yang m elingkar, didesain unt uk dit em pat kan di suat u lekukan dan dikom pres di ant ara dua bagian selam a perakit an sehingga t erbent uk segel at au perekat pada perm ukaan ( int erface) kedua bagian t ersebut . perekat pada perm ukaan ( int erface) kedua bagian t ersebut Salah sat u hal yang pat ut diperhat ikan pada penggunaan O- ring adalah kait annnya dengan t em perat urnya. ... Berikut adalah dat a observasi t em perat ur e dari O ring dalam deraj at Fahr enheit , Berikut adalah dat a observasi t em perat ur e dari O- ring dalam deraj at Fahr enheit unt uk set iap uj i peluncuran m esin roket pesawat ulang alik Challenger t ersebut ( Sum ber: Presedent ial Com m ision on t he Space Shut t le Challenger Accident , Vol. 1, 1986: 129- 131) .

  84

  45

  68

  57

  53

  76

  49

  66

  60

  63

  67

  79

  61

  70

  67

  70

  75

  75

  40

  69

  72

  78

  61

  76

  83

  80

  73

  52

  70

  58

  67

  58

  70

  67

  81

  31 Contoh ini lebih lengkap dapat dilihat di: Ref erensi 

  Djauhari,  M.A., 2001, Catatan Kuliah Analisis Data.   Walpole Ronald E et al Statistitic for Scientist and  Walpole,  Ronald E., et.al, Statistitic for Scientist and  Engineering,  8th Ed., 2007.

  39