BAB 1 PENDAHULUAN A. Hakikat Statistika 1. Asal Kata - Kuliah I BAB 1

BAB 1 PENDAHULUAN A. Hakikat Statistika

  1. Asal Kata

  • Kata statistika berasal dari kata “status” atau “statista” yang berarti negara
  • Tulisan Aristoteles “Politeia” menguraikan keadaan dari 158 negara yakni sumber dari kata “statistika”
  • Pada awalnya, status atau statista mencatat data dari berbagai negara

  2. Pemantapan Kata Statistika

  Pada abad ke-17 dan ke-18 ada tiga istilah yang bersaing

  • Political arithmetic (di Inggris abad ke-17)
  • Publisistika (oleh Achenwall dari Jerman pada
  • Statistika pertengahan abad ke-18, dan di-turuti oleh Sir John Sinclair di Inggris)

  Yang bertahan adalah kata

  “statistika” Pada saat ini kita mengenal statistika yang teoretik serta statistika terapan.

  Statistika yang teoretik dikenal juga sebagai statistika matematik

  • Statistika Teoretik (Matematik)
  • Statistika Terapan Di sini kita membahas statistika terapan dengan memanfaatkan rumus statistika yang diperoleh dari statistika teoretik

  1)

  Apa Yang dimaksud Statistik dan Statistika ? Statistik adalah kumpulan data atau fakta yang umumnya berupa angka, yang

  disajikan dalam bentuk tabel, diagram dan atau grafik, yang menggambarkan suatu persoalan tertentu.

  Statistika adalah Ilmu pengetahuan yang mempelajari tentang cara-cara

  pengumpulan data, penyajian dan pengolahan data, analisis data sehingga dapat dibuat kesimpulan dan keputusan yang dapat dipertanggung jawabkan.

3. Ruang Lingkup ” STATISTIKA”

  Statistika adalah Ilmu Pengetahuan yang perolehan Informasinya berasal dari data numerik , definisi di atas mengandung makna bahwa bahan baku statistika adalah data.

  INGAT : STATISTICS IS THE SCIENCE

  Pada dasarnya statistika dibagi menjadi dua ruang lingkup seperti pada bagan berikut :

  EXPLORATORY DATA ANALYSIS (descriptive statistics) BOX PLOT STATISTICS STEMPLOT

  Sebagai alat bantu untuk CONFIRMATORY DATA Mengetahui distribusi data ANALYSIS

  Estimation (statistical inference) (inductives statistics) Hypotesis Testing

SIFAT- SIFAT DATA NUMERIK

  

NUMERICAL DATA

PROPERTIES

CENTRAL

SHAPE TENDENCY

  

VARIATION

Mean Range

  Median Interquartile Range Mode Variance

  Midrange Standard Deviation Midhinge Coefficient of

  Variation BOX-and – WHISKER

  

PLOT

DALAM STATISTIKA

  Data Statistik dibagi dalam empat kelompok besar , yaitu :

  1. Data ditinjau dari sudut sifat

  a. Data Kualitatif : data yang dinyatakan dalam bentuk kategori Contoh : data kecelakaan lalu lintas : luka sedang ringan, dll

  b. Data Kuantitatif : data yang dinyatakan dalam bentuk bilangan Contoh : 165 cm, 45 kg, 12 mahasiswa.

  2. Data ditinjau dari sudut nilai

  a. Data diskrit : data yang diperoleh dari hasil penghitungan contoh : 12 mahasiswa, ciri berbentuk bilangan bulat

  b. Data Kontinu : data yang diperoleh dari hasil mengukur contoh : Tinggi badan (165 cm) ciri dalam bentuk interval

  3. Data ditinjau dari sudut sumber

  a. Data Intern : data yang diperoleh dari lingkungan sendiri b. Data ekstern : data yang diperoleh dari luar lingkungan.

  Contoh : mahasiswa kimia UNPAD, Mhsw. Kimia ITB.

  4. Data ditinjau dari sudut memperoleh

  a. Data primer : data yang diperoleh dari hasil penelitian sendiri / data yang diperoleh responden langsung.

  b. Data sekunder : data yang diperoleh dari hasil penelitian orang lain

  Populasi Dan Sampel

Populasi : totalitas semua hasil yang mungkin , baik dalam menghitung maupun dalam

  mengukur, kuantitatif maupun kualitatif mengenai karakteristik tertentu dari semua anggota kumpulan yang lengkap dan jelas yang ingin dipelajari sifatnya. Contoh : Semua masyarakat Kota Bandung dan mempunyai KTP Kota Bandung.

  Sampel : Bagian dari populasi yang diambil dengan metode tertentu Contoh : metode random ,kluster , ciri : diambil secara acak.

  Sensus Dan Sampling Sensus : cara mengumpulkan data yang anggota populasi diteliti Sampling : cara mengambil sampel Penyajian Data

a. Diagram / Grafik

  • Diagram lingkaran , diagram batang, diagram lambang dsb

  S-2 dan S-3 SMU S-1 sayur

  40 buah

  30 daging

  20

10 Januari Maret

  b. Daftar/ Tabel Tabel baris kolom , Tabel kontingensi, Tabel Distribuís Frekuensi.

  

Tabel 1 Bentuk Umum Tabel Baris-Kolom

Judul Baris J u d u l K o l o m

  l ... j ... k

  A . . . A . . . B Sel (Al) . . . Sel (Al) . . . ... ... . . . ... . . . ... Sel (Aj) . . . Sel (Aj) . . . Sel (Bj) ... . . . ... . . . ... Sel (Ak) . . . Sel (Ak) . . . Sel (Bk)

  Catatan : Sumber Data Keterangan : Warna atau yang lainnya.

  Tabel Kontingensi

  Adalah Tabel Baris-Kolom dimana, sel tabel merupakan frekuensi irisan antara taraf baris dengan taraf kolom. Bentuk umum tabel ini adalah seperti berikut.

  Tabel 2 Tabel Kontingensi Taraf Faktor 2 Jumlah Taraf Faktor 1

  Baris l ... j ... k

  

1 O 1l ... O 1j ... O 1k n

10 . . . . . . .

  . . . . . . . . . . . . . . i O il ... Oij ... O ik n i0 . . . . . . .

  . . . . . . . . . . . . . .

b Obl ... O ... O n

bj bk b0 Jumlah Kolom n01 ... n0j ... n0k n 00 Daftar distribusi Frekuensi

  Adalah Daftar /Tabel Baris-Kolom dengan Bentuk umum sebagai berikut : Tabel 3 Daftar Distribusi Frekuensi

  Kelas Interval Frekuensi B1

  • – A1 f 1

    . .

    .

  . .

  . Bi fi

  • – Ai

    . .

    .

  . .

  Bk - Ak fk J u m l a h n

  1 f n

  B1

  1 f n

  1 f n 1 f n

  1.00

  J u m l a h n

  . . .

  . .

  . . fk .

  . . fi .

  f1 .

  Bk - Ak

  Bi

  f1

  

Tabel 4 DDF Untuk Perhitungan

Kelas Interval Batas Kelas Titik Tengah Frekuensi fx B1 – A1 BB1 – BA1 x1 f1 x1f1

  B1

  

Tabel 5 DDF Relatif

  . . . Bk - Ak BBk - BAk xk fk xkfk J u m l a h - - n N

  . . .

  

.

.

.

  . . .

  . .

  . . . Bi - Ai Bbi - BAi xi fi xifi .

  . . .

  

.

.

.

  . . .

  . . .

  • – A1
  • – A1 . . .
  • – Ai . . .

  

Tabel 6

DDF Kumulatif Kurang Dari

Nilai B F kumulatif < B1 . . . < Bi . . . < Bk + p . . . fi ; i = 1,2,...i-j . . . fi ; i = 1,2,... k

  

Tabel 7

DDF Kumulatif Lebih atau sama

Nilai B F kumulatif B1 . . . Bi . . . Bk + p fi ; i = 1,2,... k . . . fi ; i = 1,2,...i-1 . . .

  Daftar Distribusi Frekuensi , dibuat dengan langkah-langkah berikut :

   1. Hitung Range (R) atau jangkauan dari n data yang ada, yaitu selisih antara data

  terbesar (xmax) dengan data terkecil (xmin). Jadi , R = xmax - xmin

  2. Tentukan banyak kelas interval, yaitu dengan :

  3. Aturan Sturges : K = 1 + 3,3 log n

  4. Atau dipilih sembarang dalam interval 5 ≤ K ≤ 15

  5. Hitung Panjang kelas, yaitu p = {R/K} dan dalam DDF akan tampak sebagai :

  • – Selisih antara dua ujung bawah / atas yang berdekatan
  • – Selisih antara dua batas bawah / atas yang berdekatan
  • – Selisih antara batas atas dengan batas bawah yang berada dalam satu kelas – Selisih antara dua titik tengah yang berdekatan.

  6. Tentukan ujung bawah kelas pertama, yaitu :

  7. B1 = data terkecil atau data terkecil dikurangi sebuah bilangan yang lebih kecil dari p.

  8. Lengkapi DDF dengan bantuan aturan-aturan berikut :

  • Selisih antara ujung atas sebuah kelas dengan ujung bawah kelas berikutnya adalah : 9. 1,0 jika data bulat; 0,1 jika data terdiri dari desimal; dan seterusnya.
  • Batas bawah adalah ujung bawah dikurangi : 0,5 jika data bulat ; 0,05 jika data terdiri dari 1 desimal ; dan seterusnya.
  • Batas atas adalah ujung atas ditambah : 0,5 jika data bulat ; 0,05 jika data terdisri dari 1 desimal; dan seterusnya. Aturan untuk menentukan banyak kelas, tidaklah merupakan aturan yang sangat ketat karena, ada suatu kesepakatan antara para ahli bahwa banyak kelas yang dibuat harus menghasilkan kelas-kelas dengan frekuensi tidak nol (kosong).

  Ukuran Statistik

  Dalam Statistik terdapat 3 kelompok besar

  a. Ukuran Central (Pemusatan)

  b. Ukuran Letak

  c. Ukuran Variasi ( penyebaran)

1. Ukuran Central (Ukuran Pemusatan) Terdiri dari : Rata-rata Hitung, Rata-rata Ukur, Rata-rata Harmonis, dan Modus.

a. Rata-rata Hitung (kalau datanya Stationer)

  Misal x1, x2, .... xn adalah n buah data (diskrit atau kontinu) yang belum disajikan dalam DDF (ungrouped data), yang diambil dari sebuah populasi berukuran N dengan data x1, x2, ..., xN. Maka rata-rata (µ : populasi , : sampel) dihitung dengan

  Mean /Avarage( The Arithmetic Mean) n

  1

  … (1.1)

  X X i n i

  1

f x

i i

  … (1.2)

  X

f

i

  N

  1

  … ( 1.3)

  

x

i

  N i

1 Contoh : Ditentukan data sebagai berikut : 8, 5, 10, 4, 7 hitunglah rata-ratanya ?

  Jawab :

  8 5 10

  4

  7 x

  5 Sedangkan jika data tersebut telah disajikan di dalam DDF (grouped data), rata-rata hitung dengan rumus (1.4) dan (1.5) berikut. N

  f x

  1 i i Cara Panjang, (1.4) ... Dan

  f x i i

  X N i 1 f i k p

  Cara Pendek, (1.5) …

  x x f c i i n

i

  1 Xi : Titik Tengah ; x0 : Xi yang sekelas dengan Ci = 1/p (Xi - x0 ) = 0.

  Untuk menghitung µ dengan cara pendek, ganti n pada (1.5) dengan N. Dan, melihat (1.5) maka tabel (4) harus ditambah kolom C dan fC.

  n 1 , X jika n ganjil

2 Median

  X

  1 n n ,

  X X jika n genap

  1

  2

  2

  2 ˆY

  Mode :

1 Midrange

  X X s l

  2

1 MidHinge

  Q Q

  1

  3

2 Ukuran-ukuran dalam Statistika Lainnya

  Q1 = Q (0.25) : disebut Lower Quartile atau Lower Hinge Q3 = Q (0.75) : disebut Upper Quartile atau Upper Hinge

  X

  = Mean = Point of Balance

  X

  = Q

  2 = Q (0.50) = Half Position ˆX

   = Peak point

2. Ukuran Dispersi

  Yang akan dibahas disini adalah simpangan baku , varians, Koefisien Variasi karena tiga ukuran dispersi ini yang paling sering digunakan. Hubungan antara simpangan baku dengan variansi adalah ”Varians = Kuadrat dari Simpangan baku ”. Notasi yang umum digunakan untuk simpangan bakuadalah : (tou, sigma) untuk simpangan baku populasi dan s untuk simpangan baku sampel.

  Ukuran ini merupakan ukuran statistik yang menunjukkan sampai sejauh mana variabilitas data yang terkumpul. Makin kecil nilai ukuran ini, menunjukkan variabilitas data makin rendah atau dapat dikatakan bahwa data relatif seragam, dan sebaliknya.

  Misal x

  1 , x 2 , .... x n adalah n buah data ( diskrit atau kontinu) yang belum

  disajikan dalam DDF (ungrouped data). Yang diambil dari sebuah populasi berukuran N

  

2

  2

  dengan data x

  1 , x 2 , ..., x N . Maka varians ( : populasi , s : sampel ) dihitung dengan

  σ rumus : Ukuran Keragaman (Measures of Variation) :

   Range X l - X s

  Interquartile Range Quartiles spread/ MidSpread/H-Spread

  IQR = H – SPRAD = Q3 – Q1

  Variansi / Ragam (Variance)

  n 2 2 1 X 1 X i

  S

  1

  n N 2 2 1 X 1 i

  N

  Dapat dibuktikan bahwa : n

  2 X

  X

  1 2 i

  1 S

  1 2 1 n 2 2 1 2 2 E S E X n X n 1 i E X n E X 1 n 1 i 2 2 . 2 2 n 1 n n 1

  2 2 2 2 n 1 n n

  2

  2

  2 n

  1 E S ( ) n

  1 Rumus : Ungrouped Data : N N 2 2 n n 2 N x x i i 2 2 i 1 i 1 i i 2 n x x

   = dan s = 2 i 1 i 1 N n n ( 1)

  Grouped Data : “Cara Panjang “ N N 2 2 n n 2 2 N f x f x 2 i 1 i i i i i 1 n f x f x i 1 i i i i i 1

  2 = dan s 2 = N 2 n n ( 1) 2 Cara Pendek N N 2 n n 2 2 N f C f C n f C f C i i i i i i i i 2 i 1 i 1

  2 2 i 1 i 1 = dan s = p x 2 p x N n n ( 1)

  1 X : titik tengah, f frekuensi, dan Ci = (x i )

  • – x

  p

  Koefisien Variasi (coefficient of variation) S

  100% CV

  X Simpangan Baku (Deviasi standard) 2 x x i

  S =

  n

  1

3. Bentuk Distribusi (Shape )

  Bentuk Distribusi (Shape ) adalah : Suatu Pola, Dimana Data didistribusikan Symmetrical

  Distribution

  X X

  (Zero-Skewed) of The Data Not Symmetrical

  Right-Skewed (Asymmetrical/Skewed)

  (Positive)

  X X Left – Skewed (Negative)

  X X

  Pengukuran kadar ion nitrat pada contoh :1 hanya mempunyai nilai diskrit tertentu, karena dibatasi oleh cara pengukurannya. Namun dalam teori, kadar dapat mempunyai sebarang nilai, sehingga untuk melukiskan bentuk populasi dari sample diperlukan kurva kontinu. Model matematika yang biasanya dipakai adalah sebaran normal atau dikenal sebaran Gauss yang digambarkan oleh :

  x 2

  2

  1 2

  y

  exp

  2 Contoh : Hasil 50 penentuan kadar ion nitrat

  μg/ ml 0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47 0.51 0.52 0.53 0.48 0.49 0.50 0.52 0.49 0.49 0.50 0.49 0.48 0.46 0.49 0.49 0.48 0.49 0.49 0.51 0.47 0.51 0.51 0.51 0.48 0.50 0.47 0.50 0.51 0.49 0.48 0.51 0.50 0.50 0.53 0.52 0.52 0.50 0.50 0.51 0.51

  Sajikan data tersebut ke dalam Daftar Distribuís Frekuensi dan hitunglah :

  a. Rata-rata Hitung dengan cara pendek dan cara panjang b. Hitunglah variansi dan simpangan baku.

  c. Hitunglah Koefisien Variasi.

  d. Buatlah Histogram , Poligon dan Ogive. Histogram

  14

  10 12

  8 ncy que Fre 4 6

  2 0.46 0.47 0.48 0.49 x 0.50 0.51 0.52 0.53 Mean = 0.4998 Std. Dev. = 0.01647 N = 50 Statistics x N Valid

  50 Missing Mean

.4998

Std. Error of Mean .00233

  Median

.5000

Mode .51 Std. Deviation .01647 Variance

  

.000

Range .07 Minimum .46 Maximum .53

  Sum

24.99 Percentiles

  25

.4900

50 .5000

  75

.5100

  x Frequency Percent Valid Percent Cumulative

  38.0 .50

  6.0 6.0 100.0 Total 50 100.0 100.0

  3

  94.0 .53

  10.0

  10.0

  5

  84.0 .52

  26.0

  26.0

  13

  58.0 .51

  20.0

  20.0

  10

  20.0

  Percent Valid .46

  20.0

  10

  18.0 .49

  10.0

  10.0

  5

  8.0 .48

  6.0

  6.0

  3

  2.0 .47

  2.0

  2.0

  1

  .53 .52 .51 .50 .49 .48 .47 .46 x