BAB 1 PENDAHULUAN A. Hakikat Statistika 1. Asal Kata - Kuliah I BAB 1
BAB 1 PENDAHULUAN A. Hakikat Statistika
1. Asal Kata
- Kata statistika berasal dari kata “status” atau “statista” yang berarti negara
- Tulisan Aristoteles “Politeia” menguraikan keadaan dari 158 negara yakni sumber dari kata “statistika”
- Pada awalnya, status atau statista mencatat data dari berbagai negara
2. Pemantapan Kata Statistika
Pada abad ke-17 dan ke-18 ada tiga istilah yang bersaing
- Political arithmetic (di Inggris abad ke-17)
- Publisistika (oleh Achenwall dari Jerman pada
- Statistika pertengahan abad ke-18, dan di-turuti oleh Sir John Sinclair di Inggris)
Yang bertahan adalah kata
“statistika” Pada saat ini kita mengenal statistika yang teoretik serta statistika terapan.
Statistika yang teoretik dikenal juga sebagai statistika matematik
- Statistika Teoretik (Matematik)
- Statistika Terapan Di sini kita membahas statistika terapan dengan memanfaatkan rumus statistika yang diperoleh dari statistika teoretik
1)
Apa Yang dimaksud Statistik dan Statistika ? Statistik adalah kumpulan data atau fakta yang umumnya berupa angka, yang
disajikan dalam bentuk tabel, diagram dan atau grafik, yang menggambarkan suatu persoalan tertentu.
Statistika adalah Ilmu pengetahuan yang mempelajari tentang cara-cara
pengumpulan data, penyajian dan pengolahan data, analisis data sehingga dapat dibuat kesimpulan dan keputusan yang dapat dipertanggung jawabkan.
3. Ruang Lingkup ” STATISTIKA”
Statistika adalah Ilmu Pengetahuan yang perolehan Informasinya berasal dari data numerik , definisi di atas mengandung makna bahwa bahan baku statistika adalah data.
INGAT : STATISTICS IS THE SCIENCE
Pada dasarnya statistika dibagi menjadi dua ruang lingkup seperti pada bagan berikut :
EXPLORATORY DATA ANALYSIS (descriptive statistics) BOX PLOT STATISTICS STEMPLOT
Sebagai alat bantu untuk CONFIRMATORY DATA Mengetahui distribusi data ANALYSIS
Estimation (statistical inference) (inductives statistics) Hypotesis Testing
SIFAT- SIFAT DATA NUMERIK
NUMERICAL DATA
PROPERTIES
CENTRALSHAPE TENDENCY
VARIATION
Mean RangeMedian Interquartile Range Mode Variance
Midrange Standard Deviation Midhinge Coefficient of
Variation BOX-and – WHISKER
PLOT
DALAM STATISTIKA
Data Statistik dibagi dalam empat kelompok besar , yaitu :
1. Data ditinjau dari sudut sifat
a. Data Kualitatif : data yang dinyatakan dalam bentuk kategori Contoh : data kecelakaan lalu lintas : luka sedang ringan, dll
b. Data Kuantitatif : data yang dinyatakan dalam bentuk bilangan Contoh : 165 cm, 45 kg, 12 mahasiswa.
2. Data ditinjau dari sudut nilai
a. Data diskrit : data yang diperoleh dari hasil penghitungan contoh : 12 mahasiswa, ciri berbentuk bilangan bulat
b. Data Kontinu : data yang diperoleh dari hasil mengukur contoh : Tinggi badan (165 cm) ciri dalam bentuk interval
3. Data ditinjau dari sudut sumber
a. Data Intern : data yang diperoleh dari lingkungan sendiri b. Data ekstern : data yang diperoleh dari luar lingkungan.
Contoh : mahasiswa kimia UNPAD, Mhsw. Kimia ITB.
4. Data ditinjau dari sudut memperoleh
a. Data primer : data yang diperoleh dari hasil penelitian sendiri / data yang diperoleh responden langsung.
b. Data sekunder : data yang diperoleh dari hasil penelitian orang lain
Populasi Dan Sampel
Populasi : totalitas semua hasil yang mungkin , baik dalam menghitung maupun dalam
mengukur, kuantitatif maupun kualitatif mengenai karakteristik tertentu dari semua anggota kumpulan yang lengkap dan jelas yang ingin dipelajari sifatnya. Contoh : Semua masyarakat Kota Bandung dan mempunyai KTP Kota Bandung.
Sampel : Bagian dari populasi yang diambil dengan metode tertentu Contoh : metode random ,kluster , ciri : diambil secara acak.
Sensus Dan Sampling Sensus : cara mengumpulkan data yang anggota populasi diteliti Sampling : cara mengambil sampel Penyajian Data
a. Diagram / Grafik
- Diagram lingkaran , diagram batang, diagram lambang dsb
S-2 dan S-3 SMU S-1 sayur
40 buah
30 daging
20
10 Januari Maret
b. Daftar/ Tabel Tabel baris kolom , Tabel kontingensi, Tabel Distribuís Frekuensi.
Tabel 1 Bentuk Umum Tabel Baris-Kolom
Judul Baris J u d u l K o l o ml ... j ... k
A . . . A . . . B Sel (Al) . . . Sel (Al) . . . ... ... . . . ... . . . ... Sel (Aj) . . . Sel (Aj) . . . Sel (Bj) ... . . . ... . . . ... Sel (Ak) . . . Sel (Ak) . . . Sel (Bk)
Catatan : Sumber Data Keterangan : Warna atau yang lainnya.
Tabel Kontingensi
Adalah Tabel Baris-Kolom dimana, sel tabel merupakan frekuensi irisan antara taraf baris dengan taraf kolom. Bentuk umum tabel ini adalah seperti berikut.
Tabel 2 Tabel Kontingensi Taraf Faktor 2 Jumlah Taraf Faktor 1
Baris l ... j ... k
1 O 1l ... O 1j ... O 1k n
10 . . . . . . .. . . . . . . . . . . . . . i O il ... Oij ... O ik n i0 . . . . . . .
. . . . . . . . . . . . . .
b Obl ... O ... O n
bj bk b0 Jumlah Kolom n01 ... n0j ... n0k n 00 Daftar distribusi FrekuensiAdalah Daftar /Tabel Baris-Kolom dengan Bentuk umum sebagai berikut : Tabel 3 Daftar Distribusi Frekuensi
Kelas Interval Frekuensi B1
- – A1 f 1
. .
.
. .
. Bi fi
- – Ai
. .
.
. .
Bk - Ak fk J u m l a h n
1 f n
B1
1 f n
1 f n 1 f n
1.00
J u m l a h n
. . .
. .
. . fk .
. . fi .
f1 .
Bk - Ak
Bi
f1
Tabel 4 DDF Untuk Perhitungan
Kelas Interval Batas Kelas Titik Tengah Frekuensi fx B1 – A1 BB1 – BA1 x1 f1 x1f1B1
Tabel 5 DDF Relatif
. . . Bk - Ak BBk - BAk xk fk xkfk J u m l a h - - n N
. . .
.
.
.
. . .
. .
. . . Bi - Ai Bbi - BAi xi fi xifi .
. . .
.
.
.
. . .
. . .
- – A1
- – A1 . . .
- – Ai . . .
Tabel 6
DDF Kumulatif Kurang Dari
Nilai B F kumulatif < B1 . . . < Bi . . . < Bk + p . . . fi ; i = 1,2,...i-j . . . fi ; i = 1,2,... k
Tabel 7
DDF Kumulatif Lebih atau sama
Nilai B F kumulatif B1 . . . Bi . . . Bk + p fi ; i = 1,2,... k . . . fi ; i = 1,2,...i-1 . . .Daftar Distribusi Frekuensi , dibuat dengan langkah-langkah berikut :
1. Hitung Range (R) atau jangkauan dari n data yang ada, yaitu selisih antara data
terbesar (xmax) dengan data terkecil (xmin). Jadi , R = xmax - xmin
2. Tentukan banyak kelas interval, yaitu dengan :
3. Aturan Sturges : K = 1 + 3,3 log n
4. Atau dipilih sembarang dalam interval 5 ≤ K ≤ 15
5. Hitung Panjang kelas, yaitu p = {R/K} dan dalam DDF akan tampak sebagai :
- – Selisih antara dua ujung bawah / atas yang berdekatan
- – Selisih antara dua batas bawah / atas yang berdekatan
- – Selisih antara batas atas dengan batas bawah yang berada dalam satu kelas – Selisih antara dua titik tengah yang berdekatan.
6. Tentukan ujung bawah kelas pertama, yaitu :
7. B1 = data terkecil atau data terkecil dikurangi sebuah bilangan yang lebih kecil dari p.
8. Lengkapi DDF dengan bantuan aturan-aturan berikut :
- Selisih antara ujung atas sebuah kelas dengan ujung bawah kelas berikutnya adalah : 9. 1,0 jika data bulat; 0,1 jika data terdiri dari desimal; dan seterusnya.
- Batas bawah adalah ujung bawah dikurangi : 0,5 jika data bulat ; 0,05 jika data terdiri dari 1 desimal ; dan seterusnya.
- Batas atas adalah ujung atas ditambah : 0,5 jika data bulat ; 0,05 jika data terdisri dari 1 desimal; dan seterusnya. Aturan untuk menentukan banyak kelas, tidaklah merupakan aturan yang sangat ketat karena, ada suatu kesepakatan antara para ahli bahwa banyak kelas yang dibuat harus menghasilkan kelas-kelas dengan frekuensi tidak nol (kosong).
Ukuran Statistik
Dalam Statistik terdapat 3 kelompok besar
a. Ukuran Central (Pemusatan)
b. Ukuran Letak
c. Ukuran Variasi ( penyebaran)
1. Ukuran Central (Ukuran Pemusatan) Terdiri dari : Rata-rata Hitung, Rata-rata Ukur, Rata-rata Harmonis, dan Modus.
a. Rata-rata Hitung (kalau datanya Stationer)
Misal x1, x2, .... xn adalah n buah data (diskrit atau kontinu) yang belum disajikan dalam DDF (ungrouped data), yang diambil dari sebuah populasi berukuran N dengan data x1, x2, ..., xN. Maka rata-rata (µ : populasi , : sampel) dihitung dengan
Mean /Avarage( The Arithmetic Mean) n
1
… (1.1)
X X i n i
1
f x
i i
… (1.2)
X
f
i
N
1
… ( 1.3)
x
iN i
1 Contoh : Ditentukan data sebagai berikut : 8, 5, 10, 4, 7 hitunglah rata-ratanya ?
Jawab :
8 5 10
4
7 x
5 Sedangkan jika data tersebut telah disajikan di dalam DDF (grouped data), rata-rata hitung dengan rumus (1.4) dan (1.5) berikut. N
f x
1 i i Cara Panjang, (1.4) ... Dan
f x i i
X N i 1 f i k p
Cara Pendek, (1.5) …
x x f c i i n
i
1 Xi : Titik Tengah ; x0 : Xi yang sekelas dengan Ci = 1/p (Xi - x0 ) = 0.
Untuk menghitung µ dengan cara pendek, ganti n pada (1.5) dengan N. Dan, melihat (1.5) maka tabel (4) harus ditambah kolom C dan fC.
n 1 , X jika n ganjil
2 Median
X
1 n n ,
X X jika n genap
1
2
2
2 ˆY
Mode :
1 Midrange
X X s l
2
1 MidHinge
Q Q
1
3
2 Ukuran-ukuran dalam Statistika Lainnya
Q1 = Q (0.25) : disebut Lower Quartile atau Lower Hinge Q3 = Q (0.75) : disebut Upper Quartile atau Upper Hinge
X
= Mean = Point of Balance
X
= Q
2 = Q (0.50) = Half Position ˆX
= Peak point
2. Ukuran Dispersi
Yang akan dibahas disini adalah simpangan baku , varians, Koefisien Variasi karena tiga ukuran dispersi ini yang paling sering digunakan. Hubungan antara simpangan baku dengan variansi adalah ”Varians = Kuadrat dari Simpangan baku ”. Notasi yang umum digunakan untuk simpangan bakuadalah : (tou, sigma) untuk simpangan baku populasi dan s untuk simpangan baku sampel.
Ukuran ini merupakan ukuran statistik yang menunjukkan sampai sejauh mana variabilitas data yang terkumpul. Makin kecil nilai ukuran ini, menunjukkan variabilitas data makin rendah atau dapat dikatakan bahwa data relatif seragam, dan sebaliknya.
Misal x
1 , x 2 , .... x n adalah n buah data ( diskrit atau kontinu) yang belum
disajikan dalam DDF (ungrouped data). Yang diambil dari sebuah populasi berukuran N
2
2
dengan data x
1 , x 2 , ..., x N . Maka varians ( : populasi , s : sampel ) dihitung dengan
σ rumus : Ukuran Keragaman (Measures of Variation) :
Range X l - X s
Interquartile Range Quartiles spread/ MidSpread/H-Spread
IQR = H – SPRAD = Q3 – Q1
Variansi / Ragam (Variance)
n 2 2 1 X 1 X i
S
1
n N 2 2 1 X 1 i
N
Dapat dibuktikan bahwa : n
2 X
X
1 2 i
1 S
1 2 1 n 2 2 1 2 2 E S E X n X n 1 i E X n E X 1 n 1 i 2 2 . 2 2 n 1 n n 1
2 2 2 2 n 1 n n
2
2
2 n
1 E S ( ) n
1 Rumus : Ungrouped Data : N N 2 2 n n 2 N x x i i 2 2 i 1 i 1 i i 2 n x x
= dan s = 2 i 1 i 1 N n n ( 1)
Grouped Data : “Cara Panjang “ N N 2 2 n n 2 2 N f x f x 2 i 1 i i i i i 1 n f x f x i 1 i i i i i 1
2 = dan s 2 = N 2 n n ( 1) 2 Cara Pendek N N 2 n n 2 2 N f C f C n f C f C i i i i i i i i 2 i 1 i 1
2 2 i 1 i 1 = dan s = p x 2 p x N n n ( 1)
1 X : titik tengah, f frekuensi, dan Ci = (x i )
- – x
p
Koefisien Variasi (coefficient of variation) S
100% CV
X Simpangan Baku (Deviasi standard) 2 x x i
S =
n
1
3. Bentuk Distribusi (Shape )
Bentuk Distribusi (Shape ) adalah : Suatu Pola, Dimana Data didistribusikan Symmetrical
Distribution
X X
(Zero-Skewed) of The Data Not Symmetrical
Right-Skewed (Asymmetrical/Skewed)
(Positive)
X X Left – Skewed (Negative)
X X
Pengukuran kadar ion nitrat pada contoh :1 hanya mempunyai nilai diskrit tertentu, karena dibatasi oleh cara pengukurannya. Namun dalam teori, kadar dapat mempunyai sebarang nilai, sehingga untuk melukiskan bentuk populasi dari sample diperlukan kurva kontinu. Model matematika yang biasanya dipakai adalah sebaran normal atau dikenal sebaran Gauss yang digambarkan oleh :
x 2
2
1 2
y
exp
2 Contoh : Hasil 50 penentuan kadar ion nitrat
μg/ ml 0.51 0.51 0.51 0.50 0.51 0.49 0.52 0.53 0.50 0.47 0.51 0.52 0.53 0.48 0.49 0.50 0.52 0.49 0.49 0.50 0.49 0.48 0.46 0.49 0.49 0.48 0.49 0.49 0.51 0.47 0.51 0.51 0.51 0.48 0.50 0.47 0.50 0.51 0.49 0.48 0.51 0.50 0.50 0.53 0.52 0.52 0.50 0.50 0.51 0.51
Sajikan data tersebut ke dalam Daftar Distribuís Frekuensi dan hitunglah :
a. Rata-rata Hitung dengan cara pendek dan cara panjang b. Hitunglah variansi dan simpangan baku.
c. Hitunglah Koefisien Variasi.
d. Buatlah Histogram , Poligon dan Ogive. Histogram
14
10 12
8 ncy que Fre 4 6
2 0.46 0.47 0.48 0.49 x 0.50 0.51 0.52 0.53 Mean = 0.4998 Std. Dev. = 0.01647 N = 50 Statistics x N Valid
50 Missing Mean
.4998
Std. Error of Mean .00233Median
.5000
Mode .51 Std. Deviation .01647 Variance
.000
Range .07 Minimum .46 Maximum .53Sum
24.99 Percentiles
25
.4900
50 .500075
.5100
x Frequency Percent Valid Percent Cumulative
38.0 .50
6.0 6.0 100.0 Total 50 100.0 100.0
3
94.0 .53
10.0
10.0
5
84.0 .52
26.0
26.0
13
58.0 .51
20.0
20.0
10
20.0
Percent Valid .46
20.0
10
18.0 .49
10.0
10.0
5
8.0 .48
6.0
6.0
3
2.0 .47
2.0
2.0
1
.53 .52 .51 .50 .49 .48 .47 .46 x