1.1. Pengertian statistik dan statistika (1)

1

PENDAHULUAN

1.1. Pengertian statistik dan statistika
Statistik adalah kumpulan data, bilangan maupun non bilangan yang disusun
dalam table dan atau diagram yang melukiskan suatu persoalan

Tabel nilai statistika
Nilai

Jumlah Mahasiswa

A

5

B

9


C

25

D

3

E

1

Statistika adalah pengetahuan yang berhubungan dengan cara-cara pengumpulan data,
pengolahan atau penganalisaannya dan penarikan kesimpulan berdasarkan kumpulan data
dan penganalisaan yang dilakukan.
Statistika dikelompokkan dalam dua kelompok yaitu statistika deskriptif dan
statistika inferensia. Statistika deskriptif adalah metode yang berkaitan dengan
pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang
berguna. Sedangkan pengertian statistika inferensia adalah metode yang berhubungan


dengan analisis sebagian data untuk kemudian sampai pada peramalan atau penarikan
kesimpulan tentang seluruh gugus data induknya.

1.2. Data Statistik
Data statistik adalah keterangan atau ilustrasi mengenai sesuatu hal yang bisa
berbentuk kategori (misalnya rusak, baik, cerah, berhasil) atau bilangan. Selanjutnya data
yang berupa kategori disebut sebagai data kualitatif dan data bilangan disebut data
kuantitatif. Berdasarkan cara perolehannya data kuantitatif dibedakan menjadi data
diskrit dan data kontinu. Data-data yang diperoleh dari hasil menghitung atau membilang
termasuk dalam data diskrit, sedangkan data-data yang diperoleh dari hasil mengukur
termasuk dalam data kontinu.
Menurut sumbernya kita mengenal data intern dan data ekstern. Data intern
adalah data yang diperoleh dari perusahaan atau instansi yang bersangkutan. Sedangkan
data ekstern diperoleh dari luar instansi atau perusahaan tersebut.
Data ekstern dibedakan menjadi data primer dan data sekunder. Data primer
adalah data yang dikeluarkan oleh badan sejenis. Sedangkan data lainnya termasuk data
sekunder. Semua data-data yang beru dikumpulkan dan belum pernah diolah disebut
sebagai data mentah.

1.3. Populasi dan sampel

Populasi adalah keseluruhan pengamatan yang menjadi perhatian kita baik yang
berhingga maupun tak berhingga jumlahnya. Seringkali tidak praktis mengambil data dari
keseluruhan populasi untuk menarik suatu kesimpulan. Untuk itu dilakukan pengambilan
sampel yaitu sebagian atau himpinan bagian dari populasi. Sampel yang diambil haris
dapat merepresentasikan populasi yang ada. Prosedur pengambialan sampel yang
menghasilkan kesimpulan yang konsisten terlalu tinggi atau terlalu rendah mengenai
suatu ciri populasi dikatakan berbias. Untuk menghindari kemungkinan bias ini perlu
dilakukan pengambian contoh acak atau contoh acak sederhana. Contoh acak sederhana
didefinisikan sebagai contoh yang dipilih sedemikian rupa sehingga setiap himpunan
bagian yang berukuran n dari populasi mempunyai peluang terpilih yang sama.

1.4. Pembulatan angka
Dalam perhitungan dan analisis data statistik seringkali diperlukan pembulatan
angka-angka. Berikut ini adalah beberapa aturan tentang pembulatan angka-angka.
1. Jika angka yang harus dihilangkan adalah 4 atau kurang, maka angka terkanan yang
mendahuluinya tetap.
Contoh: Rp. 59.376,- dibulatkan menjadi Rp. 59 ribu.
2. Jika angka yang haarus dihilangkan adalah lebih dari 5 atau angka 5 diikuti angka
bukan nol maka angka yang mendahuluinya ditambah dengan 1.
Contoh: 176,51 kg dibulatkan menjadi 177 kg.

3. Jika angka yang harus dihilangkan hanya angka 5 atau angka 5 diikuti nol, maka
angka yang mendahuluinya tetap jika genap dan ditambah 1 jika ganjil.
Contoh: 8,500 dibulatkan menjadi 8
19,5 dibulatkan menjadi 20

1.5. Penyajian Data
Secara garis besar ada dua macam cara penyajian data dalam statistika yaitu:
1. Tabel atau daftar yang dapat berbentuk:
a. Daftar baris kolom
b. Daftar kontingensi
c. Daftar distribusi frekuensi
2. Grafik atau diagram yang terbagi menjadi:
a. Diagram batang atau balok
b. Diagram garis atau grafik
c. Diagram lingkaran
d. Diagram lambing
e. Diagram peta
f. Diagram pencar

1.6. Daftar distribusi frekuensi dan grafiknya

Dalam distribusi frekuensi data dikelompokkan dalam beberapa kelas interval misalnya
a–b, c-d dan seterusnya. Ada beberapa istilah yang digunakan dalam distribusi frekuensi
yaitu:
1.

Limit kelas atau ujung kelas yaitu nilai-nilai terkecil dan terbesar dalam setiap
kelas interval. Nilai terbesar disebut sebagai limit atas kelas dan nilai terkecil
disebut sebagai limit bawah kelas.

2.

Batas kelas yaitu limit kelas ± setengah nilai skala terkecil. Nilai yang besar
disebut batas atas kelas dan nilai yang kecil disebut sebagai batas bawah kelas.

3.

Titik tengah kelas atau tanda kelas yaitu nilai yang terletak pada engah setiap kelas
interval. Aturan umum yang digunakan untuk menentukan titik tengah kelas atau
tanda kelas adalah:
Tanda kelas = ± ½ (limit bawah + limit atas)


Macam-macam distribusi frekuensi
1. Distribusi frekuensi
2. Distribusi frekuensi. Relative (%)
3. Distribusi frekuensi kumulatif kurang dari
4. Distribusi frekuensi kumulatif lebih dari

1.7. CARA MEMBUAT DIST. FREK.
1. Tentukan Rentang
R = Nilai terbesar – nilai terkecil.
= 99 - 35 = 64
2. Tentukan banyaknya kelas interval.
Acuan aturan Starges
Banyak kelas

= 1 + (3,3) log n
= 1 + (3,3) log 80 = 7,28
≈ 7 kelas

3. Tentukan panjang kelas interval


P=

Re n tan g
64
=
= 9,14 = 10
Banyakkelas
7

4. Tentukan limit kelas
5. Daftar semua limit keats
6. Menentukan frekwensi → bantuan kolom tabulasi

Contoh:
Nilai Ujian Statistik 80 orang mahasiswa adalah sebagai berikut:
79 49 48 34 81 98 87 80
80 84 90 70 91 93 82 78
70 71 92 38 56 81 74 73
68 72 85 51 65 93 83 86

80 35 83 73 74 43 86 88
92 93 76 71 90 72 67 75
80 91 61 72 97 81 88 81
70 74 98 95 80 59 73 71
83 60 83 82 60 67 89 63
76 63 88 70 66 88 79 75
Dengan menggunakan aturan pembuatan distribusi frekuensi tersebut di atas dapat dibuat
sebuah distribusi frekuensi dengan 7 kelas sebagai berikut:
Nilai Ujian
31 – 40
41 – 50
51 – 60
61 – 70
71 – 80
81 – 90
91 - 100

Frekuensi (f)
2
3

5
14
24
20
12

1.8. Model Populasi
Adalah pendekatan bentuk polygon frekuensi dengan garis lengkung halus yang
bentuknya secocok mungkin:
a. Model normal
b. Model simetrik

c. Model miring (ke kanan/ke kiri).

Jika suatu frekwensi tidak simetrik maka nilai mean (rata-rata) dan median tidak sama.
Koefisien ke menjuluran pearson (sk)

sk =

3(µ -µ

σ

µ = median

µ = mean (rata-rata)
σ = simpangan baku.

TUGAS I :
Berikut ini adalah data daya tahan alat terhadap suatu insektisida dalam satuan menit.
2.4

0.7

3.9

2.8

1.3

1.6


2.9

2.6

3.7

2.1

3.2

3.5

1.8

3.1

0.3

4.6

0.9

3.4

2.3

2.5

0.4

2.1

2.5

1.5

4.3

1.8

2.4

1.3

2.6

1.8

2.7

0.4

2.8

3.5

1.4

1.7

3.9

1.1

5.9

2.0

5.3

6.3

0.2

2.0

1.9

1.2

2.5

1.2

1.2

1.7

Dengan menggunakan 8 kelas interval dan nilai terendah 0,1
a. Buat distribusi frekuensi, distribusi frekuensi relatif (%) dan distribusi frekuensi
kumulatif
b. Dengan menggunakan Microsoft Exel buatlah
1. Diagram balok, histogram, polygon frekuensi, Ogif dan diagram
lingkaran.
2. Tentukan rata-rata (mean), modus, median, kuartil dan desil.
1.9. UKURAN PEMUSATAN
Ukuran pemusatan dibagi dalam dua kelompok
1. Ukuran gejala pusat, meliputi


Rata-rata hitung (mean)



Rata-rata ukur



Rata-rata harmonic



Rata-rata gabungan



Modus

2. Ukuran letak, meliputi


Median



Kuartil



Desil



Persentil

Ukuran-ukuran tersebut di atas dapat dihitung dari kumpulan data populasi atau sampel.
Jika ukuran-ukuran yang diambil dihitung dari data populasi disebut

parameter ,

sedangkan jika dihitung dari data sampel disebut statistic.

1.9.1. Rata-rata Hitung (Mean)
Diperoleh dengan membagi jumlah seluruh data dengan banyak data
x=

∑x

i

n

Jika masing-masing mempunyai frekuensi maka rata-ratanya disebut sebagai rata-rata
terboboti.
x=

∑f x
∑f
i

i

i

contoh;
Barang

Disimpan (fi)

% Rusak (xi)

fi xi

A

100

96

96

B

200

46

92

C

160

50

80

D

80

75

60

Berapa persen rata-rata barang yang rusak
x=

∑f x
∑f
i

i

i

=

328
x 100 % = 60,07 %
540

Bukan seperti ini
x=

(96% + 46% + 50% + 75%) = 66,75 %
4

1.9.2. Rata-rata Gabungan
Jika kita mempunyai data n1, n2, n3, … dengan nilai rata-rata masing-masing x 1 , x 2 , x 3 , ...
maka rata-rata gabungan data di atas dinyatakan dengan
x gab =

∑n x
∑n
i

i

i

Untuk data-data yangv tersusun dalam distribusi frekuensi rata-ratanya dihitung dengan
x=

∑f x
∑f
k

k

k

dengan xk : nilai tengah kelas
fk : frekuensi kelas
atau dengan cara singkat/sandi (khusus untuk lebar kelas yang sama) yakni sebagai
berikut
 ∑ fi ci
x = xo + p
 ∑f
i







dengan xo : tengah kelas acuan

fi : frekuensi ke-i
ci : harga sandi

p : lebar kelas

1.9.3 Rata-rata Ukur (geometrik)
Digunakan jika perbandingan dua data berturutan tetap atau hampir tetap.
U = n x 1 . x 2 . x 3 ... x n
Untuk bilangan-bulangan yang besar digunakan
log U =

∑ log x

i

n

Untuk fenomena yang bersifat tumbuh seperti pertumbuhan penduduk, bakteri dan lainlain digunakan

x 

Pt = Po 1 +

 100 

t

Untuk data-data yang telah disusun dalam daftar distribusi frekuensi rata-rata ukurnya
dinyatakan
log U =

∑ (f log x )
∑f
i

i

i

1.9.4. Rata-rata Harmonik
Rata-rata harmonik biasanya digunakan untuk merata-ratakan kecepatan beberapa jarak
tempuh atau mencari harga rata-rata suatu komoditi tertentu.
H=

n
 1
∑  x
 i





Untuk data-data yang disusun dalam distribusi frekuensi
H=

∑f

i

 fi 

 i

∑  x

Secara umum hubungan rata-rata hitung (x ) , rata-rata ukur (U) dan rata-rata harmonic
(H) dinyatakan
H≤U≤x

1.9.5. MODUS
Modus adalah nilai atau fenomena yang paling sering muncul jika datanya telah disusun
dalam distribusi frekuensi .
 b1
M o = b + p 
 b1 + b 2





dengan b : batas bawah kelas modal (kelas dengan frekuensi tertinggi)
p : panjang/lebar kelas modal
b1: frekuensi kelas modal dikurangi frekuensi kelas sebelumnya
b2: frekuensi kelas modal dikurangi frekuensi kelas sebelumnya

1.9.6. KUARTIL
Jika sekumpulan data dibagi menjadi empat bagian yang sama setelah di urutkan maka
nilai yang membaginya disebut kuartil.
Letak k i = data ke

i (n + 1)
; i = 1, 2, 3
4

Untuk data yang disusun dalam distribusi frekuensi
 in

 −F
 ; i = 1, 2, 3
K i = b + p  10
 f 




dengan b : batas bawah kelas Di
p : panjang kelas Di
F : jumlah seluruh frekuensi sebelum kelas Di
f : frekuensi kelas Di

1.9.7. PRESENTIL
Jika sekumpulan data dibagi 100 sama besar akan menghasilkan persentil ke 1,2,3,…,99.
Letak Pi = data ke

i (n + 1)
100

Untuk data dalam distribusi frekuensi
 in

− F

100

Pi = b + p 
f
dengan b : batas bawah kelas Pi
p : panjang kelas Pi
F : jumlah seluruh frekuensi sebelum kelas Pis
f : frekuensi kelas Pi
QUIZ I
1. Apa yang dimaksud data diskrit dan data kontinu. Berikan masing-masing dua
contoh!
2. Jelaskan perbedaan diagram batang dan histogram. Gambarkan sketsanya!

3. Bagaimana rumus aturan untuk menentukan banyak kelas interval. Beri
keterangan symbol-simbolnya.
4. Berikut adalah data umur 100 karyawan pabrik
44
35
41
31
49
34
37
63

51
33
37
33
41
38
52
31

40
36
42
28
40
40
35
32

45
39
40
48
61
61
44
58

53
47
30
64
31
35
65
43

67
53
42
43
52
68
64
46

50
45
59
56
59
47
43
37

52
40
27
44
41
33
29
24

47
26
45
41
55
34
51
58

34
26
25
44
57
67
59
62

28 44 31 29 53 41 52 36 51 40
40 31 52 56 58 58 52 23 35 52
a. Buat daftar distribusi frekuensi dengan 5 kelas.
b. Gambarkan polygon frekuensinya.
c. Tentukan mean, modus, median
Kuartil 1 dan desil 7 berdasarkan distribusi fekuensi yang telah dibuat.

1.10. UKURAN SIMPANGAN
Ukuran simpangan digunakan sebagai gambaran bagaimana berpencarnya suatu
data kuantitatif. Ukuran-ukuran tersebut yaitu:
a. Rentang = data terbesar – data terkecil
b.Rentang Antar Kuartil (RAK)
RAK = K3 – K1
c. Simpangan Kuartil (SK)
SK

= 1/2 RAK = 1/2 (K3 – K1)

d. Rata-rata Simpangan (RS)
RS

=



χi − χ
n

Selalu positif

e. Simpangan baku/ deviasi standart


Simpangan baku untuk sampel disimbolkan S



Simpangan baku untuk populasi disimbolkan σ

Kuadrat simpangan baku disebut Varians
Varians sampel dihitung dengan :
2

S

=

∑ (χ

− χ)

=

n ∑ χ i − (∑ χ i )

2

i

n −1

atau
2

2

2

S

Ini lebih dianjurkan karena kesalahannya -

n (n − 1 )

Lebih kecil
Jika datanya dalam distribusi frekuensi :
2

S

=

∑ f (χ

=

n ∑ f i χ i − (∑ f i χ i )

i

− χ)

2

i

n −1

Atau
2

2

2

S

n (n − 1 )

Cara Sandi xi dapat diganti ci
Simpangn baku gabungan
S2

=

∑ (n − 1)S
∑n−K
i

2
i

ni = jumlah data sampel ke i
Si = Simpangan baku sample ke i
K = jumlah / banyaknya sampel .
Bilangan baku/ Nilai Z
Bilangan baku/nilai z didefinisikan sebagai :
Zi

=

∑χ

i

−χ

s

; i = 1,2,3,…. N

Atau lengkapnya
Zi

 χi − χ 

 s 

= χo + s o 

xo = rata-rata bilangan baku

so = Simpangan baku
Ukuran-ukuran

simpangan diatas merupakan ukuran absolut. Jika dari simpangan

absolut diambil simpangan bakunya, maka kita dapat koefisien Variasi
KV

=

Simpangan baku
x100%
rata - rata

Selain ukuran simpangan/ disperse absolut, dikenal pula dispersi relatif yang dinyatakan :
Dispersi relative

=

Simpangan baku
rata - rata