UKURAN NILAI PUSAT STATISTIK dan PROBA

UKURAN NILAI
PUSAT
Feri Harianto

Pengertian
Untuk keperluan penganalisisan data lebih lanjut, di
samping pembuatan tabel dan grafik diperlukan juga ukuranukuran yang dapat mewakili data tersebut, sehingga dapat
diucapkan secara singkat dan dapat digunakan untuk
membandingkan keadaan berbagai kelompok data.
Nilai tunggal yang dianggap dapat mewakili keseluruhan
nilai dalam data dianggap sebagai rata-rata (average),
karena nilai rata-rata itu dihitung berdasarkan keseluruhan
nilai yang terdapat dalam data bersangkutan. Nilai rata-rata
itulah yang disebut ukuran nilai pusat atau ukuran tendensi
pusat.

Jenis-jenis Ukuran Nilai Pusat
1.

Rata-rata Hitung (Mean); adalah nilai rata-rata dari
data-data yang ada.

Mean dari populasi diberi simbol  (baca miu).
Mean dari sampel diberi simbolX (baca eks bar)
rumus : Rata-rata hitung =
a.

Jumlah semua data
Jumlah data

Mean untuk data tunggal

Keterangan :
X = mean
X = wakil data
n = jumlah data

X

X
n




X1  X 2  ...  X n
n

Latihan : hitunglah rata-rata hitung dari nilai-nilai 7, 6, 3, 8, 9, 4

f1 X1  f 2 X 2  ...  f n X n
 fX
Keterangan :
X

X = mean
f1  f 2  ...  f n
f
X = wakil data
f = frekuensi
Latihan : hitunglah rata-rata hitung dari nilai-nilai 3, 4, 3, 2, 5, 1, 4, 5,
1, 2, 6, 4, 3, 6, 1


 fm f1m1  f 2 m2  ...  f k mk
X

f
f1  f 2  ...  f k

Keterangan :
X = mean
m = nilai rata-rata hitung
f = frekuensi
Latihan :
Sebuah perusahaan memiliki 40 pekerja. Perusahaan memberikan
gaji, yaitu 5 orang dengan gaji Rp350.000,00/bulan, 10 orang dengan
gaji Rp250.000,00/bulan, dan 25 orang dengan gaji
Rp125.000,00/bulan. Berapa rata-rata rupiah yang dikeluarkan oleh
perusahaan itu per bulan untuk setiap pekerja ?

b.

Mean untuk data berkelompok


Keterangan :
X = mean
X = titik tengah interval
f = frekuensi pada interval kelas

 fX
X
f

Latihan : tentukan rata-rata hitung dari tabel berikut
Berat badan (kg)

Banyaknya Mahasiswa (f)

60 – 62
63 – 65
66 – 68
69 – 71
72 – 74


10
25
32
15
18

2.

Median; adalah nilai tengah dari data-data yang ada
setelah diurutkan.
Median diberi simbol Me atau Md.
a.

Median untuk data tunggal
* jika jumlah data ganjil, mediannya adalah data yang berada
paling tengah

Me  X n


2

* jika jumlah data genap, mediannya adalah hasil bagi jumlah
dua data yang berada di tengah

Me 

X n  X n2
2

2

2

Latihan : tentukan median dari data berikut :

4, 3, 6, 2, 7, 5, 8

11, 5, 4, 7, 14, 8, 9, 12


b.

Median untuk data berkelompok
1
rumus :

Me  B  2

n  (  f 2 )o
f Me

C

Keterangan :
Me = median
B = tepi bawah kelas median
n = jumlah frekuensi
( f2 )o = jumlah frekuensi kelas-kelas sebelum kelas median
C = panjang interval kelas
f Me = frekuensi kelas median

Dalam mencari median data berkelompok (distribusi frekuensi)
yang perlu dicari terlebih dahulu adalah kelas tempat median
berada (kelas median). Kelas median dapat dicari dengan :

(  f 2 )o  ½ n

Latihan :
Tentukan median dari distribusi frekuensi berikut
Diameter pipa (mm) Frekuensi (f)
65 – 67
68 – 70
71 – 73
74 – 76
77 – 79
80 – 82

2
5
13
14

4
2

Penyelesaian :

(  f 2 )o

Jumlah frekuensi (n) = 40 dan ½ n = 20
Kelas median adalah

 ½ n ; f1  f 2  f3  20

Jadi, kelas median adalah kelas ke-3
B = 70,5

(  f 2 )o = 7
C =3

f Me = 13


Me  70,5 

20  7
 3 = 73,5
13

3.

Modus; adalah nilai yang paling sering muncul dalam
data.
Modus diberi simbol Mo.
Modus untuk data tunggal
* modus dari data tunggal adalah data yang frekuensinya
terbanyak.
Latihan : tentukan modus dari data berikut :
• 1, 3, 6, 6, 7, 8, 9
• 1, 4, 7, 8, 9, 12
• 1, 2, 4, 4, 6, 8, 8, 12, 14
b. Modus untuk data berkelompok
* modus dari data berkelompok hanya dapat diperkirakan.

Nilai yang paling sering muncul akan berada di kelas yang
memiliki frekuensi terbesar, disebut sebagai kelas modus.
a.

Mo  L 

Keterangan :
Mo
= modus
L
= tepi bawah kelas
= selisih frekuensi kelas modus dengan
d1
frekuensi kelas sebelumnya
d2
= selisih frekuensi kelas modus dengan
frekuensi kelas sesudahnya
C
= panjang interval kelas

d1  d 2
d2

C

Latihan : tentukan modus dari distribusi frekuensi pada tabel di atas

4.

Kuartil (Q); adalah nilai-nilai yang membagi
seperangkat data yang telah terurut menjadi empat
bagian yang sama.
Q1 = kuartil bawah atau pertama
Q2 = kuartil tengah atau kedua = median
Q3 = kuartil atas atau ketiga
a.

i (n  1)

Kuartil untuk data tunggal

Qi 

nilai ke

i = 1, 2, 3

4

Latihan : tentukan kuartil dari data berikut :

3, 6, 10, 4, 8, 9, 14

4, 9, 6, 12, 10, 5, 14, 2

b.

Kuartil untuk data berkelompok

in

Qi  Bi  4

 (  fi ) o
fQi

C

Keterangan :
Bi = tepi bawah kelas kuartil
n
= jumlah semua frekuensi
I
= 1, 2, 3
( fi )o = jumlah frekuensi semua kelas sebelum kelas kuartil
C = panjang interval kelas
fQi = frekuensi kelas kuartil

Measures of Variation
Variation

Variance

Range

Population
Variance
Sample
Variance

Interquartile Range

Standard Deviation
Population
Standard
Deviation
Sample
Standard
Deviation

Coefficient
of Variation

The Range
• Measure of Variation
• Difference Between Largest & Smallest
Observations:

Range = x Largest  x Smallest

• Ignores How Data Are Distributed:
Range = 12 - 7 = 5

Range = 12 - 7 = 5

7

8

9

10

11 12

7

8

9

10

11

12

Interquartile Range


Measure of Variation

• Also Known as Midspread:
Spread in the Middle 50%
• Difference Between Third & First
Quartiles: Interquartile Range =

• Not Affected by Extreme Values

Q 3  Q1

Q 3  Q 1 = 17.5 - 12.5 = 5

Data in Ordered Array: 11 12 13 16 16 17

17 18 21

Variance
•Important Measure of Variation
•Shows Variation About the Mean:
2


X



2
i
•For the Population:  
N
•For the Sample:
For the Population: use N in the
denominator.

  Xi  X 
s 
n 1

2

2

For the Sample : use n - 1 in the
denominator.

Standard Deviation
•Most Important Measure of Variation
•Shows Variation About the Mean:
2



X

 i
•For the Population:  
N

•For the Sample:
For the Population: use N in the
denominator.

s 

 X i  X
n 1



2

For the Sample : use n - 1 in the
denominator.

Sample Standard Deviation
s 
Data:

24

 Xi  X 
n 1

Xi :

10

2

12

n=8

s=
=

For the Sample : use n - 1 in the
denominator.

14

15

17

18

18

Mean =16

(10  16)2  (12  16)2  (14  16)2  (15  16)2  (17  16)2  (18  16)2  (24  16)2
8 1
4.2426

Comparing Standard Deviations
Data :

X i : 10
N= 8

12

14

15

17

18

  Xi  X 
n 1
2
 X i   
N

18

24

Mean =16

2

s =

 

=

4.2426

=

3.9686

Value for the Standard Deviation is larger for data considered as a
Sample.

Comparing Standard Deviations
Data A
Mean = 15.5

11

12

13

14 15 16 17 18 19 20 21

s = 3.338

Data B

Mean = 15.5

11 12 13 14 15 16 17 18

19

20

21

s = .9258

Data C
Mean = 15.5

11

12

13 14 15 16 17 18 19 20

21

s = 4.57

Coefficient of Variation
•Measure of Relative Variation
•Always a %

•Shows Variation Relative to Mean
•Used to Compare 2 or More Groups
•Formula ( for Sample):

S
CV  
X


  100%


Comparing Coefficient of Variation
 Stock A: Average Price last year = $50



Standard Deviation = $5
 Stock B: Average Price last year = $100

Standard Deviation = $5

S
CV     100%
X 

Coefficient of
Variation:
Stock A: CV = 10%
Stock B: CV = 5%

Shape




Describes How Data Are Distributed
Measures of Shape:
Symmetric or skewed
Left-Skewed
Mean Median Mod
e

Symmetric
Mean = Median = Mode

Right-Skewed
Mode Median Mean

Box-and-Whisker Plot


Graphical Display of Data Using
5-Number Summary

X smallest Q1 Median Q3

4

6

8

10

Xlargest

12

Distribution Shape &
Box-and-Whisker Plots

Left-Skewed

Q1 Median Q3

Symmetric

Q1

Median Q3

Right-Skewed

Q1 Median Q3

Kesimetrisan
 Skewness coefficient (koefisien kemiringan)

[ 1/(n-1 ]  (xi – xrata)3

b1 = ---------------------------s3

Kesimetrisan
 Kurtosis coefficient (koefisien keruncingan)

[ 1/(n-1 ]  (xi – xrata)4

b2 = ----------------------------

s4

DISTRIBUSI
FREKUENSI

Pengertian
Data yang telah diperoleh dari suatu penelitian yang
masih berupa data acak atau data mentah dapat dibuat
menjadi data yang berkelompok, yaitu data yang telah
disusun ke dalam kelas-kelas tertentu. Daftar yang memuat
data berkelompok disebut distribusi frekuensi atau tabel
frekuensi.
Jadi, distribusi frekuensi adalah susunan data menurut
kelas-kelas interval tertentu atau menurut kategori tertentu
dalam sebuah daftar.
Diperoleh keterangan atau gambaran sederhana dan
sistematis dari data yang diperoleh.

Bagian-bagian Distribusi Frekuensi
Kelas-kelas; adalah kelompok nilai data atau variabel.
2. Batas kelas; adalah nilai-nilai yang membatasi kelas yang
satu dengan kelas yang lain.
1.

a.
b.

3.

Batas kelas bawah, terdapat di deretan sebelah kiri setiap kelas,
Batas kelas atas, terdapat di deretan sebelah kanan setiap kelas.

Tepi kelas (batas nyata kelas); adalah batas kelas yang
tidak memiliki lubang untuk angka tertentu antara kelas
yang satu dengan yang lain
a.
b.

Tepi bawah kelas atau batas kelas bawah sebenarnya = batas
bawah kelas – 0,5
Tepi atas kelas atau batas kelas atas sebenarnya = batas atas
kelas + 0,5

Bagian-bagian Distribusi Frekuensi
Titik tengah kelas; adalah angka atau nilai data yang
tepat terletak di tengah suatu kelas, merupakan nilai
yang mewakili kelasnya.
Titik tengah
kelas = ½ (batas atas + batas bawah) kelas
5. Interval kelas; adalah selang yang memisahkan kelas
yang satu dengan yang lain.
6. Panjang interval kelas atau luas kelas; adalah jarak
antara tepi atas kelas dan tepi bawah kelas.
7. Frekuensi kelas; adalah banyaknya data yang termasuk
ke dalam kelas tertentu
4.

contoh
Modal (jutaan Rp) Frekuensi (f)
50 – 59
60 – 69
70 – 79
80 – 89
90 – 99

16
32
20
17
15

Jumlah

100

Sumber : Data fiktif

• Banyaknya kelas adalah 5
• Batas bawah kelas-kelas adalah 50, 60, 70, 80, 90

• Batas atas kelas-kelas adalah 59, 69, 79, 89, 99
• Tepi bawah kelas-kelas adalah 49,5; 59,5; 69,5; 79,5; 89,5
• Tepi atas kelas-kelas adalah 59,5; 69,5; 79,5; 89,5; 99,5

• Titik tengah kelas-kelas adalah 54,5; 64,5; 74,5; 84,5;
94,5
• Interval kelas-kelas adalah 50-59; 60-69; ,,, ;90-99
• Panjang interval kelas-kelas masing-masing 10
• Frekuensi kelas-kelas adalah 16, 32, 20, 17, 15

Penyusunan Distribusi Frekuensi
Mengurutkan data dari yang terkecil ke yang terbesar.
2. Menentukan jangkauan (range) dari data
Jangkauan = data terbesar – data terkecil
3. Menentukan banyaknya kelas (k) dengan rumus sturgess
1.

k = 1 + 3,3 log n
Keterangan :
k = banyaknya kelas

n = banyaknya data

k  bulat

Penyusunan Distribusi Frekuensi
4.

5.

6.

Menentukan panjang interval kelas (i)
jangkauan (R)
i=
banyaknya kelas (k)
Menentukan batas bawah kelas pertama; biasanya dipilih
dari data terkecil atau data terkecil yang berasal dari
pelebaran jangkauan (data yang lebih kecil dari data
terkecil) dan selisihnya harus kurang dari panjang interval
kelasnya
Menuliskan frekuensi kelas secara melidi sesuai banyaknya
data

Catatan tentang penyusunan distribusi frekuensi

1. Perlu dijaga jangan sampai ada data yang tidak dimasukkan
ke dalam kelas atau ada data yang masuk ke dalam dua
kelas yang berbeda.
2. Titik tengah kelas diusahakan bilangan bulat tidak pecahan.

3. Nilai frekuensi diusahakan tidak ada yang nol (0).
4. Dalam menentukan banyaknya kelas (k), diusahakan :
a. tidak terlalu sedikit, sehingga pola kelompok kabur;
b. banyaknya kelas berkisar 5 sampai 15 buah;
c. jika jangkauan terlalu besar, banyaknya kelas antara 10
sampai 20.

Contoh soal
Dari hasil pengukuran diameter pipa-pipa yang dibuat oleh sebuah mesin
(dalam mm terdekat), diperoleh data sebagai berikut
78

72

74

79

74

71

75

74

72

68

72

73

72

74

75

74

73

74

65

72

66

75

80

69

82

73

74

72

79

71

70

75

71

70

70

70

75

76

77

67

Buatlah distribusi frekuensi dari data tersebut !
Penyelesaian:
a.Urutan data :
65

66

67

68

69

70

70

70

70

71

71

71

72

72

72

72

72

72

73

73

73

74

74

74

74

74

74

74

75

75

75

75

75

76

77

78

79

79

80

82

b. Jangkauan (R) = 82 – 65 = 17
c. Banyaknya kelas (k) adalah
k = 1+ 3,3 log 40

= 1+ 5,3 = 6,3  6

d. Panjang interval kelas (i) adalah
i = 17 / 6 = 2,83  3

e. Batas kelas pertama adalah 65 (data terkecil)
f. Tabelnya :
Diameter

Turus

Frekuensi

65 – 67
68 – 70
71 – 73
74 – 76
77 – 79
80 – 82

III
IIII I
IIII IIII II
IIII IIII III
IIII
II

3
6
12
13
4
2

Jumlah

40

Histogram dan Poligon Frekuensi
Adalah dua grafik yang sering digunakan untuk menggambarkan distribusi frekuensi. Histogram merupakan grafik batang
dari distribusi frekuensi dan poligon frekuensi merupakan grafik
garisnya.
Histogram = batang-batangnya saling melekat atau berimpitan

digunakan sistem salib sumbu; sumbu x menyatakan interval
kelas dan sumbu y menyatakan frekuensi.
Poligon Frekuensi = dibuat dengan cara menarik garis dari satu
titik tengah batang histogram ke titik tengah batang histogram lain

contoh
Interval Kelas
140 –
145 –
150 –
155 –
160 –
165 –
170 –

144
149
154
159
164
169
174

Frekuensi
(banyak murid)

Tepi Interval
Kelas

Titik tengah

2
4
10
14
12
5
3

139,5 – 144,5
144,5 – 149,5
149,5 – 154,5
154,5 – 159,5
159,5 – 164,5
164,5 – 169,5
169,5 – 174,5

142
147
152
157
162
167
172

f = 50

Frekuensi

a. Histogram
15
10
5
0
144,5

149,5

154,5

159,5

164,5

169,5

174,5

139,5

144,5

149,5

154,5

159,5

164,5

169,5

Tinggi Badan

b. Poligon frekuensi

Frekuensi

15
10
5
0
142

147

152

157

162

Tinggi Badan

167

172

Teknik Grafis (Graphical
Techniques)




Peringkasan data secara visual atau
grafis yang menggunakan gambargambar berdasarkan tabel data yang
telah ada sebelumnya
Teknik Grafis :
- Piktogram
- Pie Chart
- Bar Chart
- Histogram Frekuensi
- Ogive
- Stem and Leaf Plot
- Box Plot

Piktogram

Pie Chart (Diagram Pia)


Data digambarkan
dengan suatu
lingkaran yang
sektor-sektornya
menggambarkan
proporsi variabel
yang berbeda

Histogram & Poligon
Frekuensi


Data diringkas dalam
bentuk grafik yang
mencerminkan
distribusi frekuensi.
Diperlukan sumbu X
untuk menyatakan
interval kelas dan
sumbu Y untuk
menyatakan frekuensi
kelas

Ogive (Poligon Frekuensi
Kumulatif)


Data diringkas
dalam bentuk grafik
yang merupakan
grafik dari distribusi
frekuensi kumulatif
lebih dari atau
kurang dari.

Stem and Leaf Plot
(Diagram Batang dan Daun)





Diperkenalkan oleh
John Tuckey (1977)
Data dirangkum
dalam bentuk
batang dan daun
(stem and leaf).
Jika ukuran data
besar maka stem
dapat dibuat
menjadi dua baris

Box Plot (Diagram Kotak – Box and
Whisker plot)


Peringkasan data
menggunakan
diagram kotak untuk
menggambarkan
apakah data
mempunyai outlier
(data ekstrim) atau
tidak



Untuk membuat Box Plot, ada beberapa
hal yang harus diketahui :
- Nilai minimum
- Nilai maksimum
- Median (Q2 = kuartil ke-2)
- Lower Quartile (Q1 = kuartil ke-1)
- Upper Quartile (Q3 = kuartil ke-3)
- IQR (Inter Quartile Range ) = Q3-Q1
- LIF (Lower Inner Fence) = Q1 – 1,5 IQR
- UIF (Upper Inner Fence) = Q3 + 1,5 IQR
- LOF (Lower Outer Fence) = Q1 – 3 IQR
- UOF (Upper Outer Fence) = Q3 + 3 IQR

Contoh


Misalkan dimiliki data berikut :
5,3 4,0 12,5 3,0 3,9 6,4 5,2 2,6 15,8, 6,2 4,0
7,1 3,4 4,4 3,5 3,4 3,2 5,6 3,2 3,4 8,6 3,1
n = 22, nilai minimum = 2,6, nilai maksimum = 15,8
Data terurut :
2,6 3,0 3,1 3,2 3,2 3,4 3,4 3,5 3,7 3,9 4,0
4,0 4,4 5,2 5,3 5,6 6,2 6,4 7,1 8,6 12,5 15,8



Lokasi Median : (n+1)/2 = 23/2 = 11,5
 Median (4,0 + 4,0)/2 = 4,0
 Mean = 5,4
 Lokasi Q1 :
(lokasi median dibulatkan ke bawah + 1)/2
yaitu lokasi ke 6 dari nilai minimum
Q1 = 3,4
 Lokasi Q3 :
(lokasi median dibulatkan ke bawah + 1)/2
yaitu lokasi ke 6 dari nilai maksimum
Q3 = 6,2



IQR = Q3-Q1 = 6,2 – 3,4 = 2,8
 LIF = Q1 - 1,5 IQR = 3,4 – 1,5 (2,8) = - 0,8
 UIF = Q3 + 1,5 IQR = 6,2 + 1,5 (2,8) = 10,4
 LOF = Q1 - 3 IQR = 3,4 – 3 (2,8) = - 5
 UOF = Q3 + 3 IQR = 6,2 + 3 (2,8) = 14,6
Data yang terletak antara LIF dan UIF bukan
outlier
Data yang terletak di luar LIF dan UIF adalah
outlier yang dibedakan menjadi 2 yaitu mild
outlier dan extrem outlier

Boxplot - Contoh






Bila semua data
terletak terletak antara
LIF dan UIF maka data
tidak memiliki outlier
Data terletak antara IF
dan OF disebut mild
outlier (tanda bulat)
Data terletak di luar OF
disebut extreme outlier
(tanda bintang)