UKURAN NILAI PUSAT STATISTIK dan PROBA
UKURAN NILAI
PUSAT
Feri Harianto
Pengertian
Untuk keperluan penganalisisan data lebih lanjut, di
samping pembuatan tabel dan grafik diperlukan juga ukuranukuran yang dapat mewakili data tersebut, sehingga dapat
diucapkan secara singkat dan dapat digunakan untuk
membandingkan keadaan berbagai kelompok data.
Nilai tunggal yang dianggap dapat mewakili keseluruhan
nilai dalam data dianggap sebagai rata-rata (average),
karena nilai rata-rata itu dihitung berdasarkan keseluruhan
nilai yang terdapat dalam data bersangkutan. Nilai rata-rata
itulah yang disebut ukuran nilai pusat atau ukuran tendensi
pusat.
Jenis-jenis Ukuran Nilai Pusat
1.
Rata-rata Hitung (Mean); adalah nilai rata-rata dari
data-data yang ada.
Mean dari populasi diberi simbol (baca miu).
Mean dari sampel diberi simbolX (baca eks bar)
rumus : Rata-rata hitung =
a.
Jumlah semua data
Jumlah data
Mean untuk data tunggal
Keterangan :
X = mean
X = wakil data
n = jumlah data
X
X
n
X1 X 2 ... X n
n
Latihan : hitunglah rata-rata hitung dari nilai-nilai 7, 6, 3, 8, 9, 4
f1 X1 f 2 X 2 ... f n X n
fX
Keterangan :
X
X = mean
f1 f 2 ... f n
f
X = wakil data
f = frekuensi
Latihan : hitunglah rata-rata hitung dari nilai-nilai 3, 4, 3, 2, 5, 1, 4, 5,
1, 2, 6, 4, 3, 6, 1
fm f1m1 f 2 m2 ... f k mk
X
f
f1 f 2 ... f k
Keterangan :
X = mean
m = nilai rata-rata hitung
f = frekuensi
Latihan :
Sebuah perusahaan memiliki 40 pekerja. Perusahaan memberikan
gaji, yaitu 5 orang dengan gaji Rp350.000,00/bulan, 10 orang dengan
gaji Rp250.000,00/bulan, dan 25 orang dengan gaji
Rp125.000,00/bulan. Berapa rata-rata rupiah yang dikeluarkan oleh
perusahaan itu per bulan untuk setiap pekerja ?
b.
Mean untuk data berkelompok
Keterangan :
X = mean
X = titik tengah interval
f = frekuensi pada interval kelas
fX
X
f
Latihan : tentukan rata-rata hitung dari tabel berikut
Berat badan (kg)
Banyaknya Mahasiswa (f)
60 – 62
63 – 65
66 – 68
69 – 71
72 – 74
10
25
32
15
18
2.
Median; adalah nilai tengah dari data-data yang ada
setelah diurutkan.
Median diberi simbol Me atau Md.
a.
Median untuk data tunggal
* jika jumlah data ganjil, mediannya adalah data yang berada
paling tengah
Me X n
2
* jika jumlah data genap, mediannya adalah hasil bagi jumlah
dua data yang berada di tengah
Me
X n X n2
2
2
2
Latihan : tentukan median dari data berikut :
•
4, 3, 6, 2, 7, 5, 8
•
11, 5, 4, 7, 14, 8, 9, 12
b.
Median untuk data berkelompok
1
rumus :
Me B 2
n ( f 2 )o
f Me
C
Keterangan :
Me = median
B = tepi bawah kelas median
n = jumlah frekuensi
( f2 )o = jumlah frekuensi kelas-kelas sebelum kelas median
C = panjang interval kelas
f Me = frekuensi kelas median
Dalam mencari median data berkelompok (distribusi frekuensi)
yang perlu dicari terlebih dahulu adalah kelas tempat median
berada (kelas median). Kelas median dapat dicari dengan :
( f 2 )o ½ n
Latihan :
Tentukan median dari distribusi frekuensi berikut
Diameter pipa (mm) Frekuensi (f)
65 – 67
68 – 70
71 – 73
74 – 76
77 – 79
80 – 82
2
5
13
14
4
2
Penyelesaian :
( f 2 )o
Jumlah frekuensi (n) = 40 dan ½ n = 20
Kelas median adalah
½ n ; f1 f 2 f3 20
Jadi, kelas median adalah kelas ke-3
B = 70,5
( f 2 )o = 7
C =3
f Me = 13
Me 70,5
20 7
3 = 73,5
13
3.
Modus; adalah nilai yang paling sering muncul dalam
data.
Modus diberi simbol Mo.
Modus untuk data tunggal
* modus dari data tunggal adalah data yang frekuensinya
terbanyak.
Latihan : tentukan modus dari data berikut :
• 1, 3, 6, 6, 7, 8, 9
• 1, 4, 7, 8, 9, 12
• 1, 2, 4, 4, 6, 8, 8, 12, 14
b. Modus untuk data berkelompok
* modus dari data berkelompok hanya dapat diperkirakan.
Nilai yang paling sering muncul akan berada di kelas yang
memiliki frekuensi terbesar, disebut sebagai kelas modus.
a.
Mo L
Keterangan :
Mo
= modus
L
= tepi bawah kelas
= selisih frekuensi kelas modus dengan
d1
frekuensi kelas sebelumnya
d2
= selisih frekuensi kelas modus dengan
frekuensi kelas sesudahnya
C
= panjang interval kelas
d1 d 2
d2
C
Latihan : tentukan modus dari distribusi frekuensi pada tabel di atas
4.
Kuartil (Q); adalah nilai-nilai yang membagi
seperangkat data yang telah terurut menjadi empat
bagian yang sama.
Q1 = kuartil bawah atau pertama
Q2 = kuartil tengah atau kedua = median
Q3 = kuartil atas atau ketiga
a.
i (n 1)
Kuartil untuk data tunggal
Qi
nilai ke
i = 1, 2, 3
4
Latihan : tentukan kuartil dari data berikut :
•
3, 6, 10, 4, 8, 9, 14
•
4, 9, 6, 12, 10, 5, 14, 2
b.
Kuartil untuk data berkelompok
in
Qi Bi 4
( fi ) o
fQi
C
Keterangan :
Bi = tepi bawah kelas kuartil
n
= jumlah semua frekuensi
I
= 1, 2, 3
( fi )o = jumlah frekuensi semua kelas sebelum kelas kuartil
C = panjang interval kelas
fQi = frekuensi kelas kuartil
Measures of Variation
Variation
Variance
Range
Population
Variance
Sample
Variance
Interquartile Range
Standard Deviation
Population
Standard
Deviation
Sample
Standard
Deviation
Coefficient
of Variation
The Range
• Measure of Variation
• Difference Between Largest & Smallest
Observations:
Range = x Largest x Smallest
• Ignores How Data Are Distributed:
Range = 12 - 7 = 5
Range = 12 - 7 = 5
7
8
9
10
11 12
7
8
9
10
11
12
Interquartile Range
•
Measure of Variation
• Also Known as Midspread:
Spread in the Middle 50%
• Difference Between Third & First
Quartiles: Interquartile Range =
• Not Affected by Extreme Values
Q 3 Q1
Q 3 Q 1 = 17.5 - 12.5 = 5
Data in Ordered Array: 11 12 13 16 16 17
17 18 21
Variance
•Important Measure of Variation
•Shows Variation About the Mean:
2
X
2
i
•For the Population:
N
•For the Sample:
For the Population: use N in the
denominator.
Xi X
s
n 1
2
2
For the Sample : use n - 1 in the
denominator.
Standard Deviation
•Most Important Measure of Variation
•Shows Variation About the Mean:
2
X
i
•For the Population:
N
•For the Sample:
For the Population: use N in the
denominator.
s
X i X
n 1
2
For the Sample : use n - 1 in the
denominator.
Sample Standard Deviation
s
Data:
24
Xi X
n 1
Xi :
10
2
12
n=8
s=
=
For the Sample : use n - 1 in the
denominator.
14
15
17
18
18
Mean =16
(10 16)2 (12 16)2 (14 16)2 (15 16)2 (17 16)2 (18 16)2 (24 16)2
8 1
4.2426
Comparing Standard Deviations
Data :
X i : 10
N= 8
12
14
15
17
18
Xi X
n 1
2
X i
N
18
24
Mean =16
2
s =
=
4.2426
=
3.9686
Value for the Standard Deviation is larger for data considered as a
Sample.
Comparing Standard Deviations
Data A
Mean = 15.5
11
12
13
14 15 16 17 18 19 20 21
s = 3.338
Data B
Mean = 15.5
11 12 13 14 15 16 17 18
19
20
21
s = .9258
Data C
Mean = 15.5
11
12
13 14 15 16 17 18 19 20
21
s = 4.57
Coefficient of Variation
•Measure of Relative Variation
•Always a %
•Shows Variation Relative to Mean
•Used to Compare 2 or More Groups
•Formula ( for Sample):
S
CV
X
100%
Comparing Coefficient of Variation
Stock A: Average Price last year = $50
Standard Deviation = $5
Stock B: Average Price last year = $100
Standard Deviation = $5
S
CV 100%
X
Coefficient of
Variation:
Stock A: CV = 10%
Stock B: CV = 5%
Shape
•
•
Describes How Data Are Distributed
Measures of Shape:
Symmetric or skewed
Left-Skewed
Mean Median Mod
e
Symmetric
Mean = Median = Mode
Right-Skewed
Mode Median Mean
Box-and-Whisker Plot
Graphical Display of Data Using
5-Number Summary
X smallest Q1 Median Q3
4
6
8
10
Xlargest
12
Distribution Shape &
Box-and-Whisker Plots
Left-Skewed
Q1 Median Q3
Symmetric
Q1
Median Q3
Right-Skewed
Q1 Median Q3
Kesimetrisan
Skewness coefficient (koefisien kemiringan)
[ 1/(n-1 ] (xi – xrata)3
b1 = ---------------------------s3
Kesimetrisan
Kurtosis coefficient (koefisien keruncingan)
[ 1/(n-1 ] (xi – xrata)4
b2 = ----------------------------
s4
DISTRIBUSI
FREKUENSI
Pengertian
Data yang telah diperoleh dari suatu penelitian yang
masih berupa data acak atau data mentah dapat dibuat
menjadi data yang berkelompok, yaitu data yang telah
disusun ke dalam kelas-kelas tertentu. Daftar yang memuat
data berkelompok disebut distribusi frekuensi atau tabel
frekuensi.
Jadi, distribusi frekuensi adalah susunan data menurut
kelas-kelas interval tertentu atau menurut kategori tertentu
dalam sebuah daftar.
Diperoleh keterangan atau gambaran sederhana dan
sistematis dari data yang diperoleh.
Bagian-bagian Distribusi Frekuensi
Kelas-kelas; adalah kelompok nilai data atau variabel.
2. Batas kelas; adalah nilai-nilai yang membatasi kelas yang
satu dengan kelas yang lain.
1.
a.
b.
3.
Batas kelas bawah, terdapat di deretan sebelah kiri setiap kelas,
Batas kelas atas, terdapat di deretan sebelah kanan setiap kelas.
Tepi kelas (batas nyata kelas); adalah batas kelas yang
tidak memiliki lubang untuk angka tertentu antara kelas
yang satu dengan yang lain
a.
b.
Tepi bawah kelas atau batas kelas bawah sebenarnya = batas
bawah kelas – 0,5
Tepi atas kelas atau batas kelas atas sebenarnya = batas atas
kelas + 0,5
Bagian-bagian Distribusi Frekuensi
Titik tengah kelas; adalah angka atau nilai data yang
tepat terletak di tengah suatu kelas, merupakan nilai
yang mewakili kelasnya.
Titik tengah
kelas = ½ (batas atas + batas bawah) kelas
5. Interval kelas; adalah selang yang memisahkan kelas
yang satu dengan yang lain.
6. Panjang interval kelas atau luas kelas; adalah jarak
antara tepi atas kelas dan tepi bawah kelas.
7. Frekuensi kelas; adalah banyaknya data yang termasuk
ke dalam kelas tertentu
4.
contoh
Modal (jutaan Rp) Frekuensi (f)
50 – 59
60 – 69
70 – 79
80 – 89
90 – 99
16
32
20
17
15
Jumlah
100
Sumber : Data fiktif
• Banyaknya kelas adalah 5
• Batas bawah kelas-kelas adalah 50, 60, 70, 80, 90
• Batas atas kelas-kelas adalah 59, 69, 79, 89, 99
• Tepi bawah kelas-kelas adalah 49,5; 59,5; 69,5; 79,5; 89,5
• Tepi atas kelas-kelas adalah 59,5; 69,5; 79,5; 89,5; 99,5
• Titik tengah kelas-kelas adalah 54,5; 64,5; 74,5; 84,5;
94,5
• Interval kelas-kelas adalah 50-59; 60-69; ,,, ;90-99
• Panjang interval kelas-kelas masing-masing 10
• Frekuensi kelas-kelas adalah 16, 32, 20, 17, 15
Penyusunan Distribusi Frekuensi
Mengurutkan data dari yang terkecil ke yang terbesar.
2. Menentukan jangkauan (range) dari data
Jangkauan = data terbesar – data terkecil
3. Menentukan banyaknya kelas (k) dengan rumus sturgess
1.
k = 1 + 3,3 log n
Keterangan :
k = banyaknya kelas
n = banyaknya data
k bulat
Penyusunan Distribusi Frekuensi
4.
5.
6.
Menentukan panjang interval kelas (i)
jangkauan (R)
i=
banyaknya kelas (k)
Menentukan batas bawah kelas pertama; biasanya dipilih
dari data terkecil atau data terkecil yang berasal dari
pelebaran jangkauan (data yang lebih kecil dari data
terkecil) dan selisihnya harus kurang dari panjang interval
kelasnya
Menuliskan frekuensi kelas secara melidi sesuai banyaknya
data
Catatan tentang penyusunan distribusi frekuensi
1. Perlu dijaga jangan sampai ada data yang tidak dimasukkan
ke dalam kelas atau ada data yang masuk ke dalam dua
kelas yang berbeda.
2. Titik tengah kelas diusahakan bilangan bulat tidak pecahan.
3. Nilai frekuensi diusahakan tidak ada yang nol (0).
4. Dalam menentukan banyaknya kelas (k), diusahakan :
a. tidak terlalu sedikit, sehingga pola kelompok kabur;
b. banyaknya kelas berkisar 5 sampai 15 buah;
c. jika jangkauan terlalu besar, banyaknya kelas antara 10
sampai 20.
Contoh soal
Dari hasil pengukuran diameter pipa-pipa yang dibuat oleh sebuah mesin
(dalam mm terdekat), diperoleh data sebagai berikut
78
72
74
79
74
71
75
74
72
68
72
73
72
74
75
74
73
74
65
72
66
75
80
69
82
73
74
72
79
71
70
75
71
70
70
70
75
76
77
67
Buatlah distribusi frekuensi dari data tersebut !
Penyelesaian:
a.Urutan data :
65
66
67
68
69
70
70
70
70
71
71
71
72
72
72
72
72
72
73
73
73
74
74
74
74
74
74
74
75
75
75
75
75
76
77
78
79
79
80
82
b. Jangkauan (R) = 82 – 65 = 17
c. Banyaknya kelas (k) adalah
k = 1+ 3,3 log 40
= 1+ 5,3 = 6,3 6
d. Panjang interval kelas (i) adalah
i = 17 / 6 = 2,83 3
e. Batas kelas pertama adalah 65 (data terkecil)
f. Tabelnya :
Diameter
Turus
Frekuensi
65 – 67
68 – 70
71 – 73
74 – 76
77 – 79
80 – 82
III
IIII I
IIII IIII II
IIII IIII III
IIII
II
3
6
12
13
4
2
Jumlah
40
Histogram dan Poligon Frekuensi
Adalah dua grafik yang sering digunakan untuk menggambarkan distribusi frekuensi. Histogram merupakan grafik batang
dari distribusi frekuensi dan poligon frekuensi merupakan grafik
garisnya.
Histogram = batang-batangnya saling melekat atau berimpitan
digunakan sistem salib sumbu; sumbu x menyatakan interval
kelas dan sumbu y menyatakan frekuensi.
Poligon Frekuensi = dibuat dengan cara menarik garis dari satu
titik tengah batang histogram ke titik tengah batang histogram lain
contoh
Interval Kelas
140 –
145 –
150 –
155 –
160 –
165 –
170 –
144
149
154
159
164
169
174
Frekuensi
(banyak murid)
Tepi Interval
Kelas
Titik tengah
2
4
10
14
12
5
3
139,5 – 144,5
144,5 – 149,5
149,5 – 154,5
154,5 – 159,5
159,5 – 164,5
164,5 – 169,5
169,5 – 174,5
142
147
152
157
162
167
172
f = 50
Frekuensi
a. Histogram
15
10
5
0
144,5
149,5
154,5
159,5
164,5
169,5
174,5
139,5
144,5
149,5
154,5
159,5
164,5
169,5
Tinggi Badan
b. Poligon frekuensi
Frekuensi
15
10
5
0
142
147
152
157
162
Tinggi Badan
167
172
Teknik Grafis (Graphical
Techniques)
Peringkasan data secara visual atau
grafis yang menggunakan gambargambar berdasarkan tabel data yang
telah ada sebelumnya
Teknik Grafis :
- Piktogram
- Pie Chart
- Bar Chart
- Histogram Frekuensi
- Ogive
- Stem and Leaf Plot
- Box Plot
Piktogram
Pie Chart (Diagram Pia)
Data digambarkan
dengan suatu
lingkaran yang
sektor-sektornya
menggambarkan
proporsi variabel
yang berbeda
Histogram & Poligon
Frekuensi
Data diringkas dalam
bentuk grafik yang
mencerminkan
distribusi frekuensi.
Diperlukan sumbu X
untuk menyatakan
interval kelas dan
sumbu Y untuk
menyatakan frekuensi
kelas
Ogive (Poligon Frekuensi
Kumulatif)
Data diringkas
dalam bentuk grafik
yang merupakan
grafik dari distribusi
frekuensi kumulatif
lebih dari atau
kurang dari.
Stem and Leaf Plot
(Diagram Batang dan Daun)
Diperkenalkan oleh
John Tuckey (1977)
Data dirangkum
dalam bentuk
batang dan daun
(stem and leaf).
Jika ukuran data
besar maka stem
dapat dibuat
menjadi dua baris
Box Plot (Diagram Kotak – Box and
Whisker plot)
Peringkasan data
menggunakan
diagram kotak untuk
menggambarkan
apakah data
mempunyai outlier
(data ekstrim) atau
tidak
Untuk membuat Box Plot, ada beberapa
hal yang harus diketahui :
- Nilai minimum
- Nilai maksimum
- Median (Q2 = kuartil ke-2)
- Lower Quartile (Q1 = kuartil ke-1)
- Upper Quartile (Q3 = kuartil ke-3)
- IQR (Inter Quartile Range ) = Q3-Q1
- LIF (Lower Inner Fence) = Q1 – 1,5 IQR
- UIF (Upper Inner Fence) = Q3 + 1,5 IQR
- LOF (Lower Outer Fence) = Q1 – 3 IQR
- UOF (Upper Outer Fence) = Q3 + 3 IQR
Contoh
Misalkan dimiliki data berikut :
5,3 4,0 12,5 3,0 3,9 6,4 5,2 2,6 15,8, 6,2 4,0
7,1 3,4 4,4 3,5 3,4 3,2 5,6 3,2 3,4 8,6 3,1
n = 22, nilai minimum = 2,6, nilai maksimum = 15,8
Data terurut :
2,6 3,0 3,1 3,2 3,2 3,4 3,4 3,5 3,7 3,9 4,0
4,0 4,4 5,2 5,3 5,6 6,2 6,4 7,1 8,6 12,5 15,8
Lokasi Median : (n+1)/2 = 23/2 = 11,5
Median (4,0 + 4,0)/2 = 4,0
Mean = 5,4
Lokasi Q1 :
(lokasi median dibulatkan ke bawah + 1)/2
yaitu lokasi ke 6 dari nilai minimum
Q1 = 3,4
Lokasi Q3 :
(lokasi median dibulatkan ke bawah + 1)/2
yaitu lokasi ke 6 dari nilai maksimum
Q3 = 6,2
IQR = Q3-Q1 = 6,2 – 3,4 = 2,8
LIF = Q1 - 1,5 IQR = 3,4 – 1,5 (2,8) = - 0,8
UIF = Q3 + 1,5 IQR = 6,2 + 1,5 (2,8) = 10,4
LOF = Q1 - 3 IQR = 3,4 – 3 (2,8) = - 5
UOF = Q3 + 3 IQR = 6,2 + 3 (2,8) = 14,6
Data yang terletak antara LIF dan UIF bukan
outlier
Data yang terletak di luar LIF dan UIF adalah
outlier yang dibedakan menjadi 2 yaitu mild
outlier dan extrem outlier
Boxplot - Contoh
Bila semua data
terletak terletak antara
LIF dan UIF maka data
tidak memiliki outlier
Data terletak antara IF
dan OF disebut mild
outlier (tanda bulat)
Data terletak di luar OF
disebut extreme outlier
(tanda bintang)
PUSAT
Feri Harianto
Pengertian
Untuk keperluan penganalisisan data lebih lanjut, di
samping pembuatan tabel dan grafik diperlukan juga ukuranukuran yang dapat mewakili data tersebut, sehingga dapat
diucapkan secara singkat dan dapat digunakan untuk
membandingkan keadaan berbagai kelompok data.
Nilai tunggal yang dianggap dapat mewakili keseluruhan
nilai dalam data dianggap sebagai rata-rata (average),
karena nilai rata-rata itu dihitung berdasarkan keseluruhan
nilai yang terdapat dalam data bersangkutan. Nilai rata-rata
itulah yang disebut ukuran nilai pusat atau ukuran tendensi
pusat.
Jenis-jenis Ukuran Nilai Pusat
1.
Rata-rata Hitung (Mean); adalah nilai rata-rata dari
data-data yang ada.
Mean dari populasi diberi simbol (baca miu).
Mean dari sampel diberi simbolX (baca eks bar)
rumus : Rata-rata hitung =
a.
Jumlah semua data
Jumlah data
Mean untuk data tunggal
Keterangan :
X = mean
X = wakil data
n = jumlah data
X
X
n
X1 X 2 ... X n
n
Latihan : hitunglah rata-rata hitung dari nilai-nilai 7, 6, 3, 8, 9, 4
f1 X1 f 2 X 2 ... f n X n
fX
Keterangan :
X
X = mean
f1 f 2 ... f n
f
X = wakil data
f = frekuensi
Latihan : hitunglah rata-rata hitung dari nilai-nilai 3, 4, 3, 2, 5, 1, 4, 5,
1, 2, 6, 4, 3, 6, 1
fm f1m1 f 2 m2 ... f k mk
X
f
f1 f 2 ... f k
Keterangan :
X = mean
m = nilai rata-rata hitung
f = frekuensi
Latihan :
Sebuah perusahaan memiliki 40 pekerja. Perusahaan memberikan
gaji, yaitu 5 orang dengan gaji Rp350.000,00/bulan, 10 orang dengan
gaji Rp250.000,00/bulan, dan 25 orang dengan gaji
Rp125.000,00/bulan. Berapa rata-rata rupiah yang dikeluarkan oleh
perusahaan itu per bulan untuk setiap pekerja ?
b.
Mean untuk data berkelompok
Keterangan :
X = mean
X = titik tengah interval
f = frekuensi pada interval kelas
fX
X
f
Latihan : tentukan rata-rata hitung dari tabel berikut
Berat badan (kg)
Banyaknya Mahasiswa (f)
60 – 62
63 – 65
66 – 68
69 – 71
72 – 74
10
25
32
15
18
2.
Median; adalah nilai tengah dari data-data yang ada
setelah diurutkan.
Median diberi simbol Me atau Md.
a.
Median untuk data tunggal
* jika jumlah data ganjil, mediannya adalah data yang berada
paling tengah
Me X n
2
* jika jumlah data genap, mediannya adalah hasil bagi jumlah
dua data yang berada di tengah
Me
X n X n2
2
2
2
Latihan : tentukan median dari data berikut :
•
4, 3, 6, 2, 7, 5, 8
•
11, 5, 4, 7, 14, 8, 9, 12
b.
Median untuk data berkelompok
1
rumus :
Me B 2
n ( f 2 )o
f Me
C
Keterangan :
Me = median
B = tepi bawah kelas median
n = jumlah frekuensi
( f2 )o = jumlah frekuensi kelas-kelas sebelum kelas median
C = panjang interval kelas
f Me = frekuensi kelas median
Dalam mencari median data berkelompok (distribusi frekuensi)
yang perlu dicari terlebih dahulu adalah kelas tempat median
berada (kelas median). Kelas median dapat dicari dengan :
( f 2 )o ½ n
Latihan :
Tentukan median dari distribusi frekuensi berikut
Diameter pipa (mm) Frekuensi (f)
65 – 67
68 – 70
71 – 73
74 – 76
77 – 79
80 – 82
2
5
13
14
4
2
Penyelesaian :
( f 2 )o
Jumlah frekuensi (n) = 40 dan ½ n = 20
Kelas median adalah
½ n ; f1 f 2 f3 20
Jadi, kelas median adalah kelas ke-3
B = 70,5
( f 2 )o = 7
C =3
f Me = 13
Me 70,5
20 7
3 = 73,5
13
3.
Modus; adalah nilai yang paling sering muncul dalam
data.
Modus diberi simbol Mo.
Modus untuk data tunggal
* modus dari data tunggal adalah data yang frekuensinya
terbanyak.
Latihan : tentukan modus dari data berikut :
• 1, 3, 6, 6, 7, 8, 9
• 1, 4, 7, 8, 9, 12
• 1, 2, 4, 4, 6, 8, 8, 12, 14
b. Modus untuk data berkelompok
* modus dari data berkelompok hanya dapat diperkirakan.
Nilai yang paling sering muncul akan berada di kelas yang
memiliki frekuensi terbesar, disebut sebagai kelas modus.
a.
Mo L
Keterangan :
Mo
= modus
L
= tepi bawah kelas
= selisih frekuensi kelas modus dengan
d1
frekuensi kelas sebelumnya
d2
= selisih frekuensi kelas modus dengan
frekuensi kelas sesudahnya
C
= panjang interval kelas
d1 d 2
d2
C
Latihan : tentukan modus dari distribusi frekuensi pada tabel di atas
4.
Kuartil (Q); adalah nilai-nilai yang membagi
seperangkat data yang telah terurut menjadi empat
bagian yang sama.
Q1 = kuartil bawah atau pertama
Q2 = kuartil tengah atau kedua = median
Q3 = kuartil atas atau ketiga
a.
i (n 1)
Kuartil untuk data tunggal
Qi
nilai ke
i = 1, 2, 3
4
Latihan : tentukan kuartil dari data berikut :
•
3, 6, 10, 4, 8, 9, 14
•
4, 9, 6, 12, 10, 5, 14, 2
b.
Kuartil untuk data berkelompok
in
Qi Bi 4
( fi ) o
fQi
C
Keterangan :
Bi = tepi bawah kelas kuartil
n
= jumlah semua frekuensi
I
= 1, 2, 3
( fi )o = jumlah frekuensi semua kelas sebelum kelas kuartil
C = panjang interval kelas
fQi = frekuensi kelas kuartil
Measures of Variation
Variation
Variance
Range
Population
Variance
Sample
Variance
Interquartile Range
Standard Deviation
Population
Standard
Deviation
Sample
Standard
Deviation
Coefficient
of Variation
The Range
• Measure of Variation
• Difference Between Largest & Smallest
Observations:
Range = x Largest x Smallest
• Ignores How Data Are Distributed:
Range = 12 - 7 = 5
Range = 12 - 7 = 5
7
8
9
10
11 12
7
8
9
10
11
12
Interquartile Range
•
Measure of Variation
• Also Known as Midspread:
Spread in the Middle 50%
• Difference Between Third & First
Quartiles: Interquartile Range =
• Not Affected by Extreme Values
Q 3 Q1
Q 3 Q 1 = 17.5 - 12.5 = 5
Data in Ordered Array: 11 12 13 16 16 17
17 18 21
Variance
•Important Measure of Variation
•Shows Variation About the Mean:
2
X
2
i
•For the Population:
N
•For the Sample:
For the Population: use N in the
denominator.
Xi X
s
n 1
2
2
For the Sample : use n - 1 in the
denominator.
Standard Deviation
•Most Important Measure of Variation
•Shows Variation About the Mean:
2
X
i
•For the Population:
N
•For the Sample:
For the Population: use N in the
denominator.
s
X i X
n 1
2
For the Sample : use n - 1 in the
denominator.
Sample Standard Deviation
s
Data:
24
Xi X
n 1
Xi :
10
2
12
n=8
s=
=
For the Sample : use n - 1 in the
denominator.
14
15
17
18
18
Mean =16
(10 16)2 (12 16)2 (14 16)2 (15 16)2 (17 16)2 (18 16)2 (24 16)2
8 1
4.2426
Comparing Standard Deviations
Data :
X i : 10
N= 8
12
14
15
17
18
Xi X
n 1
2
X i
N
18
24
Mean =16
2
s =
=
4.2426
=
3.9686
Value for the Standard Deviation is larger for data considered as a
Sample.
Comparing Standard Deviations
Data A
Mean = 15.5
11
12
13
14 15 16 17 18 19 20 21
s = 3.338
Data B
Mean = 15.5
11 12 13 14 15 16 17 18
19
20
21
s = .9258
Data C
Mean = 15.5
11
12
13 14 15 16 17 18 19 20
21
s = 4.57
Coefficient of Variation
•Measure of Relative Variation
•Always a %
•Shows Variation Relative to Mean
•Used to Compare 2 or More Groups
•Formula ( for Sample):
S
CV
X
100%
Comparing Coefficient of Variation
Stock A: Average Price last year = $50
Standard Deviation = $5
Stock B: Average Price last year = $100
Standard Deviation = $5
S
CV 100%
X
Coefficient of
Variation:
Stock A: CV = 10%
Stock B: CV = 5%
Shape
•
•
Describes How Data Are Distributed
Measures of Shape:
Symmetric or skewed
Left-Skewed
Mean Median Mod
e
Symmetric
Mean = Median = Mode
Right-Skewed
Mode Median Mean
Box-and-Whisker Plot
Graphical Display of Data Using
5-Number Summary
X smallest Q1 Median Q3
4
6
8
10
Xlargest
12
Distribution Shape &
Box-and-Whisker Plots
Left-Skewed
Q1 Median Q3
Symmetric
Q1
Median Q3
Right-Skewed
Q1 Median Q3
Kesimetrisan
Skewness coefficient (koefisien kemiringan)
[ 1/(n-1 ] (xi – xrata)3
b1 = ---------------------------s3
Kesimetrisan
Kurtosis coefficient (koefisien keruncingan)
[ 1/(n-1 ] (xi – xrata)4
b2 = ----------------------------
s4
DISTRIBUSI
FREKUENSI
Pengertian
Data yang telah diperoleh dari suatu penelitian yang
masih berupa data acak atau data mentah dapat dibuat
menjadi data yang berkelompok, yaitu data yang telah
disusun ke dalam kelas-kelas tertentu. Daftar yang memuat
data berkelompok disebut distribusi frekuensi atau tabel
frekuensi.
Jadi, distribusi frekuensi adalah susunan data menurut
kelas-kelas interval tertentu atau menurut kategori tertentu
dalam sebuah daftar.
Diperoleh keterangan atau gambaran sederhana dan
sistematis dari data yang diperoleh.
Bagian-bagian Distribusi Frekuensi
Kelas-kelas; adalah kelompok nilai data atau variabel.
2. Batas kelas; adalah nilai-nilai yang membatasi kelas yang
satu dengan kelas yang lain.
1.
a.
b.
3.
Batas kelas bawah, terdapat di deretan sebelah kiri setiap kelas,
Batas kelas atas, terdapat di deretan sebelah kanan setiap kelas.
Tepi kelas (batas nyata kelas); adalah batas kelas yang
tidak memiliki lubang untuk angka tertentu antara kelas
yang satu dengan yang lain
a.
b.
Tepi bawah kelas atau batas kelas bawah sebenarnya = batas
bawah kelas – 0,5
Tepi atas kelas atau batas kelas atas sebenarnya = batas atas
kelas + 0,5
Bagian-bagian Distribusi Frekuensi
Titik tengah kelas; adalah angka atau nilai data yang
tepat terletak di tengah suatu kelas, merupakan nilai
yang mewakili kelasnya.
Titik tengah
kelas = ½ (batas atas + batas bawah) kelas
5. Interval kelas; adalah selang yang memisahkan kelas
yang satu dengan yang lain.
6. Panjang interval kelas atau luas kelas; adalah jarak
antara tepi atas kelas dan tepi bawah kelas.
7. Frekuensi kelas; adalah banyaknya data yang termasuk
ke dalam kelas tertentu
4.
contoh
Modal (jutaan Rp) Frekuensi (f)
50 – 59
60 – 69
70 – 79
80 – 89
90 – 99
16
32
20
17
15
Jumlah
100
Sumber : Data fiktif
• Banyaknya kelas adalah 5
• Batas bawah kelas-kelas adalah 50, 60, 70, 80, 90
• Batas atas kelas-kelas adalah 59, 69, 79, 89, 99
• Tepi bawah kelas-kelas adalah 49,5; 59,5; 69,5; 79,5; 89,5
• Tepi atas kelas-kelas adalah 59,5; 69,5; 79,5; 89,5; 99,5
• Titik tengah kelas-kelas adalah 54,5; 64,5; 74,5; 84,5;
94,5
• Interval kelas-kelas adalah 50-59; 60-69; ,,, ;90-99
• Panjang interval kelas-kelas masing-masing 10
• Frekuensi kelas-kelas adalah 16, 32, 20, 17, 15
Penyusunan Distribusi Frekuensi
Mengurutkan data dari yang terkecil ke yang terbesar.
2. Menentukan jangkauan (range) dari data
Jangkauan = data terbesar – data terkecil
3. Menentukan banyaknya kelas (k) dengan rumus sturgess
1.
k = 1 + 3,3 log n
Keterangan :
k = banyaknya kelas
n = banyaknya data
k bulat
Penyusunan Distribusi Frekuensi
4.
5.
6.
Menentukan panjang interval kelas (i)
jangkauan (R)
i=
banyaknya kelas (k)
Menentukan batas bawah kelas pertama; biasanya dipilih
dari data terkecil atau data terkecil yang berasal dari
pelebaran jangkauan (data yang lebih kecil dari data
terkecil) dan selisihnya harus kurang dari panjang interval
kelasnya
Menuliskan frekuensi kelas secara melidi sesuai banyaknya
data
Catatan tentang penyusunan distribusi frekuensi
1. Perlu dijaga jangan sampai ada data yang tidak dimasukkan
ke dalam kelas atau ada data yang masuk ke dalam dua
kelas yang berbeda.
2. Titik tengah kelas diusahakan bilangan bulat tidak pecahan.
3. Nilai frekuensi diusahakan tidak ada yang nol (0).
4. Dalam menentukan banyaknya kelas (k), diusahakan :
a. tidak terlalu sedikit, sehingga pola kelompok kabur;
b. banyaknya kelas berkisar 5 sampai 15 buah;
c. jika jangkauan terlalu besar, banyaknya kelas antara 10
sampai 20.
Contoh soal
Dari hasil pengukuran diameter pipa-pipa yang dibuat oleh sebuah mesin
(dalam mm terdekat), diperoleh data sebagai berikut
78
72
74
79
74
71
75
74
72
68
72
73
72
74
75
74
73
74
65
72
66
75
80
69
82
73
74
72
79
71
70
75
71
70
70
70
75
76
77
67
Buatlah distribusi frekuensi dari data tersebut !
Penyelesaian:
a.Urutan data :
65
66
67
68
69
70
70
70
70
71
71
71
72
72
72
72
72
72
73
73
73
74
74
74
74
74
74
74
75
75
75
75
75
76
77
78
79
79
80
82
b. Jangkauan (R) = 82 – 65 = 17
c. Banyaknya kelas (k) adalah
k = 1+ 3,3 log 40
= 1+ 5,3 = 6,3 6
d. Panjang interval kelas (i) adalah
i = 17 / 6 = 2,83 3
e. Batas kelas pertama adalah 65 (data terkecil)
f. Tabelnya :
Diameter
Turus
Frekuensi
65 – 67
68 – 70
71 – 73
74 – 76
77 – 79
80 – 82
III
IIII I
IIII IIII II
IIII IIII III
IIII
II
3
6
12
13
4
2
Jumlah
40
Histogram dan Poligon Frekuensi
Adalah dua grafik yang sering digunakan untuk menggambarkan distribusi frekuensi. Histogram merupakan grafik batang
dari distribusi frekuensi dan poligon frekuensi merupakan grafik
garisnya.
Histogram = batang-batangnya saling melekat atau berimpitan
digunakan sistem salib sumbu; sumbu x menyatakan interval
kelas dan sumbu y menyatakan frekuensi.
Poligon Frekuensi = dibuat dengan cara menarik garis dari satu
titik tengah batang histogram ke titik tengah batang histogram lain
contoh
Interval Kelas
140 –
145 –
150 –
155 –
160 –
165 –
170 –
144
149
154
159
164
169
174
Frekuensi
(banyak murid)
Tepi Interval
Kelas
Titik tengah
2
4
10
14
12
5
3
139,5 – 144,5
144,5 – 149,5
149,5 – 154,5
154,5 – 159,5
159,5 – 164,5
164,5 – 169,5
169,5 – 174,5
142
147
152
157
162
167
172
f = 50
Frekuensi
a. Histogram
15
10
5
0
144,5
149,5
154,5
159,5
164,5
169,5
174,5
139,5
144,5
149,5
154,5
159,5
164,5
169,5
Tinggi Badan
b. Poligon frekuensi
Frekuensi
15
10
5
0
142
147
152
157
162
Tinggi Badan
167
172
Teknik Grafis (Graphical
Techniques)
Peringkasan data secara visual atau
grafis yang menggunakan gambargambar berdasarkan tabel data yang
telah ada sebelumnya
Teknik Grafis :
- Piktogram
- Pie Chart
- Bar Chart
- Histogram Frekuensi
- Ogive
- Stem and Leaf Plot
- Box Plot
Piktogram
Pie Chart (Diagram Pia)
Data digambarkan
dengan suatu
lingkaran yang
sektor-sektornya
menggambarkan
proporsi variabel
yang berbeda
Histogram & Poligon
Frekuensi
Data diringkas dalam
bentuk grafik yang
mencerminkan
distribusi frekuensi.
Diperlukan sumbu X
untuk menyatakan
interval kelas dan
sumbu Y untuk
menyatakan frekuensi
kelas
Ogive (Poligon Frekuensi
Kumulatif)
Data diringkas
dalam bentuk grafik
yang merupakan
grafik dari distribusi
frekuensi kumulatif
lebih dari atau
kurang dari.
Stem and Leaf Plot
(Diagram Batang dan Daun)
Diperkenalkan oleh
John Tuckey (1977)
Data dirangkum
dalam bentuk
batang dan daun
(stem and leaf).
Jika ukuran data
besar maka stem
dapat dibuat
menjadi dua baris
Box Plot (Diagram Kotak – Box and
Whisker plot)
Peringkasan data
menggunakan
diagram kotak untuk
menggambarkan
apakah data
mempunyai outlier
(data ekstrim) atau
tidak
Untuk membuat Box Plot, ada beberapa
hal yang harus diketahui :
- Nilai minimum
- Nilai maksimum
- Median (Q2 = kuartil ke-2)
- Lower Quartile (Q1 = kuartil ke-1)
- Upper Quartile (Q3 = kuartil ke-3)
- IQR (Inter Quartile Range ) = Q3-Q1
- LIF (Lower Inner Fence) = Q1 – 1,5 IQR
- UIF (Upper Inner Fence) = Q3 + 1,5 IQR
- LOF (Lower Outer Fence) = Q1 – 3 IQR
- UOF (Upper Outer Fence) = Q3 + 3 IQR
Contoh
Misalkan dimiliki data berikut :
5,3 4,0 12,5 3,0 3,9 6,4 5,2 2,6 15,8, 6,2 4,0
7,1 3,4 4,4 3,5 3,4 3,2 5,6 3,2 3,4 8,6 3,1
n = 22, nilai minimum = 2,6, nilai maksimum = 15,8
Data terurut :
2,6 3,0 3,1 3,2 3,2 3,4 3,4 3,5 3,7 3,9 4,0
4,0 4,4 5,2 5,3 5,6 6,2 6,4 7,1 8,6 12,5 15,8
Lokasi Median : (n+1)/2 = 23/2 = 11,5
Median (4,0 + 4,0)/2 = 4,0
Mean = 5,4
Lokasi Q1 :
(lokasi median dibulatkan ke bawah + 1)/2
yaitu lokasi ke 6 dari nilai minimum
Q1 = 3,4
Lokasi Q3 :
(lokasi median dibulatkan ke bawah + 1)/2
yaitu lokasi ke 6 dari nilai maksimum
Q3 = 6,2
IQR = Q3-Q1 = 6,2 – 3,4 = 2,8
LIF = Q1 - 1,5 IQR = 3,4 – 1,5 (2,8) = - 0,8
UIF = Q3 + 1,5 IQR = 6,2 + 1,5 (2,8) = 10,4
LOF = Q1 - 3 IQR = 3,4 – 3 (2,8) = - 5
UOF = Q3 + 3 IQR = 6,2 + 3 (2,8) = 14,6
Data yang terletak antara LIF dan UIF bukan
outlier
Data yang terletak di luar LIF dan UIF adalah
outlier yang dibedakan menjadi 2 yaitu mild
outlier dan extrem outlier
Boxplot - Contoh
Bila semua data
terletak terletak antara
LIF dan UIF maka data
tidak memiliki outlier
Data terletak antara IF
dan OF disebut mild
outlier (tanda bulat)
Data terletak di luar OF
disebut extreme outlier
(tanda bintang)