Materi 1 Statistika
STATISTIKA
• PENGERTIAN
Statistika
Ilmu tentang pengumpulan data
Klasifikasi Data
Penyajian Data
Pengolahan Data
Penarikan Kesimpulan
Pengambilan keputusan
Populasi: Himpunan
keseluruhan dari objek
pengamatan
Sample: Bagian dari populasi
Data: Informasi atau fakta yang
tertuang dalam angka atau
bukan angka
Deskriptif: Metode untuk
mendeskripsikan,
menggambarkan, menjabarkan,
atau menguraikan data
Inferensia: Penarikan
kesimpulan dari sample untuk
menjelaskan isi dari populasi
• JENIS – JENIS DATA
Data
Data
Data
Data
mentah
primer
sekunder
Kuantitatif
Data Diskrit
Data Kontinyu
Data Diskrit:
Civitas UMMI
o Data Nominal
o Daata Ordinal
o Data Dikotomi
Mahas
iswa
o Data Kualitatif
o Parameter: Kualitas
Pengukuran sample
Pega
wai
• CONTOH – CONTOH
Populasi dan Sample
“Civitas akademik Universitas
Muhammadiyah Sukabumi terdiri dari
dosen, mahasiswa dan staff pekerja
lainnya yang berjumlah 1200 orang”
sample
Populasi
Deskriptif
“Nilai UAS mahasiswa Teknik
Informatika semester 4 untuk mata
kuliah Statistika adalah dengan nilai
rata – rata 65”
Dose
n
Data Nominal
Jumlah lulusan mahasiswa Universitas
Muhammadiyah Sukabumi tahun 2008
l
Program
Studi
Jumlah
Teknik
Informatik
25 orang
Kimia
5 orang
SDPK
4 orang
Data Ordinal
Kategori hasil nilai akhir Mata Kuliah
Statistika
Kategori
Nilai
Jumlah
Istimewa
10 orang
Baik
12 orang
Cukup
20 orang
Kurang
7 orang
Kurang sekali
3 orang
Data Dikotomi
Murni: Hidup – mati, surga –
neraka, laki – laki – wanita, dll.
Buatan: lulus – gagal, hitam –
putih, dll.
Data interval: data yang
memiliki rentang atau jarak
yang sama
Data rasio: Data yang
dinyatakan dalam perbandingan
TENDENSI SENTRAL
• Nilai rata – rata (Mean):
Rumus:
Biasa
Dengan Frekuensi
• Nilai Tengah (Median):
Rumus:
Biasa
Dengan Frekuensi
Keterangan:
(jumlah data
ke 1 sampai data ke-n )
(jumlah perkalian frekuensi dengan
data)
n = banyaknya data
= jumlah frekuensi
Keterangan:
Me = median
Lo = Batas bawah kelas
C = lebar kelas
n = banyaknya data
F = jumlah frekuensi sebelum
kelas
f = jumlah frekuensi kelas
• Modus = Nilai yang
paling sering muncul
Biasa
Mo = nilai yang paling
sering muncul
Data berfrekuensi
Keterangan:
Mo = modus
Lo = Batas bawah kelas
modus
C = lebar kelas
b1 = selisih frekuensi
sebelum kelas modus
b2 = selisih frekuensi tepat
satu data setelahnya
•
Contoh Kasus:
1. Data hasil ujian akhir semester 4
untuk mata kuliah statistika adalah
sebagai berikut: 40, 65, 90, 65, 70, 55,
85, 65, 70, 35
Tentukanlah:
a. Rata – rata nilai UAS
b. Modus nilai UAS
c. Median Nilai UAS
2. Data nilai UAS mahasiswa semester 4,
untuk mata kuliah STATISTIKA adalah
Nilai
Jml Mhs
sebagai berikut:
45
6
50
8
65
14
70
16
75
9
80
4
Tentukanlah nilai :
a. Rata2
b. Modus
c. Median
Contoh soal data distribusi
berfrekuensi
• Misalkan modal (dalam jutaan
rupiah) dari 40 perusahaan pada
tabel distribusi
frekuensi
berikut:
Modal
Frekuensi
112 - 120
4
121 - 129
5
130 - 138
8
139 - 147
12
148 -156
5
157 -165
4
166 - 174
2
= 40
Tentukan:
a.Mean/ Rata – rata
b.Median
c.Modus
Kata Kunci
Data Distribusi Frekuensi
• Kelas = selang/ interval
• Frekuensi = banyaknya
nilai yang termasuk ke
dalam kelas
• Limit kelas/ tepi kelas:
Nilai terkecil dan
terbesar pada setiap
kelas, terbagi menjadi
2, yaitu limit bawah
kelas dan limit atas
kelas
• Batas bawah kelas
dan batas atas kelas
• Lebar kelas= selisih
batas atas kelas dan
batas bawah kelas
• Nilai tengah kelas =
(batas bawah kelas
+ batas atas kelas)/
2
Dari contoh di atas, maka
didapat:
• Kelas = 112 – 120
• Limit kelas/ tepi kelas:
pada kelas 112 – 120,
Nilai 112 disebut limit
bawah kelas dan nilai
120 disebut limit atas
kelas
• Pada kelas 112 – 120,
nilai 111,5 disebut
batas bawah kelas dan
nilai 120,5 disebut
batas atas kelas
• Lebar kelas= 120,5
– 111,5 = 9 nilai
lebar kelas pada
masing – masing
kelas adalah sama
• Nilai tengah kelas
= (111,5 +
120,5)/2 = 116
Penyelesaian Soal
• Mean/ Rata - rata
Modal
Nilai
Tengah
(X)
Frekuensi
(f)
fX
112 - 120
116
4
464
121 - 129
125
5
625
130 - 138
134
8
1.072
139 - 147
143
12
1.716
148 -156
152
5
760
157 -165
161
4
644
166 - 174
170
2
340
= 40
= 5.621
X
5.621
140,525
40
• MEDIAN
n
2F
Med L0 c
f
Untuk mencari median, tentukan dulu pada kelas
interval mana mediannya terletak.
Karena frekuensinya bernilai genap, maka median
terletak pada nilai ke
n 1 40 1
20,5
2
2
Data ke 20,5 terletak pada kelas interval 139 – 147.
Maka diperoleh:
Lo = 138,5
f = 12
F = 4 + 5 + 8 = 17
c = 147,5 – 138,5 = 9
• Jadi mediannya adalah
40
17
2
Med 138, 5 9
12
20 17
Med 138,5 9
140, 75
12
• MODUS
Untuk mencari modus, tentukan dulu kelas interval
yang mengandung modus, yaitu kelas interval yang
memiliki frekuensi terbesar. Maka dapat diketahui
bahwa modus terletak pada kelas interval 139 – 147
• Dengan demikian:
Lo = 138, 5
b2 = 12-5=7
c=9
b1 = 12-8=4
Jadi modusnya adalah:
b1
4
Mod L0 c
138,5 9
b1 b2
47
= 138,5 + 3,27 = 141,77
KUARTIL, DESIL, DAN
PERSENTIL
• KUARTIL (Perluasan Median)
Kuartil terbagi menjadi 3, yaitu:
Kuartil pertama/ Kuartil bawah (Q1)
Kuartil kedua/ Kuartil tengah (Q2)
Kuartil ketiga/ Kuartil atas (Q3)
Rumus Untuk data tidak berkelompok:
i (n 1)
Qi Nilaiyangke
i 1, 2,3
4
• Untuk data berkelompok
i, n
4 F
Qi L0 c
, i 1, 2,3
f
Dimana:
Lo= Batas bawah kelas kuartil
c = Lebar kelas
F = Jumlah frekuensi semua kelas
sebelum kelas kuartil Qi
f = Frekuensi kelas kuartil Qi
• DESIL
Jika sekelompok data dibagi menjadi 10
bagian yang sama banyak, maka akan
terdapat 9 pembagi, masing – masing
disebut nilai Desil (D), yaitu D1, D2, …, D9
• Untuk data tidak berkelompok
i (n 1)
Di nilaiyangke
, i 1, 2,3,...,9
10
• Untuk data berkelompok
i.n
10 F
Di L0 c
, i 1, 2,3,...,9
f
Dimana: Lo = Batas bawah kelas desil Di
c = Lebar kelas
F = Jumlah frekuensi semua kelas sebelum kelas desil Di
f = Frekuensi kelas desil Di
• PERSENTIL
Jika sekelompok data dibagi menjadi 100
bagian sama banyak, maka akan terdapat
99 pembagi, yang masing – masing
disebut persentil (P), yaitu P1,P2,P3,
…,P99. Nilai persentil ke-I, yaitu Pi dihitung
dengan rumus berikut.
Untuk data tidak berkelompok:
i (n 1)
Pi nilaike
, i 1, 2,3,...,99
100
• Untuk data berkelompok
i.n
100 F
Pi L0 c
, i 1, 2,3,...,99
f
Dimana: Lo = Batas bawah kelas persentil Pi
c = Lebar kelas
F = Jumlah frekuensi semua kelas sebelum kelas persentil Pi
f = Frekuensi kelas persentil Pi
Contoh soal data tidak
berkelompok
• Tentukan kuartil Q1, Q2 dan Q3 dari data gaji bulanan 13
karyawan (dalam ribuan rupiah) berikut.
40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100.
• Jawab:
Urutan data: 30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85,
95, 100.
i (n 1)
Maka:
Qi nilaike
1(13 1)
4
, n 13
Q1=nilai kenilai
ke- 3 1
4
2
= antara nilai ke 3 dan ke 4
= nilai ke 3 + ½ (nilai ke 4 – nilai ke 3)
= 40 + ½ (45-40)
= 40 + 2,5= 42,5
• Tentukan desil D3 dan D7 dari data gaji bulanan 13
karyawan (dalam ribuan rupiah) berikut.
40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100.
• Jawab:
Urutan data: 30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85,
95, 100.
i (n 1)
Di nilaiyangke
10
Maka:
3(13 1)
D3= nilai yang ke10
= nilai ke 4–1
= nilai ke 45 + 1/5 (nilai ke 5 – nilai ke 4)
= 45 + 1/5 (50-45)
= 45 + 1= 46
Contoh soal data
berkelompok
• Misalkan modal (dalam jutaan
rupiah) dari 40 perusahaan pada
tabel distribusi
frekuensi
berikut:
Tentukan:
Modal
Frekuensi
112 - 120
4
121 - 129
5
130 - 138
8
139 - 147
12
148 -156
5
157 -165
4
166 - 174
2
= 40
a.Tentukan nilai kuartil
Q1, Q2 dan Q3
b. Tentukan desil D3 dan D8
c. Tentukan persentil P20
dan P 80
Penyelesaian Soal
• Mencari Q1, Q2, dan Q3
Jawab:
Tentukan dulu kelas interval Q1, Q2, dan Q3
Karena n=40,
Q1 terletak pada nilai ke
1(40 1)
10, 25
Nilai ke 10, 25 terletak pada
4 interval kelas 130 – 138
Q2 terletak pada nilai ke
2(40 interval
1)
Nilai ke 20, 5 terletak pada
kelas 139 – 147
20,5
4
Q3 terletak pada nilai ke
Nilai ke 30,75 terletak pada
3(40 1)interval kelas 148 – 156
4
30, 75
Setelah diketahui interval kelas dari tiap – tiap kuartil
yang dicari, maka nilai kuartil dapat dicari dengan
rumus.
i, n
4 F
Qi L0 c
f
Untuk Q1, terletak pada interval kelas 130 – 137,
maka:
Lo = 129,5
F = 4+5 = 9
f=8 c=
9
40
9
sehingga:
10 9
4
Q1 129,5 9
129,5 9
130, 625
8
8
• Mencari D3 dan D8
Jawab:
Tentukan kelas interval dimana desil berada
Karena n = 40, maka kelas interval D3 dan D8
3(40 1)
berada pada:
12,3
10
D3 terletak pada nilai ke
1)
Nilai ke 12,3 terletak8(40
pada
interval kelas 130 – 138
32,8
10
D8 terletak pada nilai ke
Nilai ke 32,8 terletak pada interval kelas 139 – 147
Maka nilai D3 dan D8 adalah:
i.n
10 F
Di L0 c
f
Untuk D3 terletak pada interval kelas 130 – 138,
maka:
Lo = 129,5 F = 4+5= 9f = 8
c=9
Sehingga:
3(40)
9
10
12 9
D3 129,5 9
129,5 9
132,875
8
8
PENGUKURAN DISPERSI,
KEMIRINGAN, DAN KERUNCINGAN
DATA
• DISPERSI DATA
Dispersi/ variasi/ keragaman data: ukuran penyebaran
suatu kelompok data terhadap pusat data.
• Ukuran Dispersi yang akan dipelajari:
Jangkauan (Range)
Simpangan rata – rata (mean deviation)
Variansi (variance)
Dispersi multak
Standar Deviasi (Standard Deviation)
Simpangan Kuartil (quartile deviation)
Koefisien variasi (coeficient of variation)
Dispersi relatif
RANGE/ JANGKAUAN DATA (r)
• Range: Selisih nilai maksimum dan nilai
minimum
Rumus: Range (r) = Nilai max – nilai min
• Range untuk kelompok data dalam bentuk
distribusi frekuensi diambil dari selisih
antara nilai tengah kelas maksimun – nilai
tengah kelas minimum
Simpangan Rata2/ Mean
Deviation (SR)
• Simpangan rata – rata: jumlah nilai mutlak
dari selisih semua nilai dengan nilai rata –
rata, dibagi banyaknya data.
• Rumus
• Untuk data tidak berkelompok
SR
X X
n
Dimana:
X = nilai data
X = rata – rata hitung
n = banyaknya data
• Untuk data berkelompok
SR
( f X X )
n
Dimana:
X = nilai data
X = rata – rata hitung
n = Σf = jumlah frekuensi
2
(s )
VARIANSI/ VARIANCE
• Variansi adalah rata – rata kuadrat selisih
atau kuadrat simpangan dari semua nilai
data terhadap rata – rata hitung.
2
s
2
= simbol untuk sample
= simbol untuk populasi
• Rumus untuk data tidak berkelompok
S
2
X X
2
n 1
• Untuk data berkelompok
S
2
f X X
n 1
2
STANDAR DEVIASI/ STANDARD
DEVIATION (S)
• Standar deviasi: akar pangkat dua dari
variansi
• Rumus:
X
X
2
Untuk data tidak berkelompok
S
2
f X X
2
n 1
Untuk data berkelompok
S
2
n 1
Contoh Soal
• Data tidak berkelompok
Diketahui sebuah data berikut:
20, 50, 30, 70, 80
Tentukanlah:
a. Range (r)
b. Simpangan Rata – rata (SR)
c. Variansi
d. Standar Deviasai
• Jawab:
a. Range (r) = nilai terbesar – nilai terkecil = 80
– 20 = 60
b. Simpangan
X X Rata – rata (SR):
SR
n
X
20 50 30 70 80
50
5
n = 20
5 50 50 50 30 50 70 50 80 50
SR
5
30 0 20 20 30 100
SR
20
5
5
2
(
s
• Variansi )
S
2
X X
2
n 1
2
2
2
2
2
(20
50)
(50
50)
(30
50)
(70
50)
(80
50)
S2
5 1
S2
900 0 400 400 900 2600
650
4
4
• Standar Deviasi (S)
S S
2
S 650 25, 495
Contoh Soal
• Data Berkelompok
Diketahui data pada tabel dibawah ini:
Modal
Frekuensi
112 - 120
4
121 - 129
5
130 - 138
8
139 - 147
12
148 -156
5
157 -165
4
166 - 174
2
40
Tentukan:
a.Range (r)
b.Simpangan rata – rata (SR)
c.Variansi
d.Standar Deviasi
JAWAB
• Range (r)= (nilai tengah tertinggi – nilai tengah
terendah)/2
• Simpangan
( f Xrata
X–)rata
SR
n
n = jml frekuensi
f X X
• Variansi
S
2
2
n 1
• Standar Deviasi S 2
f X X
n 1
2
• Untuk memudahkan mencari jawaban, maka
dibuat tabel sesuai dengan keperluan jawaban
Modal
f
Nilai
Tenga
h (X)
112 - 120
4
116
121 - 129
5
125
130 - 138
8
139 - 147
f X X
( X X )2
f ( X X )2
24,525
98,100
601,476
2405,90
2
15,525
77,625
241,026
1205,12
8
134
6,525
52,200
42,576
340,605
12
143
2,475
29,700
6,126
73,507
148 -156
5
152
11,475
57,375
131,676
658,378
157 -165
4
161
20,475
81,900
419,226
1676,90
2
166 - 174
2
170
29,475
58,950
868,776
1737,55
1
Jumlah
40
X X
455,8
50
8097,9
74
Maka dapat dijawab:
• Range (r) = 170 – 116 = 54
• Simpangan rata – rata
455,850
SR
11,396
40
• Variansi
8097,974 8097,974
S
207, 64
40 1
39
2
• Standar Deviasi
S 207, 64 14, 41
JANGKAUAN QUARTIL
DAN JANGKAUAN PERSENTIL 10-90
• Jangkauan kuartil disebut juga simpangan kuartil,
rentang semi antar kuartil, deviasi kuartil.
Jangkauan persentil 10-90 disebut juga rentang
persentil 10-90
• Jangkauan kuartil dan jangkauan persentil lebih
baik daripada jangkauan (range) yang memakai
selisih antara nilai maksimum dan nilai minimun
suatu kelompok data
• Rumus:
Ket:
1
Jangkauan
JK (Q3 QKuartil:
1)
2
JK: jangkauan kuartil
Q1: kuartil bawah/ pertama
Q3: kuartil atas/ ketiga
• Rumus Jangkauan Persentil
JP1090 P90 P10
• KOEFISIEN VARIASI/ DISPERSI
RELATIF
Untuk mengatasi dispersi data yang sifatnya mutlak, seperti
simpangan baku, variansi, standar deviasi, jangkauan kuartil,dll
Untuk membandingkan variasi antara nilai – nilai bersar
dengan nilai – nilai kecil.
Untuk mengatasi jangkauan data yang lebih dari 2 kelompok
data.
Rumus:
S
KV *100%
X
Ket:
KV: Koefisien variasi
S : Standar deviasi
X : Rata – rata hitung
KOEFISIEN VARIASI KUARTIL
• Alternatif lain untuk dispersi relatif yang bisa
digunakan jika suatu kelompok data tidak
diketahui nilai rata – rata hitungnya dan nilai
standar deviasinya.
• Rumus:
Q3 Q1
KVQ
Q3 Q1
atau
(Q3 Q1 ) / 2
KVQ
Med
NILAI BAKU
• Nilai baku atau skor baku adalah hasil
transformasi antara nilai rata – rata hitung
dengan standar deviasi
• Rumus:
X1 X
Zi
S
Nilai i = 1, 2, 3, …, n
Contoh Soal untuk Koefisien
Variasi dan Simpangan Baku
• Koefisien Variasi
Ada dua jenis bola lampu. Lampu jenis A secara rata –
rata mampu menyala selama 1500 jam dengan
simpangan baku (standar deviasi) S1 = 275 jam,
sedangkan lampu jenis B secara rata – rata dapat
menyala selama 1.750 jam dengan simpangan baku
S2 = 300 jam. Lampu mana yang kualitasnya paling
baik?
Jawab:
S1
275
KV1
*100%
*100% 18,3%
Lampu jenis A:
X1
1500
S
300
Lampu jenis B:
KV2 2 *100%
*100% 17,1%
X2
1750
• Nilai rata – rata ujian akhir semester mata kuliah
Statistika dengan 45 mahasiswa adalah 78 dan
simpangan baku/standar deviasi (S) = 10. Sedangkan
untuk mata kuliah Bahasa Inggris di Kelas
itu
mempunyai nilai rata – rata 84 dan simpangan bakunya
(S) = 18. Bila dikelas itu, Desi mendapat nilai UAS untuk
kalkulus adalah 86 dan untuk bahasa Inggris adalah 92,
bagaimana posisi/ prestasi Desi di kelas itu?
• Jawab
• Untuk mengetahui posisi/ prestasi Desi, maka harus
dicari nilai baku (Z) dari kedua mata kuliah tersebut.
X X
Z
S
dengan nilai X adalah nilai UAS yang diperoleh Desi
• Untuk Mata Kuliah Statistika
X = 86 S = 10
X 78
Maka:
86 78
Z
0,8
10
• Untuk Mata Kuliah Bahasa Inggris
X = 92 S = 18
Maka:
X 84
92 84
Karena nilai
baku
(Z)untuk
Z
0, 4 mata kuliah Statistika
lebih besar dari18
B. Inggris, maka posisi Desi lebih
baik pada mata kuliah Statistika dari pada B.
Inggris
KEMIRINGAN DATA
• Kemiringan: derajat/ ukuran dari
ketidaksimetrian
(asimetri)
suatu
distribusi data
• 3 pola kemiringan distribusi data, sbb:
– Distribusi simetri (kemiringan 0)
– Distribusi miring ke kiri (kemiringan
negatif)
– Distribusi miring ke kanan (kemiringan
positif)
• Beberapa metoda yang bisa dipakai
untuk menghitung kemiringan data,
yaitu:
– Rumus Pearson
– Rumus Momen
– Rumus Bowley
• Rumus Pearson (α)
3( X Med )
X Mod
atau
S
S
• Rumus tersebut dipakai untuk data
tidak
berkelompok
maupun
data
berkelompok.
– Bila α = 0 atau mendekati nol, maka
dikatakan distribusi data simetri.
– Bila α bertanda negatif, maka dikatakan
distribusi data miring ke kiri.
– Bila α bertanda positif, maka dikatakan
distribusi data miring ke kanan.
– Semakin besar α, maka distribusi data
akan semakin miring atau tidak simetri
RUMUS MOMEN ( 3 )
• Cara lain yang dipakai untuk
menghitung
derajat
kemiringan
adalah rumus momen derajat tiga,
yaitu
3
• Untuk data
tidak
berkelompok:
(
X
X
)
3
3
nS
3
(
f
(
X
X
)
)
3
3
• Untuk data berkelompok
f
S
• Khusus untuk data berkelompok dalam
bentuk tabel distribusi frekuensi , derajat
kemiringan α3 dapat dihitung dengan
cara transformasi sebabai berikut:
3
2
fU
fU
fU
c
3 3
3
n
S n
n
3
fU
2 n
3
– Jika α3 = 0, maka distribusi data simetri
– Jika α3 < 0, maka distribusi data miring ke kiri
– Jika α3 > 0, maka distribusi data miring ke
kanan
– Untuk mencari nilai Standar deviasi (S)
menggunakan variabel U:
2
n fU ( fU )
2
S c
n(n 1)
– Variabel U = 0, ±1, ±2, ±3, dst.
• RUMUS BOWLEY
Q3 Q1 Q2
Q3 Q1
KERUNCINGAN DISTRIBUSI
DATA
• Keruncingan distribusi data adalah
derajat atau ukuran tinggi rendahnya
puncak suatu distribusi data terhadap
distribusi normalnya.
• Keruncingan
data
disebut
juga
kurtosis, ada 3 jenis yaitu:
– Leptokurtis
– Mesokurtis
– Platikurtis
KERUNCINGAN DISTRIBUSI
DATA
• Keruncingan distribusi
dihitung dengan rumus:
• Data tidak berkelompok
4
(X X )
nS
4
4
• Data Berkelompok
( f (X X ) )
f *S
4
4
4
data
(α4)
• Khusus untuk transformasi
2
4
4
3
2
fU fU fU fU fU
c fU
4 4
4
6
3
S n
n n n n n
4
• Keterangan
– α4 = 3, distribusi data mesokurtis
– α4 > 3, distribusi data leptokurtis
– α4 < 3, distribusi data platikurtis
• Selain cara di atas, untuk mencari
keruncingan data, dapat dicari dengan
menggunakan rumus:
1
(Q3 Q1 )
JK
K
2
P90 P10
P90 P10
K= Koefisien Kurtorsis Persentil
• Keterangan
– K = 0,263 maka keruncingan distribusi data
mesokurtis
– K > 0,263 maka keruncingan distribusi data
leptokurtis
– K < 0,263 maka keruncingan distribusi data platikurtis
REGRESI DAN KORELASI
• Pada bab ini akan membahas dua bagian
yang saling berhubungan, khususnya dua
kejadian
yang
dapat
diukur
secara
matematis.
• Dalam hal dua kejadian yang saling
berhubungan, ada dua hal yang perlu diukur
dan dianalisis, yaitu:
– Bagaimana hubungan fungsional (persamaan matematis)
antara dua kejadian tersebut -> analisis regresi
– Bagaimana kekuatan (keeratan) hubungan dua kejadian
itu -> analisis korelasi
REGRESI LINEAR
SEDERHANA
• Garis regresi/ regresi: garis lurus/ garis
linear yang merupakan garis taksiran
atau perkiraan untuk mewakili pola
hubungan antara variabel X
dan
variabel Y.
• Cara untuk mencari persamaan garis
Dimana
regresi:
^
Y = variabel terikat
Y a bX
X = variabel bebas
a = intersep (pintasan) bilamana X=0
b = koefisien arah (slope) dari garis regresi
• Koefisien regresi a dan b dapat dicari
dengan rumus:
Y . X X . XY
a
n. X ( X )
2
2
b
2
n. XY X . Y
n. X ( X )
2
2
Rumus
lain
untuk
koefisien a dan b adalah:
b
menghitung
n. XY X . Y
n. X ( X )
2
X
Y
a
b
n
n
2
• Kita dapat membuat garis regresi
lebih dari satu dari suatu data. Lalu
garis regresi manakah yang paling
baik??
• Garis regresi yang paling baik adalah
garis regresi yang mempunyai total
kuadrat kesalahan/ total kuadrat
selisih/ total kuadrat eror yang paling
minimum.
^
2
2eror
• Total
kuadrat
dapat
dihitung
e
(
Y
Y
)
dengan:
n
n
Selanjutnya bila diambil
akarnya, maka diperoleh:
^
S^
yx
(Y Y )
Bentuk terakhir ini disebut
Kesalahan baku dari penafsiran
Atau disebut juga
Standard error of estimate
2
n
Rumus di atas dapat di jabarkan menjadi:
S^
yx
Y
2
a. Y b. XY
n
Nih….. Contoh Soal
Regresi……
Berat
Badan
2
3
4
5
6
7
8
Tinggi
Badan
4
5
2
3
9
6
7
Tentukanlah persamaan regresi dan kesalahan baku penafsirannya!
Jawab:
^
Persamaan regresi adalah:
Y a bX
Untuk melengkapi persamaan tersebut, maka perlu dicari nilai a dan b.
Cara mencari nilai a dan b adalah:
Y . X X . XY
a
n. X ( X )
2
2
2
b
n. XY X . Y
n. X 2 ( X ) 2
Untuk mempermudah mencari nilai –
nilai yang diperlukan, maka akan
digunakan tabel.
Berat
Badan
(X)
2
3
4
5
6
7
8
∑X =
35
Tinggi
Badan
(Y)
4
5
2
3
9
6
7
∑Y = 36
X
4
9
16
25
36
49
64
∑X =
203
XY
8
15
8
15
54
42
56
∑XY =
198
Masukan nilai – nilai yang telah diketahui,
ke dalam rumus untuk mencari nilai a dan b:
(∑X) = 1225
36* 203 35*198 7308 6930 378
a
1,93
7 * 203 1225
1421 1225 196
7 *198 35*36 1386 1260 126
b
0, 64
7 * 203 1225
1421 1225 196
Setelah diketahui, nilai a dan b, maka masukan nilai a dan b
ke dalam persamaan regresi. Hasilnya adalah:
^
Y 1,93 0, 64 X
b. Mencari nilai kesalahan baku dari penafsiran.
^
S^
yx
2
(
Y
Y
)
n
Ini persamaan
regresi / hubungan
dari variabel X dan
Y tadi…. Ngerti
kan????
Masukan nilai X ke dalam persamaan regresi
untuk mencari nilai Y regresi
Berat
Badan
(X)
2
3
4
5
6
7
8
Tinggi
Badan
(Y)
4
5
2
3
9
6
7
^
3.21
3,85
4,49
5,13
5,77
6,41
7,05
^
0,79
1,15
-2,49
-2,13
3,33
-0,41
-0,05
0,6241
1,322
5
6,2001
4,5369
11,088
9
0,1681
0,0025
Y
Y Y
^
(Y Y ) 2
^
(Y Y )2
23,9431
Cara mencari nilai Y regresi, masukan nilai masing – masing X ke dalam
persamaan regresi. ^
Y 1, 93 0, 64 X
^
Y1 1,93 0, 64* 2 1, 93 1, 28 3, 21
X 1 = 2 ->
^
X 2 = 3 ->
Y2 1, 93 0, 64*3 1,93 1,92 3,85
^
X 3 = 4 Y->
3 1,93 0, 64* 4 1,93 2, 56 4, 49
^
Y4 1, 93 0, 64*5 1,93 3, 2 5,13
X 4 = 5 ->
^
X 5 = 6 Y->
5 1,93 0, 64* 6 1,93 3,84 5, 77
^
Y6 1, 93 0, 64*7 1,93 4, 48 6, 41
X 6 = 7 ->
^
X 7 = 8 ->
Y7 1,93 0, 64*8 1, 93 5,12 7, 05
Maka nilai kesalahan
taksiran regresi adalah:
^
S^
yx
2
(
Y
Y
)
n
23,9431
1,85
7
baku
dari
Akhirnya….
Terjawab
semuanya…
.
Mudah kan?
^^
Perlu diketahui, bahwa selain regresi linear, dikenal juga regresi yang bukan
linear, yaitu:
1.Parabola kuadrat
Sekedar buat
2.Parabola kubik
pengetahuan
3.Eksponen
aja,,, ga dipelajari
4.Geometrik
di bab ini…..
5.Logistik
Tapi kalo mau,,
6.Hiperbola
otodidak aja ya…
7.Gompertz
KOEFISIEN KORELASI
• Perumusan
koefisien
korelasi
dilakukan
dengan
memakai
perbandingan antara variasi yang
dijelaskan dengan variasi
Y total.
2
(
Y
Y
)
total dari Y terhadap
• Variasi
^
dirumuskan
oleh ^ 2
2
2
(
Y
Y
)
(
Y
Y
)
(
Y
Y
)
•
Variasi yang
tidak
dijelaskan
Variasi yang
dijelaskan
• Perbandingan antara variasi yang
dijelaskan dengan variasi total, yaitu:
^
r2
(Y Y )
r
2
2
adalah koefisien determinasi
2
(
Y
Y
)
• Koefisien korelasi (r) adalah akar dari
koefisien determinasi
^
r
(Y Y )
(Y Y )
2
2
Rumus r
pertama
Keterangan:
1. Nilai r = -1 disebut korelasi linear negatif
(berlawanan arah); artinya terdapat hubungan
negatif yang sempurna antara variabel X dan
Y
2. Nilai r = 1 disebut korelasi linear positif
(searah); artinya terdapat hubungan positif
yang sempurna antara variable X dengan
variabel Y
3. Nilai r = 0 disebut tidak berkorelasi secara
linear, artinya tidak ada hubungan antara
variabel X dan Y
Koefisien korelasi dapat juga dicari
dengan rumus berikut:
Dimana:
2
r 1
S^
y.x
2
y
S
S ^2
Rumus r
kedua
= kuadrat dari kesalahan baku
y .x
S
2
y = variansi Y
(Y Y )
2
n
Kedua rumus koefisien korelasi di atas, dapat digunakan untuk mengukur
kekuatan hubungan yang bentuknya linear maupun tidak linear. Bila hubungan
antara variabel X dan Y bentuknya linear, maka rumus pertama dapat diubah
menjadi:
r
xy
( x )( y
2
Dimana:
2
)
xX X
y Y Y
Disebut juga koefisien
korelasi produk momen
Dari rumus terakhir, yaitu koefisien
korelasi produk momen (product
momen formula)
Apabila kita ambil:
S xy
xy
Sx
Sy
Merupakan kovarians dari X dan Y
n
2
x
Merupakan simpangan baku dari X
n
2
y
n
Merupakan simpangan baku dari Y
2
y
Merupakan variansi dari Y
S x2
Merupakan variansi dari X
S
Dengan demikian, maka rumus
koefisien korelasi dapat juga
ditulis:
Gmana???
r
r
S xy
Sx S y
Bingung rumus mana
yang harus
digunakan???
Ga usah khawatir…
sesuaikan aja sama
data yang
diketahui….. OK?!!
n. XY X . Y
2
2
2
2
n
.
X
(
X
)
n
.
Y
(
Y
)
• Arti dari koefisien korelasi r adalah:
1.Bila 0,90 < r < 1,00 atau -1,00 < r <
-0,90: artinya hubungan yang sangat kuat
2.Bila 0,70 < r < 0,90 atau -0,90 < r <
-0,70: artinya hubungan yang kuat
3.Bila 0,50 < r < 0,70 atau -0,70 < r <
-0,50: artinya hubungan yang moderat
4.Bila 0,30 < r < 0,50 atau -0,50 < r <
-0,30: artinya hubungan yang lemah
5.Bila 0,0 < r < 0,30 atau -0,30 < r < 0,0:
artinya hubungan yang sangat lemah
Contoh soalnya nih….
Biar lebih ngerti…….
Soalnya sama aja dengan yang regresi
Berat
3
4
5
6
7
8
ya…. 2
Badan
Tinggi
Badan
4
5
2
Tentukanlah:
1.Koefisien korelasi (r) dan artinya
2.Koefisien determinasi dan artinya
Jawab:
3
9
6
7
Berat
Badan
(X)
2
3
4
5
6
7
8
∑X = 35
Tinggi
Badan
(Y)
4
X
4
9
16
25
36
49
64
∑X =
203
XY
8
15
8
15
54
42
56
∑XY =
198
Y
16
25
4
9
81
36
49
∑Y =
220
(∑X) =
1225
5
2
3
9
6
7
∑Y = 36
(∑Y) =
1296
Koefisien korelasi adalah:
r
r
n. X
n. XY X . Y
2
( X ) 2 n. Y 2 ( Y ) 2
7 *198 35*36
7 * 203 1225 7 * 220 1296
Truz….
r
1368 1260
1421 1225 1540 1296
108
r
196* 244
108
r
47824
108
108
r
0, 49
47824 218, 69
Kesimpulannya….????
Oleh karena, nilai r = 0,49 terletak
antara 0,30 dan 0,50 maka terdapat
hubungan positif yang lemah antara
tinggi badan dan berat badan.
2
2
Koefisien
determinasi,
yaitu
r (0, 49) 0, 2401
Artinya, variasi tinggi badan yang dapat dijelaskan oleh variasi berat badan (X)
Mahasiswa oleh persamaan regresi ^
adalah
Y 1, 93 0, 64 X
Sebesar 24,01 %. Sisanya 75,99% dipengaruhi oleh faktor lain.
TUGAS 2
• Data pada suatu pabrik kertas
menunjukkan
bahwa
banyaknya
mesin yang rusak ada hubungannya
dengan kecepatan beroperasi mesin
cetak. Tergambar pada tabel di
bawah
ini. 8 9 10 11 12 13 15 16
Kecepatan
mesin
permenit
Jumlah kerusakan
kertas (lembar)
6
7
8
5
7
10
12
9
• Tentukanlah:
1.Persamaan regresi linear
2.Berapa perkiraan jumlah kertas yang
rusak, jika kecepatan mesin permenit
adalah 18?
3.Tentukan kesalahan baku yang diberikan
oleh persamaan regresi!
4.Tentukanlah
koefisien
korelasi
dan
koefisien determinasi data tersebut serta
Deadline…
berikan artinya masingNext
– masing!
week…
Don’t be
late OK!!!!
STATISTIKA SEMESTER 4
QUIZ 3
Selasa, 2 Juni 2009
• Data pada suatu pabrik kertas menunjukkan bahwa
banyaknya mesin yang rusak ada hubungannya dengan
kecepatan beroperasi mesin cetak. Tergambar pada tabel
di bawah ini.
Kecepatan mesin
permenit
7
8
9
10
11
12
14
15
Jumlah kerusakan
kertas (lembar)
5
6
7
4
6
9
11
8
• Tentukanlah:
1. Persamaan regresi linear
2. Berapa perkiraan jumlah kertas yang rusak, jika kecepatan
mesin permenit adalah 20?
• PENGERTIAN
Statistika
Ilmu tentang pengumpulan data
Klasifikasi Data
Penyajian Data
Pengolahan Data
Penarikan Kesimpulan
Pengambilan keputusan
Populasi: Himpunan
keseluruhan dari objek
pengamatan
Sample: Bagian dari populasi
Data: Informasi atau fakta yang
tertuang dalam angka atau
bukan angka
Deskriptif: Metode untuk
mendeskripsikan,
menggambarkan, menjabarkan,
atau menguraikan data
Inferensia: Penarikan
kesimpulan dari sample untuk
menjelaskan isi dari populasi
• JENIS – JENIS DATA
Data
Data
Data
Data
mentah
primer
sekunder
Kuantitatif
Data Diskrit
Data Kontinyu
Data Diskrit:
Civitas UMMI
o Data Nominal
o Daata Ordinal
o Data Dikotomi
Mahas
iswa
o Data Kualitatif
o Parameter: Kualitas
Pengukuran sample
Pega
wai
• CONTOH – CONTOH
Populasi dan Sample
“Civitas akademik Universitas
Muhammadiyah Sukabumi terdiri dari
dosen, mahasiswa dan staff pekerja
lainnya yang berjumlah 1200 orang”
sample
Populasi
Deskriptif
“Nilai UAS mahasiswa Teknik
Informatika semester 4 untuk mata
kuliah Statistika adalah dengan nilai
rata – rata 65”
Dose
n
Data Nominal
Jumlah lulusan mahasiswa Universitas
Muhammadiyah Sukabumi tahun 2008
l
Program
Studi
Jumlah
Teknik
Informatik
25 orang
Kimia
5 orang
SDPK
4 orang
Data Ordinal
Kategori hasil nilai akhir Mata Kuliah
Statistika
Kategori
Nilai
Jumlah
Istimewa
10 orang
Baik
12 orang
Cukup
20 orang
Kurang
7 orang
Kurang sekali
3 orang
Data Dikotomi
Murni: Hidup – mati, surga –
neraka, laki – laki – wanita, dll.
Buatan: lulus – gagal, hitam –
putih, dll.
Data interval: data yang
memiliki rentang atau jarak
yang sama
Data rasio: Data yang
dinyatakan dalam perbandingan
TENDENSI SENTRAL
• Nilai rata – rata (Mean):
Rumus:
Biasa
Dengan Frekuensi
• Nilai Tengah (Median):
Rumus:
Biasa
Dengan Frekuensi
Keterangan:
(jumlah data
ke 1 sampai data ke-n )
(jumlah perkalian frekuensi dengan
data)
n = banyaknya data
= jumlah frekuensi
Keterangan:
Me = median
Lo = Batas bawah kelas
C = lebar kelas
n = banyaknya data
F = jumlah frekuensi sebelum
kelas
f = jumlah frekuensi kelas
• Modus = Nilai yang
paling sering muncul
Biasa
Mo = nilai yang paling
sering muncul
Data berfrekuensi
Keterangan:
Mo = modus
Lo = Batas bawah kelas
modus
C = lebar kelas
b1 = selisih frekuensi
sebelum kelas modus
b2 = selisih frekuensi tepat
satu data setelahnya
•
Contoh Kasus:
1. Data hasil ujian akhir semester 4
untuk mata kuliah statistika adalah
sebagai berikut: 40, 65, 90, 65, 70, 55,
85, 65, 70, 35
Tentukanlah:
a. Rata – rata nilai UAS
b. Modus nilai UAS
c. Median Nilai UAS
2. Data nilai UAS mahasiswa semester 4,
untuk mata kuliah STATISTIKA adalah
Nilai
Jml Mhs
sebagai berikut:
45
6
50
8
65
14
70
16
75
9
80
4
Tentukanlah nilai :
a. Rata2
b. Modus
c. Median
Contoh soal data distribusi
berfrekuensi
• Misalkan modal (dalam jutaan
rupiah) dari 40 perusahaan pada
tabel distribusi
frekuensi
berikut:
Modal
Frekuensi
112 - 120
4
121 - 129
5
130 - 138
8
139 - 147
12
148 -156
5
157 -165
4
166 - 174
2
= 40
Tentukan:
a.Mean/ Rata – rata
b.Median
c.Modus
Kata Kunci
Data Distribusi Frekuensi
• Kelas = selang/ interval
• Frekuensi = banyaknya
nilai yang termasuk ke
dalam kelas
• Limit kelas/ tepi kelas:
Nilai terkecil dan
terbesar pada setiap
kelas, terbagi menjadi
2, yaitu limit bawah
kelas dan limit atas
kelas
• Batas bawah kelas
dan batas atas kelas
• Lebar kelas= selisih
batas atas kelas dan
batas bawah kelas
• Nilai tengah kelas =
(batas bawah kelas
+ batas atas kelas)/
2
Dari contoh di atas, maka
didapat:
• Kelas = 112 – 120
• Limit kelas/ tepi kelas:
pada kelas 112 – 120,
Nilai 112 disebut limit
bawah kelas dan nilai
120 disebut limit atas
kelas
• Pada kelas 112 – 120,
nilai 111,5 disebut
batas bawah kelas dan
nilai 120,5 disebut
batas atas kelas
• Lebar kelas= 120,5
– 111,5 = 9 nilai
lebar kelas pada
masing – masing
kelas adalah sama
• Nilai tengah kelas
= (111,5 +
120,5)/2 = 116
Penyelesaian Soal
• Mean/ Rata - rata
Modal
Nilai
Tengah
(X)
Frekuensi
(f)
fX
112 - 120
116
4
464
121 - 129
125
5
625
130 - 138
134
8
1.072
139 - 147
143
12
1.716
148 -156
152
5
760
157 -165
161
4
644
166 - 174
170
2
340
= 40
= 5.621
X
5.621
140,525
40
• MEDIAN
n
2F
Med L0 c
f
Untuk mencari median, tentukan dulu pada kelas
interval mana mediannya terletak.
Karena frekuensinya bernilai genap, maka median
terletak pada nilai ke
n 1 40 1
20,5
2
2
Data ke 20,5 terletak pada kelas interval 139 – 147.
Maka diperoleh:
Lo = 138,5
f = 12
F = 4 + 5 + 8 = 17
c = 147,5 – 138,5 = 9
• Jadi mediannya adalah
40
17
2
Med 138, 5 9
12
20 17
Med 138,5 9
140, 75
12
• MODUS
Untuk mencari modus, tentukan dulu kelas interval
yang mengandung modus, yaitu kelas interval yang
memiliki frekuensi terbesar. Maka dapat diketahui
bahwa modus terletak pada kelas interval 139 – 147
• Dengan demikian:
Lo = 138, 5
b2 = 12-5=7
c=9
b1 = 12-8=4
Jadi modusnya adalah:
b1
4
Mod L0 c
138,5 9
b1 b2
47
= 138,5 + 3,27 = 141,77
KUARTIL, DESIL, DAN
PERSENTIL
• KUARTIL (Perluasan Median)
Kuartil terbagi menjadi 3, yaitu:
Kuartil pertama/ Kuartil bawah (Q1)
Kuartil kedua/ Kuartil tengah (Q2)
Kuartil ketiga/ Kuartil atas (Q3)
Rumus Untuk data tidak berkelompok:
i (n 1)
Qi Nilaiyangke
i 1, 2,3
4
• Untuk data berkelompok
i, n
4 F
Qi L0 c
, i 1, 2,3
f
Dimana:
Lo= Batas bawah kelas kuartil
c = Lebar kelas
F = Jumlah frekuensi semua kelas
sebelum kelas kuartil Qi
f = Frekuensi kelas kuartil Qi
• DESIL
Jika sekelompok data dibagi menjadi 10
bagian yang sama banyak, maka akan
terdapat 9 pembagi, masing – masing
disebut nilai Desil (D), yaitu D1, D2, …, D9
• Untuk data tidak berkelompok
i (n 1)
Di nilaiyangke
, i 1, 2,3,...,9
10
• Untuk data berkelompok
i.n
10 F
Di L0 c
, i 1, 2,3,...,9
f
Dimana: Lo = Batas bawah kelas desil Di
c = Lebar kelas
F = Jumlah frekuensi semua kelas sebelum kelas desil Di
f = Frekuensi kelas desil Di
• PERSENTIL
Jika sekelompok data dibagi menjadi 100
bagian sama banyak, maka akan terdapat
99 pembagi, yang masing – masing
disebut persentil (P), yaitu P1,P2,P3,
…,P99. Nilai persentil ke-I, yaitu Pi dihitung
dengan rumus berikut.
Untuk data tidak berkelompok:
i (n 1)
Pi nilaike
, i 1, 2,3,...,99
100
• Untuk data berkelompok
i.n
100 F
Pi L0 c
, i 1, 2,3,...,99
f
Dimana: Lo = Batas bawah kelas persentil Pi
c = Lebar kelas
F = Jumlah frekuensi semua kelas sebelum kelas persentil Pi
f = Frekuensi kelas persentil Pi
Contoh soal data tidak
berkelompok
• Tentukan kuartil Q1, Q2 dan Q3 dari data gaji bulanan 13
karyawan (dalam ribuan rupiah) berikut.
40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100.
• Jawab:
Urutan data: 30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85,
95, 100.
i (n 1)
Maka:
Qi nilaike
1(13 1)
4
, n 13
Q1=nilai kenilai
ke- 3 1
4
2
= antara nilai ke 3 dan ke 4
= nilai ke 3 + ½ (nilai ke 4 – nilai ke 3)
= 40 + ½ (45-40)
= 40 + 2,5= 42,5
• Tentukan desil D3 dan D7 dari data gaji bulanan 13
karyawan (dalam ribuan rupiah) berikut.
40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100.
• Jawab:
Urutan data: 30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85,
95, 100.
i (n 1)
Di nilaiyangke
10
Maka:
3(13 1)
D3= nilai yang ke10
= nilai ke 4–1
= nilai ke 45 + 1/5 (nilai ke 5 – nilai ke 4)
= 45 + 1/5 (50-45)
= 45 + 1= 46
Contoh soal data
berkelompok
• Misalkan modal (dalam jutaan
rupiah) dari 40 perusahaan pada
tabel distribusi
frekuensi
berikut:
Tentukan:
Modal
Frekuensi
112 - 120
4
121 - 129
5
130 - 138
8
139 - 147
12
148 -156
5
157 -165
4
166 - 174
2
= 40
a.Tentukan nilai kuartil
Q1, Q2 dan Q3
b. Tentukan desil D3 dan D8
c. Tentukan persentil P20
dan P 80
Penyelesaian Soal
• Mencari Q1, Q2, dan Q3
Jawab:
Tentukan dulu kelas interval Q1, Q2, dan Q3
Karena n=40,
Q1 terletak pada nilai ke
1(40 1)
10, 25
Nilai ke 10, 25 terletak pada
4 interval kelas 130 – 138
Q2 terletak pada nilai ke
2(40 interval
1)
Nilai ke 20, 5 terletak pada
kelas 139 – 147
20,5
4
Q3 terletak pada nilai ke
Nilai ke 30,75 terletak pada
3(40 1)interval kelas 148 – 156
4
30, 75
Setelah diketahui interval kelas dari tiap – tiap kuartil
yang dicari, maka nilai kuartil dapat dicari dengan
rumus.
i, n
4 F
Qi L0 c
f
Untuk Q1, terletak pada interval kelas 130 – 137,
maka:
Lo = 129,5
F = 4+5 = 9
f=8 c=
9
40
9
sehingga:
10 9
4
Q1 129,5 9
129,5 9
130, 625
8
8
• Mencari D3 dan D8
Jawab:
Tentukan kelas interval dimana desil berada
Karena n = 40, maka kelas interval D3 dan D8
3(40 1)
berada pada:
12,3
10
D3 terletak pada nilai ke
1)
Nilai ke 12,3 terletak8(40
pada
interval kelas 130 – 138
32,8
10
D8 terletak pada nilai ke
Nilai ke 32,8 terletak pada interval kelas 139 – 147
Maka nilai D3 dan D8 adalah:
i.n
10 F
Di L0 c
f
Untuk D3 terletak pada interval kelas 130 – 138,
maka:
Lo = 129,5 F = 4+5= 9f = 8
c=9
Sehingga:
3(40)
9
10
12 9
D3 129,5 9
129,5 9
132,875
8
8
PENGUKURAN DISPERSI,
KEMIRINGAN, DAN KERUNCINGAN
DATA
• DISPERSI DATA
Dispersi/ variasi/ keragaman data: ukuran penyebaran
suatu kelompok data terhadap pusat data.
• Ukuran Dispersi yang akan dipelajari:
Jangkauan (Range)
Simpangan rata – rata (mean deviation)
Variansi (variance)
Dispersi multak
Standar Deviasi (Standard Deviation)
Simpangan Kuartil (quartile deviation)
Koefisien variasi (coeficient of variation)
Dispersi relatif
RANGE/ JANGKAUAN DATA (r)
• Range: Selisih nilai maksimum dan nilai
minimum
Rumus: Range (r) = Nilai max – nilai min
• Range untuk kelompok data dalam bentuk
distribusi frekuensi diambil dari selisih
antara nilai tengah kelas maksimun – nilai
tengah kelas minimum
Simpangan Rata2/ Mean
Deviation (SR)
• Simpangan rata – rata: jumlah nilai mutlak
dari selisih semua nilai dengan nilai rata –
rata, dibagi banyaknya data.
• Rumus
• Untuk data tidak berkelompok
SR
X X
n
Dimana:
X = nilai data
X = rata – rata hitung
n = banyaknya data
• Untuk data berkelompok
SR
( f X X )
n
Dimana:
X = nilai data
X = rata – rata hitung
n = Σf = jumlah frekuensi
2
(s )
VARIANSI/ VARIANCE
• Variansi adalah rata – rata kuadrat selisih
atau kuadrat simpangan dari semua nilai
data terhadap rata – rata hitung.
2
s
2
= simbol untuk sample
= simbol untuk populasi
• Rumus untuk data tidak berkelompok
S
2
X X
2
n 1
• Untuk data berkelompok
S
2
f X X
n 1
2
STANDAR DEVIASI/ STANDARD
DEVIATION (S)
• Standar deviasi: akar pangkat dua dari
variansi
• Rumus:
X
X
2
Untuk data tidak berkelompok
S
2
f X X
2
n 1
Untuk data berkelompok
S
2
n 1
Contoh Soal
• Data tidak berkelompok
Diketahui sebuah data berikut:
20, 50, 30, 70, 80
Tentukanlah:
a. Range (r)
b. Simpangan Rata – rata (SR)
c. Variansi
d. Standar Deviasai
• Jawab:
a. Range (r) = nilai terbesar – nilai terkecil = 80
– 20 = 60
b. Simpangan
X X Rata – rata (SR):
SR
n
X
20 50 30 70 80
50
5
n = 20
5 50 50 50 30 50 70 50 80 50
SR
5
30 0 20 20 30 100
SR
20
5
5
2
(
s
• Variansi )
S
2
X X
2
n 1
2
2
2
2
2
(20
50)
(50
50)
(30
50)
(70
50)
(80
50)
S2
5 1
S2
900 0 400 400 900 2600
650
4
4
• Standar Deviasi (S)
S S
2
S 650 25, 495
Contoh Soal
• Data Berkelompok
Diketahui data pada tabel dibawah ini:
Modal
Frekuensi
112 - 120
4
121 - 129
5
130 - 138
8
139 - 147
12
148 -156
5
157 -165
4
166 - 174
2
40
Tentukan:
a.Range (r)
b.Simpangan rata – rata (SR)
c.Variansi
d.Standar Deviasi
JAWAB
• Range (r)= (nilai tengah tertinggi – nilai tengah
terendah)/2
• Simpangan
( f Xrata
X–)rata
SR
n
n = jml frekuensi
f X X
• Variansi
S
2
2
n 1
• Standar Deviasi S 2
f X X
n 1
2
• Untuk memudahkan mencari jawaban, maka
dibuat tabel sesuai dengan keperluan jawaban
Modal
f
Nilai
Tenga
h (X)
112 - 120
4
116
121 - 129
5
125
130 - 138
8
139 - 147
f X X
( X X )2
f ( X X )2
24,525
98,100
601,476
2405,90
2
15,525
77,625
241,026
1205,12
8
134
6,525
52,200
42,576
340,605
12
143
2,475
29,700
6,126
73,507
148 -156
5
152
11,475
57,375
131,676
658,378
157 -165
4
161
20,475
81,900
419,226
1676,90
2
166 - 174
2
170
29,475
58,950
868,776
1737,55
1
Jumlah
40
X X
455,8
50
8097,9
74
Maka dapat dijawab:
• Range (r) = 170 – 116 = 54
• Simpangan rata – rata
455,850
SR
11,396
40
• Variansi
8097,974 8097,974
S
207, 64
40 1
39
2
• Standar Deviasi
S 207, 64 14, 41
JANGKAUAN QUARTIL
DAN JANGKAUAN PERSENTIL 10-90
• Jangkauan kuartil disebut juga simpangan kuartil,
rentang semi antar kuartil, deviasi kuartil.
Jangkauan persentil 10-90 disebut juga rentang
persentil 10-90
• Jangkauan kuartil dan jangkauan persentil lebih
baik daripada jangkauan (range) yang memakai
selisih antara nilai maksimum dan nilai minimun
suatu kelompok data
• Rumus:
Ket:
1
Jangkauan
JK (Q3 QKuartil:
1)
2
JK: jangkauan kuartil
Q1: kuartil bawah/ pertama
Q3: kuartil atas/ ketiga
• Rumus Jangkauan Persentil
JP1090 P90 P10
• KOEFISIEN VARIASI/ DISPERSI
RELATIF
Untuk mengatasi dispersi data yang sifatnya mutlak, seperti
simpangan baku, variansi, standar deviasi, jangkauan kuartil,dll
Untuk membandingkan variasi antara nilai – nilai bersar
dengan nilai – nilai kecil.
Untuk mengatasi jangkauan data yang lebih dari 2 kelompok
data.
Rumus:
S
KV *100%
X
Ket:
KV: Koefisien variasi
S : Standar deviasi
X : Rata – rata hitung
KOEFISIEN VARIASI KUARTIL
• Alternatif lain untuk dispersi relatif yang bisa
digunakan jika suatu kelompok data tidak
diketahui nilai rata – rata hitungnya dan nilai
standar deviasinya.
• Rumus:
Q3 Q1
KVQ
Q3 Q1
atau
(Q3 Q1 ) / 2
KVQ
Med
NILAI BAKU
• Nilai baku atau skor baku adalah hasil
transformasi antara nilai rata – rata hitung
dengan standar deviasi
• Rumus:
X1 X
Zi
S
Nilai i = 1, 2, 3, …, n
Contoh Soal untuk Koefisien
Variasi dan Simpangan Baku
• Koefisien Variasi
Ada dua jenis bola lampu. Lampu jenis A secara rata –
rata mampu menyala selama 1500 jam dengan
simpangan baku (standar deviasi) S1 = 275 jam,
sedangkan lampu jenis B secara rata – rata dapat
menyala selama 1.750 jam dengan simpangan baku
S2 = 300 jam. Lampu mana yang kualitasnya paling
baik?
Jawab:
S1
275
KV1
*100%
*100% 18,3%
Lampu jenis A:
X1
1500
S
300
Lampu jenis B:
KV2 2 *100%
*100% 17,1%
X2
1750
• Nilai rata – rata ujian akhir semester mata kuliah
Statistika dengan 45 mahasiswa adalah 78 dan
simpangan baku/standar deviasi (S) = 10. Sedangkan
untuk mata kuliah Bahasa Inggris di Kelas
itu
mempunyai nilai rata – rata 84 dan simpangan bakunya
(S) = 18. Bila dikelas itu, Desi mendapat nilai UAS untuk
kalkulus adalah 86 dan untuk bahasa Inggris adalah 92,
bagaimana posisi/ prestasi Desi di kelas itu?
• Jawab
• Untuk mengetahui posisi/ prestasi Desi, maka harus
dicari nilai baku (Z) dari kedua mata kuliah tersebut.
X X
Z
S
dengan nilai X adalah nilai UAS yang diperoleh Desi
• Untuk Mata Kuliah Statistika
X = 86 S = 10
X 78
Maka:
86 78
Z
0,8
10
• Untuk Mata Kuliah Bahasa Inggris
X = 92 S = 18
Maka:
X 84
92 84
Karena nilai
baku
(Z)untuk
Z
0, 4 mata kuliah Statistika
lebih besar dari18
B. Inggris, maka posisi Desi lebih
baik pada mata kuliah Statistika dari pada B.
Inggris
KEMIRINGAN DATA
• Kemiringan: derajat/ ukuran dari
ketidaksimetrian
(asimetri)
suatu
distribusi data
• 3 pola kemiringan distribusi data, sbb:
– Distribusi simetri (kemiringan 0)
– Distribusi miring ke kiri (kemiringan
negatif)
– Distribusi miring ke kanan (kemiringan
positif)
• Beberapa metoda yang bisa dipakai
untuk menghitung kemiringan data,
yaitu:
– Rumus Pearson
– Rumus Momen
– Rumus Bowley
• Rumus Pearson (α)
3( X Med )
X Mod
atau
S
S
• Rumus tersebut dipakai untuk data
tidak
berkelompok
maupun
data
berkelompok.
– Bila α = 0 atau mendekati nol, maka
dikatakan distribusi data simetri.
– Bila α bertanda negatif, maka dikatakan
distribusi data miring ke kiri.
– Bila α bertanda positif, maka dikatakan
distribusi data miring ke kanan.
– Semakin besar α, maka distribusi data
akan semakin miring atau tidak simetri
RUMUS MOMEN ( 3 )
• Cara lain yang dipakai untuk
menghitung
derajat
kemiringan
adalah rumus momen derajat tiga,
yaitu
3
• Untuk data
tidak
berkelompok:
(
X
X
)
3
3
nS
3
(
f
(
X
X
)
)
3
3
• Untuk data berkelompok
f
S
• Khusus untuk data berkelompok dalam
bentuk tabel distribusi frekuensi , derajat
kemiringan α3 dapat dihitung dengan
cara transformasi sebabai berikut:
3
2
fU
fU
fU
c
3 3
3
n
S n
n
3
fU
2 n
3
– Jika α3 = 0, maka distribusi data simetri
– Jika α3 < 0, maka distribusi data miring ke kiri
– Jika α3 > 0, maka distribusi data miring ke
kanan
– Untuk mencari nilai Standar deviasi (S)
menggunakan variabel U:
2
n fU ( fU )
2
S c
n(n 1)
– Variabel U = 0, ±1, ±2, ±3, dst.
• RUMUS BOWLEY
Q3 Q1 Q2
Q3 Q1
KERUNCINGAN DISTRIBUSI
DATA
• Keruncingan distribusi data adalah
derajat atau ukuran tinggi rendahnya
puncak suatu distribusi data terhadap
distribusi normalnya.
• Keruncingan
data
disebut
juga
kurtosis, ada 3 jenis yaitu:
– Leptokurtis
– Mesokurtis
– Platikurtis
KERUNCINGAN DISTRIBUSI
DATA
• Keruncingan distribusi
dihitung dengan rumus:
• Data tidak berkelompok
4
(X X )
nS
4
4
• Data Berkelompok
( f (X X ) )
f *S
4
4
4
data
(α4)
• Khusus untuk transformasi
2
4
4
3
2
fU fU fU fU fU
c fU
4 4
4
6
3
S n
n n n n n
4
• Keterangan
– α4 = 3, distribusi data mesokurtis
– α4 > 3, distribusi data leptokurtis
– α4 < 3, distribusi data platikurtis
• Selain cara di atas, untuk mencari
keruncingan data, dapat dicari dengan
menggunakan rumus:
1
(Q3 Q1 )
JK
K
2
P90 P10
P90 P10
K= Koefisien Kurtorsis Persentil
• Keterangan
– K = 0,263 maka keruncingan distribusi data
mesokurtis
– K > 0,263 maka keruncingan distribusi data
leptokurtis
– K < 0,263 maka keruncingan distribusi data platikurtis
REGRESI DAN KORELASI
• Pada bab ini akan membahas dua bagian
yang saling berhubungan, khususnya dua
kejadian
yang
dapat
diukur
secara
matematis.
• Dalam hal dua kejadian yang saling
berhubungan, ada dua hal yang perlu diukur
dan dianalisis, yaitu:
– Bagaimana hubungan fungsional (persamaan matematis)
antara dua kejadian tersebut -> analisis regresi
– Bagaimana kekuatan (keeratan) hubungan dua kejadian
itu -> analisis korelasi
REGRESI LINEAR
SEDERHANA
• Garis regresi/ regresi: garis lurus/ garis
linear yang merupakan garis taksiran
atau perkiraan untuk mewakili pola
hubungan antara variabel X
dan
variabel Y.
• Cara untuk mencari persamaan garis
Dimana
regresi:
^
Y = variabel terikat
Y a bX
X = variabel bebas
a = intersep (pintasan) bilamana X=0
b = koefisien arah (slope) dari garis regresi
• Koefisien regresi a dan b dapat dicari
dengan rumus:
Y . X X . XY
a
n. X ( X )
2
2
b
2
n. XY X . Y
n. X ( X )
2
2
Rumus
lain
untuk
koefisien a dan b adalah:
b
menghitung
n. XY X . Y
n. X ( X )
2
X
Y
a
b
n
n
2
• Kita dapat membuat garis regresi
lebih dari satu dari suatu data. Lalu
garis regresi manakah yang paling
baik??
• Garis regresi yang paling baik adalah
garis regresi yang mempunyai total
kuadrat kesalahan/ total kuadrat
selisih/ total kuadrat eror yang paling
minimum.
^
2
2eror
• Total
kuadrat
dapat
dihitung
e
(
Y
Y
)
dengan:
n
n
Selanjutnya bila diambil
akarnya, maka diperoleh:
^
S^
yx
(Y Y )
Bentuk terakhir ini disebut
Kesalahan baku dari penafsiran
Atau disebut juga
Standard error of estimate
2
n
Rumus di atas dapat di jabarkan menjadi:
S^
yx
Y
2
a. Y b. XY
n
Nih….. Contoh Soal
Regresi……
Berat
Badan
2
3
4
5
6
7
8
Tinggi
Badan
4
5
2
3
9
6
7
Tentukanlah persamaan regresi dan kesalahan baku penafsirannya!
Jawab:
^
Persamaan regresi adalah:
Y a bX
Untuk melengkapi persamaan tersebut, maka perlu dicari nilai a dan b.
Cara mencari nilai a dan b adalah:
Y . X X . XY
a
n. X ( X )
2
2
2
b
n. XY X . Y
n. X 2 ( X ) 2
Untuk mempermudah mencari nilai –
nilai yang diperlukan, maka akan
digunakan tabel.
Berat
Badan
(X)
2
3
4
5
6
7
8
∑X =
35
Tinggi
Badan
(Y)
4
5
2
3
9
6
7
∑Y = 36
X
4
9
16
25
36
49
64
∑X =
203
XY
8
15
8
15
54
42
56
∑XY =
198
Masukan nilai – nilai yang telah diketahui,
ke dalam rumus untuk mencari nilai a dan b:
(∑X) = 1225
36* 203 35*198 7308 6930 378
a
1,93
7 * 203 1225
1421 1225 196
7 *198 35*36 1386 1260 126
b
0, 64
7 * 203 1225
1421 1225 196
Setelah diketahui, nilai a dan b, maka masukan nilai a dan b
ke dalam persamaan regresi. Hasilnya adalah:
^
Y 1,93 0, 64 X
b. Mencari nilai kesalahan baku dari penafsiran.
^
S^
yx
2
(
Y
Y
)
n
Ini persamaan
regresi / hubungan
dari variabel X dan
Y tadi…. Ngerti
kan????
Masukan nilai X ke dalam persamaan regresi
untuk mencari nilai Y regresi
Berat
Badan
(X)
2
3
4
5
6
7
8
Tinggi
Badan
(Y)
4
5
2
3
9
6
7
^
3.21
3,85
4,49
5,13
5,77
6,41
7,05
^
0,79
1,15
-2,49
-2,13
3,33
-0,41
-0,05
0,6241
1,322
5
6,2001
4,5369
11,088
9
0,1681
0,0025
Y
Y Y
^
(Y Y ) 2
^
(Y Y )2
23,9431
Cara mencari nilai Y regresi, masukan nilai masing – masing X ke dalam
persamaan regresi. ^
Y 1, 93 0, 64 X
^
Y1 1,93 0, 64* 2 1, 93 1, 28 3, 21
X 1 = 2 ->
^
X 2 = 3 ->
Y2 1, 93 0, 64*3 1,93 1,92 3,85
^
X 3 = 4 Y->
3 1,93 0, 64* 4 1,93 2, 56 4, 49
^
Y4 1, 93 0, 64*5 1,93 3, 2 5,13
X 4 = 5 ->
^
X 5 = 6 Y->
5 1,93 0, 64* 6 1,93 3,84 5, 77
^
Y6 1, 93 0, 64*7 1,93 4, 48 6, 41
X 6 = 7 ->
^
X 7 = 8 ->
Y7 1,93 0, 64*8 1, 93 5,12 7, 05
Maka nilai kesalahan
taksiran regresi adalah:
^
S^
yx
2
(
Y
Y
)
n
23,9431
1,85
7
baku
dari
Akhirnya….
Terjawab
semuanya…
.
Mudah kan?
^^
Perlu diketahui, bahwa selain regresi linear, dikenal juga regresi yang bukan
linear, yaitu:
1.Parabola kuadrat
Sekedar buat
2.Parabola kubik
pengetahuan
3.Eksponen
aja,,, ga dipelajari
4.Geometrik
di bab ini…..
5.Logistik
Tapi kalo mau,,
6.Hiperbola
otodidak aja ya…
7.Gompertz
KOEFISIEN KORELASI
• Perumusan
koefisien
korelasi
dilakukan
dengan
memakai
perbandingan antara variasi yang
dijelaskan dengan variasi
Y total.
2
(
Y
Y
)
total dari Y terhadap
• Variasi
^
dirumuskan
oleh ^ 2
2
2
(
Y
Y
)
(
Y
Y
)
(
Y
Y
)
•
Variasi yang
tidak
dijelaskan
Variasi yang
dijelaskan
• Perbandingan antara variasi yang
dijelaskan dengan variasi total, yaitu:
^
r2
(Y Y )
r
2
2
adalah koefisien determinasi
2
(
Y
Y
)
• Koefisien korelasi (r) adalah akar dari
koefisien determinasi
^
r
(Y Y )
(Y Y )
2
2
Rumus r
pertama
Keterangan:
1. Nilai r = -1 disebut korelasi linear negatif
(berlawanan arah); artinya terdapat hubungan
negatif yang sempurna antara variabel X dan
Y
2. Nilai r = 1 disebut korelasi linear positif
(searah); artinya terdapat hubungan positif
yang sempurna antara variable X dengan
variabel Y
3. Nilai r = 0 disebut tidak berkorelasi secara
linear, artinya tidak ada hubungan antara
variabel X dan Y
Koefisien korelasi dapat juga dicari
dengan rumus berikut:
Dimana:
2
r 1
S^
y.x
2
y
S
S ^2
Rumus r
kedua
= kuadrat dari kesalahan baku
y .x
S
2
y = variansi Y
(Y Y )
2
n
Kedua rumus koefisien korelasi di atas, dapat digunakan untuk mengukur
kekuatan hubungan yang bentuknya linear maupun tidak linear. Bila hubungan
antara variabel X dan Y bentuknya linear, maka rumus pertama dapat diubah
menjadi:
r
xy
( x )( y
2
Dimana:
2
)
xX X
y Y Y
Disebut juga koefisien
korelasi produk momen
Dari rumus terakhir, yaitu koefisien
korelasi produk momen (product
momen formula)
Apabila kita ambil:
S xy
xy
Sx
Sy
Merupakan kovarians dari X dan Y
n
2
x
Merupakan simpangan baku dari X
n
2
y
n
Merupakan simpangan baku dari Y
2
y
Merupakan variansi dari Y
S x2
Merupakan variansi dari X
S
Dengan demikian, maka rumus
koefisien korelasi dapat juga
ditulis:
Gmana???
r
r
S xy
Sx S y
Bingung rumus mana
yang harus
digunakan???
Ga usah khawatir…
sesuaikan aja sama
data yang
diketahui….. OK?!!
n. XY X . Y
2
2
2
2
n
.
X
(
X
)
n
.
Y
(
Y
)
• Arti dari koefisien korelasi r adalah:
1.Bila 0,90 < r < 1,00 atau -1,00 < r <
-0,90: artinya hubungan yang sangat kuat
2.Bila 0,70 < r < 0,90 atau -0,90 < r <
-0,70: artinya hubungan yang kuat
3.Bila 0,50 < r < 0,70 atau -0,70 < r <
-0,50: artinya hubungan yang moderat
4.Bila 0,30 < r < 0,50 atau -0,50 < r <
-0,30: artinya hubungan yang lemah
5.Bila 0,0 < r < 0,30 atau -0,30 < r < 0,0:
artinya hubungan yang sangat lemah
Contoh soalnya nih….
Biar lebih ngerti…….
Soalnya sama aja dengan yang regresi
Berat
3
4
5
6
7
8
ya…. 2
Badan
Tinggi
Badan
4
5
2
Tentukanlah:
1.Koefisien korelasi (r) dan artinya
2.Koefisien determinasi dan artinya
Jawab:
3
9
6
7
Berat
Badan
(X)
2
3
4
5
6
7
8
∑X = 35
Tinggi
Badan
(Y)
4
X
4
9
16
25
36
49
64
∑X =
203
XY
8
15
8
15
54
42
56
∑XY =
198
Y
16
25
4
9
81
36
49
∑Y =
220
(∑X) =
1225
5
2
3
9
6
7
∑Y = 36
(∑Y) =
1296
Koefisien korelasi adalah:
r
r
n. X
n. XY X . Y
2
( X ) 2 n. Y 2 ( Y ) 2
7 *198 35*36
7 * 203 1225 7 * 220 1296
Truz….
r
1368 1260
1421 1225 1540 1296
108
r
196* 244
108
r
47824
108
108
r
0, 49
47824 218, 69
Kesimpulannya….????
Oleh karena, nilai r = 0,49 terletak
antara 0,30 dan 0,50 maka terdapat
hubungan positif yang lemah antara
tinggi badan dan berat badan.
2
2
Koefisien
determinasi,
yaitu
r (0, 49) 0, 2401
Artinya, variasi tinggi badan yang dapat dijelaskan oleh variasi berat badan (X)
Mahasiswa oleh persamaan regresi ^
adalah
Y 1, 93 0, 64 X
Sebesar 24,01 %. Sisanya 75,99% dipengaruhi oleh faktor lain.
TUGAS 2
• Data pada suatu pabrik kertas
menunjukkan
bahwa
banyaknya
mesin yang rusak ada hubungannya
dengan kecepatan beroperasi mesin
cetak. Tergambar pada tabel di
bawah
ini. 8 9 10 11 12 13 15 16
Kecepatan
mesin
permenit
Jumlah kerusakan
kertas (lembar)
6
7
8
5
7
10
12
9
• Tentukanlah:
1.Persamaan regresi linear
2.Berapa perkiraan jumlah kertas yang
rusak, jika kecepatan mesin permenit
adalah 18?
3.Tentukan kesalahan baku yang diberikan
oleh persamaan regresi!
4.Tentukanlah
koefisien
korelasi
dan
koefisien determinasi data tersebut serta
Deadline…
berikan artinya masingNext
– masing!
week…
Don’t be
late OK!!!!
STATISTIKA SEMESTER 4
QUIZ 3
Selasa, 2 Juni 2009
• Data pada suatu pabrik kertas menunjukkan bahwa
banyaknya mesin yang rusak ada hubungannya dengan
kecepatan beroperasi mesin cetak. Tergambar pada tabel
di bawah ini.
Kecepatan mesin
permenit
7
8
9
10
11
12
14
15
Jumlah kerusakan
kertas (lembar)
5
6
7
4
6
9
11
8
• Tentukanlah:
1. Persamaan regresi linear
2. Berapa perkiraan jumlah kertas yang rusak, jika kecepatan
mesin permenit adalah 20?