Deskripsi Data Pengukuran Nilai Pusat & Dispersi untuk Data Tunggal
DESKRIPSI DATA
Pengukuran Nilai Pusat & Dispersi untuk data tunggal / data tidak terdistribusi Srava Chrisdes Antoro, M.Si.
2 cara numerik untuk mendeskripsikan variabel kuantitatif: Measure of location: Mengukur pusat penyebaran
data Tujuan: menunjukan sesuatu dengan tepat tentang pusat penyebaran data Meliputi: mean (rata-rata), median, modus
Measure of dispersion: Mengukur variasi dari penyebaran data.
Meliputi: Jangkauan, deviasi mean (simpangan rata-rata), variansi (ragam), deviasi standar (simpangan baku) Mengapa
measure of location
(penge- tahuan tentang rata- rata) saja tidak cukup?
Karena kita bisa terarah pada pengam- bilan kesimpu- lan yang salah
Contoh: Rata-rata gaji direktur di perusahaan makanan adalah 50jt/bulan, dan rata-rata dari gaji direktur di perusahaan asuransi adalah 50jt/bulan. Dari hal ini, seolah-olah bisa diambil kesimpulan bahwa distribusi dari gaji direktur sama. Padahal interval gaji direktur di perusahaan makanan adalah
40jt-60jt/bulan, sedangkan interval gaji direktur dari perusahaan asuransi adalah dengan range 30jt-70jt/bulan. Ternyata distribusi penyebaran tidak sama, maka diperlukan measuere of dispersion.
1. MEAN POPULASI
Jumlah nilai dalam populasi Mean populasi Banyak nilai dalam populasi
X
N Mean populasi merupakan suatu parameter.Parameter adalah sebarang karakter yang bisa diukur dalam populasi.
Contoh 1
Ada 42 swalayan/minimarket/supermarket di Kota
Depok. Jarak antar swalayan/minimarket tersebut adalah sebagai berikut (dalam km):
a) Mengapa data tersebut disebut data populasi?
b) Tentukan mean dari jarak antara swalayan 11 4 10 4 9 3 8 2 2 5 6 1 2 2 1 4 7 5 2 2 5 10 3 14 1 10 3 5 3 7 1 3 7 8 10 1 1 3 3 1 2 1
Jawab:
a) Data tersebut merupakan data populasi karena
mempertimbangkan semua swalayan/minimarket/ supermarket yang ada di Kota Depok.b) Mean dari jarak antar swalayan tersebut adalah: 11 4 10 ... 2 1 192
4,57
42
42
2. MEAN SAMPEL
Jumlah nilai dalam sampel Mean sampel Banyak nilai dalam sampel
X x n
Mean dari sampel merupakan suatu statistik. Statistik adalah sebarang karakter yang diukur berdasarkan data pada sampel.
Contoh 2 Seseorang sedang melakukan penelitian tentang lamanya seseorang berbicara menggunakan telepon/HP pada suatu hari tertentu. 12 orang
diambil secara random dan diperoleh data sebagai
berikut (dalam menit). 90 77 94 89 119 11291 110 92 100 113 83 Tentukan mean dari data di atas!
Jawab: Mean dari lamanya seseorang berbicara menggunakan telepon/ HP adalah
90 77 ... 83 1170 x
97,5
12
12
Karakter dari mean (aritmetika) Setiap himpunan dari data interval dan data rasio memiliki mean.
Semua nilai diikutsertakan dalam perhitungan mean.
Mean dari suatu data populasi atau sampel adalah tunggal.
Jumlah deviasi dari setiap nilai dari mean adalah 0.
( ) X x
Contoh 3 Nilai : 3, 8, 4.
Mean = (3+8+4)/3 = 15/3 = 5
Deviasi = (3-5) + (8-5) + (4-5) = -2 + 3 + (-1) = 0
Kelemahan Mean Jika ada salah satu nilai dalam sampel ataupun populasi yang terlalu tinggi atau terlalu rendah dibanding dengan nilai mayoritas lainnya, maka mean tidak lagi menjadi rata-rata yang tepat untuk data.
CONTOH: Pendapatan tahunan dari perusahaan percetakan adalah
1M, 1,5M, 2M, dan 8M.Mean = (1M + 1,5M + 2M + 8M)/4 = 3,125M Mean pada contoh ini tentunya tidak mewakili data yang ada,
karena nyaris semua pendapatan berada dalam interval 1M – 2M,
hanya ada 1 data yang terlalu tinggi.3. Weighted MEAN
Weighted mean sering juga diartikan sebagai rata-rata berbobot.
1 1
2
2
1
2 ( ) ...
... n n w n wX w x w x w x
X w w w w
Contoh 4
Suatu restoran menjual suatu minuman dengan ukuran kecil, medium dan besar, yang harga masing-masingnya adalah $0.90, $1.25 dan $1.50. Sebanyak 3 ukuran kecil, 4 ukuran medium dan 3 ukuran besar terjual.
Tentukan rata-rata dari harga minuman yang terjual di restoran tersebut!
Jawab:
Rata-rata (weighted mean) dari harga minuman yang terjual di restoran tersebut adalah:
3 0,90 4 1, 25 3 1,5 12, 20 X w
1, 22 3 4 3
10 Why Median is necessary ?
4. MEDIAN Contoh: Seseorang akan menginap di suatu kamar hotel.
Seorang agen mengatakan bahwa rata-rata harga kamar di hotel tersebut adalah 1,1jt/malam. Sedangkan, budget dari orang tersebut max 750rb/malam. Apakah orang tersebut masih akan mencari penyewaan kamar di hotel tersebut? Tapi setelah mengetahui detil harga kamar hotel di kawasan tersebut, bisa jadi orang tersebut akan berubah pikiran.
Harga sewa kamar hotel tersebut adalah standard room 600rb, Superior room 650rb, Deluxe room 700rb, Suite room 800rb, dan Presidential room 2,75jt.
Karakter dari Median Merupakan nilai tengah dari data setelah diurutkan dari
nilai terkecil hingga yang terbesar atau sebaliknya.
Tidak dipengaruhi oleh nilai-nilai ekstrem (nilai yang terlalu besar ataupun yang terlalu kecil).
Median dapat dihitung untuk data ordinal, data interval, dan data rasio.
Jika banyaknya data adalah ganjil, maka median terdapat pada data. Jika banyaknya data adalah genap, maka median merupakan rata- rata dari 2 nilai di tengahnya. Dengan kata lain, median bisa jadi bukan merupakan suatu nilai pada data.
Contoh 5
Diketahui: 3 5 7 5 9 1 3 9 17 10 Tentukan median dari data tersebut.
Jawab:
Urutkan terlebih dahulu datanya dari yang terkecil hingga terbesar.
1 3 3 5 5 7 9 9 10 17 Karena banyaknya data ada 10 (genap), maka mediannya adalah rata-rata dari data ke-5 dan data ke-6, yaitu:
5 7
12 median
6
2
2
Nilai yang paling
5. MODUS sering muncul
Karakter Modus:
- Dapat dihitung untuk semua ukuran data, yaitu data nominal, data ordinal, data interval, dan data rasio.
- Nilai modus tidak dipengaruhi oleh nilai-nilai ekstrem, misalnya nilai yang terlalu tinggi ataupun yang terlalu rendah dari mayoritas nilai lainnya.
Kelemahan Modus:
- Kadang ada beberapa data, saat masing-masing nilai muncul hanya 1 kali saja
Data Frekuensi Frekuensi Kumulatif 1 8 8
2 7 15 3 7 22
4 3 25 5 4 29
6 1 30 7 3 33
8 2 35 9 1 36
10 4 40 11 1 41
14 1 42 TOTAL 42 Contoh 1 (tentang 42 swalayan di Kota Depok)
Menunjukkan frekuensi terbanyak di antara nilai lainnya, maka: MODUS = 1.
MEDIAN terletak pada data ke-21 dan data ke- 22, yaitu 3.
6. MEAN GEOMETRI
- Sangat berguna untuk menemukan rata-rata perubahan pada persentase, rasio, indeks, dan rata-rata laju pertumbuhan terhadap waktu.
- Mean geometri Mean aritmetika
Contoh 6
Asumsikan seseorang menerima kenaikan gaji sebesar 5% pada tahun ini dan 15% pada tahun berikutnya. Tentukan apakah rata-rata persentase kenaikan gajinya adalah 10% (yang diperoleh dari (5%+15%)/2)? Kenaikan gaji sebanyak 5% => gaji naik menjadi sebesar 1,05x.
Kenaikan gaji sebanyak 15% => gaji naik menjadi 1,15x.
2 GM x x 1 2 1, 05 1,15 1, 2075 1, 09886
Hasil tersebut menunjukkan rata-rata persentase kenaikan gaji
orang tersebut adalah 9,886%, BUKAN 10%. Asumsikan pada mulanya gaji seseorang tersebut adalah sebesar 1jt/ bulan, maka
Gaji awal Kenaikan (%) Kenaikan (Rp) 1) Kenyataannya Kenaikan gaji tahun ini 1.000.000,00 5% 50.000,00 Kenaikan gaji tahun depan 1.050.000,00 15% 157.500,00
TOTAL kenaikan gaji selama 2 tahun = 207.500,00 2) Rata-rata persentase kenaikan gaji = 9,886% Kenaikan gaji tahun ini 1.000.000,00 9,886% 98.860,00 Kenaikan gaji tahun depan 1.098.860,00 9,886% 108.633,30
TOTAL kenaikan gaji selama 2 tahun = 207.493,30 3) Jika dianggap rata-rata persentase kenaikan gaji = 10% Kenaikan gaji tahun ini 1.000.000,00 10% 100.000,00 Kenaikan gaji tahun depan 1.100.000,00 10% 110.000,00
TOTAL kenaikan gaji selama 2 tahun = 210.000,00
Lebih mendekati ke hasil yang sebenarnya
Contoh 7
Populasi di Las Vegas meningkat dari 258.295 jiwa
pada 1990 menjadi 607.876 jiwa pada tahun 2009,
atau terjadi kenaikan sebesar 349.581 jiwa atau135,34% pada periode tersebut. Tentukan rata-rata
persentase laju pertumbuhan populasi per tahunnya
pada periode tersebut?
Jawab: 1990 – 2009 = 19 tahun, sehingga n = 19.
Artinya, rata-rata persentase laju pertumbuhan populasi per tahun
selama periode tersebut adalah 4,61%. Dengan kata lain, populasi
penduduk di Las Vegas meningkat dengan laju 4,61% per tahun dari
1990 ke 2009.Mengapa perlu mempelajari Dispersi/Penyebaran Data ? 1)
Karena mean, median, modus hanya membicarakan tentang pusat data, tapi tidak menceritakan tentang penyebaran data.
2)
Jika nilai ukuran penyebaran data kecil, hal itu menunjukkan bahwa
nilai-nilai pada data tidak terlalu jauh berbeda, yaitu hampir mendekati mean aritmetika, sehingga dalam hal ini nilai mean sangat dipertimbangkan untuk mewakili pusat data.3)
Jika nilai ukuran penyebaran data besar, maka nilai mean tidak bisa
dipertimbangkan untuk mewakili pusat data.4) Pengetahuan tentang penyebaran data berguna untuk membandingkan penyebaran dalam dua atau lebih distribusi.
5) Ukuran penyebaran data dapat digunakan untuk mengevaluasi apakah hasil pengukuran lokasi (mean, median, modus) benar-benar mewakili data/dapat dipertanggungjawabkan.
1. RANGE (JANGKAUAN)
hanya berdasarkan nilai terbesar atau nilai terendah saja
Range = Nilai terbesar – Nilai terkecil
2. DEVIASI MEAN
melibatkan semua nilai observasi pada data
X x
MD dengan: n
X nilai dari setiap observasi x mean aritmetika
3. VARIANSI & DEVIASI STANDAR
a) Variansi Populasi
Proses menghitung variansi populasi:
Mulai dengan menemukan nilai mean artimetika sehingga diperoleh
), kemudian kuadratkan nilai selisih tersebut sehingga diperoleh (X
- Tentukan selisih setiap nilai X dengan mean sehingga diperoleh (X
) 2
) 2
- Jumlahkan semua kuadrat selisihnya sehingga diperoleh ∑(X
- Bagi hasil jumlah semua kuadrat selisih dengan banyaknya data dalam
populasi sehingga diperoleh 2 .
2 2 ( )
X N
Variansi populasi sangat sulit diinterpetasikan, karena
jika nilai adanya kuadrat, tapi dapat disimpulkan bahwavariansi populasi makin kecil, maka nilai-nilai observasi pada
data dekat dengan pusat data (yaitu mean), sehingga nilai
observasi pada data tidak terlalu menyebar luas atau tidak
terlalu bervariasi. jika nilai observasi dalam populasi menyebar luasSedangkan, dari mean, maka variansi populasi akan besar .
b) Deviasi Standar Populasi
c) Variansi Sampel
d) Deviasi Standar Sampel 2 2 ( )
X N
2 2
( )
s n
1 X x
2 2 ( )
s s n
1 X x
dengan: 2 variansi populasi
deviasi standar populasi 2 s variansi sampel s deviasi standar sampel
mean aritmetika dari populasi x mean aritmetika dari sampel
N banyaknya observasi pada populasi
n banyakny a observasi pada sampel X nilai dari setiap observasi
Deviasi standar biasanya digunakan untuk
membandingkan penyebaran dalam dua atau lebih
himpunan observasi.
Semakin kecil nilai deviasi standar, maka hal itu menunjukkan
makin dekatnya nilai-nilai observasi dengan mean-nya
. jika semakin besar nilai deviasi, maka hal ituSebaliknya, menunjukkan semakin bervariasinya nilai-nilai observasi .
Contoh 8 Upah rata-rata sejumlah sampel pegawai paruh waktu di suatu perusahaan adalah:
$12, $20, $16, $18, $19
a. Hitunglah jangkauan dari data tersebut!
b. Berapakah deviasi mean dari sampel tersebut?
c. Hitunglah variansi dari sampel tersebut?
d. Berapakah deviasi standar dari sampel tersebut?
Jawab:
a. Jangkauan = 20
- – 12 = 8
b. Hitung mean terlebih dahulu:
Deviasi meannya adalah:
12 20 16 18 19
85
17
5
5 x
12 17 20 17 16 17 18 17 19 17
5 5 3 1 1 2 12 2, 4
X x MD n
2 2
2 2 2 2 2 ( )
1 (12 17) (20 17) (16 17) (18 17) (19 17) 5 1
40
10
s n
4 X x
2 10 3,16 s s
c. Variansi sampelnya adalah:
d. Deviasi standar sampelnya adalah:
Tugas 1
Carilah informasi mengenai bagaimana cara menentukan:
a. kuartil b. desil c. persentil pada data tunggal/data tidak terdistribusi.Tugas 2
Sepuluh pemuda yang tinggal di Ancol dipilih secara acak untuk
menilai rasa dari pizza sushi terbaru yang dilapisi tuna, nasi, dan
rumput laut pada skala 1 hingga 50. Berikut adalah penilaiannya.
34
39
40
46
33
31
34
14
15
45 a) Hitunglah rata-rata (mean), median, dan modus dari data tersebut.
b) Hitunglah simpangan rata-rata (deviasi mean) dari data tersebut. Interpretasikan hasilnya dengan rata-rata (mean) yang didapat pada poin (a).
c) Berapakah jangkauan (range) dari data tersebut?
d) Hitunglah variansi dan simpangan baku (deviasi standar) dari data tersebut.
e) Tentukan kuartil pertama, kedua, dan ketiga dari data tersebut.
f) Tentukan desil ketiga dan ketujuh dari data tersebut.
g) Tentukan persentil ke-40 dari data tersebut.