Deskripsi Data Pengukuran Nilai Pusat & Dispersi untuk Data Tunggal

DESKRIPSI DATA

  Pengukuran Nilai Pusat & Dispersi untuk data tunggal / data tidak terdistribusi Srava Chrisdes Antoro, M.Si.

  2 cara numerik untuk mendeskripsikan variabel kuantitatif: Measure of location: Mengukur pusat penyebaran

  data Tujuan: menunjukan sesuatu dengan tepat tentang pusat penyebaran data Meliputi: mean (rata-rata), median, modus

  Measure of dispersion: Mengukur variasi dari penyebaran data.

  Meliputi: Jangkauan, deviasi mean (simpangan rata-rata), variansi (ragam), deviasi standar (simpangan baku) Mengapa

  measure of location

  (penge- tahuan tentang rata- rata) saja tidak cukup?

  Karena kita bisa terarah pada pengam- bilan kesimpu- lan yang salah

  Contoh: Rata-rata gaji direktur di perusahaan makanan adalah 50jt/bulan, dan rata-rata dari gaji direktur di perusahaan asuransi adalah 50jt/bulan. Dari hal ini, seolah-olah bisa diambil kesimpulan bahwa distribusi dari gaji direktur sama. Padahal interval gaji direktur di perusahaan makanan adalah

  40jt-60jt/bulan, sedangkan interval gaji direktur dari perusahaan asuransi adalah dengan range 30jt-70jt/bulan. Ternyata distribusi penyebaran tidak sama, maka diperlukan measuere of dispersion.

1. MEAN POPULASI

  Jumlah nilai dalam populasi Mean populasi  Banyak nilai dalam populasi

  X

  

 

N Mean populasi merupakan suatu parameter.

  Parameter adalah sebarang karakter yang bisa diukur dalam populasi.

  Contoh 1

Ada 42 swalayan/minimarket/supermarket di Kota

Depok. Jarak antar swalayan/minimarket tersebut adalah sebagai berikut (dalam km):

  

a) Mengapa data tersebut disebut data populasi?

  b) Tentukan mean dari jarak antara swalayan 11 4 10 4 9 3 8 2 2 5 6 1 2 2 1 4 7 5 2 2 5 10 3 14 1 10 3 5 3 7 1 3 7 8 10 1 1 3 3 1 2 1

  Jawab:

  

a) Data tersebut merupakan data populasi karena

mempertimbangkan semua swalayan/minimarket/ supermarket yang ada di Kota Depok.

  b) Mean dari jarak antar swalayan tersebut adalah:      11 4 10 ... 2 1 192

      4,57

  42

  42

2. MEAN SAMPEL

  Jumlah nilai dalam sampel Mean sampel  Banyak nilai dalam sampel

  Xxn

  Mean dari sampel merupakan suatu statistik. Statistik adalah sebarang karakter yang diukur berdasarkan data pada sampel.

  Contoh 2 Seseorang sedang melakukan penelitian tentang lamanya seseorang berbicara menggunakan telepon/HP pada suatu hari tertentu. 12 orang

diambil secara random dan diperoleh data sebagai

berikut (dalam menit). 90 77 94 89 119 112

  91 110 92 100 113 83 Tentukan mean dari data di atas!

  Jawab: Mean dari lamanya seseorang berbicara menggunakan telepon/ HP adalah

  90 77 ... 83    1170 x

    97,5

  12

  12

  Karakter dari mean (aritmetika) Setiap himpunan dari data interval dan data rasio memiliki mean.

  Semua nilai diikutsertakan dalam perhitungan mean.

  Mean dari suatu data populasi atau sampel adalah tunggal.

  Jumlah deviasi dari setiap nilai dari mean adalah 0.

  (  )  X x

  Contoh 3 Nilai : 3, 8, 4.

  Mean = (3+8+4)/3 = 15/3 = 5

Deviasi = (3-5) + (8-5) + (4-5) = -2 + 3 + (-1) = 0

  Kelemahan Mean Jika ada salah satu nilai dalam sampel ataupun populasi yang terlalu tinggi atau terlalu rendah dibanding dengan nilai mayoritas lainnya, maka mean tidak lagi menjadi rata-rata yang tepat untuk data.

  

CONTOH: Pendapatan tahunan dari perusahaan percetakan adalah

1M, 1,5M, 2M, dan 8M.

  Mean = (1M + 1,5M + 2M + 8M)/4 = 3,125M Mean pada contoh ini tentunya tidak mewakili data yang ada,

karena nyaris semua pendapatan berada dalam interval 1M – 2M,

hanya ada 1 data yang terlalu tinggi.

3. Weighted MEAN

  Weighted mean sering juga diartikan sebagai rata-rata berbobot.

  1 1

  2

  2

  1

  2 ( ) ...

  ... n n w n wX w x w x w x

  X w w w w    

       

  Contoh 4

  Suatu restoran menjual suatu minuman dengan ukuran kecil, medium dan besar, yang harga masing-masingnya adalah $0.90, $1.25 dan $1.50. Sebanyak 3 ukuran kecil, 4 ukuran medium dan 3 ukuran besar terjual.

  Tentukan rata-rata dari harga minuman yang terjual di restoran tersebut!

  Jawab:

  Rata-rata (weighted mean) dari harga minuman yang terjual di restoran tersebut adalah:

       3 0,90 4 1, 25 3 1,5 12, 20 Xw

    1, 22 3 4 3  

  10 Why Median is necessary ?

4. MEDIAN Contoh: Seseorang akan menginap di suatu kamar hotel.

  Seorang agen mengatakan bahwa rata-rata harga kamar di hotel tersebut adalah 1,1jt/malam. Sedangkan, budget dari orang tersebut max 750rb/malam. Apakah orang tersebut masih akan mencari penyewaan kamar di hotel tersebut? Tapi setelah mengetahui detil harga kamar hotel di kawasan tersebut, bisa jadi orang tersebut akan berubah pikiran.

  Harga sewa kamar hotel tersebut adalah standard room 600rb, Superior room 650rb, Deluxe room 700rb, Suite room 800rb, dan Presidential room 2,75jt.

  Karakter dari Median Merupakan nilai tengah dari data setelah diurutkan dari

nilai terkecil hingga yang terbesar atau sebaliknya.

  Tidak dipengaruhi oleh nilai-nilai ekstrem (nilai yang terlalu besar ataupun yang terlalu kecil).

  Median dapat dihitung untuk data ordinal, data interval, dan data rasio.

  Jika banyaknya data adalah ganjil, maka median terdapat pada data. Jika banyaknya data adalah genap, maka median merupakan rata- rata dari 2 nilai di tengahnya. Dengan kata lain, median bisa jadi bukan merupakan suatu nilai pada data.

  Contoh 5

  Diketahui: 3 5 7 5 9 1 3 9 17 10 Tentukan median dari data tersebut.

  Jawab:

  Urutkan terlebih dahulu datanya dari yang terkecil hingga terbesar.

  1 3 3 5 5 7 9 9 10 17 Karena banyaknya data ada 10 (genap), maka mediannya adalah rata-rata dari data ke-5 dan data ke-6, yaitu:

  5 7 

  12 median   

  6

  

2

  2

  Nilai yang paling

5. MODUS sering muncul

  

Karakter Modus:

  • Dapat dihitung untuk semua ukuran data, yaitu data nominal, data ordinal, data interval, dan data rasio.
  • Nilai modus tidak dipengaruhi oleh nilai-nilai ekstrem, misalnya nilai yang terlalu tinggi ataupun yang terlalu rendah dari mayoritas nilai lainnya.

  Kelemahan Modus:

  • Kadang ada beberapa data, saat masing-masing nilai muncul hanya 1 kali saja

  Data Frekuensi Frekuensi Kumulatif 1 8 8

  2 7 15 3 7 22

  4 3 25 5 4 29

  6 1 30 7 3 33

  8 2 35 9 1 36

  10 4 40 11 1 41

  14 1 42 TOTAL 42 Contoh 1 (tentang 42 swalayan di Kota Depok)

  Menunjukkan frekuensi terbanyak di antara nilai lainnya, maka: MODUS = 1.

  MEDIAN terletak pada data ke-21 dan data ke- 22, yaitu 3.

6. MEAN GEOMETRI

  • Sangat berguna untuk menemukan rata-rata perubahan pada persentase, rasio, indeks, dan rata-rata laju pertumbuhan terhadap waktu.
  • Mean geometri  Mean aritmetika

  Contoh 6

  Asumsikan seseorang menerima kenaikan gaji sebesar 5% pada tahun ini dan 15% pada tahun berikutnya. Tentukan apakah rata-rata persentase kenaikan gajinya adalah 10% (yang diperoleh dari (5%+15%)/2)? Kenaikan gaji sebanyak 5% => gaji naik menjadi sebesar 1,05x.

  Kenaikan gaji sebanyak 15% => gaji naik menjadi 1,15x.

  2 GMx x     1 2 1, 05 1,15 1, 2075 1, 09886

Hasil tersebut menunjukkan rata-rata persentase kenaikan gaji

orang tersebut adalah 9,886%, BUKAN 10%

  . Asumsikan pada mulanya gaji seseorang tersebut adalah sebesar 1jt/ bulan, maka

  Gaji awal Kenaikan (%) Kenaikan (Rp) 1) Kenyataannya Kenaikan gaji tahun ini 1.000.000,00 5% 50.000,00 Kenaikan gaji tahun depan 1.050.000,00 15% 157.500,00

  TOTAL kenaikan gaji selama 2 tahun = 207.500,00 2) Rata-rata persentase kenaikan gaji = 9,886% Kenaikan gaji tahun ini 1.000.000,00 9,886% 98.860,00 Kenaikan gaji tahun depan 1.098.860,00 9,886% 108.633,30

  TOTAL kenaikan gaji selama 2 tahun = 207.493,30 3) Jika dianggap rata-rata persentase kenaikan gaji = 10% Kenaikan gaji tahun ini 1.000.000,00 10% 100.000,00 Kenaikan gaji tahun depan 1.100.000,00 10% 110.000,00

  TOTAL kenaikan gaji selama 2 tahun = 210.000,00

  Lebih mendekati ke hasil yang sebenarnya

  Contoh 7

Populasi di Las Vegas meningkat dari 258.295 jiwa

pada 1990 menjadi 607.876 jiwa pada tahun 2009,

atau terjadi kenaikan sebesar 349.581 jiwa atau

135,34% pada periode tersebut. Tentukan rata-rata

persentase laju pertumbuhan populasi per tahunnya

pada periode tersebut

  ?

  Jawab: 1990 – 2009 = 19 tahun, sehingga n = 19.

  

Artinya, rata-rata persentase laju pertumbuhan populasi per tahun

selama periode tersebut adalah 4,61%. Dengan kata lain, populasi

penduduk di Las Vegas meningkat dengan laju 4,61% per tahun dari

1990 ke 2009.

  Mengapa perlu mempelajari Dispersi/Penyebaran Data ? 1)

  Karena mean, median, modus hanya membicarakan tentang pusat data, tapi tidak menceritakan tentang penyebaran data.

  2)

Jika nilai ukuran penyebaran data kecil, hal itu menunjukkan bahwa

nilai-nilai pada data tidak terlalu jauh berbeda, yaitu hampir mendekati mean aritmetika, sehingga dalam hal ini nilai mean sangat dipertimbangkan untuk mewakili pusat data.

  3)

Jika nilai ukuran penyebaran data besar, maka nilai mean tidak bisa

dipertimbangkan untuk mewakili pusat data.

  4) Pengetahuan tentang penyebaran data berguna untuk membandingkan penyebaran dalam dua atau lebih distribusi.

  5) Ukuran penyebaran data dapat digunakan untuk mengevaluasi apakah hasil pengukuran lokasi (mean, median, modus) benar-benar mewakili data/dapat dipertanggungjawabkan.

1. RANGE (JANGKAUAN)

  hanya berdasarkan nilai terbesar atau nilai terendah saja

  Range = Nilai terbesar – Nilai terkecil

2. DEVIASI MEAN

  melibatkan semua nilai observasi pada data

  Xx

  MD  dengan: n

  X  nilai dari setiap observasi x  mean aritmetika

3. VARIANSI & DEVIASI STANDAR

a) Variansi Populasi

  Proses menghitung variansi populasi:

  

  • Mulai dengan menemukan nilai mean artimetika sehingga diperoleh

    ), kemudian kuadratkan nilai selisih tersebut sehingga diperoleh (X

  • Tentukan selisih setiap nilai X dengan mean sehingga diperoleh (X

    ) 2

    ) 2

  • Jumlahkan semua kuadrat selisihnya sehingga diperoleh ∑(X
  • Bagi hasil jumlah semua kuadrat selisih dengan banyaknya data dalam

  populasi sehingga diperoleh  2 .

  2 2 ( )

  X N  

    

  

Variansi populasi sangat sulit diinterpetasikan, karena

jika nilai adanya kuadrat, tapi dapat disimpulkan bahwa

variansi populasi makin kecil, maka nilai-nilai observasi pada

data dekat dengan pusat data (yaitu mean)

  , sehingga nilai

observasi pada data tidak terlalu menyebar luas atau tidak

terlalu bervariasi. jika nilai observasi dalam populasi menyebar luas

  Sedangkan, dari mean, maka variansi populasi akan besar .

  b) Deviasi Standar Populasi

  c) Variansi Sampel

  d) Deviasi Standar Sampel 2 2 ( )

  X N   

     

  2 2

( )

  s n  

  

1 X x

  2 2 ( )

  s s n   

   

1 X x

  dengan: 2  variansi populasi 

   deviasi standar populasi  2 s  variansi sampel s  deviasi standar sampel 

   mean aritmetika dari populasi x  mean aritmetika dari sampel

N  banyaknya observasi pada populasi

   n banyakny a observasi pada sampel X  nilai dari setiap observasi

  

Deviasi standar biasanya digunakan untuk

membandingkan penyebaran dalam dua atau lebih

himpunan observasi.

  

Semakin kecil nilai deviasi standar, maka hal itu menunjukkan

makin dekatnya nilai-nilai observasi dengan mean-nya

. jika semakin besar nilai deviasi, maka hal itu

  Sebaliknya, menunjukkan semakin bervariasinya nilai-nilai observasi .

  Contoh 8 Upah rata-rata sejumlah sampel pegawai paruh waktu di suatu perusahaan adalah:

  $12, $20, $16, $18, $19

  a. Hitunglah jangkauan dari data tersebut!

  b. Berapakah deviasi mean dari sampel tersebut?

  c. Hitunglah variansi dari sampel tersebut?

  

d. Berapakah deviasi standar dari sampel tersebut?

  Jawab:

  a. Jangkauan = 20

  • – 12 = 8

  b. Hitung mean terlebih dahulu:

  Deviasi meannya adalah:

  12 20 16 18 19

  85

  17

  5

  5 x

        

  12 17 20 17 16 17 18 17 19 17

  5 5 3 1 1 2 12 2, 4

  X x MD n

             

         

  2 2

  2 2 2 2 2 ( )

  1 (12 17) (20 17) (16 17) (18 17) (19 17) 5 1

  40

  10

  s n  

            

     

4 X x

  2 10 3,16 s s

    

  c. Variansi sampelnya adalah:

  d. Deviasi standar sampelnya adalah:

  Tugas 1

Carilah informasi mengenai bagaimana cara menentukan:

a. kuartil b. desil c. persentil pada data tunggal/data tidak terdistribusi.

  Tugas 2

Sepuluh pemuda yang tinggal di Ancol dipilih secara acak untuk

menilai rasa dari pizza sushi terbaru yang dilapisi tuna, nasi, dan

rumput laut pada skala 1 hingga 50. Berikut adalah penilaiannya.

  34

  39

  40

  46

  33

  31

  34

  14

  15

  45 a) Hitunglah rata-rata (mean), median, dan modus dari data tersebut.

  b) Hitunglah simpangan rata-rata (deviasi mean) dari data tersebut. Interpretasikan hasilnya dengan rata-rata (mean) yang didapat pada poin (a).

  c) Berapakah jangkauan (range) dari data tersebut?

  d) Hitunglah variansi dan simpangan baku (deviasi standar) dari data tersebut.

  e) Tentukan kuartil pertama, kedua, dan ketiga dari data tersebut.

  f) Tentukan desil ketiga dan ketujuh dari data tersebut.

  g) Tentukan persentil ke-40 dari data tersebut.