UKURAN DASAR DATA STATISTIK

  

UKURAN DASAR DATA STATISTIK

UKURAN PUSAT

  30 IRA RIANI P Operator Rp.1.125.000

  

Data ) yaitu data mentah hasil observasi yang disajikan masih dalam bentuk per-individu atau per-karakteristik dan

  paling banyak muncul, informasi gaji karyawan dinyatakan dalam ukuran rata-rata (mean), dan umur karyawan dinyatakan dengan ukuran median, yaitu tengah-tengah umur. Ukuran diatas, adalah beberapa contoh konkrit dari deskripsi ukuran pusat data statistik. Ukuran statistik secara rumusan perhitungannya dibedakan atas bentuk data yang diolah, yaitu ada yang disebut data acak (Ungrouped

  

mesuarement ). Yaitu jenis kelamin dan jenis pekerjaan karyawan dinyatakan dalam ukuran modus, yaitu yang

  34 Maka dapat kita berikan informasi bahwa paling banyak karyawan tersebut berjenis kelamin Laki-laki, dengan status pekerjaannya adalah Staf Administrasi Kantor. Sedangkan rata-rata gaji per-bulan karyawan tersebut sebesar Rp. 685.632,14. Sedangkan umur karyawan sekitar 35 tahun. Informasi yang disampaikan diatas, tidak lain adalah kita membicarakan beberapa ukuran pusat data (Centre

  42 DADANG K L Staf Adm Rp. 476.500

  39 IMRAN L Staf Adm Rp. 535.000

  31 AZHAR L Staf Keu Rp. 925.500

  Rp. 725.500

  34 NANI RIAWATI P Staf Adm

  28 ALI YASFI L Staf Adm Rp. 885.000

  Apa yang dapat kita simpulkan secara gamblang dan cepat dari data yang disodorkan berikut ini : Tabel 1

  39 ASEP KURNIA L Operator Rp. 475.500

  28 BUDIMAN L Satpam Rp. 525.000

  36 ENNI SUSNITA P Staf Adm Rp. 448.850

  33 YUDHI L Staf Adm Rp. 655.500

  40 DEDI PRIADHI L Staf Keu Rp. 825.000

  35 HANDI L Staf Adm Rp. 775.000

  32 ARMIN FANE L Staf Adm Rp. 576.500

  NATUL MARISA P Staf Adm Rp. 645.000

  Nama Sex Status Kerja Gaji/Bln Umur

  Sampel Data Karyawan peserta Jamsostek

  data yang berbentuk kelompok (Grouped Data), yaitu data yang telah di deskripsikan dalam kelompok atau kelas data yang dikenal dengan penyajian dalam bentuk Daftar Distribusi Frekuensi.

a). Ukuran Statistik Rata-rata ( Notasi :

  Jika terdapat sekumpulan unit data (set data) sampel berukuran n, berbentuk acak yaitu : x

  d – f f

   

  1 f k i i x

    i

  1 k i i f

  Jumlah

  . .

  .

  2 .

  2 x 2 = (d+f)/2 f 2 .x

  1

  1 , x 2 , x 3 , . . . , x n maka

  1 x 1 = (a+c)/2 f 1 .x

  a – c f

  ( f i .x i )

  Interval Data Frekuensi Nilai tengah ( x i ) Perkalian

  . . . (1) Dilain waktu kita memiliki set data tentang karakteristik atau variabel tertentu dan di deskripsikan sudah dalam bentuk tabel atau daftar distribusi frekuensi berikut ini :

   

  1 x n

  X n i i=1

  perhitungan rata-rata data sampel tersebut dirumuskan sebagai :

  X ) Maka ukuran rata-rata data terkelompok diatas, dihitung dengan menentukan nilai tengah masing-masing kelas data dan ambil jumlah perkalian frekuensi kelas ke-i dengan nilai tengah kelas ke-i, sehingga :

  k f x

i i

    i 1

  

  X

  . . . (2)

  k f

i

   i=1

  Misalkan dari data gaji per-bulan karyawan yang tercantum dalam tabel 3.1 d\sebelumnya kita akan olah ukuran rata-rata gaji dari sample 14 karyawan tersebut dengan kedua rumusan diatas, maka : Rumusan-1 : Bentuk data Acak

  n

1 X  x

  

i

n i=1

  = 1/14 ( 645.000 + 576.500 + 775.000 + . . . + 476.500) = 685.632,14 Rumusan-2 : Bentuk data Terkelompok

  Interval Nilai tengah Perkalian Frekuensi Gaji/Bln ( x i ) ( f i .x i )

  4.603.996,0 475.500 - 675.499 8 575.499,5

  2.326.498,5 675.500 - 875.499 3 775.499,5

  1.950.999,0 875.500 – 1.075.499 2 975.499,5

  1.100.250,0 1.075.500 - 1.125.000 1 1.100.250,0

  k k

  Jumlah

  f =14 f x =9.981.744,5 i i i

    i  1 i

  1 k f x i i

  

i 1 

  X = (9.981.744,5) / 14 = 712.981,7  k f i

   i=1

  Dari kedua rumusan diatas, memang terlihat terdapat perbedaan hasil. Hal ini disebabkan karena distribusi data gaji tidak merata, dan diyakini data tersebut tidak berdistribusi normal.

b). Ukuran Statistik Median ( Notasi : M d )

  Ukuran median dalam pengertian sederhana adalah suatu nilai tengah dari urutan data yang diranking, sehingga 50% data pengamatan ada disebelah kiri batas kritis median dan 50% lainnya akan berada disebelah kanan median. Secara skematis dapat digambarkan sebagai berikut :

  X

  1  X 2  X 3 . . .  M d  . . .  X n-2  X n-1  X n 50% 50% Konsep ini dapat diterapkan langsung untuk data yang bersifat acak.

  Jika jumlah data atau banyak unit data pengamatan : (a.) n = ganjil , letak median dapat langsung ditandai pada titik data yang tengah, yaitu data ke- (n+1)/2 (b.) n = genap , letak median akan berada diantara dua titik data, misalnya data ke X dan data X ,

  k k+1

  dengan k = n/2 Untuk data berbentuk kelompok (Disajikan dalam Daftar distribusi frekuensi), maka ukuran median menyatakan nilai pusat sebuah distribusi frekuensi yang dihitung dengan langkah-langkah berikut ini :

  (i). Tentukan terlebih dahulu tepi kelas setiap interval kelas yang dimulai dari batas kiri kelas pertama sampai batas kanan kelas terakhir. Tepi kelas yang dibentuk, mengambil tingkat ketelitian berikut : Jika nilai batas kelas data berbentuk bulat, maka tepi kelas berbeda 0.5 - Jika nilai batas kelas data berbentuk satu satuan decimal, maka tepi kelas berbeda 0.05 - Jika nilai batas kelas data berbentuk dua satuan decimal, maka tepi kelas berbeda 0.005 - - Demikian seterusnya.

  (ii). Hitung frekuensi kumulatif setiap tepi kelas yang dibentuk. (iii).Tentukan dimana dapat ditentukan letak Median, yaitu data ke-(n/2) jika genap atau data ke-(n+1)/2 jika ganjil, sehingga dapat diketahui kelas median data.

  Berdasarkan ketiga langkah diatas, maka dapat ditandai hal-hal berikut ini :

  • Tepi kelas bawah dari kelas median, misalnya : B  Jumlah frekuensi kumulatif sebelum kelas median, misalnya : F  Dan jumlah frekuensi kumulatif setelah kelas median, misalnya : F

  m

  • Maka rumusan median dinyatakan sebagai berikut : n

     F

    . . . (3)

  2 M  B + i d  

F

m    

  (dimana, i = panjang kelas interval ) Untuk memudahkan deskripsi perhitungan ukuran median tersebut, dapat ditampilkan tabel Bantu hitung atau

  Worksheet Tables berikut ini : Letak Md Interval Data Frek. Tepi Kelas Frek.Kum.

  a - 0,5 F = 0

  1

  a – c f

  1

  d – 0.5 F

  2 = f

  1

  d f

  • – f

  2

  g F = f +f

  • – 0.5

  3

  1

  2

  n/2 g – i f

  3 . . . .

  . . . .

  Contoh : Misalkan data dalam bentuk satu satuan decimal berikut : Tabel 2. Contoh Hitung Nilai Median

  

Interval Data Frek. Tepi Kelas Frek.Kum. Letak M d

  1,45 1,5

  7

  • – 10,4

  10,45

  7 Data ke- 10,5 - 19,4

  12 [n+1)/2]=

  19,45

  29 [(77+1)/2]=

  19,5 - 28,4

  16 Data ke-39 28,45

  45 28,5 - 37,4

  14 37,45

  59 37,5 - 46,4

  10 46,45

  69 46,5 - 55,5

  8 Jumlah 77 55,55

  77 Berdasarkan Tabel Bantu kotak kanan , diketahui letak Median ada pada data ke-39, sehingga kelas mediannya adalah : 19,5 - 28,4.

  Maka : n = 77 , B = 19,45 , F = 29 , F m = 45 , dan i = 9, Diperoleh :

  77   

  29  

2 M  19,45+ 9

   = 21,35 d

   

  45    

c). Ukuran Statistik Modus ( Notasi : M )

  Modus adalah suatu ukuran data statistik yang mendeskripsikan pernyataan nilai data yang paling sering ada (muncul) atau disebut juga item yang memiliki frekuensi tertinggi pada suatu kumpulan data (data set). Misalnya, modus nilai statistik mahasiswa adalah : C, artinya paling banyak nilai mahasiswa untuk mata kuliah statistik adalah C, atau nilai mereka berkisar antara 60-65. Modus ukuran sepatu mahasiswa pria adalah 39, modus SKS yang ditempuh mahasiswa setiap semester adalah 20 SKS, dan lain-lain. Jika data set yang dimiliki berbentuk acak, maka nilai modus dapat diperoleh langsung dengan menandai nilai data mana yang paling banyak ada diantara set data tersebut. Dapat terjadi data set yang dimiliki tidak memiliki modus, dan juga dapat terjadi dari data set yang ada akn memiliki dua nilai modus (disebut Bi-Modus), atau tiga modus, 4-modus dan selebihnya (disebut Multi-Modus). Sedangkan untuk data berbentuk kelompok (Grouped Data), maka penentuan modus dapat mengikuti aturan statistik berikut ini : (i). Tentukan kelas modus data, yaitu kelas data yang memiliki nilai frekuen-si tertinggi ( f ) dari kelas data yang ada. (ii). Tentukan tepi kelas setiap interval kelas data, sehingga dapat ditentukan tepi kelas bawah dari kelas modus, misalkan : B. (iii).Tentukan frekuensi sebelum kelas Modus, dan frekuensi setelah kelas modus, masing-masing misalkan bernilai : f -1 dan f +1 . Dari ketiga langkah diatas, maka dapat dirumuskan perhitungan nilai Modus yang dimaksud sebagai :

    (f - f )

  • 1

  M = B + i

  . . . (4)

    (f - f ) (f - f ) 

  • 1 +1

   

  Misalkan dari data contoh hitung Median diatas, akan kita tentukan nilai Modus data set tersebut, maka dilakukan dengan tabel Bantu berikut : Tabel 3. Contoh Hitung Nilai Modus

  

Interval Data Frek. Tepi Kelas

  1,45 1,5 – 10,4

  7 10,45

  10,5 - 19,4

  12 19,45

  19,5 - 28,4

  16 28,45

  28,5 - 37,4

  14 37,45

  37,5 - 46,4

  10 46,45

  46,5 - 55,5

  8 Jumlah 77 55,55 Maka ;

  f = 16, Kelas M = (19,5 – 28,5 ), B = 19,45 f -1 = 12, f +1 = 14 dan , i = 9

 (16 - 12) 

  M = 19,5 + 9

  sehingga : = 25,5

  

 

(16 - 12) (16 - 14) 

 

  j

d). Ukuran Statistik Kuartil ( Notasi : K )

  Nilai kuartil data merupakan ukuran letak data, yang dapat mendeskripsikan batas nilai 25% terkecil, batas 50% nilai data dan batas 25% terbesar. Sehingga kuartil disebut sebagai ukuran lokasi data yang membagi sekumpulan data pengamatan kedalam 4-bagian yang sama, untuk data yang berurutan atau data yang diranking. Maka dalam set data tersebut akan diperoleh 3-nilai kuartil, dinyatakan dengan K j , j = 1, 2, 3.

  j n (  1)  

  Letak kuartil ke-j adalah urutan data ke- , dengan n = banyak data set

   

  4   1( n  1)  

  Sehingga : Letak Kuatil ke-1 adalah urutan data ke-

   

  4   2( n  1)  

  Letak Kuatil ke-2 adalah urutan data ke-

   

  4   3( n  1)  

  Letak Kuatil ke-3 adalah urutan data ke-

   

  4  

  Konsep diatas akan dapat langsung diterapkan, manakala kita memiliki data set yang berbentuk acak, sehingga letak kuatil tersebut dapat digambarkan sbb:

  X X

  min max

  K

1 K

  2 K

  3 Sedangkan jika data yang dimiliki berbentuk data kelompok (disusun dalam suatu DDF), penentuan nilai

  ukuran kuartil dilakukan dengan prosedur berikut:

  j n ( 1)   

  (i). Tentukan letak kuartil yang akan dicari, yaitu data ke- , berdasar-kan frekuensi kumulatifnya

   

  4  

  (ii). Tentukan batas bawah kelas kuartil ke-j, dinyatakan dengan : b j

  j

  (iii). Tentukan frekuensi kelas kuartil ke-j, dinyatakan dengan : f (iv). Tentukan frekuensi kumulatif sebelum kelas kuatil ke-j dan dinyatakan dengan : F j Sehingga ukuran nilai kuartil tersebut dapat dirumuskan sebagai :

  

 

j(n/4)-F

j

  K = b + i

  . . . (5)

  j j  

f

j

  

 

 

  dengan i = jarak interval data Sebagai contoh perhatikan data yang kita punya sebelumnya, yang ditulis ulang dalam tabel 3.4 berikut ini:

  Tabel 4 Tabel data perhitungan Nilai Kuartil

  Interval Data Frek. Tepi Kelas Frek.Kum. Letak K j

  1,45 1,5

  7

  • – 10,4

  1(77 1)   

  Letak K

  1 =

  10,45

  7

   

  10,5 - 19,4

  12 Data ke-19,5 19,45

  4  

  29

  19,5 - 28,4

  16 28,45

  45

  2(77 1)   

  Letak K

  2 =

  28,5 - 37,4

  14

   

  4  

  37,45

  59 Data ke-39 37,5 - 46,4

  10 46,45

  69 46,5 - 55,5

  8

  3(77 1)   

  Letak K

  3 =

  Jumlah 77 55,55

  77

   

  4  

  Data ke- 58,5 Sehingga diperoleh :

  Kuartil K

1 Kuartil K

  3

  3

  Dengan cara yang sama, dapat juga kita rumuskan dan hitung untuk kasus-kasus ukuran data : Desil dan Persentil. Dimana, ukuran Desil adalah membagi data dalam 10 bagian yang sama, sedangkan Persentil adalah membagi data dalam 100 bagian yang sama.

  K 1 = 8,2 K 2 = 24,8 K 3 = 36,6

  = 45

  3

  = 29 F

  2

  = 7 F

  1

  = 14 F

  = 16 f

  b

  2 Kuartil K

  = 12 f

  1

  = 28,45 f

  3

  = 19,45 b

  2

  = 10,45 b

  1

  2

UKURAN DISPERSI DATA 1). PENGERTIAN

  

Ukuran ini menerangkan kepada kita sebera jauh adanya penyimpangan atau kekeliruan yang

mungkin ada dalam ukuran pemusatan data, khususnya ukuran rata-rata hitung. Misalnya kita

memiliki dua set data, sebut saja data X dan Y berikut :

Data X : 50, 57, 58, 64, 72 X = 60,2  Y Data Y : 40, 54, 63, 70, 74 = 60,2

Rata-rata kedua kelompok data sama yaitu 60,2, namun variasi nialinya terhadap nilai sentral

kedua kelompok data tersebut terlihat berbeda. Misalnya saja range (jarak) data set pertama

sebesar : 72-50 = 22, sedangkan data set kedua : 74-40 = 34.

  

Beberapa ukuran dispersi yang dikenal dan sering bermanfaat dalam deskripsi data statistik,

diantaranya adalah : Range, Deviasi rata-rata, Deviasi Standar, dan Koefisien variasi.

  a). Ukuran Statistik Range ( Notasi : R )

range adalah selisih nilai tertinggi dengan nilai terendah, sehingga dinyatakan sebagai jarak

suatu data set. Dinyatakan sebagai : x max min x n

  • – X – X

    Untuk data : 50, 57, 58, 64, 72, memiliki Range = 22

  1 R = X atau R = X . . . (1)

  b). Ukuran Statistik Deviasi Rata-rata ( Notasi : D ) x

  

Deviasi rata-rata adalah jumlah absolut dari penyimpangan nilai observasi dari nilai sentralnya

(rata-rata), dibagi dengan jumlah obsevasi pada data. n xx i

   i

  1 Dx Rumuskan Untuk Data Acak : = . . . (2) n

  Dimana : i x = nilai observasi ke-i, x = nilai rata-rata dan n = jumlah observasi n f xx i i

    i

  

1

Dx Rumuskan Untuk Data Kelompok : = . . . (3) n Dimana : f i = frekuensi pada kelas ke-i.

c). Ukuran Statistik Deviasi Standar ( Notasi : s )

  

Ukuran ini sangat popular dan dapat menjelaskan besar penyimpangan langsung ukuran nilai

sentral (rata-rata). Ukuran ini sering dinyatakan dengan Simpangan baku (Standart Deviations),

yang untuk ukuran parameter data dinotasikan dengan : , sedangkan statistik data dengan : s Ukuran yang ditemukan oleh Karl pearson ini dirumuskan sebagai : n

  2

(x - x)

i

   i

  1 = s

  Untuk data Bersifat Acak : . . . (4)

n-1

  Dimana ; x i = unit data observasi ke-i n

  2 f (x - x) i i

   i

  

1

s =

  Dan untuk data Bersifat Kelompok : . . . (5) n-1

  Dimana ; x i = Nilai tengah data kelas ke-i (markah kelas ke-i)

Untuk data sampel yang cukup besar, seperti n > 100, penyebut (n-1) dalam rumus diatas dapat

diganti dengan n saja, dengan pertimbangan bahwa untuk data dengan n yang besar, nilai (n-1)

dan n tidak jauh berbeda.

Untuk menghitung ukuran penyimpangan standar dari ukuran sentral data, maka perlu diketahui

ukuran rata-rata data yang bersangkutan.

Dalam memudahkan perhitungan, perlu dirancang spread sheet atau tabel Bantu hitung untuk

ukuran ini yang dapat dibuat sebagai berikut :

Misalkan suatu data set yang tersusun dalam kelompok kelas data memiliki rata-rata : x , maka

tabel bantunya dibuat sebagai :

  

Tabel 1 Tabel Bantu Hitung Ukuran S

  2

  2 i i Interval Data f x i i i (x x ) f .(x x ) - -

  2

  2 a - c f i x

  

1

(x 1 x ) f 1 .(x 1 x ) - -

  2

  2

  2

  

2

d - f f x

  2 x ) f - - (x 2 .(x 2 x )

  2

  2 g - I f

  3 x

  

3

(x 3 x ) f 3 .(x 3 x ) Dst

  … … … …

  2 Jumlah i f = n i i

   f x ) - .(x

Contoh : Data berikut adalah 50 sampel data observasi yang memiliki nilai antara nilai 0

sampai 80, dimana diketahui rata-ratanya adalah 33,2 dinyatakan dalam kelompok data berikut

  2

  2 Interval Data f i x -

i

i i i

  (x x ) - f .(x x )

  • – 9

  2 4.5 823.69 1647.38

  10

  6 14.5 349.69 2098.14

  • – 19

  20

  16

  24.5 75.69 1211.04

  • – 29 30 – 39

  12

  34.5

  1.69

  20.28

  40

  7 44.5 127.69 893.83

  • – 49

  50

  4 54.5 453.69 1814.76

  • – 59

  60

  2 64.5 979.69 1959.38

  • – 69

  70

  1 75 1747.24 1747.24

  • – 80

  Jumlah i f = 50

  11392.05 Maka, ukuran simpangan rata-rata standar tersebut, atau s adalah : n

  2 f (x - x) i i

   11.392, 05 i

  1 s =

  = = 15,3 50-1 n-1

d). Ukuran Statistik Koefisien Variasi ( Notasi : KV )

  

Yaitu ukuran perbandingan variasi relatif antara ukuran standar deviasi dengan nilai rata-rata

(nilai sentral). Ukuran ini umumnya digunakan untuk mengukur satu kelompok data dengan

kelompok data lainnya, mana yang lebih homogen atau sebaliknya mana yang lebih heterogen.

Misalnya suatu penelitian tentang lamanya masa pakai bola lampu merk Philips, diantara jenis

Neon dan jenis TL. Dengan menghitung rata-rata dan devisi standar kedua kelompok data lama

masa pakai jenis bola lampu tersebut, dapat ditentukan masing-masing ukuran Koefisien

korelasinya. Sehingga dapat kita simpulkan apakah masa pakai jenis bola lampu Neon lebih

uniform (seragam) dim\bandingkan jenis lampu TL. x

  Rumusan ukuran ini dinyatakan sebagai : KV = ( s / ) 100 % . . . (6)

SOAL-SOAL LATIHAN

  17

  81

  78

  40

  19

  65

  61

  72

  35

  18

  38

  70

  80

  72

  67

  20

  50

  62

  47

  16

  58

  61

  56

  48

  15

  54

  42

  72

  74

  70

  50

  68

  53

  Mulai Mengitung ukran Pusat Data Statistik ke empat dinas tsb, masing-masing Lalu Hitung Ukuran Dispersinya Jika ke empat Pegawai Dinas tersebut digabung, lalu anda buatkan Penyajian data dalam Daftar Distribusi Frekensi nya, lalu coba hitung nilai ukuran statistiknya Terima kasih ........... Matangglumpangdua, Mei 2014 Win Konadi

  36 Lakukan deskripsi Ukuran statistik data diatas, untuk semua ukuran yang dipelajari.

  38

  40

  56

  25

  65

  61

  49

  45

  24

  69

  40

  49

  75

  23

  45

  59

  75

  65

  22

  42

  49

  60

  52

  21

  60

  53

  14

  Berikut Bobot badan Pegawai di 4 dinas , pengamatan mengambil sampel 25 orang, yaitu : Responden Dinas Sosial Dinas Syariah Dinas PU Dispora

  1

  4

  58

  50

  64

  6

  57

  69

  55

  37

  5

  64

  70

  60

  64

  55

  7

  61

  50

  55

  3

  62

  70

  45

  52

  2

  58

  62

  52

  48

  64

  55

  60

  70

  68

  13

  65

  73

  75

  55

  12

  62

  54

  60

  52

  11

  70

  69

  60

  60

  10

  61

  42

  42

  51

  9

  70

  44

  65

  50

  8

  65

  61

  37